百度李彦宏:重复开发基础大模型是极大浪费 AI原生应用太少
Aim_yuan
发表于 2023-11-15 13:06:07
292
0
0
截至10月份,国内已经发布238个大模型,而6月份为79个。海外已经有上千个AI原生应用,中国市场多大模型,少原生应用。
李彦宏表示,人类进入AI时代的标志,不是产生很多的大模型,而是产生很多的AI原生应用。PC时代基本上只有Windows一个操作系统,但是基于Windows系统开发的软件有很多;移动互联网时代,主流操作系统也只有安卓和iOS两家,而移动应用有800万之多。大模型时代也类似,大模型本身是一个基础底座,类似操作系统,开发者要依赖为数不多的大模型来开发出各种各样的原生应用。所以,不断地重复开发基础大模型是对社会资源的极大浪费。
“AI原生时代,需要100万量级的AI原生应用,但是不需要100个大模型”。李彦宏表示,如果中国产业政策能够更加鼓励基于大模型的AI原生应用,一定能够构建起一个繁荣的AI生态,推动新一轮的经济增长。
AI技术栈分为四层,分别为芯片层、框架层、模型层和应用层。最上面一层是原生应用,芯片、框架、模型都需要AI应用驱动,只有通过更多的场景落地应用,才可以形成更大的数据飞轮,才能够让芯片够用、好用。全球来看,AI原生应用正在成为主要的趋势。微软跟OpenAI合作的,目前最成功的AI原生应用Office365的Copilot,用户需要支付30美元一个月。
百度上线了大模型插件平台,个人和企业都可以通过平台把自己的数据和能力变成插件,比如法律助手、简历助手、装修助手等。插件是一类特殊的AI原生应用,不仅容易上手,还能让企业在私有数据没有泄露风险的情况下,更便捷地用到大模型的能力,降低开发者门槛,有利于构建AI原生应用生态。百度目前有超过800万AI开发者。
API是AI原生应用调用大模型的主要方式。在制造、能源、电力、化工、交通等实体产业,都将成为大模型和AI原生应用极为重要的落脚点,也将成为推动数实融合的主阵地。在百度智能云千帆大模型平台上,已经有超过17000家企业开发产业模型和解决方案。
如果没有智能涌现能力,专用大模型的价值非常有限,想要训练专用大模型需要参数规模足够大,训练数据量足够多,并且能够不断投入迭代,才能够产生智能涌现,大模型才能具有触类旁通的能力。
李彦宏认为,大模型的产业化模式,应该是把基础模型的通用能力和行业领域的专业知识相结合。也就是大模型套小模型,专用的小模型反应快,成本低,大模型更智能,可以用来兜底。
李彦宏称,自从8月31号开放以来,文心大模型的API调用量,呈现了指数级的增长,文心大模型一家的调用量比另外200多家大模型调用量加起来还要多。
无论是中国还是美国,李彦宏认为最好的AI原生应用还有没出现。就像移动时代诞生了像微信、抖音、Uber这样的“mobile-native”的应用一样,AI原生时代一定会有优秀的AI原生应用是基于这些大模型开发出来的。
百度对旗下各个产品线进行了AI原生的重构,新搜索具有极致满足、推荐激发和多轮交互的特点,写文章3000字一分钟就可以完成,百度文库可以在1分钟内生成一个20多页PPT,包括图表生成,格式美化等,成本几乎是零。新文库也实现了从内容工具到生产力工具的转变。
更大想象空间在于,大模型催生出过去从来没有过的AI原生应用。百度也在孵化全新的AI原生应用。比如智能代码助手Comate。百度有上万个工程师,目前每新增100行代码,就有20行是AI生成,这个比例还在快速增长中。通过人机协同,可以帮助大幅提升研发效率。
CandyLake.com is an information publishing platform and only provides information storage space services.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.