李彦宏发布文心大模型4.0工具版 推理成本降至1年前的1%
一生和尚尚iu
发表于 2024-4-16 11:16:11
1198
0
0
4月16日,百度创始人、董事长兼首席执行官李彦宏在Create 2024百度AI开发者大会上,正式宣布发布文心大模型4.0的工具版。
李彦宏表示,相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。“也就是说,客户原来一天调用1万次,同样成本之下,现在一天可以调用100万次。”
此外,李彦宏在演讲中分享了百度过去一年实践出来的、开发AI原生应用的具体思路和工具。“这是我们百度根据过去一年的实践,踩了无数的坑,交了高昂的学费换来的。”他强调,大语言模型本身并不直接创造价值,基于大模型开发出来的AI应用才能满足真实的市场需求。
李彦宏首先表示,未来,大型的AI原生应用基本都是MoE。他介绍:“这里所说的MoE不是一般的学术概念,而是大小模型的混用,不依赖一个模型来解决所有问题。”
其次,李彦宏表示,小模型推理成本低,响应速度快,在一些特定场景中,经过精调后的小模型使用效果可以媲美大模型。这也是百度发布ERNIE Speed、ERNIE Lite和ERNIE Tiny三个轻量模型的原因。“我们通过大模型,压缩‘蒸馏’出来一个基础模型,然后再用数据去训练,这比从头开始训小模型,效果要好很多,比基于开源模型训出来的模型,效果更好,速度更快,成本更低。”他表示。
第三是智能体。李彦宏表示,“智能体”是当前非常热的一个话题,随着智能体能力的提升,会不断催生出大量的AI原生应用。智能体机制包括理解、规划、反思和进化,它让机器像人一样思考和行动,可以自主完成复杂任务,在环境中持续学习、实现自我迭代和自我进化。“在一些复杂系统中,我们还可以让不同的智能体互动,相互协作,更高质量地完成任务。这些智能体能力,我们已经开发出来了,并且向开发者全面开放。”李彦宏介绍。
CandyLake.com is an information publishing platform and only provides information storage space services.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.