李彦宏:大模型场景下开源是最贵的 多模态是通往AGI的必经之路
飘渺九月
发表于 2024-4-16 15:06:02
216
0
0
李彦宏表示,百度作为一家技术公司,定位是尽可能为大家提供所需的开发工具,这包括了1个基础模型系列和三大AI开发工具,今天的中国,有10亿互联网用户,有强大的基础大模型,有足够多的AI应用场景,有全球最完备的产业体系,国家也在大力鼓励和支持‘人工智能+’行动,每一个人,每一家企业,只需要充分利用这些工具,就可以释放无限的创造力和生产力。
值得关注的是,李彦宏在开发者大会上谈到的工具和案例大部分都是基于大语言模型。面向未来,他认为多模态大模型,抑或是文字、图片、语音、视频等多模态的融合,是基础模型非常重要的长期发展方向,是通往AGI(通用人工智能)的必经之路。而百度在这些领域有着长期投入,并将及时更新技术进展。
文心最新成绩单:用户数、API日均调用量均超2亿
李彦宏首先公布了文心一言和文心大模型的最新进展。
据悉,文心一言于去年3月16日发布,当时较受外界关注。时隔一年零一个月,文心一言用户数、API日均调用量均突破了2亿,服务的客户数达到了8.5万,利用千帆平台开发的AI原生应用数超过了19万。
支撑文心一言的基座模型是文心大模型。过去一年,它经历了从3.0版本到3.5,再到4.0版本的进化。李彦宏称,文心4.0在理解、生成、逻辑、记忆四大能力方面,均达到了业界领军水平。近几个月来,文心大模型在代码生成、代码解释、代码优化等通用能力方面实现了进一步显著提升,达到国际领先水平。
最新数据显示,相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。
会上,百度发布了文心大模型4.0的工具版,该工具版可以让开发者体验代码解释器功能,开发者不仅可以通过自然语言交互实现对复杂数据和文件的处理与分析,还可以生成图表或文件,能够快速洞察数据中的特点、分析变化趋势、为后续的决策提供支撑。
“客户原来一天调用1万次,同样成本现在可以调用100万次。媒体可能不会因为成本下降99%而兴奋。但是企业也好,开发者也好,一旦用起来,最关注的就是效果和成本。”李彦宏指出,把推理成本降到1%,是因为百度在芯片、框架、模型、应用这四层架构上有着全栈的布局,能不断地把成本打下来。
李彦宏表示,大模型相关的话题在2024年依然会很热,各类技术突破还会不断涌现,但他想强调的是,大模型本身并不直接创造价值,基于大模型开发出来的AI应用才能满足真实的市场需求。而这样的观点,李彦宏已多次在公开场合强调,希望大家可以在文心大模型上开发AI应用。
百度开发AI原生应用的思路,是过去踩坑交学费换来的
李彦宏指出,他分享的一些基于大模型开发AI原生应用的具体思路和工具,是百度根据过去一年的实践,踩了无数的坑,交了高昂的学费换来的。他判断,MoE、小模型和智能体是值得关注的三个方向。
具体来看,一是未来大型的AI原生应用基本都是MoE(大小模型的混用),不依赖一个模型来解决所有问题。
二是小模型推理成本低,响应速度快,在一些特定场景中,经过精调后的小模型,使用效果可以媲美大模型,这也是百度发布Speed,Lite、Tiny三个轻量模型的原因。
三是智能体是当下较热的话题之一,随着智能体能力的提升,会不断催生出大量新的应用。智能体机制,包括理解、规划、反思和进化,它让机器像人一样思考和行动,可以自主完成复杂任务,在环境中持续学习、实现自我迭代和进化。
在这三个方向之上,百度发布了三种不同的工具,分别是:智能体开发工具AgentBuilder、AI原生应用开发工具AppBuilder、各种尺寸的模型定制工具ModelBuilder。
会上,李彦宏再次提及开源模型的弊端,“大家以前用开源觉得开源便宜,其实在大模型场景下,开源是最贵的。”
关于文心大模型开源还是闭源,澎湃新闻记者在4月11日获取的一份李彦宏的内部谈话实录中看到,李彦宏认为,目前国外像Llama(编注:Meta开源模型),Mistral(编注:法国人工智能初创公司 Mistral发布的模型)都有相当的影响力,国内的智源、百川、阿里的通义也都是开源模型,市场上不缺百度这一家开源的模型。百度要开源还得自己去维护一套开源的版本,这不划算。
李彦宏的判断是,闭源才有真正的商业模式,才能聚集人才和算力。
百度2月28日发布的2023年第四季度及全年财报显示,百度去年总营收达1345.98亿元,同比增长9%;归属百度的净利润(non-GAAP)287亿元,同比增速达39%;四季度营收349.51亿元,同比增长6%,归属百度的净利润(non-GAAP)77.55亿元,同比大涨44%。2023年,百度全年营收和利润均超市场预期。李彦宏在财报会上预计,2024年生成式人工智能与基础模型业务将为百度带来数十亿元人民币的增量收入,这也将为百度的总收入带来正向影响。
财报显示,百度2023年的研发支出为242亿元,较2022年增长4%。百度在财报中表示,这主要由于支持生成式AI研发投入的服务器的折旧开支及服务器机架费增加。
截至午间收盘,百度港股跌2.17%,报94.650港元/股,总市值2655亿港元。美股表现方面,截至美东时间4月15日收盘,百度跌1.25%,报96.320美元/股,总市值337.36亿美元。
CandyLake.com is an information publishing platform and only provides information storage space services.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
You may like