踩了无数的坑 交了高昂的学费!李彦宏开怼
tekno
发表于 2024-4-16 18:19:05
2956
0
0
去年3月,百度在一众互联网公司中率先入局大模型,时间过去一年,李彦宏依然认为,大模型在2024年依然会很热,各类技术突破还会不断涌现。
不过,在这次大会上,他却“怼”了时下大热的开源大模型,并认为开源模型会越来越落后。在他看来,通过降维剪裁出来的“小模型”,将比直接开源模型调出来的模型,同等尺寸下效果明显更好,同等效果下,成本明显更低。
百度小度已经开启了大模型小模型混用的方式,不仅响应速度提升2倍,更重要的是成本下降了99%。
开发应用就像拍短视频一样简单
文心一言从去年3月16日发布,到今年4月16日正好是一年零一个月的时间。
在4月16日召开的百度AI开发者大会上,李彦宏宣称文心一言用户数突破了2亿,API日均调用量也突破了2亿,服务客户数达到了8.5万,利用千帆平台开发的AI原生应用数超过了19万。
“相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。”他说,这意味着,客户原来一天调用1万次,同样成本现在一天可以调用100万次。
文心大模型使用人数的增加,调用成本的大幅下降,也在悄然改变着很多行业的生态。
今年3月,李彦宏在一次接受采访时表示:程序员职业将消失。当时还引发360创始人周鸿祎等大佬,加入这一话题激烈论辩。
在此次百度AI开发者大会,李彦宏具体展示了让程序员职业消失的工具,即此次基于文心大模型三大开发工具:AgentBuilder、AppBuilder和ModelBuilder,在大模型的加持下,开发应用就像拍短视频一样简单。
比如,基于文心大模型的智能代码助手Comate。它不仅支持100多种语言和所有主流IDE平台,可以推荐代码、生成代码注释、查找代码缺陷、给出优化方案,还可以深度解读代码库、关联私域知识生成新的代码。
“百度每天新增的代码中,已经有27%是由Comate生成的。”李彦宏说,此外,百度AppBuilder,也支持自然语言三步开发一个AI原生应用,并且能够便捷地发布、集成到各种各样的业务环境中。
而各种尺寸模型定制工具ModelBuilder,则具备“高效低价生产模型的能力”,可以根据开发者的需求定制任意尺寸的模型,并根据细分场景对模型进一步精调。
现场,李彦宏展示了教育行业作文批改的案例,经过数据处理、模型精调后的“作文批改助手”,不仅可以拥有更专业的老师点评思维、做到格式遵循,而且相比未精调模型,精调后的模型打分与真实的老师点评分数更为接近。
细分场景的小模型经济且高效
在发布三大工具的同时,李彦宏也“怼”了开源大模型,他认为开源大模型将会越来越落后。
“这是我们百度根据过去一年的实践,踩了无数的坑,交了高昂的学费换来的。”他强调,大语言模型本身并不直接创造价值,基于大模型开发出来的AI应用才能满足真实的市场需求。
在他看来,未来大型的AI原生应用基本是MoE的,即大小模型的混用,不依赖一个模型来解决所有问题。而ModelBuilder可以制作各种尺寸的定制小模型,与大模型相比,小模型推理成本低,响应速度快,在一些特定场景中,经过精调后的小模型,它的使用效果可以媲美大模型,更重要的成本更低,这也是百度发布Speed,Lite、Tiny三个轻量模型的原因。
此外,李彦宏还提出了智能体的概念,智能体机制,包括理解、规划、反思和进化,它让机器像人一样思考和行动,可以自主完成复杂任务,在环境中持续学习、实现自我迭代和进化。
在一些复杂系统中,还可以让不同的智能体互动,相互协作,更高质量地完成任务。无论是小模型的建设能力还是智能体的学习进化能力,百度已经开发出来了,并且向开发者全面开放。
目前,百度的一些应用上,已经实现了大小模式的混用。李彦宏现场用小度展示MoE模型路由的案例。他与小度的对话中,既有简单的新闻问询,也有复杂的日程安排需求。表面上看起来是跟同一个小度在交流,其实背后调用了不同的模型。
当它接到李彦宏的提问,先由小模型ERNIE Tiny对问题进行分类:对于天气问题,调用基于ERNIE Lite打造的精调模型回复,同时依托ERNIE Lite模型,给出了穿衣建议。对于更复杂的日程安排问题,则调用了性能最好的大模型文心4.0来计算出各种事项安排。当小度作为智能助理时,则使用ERNIE Character模型,让小度拥有一定的人设,激发用户聊天欲。
这样的小度不仅更聪明了,相比全部使用文心大模型的旗舰版,响应速度也提升2倍,更重要的是成本下降了99%,提升了其商用的价值。
“每一个人,每一家企业,只需要充分利用这些工具,就可以释放无限的创造力和生产力。”李彦宏说,今天,人人都可以成为开发者。而未来,也必将是一个由开发者一起创造出来的未来。
CandyLake.com is an information publishing platform and only provides information storage space services.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.