2024世界人工智能大会|李彦宏:商业化的闭源模型是最能打的
mygogo4
发表于 2024-7-4 17:08:52
2887
0
0
“今年(2024年)以来,很多人混淆了模型开源和代码开源的概念”,李彦宏说道,“模型开源只能拿到一堆参数,还要在做SFT、安全对齐,即使是拿到对应源代码,也不知道是用了多少比例、什么比例的数据去训练这些参数,无法做到众人拾柴火焰高,拿到这些东西,并不能让你站在巨人的肩膀上迭代开发。”
李彦宏直言,同样参数规模下,开源模型的能力不如闭源,“如果开源想能力追平闭源,它需要有更大的参数规模,这意味着推理成本更高、反应速度更慢。很多人拿开源模型来做改款,以为这样可以更好地服务自己的个性化需求,殊不知这就变成了一个孤本模型,既无法从基础模型的持续升级中获益,也没办法跟别人共享算力。”
他承认,开源模型在一些学术研究、教学领域有存在价值,可以用于研究大模型的工作机制,形成理论。但开源模型并不适用于大多数应用场景,在激烈的商业环境中,想要让业务效率高于同行、成本低于同行,商业化的闭源模型是“最能打的”。他以百度在小说创作上的实践为例,当从开源模型转向轻量级模型、再转向文心大模型4.0后,小说生成的可用率和优质率得到极大提升,让网文作者如虎添翼。在李彦宏看来,大模型的重点还是“卷应用”,“没有应用,光有基础模型,不管是开源还是闭源都一文不值。”
CandyLake.com is an information publishing platform and only provides information storage space services.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.