李彦宏发声!“商业化的闭源模型最能打”
摩天一人虐
发表于 2024-7-4 18:09:00
1184
0
0
他表示,开源大模型在学术研究、教学领域等特定场景下有存在的价值,但并不适用于大多数应用场景。“当你处在激烈竞争的环境中,需要让业务效率比同行更高、成本比同行更低。这时,商业化的闭源模型是最能打的。”
李彦宏表示,今年以来,开源和闭源大模型是一个争议较大的话题,但很多人混淆了模型开源和代码开源的概念。“模型开源只能拿到一堆参数,还要再做SFT、安全对齐。即使拿到对应源代码,也不知道用了多少比例、什么比例的数据去训练这些参数,无法做到‘众人拾柴火焰高’,并不能让你站在巨人的肩膀上迭代开发。”
李彦宏直言,同样的参数规模下,开源模型能力不如闭源,“如果开源(模型)能力想追平闭源(模型),需要有更大的参数规模,这意味着推理成本更高、反应速度更慢。很多人拿开源模型来做改款,以为这样可以更好服务自己的个性化需求,殊不知这就变成了一个孤本模型,既无法从基础模型的持续升级中获益,也没办法跟别人共享算力。”
李彦宏称,开源模型在一些学术研究、教学领域有存在价值,可以用于研究大模型的工作机制,形成理论。但开源模型并不适用于大多数应用场景,在激烈的商业环境中,想要让业务效率高于同行、成本低于同行,商业化的闭源模型是“最能打的”。他以百度在小说创作上的实践为例,当从开源模型转向轻量级模型、再转向文心大模型4.0后,小说生成的可用率和优质率得到极大提升。
李彦宏认为,大模型的重点还是“应用”,“没有应用,光有基础模型,不管是开源还是闭源都一文不值。”
CandyLake.com is an information publishing platform and only provides information storage space services.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.