开放Gemma而非“开源” 谷歌为何转变大模型竞争策略?
长安不良帅
发表于 2024-2-22 16:19:03
225
0
0
2月21日晚,谷歌宣布新一代免费可商用大语言模型Gemma在全球开放使用。该模型被谷歌视为自身“最先进的开放模型”。
这是该公司在开放AI大模型领域做出的一大动作。谷歌DeepMind产品管理总监Tris Warkentin称,开放模型对谷歌来说是一个新的机会,让其可以与社区和谷歌之外的人合作,在AI研发方面创造新的机会。
Gemma得名于拉丁语“宝石”,仅用于处理文本信息,其基础技术架构与谷歌最强AI模型Gemini一致,但参数规模较小,仅有20亿参数和70亿参数两个规模版本,且两种参数规模的Gemma模型都会有预训练和指令微调版本。
较小的参数规模有助于Gemma实现更广泛部署。谷歌介绍称,Gemma支持主流AI框架,还可在笔记本电脑、台式机、物联网、移动设备和云端等环境上运行。
该公司公布的测评结果显示,Gemma在数学、编码、推理精通性和知识测试等许多外部基准测试中都优于Llama 2模型。Llama 2是Meta发布的最新一代开源大模型,包含了70亿、130亿和700亿参数的模型。
值得注意的是,谷歌强调Gemma为开放模型,而非“开源”,这意味着谷歌并不会分享Gemma的多项技术细节,包括Gemma的源代码、训练数据等。在应用上,谷歌称其使用条款允许所有组织负责任地进行商用和分发。
开放Gemma或是针对开源大模型领域所受批评的部分回应。此前谷歌和OpenAI因坚持技术封闭而遭到外界抨击,两者在最新、最先进的模型上都选择了闭源,被认为不利于技术进步。
对此,新浪微博新技术研发负责人张俊林评价称,Gemma代表谷歌大模型策略的转变——兼顾开源和闭源,开源主打性能最强大的小规模模型,希望战胜Meta和Mistral(欧洲AI公司,推出了Mistral 7B开源AI模型);闭源主打规模大的效果最好的大模型,希望尽快追上OpenAI。
在AI社区,目前Meta的Llama 2一直是最强大的开源大模型之一,该模型信息和源代码支持免费商用,因此获得大量AI开发者支持。
谷歌显然希望借助Gemma吸引更多开发者进入谷歌云生态。一方面,Gemma针对谷歌自研云端AI芯片TPU进行了优化,声称可发挥更好的效能。同时,谷歌云新用户还会获得300美元云积分,用来研究Gemma。
此外,Gemma将能够在英伟达芯片上运行,由双方合作进行优化,以加速该模型在云端数据中心、PC端侧的推理性能。如将Gemma用于搭载英伟达GPU的AI PC上,驱动本地聊天机器人软件,并与英伟达的多项AI工具集成。
OpenAI、谷歌、Meta等大型科技公司的大模型之战有愈演愈烈之势。
谷歌在2023年3月推出AI对话机器人Bard,并在去年5月推出最新的闭源大语言模型PaLM2。在上周,该公司官宣“下一代AI大模型” Gemini 1.5,称在诸多方面已经超越OpenAI的GPT-4 Turbo。Meta则热衷模型开源,旗下Llama 2最为知名。
而在近日,OpenAI发布文生视频模型Sora再次引爆AI圈,也进一步拉开了与其他大模型公司的距离。谷歌要最终赶超OpenAI仍将充满诸多不确定性。
CandyLake.com is an information publishing platform and only provides information storage space services.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.