谷歌重磅发布新一代开源AI大模型,称其性能在同等规模中最为先进!
今早我梦醒了坎
发表于 2024-2-22 10:23:02
231
0
0
当地时间周三(2月21日),科技巨头谷歌发布了新一代开源模型“Gemma”,公司称其是轻量级中“最先进的”开放模型系列,超越了原本最强的Mistral 7B。
谷歌官网写道,Gemma在拉丁语中意为“宝石”,以此命名的开放模型系列Gemma由Google DeepMind等团队开发,采用了与创建Gemini模型相同的研究和技术。
目前,Gemma系列有两种权重规模的模型,分别为“Gemma 2B”和“Gemma 7B”,即20亿参数和70亿参数,以满足开发人员的不同需求。
在性能方面,官方页面显示,Gemma 7B在MMLU(大规模多任务语言理解)的得分率达到64.3%。在同等规模中,原本最强Mistral 7B的得分率为62.5%,Meta的Llama-2 7B和13B也都与其有一定的差距。
Gemma也第一时间上线了 HuggingFace 和 HuggingChat,每个人都能试一下它的生成能力:
在Hugging Face的LLM leaderboard集中式排行榜上,Gemma的2B和7B模型的平均得分也位于各自参数规模的榜单前列。
谷歌在新闻稿中写道,Gemma 2B和7B与其他开放模型相比,展现出在同等参数规模中最先进的性能,甚至超过了一些更大的模型,这得益于与公司最强的AI模型Gemini共享技术和基础架构。
软件工程师Jeff dean称,尽管体量较小,但Gemma模型已经在关键基准测试中明显超越了更大的模型,对比的包括Llama-2 7B和13B,以及风头正劲的Mistral 7B。
而且Gemma能够直接在开发人员的笔记本电脑或台式电脑上运行。除了轻量级模型之外,谷歌还推出了鼓励协作的工具以及负责任地使用这些模型的指南。
Keras作者Franois Chollet对此直接表示:最强开源大模型的位置现在易主了。
谷歌和Alphabet公司CEO 桑达尔·皮查伊(Sundar Pichai)表示,Gemma展示了强大的性能,从今天开始,该模型将在全球范围内提供,并可在笔记本电脑、工作站或谷歌云上运行。
Google DeepMind CEO Demis Hassabis表示,轻量开源的Gemma是同类尺寸中性能最佳的模型。
如今,谷歌不仅将对手瞄向OpenAI,而且打算占据一切,新模型将比扎克伯格的Llama-2“遥遥领先”。
谷歌计划未来推出更多的Gemma变体,以适应更广泛的应用场景。目前,想要开始使用这些模型的开发者可以通过数据科学平台Kaggle、谷歌的Colab笔记本或通过谷歌云进行访问。
每日经济新闻综合谷歌官网、公开资料
CandyLake.com is an information publishing platform and only provides information storage space services.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
You may like
- AI五大趋势将重塑企业!谷歌云重磅报告:2025年将是关键一年
- 美联储降息“变调”,将如何影响股市、金价?
- 科技早报 | 陪审团裁决高通并未违反与Arm的授权协议;OpenAI正在测试新一代 “o3”AI 推理模型
- 发力门店建设 沃尔玛新一代门店强化场景内容
- 增加寻宝体验!电商业务占一半!沃尔玛新一代门店亮相
- 一周前瞻| 中美12月PMI数据重磅来袭!因元旦假期 港股休市一天半 美股休市一天
- “国外一开源,国内就创新?” 阿里巴巴提供AI治理新范式
- 支付宝推出新一代AI视觉搜索产品“探一下”
- 英伟达计划明年上半年发布新一代人形机器人计算平台,支持多模态AI模型
- 重磅官宣!《黑神话:悟空》与名创优品达成官方合作