谷歌重磅发布新一代开源AI大模型，称其性能在同等规模中最为先进！

今早我梦醒了坎发表于 2024-2-22 10:23:02

241 0 0

　　开源领域大模型，迎来了重磅新玩家。

　　当地时间周三（2月21日），科技巨头谷歌发布了新一代开源模型“Gemma”，公司称其是轻量级中“最先进的”开放模型系列，超越了原本最强的Mistral 7B。
　　谷歌官网写道，Gemma在拉丁语中意为“宝石”，以此命名的开放模型系列Gemma由Google DeepMind等团队开发，采用了与创建Gemini模型相同的研究和技术。
　　目前，Gemma系列有两种权重规模的模型，分别为“Gemma 2B”和“Gemma 7B”，即20亿参数和70亿参数，以满足开发人员的不同需求。
　　在性能方面，官方页面显示，Gemma 7B在MMLU（大规模多任务语言理解）的得分率达到64.3%。在同等规模中，原本最强Mistral 7B的得分率为62.5%，Meta的Llama-2 7B和13B也都与其有一定的差距。
　　Gemma也第一时间上线了 HuggingFace 和 HuggingChat，每个人都能试一下它的生成能力：
　　在Hugging Face的LLM leaderboard集中式排行榜上，Gemma的2B和7B模型的平均得分也位于各自参数规模的榜单前列。
　　谷歌在新闻稿中写道，Gemma 2B和7B与其他开放模型相比，展现出在同等参数规模中最先进的性能，甚至超过了一些更大的模型，这得益于与公司最强的AI模型Gemini共享技术和基础架构。
　　软件工程师Jeff dean称，尽管体量较小，但Gemma模型已经在关键基准测试中明显超越了更大的模型，对比的包括Llama-2 7B和13B，以及风头正劲的Mistral 7B。
　　而且Gemma能够直接在开发人员的笔记本电脑或台式电脑上运行。除了轻量级模型之外，谷歌还推出了鼓励协作的工具以及负责任地使用这些模型的指南。
　　Keras作者Franois Chollet对此直接表示：最强开源大模型的位置现在易主了。
　　谷歌和Alphabet公司CEO 桑达尔·皮查伊（Sundar Pichai）表示，Gemma展示了强大的性能，从今天开始，该模型将在全球范围内提供，并可在笔记本电脑、工作站或谷歌云上运行。
　　Google DeepMind CEO Demis Hassabis表示，轻量开源的Gemma是同类尺寸中性能最佳的模型。
　　如今，谷歌不仅将对手瞄向OpenAI，而且打算占据一切，新模型将比扎克伯格的Llama-2“遥遥领先”。
　　谷歌计划未来推出更多的Gemma变体，以适应更广泛的应用场景。目前，想要开始使用这些模型的开发者可以通过数据科学平台Kaggle、谷歌的Colab笔记本或通过谷歌云进行访问。
　　每日经济新闻综合谷歌官网、公开资料

谷歌重磅发布新一代开源AI大模型，称其性能在同等规模中最为先进！

浏览过的版块