谷歌放出最强大模型狙击OpenAI 重心转向AI智能体
清一色糊了餐
发表于 8 시간전
1076
0
0
北京时间12月12日凌晨,谷歌赶在OpenAI宣布ChatGPT正式登陆iPhone之前,发布了全新模型Gemini 2.0。
谷歌CEO桑达尔·皮查伊称,这是谷歌迄今为止最强大的模型。凭借原生图像和原生音频的输出等多模态方面的提升,Gemini 2.0能够构建新的AI智能体,让谷歌离构建通用助手的愿景更进一步。
需要指出的是,Gemini 2.0主要开放给开发者以及受信任的测试人员。目前,Gemini 2.0 Flash体验版模型已经面向所有Gemini用户开放。
Gemini 2.0 Flash是建立在1.5 Flash基础之上的模型,此前1.5 Flash是谷歌最受开发者欢迎的版本。与1.5 Flash相比,Gemini 2.0 Flash在同样快速的响应时间下性能进一步增强。谷歌方面称,2.0 Flash在关键基准测试中甚至超越了1.5 Pro,其速度是1.5 Pro的两倍。
同时2.0 Flash还具有新功能,除了能够支持图片、视频和音频等多模态输入,还可以支持多模态输出,比如可直接生成图像与文本混合的内容,以及原生生成可控的多语言文本转语音(TTS)音频。它还可以原生调用Google Search、代码执行以及第三方用户定义的函数等工具。
全球Gemini用户现在可以在电脑端和移动端体验基于2.0 Flash优化后的聊天对话,并且该版本将很快在Gemini移动应用中推出。基于这个新模型,用户还可以体验到Gemini助手。明年初,谷歌还会将Gemini 2.0扩展到更多产品中。
Gemini 2.0最大的变化在于把重心转向AI智能体,想要做所有AI智能体的基座模型。基于此,Gemini 2.0开发出了一系列原型,这些原型能够帮助用户完成相应的任务。
其中,Project Astra的升级版,用于探索未来通用AI助手能力的研究原型。自从在Google I/O大会上推出Project Astra以来 ,谷歌一直向那些在Android手机上使用它的受信任的测试人员收集反馈。此次推出的升级版可以实现多种语言和混合语言之间的对话,也可使用 Google Search、Google Lens和Google Map等新工具,能够记住长达10分钟的会话内容,并可以近于人类对话的延迟来理解语言。
全新的Project Mariner从浏览器入手探索人与智能体交互的未来发展。Project Mariner 使用了Gemini 2.0构建的早期研究原型,能够理解和推理浏览器页面中的信息,包括像素和文本、代码、图像和表单等网页元素,然后通过实验性的Chrome扩展程序帮助用户完成相应任务。此次升级,Project Mariner改进了原来速度较慢的问题。
简而言之,用户可以用这项功能让浏览器自己去帮你完成特定任务,例如批量查找某些网站上邮箱地址,从而在一定程度上实现浏览器的“自动运行”。
Jules则是面向开发者的编码智能体,它可以直接集成到GitHub工作流程中来协助开发者完成开发任务。
在谷歌的演示视频中,演示人员输入了一长串含有详细编程问题的提示语,之后Jules会对这些要求进行分析,给出一个三步的编程解决方案,待点击同意后,模型就会开启自动编程,生成代码。这无疑有助于开发者进一步提升工作效率。
去年年底,谷歌发布了Gemini 1.0模型,主要能力是整合和理解信息。而Gemini 2.0能让信息变得更加有用。桑达尔·皮查伊表示,Gemini 2.0的进展得益于谷歌长达10年全栈式AI创新研究的投入,基于谷歌定制的硬件第六代TPU Trillium构建而成。
就在谷歌以最强大模型吸睛之时,OpenAI为期12天的产品发布活动仍在进行中。同一天,OpenAI对外展示了ChatGPT与苹果Apple Intelligence的整合,内容略显平淡。谷歌Gemini 2.0的突然发布,显然抢了不少OpenAI的风头。
在Gemini 2.0的加持下,谷歌一口气推出三款智能体产品,也意味着其在和微软绑定OpenAI、亚马逊与Anthropic的竞争中又迈出了重要一步。
智能体已经成为大模型领域竞争的核心方向。所谓智能体,是指能够感知环境、进行决策并采取行动以实现特定目标的系统,被视作大语言模型(LLM)落地应用的关键载体。
近两个月前,微软曾连发10个AI智能体,面向销售、运营等场景,随后又宣布Copilot Studio平台已支持用户构建自主智能体,同时发布5款预构建的智能体。而在刚刚结束的2024 re:Invent上,亚马逊一口气发布了6款大模型,其中Amazon Nova Premier同样是多模态大模型,专为复杂推理任务而生。
无论在消费端还是企业端场景中,AI智能体均有较多想象空间,商业化前景也较为明确。多位业内人士预计,2025年将是AI智能体商用爆发之年。届时,谷歌、OpenAI等科技巨头围绕智能体的竞争势必将愈发激烈。
CandyLake.com is an information publishing platform and only provides information storage space services.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
You may like
- 奇富科技:助力提高数字金融安全水平和金融大模型落地应用
- 微软否认使用客户数据来训练人工智能模型
- OpenAI上线满血版o1大模型 以及每月200美元的ChatGPT Pro
- 奇富科技:助力数字金融安全水平提升 分享金融大模型前沿实践
- 英伟达携全新AI模型“颠覆”音频界:可创作音乐、修改人声
- 英偉達は新しいAIモデルを携えてオーディオ業界を「転覆」させた:音楽を創作し、人の声を修正することができる
- OpenAI又有王炸!正式推出AI视频生成模型Sora
- OpenAI正式推出AI视频生成模型Sora 会员无需额外付费
- 英伟达发布“NaVILA模型” 帮助机器人摆脱地图依赖
- 新东方“虽迟但到”,教育大模型时代来临了?
-
"대적전 창시자 장충모: 인텔이 AI 물결을 따라잡지 못한 삼성의 문제는 경영전략에 있지 않다"12월 9일, 대적전 창시자 장충모의 자서전 전집의 신간 발표회가 중국 대만에서 개최되였다.행사장에서 경쟁사인 인텔 ...
- 西西里柠檬2017
- 그저께 14:46
- Up
- Down
- Reply
- Favorite
-
12월 11일 CNN에 따르면 엘론 머스크의 순자산은 4000억 달러에 달해 사상 처음으로 이 관문을 돌파했다. 머스크의 재산은 그의 우주 탐사 기술 회사와 관련이 있는 200억 달러 가까이 다시 늘어난 것으로 알려졌다 ...
- 真不是我干的的
- 7 시간전
- Up
- Down
- Reply
- Favorite
-
미국 동부 시간으로 월요일, 미국 주식 3대 지수는 집단적으로 하락하여 마감 마감되었는데, 나지는 0.62%, S & P500 지수는 0.61%, 지수는 0.54% 하락했다. 나스닥 중국 진룽지수는 8.54% 상승해 인기 있는 중국계 ...
- 强绝商爸摇
- 그저께 13:58
- Up
- Down
- Reply
- Favorite
-
샤오펑자동차 웨이보 12월 11일 소식에 따르면 샤오펑 P7 + 는 출시 4주 만에 10000대의 샤오펑 P7 + 를 정식 인도했다.
- 崔炫俊献
- 어제 12:18
- Up
- Down
- Reply
- Favorite