谷歌发布支持200万token大模型Gemini 1.5 Flash
123457931
发表于 2024-5-15 10:31:56
1152
0
0
据悉,全新Gemini 1.5 Pro具有原生音频理解、系统指令、JSON模式等,能够使用视频计算机视觉来分析图像(帧)和音频(语音)的视频,这使其具有人类水平的视觉感知。使用深度神经网络,Gemini 1.5可以以超人的精度识别图像(和视频帧)中的物体、场景和人物。同时,为了快速响应与成本效益,谷歌还推出更轻的模型Gemini 1.5 Flash。
同时,针对OpenAI发布的GPT-4o,谷歌也发布了对标的大模型Project Astra。此外,谷歌进一步升级开源模型Gemma 2。
过去一年,谷歌在生成式AI领域奋起直追。2023年12月,谷歌推出全球最强大、最通用的多模态通用大模型:Gemini,中文称“双子座”。在此次大会上,皮查伊透露,Gemini发布后短短3个月内就有100万+Gemini Advanced注册;20亿用户产品(user products)全部使用 Gemini;超过150万开发者使用Gemini。
CandyLake.com is an information publishing platform and only provides information storage space services.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.