谷歌发布最强AI模型Gemini 头部券商火速点评:持续看好AI产业前景
稀土掘金
发表于 2023-12-7 13:03:36
272
0
0
此次谷歌发布的Gemini模型可实现多模态,性能大幅提升,Gemini是基于Transformer decoder构建的多模态模型,这种技术能够处理视频、音频和文本等不同内容形式的信息。最新的Gemini模型对比之前的技术,能够进行更复杂的推理,理解更加细微的信息。它通过阅读、过滤和理解信息,可以从数十万份文件中提取要点,将有助于在从科学到金融的许多领域实现新的突破。
Gemini模型根据体量大小可分为Gemini Ultra、Gemini Pro、以及Gemini Nano三个版本,都支持上下文32K理解,其中:
1)Ultra版本是性能最强的版本,在对应的TPU基础设施中能够展现出最高效率,在多项测试中Ultra版本性能超过GPT4V;
2)Pro版本是性价比优化的版本,在推理、多模态等方面也有较强能力,Pro版本具有良好延展性,可以在几周内完成预训练,在多项测试中仅次于GPT4V,强于PaLM2、Claude2、LLaMA2、GPT3.5等主流大模型;
3)Nano:是通过对其他模型蒸馏得来的4位模型,有1.8B和3.25B两个版本,分别针对低内存和高内存设备,支持在本地部署
Gemini模型作为谷歌以及全球范围内最先发布的多模态模型,支持在云端以及边缘测运行。相关测试数据表面,Gemini Ultra 在 MMLU(大规模多任务语言理解)方面优于人类专家的模型,横向对比来看多个任务性能超过GPT-4。
民生证券表示:通过在超过50个基准测试中对Gemini模型系列进行评估,随着模型规模的增加,Gemini模型家族在推理、数学/科学、和长文本方面持续提高了质量。在所有六种能力中,Gemini Ultra是最优秀的模型。而Gemini Pro作为Gemini模型家族中第二大的模型,在性能上也非常有竞争力,并且在提供服务时更加高效。
民生证券指出:Gemini训练过程也可对基础设施、算法、数据集进行创新;
基础设施方面:Gemini由谷歌TPUV5e和TPUV4训练,并在训练过程中展现出工程化创新,如将4096个TPUV4每个芯片连接到一个专用的光学交换机,可以在大约10秒内动态重新配置4x4x4芯片立方体为任意的3D环形拓扑结构的超级节点,对Gemini Ultra还有热维护等功能的针对性部署。针对Ultra版本需要的高额片间互联速率,谷歌运用了OCS光交换等多个专利技术,文中暂未给出最终速率。
算法方面:使用单控制算法、XLA编译器等技术优化训练过程,还通过预防SDC等问题实现稳定训练。
数据集方面:通过分词技术提高Gemini训练和推理速度,还通过一系列过滤方法保证用于训练的数据的高质量
此次谷歌最新版本的计算芯片TPU v5p同步发布,TPU v5p是之前TPU v4版本的改进,与TPU v4相比,TPU v5p的浮点运算性能提升了两倍,它训练大语言模型的速度比TPU v4快2.8倍。中信证券认为,多模态Gemini模型的正式发布,一方面可以拓宽应用场景的拓展,另一方面能够带来算力需求的持续升级。民生证券持续看好后续AI产业的前景,认为后续GPT-5等模型的发布亦将带来更多的催化。
中信证券表示:在当前的搜索场景中,Gemini能够降低大约40%的延迟。对整个产业来讲,谷歌产品化、商业化的推进亦将带来行业整体的变化,同时伴随GPT-5等模型的推出,预计将看到:1)多模态模型带来的算力需求增长以及 ;2)越来越多的AI场景与产品的出现。
Gemini的发布将进一步带来对多模态模型的更多期待,对产业而言,多模态料将带动算力需求的提升;而在中长期来看,预计多模态模型的升级将丰富相关产品的使用场景,叠加硬件升级、算法优化带来的成本优化,2C产品的进展值得期待。
中信证券表示:持续看好本轮生成式AI浪潮对科技产业的长周期影响和改变,继续关注算力、算法、数据、应用等环节的领先厂商。
CandyLake.com is an information publishing platform and only provides information storage space services.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
You may like
- 马斯克:史上最强AI训练集群上线 将再增加10万颗GPU
- 百济神州发布半年度券商督导报告 公司存大额亏损、无法分红等风险
- 百济神州发布半年度券商督导报告 公司存大额亏损、无法分红等风险
- OpenAI放大招!发布最强水平大模型 解决博士生级别科学问题
- Meta发布新MR头显,预告“史上最强”AR眼镜,黄仁勋点赞
- 头部家电企业与京东深化供应链协同 共同探索AI智能数字化创新发展路径
- 美股成交额前20:券商Jefferies下调苹果评级 称对iPhone预期过高
- 知名券商被罚!暂停这项业务一个月
- 重磅!苹果正式上线Apple Intelligence 还发布配置最强M4芯片的iMac
- 13年后京东支付宝再“牵手” 头部电商平台全部接入支付宝
-
11월 14일, 세계예선 아시아지역 제3단계 C조 제5라운드, 중국남자축구는 바레인남자축구와 원정경기를 가졌다.축구 국가대표팀은 바레인을 1-0으로 꺾고 예선 2연승을 거두었다. 특히 이번 경기 국내 유일한 중계 ...
- 我是来围观的逊
- 3 시간전
- Up
- Down
- Reply
- Favorite
-
"영비릉: 2024회계연도 영업수입 동기대비 8% 감소"영비릉은 2024회계연도 재무제보를 발표했다.2024 회계연도 매출은 149억5500만 유로로 전년 동기 대비 8% 감소했습니다.이익은 31억 500만 유로입니다.이익률은 ...
- 勇敢的树袋熊1
- 3 일전
- Up
- Down
- Reply
- Favorite
-
계면신문기자 장우발 4분기의 영업수입이 하락한후 텐센트음악은 다시 성장으로 돌아왔다. 11월 12일, 텐센트음악은 최신 재보를 발표했다.2024년 9월 30일까지 이 회사의 3분기 총수입은 70억 2천만 위안으로 전년 ...
- 勇敢的树袋熊1
- 그저께 15:27
- Up
- Down
- Reply
- Favorite
-
본사소식 (기자 원전새): 11월 14일, 다다그룹 (나스닥코드: DADA) 은 2024년 3분기 실적보고를 발표했다. 수치가 보여준데 따르면 고품질발전전략에 지속적으로 전념하고 사용자체험을 끊임없이 최적화하며 공급을 ...
- 家养宠物繁殖
- 어제 15:21
- Up
- Down
- Reply
- Favorite