英伟达发布“超级AI芯片”H200 预计明年第二季度开始供应
飘渺九月
发表于 2023-11-14 18:36:56
260
0
0
在英伟达超大规模和高性能计算副总裁Ian Buck看来,想要通过生成式AI和HPC应用创造智能,就必须使用大型、快速的GPU显存来高速、高效地处理海量数据。当H200与采用超高速NVLink-C2C互连技术的NVIDIA Grace CPU搭配使用时,就组成了带有HBM3e的GH200 Grace Hopper超级芯片——专为大型HPC和AI应用而设计的计算模块。
从规格来看,H200将提供四路和八路H200服务器主板可选,与HGX H100系统的硬件和软件都兼容;还可用于今年8月发布的采用HBM3e的NVIDIA GH200 Grace Hopper超级芯片。这些配置使H200可以部署在各类数据中心,包括本地、云、混合云和边缘;可为各种应用工作负载提供最高的性能,包括针对1750亿参数以上超大模型的LLM训练和推理。
架构方面,与前代相比,NVIDIA Hopper架构实现了性能跃升,如在一个700亿参数的LLM——Llama 2上的推理速度比H100(英伟达AI芯片)提高了近一倍。
根据英伟达方面的说法,将于2024年第二季度开始通过全球系统制造商和云服务提供商提供H200;服务器制造商和云服务提供商也预计于同一时间开始提供搭载H200的系统。
CandyLake.com is an information publishing platform and only provides information storage space services.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.
Disclaimer: The views expressed in this article are those of the author only, this article does not represent the position of CandyLake.com, and does not constitute advice, please treat with caution.