该研报详细介绍了H100、SXMH200、SXMFP系列GPU的技术参数与特性,主要亮点如下:
-
计算性能:
- FP64 Tensor Core:在FP64浮点运算上提供67 teraFLOPS(万亿次浮点运算)的性能。
- FP32 Tensor Core:同样在FP32浮点运算上达到67 teraFLOPS。
- FP16 Tensor Core:在FP16(半精度)浮点运算上实现1979 teraFLOPS的性能。
- INT8 Tensor Core:在INT8整数运算上提供3958 TOPS(万亿次操作)的性能。
-
内存与带宽:
- 提供80GB和141GB两种不同大小的GPU内存选项。
- 内存带宽分别为3.35TB/s和4.8TB/s,显著提升了数据处理效率。
-
解码能力:
- 支持7个NVDEC和JPEG解码器,适合多媒体和视频处理应用。
-
热设计功率(TDP):
- 最大TDP为700W(配置可调),确保高性能同时考虑散热需求。
-
多实例GPU(MIGs)支持:
- 最高支持7个MIGs实例,每个MIGs@16.5GB的配置下最多支持7个实例。
-
互联技术:
- 支持NVLink(最高900GB/s)和PCIe Gen5(最高128GB/s),优化数据传输速度。
-
服务器选项:
- 提供NVIDIA HGX H100、NVIDIA DGX H100、NVIDIA HGM H200等系统选项,支持不同规模的GPU配置,如4到8个GPU,满足各种数据中心的需求。
-
企业级扩展:
- 提供NVIDIA Enterprise Add-on服务,增强系统的稳定性和安全性。
综上所述,该系列GPU旨在提供强大的计算能力、高速的数据处理和传输能力,以及灵活的配置选项,适用于高性能计算、人工智能训练、大规模数据分析等领域,尤其适用于需要高度并行处理和大量内存的应用场景。