您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[上海证券]:人工智能行业跟踪报告:英伟达发布新一代GPU架构,NVLink连接技术迭代升级 - 发现报告

人工智能行业跟踪报告:英伟达发布新一代GPU架构,NVLink连接技术迭代升级

信息技术2024-03-29刘京昭上海证券J***
人工智能行业跟踪报告:英伟达发布新一代GPU架构,NVLink连接技术迭代升级

——人工智能行业跟踪报告 事件描述 2024年3月19日,英伟达正式发布Blackwell架构的GPU B200、计算平台HGX B200以及新一代NVLink 5.0连接技术。同时,英伟达基于B200和Grace CPU推出了超级芯片GB200,以及由72张GB200组成的DGXGB200 NVL72超级计算机。 值得关注的是,新一代NVLink连接技术支持单块Blackwell架构的GPU实现1.8TB/s的传输带宽。根据SemiAnalysis的测算,鉴于DGXGB200 NVL72拥有72个OSFP端口,每个端口对应于1个400G或800G光模块,随着GB200数量的增加,网络拓扑结构发生变化,最终GB200对应于800G光模块的数量关系将介于1:2.5到1:3.5之间。 分析与判断 我们认为: (1)以DGX GB200 NVL72为代表的超级计算机,在内部节点间使用铜缆连接,主要是出于降低功耗的考虑,跨机柜连接短期内仍依赖于光收发器。 (2)从生成式AI模型训练需求角度看,跨机柜连接仍为未来主流技术方案,因此数通市场800G光模块需求具备可持续性。 (3)GB200在推理性能上持续优化升级,能够进一步降低生成式AI模型在云侧的推理成本,有助于生成式AI应用在C端落地。 ◼投资建议 建议关注: 中际旭创:中高端数通市场龙头,2022年与II-VI并列光模块业务营收全球第一。根据iFinD机构一致预期,截至2024年3月25日,公司2024年的预测PE为32倍,位于近五年的93%分位。 天孚通信:光器件整体解决方案提供商。根据iFinD机构一致预期,截至2024年3月25日,公司2024年的预测PE为53倍,位于近五年的99%分位。 新易盛:光模块领域龙头,成本管控优秀,具备切入增量云计算/AI客户的能力。根据iFinD机构一致预期,截至2024年3月25日,公司2024年的预测PE为42倍,位于近五年的98%分位。 ◼风险提示 下游需求不及预期;人工智能技术落地和商业化不及预期;产业政策转变;宏观经济不及预期等。 目录 1英伟达推出Blackwell架构,生成式AI训练、推理再加速......32风险提示.....................................................................................7 图 图1:HGX B200计算平台在生成式AI推理场景下实时吞吐量大幅上升.....................................................................3图2:HGX B200计算平台在生成式AI模型训练场景下训练速率提升明显..................................................................3图3:GB200 NVL72在推理场景下实时吞吐量较HGX100提升更明显......................................................................4图4:GB200 NVL72在生成式AI模型训练场景下性能有所提升.................................................................................4图5:GB200由铜缆连接GB200节点机架与NVSwitch机架....................................................................................4图6:GB200使用第五代NVLink连接技术增强GPU卡间互联能力.............................................................................5图7:GB200和800G光模块的数量关系与H100类似........5 表 表1:Blackwell架构GPU更注重FP8和FP4浮点运算....3表2:人工智能领域相关公司对比表......................................6 1英伟达推出Blackwell架构,生成式AI训练、推理再加速 2024年3月19日,英伟达正式发布Blackwell架构的GPUB200、计算平台HGXB200以及新一代NVLink5.0连接技术。同时,英伟达基于B200和GraceCPU推出了超级芯片GB200,以及由72张GB200组成的DGXGB200NVL72超级计算机。 资料来源:NVIDIA,上海证券研究所 资料来源:NVIDIA,上海证券研究所 B200采用台积电的4纳米工艺蚀刻而成,通过NVLink5.0将两个独立制造的裸晶(Die)连接整合,内部共有2080亿个晶体管。单个Blackwell Die的浮点运算能力相较于Hopper Die提高近25%,总性能提升2.5倍,在处理FP4精度的浮点运算时,性能还能进一步提升至H100的5倍。 DGXGB200 NVL72超级计算机包含18个GB200节点机架和9个NVSwitch节点机架。每个GB200节点搭配1个GraceCPU和2个GB200GPU,共计36个GraceCPU和72个GB200GPU。在生成式AI训练场景下,GB200NVL72可支持720PFLOPS的FP8吞吐量;在推理场景下,GB200NVL72可支持1.44EFLOPS的FP4吞吐量。 资料来源:NVIDIA,上海证券研究所 资料来源:NVIDIA,上海证券研究所 DGXGB200 NVL72使用水冷散热,在功耗方面,由于使用了5000条左右总长度2英里的NVLink铜缆,在内部的GB200节点和NVSwitch节点间通信不再依赖光收发器,从而降低近20KW的功耗。 资料来源:36氪,上海证券研究所 DGXGB200NVL72使用第五代NVLink实现互联,NVLink多节点all-to-all带宽达到130TB/s。新一代的DGX SuperPOD可由8台或8台以上的DGX GB200超级计算机构成,用户可通过NVLink连接8台DGX GB200超级计算机的576块GB200GPU,从而进一步扩增集群的共享显存,适应新一代生成式AI模型的训练需求。据英伟达介绍,此前需要8000块H100GPU使用90天时间对GPT-MoE-1.8T进行训练,如今只需要2000块GB200GPU进行训练,且能耗为使用H100训练的四分之一。 资料来源:NVIDIA,上海证券研究所 值得关注的是,第五代NVLink连接技术支持单块Blackwell架构的GPU实现1.8TB/s的双向带宽。根据SemiAnalysis的测算,鉴于DGXGB200NVL72拥有72个OSFP端口,每个端口对应于1个400G或800G光模块,随着GB200数量的增加,网络拓扑结构发生变化,最终GB200对应于800G光模块的数量关系将介于1:2.5到1:3.5之间。 资料来源:SemiAnalysis,上海证券研究所 我们认为:(1)以DGXGB200NVL72为代表的超级计算机,在内部节点间使用铜缆连接,主要是出于降低功耗的考虑,跨机柜连接短期内仍依赖于光收发器。(2)从生成式AI模型训练需求角度看,跨机柜连接仍为未来主流技术方案,因此数通市场800G光模块需求具备可持续性。(3)GB200在推理性能上持续优化升级,能够进一步降低生成式AI模型在云侧的推理成本,有助于生成式AI应用在C端落地。 2风险提示 下游需求不及预期;人工智能技术落地和商业化不及预期;产业政策转变;宏观经济不及预期。 分析师声明 作者具有中国证券业协会授予的证券投资咨询资格或相当的专业胜任能力,以勤勉尽责的职业态度,独立、客观地出具本报告,并保证报告采用的信息均来自合规渠道,力求清晰、准确地反映作者的研究观点,结论不受任何第三方的授意或影响。此外,作者薪酬的任何部分不与本报告中的具体推荐意见或观点直接或间接相关。 公司业务资格说明 本公司具备证券投资咨询业务资格。 投资评级说明: 不同证券研究机构采用不同的评级术语及评级标准,投资者应区分不同机构在相同评级名称下的定义差异。本评级体系采用的是相对评级体系。投资者买卖证券的决定取决于个人的实际情况。投资者应阅读整篇报告,以获取比较完整的观点与信息,投资者不应以分析师的投资评级取代个人的分析与判断。 免责声明 本报告仅供上海证券有限责任公司(以下简称“本公司”)的客户使用。本公司不会因接收人收到本报告而视其为客户。 本报告版权归本公司所有,本公司对本报告保留一切权利。未经书面授权,任何机构和个人均不得对本报告进行任何形式的发布、复制、引用或转载。如经过本公司同意引用、刊发的,须注明出处为上海证券有限责任公司研究所,且不得对本报告进行有悖原意的引用、删节和修改。 在法律许可的情况下,本公司或其关联机构可能会持有报告中涉及的公司所发行的证券或期权并进行交易,也可能为这些公司提供或争取提供多种金融服务。 本报告的信息来源于已公开的资料,本公司对该等信息的准确性、完整性或可靠性不作任何保证。本报告所载的资料、意见和推测仅反映本公司于发布本报告当日的判断,本报告所指的证券或投资标的的价格、价值或投资收入可升可跌。过往表现不应作为日后的表现依据。在不同时期,本公司可发出与本报告所载资料、意见或推测不一致的报告。本公司不保证本报告所含信息保持在最新状态。同时,本公司对本报告所含信息可在不发出通知的情形下做出修改,投资者应当自行关注相应的更新或修改。 本报告中的内容和意见仅供参考,并不构成客户私人咨询建议。在任何情况下,本公司、本公司员工或关联机构不承诺投资者一定获利,不与投资者分享投资收益,也不对任何人因使用本报告中的任何内容所引致的任何损失负责,投资者据此做出的任何投资决策与本公司、本公司员工或关联机构无关。 市场有风险,投资需谨慎。投资者不应将本报告作为投资决策的唯一参考因素,也不应当认为本报告可以取代自己的判断。