AI智能总结
行业深度报告—— GTC大会召开,催生供应链新增量 李珏晗S1190523080001证券分析师:分析师登记编号:张世杰S1190523020001证券分析师:分析师登记编号: 报告摘要 Blackwell Ultra平台发布,测试时扩展推理能力优化。英伟达于GTC发布Blackwell平台新一代产品Blackwell Ultra,该产品定位提升训练和测试时扩展推理能力。Blackwell Ultra采用台积电N4P工艺,单卡FP4浮点运算性能为15PetaFlops,相较B200提升50%;采用8堆栈12层堆叠的HBM3e,容量提升至288GB,相较B200提升50%。Blackwell Ultra核心变化聚焦显存容量的优化,为AI推理大时代的开启作出铺垫。 Rubin Ultra NVL576性能大幅提升,“纵向扩展”推进。GTC大会预告下一代Rubin架构,基于RubinUltra的Rubin Ultra NVL576预计于27年下半年推出,将标配HBM4,FP4推理浮点运算能力达到15ExaFlops,FP8训练运算能力达到5ExaFlops,是GB300 NVL72的14倍。Rubin Ultra NVL576性能大幅提升,“纵向扩展”持续推进。 GB300&RUBIN架构变化,催生供应链新增量。变化一:回归UBB+OAM板,在GB200中,Compute Tray为集成了2颗GPU、1颗Grace CPU、LPDDR5X等器件的Bianca主板;预计英伟达在GB300中将不再采用Bianca主板,而是采用UBB+OAM模式,由英伟达提供GPU SXM Puck,客户配置更加灵活。变化二:有望引入PTFE背板架构。考虑到Rubin性能大幅提升,功耗随之增加,Rubin系列中有望迎来架构调整。正交架构或成为机柜方案,从而提升传输效率。正交架构需要高传输速率及低损耗,PTFE材料介电损耗仅为2.1MHz,有望引入PTFE背板。 风险提示:下游需求不及预期风险;行业竞争加剧风险;地缘政治风险。 目录 Blackwell Ultra平台发布,测试时扩展推理能力优化 Ⅰ Rubin Ultra NVL576性能大幅提升,“纵向扩展”推进 Ⅱ Ⅲ GB300&Rubin平台架构变化,催生供应链新增量 1.1. Blackwell Ultra于GTC大会发布,预计25年下半年出货 英伟达于GTC大会发布Blackwell Ultra平台,开启AI推理新时代。3月17日至21日美国加州圣何塞举行GTC 2025大会,英伟达CEO黄仁勋发表主题演讲,发布Blackwell平台新一代产品BlackwellUltra,该产品定位提升训练和测试时扩展推理能力,即通过在推理过程中增加计算量来提升准确率,开启AI推理新时代。 资料来源:英伟达GTC2025,英伟达官网,太平洋证券 1.1. Blackwell Ultra于GTC大会发布,预计25年下半年出货 基于Blackwell Ultra的产品预计将于2025年下半年出货。参考GB200时间线,GB200于GTC2024正式发布后,同年四季度开始出货,25年一季度批量出货,GB300发布时间与GB200出货时间相隔仅半年左右,预测GB300或于2025年下半年左右量产出货。 1.1. Blackwell Ultra于GTC大会发布,预计25年下半年出货 Blackwell Ultra计算性能提升,FP4 15 Petaflops。英伟达2025年下半年将逐步过渡升级至Blackwell Ultra,Blackwell Ultra采用台积电N4P工艺,推理能力大幅优化,单卡FP4浮点运算性能为15PetaFlops,相较B200FP4的单卡算力9PetaFlpos,Blackwell Ultra单卡FP4浮点运算性提升50%以上。 资料来源:英伟达GTC2025,英伟达官网,太平洋证券 1.1. Blackwell Ultra于GTC大会发布,预计25年下半年出货 Blackwell Ultra存力显著提升,升级至288GB 12hiHBM3e。显存方面,Blackwell Ultra采用8堆栈12层堆叠的HBM3e,B100、B200均为8层堆叠的HBM3e,Blackwell Ultra显存容量提升至288GB,B200显存容量仅为192GB,相较提升50%。Blackwell Ultra与上一代相同,支持NVLinkv5,带宽1.8TB/s。 资料来源:GTC 2025,Trendforce,太平洋证券 1.2.基于Blackwell Ultra的GB300 NVL72,专注大规模AI推理场景 基于Blackwell Ultra的GB300 NVL72,专注大规模AI推理场景。Blackwell Ultra包括GB300NVL72机架级解决方案和HGX B300 NVL16系统。GB300 NVL72在单机架连接72个Blackwell UltraGPU+36个基于Arm Neoverse架构的Grace CPU,有18个Compute Tray+9个NVLink Switch Tray组成,专注测试时扩展的应用场景。 资料来源:英伟达官网,太平洋证券 1.2.基于Blackwell Ultra的GB300 NVL72,专注大规模AI推理场景 GB300 NVL72性能优化,为上代1.5倍。GB300 NVL72性能为GB200 NVL72的1.5倍,FP4推理浮点运算能力达到1.1ExaFlops,GB200 NVL72 FP4为1440PetaFlops,FP8训练运算能力达到0.36ExaFlops;配备20TB内存,上一代内存为14TB,为上一代1.5倍;总带宽为576TB/s。HGX B300NVL16相比Hopper系列,LLM推理速度增加11倍,计算性能增加7倍,内存容量增加4倍。 资料来源:英伟达GTC 2025,太平洋证券 1.3内存模组、网卡、光模块等配置均有升级 内存条预计引入LPCAMM模组。GB300的外部存储预计引入LPCAMM模块,GB200采用的方案是焊接LPDDR5X,GB300外接存储器LPCAMM支持可插拔与扩展,带来灵活性提升。 网卡升级为CX8,提升一倍。GB300预计采用800G ConnectX-8,在GB200中网卡配置为400GConnectX-7,CX8带宽较CX7提升一倍,带宽为14.4TB/s,传输速率更快。 单卡功耗提升,但整机柜能耗预计不变。GB300单卡功耗提升到1.4kW,相较GB200的单卡功耗1.2kW,G300B单卡功耗提升约17%,而整体机柜能耗预计仍控制在132kW。 资料来源:美光官网,太平洋证券 1.4.DGX SuperPOD赋能AI推理,助力企业快速部署 基于Blackwell Ultra的DGXSuperPOD赋能AI推理。DGXSuperPODAI超级计算机采用DGX GB300和DGX B300系统,集成NVQuantum-X800InfiniBand或Spectrum-X以太网,助力企业快速部署。DGXSuperPOD提供FP4精度计算,大幅提升AI应用中Token生成速率。DGX GB300采用液冷架构,专注高级推理模型的实时代理响应,DGX B300采用风冷架构,专注生成式和代理式AI。 资料来源:英伟达官网,太平洋证券 目录 Blackwell Ultra平台发布,测试时扩展推理能力优化 Ⅰ ⅡRubin Ultra NVL576性能大幅提升,“纵向扩展”推进 Ⅲ GB300&Rubin平台架构变化,催生供应链新增量 2.1.新继代Vera Rubin预计26年出货,配置全面更新 新一继代Rubin架构将于2026年发布。英伟达继Hopper、Blackwell之后的下一代Rubin发布,相较Hopper、Blackwell的每两年发布新一代,Rubin Ultra将于预计2027年发布。Rubin架构基于台积电3nm工艺,采用CoWoS-L封装。 2.1.新继代Vera Rubin预计26年出货,配置全面更新 Vera Rubin架构正式问世,配置全面更新。Rubin GPU FP4精度下达到50 petaflops,是Blackwell Ultra 15 petaflops的3.3倍以上,推理能力大幅提升;配置8颗16层堆叠HBM4,容量288GB。Vera CPU是基于英伟达自主架构Olympus的处理器,集成88个定制Arm核心,总线程数达到176个,支持多线程技术,相较上一代Grace CPU为72核,仅支持单线程。Vera CPU通过NVLink-C2C与Rubin GPU链接,带宽达1.8TB/s。 资料来源:英伟达GTC2025,英伟达官网,太平洋证券 2.2. Rubin Ultra NVL576性能突破性提升 Vera Rubin NVL144提供3.3倍NVL72性能。在Blackwell架构为双GPU架构,即1个Blackwell芯片上集成2个GPU,并以Blackwell芯片数量计数,而从Rubin系列开始,英伟达将使用GPU die数量作为计数,每个GPU die为一个GPU,每个NVL均连接到GPU,集成为Vera Rubin NVL144。VeraRubinNVL144将标配HBM4,带宽为13TB/s,FP4推理浮点运算能力达到3.6 ExaFlops,FP8训练运算能力达到1.2 ExaFlops,是GB300 NVL72的3.3倍;配置Connect-X9,带宽为28.8TB/s,为上一代Connect-X8的2倍;支持NVLink6,带宽为260TB/s,带宽提高一倍。 资料来源:英伟达GTC2025,英伟达官网,太平洋证券 2.2. Rubin Ultra NVL576性能突破性提升 下一代Rubin Ultra由4个GPU die封装,预计2027年正式发布。Rubin架构平台的新一子代RubinUltra将于2027年发布,Rubin Ultra芯片上将集成4个GPU die。Rubin Ultra的FP4推理算力高达100 Petaflops,是Rubin的50 Petaflops FP4算力的2倍,同时将配置HBM4e,内存容量升级至1TB,是Rubin的3.5倍。 资料来源:英伟达GTC2025,英伟达官网,太平洋证券 2.2. Rubin Ultra NVL576性能突破性提升 Rubin Ultra NVL576提供14倍GB300 NVL72性能。基于Rubin Ultra的Rubin Ultra NVL576预计于27年下半年推出,将标配HBM4,带宽为4.6PB/s,FP4推理浮点运算能力达到15ExaFlops,FP8训练运算能力达到5ExaFlops,是GB300 NVL72的14倍;配置Connect-X9,带宽为28.8TB/s,为上一代Connect-X9的2倍;支持NVLink7,带宽为1.5PB/s,带宽为上一代的12倍。 资料来源:英伟达GTC2025,英伟达官网,太平洋证券 资料来源:英伟达GTC2025,英伟达官网,太平洋证券 目录 Blackwell Ultra平台发布,测试时扩展推理能力优化 Ⅰ Rubin Ultra NVL576性能大幅提升,“纵向扩展”推进 Ⅱ Ⅲ GB300&Rubin平台架构变化,催生供应链新增量 3.1架构模块化,助力灵活配置需求 回归UBB+OAM架构,为客户提供灵活配置可能性。在GB200中,Compute Tray为集成了2颗GPU、1颗Grace CPU、LPDDR5X等器件的Bianca主板;预计英伟达在GB300中将不再采用Bianca主板,而是采用UBB+OAM模式,由英伟达提供G