AI智能总结
中泰通信首席分析师:陈宁玉(S0740517020004)Email:chenny@zts.com.cn分析师:杨雷(S0740524060005)Email:yanglei01@zts.com.cn ◼GTC 2022:硬件为主,发布全新Hopper架构H100 GPU及Grace CPU超级芯片,第四代NVLink和第三代NVSwitch技术、DGX H100SuperPOD等。 图表:GTC 2025精选主题 ◼GTC 2023:侧重软件及服务更新,发布及更新H100 NVL GPU,PCIe H100等硬件,以及AI超级计算服务DGX Cloud、光刻计算库CuLitho、GPU加速量子计算系统等。 ◼GTC 2024:发布新一代芯片平台Blackwell、AI平台NEMO、仿真平台Omniverse、AI(AI foundry)服务、IssacRobotics平台等创新型产品服务。此外,GTC还为中国企业打造特别平台,探索中国市场新机遇。 ◼GTC 2025:3月17—21日,于美国加州圣何塞及线上举行会议。本届GTC将举办1000多场会议,邀请2000位演讲嘉宾和近400家参展商,并展示NVIDIA AI和加速计算平台如何应对全球最严峻、最艰巨的挑战,包括气候研究、医疗健康、网络安全、人形机器人、自动驾驶汽车等。预计从大语言模型和物理AI到云计算和科学发现,NVIDIA的全栈平台正在推动下一次工业革命。 ◼英伟达有望在GTC 2025上公布GB300更具体细节方案。 ◼算力与带宽性能方面:据Semi Analysis预测,B300基于台积电4NP工艺打造,算力较B200提升约50%,并搭载12-HiHBM3E显存,提供288GB超大容量与8TB/s带宽,满足千亿参数模型训练需求。GB300平台搭载了800G ConnectX-8网络接口卡,可在InfiniBand和以太网上提供双倍的扩展带宽。 ◼功耗与散热挑战:GB300服务器整机功耗升至1.4kW(较GB200提升16.7%),B300 HGX功耗达1.2kW,液冷技术或成高密度计算场景标配。 ◼模块化战略转型:英伟达或不再销售完整服务器机箱,转而向云厂商开放核心组件(SXM Puck模块、Grace CPU等),推动定制化AI算力解决方案。 ◼下一代Rubin路线:尽管3nm工艺的Rubin CPU与Vera GPU架构有望同步亮相,但受量产进度限制,本次大会或仅披露技术路线图,量产时间或延至2026年 ◼GB300或将再次提升算力性能。相较GB200,GB300单卡FP4(4位浮点数)性能有望提升1.5倍;内存容量提升至288GB,采用12层堆栈的HBM3E内存;网络功能从ConnectX7升级至ConnectX8,光模块也从800G提升至1.6T。功耗从GB200和B200的功耗1.2kW和1kW提升至GB300和B300的功耗1.4kW和1.2kW。 ◼NVL288或将提及,关注PCB的PTFE方案进展。NVL288关注度较高,其或由4个NVL72组成。因NVL72功耗大散热要求较高,建议关注其散热相关技术产品是否继续升级;二是其系统组成较为复杂,尤其是CPU、GPU如何互联成为焦点。NVL288计算单元的PCB或将回归早期的UBB+OAM结构,我们预计英伟达将采用PTFE CCL背板解决方案等。 ◼GB200即采用液冷技术,GB300功耗有望进一步提升。2024年英伟达发布GB200 NVL72机柜,整机柜功率达到120kW,使用液冷技术方案。GB300的运行功耗预计为1.4kW,相比GB200的1.2kW有所增加。功耗的提升带来了更强大的性能,但也对散热系统提出了更高要求。GB300高散热功率问题仍然是关键挑战。 ◼GB300液冷技术预计在冷板结构上有更新。GB200液冷技术以一个Computetray(计算托盘)为例,其冷板配置采用“一进一出”的设计,每个大冷板覆盖多个芯片,大冷板通过一对快接头与液冷系统相连;而后多个冷板回路经由manifold(分流器)汇集成一个整体回路,最终连接至机箱外壳。预计GB300液冷主要变化在于冷板结构的革新:为每个芯片配备独立的“一进一出”液冷板。其他配置则沿用GB200。未来,Rubin架构或将转向浸没式液冷设计,建议关注。 来源:英伟达,技术前沿,中泰证券研究所 ◼GB200冷板配置信息:GB200NV72有18个computetray,每个computetray覆盖6个芯片(4个GPU+2个CPU)。在GB200液冷板配置中,一个computetray覆盖6个芯片散热,配2个冷板,每个冷板配快充头进出各一对,则computetray侧为4对。computetray与manifold连接的两对,则(computetray+ manifold)总计需要6对快接头。 ◼GB300冷板配置预测:GB300或将不再采用大面积冷板覆盖多个芯片的模式,转而为每个芯片配备独立的液冷板。新的计算方式则为:一个computetray包括6个芯片,每个芯片均需要散热,进出各一对,则computetray侧为12对。computetray与manifold连接的两对,则(computetray+ manifold)总计需要14对快接头。 来源:英伟达,SemiAnalysis,技术前沿,中泰证券研究所 ◼Quantum 3400 X800量产节奏预期:该款产品为Infiniband(IB)交换机。目前,该款传统统可插拔光模块版本已进入量产阶段。此外,隐藏CPO版本将于2025年第三季度开始量产。 ◼2025年CPO有望加速:台积电与博通在3nm工艺上的CPO关键技术微环调制器(MRM)调试成功,预计2025年初可以交付样品,并有望在下半年实现1.6Tbps光电器件的量产。此外包括英特尔、Marvell、光迅等厂商均有不同进展。总体来看,头部大厂将CPO量产时间定在2025年,或许今年能落地相关产品于数据中心。 预预期期三三::预期三:预期三:CCPPCPCPOOOO版版本本版本版本QQuuaannttuumm 33440000 XXQuantum 3400 XQuantum 3400 X880000800800结结构构结构结构 ◼CPO版本的Quantum 3400 X800 IB交换机的外观:这是一款4U高度的交换机,总共有6排24列,每个配置MPO接线口(Multi-fiberPush On,一种标准化的光纤连接器),可支持800G,总计144个800G端口。 ◼外观上看,Quantum 3400 X800为4U交换机,设备左侧有18路外置可插拔光源模组,右侧则有调试接口、管理接口、串口以及LED指示灯等功能部件。其设计为纯液冷系统,电源位于后端中央位置,两侧则分别为进冷水管和出热水管(图二蓝色部分为进冷水接口,红色部分为出热水接口)。 来源:电子发烧友,未来创造者,中泰证券研究所 ◼内部看,Quantum 3400 X800配置4颗28.8T交换芯片,交换能力为115.2T。4颗交换芯片互相不通信,采用多平面技术(multi-planetopology)。外接信号布局为六排,每排配备24个MPO接线口,则共计144个800G接口;最新的Q3400可支持液冷。◼如上所述,从外进入交换芯片数据量为144*800=115.2T,刚好为4个交换芯片处理速率。因4个交换芯片互相不通信,则每个芯片接收通道量为144/4=36个,又一个光引擎可处理4个800G通道,则单芯片共计需要9个光引擎,单交换机配备需要4*9=36个光引擎。 预预期期四四::预期四:预期四:880000VV800V800V HHVVDDCCHVDCHVDC有有望望采采用用有望采用有望采用 ◼HVDC较UPS的供电结构简单,稳定性更强:传统UPS的原理为输入交流电流,后经AC/DC整流、DC/AC逆变后输出交流电流。而高压直流UPS输入交流电流,经AC/DC整流后输出直流电流,取消了传统UPS的DC/AC逆变过程。在负载侧,传统UPS供电的负载服务器电源需经过AC/D转换为直流电流供负载使用;而高压直流UPS供电的负载服务器取消了该环节。因而大大提高了供电系统的效率,从而降低供电系统的发热损耗,通过HVDC供电方式的应用可以比采用UPS供电节约电能10 %~20 %。 ◼HVDC运营成本较传统UPS下降明显:通过比较传统1+1冗余120kvA UPS和2套50KW高压直流电源运营成本发现。每年运营成本HVDC比UPS要低13.95%,年节省26. 91万元。近日,台达电于其官网推出72kW电源架适配800V高压输出,效率高达98%,适用于Rubin超大功率服务器机柜。未来AIDC建设中,800V HVDC有望得到更广泛采用。 预预期期四四::预期四:预期四:BBBBUUBBUBBU和和超超级级电电容容器器作作为为标标配配和超级电容器作为标配和超级电容器作为标配 ◼GB300电源有望采用高度集成化和模块化的电源系统设计:新设计整合了超级电容器和电池备份单元(BBU),可显著提升电源质量和系统可靠性,同时优化了能效和空间利用率,提升数据中心应对高功耗AI负载的能力。BBU扮演着备用电源角色,通过内置锂离子电池为服务器提供短期供电保障,可在市电中断情况下支持服务器运行5到7分钟。而超级电容器则以其快速响应特性应对电源波动,能够在电力负载突然变化立即提供瞬时功率补偿,确保电压的稳定。 ◼新设计体积更小重量更轻能耗更低:相较于传统的不间断电源(UPS),BBU的体积减少了50%到70%,重量减轻了50%到60%,并且充电速度提高了5倍,大幅降低了AI数据中心的空间需求和运营能耗。从增量分析的角度来看,GB300预计会需要5个BBU模块和超过300个超级电容器。 ◼人形机器人过往布局:英伟达于2018年推出包含全新硬件、软件和虚拟世界机器人模拟器的NVIDIA Isaac,同时还推出专为机器人设计的计算机平台Jetson Xavier和相关的机器人软件工具包。2023年,NVIDIA发布了全新Jetson AGX Orin工业级模块,并且宣布推出Isaac ROS和Isaac Sim软件的全新版本,增强了全线产品性能的同时,也降低了使用门槛。2024年2月,NVIDIA还成立了通用具身智能体研究实验室GEAR,推动跨多模态、多场景的智能应用。GTC2024上,NVIDIA重磅推出的人形机器人通用基础模型GR00T(Generalist Robot 00 Technology)与新型人形机器人计算机Jetson Thor,为整个机器人行业树立新标杆。 ◼新一代机器人平台Jetson Thor升级版:为其最新一代人形机器人专用紧凑型计算机,Thor型号借用了漫威宇宙的雷神索尔(Thor)的名字,专注于机器人技术。对外投资方面,英伟达至少已投资5家机器人初创公司,涵盖外卖机器人、工业机器人、除草机器人等,如Figure AI,其生产的Figure 02已被用于宝马公司位于美国南卡罗来纳州斯帕坦堡的工厂。此外,还有Serve Robotics、Machina Labs、Bright Machines及Carbon Robotics等公司。 来源:英伟达官网,DeepTeck深科技,中泰证券研究所 ◼根据九号公司官网,2024年1月9日,九号公司旗下商用服务机器人品牌九号机器人携旗下送物机器人、送餐机器人以及与英伟达共同开发的Nova Cater AMR等产品在CES 2024展会亮相。九号机器人与英伟达的合作由来已久,早在2014年九号公司就基于旗下九号机器人品牌,开始布局智慧移动机器人业务,2023年5月的中国台北国际电脑展上发布的自主移动机器人平台Isaac AMR,就是提供底层智慧移动能力支撑同时负责整车集成。英伟达GTC 2024大会上,发布全新开发者套件Nova Orin,该套件由九号公司负责研