您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[东吴证券]:电子行业深度报告:AI基建,光板铜电:光、铜篇:主流算力芯片 Scale up&out 方案全解析 - 发现报告

电子行业深度报告:AI基建,光板铜电:光、铜篇:主流算力芯片 Scale up&out 方案全解析

电子设备2025-12-27陈海进、解承堯东吴证券�***
电子行业深度报告:AI基建,光板铜电:光、铜篇:主流算力芯片 Scale up&out 方案全解析

AI基建,光板铜电—光&铜篇主流算力芯片Scale up&out方案全解析 2025年12月27日 证券分析师陈海进执业证书:S0600525020001chenhj@dwzq.com.cn研究助理解承堯执业证书:S0600125020001xiechy@dwzq.com.cn 增持(维持) ◼英伟达Rubin,集群互联高带宽低时延方向持续升级。Scale up端,依托NVLink6.0与六代NVSwitch,实现计算与交换侧129.6TB/s对称带宽,有效保障机柜级算力密集型场景下的参数同步效率;Scale out端,基于胖树无阻塞拓扑,通过多层组网支撑超大规模GPU集群无阻塞互联,缩短传输路径、降低时延。根据我们测算,Rubin若满配CPX芯片,三层组网下GPU光模块比例将达到1:12。 ◼谷歌TPU集群以高带宽互联与动态扩展为核心升级方向,构建Scaleup&out组网能力。Scale up端,64卡机柜内TPU(Ironwood V7)采用3D Torus拓扑,通过PCB走线、铜缆/ AOC&OCS多链路互联;Scale out端依托DCN分层架构,以9216 ICI POD为基础模块,经Tor/Leaf/Spine交换机实现流量汇聚,最终通过64台300*300端口OCS设备达成全局动态非阻塞互联,完成147456颗TPU集群组网。 ◼亚马逊Trainium3组网突出“高密度互联+灵活扩展”。Scale up端依托Scropio X交换芯片与PCIe6.0协议,通过AEC铜缆实现三层互联(PCB/背板/跨机架),144颗Trainium3经NeuronLink4端口达成高密度算力聚合;Scale out端采用ENA/EFA双网分工,搭配高基数低速率交换机,以Clos拓扑构建无阻塞网络,交换机带宽升级可实现集群规模线性扩展,全方位适配大规模AI训练的算力与通信需求。 相关研究 《从云端算力国产化到端侧AI爆发,电子行业的戴维斯双击时刻——电子行业2026年投资策略》2025-12-10 《Credo营收超预期&Marvell收购Celestial AI,催化光铜走强》2025-12-08 ◼Meta组网聚焦超大规模AI训练需求。Scale up端依托Tomahawk5交换芯片与cable backplane(112G PAM4铜缆背板),实现16颗MTIA与交换侧204.8Tbps的对称带宽互联;Scale out端基于DSF解耦架构,以Jericho3交换芯片构建机柜级RDSW、Ramon3交换芯片组成FDSW分层组网,1:1收敛比保障非阻塞传输,芯片与光模块比例可达1:10。 ◼光&铜观点:2026年商用GPU持续放量,也是CSP ASIC进入大规模部署的关键一年,数据中心Scale up催生超节点爆发,铜缆凭短距低耗低成本,成为柜内互联最优解;Scale out带动集群持续扩容,光模块与GPU配比飙升,产品放量使得光芯片缺口凸显。一铜一光双线共振,互联需求迎来量价齐升,建议重点关注光铜两大核心赛道。 ◼产业链相关公司: 光芯片:长光华芯、源杰科技、仕佳光子等铜缆:华丰科技、兆龙互连、沃尔核材等 ◼风险提示:算力互联需求不及预期,客户拓展及份额提升不及预期,产品研发及量产落地不及预期,行业竞争加剧 内容目录 1.英伟达Rubin,集群互联高带宽低时延方向持续升级..................................................................4 1.1.第六代NVLink赋能,Rubin Scale up持续突破....................................................................41.2.满配CPX,Rubin NVL 144 Scale out芯光比最高可达1:12.................................................52.谷歌TPU Scale up&out,3D Torus+DCN低时延互联升级........................................................72.1.基于3D Torus拓扑,谷歌TPU多链路Scale up扩展..........................................................72.2. TPU Scale out:DCN多层组网+ OCS支撑超大规模低时延互联........................................93.亚马逊Trainium3组网突出“高密度互联+灵活扩展”..........................................................103.1. Scropio X赋能,Tr3基于PCIe6+AEC完成Scale up扩展..................................................103.2. ENA/EFA双网分工,高基数低速率交换机支撑Tr3 Scale out...........................................114. Meta组网聚焦超大规模AI训练需求.............................................................................................134.1. Meta Minarva Scale up:TH5+112G铜缆204.8T对称互联.................................................134.2. Meta Scale out:DSF网络架构,专为AI训练设计.............................................................145.投资建议............................................................................................................................................166.风险提示............................................................................................................................................16 图表目录 图1:Rubin NVL144 CPX拆解............................................................................................................4图2:GB200 NVL 72网络端口拆分....................................................................................................5图3:TPU计算托盘板卡......................................................................................................................7图4:TPU服务器机柜..........................................................................................................................7图5:TPU V7 3D Torus拓扑图............................................................................................................8图6:谷歌TPU 147456 DCN网络Scale out网络互联....................................................................10图7:Trainium Teton3 NVL72*2交换机架构....................................................................................11图8:Tranium3 131072万卡集群Scale out组网..............................................................................13图9:Minerva机柜网络拓..................................................................................................................14图10:MTIA托盘图...........................................................................................................................14图11:Jericho托盘图..........................................................................................................................14图12:Tomahawk托盘图....................................................................................................................14图13:Meta DSF Fabric网络拓扑......................................................................................................15图14:Meta DSF Dual-stage Fabric网络拓扑...................................................................................15 表1:Rubin NVL 144光模块需求比例测算........................................................................................6表2:谷歌Ironwood TPU 3D Torus连接端口配比关系测算.............................................................8 1.英伟达Rubin,集群互联高带宽低时延方向持续升级 数据来源:英伟达,东吴证券研究所 1.1.第六代NVLink赋能,Rubin Scale up持续突破 ⚫Rubin NVL 144 Scale up节点配置 ✓18个计算托盘:每个托盘集成4个Rubin GPU模组(双GPU die)。✓单颗Rubin GPU