您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [未知机构]:英伟达 Vera-Rubin 时代降临:超级网卡驱动算力网络革命 – 华尔街见闻-20260605 - 发现报告

英伟达 Vera-Rubin 时代降临:超级网卡驱动算力网络革命 – 华尔街见闻-20260605

2026-06-05 未知机构 胡诗郁
报告封面

共5837字阅读需2分钟 瑞银将Ethernet AI switching描述为从2025年约00亿美元到2028年约580亿美元的高增长池。2026年英伟达全面导入ConnectX-8/9与Spectrum-X以太网平台的组合路线,服务器品牌厂商将于2026年三季度进入全面大规模出货阶段。 高速以太网/IB网卡及交换芯片、高性能光模块与AEC有源电缆、高速PCB/覆铜板材料、国产替代交换芯片与互联生态构成了五大核心受益方向。ConnectX-9的技术跃迁所释放的产业红利,正沿着英伟达Rubin平台的供应链从核心组件层向系统集成层逐级渗透。 一、发生了什么?VeraRubin时代到来 数据中心正演变成新一代AI工厂,GPU通信协议需要为下一代万亿参数模型预先设计的网络架构。这是ConnectX-9诞生的土壤。 在VR NVL72机架中,一条从外部网络进入、经过ConnectX-9、BlueField-4、Vera CPU,再分配到Rubin GPU的完整数据流路径,勾勒出了AI超节点内部的三重通信架构——NVLink-C2C(芯片到芯片互联)实现.8TB/s的双向带宽,为GB200NVLink-C2C的两倍;PCIe Gen6实现Vera CPU与ConnectX-9 之间的768GB/s互联;800G以太网/InfiniBand实现CX-9与OSFP光模块之间的高速出口互联。 瑞银将Ethernet AI switching描述为从2025年约00亿美元到2028年约580亿美元的高增长池。2026年英伟达全面导入ConnectX-8/9与Spectrum-X以太网平台的组合路线,服务器品牌厂商将于2026年三季度进入全面大规模出货阶段。 高速以太网/IB网卡及交换芯片、高性能光模块与AEC有源电缆、高速PCB/覆铜板材料、国产替代交换芯片与互联生态构成了五大核心受益方向。ConnectX-9的技术跃迁所释放的产业红利,正沿着英伟达Rubin平台的供应链从核心组件层向系统集成层逐级渗透。 英伟达Rubin平台由六款全新芯片组成:Vera CPU、RubinGPU、NVLink 6交换机、ConnectX-9 SuperNIC、BlueField-4DPU和Spectrum-6以太网络交换机。在VR NVL72的计算托盘内,一台完整的计算设备包含六类模块——2块Strata模块(各容纳2个Rubin GPU与个Vera CPU)、4块Orchid模块(各容 纳2个ConnectX-9 NIC和2个800G收发器)、块PCBMidplane、块BlueField-4模块、块PDB电源板和套SMM系统管理模块,各模块之间通过板对板连接器相互连接。ConnectX-9在数据流路径中承担第一道关卡角色,协调将外部的推理请求或训练数据分发到机架内的Vera CPU和RubinGPU,是所有外部通信的“网关”。 在计算托盘的主信号传输路径上,三段互联通信体系逐级衔接。Vera CPU与Rubin GPU之间的NVLink-C2C实现.8TB/s双向带宽,延迟纳秒级。Vera CPU与ConnectX-9之间通过两条PCIe Gen6链路,每条单向速度64GT/s。通过48条Lane的PCIe接口,总带宽达768GB/s。CX-9与OSFP光模块之间通过800G以太网/InfiniBand互联,4×200G PAM4调制技术实现800G速率。三层架构从昀内层的芯片到昀外层的网络形成了紧耦合的完整链路,超级网卡扮演着沟通“内”(GPU集群)与“外”(以太网/IB网络)的桥梁角色。 总的来说,有三重高速通信壁垒构筑英伟达的技术护城河。 ①第一道壁垒:NVLink-C2C——芯片间互联的范式级优势 第六代NVLink的核心参数极具统治力:每个GPU获得3.6TB/s的带宽,是前代的两倍,是PCIe Gen6的4倍以上。VR NVL72机架实现72个GPU的all-to-all全互连拓扑,总带宽达260TB/s。 NVLink 6交换机新增了控制平面高可靠性、在部分机架资源下持续运行的能力以及对交换机托盘的热插拔支持。NVLink-C2C的核心技术原理在于:通过AMBACHI协议实现硬件级缓存一致性,CPU和GPU缓存自动同步;CPU内存与GPU显存在软件视角呈现为单一内存池;对系统范围跨处理器的原子读写无需额外同步原语。主流PCIe Gen5仅为约28GB/s带宽且非一致性内存访问增加编程复杂度,NVLink-C2C在带宽和易用性上全面胜出。在VR NVL72中,NVLink Switch芯片可实现72颗GPU的全连接无阻塞计算网络,总AI计算能力高达3.6 exaFLOPS,72颗GPU可整体用作单个高性能加速器,这正是张量并行和专家并行等对通信极度敏感的算法在该平台上高效运行的根本原因。 ②第二道壁垒:PCIe Gen6+超高速背板 采用PCIe Gen6协议实现Vera CPU与超级网卡CX-9之间的高速互联。PCIe Gen6是第六代高速外设互联标准,支持48条Lane,每条Lane单向速度64Gbps,双向总带宽达到768GB/s。但PCIe Gen6信号传输对物理环境和PCB材料提出了前所未有的苛刻要求。在VR200NVL72计算托盘中,PCIe Gen6信号从Strata模块传输到Orchid模块前端,PCB距离长达约500mm。为实现信号完整性,需同时升级双向SerDes技术和PCB材料。CCL覆铜板从M7升级到M8/M9,主计算板和网络板的铜箔从普通电解铜箔升级到HVLP4超低轮廓铜箔;为降低介质损耗,玻璃纤维布甚至石英材料被用于Orchid板和中置板。单机架PCB 总价值从GB300的约3.5万美元升至Rubin的约.7万美元,增幅高达233%。 ③第三道壁垒:800G SuperNIC端到端协同 ConnectX-8/9与Spectrum-X交换机形成的端到端优化网络构成第三道壁垒。Spectrum-X专门为AI云设计的加速以太网平台,通过紧密耦合的Spectrum-4以太网交换机和BlueField-3 DPU,在大规模集群中实现了比传统OTS以太网高出.6倍的AI网络性能和95%的持续效率。外部Spectrum-X交换机与终端SuperNIC之间的关键协同技术包括:Multiplane多平面交换技术用拓扑并行取代层次深度来减少跳数和延迟;Adaptive Routing自适应路由实时感知链路拥塞并动态分配流量,避免热点;硬件级Congestion Control拥塞控制在NIC端直接感知拥塞信号并实时调整发送速率,无需主机CPU干预;高频遥测实现了000倍更快的遥测采集速度,使集群管理者可实时观测每一条链路的流量状态。这五大优化带来了显著收益:负载均衡实现.6倍更高有效带宽;尾延迟优化实现.3倍更高集合通信带宽;噪声隔离实现2.2倍更高All-reduce带宽;弹性性能实现.3倍更高All-to-all带宽。 二、为什么重要?从Scale-out到Scale-up的算力架构革命 ①超节点概念:以太网开放路线对抗英伟达生态封闭 超节点的本质是将数十乃至数百颗GPU通过高速总线与交换芯片在机柜内进行紧耦合,形成一个逻辑上的超级计算机,彻底改变了传统服务器集群松散耦合的模式,将通信带宽提升了数倍,时延降至纳秒级。英伟达通过在Scale-up层面独占NVLink技术,建立私有生态和“NVIDIA inside”全栈打包模式,从而在万卡乃至更大规模集群中实现对整体架构的控制权。自2025年以来,国内厂商纷纷推出对标国际一流的超节点产品:华为CloudMatrix 384、中科曙光scaleX 640、阿里磐久28、腾讯ETH-X64、字节跳动大禹等头部超节点产品相继发布或商用。超节点已成为国产算力追赶海外的技术主方向之一。 在Scale-up互联协议层面,两条路线并行竞争。封闭路线由英伟达NVLink独占,高带宽且已大规模工程验证,但生态私有、可扩展性和与外部网络协同能力受限。以太网开放路线凭借开放生态、低成本、多厂商兼容等优势,通过引入在网计算INC(时延从600-800ns优化至约250ns)和计算通信重叠等优化技术弥补了以太网在极低延迟需求中的短板,正加速成为主流。行业观察人士指出,AI网络互连硬件的核心分歧不是InfiniBand与AI Ethernet谁取代谁,而是英伟达、博通、Marvell、Arista、Cisco谁能在三层网络收税。英伟达已加入ESUN联盟推动以太网适配Scale Up场景,展现了技术路线的防御性开放态度。 ②以太网与InfiniBand的路线之争本质:不是“取代”而是“分层征税” InfiniBand作为超算和高性能计算领域的传统高性能网络,以原生RDMA技术实现低于2微秒的极低延迟和零丢包的绝对优势,在高端AI训练集群中因卓越性能而长期占据统治地位。然而在超大规模以太网部署中,RoCEv2(RDMA over ConvergedEthernet)在万卡集群扩展时仍面临Incast拥塞丢包、ECMP负载不均、协议稳定性差三大瓶颈,已成为业内公开的技术痛点。 英伟达自身采取“两条腿走路”策略:InfiniBand在超算和高端AI训练集群中保证极致性能;Spectrum-X以太网平台以“.6倍网络性能提升+95%效率”的数据,正在快速缩小与InfiniBand的性能差距。瑞银将Ethernet AI switching市场描述为从2025年约00亿美元到2028年约580亿美元的高增长池。从投资视角看,两者并非对立替代的关系,而是面向不同规模、不同成本敏感度的云服务商提供的分层技术选择,共同扩大了英伟达在网络侧的市场空间。 英伟达通过ConnectX SuperNIC+BlueFieldDPU+NVLink+NVSwitch+CUDA软件生态构筑不可逾越的闭环。博通则凭借Tomahawk交换芯片系列深耕开放以太网生态,是云服务商自研ASIC与开放Ethernet路线的核心推动者。Marvell在NVLink Fusion和光电互连中扮演弹性桥接角色。Arista和Cisco提供网路系统集成与交付服务。英伟达预计2026年第三季度开始铺货Rubin平台,首代Rubin机架出货目标未受制程传言明显冲击,Ultra版本则预计于2027年推出,长期订单能见度超过2028年,奠定了未来数年互联技术路线的清晰方向。 三、接下去关注?上下游产业链关键环节 ①超级网卡上游:芯片设计、先进封装与高多层PCB ConnectX-9的内核是PCIe Gen6 SerDes IP、RDMA加速引擎和Spectrum-X交换逻辑的三合一融合SoC,由台积电以先进制程制造。PCB/CCL材料升级是重要增量:M8/M9等级覆铜板和HVLP4铜箔的渗透率加速提升,叠加PCB层数(计算板22L→26L HDI、交换板24L→32L)和价值跃升,为相关公司带来重要机遇。 2026年800G以太网光模块单端口3800万颗、.6T光模块400万颗的量级直接拉动中际旭创、新易盛、天孚通信、光迅科技等光模块企业的业绩。同时,随着Rubin平台800G SuperNIC量产和400G/800G SerDes普及,AEC有源电缆在短距离GPU集群互联中的应用价值凸显。 ③国产替代主战场:交换芯片、互联芯片与整机集成 盛科通信是国内少数的高速交换芯片供应商,在国产超节点规模化铺货浪潮中具备战略卡位。海光信息在高速互联和GPU-DPU协同芯片方向持续发力。中兴通讯依托自研凌云芯片与OLink高速互联总线构建32卡以上超节点架构,GPU间互联带宽超过400GB/s。奇异摩尔800G AI SNIC单通道400G RDMAASIC突破打开了国产AI超级网卡迈向800G ASIC的大门。在超节点整机层面,浪潮信息、中科曙光、工