证券研究报告 行业研究 2026年01月11日 本期内容提要: 王义夫电子行业分析师执业编号:S1500525090001邮箱:wangyifu@cindasc.com ➢开源模型:从数据到代码全覆盖,Nemotron 3重构Agentic AI范式。本次CES上,黄仁勋宣布扩展其开源模型生态(Open ModelUniverse),新增和更新了一系列模型、数据集、代码库和工具。这 个 生 态 覆盖 六 大 领域: 生 物 医 学AI(Clara)、AI物 理 模拟(Earth-2)、Agentic AI(Nemotron)、物理AI(Cosmos)、机器人(GR00T)和自动驾驶(Alpamayo)。Nemotron系列是此次更新的重点,覆盖了推理、RAG、安全和语音四个应用方向。 ➢物理AI:从Cosmos到Alpamayo,走向商业化落地。在物理AI领域,英伟达更新了用于理解和生成物理世界视频的Cosmos,机器人通 用 基 础 模 型Isaac GR00T、 自 动 驾 驶 视 觉-语 言-行 动 模 型Alpamayo。Cosmos是一个开源的物理AI世界基础模型,目前已经用海量视频、真实驾驶与机器人数据,以及3D模拟做过预训练。 信达证券股份有限公司CINDA SECURITIES CO.,LTD北京市西城区宣武门西大街甲127号金隅大厦B座邮编:100031 Alpamayo是一个面向自动驾驶领域的开源工具链,也是首个开源的视觉-语言-行动(VLA)推理模型。 ➢投资建议:英伟达Rubin平台正式发布开启AI算力新纪元,全球算力设施向“AI工厂”范式全面转型。我们认为,Rubin通过协同设计实现性能飞跃,算力、存储、PCB、机架等多环节价值量或显著提升,产业链核心环节在基建投资化趋势下仍具备较大的成长空间,建议关注:【海外AI】工业富联/沪电股份/鹏鼎控股/胜宏科技/生益科技/生益电子等;【国产AI】寒武纪/芯原股份/海光信息/中芯国际/深南电路 等 ;【 存 储 】 德 明 利/江 波 龙/兆 易 创 新/聚 辰 股 份/普 冉 股 份 等 ;【SoC】瑞芯微/乐鑫科技/恒玄科技/晶晨股份/中科蓝讯等。 ➢风险提示:AI发展进程不及预期,下游需求发展不及预期。 目录 Vera Rubin:六大芯片协同升级,推理性能大幅提升..................................................................................5算力:NVFP4推理性能提升5倍,推理成本显著下降..........................................................6存储:针对大量KV Cache问题,推出推理上下文内存存储平台.........................................6PCB:从Cable Tray到Cableless互联,PCB价值量显著提升..............................................8Rack:系统协同设计显著提升,ODM环节核心受益.............................................................9开源模型:从数据到代码全覆盖,Nemotron 3重构Agentic AI范式................................................10物理AI:从Cosmos到Alpamayo,走向商业化落地...............................................................................11投资建议.......................................................................................................................................................................12风险因素.......................................................................................................................................................................12 图目录 图1:Vera Rubin NVL72概述................................................................................................................................5图2:Vera Rubin平台六款新芯片.......................................................................................................................5图3:Vera CPU主要参数........................................................................................................................................6图4:Rubin GPU相较于Blackwell算力提升5倍..........................................................................................6图5:Rubin HBM4总内存带宽提升至22TB/s.................................................................................................7图6:NVLink-C2C一致性内存架构....................................................................................................................7图7:BlueField-4 DPU..............................................................................................................................................7图8:Rubin平台的存储结构..................................................................................................................................8图9:Vera Rubin计算托盘采用cableless无缆互联架构............................................................................8图10:基于Vera Rubin构建的NVIDIA DGX SuperPOD............................................................................9图11:英伟达开源模型生态系统......................................................................................................................10图12:英伟达全栈物理AI平台.........................................................................................................................11图13:英伟达推出开源世界基础模型Cosmos............................................................................................11图14:面向自动驾驶领域的开源工具链Alpamayo...................................................................................11 Vera Rubin:六大芯片协同升级,推理性能大幅提升 Rubin平台正式发布,六款全新芯片协同增强推理性能。美国拉斯维加斯时间1月5日,英伟达创始人兼CEO黄仁勋在国际消费电子展CES 2026上发表主题演讲,并正式发布Rubin平台。该平台由六款专为打造超凡AI超级计算机而设计的全新芯片组成,包括VeraCPU、Rubin GPU、NVLink 6交 换 机 、ConnectX-9 SuperNIC、BlueField-4 DPU和NVIDIA Spectrum-6以太网交换机,6款芯片协同设计,从而大幅缩短训练时间并降低推理token成本。 Rubin平台的旗舰产品是Vera Rubin NVL72机架级系统,其设计使得整个机架在更大的AI工厂中作为一个协调运作的机器发挥作用。NVL72系统不仅针对峰值性能进行了优化,还致力于实现持续的智能生成:可预测的延迟、在异构执行阶段的高利用率,以及将电力高效转化为可用智能。 资料来源:Nvidia官网,信达证券研发中心 算力:NVFP4推理性能提升5倍,推理成本显著下降 Vera CPU:为数据移动和智能体处理而设计,拥有88个英伟达定制Olympus核心、176线程的英伟达空间多线程,1.8TB/sNVLink-C2C支持CPU:GPU统一内存,系统内存达1.5TB(是Grace CPU的3倍),SOCAMM LPDDR5X内存带宽为1.2TB/s,并支持机架级机密计算,数据处理性能翻倍提升。 资料来源:Nvidia官网,信达证券研发中心 Rubin GPU:引入Transformer引擎,NVFP4推理性能高达50PFLOPS,是BlackwellGPU的5倍,向后兼容,在保持推理精度的同时提升BF16/FP4级别的性能;NVFP4训练性能达到35PFLOPS,是Blackwell的3.5倍。 资料来源:Nvidia官网,信达证券研发中心 存储:针对大量KV Cache问题,推出推理上下文内存存储平台 HBM:随着上下文长度的增加以及推理过程变得越来越具交互性,内存性能的表现已成为影响整体效率的主导因素。RubinGPU集成了新一代的HBM4,每个GPU最高配备288GB HBM4,总内存带宽提升至22TB/s,是Blackwell的2.8倍。这使得RubinGPU能 够在不牺牲并发性或者利用率的情况下,支持长上下文推理、高批次MoE执行和交互式推理。 DRAM:每个VeraCPU还将搭载最高1.5TB的LPDDR5X内存子系统,能在低功耗下提供高达1.2TB/s的带宽,采用LPDDR5XSOCAMM形式。第二代NVLink-C2C在VeraCPU和Rubin GPU之间提供1.8 TB/s的一致性带宽,实现了CPU和GPU内存间的统一