AI智能总结
2025年11月25日 行业研究/行业点评 GTC25,NVIDIA发 布VeraRubinSuperchip 行业及产业电子 ——人工智能月度跟踪 投资要点: 强于大市 事件:2025年10月29日,NVIDIACEO黄仁勋在美国华盛顿举行的GTC大会上发表主题演讲,不仅展示了下一代超级芯片VeraRubin的原型机,更提出了“AI不是工具,而是会用工具的工人”这一颠覆性观点。 作为全球知名芯片设计公司,NVIDIA长期专注高性能GPU及系统芯片研发。在架构早期阶段,其通过2010年前的Tesla、2010年的Fermi、2012年的Kepler及2014年的Maxwell四大系列,推动GPU从“图形加速专用硬件”成功转型为“通用并行计算引擎”,期间持续优化可靠性、能效比与场景适配能力;2016年后,伴随AI与高性能计算需求爆发,NVIDIA加快迭代节奏,先后推出2016年的Volta(首推TensorCore开启AI算力硬件加速)、2022年的Hopper(以TransformerEngine支撑大模型研发)、2024年的Blackwell(全栈协同设计提升AI推理与图形渲染性能)等架构,并计划通过下一代Rubin、Feynman架构突破算力密度与能效比极限,服务超复杂场景。 相关研究 《电子行业周报:数据中心助力GaN需求增长》2025-11-17《电子行业周报:SKhynix发布存储新路线,重塑AI时代新架构》2025-11-10《电子行业周报:钽电容价格持续上涨》2025-11-04《电子行业周报:关注半导体新材料的应用进展》2025-10-28《人工智能月度跟踪:OpenAI推出新一代音视频工具Sora2》2025-10-21 为突破摩尔定律逼近物理极限、晶体管密度对算力边际贡献下降的瓶颈,NVIDIA于2025年10月29日推出VeraRubin超级芯片。该超级芯片并未单纯堆积晶体管,而是通过CPU与GPU的异构协同、HBM4高带宽显存的搭配,以及CUDA生态的兼容,以架构与系统级创新实现算力跃升。1)从硬件配置来看,VeraRubin超级芯片由RubinGPU与VeraCPU构成。RubinGPU被大量电源电路环绕,配备8个HBM4显存位点,且集成两颗Reticle尺寸GPU芯片;VeraCPU则搭载88个定制ARM核心,总计提供176个线程。2)从性能迭代来看,NVIDIA芯片从Hopper、Blackwell演进至Rubin架构。VeraRubin超级芯片作为该代旗舰,其VR200、VR300(Ultra)加速器的FP4算力分别达50、100PFLOPS,搭配288GBHBM4乃至1025GBHBM4E显存,带宽最高32TB/s,较前代Blackwell架构实现数倍提升;同时CPU从Grace系列升级为Vera系列,核心性能与线程数的提升进一步释放了异构协同的算力。 证券分析师 伴随VeraRubin超级芯片的持续推进,NVIDIA计划于2026H2、2027H2分别推出VeraRubinNVL144平台与更高规格的RubinUltraNVL576平台。1)VeraRubinNVL144平台采用RubinGPU与VeraCPU组合设计。RubinGPU包含两颗Reticle尺寸核心、具备50PFLOPS(FP4精度)算力及288GBHBM4显存;VeraCPU提供88个定制Arm核心、176线程且NVLINK-C2C互联带宽达1.8TB/s,该平台性能相较上一代GB300NVL72提升约3.3倍,FP4推理算力3.6Exaflops、FP8训练算力1.2Exaflops,系统总显存带宽13TB/s、快速存储容量75TB;2)而RubinUltraNVL576作为迭代产品,硬件与性能全面升级。NVL规模从144扩展至576,CPU架构不变,GPU升级为四颗Reticle尺寸核心(单颗性能最高100PFLOPSFP4精度、搭载1TBHBM4e显存)。该平台性能较GB300NVL72提升14倍,FP4推理算力15Exaflops、FP8训练算力5Exaflops,HBM4显存带宽4.6PB/s、快速存储容量365TB,NVLINK通信能力提升12倍(最高1.5PB/s),整体算力、存储及连接效率大幅跃升。 许亮S08205250100020755-83562506xuliang@ajzq.com 联系人 朱俊宇S0820125040021021-32229888-25520zhujunyu@ajzq.com 投资建议:建议关注NVIDIA服务器国产供应链的持续成长机遇。 风险提示:1)国际贸易摩擦加剧2)下游需求不及预期3)技术升级进度滞后 事件:GTC25,NVIDIA发布VeraRubin超级芯片 2025年10月29日,NVIDIACEO黄仁勋在美国华盛顿举行的GTC大会上发表主题演讲,不仅展示了下一代超级芯片VeraRubin的原型机,更提出了“AI不是工具,而是会用工具的工人”这一颠覆性观点。 1.NVIDIA从Tesla、Fermi向VeraRubin迭代升级 NVIDIA作为全球知名的芯片设计公司,专注于高性能图形处理器(GPU)及系统芯片的研发与升级。 在GPU架构的早期演进中,NVIDIA通过Tesla、Fermi、Kepler、Maxwell四大系列,实现了GPU从“图形加速专用硬件”到“通用并行计算引擎”的关键技术跃迁。2010年前,NVIDIA推出的Tesla架构,正式开启了GPU从图形加速向通用计算的跨越式转型;2010年,Fermi架构聚焦可靠性与通用性升级,不仅首次引入ECC错误校验码内存以保障数据计算准确性,还对CUDA核心进行优化,使其能支持更多编程语言;2012年,Kepler架构以“能效比革命”为核心,推出SMX流式多处理器以提升并行效率,同时首次支持GPUDirect技术,实现了GPU间及GPU与存储设备的直接数据传输;到了2014年,NVIDIA又推出Maxwell架构,该架构采用台积电28nm工艺制程。彼时移动设备兴起,市场对低功耗、高性能GPU的需求大增,NVIDIA也针对性优化了该架构在不同应用场景的适配能力。 资料来源:EXRReview,爱建证券研究所 随着人工智能与高性能计算需求的持续爆发,NVIDIA自2016年后进一步加快架构迭代节奏,先后推出Volta、Hopper、Blackwell等一系列突破性架构,并计划通过下一代架构持续拓展算力边界。2016年,Volta架构凭借首创的TensorCore技术,开启AI算力硬件加速的商业化时代,为深度学习大规模落地提供关键算力支撑;2022 年,Hopper架构聚焦大模型需求,以TransformerEngine夯实千亿参数模型研发基础;2024年发布的Blackwell架构,则通过“芯片-系统-软件”全栈协同设计,在AI推理效率与图形渲染性能上实现双重跃升。 资料来源:NVIDIA,IT之家,爱建证券研究所 而NVIDIA计划推出的下一代架构,将进一步突破算力密度与能效比的极限,为超大规模AI集群、量子计算协同模拟等复杂场景提供底层技术支撑。 2.NVIDIAVeraRubin超级芯片以异构协同与架构创新实现算力跃升 伴随“摩尔定律”逐步逼近物理极限,晶体管密度提升对算力的边际贡献持续走低。为突破这一瓶颈,NVIDIA于2025年10月29日推出VeraRubin超级芯片。该超级芯片并未单纯堆积晶体管,而是通过CPU与GPU的异构协同、HBM4高带宽显存的搭配,以及CUDA生态的兼容,以架构与系统级创新实现算力跃升。 资料来源:NVIDIA,IT之家,爱建证券研究所 资料来源:NVIDIA,IT之家,爱建证券研究所 每块RubinGPU被大量电源电路环绕,配备8个HBM4(HBM4高宽带显存)显存 位点,集成两颗Reticle尺寸(半导体光刻机掩模版的最大制造尺寸)GPU芯片;VeraCPU搭载88个定制ARM核心,总计提供176个线程。 从性能迭代维度看,在NVIDIA芯片从Hopper、Blackwell到Rubin的架构演进中,VeraRubin超级芯片作为旗舰产品,其VR200、VR300(Ultra)加速器的FP4算力分别达50、100PFLOPS,搭配288GBHBM4乃至1025GBHBM4E显存,带宽最高达32TB/s,较前代Blackwell架构实现数倍跃升;同时,NvidiaCPU从Grace系列升级为Vera系列,核心性能与线程数的提升进一步支撑了异构协同的算力释放。 3.NVIDIA2026-2027H2计划推出VeraRubin平台 针对新一代计算平台,黄仁勋宣布,公司预计于2026年H2推出VeraRubinNVL144平台,并计划在2027年H2进一步推出RubinUltraNVL576平台。 VeraRubinNVL144平台的核心硬件采用RubinGPU与VeraCPU的组合设计。其中,RubinGPU由两颗Reticle尺寸核心构成,不仅具备50PFLOPS(FP4精度)的算力,还配备288GBHBM4显存;VeraCPU则提供88个定制Arm核心与176线程,其NVLINK-C2C互联带宽可达到1.8TB/s。 性能层面,VeraRubinNVL144平台相较上一代GB300NVL72实现持续提升。其中,该平台的FP4推理算力达3.6Exaflops、FP8训练算力达1.2Exaflops,较GB300NVL72提升约3.3倍;系统总显存带宽为13TB/s,快速存储容量为75TB,两项指标较上一代分别提升60%。此外,该平台的NVLINK与CX9通信能力也实现双倍提升,最高速率分别可达260TB/s与28.8TB/s。 RubinUltraNVL576平台作为更高规格的迭代产品,在硬件与性能上均实现全面升级。1)其NVL规模从144扩展至576,CPU架构保持不变,GPU则升级为四颗Reticle尺寸核心;单颗GPU性能最高可达100PFLOPS(FP4精度),并搭载1TBHBM4e显存。2)性能层面,该平台可实现15Exaflops(FP4推理)与5Exaflops(FP8训练)算力,相较上一代GB300NVL72提升14倍,同时HBM4显存带宽达到4.6PB/s、快速存储容量达365TB;通信能力上,NVLINK与CX9分别提升至12倍与8倍,最高速率依次达到1.5PB/s与115.2TB/s,整体算力、存储与连接效率均大幅跃升。 资料来源:NVIDIA,IT之家,爱建证券研究所 4.风险提示 1)国际贸易摩擦加剧2)下游需求不及预期3)技术升级进度滞后 爱建证券有限责任公司 上海市浦东新区前滩大道199弄5号电话:021-32229888传真:021-68728700服务热线:956021邮政编码:200124邮箱:ajzq@ajzq.com网址:http://www.ajzq.com 评级说明 投资建议的评级标准 报告中投资建议所涉及的评级分为股票评级和行业评级(另有说明的除外)。评级标准为报告发布日后6个月内的相对市场表现,也即:以报告发布日后的6个月内的公司股价(或行业指数)相对同期相关证券市场代表性指数的涨跌幅作为基准。其中:A股市场:沪深300指数(000300.SH);新三板市场:三板成指(899001.CSI)(针对协议转让标的)或三板做市指数(899002.CSI)(针对做市转让标的);北交所市场:北证50指数(899050.BJ);香港市场:恒生指数(HIS.HI);美国市场:标普500指数(SPX.GI)或纳斯达克指数(IXIC.GI)。 股票评级 相对同期相关证券市场代表性指数涨幅大于15%相对同期相关证券市场代表性指数涨幅在5%~15%之间相对同期相关证券市场代表性指数涨幅在-5%~5%之间相对同期相关证券市场代表性