您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国新证券]:英伟达GTC:芯片提升算力,全栈推动产业 - 发现报告

英伟达GTC:芯片提升算力,全栈推动产业

电子设备2026-03-20钟哲元国新证券申***
英伟达GTC:芯片提升算力,全栈推动产业

2026年3月18日 英伟达GTC:芯片提升算力全栈推动产业 看好 事件 2026年3月16日,英伟达创始人兼CEO黄仁勋在GTC 2026大会上发表主题演讲,核心议题涵盖CUDA平台20周年、推理拐点与算力需求爆发、Vera Rubin系统架构、Groq集成、OpenClaw代理革命及物理AI与机器人。 核心观点 在GTC 2026大会上,英伟达将2025-2027年累计收入指引提升至至少1万亿美元,其中60%业务将来自超大规模云,数据中心转型为生产Token的“AI工厂”,Token成为核心数字商品,并给出其分层定价体系。 大会主要是推出Vera Rubin全栈AI算力平台。它包含七大芯片:Rubin GPU、Vera CPU、NVLink 6交换机、ConnectX-9超级网卡、BlueField-4 DPU、Spectrum-6以太网交换机和Groq 3 LPU,覆盖计算、推理、网络与存储全链路。五类标准化机架,采用统一MGX模块化架构与100%液冷设计,将整机安装时间从两天缩短至两小时,极大提升了部署效率。 Vera CPU采用88核Arm架构,单线程性能提升50%,成为智能体任务调度的核心。通过与Groq 3 LPU基于Dynamo框架的异构协同,系统实现了推理流程解耦:GPU处理高吞吐任务,LPU专攻低延迟解码。这使得每兆瓦推理吞吐量最高提升35倍,万亿参数模型收益潜力提升10倍,单Token成本降至Blackwell平台的十分之一。 软件层面,CUDA生态装机量达数亿,形成坚固壁垒。针对开源的OpenClaw智能体框架,英伟达推出企业级安全方案NemoClaw,支持混合调用本地与云端模型,推动智能体进入企业核心场景,并断言SaaS将全面转向AaaS。 物理AI进入爆发期,现场展示110台机器人,比亚迪、现代等主流车企加入其自动驾驶生态,计划2028年在全球28城部署L4车队。同时,英伟达发布用于太空的Vera Rubin Space-1轨道计算模块,将算力拓展至近地轨道。 分析师:钟哲元登记编码:S1490523030001邮箱:zhongzheyuan@crsec.com.cn 技术路线上,英伟达明确光铜协同,其量产CPO交换机将成为扩展核心。Vera Rubin平台的全系统设计也带动了高端PCB、光模块、导热材料等产业链的升级需求。 投资线索 聚焦智能体算力基础设施、推理加速与异构计算、AI基础软件与向量数据库、大模型与行业智能体、数据中心运营。优先布局能紧跟技术迭代、在推理加速、高速互联、液冷、智能体调度与安全等关键环节有核心壁垒的企业,把握国产替代红利。 证券研究报告 风险提示 1、 技术发 展不及 预期;2、 市场 竞争加 剧;3、 地缘政 治影响 。 目录 一、推理拐点确立,1万亿美元市场开启.................................................................................................................................3二、VERA RUBIN全栈落地,七大芯片+五类机架定型新架构............................................................................................3三、CPU+GPU+LPU异构协同,推理性能量级突破..............................................................................................................3四、CUDA壁垒加固,NEMOCLAW推动企业智能体规模化..............................................................................................4五、物理AI升级,太空计算拓展算力版图..............................................................................................................................4六、光铜协同演进,高端元器件需求提升................................................................................................................................4七、投资线索................................................................................................................................................................................5八、风险提示................................................................................................................................................................................5 一、推理拐点确立,1万亿美元市场开启 英伟达在GTC 2026大会上,将2025-2027年累计收入指引提升至至少1万亿美元,AI发展从实验室主导的训练阶段,全面迈入规模化推理、生成与智能体执行的新阶段。黄仁勋在演讲中明确,这一万亿市场中60%业务将来自超大规模云计算,背后是过去两年AI计算需求约10000倍的指数级增长,传统以存储文件为核心的数据中心,彻底转型为生产Token的“AI工厂”,Token成为AI时代核心数字商品。在Token工厂的商业模式中,以每瓦生成Token数为纵轴、交互速度为横轴的效率模型成为重要评判标准,纵轴代表固定电力下的运营效率,决定AI工厂的成本控制能力与盈利基底,横轴则直接对应终端用户体验与服务分层定价,二者共同构成Token分层定价体系的底层逻辑,从免费层到Premium层的价值分化,对应这一效率模型实现,也成为企业AI基础设施投入的决策依据之一。 二、Vera Rubin全栈落地,七大芯片+五类机架定型新架构 本次大会的核心成果是Vera Rubin全栈AI算力平台,英伟达摒弃单一芯片迭代思路,以全链路系统级协同设计重构AI算力底座,使其成为智能体AI时代的标准。该平台包含七大全新量产芯片,分别为Rubin GPU、Vera CPU、NVLink 6交换机、ConnectX-9超级网卡、BlueField-4 DPU、Spectrum-6以太网交换机、Groq 3 LPU,全面覆盖计算、专用推理、高速网络、AI原生存储等环节,实现从AI预训练、后训练、推理全流程优化。同步推出五类标准化机架,包括VeraRubin NVL72 GPU机架、Vera CPU机架、Groq 3 LPX推理机架、BlueField-4STX存储机架、Spectrum-6 SPX以太网机架,采用统一MGX模块化架构可自由组合部署,搭配100%液冷设计与45℃温水冷却方案,彻底简化内部布线,将整机安装时间从传统两天大幅缩短至两小时,显著降低AI集群的部署难度、冷却压力与总体运营成本,推动超大规模AI工厂的规模化落地效率实现飞跃。 三、CPU+GPU+LPU异构协同,推理性能量级突破 Vera CPU的正式发布,标志着英伟达强势进军数据中心CPU市场,该芯片采用88核Arm v9.2-A Olympus核心架构,单线程性能提升50%,通过NVLink-C2C互连技术与GPU实现1.8TB/s相干带宽高速互联,成为AI智能体任务调度、工具调用、代码编译等场景的核心中枢。英伟达整合2025年12月收购的Groq核心技术,推出Groq 3 LPU专用推理芯片,构建起GPU+LPU深度协同的异构计算架构,二者基于Dynamo推理调度框架实现推理流程解聚分工:Rubin GPU凭借HBM4海量带宽与强大算力,专注处理高吞吐的预填充环节与注意力机制解码任务,承载大模型上下文输入与KV Cache管理;Groq 3 LPU依托500MB片上SRAM带来的150TB/s超高带宽,专攻低延迟敏感的前馈网络解码环节,解决纯GPU在 推理解码阶段利用率低、延迟高的行业痛点。这种专业化分工协同,使系统每兆瓦推理吞吐量最高提升35倍,万亿参数模型的商业收益潜力提升10倍,完美破解大模型推理长期存在的低延迟与高吞吐量不可兼得的矛盾,同时将单Token生成成本降至Blackwell平台的十分之一,大幅改变了AI推理的成本与效率。 四、CUDA壁垒加固,NemoClaw推动企业智能体规模化 今年恰逢CUDA诞生20周年,全球数亿级的CUDA装机量形成难以复制的生态飞轮,持续吸引开发者、催生算法创新与新市场,成为英伟达算力生态的核心壁垒。针对当下爆火的OpenClaw智能体框架,英伟达推出NemoClaw企业级安全方案,在开源OpenClaw基础上叠加隔离沙箱、隐私路由、企业级安全防护多层机制,通过NVIDIA Agent Toolkit实现一键部署优化,支持本地开源模型与云端前沿模型混合调用,解决智能体在企业场景中访问敏感数据、执行外部通信的安全隐患,推动AI智能体从消费级场景快速渗透至企业核心业务场景。黄仁勋在演讲中断言,未来传统SaaS将全面转向AaaS(智能体即服务),企业需制定专属OpenClaw战略;同时英伟达发布Nemotron系列开源模型并组建Nemotron联盟,联合全球顶尖AI技术公司完善语言、物理、自动驾驶等多场景开放模型生态,进一步夯实全栈软件与模型布局。 五、物理AI升级,太空计算拓展算力版图 物理AI进入规模化落地爆发期,本次大会现场展示110台机器人,比亚迪、现代、日产、吉利等主流车企正式加入DRIVE Hyperion生态,计划2028年在全球四大洲28座城市部署L4级自动驾驶车队,与Uber的合作也将在2027年率先落地洛杉矶与旧金山湾区。英伟达同步推出全新Isaac仿真框架、Cosmos世界基础模型与Isaac GR00T开放模型,打造物理AI数据工厂Blueprint,实现机器人、自动驾驶车辆物理AI模型的大规模数据处理、合成数据生成与强化学习,全面赋能工业机器人与人形机器人的研发、训练与部署。与此同时,英伟达发布VeraRubin Space-1轨道计算模块,针对太空无对流、无传导仅辐射散热的工程难题,将数据中心级AI算力部署至近地轨道,支撑轨道数据中心、高级地理空间智能处理与自主太空操作任务,实现从地面数据中心到太空的全域算力覆盖,拓展AI算力的全新应用疆域。 六、光铜协同演进,高端元器件需求提升 英伟达明确光铜协同的长期技术路线,打破单一技术路线争论:Spectrum-6成为全球首款量产CPO(共封装光学)交换机,由英伟达与台积电合作开发, 2027年起CPO正式成为Scale-Up核心方案,2028年Feynman架构将采用CPO与铜缆混合互联模式,铜缆在短距高速互联中仍具备不可替代的价值,光学扩展则负责长距大规模集群连接。Vera Rubin平台的全液冷设计、Kyber机架垂直插入与中板连接架构、正交背板技术,叠加LPU专用机架的高密度集成需求,直接带动高阶PCB、高速互连芯片、800G/1.6T光模块、先进接口组件、高端导热材料等算力硬件产业链需求快速提升,算力硬件从单一芯片竞争转向系统级配套升级,相关