您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国泰海通证券]:2026 英伟达 GTC 大会点评:LPU 融入推理体系,全栈设计能力塑造领先优势 - 发现报告

2026 英伟达 GTC 大会点评:LPU 融入推理体系,全栈设计能力塑造领先优势

2026-03-20秦和平、刁云鹏国泰海通证券叶***
2026 英伟达 GTC 大会点评:LPU 融入推理体系,全栈设计能力塑造领先优势

英伟达(NVDA.O)[Table_Industry]海外信息科技 ——2026英伟达GTC大会点评 本报告导读: 英伟达2026GTC大会聚焦Token需求爆发与新一代架构演进,通过Rubin和LPU体系持续提升算力效率,推动AI进入以推理与Agent为核心的新阶段。 投资要点: 极致协同设计显著提升推理效率,Blackwell+Rubin收入指引上调。2025年随着Agent模型(如Claude Code)落地,模型规模与上下文长度进一步提升至100倍,Token消耗量亦同步放大至100倍。效率方面,英伟达通过极致协同设计显著提升推 理效率,G B300NVL72单位能耗Token输出较竞品提升约50倍,单位Token成本降低约35倍。Blackwell与Rubin平台收入指引由2025–2026年的5000亿美元上调至2025–2027年的1万亿美元。LPU以机柜形式融入进英伟达推理体系,在高价值量的任务场景兑现为高收入。通过“GPU负责Prefill、LPU负责Decode”的PD分离架构,高推理密度场景下Token吞吐效率可提升35倍,并在极高推理速度要求下保持稳定吞吐。Rubin+LPX的搭配有望驱动1GW数据中心年收入由Blackwell NVL72的约300亿美元提升至3000亿美元。硬件方面,LPU单芯片带宽提升至150TB/s,SRAM容量达500MB,机柜级集成可实现最高40PB/s带宽与128GB SRAM容量。Rubin算力集群中的LPU机柜占比较高,CPU首次独立成柜。系统层面,Rubin大规模计算集群包括16个Rubin NVL72计算单元、10个LPU机柜(通过推理调度软件Dynamo实现Prefill与Decode分离)、10个CPO机柜、2个Vera CPU机柜及2个BlueField存储机架。其中,LPU机柜占比较高,体现推理吞吐速率的重要性提升;CPU首次实现独立成柜并单独销售,形成新的业务增长点。延续一年一迭代的演进节奏,机架级全栈设计能力塑造持续领先优势。2026年英伟达将推出Rubin机架,2027年推出Rubin Ultra机架,通过铜互联实现NVL144级别规模扩展,并进一步通过光互联扩展至NVL576级别;2028年推出Feynman机架,引入新CPU(Rosa)、CPO及定制化HBM,持续提升系统带宽与算力密度。风险提示:贸易摩擦与政策监管风险;AI需求不及预期风险;竞争 指引超预期,Token经济学的最佳增长引擎2026.02.27业绩及指引双超预期,印证AI需求真实韧性2025.11.21稳定交付超预期业绩,AI大基建能见度至2030年2025.08.28 加剧风险。 目录 1.Token需求爆发叠加效率优势,驱动收入指引上调................................32.LPU驱动推理效率与收入能力提升,硬件架构提供底层支撑................43.系统架构持续演进,推动算力规模扩展与技术升级...............................44.软件生态布局加速,构建AI操作系统平台...........................................55.盈利预测与投资建议............................................................................66.风险提示..............................................................................................7 1.Token需求爆发叠加效率优势,驱动收入指引上调 Token需求进入爆发阶段,驱动Blackwell+Rubin收入指引上调。Token增长经历三个阶段:2023年GPT推出带动初始需求,2024年推理模型(o1/o3)推动模型规模与上下文长度提升约10倍,对应Token消耗提升10倍,而2025年随着Agent模型(如Claude Code)落地,模型规模与上下文进一步提升至100倍,Token消耗亦同步放大至100倍。在此背景下,英伟达将Blackwell与Rubin平台收入指引由2025–2026年的5000亿美元上调至2025–2027年的1万亿美元,高于市场一致预期。结构上,公司约60%收入来自CSP,其余40%来自主权AI、企业及新兴云需求,显示AI算力需求正向更广泛场景扩散。 资料来源:英伟达GTC大会,国泰海通证券研究 极致协同设计构建Token效率优势,强化公司在算力竞争中的领先地位。在数据中心电力约束趋紧的背景下,英伟达强调其核心竞争力在于单位能耗下的Token输出能力。具体来看,GB300 NVL72单位能耗Token输出较竞品提升约50倍,单位Token成本降低约35倍,显著优于摩尔定律约1.5倍的自然提升。上述效率优势主要来源于机架级系统设计与软硬件垂直整合能力,而非单一芯片性能突破,使英伟达在“Token经济”框架下具备更强的成本与收益优势。 资料来源:英伟达GTC大会,国泰海通证券研究 2.LPU驱动推理效率与收入能力提升,硬件架构提供底层支撑 LPU显著提升推理效率并驱动高价值场景收入释放。在未引入LPU的情况下,Rubin NVL72相较Blackwell NVL72在不同推理密度场景下Token吞吐效率提升约2–10倍;而通过“GPU负责Prefill、LPU负责Decode”的PD分离架构,在高推理密度场景下Token吞吐效率可进一步提升至35倍,并在更高推理速度要求下仍能保持较高吞吐能力。从商业化角度看,推理效率提升直接转化为收入能力的跃迁:1GW数据中心对应收入由Blackw ellNVL72的约300亿美元提升至Rubin NVL72的1500亿美元,Rubin+LPX的搭配将驱动收入进一步提升至3000亿美元。 资料来源:英伟达GTC大会,国泰海通证券研究 资料来源:英伟达GTC大会,国泰海通证券研究 底层硬件架构升级为推理性能提升提供关键支撑。在硬件层面,LPU实现带宽与缓存能力的显著提升,单芯片带宽达150TB/s,SRAM容量提升至500MB,并通过机柜级集成实现最高约40PB/s带宽与128GB SRAM规模。同时,LPU机柜规模化部署(单柜256颗芯片)进一步强化系统级推理能力,为高吞吐、低时延的推理场景提供底层支撑。 资料来源:英伟达GTC大会,国泰海通证券研究 资料来源:英伟达GTC大会,国泰海通证券研究 3.系统架构持续演进,推动算力规模扩展与技术升级 Rubin大规模计算集群采用模块化架构,LPU占比提升、CPU独立成柜强化系统能力。在系统层面,Rubin大规模计算集群呈现出高度模块化与分工明确的架构设计,包括16个Rubin NVL72计算单元、10个LPU机柜(通过推理调度软件Dynamo实现Prefill与Decode分离)、10个CPO机 柜、2个Vera CPU机柜及2个BlueField存储机架。其中,LPU机柜占比较高,进一步体现推理侧算力的重要性提升;同时CPU首次实现独立成柜并单独销售,形成新的业务增长点。 英伟达后续迭代路线持续推进规模扩展与关键技术升级。未来三年,英伟达将围绕机架级系统持续迭代:2026年推出Rubin机架,2027年将推出Rubin Ultra,其中NVL144(Oberon机架)主要采用铜互联进行规模扩展,随后通过光互联进一步扩展至NVL576(Kyber机架);2028年将推出Feynman机架,引入新一代CPU(Rosa)、正式导入CPO技术并采用定制化HBM,持续提升系统带宽与算力密度。 资料来源:英伟达GTC大会,国泰海通证券研究 4.软件生态布局加速,构建AI操作系统平台 英伟达推出NemoClaw平台,拓展企业级AI Agent开发与部署能力。公司发布面向企业级的开源Agent平台NemoClaw,该平台为可一键部署的完整软件栈,集成NVIDIA Nemotron模型与OpenShell运行时环境,使开发者能够在本地或云端快速构建与运行AI智能体。 NemoClaw通过安全与工具链整合,推动AI Agent向企业级生产力工具落地。在能力层面,平台集成Agent Toolkit与OpenShell运行时,提 供策略引擎、安全护栏及隐私路由等功能,实现对数据访问、任务执行与网络交互的统一管控。同时,通过沙箱机制及本地与云端模型协同运行,提升AI Agent的安全性与可扩展性,解决企业应用中的隐私与合规问题,推动AI Agent从实验性工具向规模化部署演进。 资料来源:英伟达GTC大会,国泰海通证券研究 资料来源:英伟达GTC大会,国泰海通证券研究 5.盈利预测与投资建议 站在英伟达的视角,当前时点AI投入仍在加速,预训练需求、推理需求、Agentic AI和Physical AI的需求仍在爆发进程中。从下游应用角度看,CSP仍在加大CapEx投入以保证算力,算力意味着Token,Token即意味着收入,而英伟达凭借最低的Token成本和最快的迭代速度,有望成为Token经 济 学 下 的 最 佳 增长 引擎 。 我们 维持FY2027E-FY2029E营 收 预 测为3801/5238/6374亿美元,维持NONGAAP净利润预测为2236/3064/3710亿美元。维持目标价275美元,维持“增持”评级 6.风险提示 贸易摩擦与政策监管风险;AI需求不及预期风险;竞争加剧风险。 本公司具有中国证监会核准的证券投资咨询业务资格 分析师声明 作者具有中国证券业协会授予的证券投资咨询执业资格或相当的专业胜任能力,保证报告所采用的数据均来自合规渠道,分析逻辑基于作者的职业理解,本报告清晰准确地反映了作者的研究观点,力求独立、客观和公正,结论不受任何第三方的授意或影响,特此声明。 免责声明 本报告仅供国泰海通证券股份有限公司(以下简称“本公司”)的客户使用。本公司不会因接收人收到本报告而视其为本公司的当然客户。本报告仅在相关法律许可的情况下发放,并仅为提供信息而发放,概不构成任何广告。 本报告的信息来源于已公开的资料,本公司对该等信息的准确性、完整性或可靠性不作任何保证。本报告所载的资料、意见及推测仅反映本公司于发布本报告当日的判断,本报告所指的证券或投资标的的价格、价值及投资收入可升可跌。过往表现不应作为日后的表现依据。在不同时期,本公司可发出与本报告所载资料、意见及推测不一致的报告。本公司不保证本报告所含信息保持在最新状态。同时,本公司对本报告所含信息可在不发出通知的情形下做出修改,投资者应当自行关注相应的更新或修改。 本报告中所指的投资及服务可能不适合个别客户,不构成客户私人咨询建议。在任何情况下,本报告中的信息或所表述的意见均不构成对任何人的投资建议。在任何情况下,本公司、本公司员工或者关联机构不承诺投资者一定获利,不与投资者分享投资收益,也不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任。投资者务必注意,其据此做出的任何投资决策与本公司、本公司员工或者关联机构无关。 本公司利用信息隔离墙控制内部一个或多个领域、部门或关联机构之间的信息流动。因此,投资者应注意,在法律许可的情况下,本公司及其所属关联机构可能会持有报告中提到的公司所发行的证券或期权并进行证券或期权交易,也可能为这些公司提供或者争取提供投资银行、财务顾问或者金融产品等相关服务。在法律许可的情况下,本公司的员工可能担任本报告所提到的公司的董事。 市场有风险,投资需谨慎。投资者不应将本报告作为作出投资决策的唯一参考因素,亦不应认为本报告可以取代自己的判断。在决定投资前,如有需要,投资者务必向专业人士咨询并谨慎决策。 本报告版权仅为本公司所有,未经书面许可,任何机构和个人不得以任何形式翻版