行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

英伟达2026 GTC大会黄仁勋演讲全文

2026-03-17 英伟达墨

核心观点与关键数据

CUDA技术积淀与装机量飞轮效应
英伟达CUDA平台诞生二十年来，通过SIMT技术和持续迭代（如Tiles功能），积累了数亿块GPU装机量，覆盖所有云平台和行业。其核心优势在于庞大的装机量形成的“飞轮效应”：装机量吸引开发者，开发者创造算法突破，突破催生新市场并扩大装机量，持续推动计算成本下降。英伟达库下载量高速增长，软件长期维护确保GPU高使用寿命和兼容性。

二十五年的演进之路
从GeForce到CUDA，再到RTX和神经渲染（DLSS5），英伟达通过可编程着色器、CUDA和AI技术（如光线追踪、生成式AI）推动计算机图形和AI发展。自动驾驶、金融量化、医疗AI等垂直领域均深度布局，以CUDA-X库为核心实现各行业加速计算。

AI原生企业与新计算时代
2022年三件大事（ChatGPT、推理AI、ClaudeCode）开启生成式AI时代，推理需求计算量增长10,000倍。AI算力需求激增，2027年预计达1万亿美元，英伟达平台覆盖所有AI领域，成为成本最低、置信度最高的选择。

技术革新与AI工厂
GraceBlackwell架构（NVLink72、NVFP4）实现推理性能35倍提升，每token成本全球最低。数据中心从文件存储转变为“token工厂”，token分层定价（免费层至超高速层），GraceBlackwell最高价值层吞吐量提升35倍。VeraRubin系统专为智能体工作负载设计，包含NVLink72GPU集群、LPDDR5CPU、BlueField4+存储等。

极致协同设计
Groq与VeraRubin结合，通过Dynamo调度实现性能提升35倍，开辟全新推理层级。2年内1吉瓦AI工厂token生成速率提升350倍。技术路线图并行推进铜缆、光学（Scale-Up/Scale-Out）扩展，NVIDIAADSX平台实现数据中心协同设计与节能。

企业IT重塑与OpenClaw
OpenClaw作为智能体操作系统，推动企业IT从工具转向AI智能体服务（AaaS）。NeMoClaw参考设计和OpenShield确保企业数据安全。未来工程师将拥有token预算，企业既是token使用者也是生产者。

NVIDIA开放模型倡议
提供Nemotron、Cosmos、GROOT等前沿模型，成立Nemotron联盟推动基础模型研发。Nemotron3Ultra支持主权AI构建。

物理AI与机器人
英伟达提供训练、仿真、机载计算机及软件栈，推动自动驾驶（RoboTaxiReady平台引入比亚迪等）、工业机器人（ABB等）、电信基站（Aerial平台）规模化落地。Olaf机器人演示展示物理AI与仿真结合的成果。

研究结论

推理拐点到来：推理成为AI核心工作负载，token成为新大宗商品，推理性能直接影响收入。
AI工厂时代：数据中心演变为token工厂，AI工厂效率成为企业竞争力指标。
智能体革命：OpenClaw开启智能体计算，企业IT从工具转向AI智能体服务，需制定OpenClaw战略。
物理AI机遇：自动驾驶、工业机器人、人形机器人规模化落地，推动具身智能发展。
英伟达平台优势：全球唯一支持所有AI领域模型的平台，极致协同设计实现性能与成本领先。

在GTC，我们将聚焦三大主题：技术、平台和生态系统。英伟达目前拥有三大平台：CUDA-X平台、系统平台，以及我们最新推出的AI工厂平台。在正式开始之前，我要感谢我们的预热环节主持人——Conviction的SarahGuo、红杉资本的AlfredLin（英伟达的第一位风险投资人），以及英伟达的第一位主要机构投资人GavinBaker。这三位对技术有深刻的洞见，在整个技术生态系统中拥有极广的影响力。当然，我还要感谢今天所有我亲自邀请出席的贵宾们。感谢这支全明星团队。我同样要感谢今天到场的所有企业。英伟达是一家平台公司，我们拥有技术、平台和丰富的生态系统。今天到场的企业代表了价值100万亿美元行业中几乎全部的参与者，共有450家公司赞助了本次活动，在此深表感谢。本次大会共设有1,000场技术论坛、2,000位演讲嘉宾，将覆盖人工智能"五层蛋糕"架构的每一个层级——从土地、电力与机房等基础设施，到芯片、平台、模型，以及最终推动整个行业腾飞的各类应用。 CUDA：二十年的技术积淀一切的起点，就在这里。今年是CUDA诞生二十周年。二十年来，我们始终致力于这一架构的研发。CUDA是一项革命性的发明——SIMT（单指令多线程）技术允许开发者以标量代码编写程序，并将其扩展为多线程应用，其编程难度远低于此前的SIMD架构。我们最近还新增了Tiles功能，帮助开发者更便捷地编程张量核心（TensorCore），以及当今人工智能所依赖的各类数学运算结构。目前， CUDA已拥有数千种工具、编译器、框架和库，在开源社区中存在数十万个公开项目，并已深度集成到每一个技术生态系统之中。这张图表揭示了英伟达100%的战略逻辑，我从最初就一直在讲这张幻灯片。其中最难实现、也是最核心的要素，是图表底部的"装机量"。历经二十年，我们已在全球范围内积累了数亿块运行CUDA的GPU和计算系统。我们的GPU覆盖所有云平台，服务于几乎所有计算机厂商和行业。CUDA庞大的装机量，正是这个飞轮不断加速的根本原因。装机量吸引开发者，开发者创造新算法并取得突破，突破催生全新市场，新市场形成新生态并吸引更多企业加入，进而扩大装机量——这个飞轮正在持续加速。英伟达库的下载量正以惊人的速度增长，规模庞大且增速不断提升。这个飞轮使我们的计算平台能够支撑海量应用和层出不穷的新突破。更重要的是，它还赋予了这些基础设施极长的使用寿命。原因显而易见：NVIDIACUDA上可运行的应用极为丰富，涵盖AI生命周期的每个阶段、各类数据处理平台，以及各种科学原理求解器。因此，一旦安装了英伟达GPU，其实际使用价值极高。这也是为何我们六年前发布的Ampere架构GPU，其云端价格反而在上涨。这一切的根本原因在于：装机量庞大，飞轮强劲，开发者生态广泛。当这些因素共同发挥作用，加之我们持续更新软件，计算成本便会不断下降。加速计算在大幅提升应用性能的同时，随着我们长期维护和迭代软件，用户不仅能在初期获得性能跃升，还能持续享受计算成本的下降。我们愿意为全球每一块GPU提供长期支持，因为它们在架构上完全兼容。我们之所以愿意这样做，是因为装机量如此庞大——每发布一次新的优化，便能惠及数百万用户。这种动态组合，使得英伟达架构在持续扩大覆盖范围、加速自身成长的同时，不断压低计算成本，最终刺激新的增长。CUDA是这一切的核心。从GeForce到CUDA：二十五年的演进之路而我们与CUDA的旅程，实际上早在二十五年前就已开始。 GeForce——相信在座有很多人是伴随着GeForce长大的。GeForce是英伟达最成功的市场推广项目。我们从你们还买不起产品的时候就开始培养未来的客户——是你们的父母代替你们成为了英伟达最早的用户，年复一年地购买我们的产品，直到有一天，你们成长为优秀的计算机科学家，成为真正意义上的客户和开发者。这是二十五年前GeForce奠定的基业。二十五年前，我们发明了可编程着色器——这是让加速器实现可编程化的一项显而易见却意义深远的发明，也是世界上第一款可编程加速器，即像素着色器。这五年后，我们创造了CUDA——这是我们有史以来最重要的投资之一。当时公司财力有限，但我们将绝大部分利润押注于此，致力于将CUDA从GeForce延伸到每一台计算机。我们之所以如此坚定，是因为我们深信其潜力。尽管初期历经艰辛，公司坚守这一信念长达13代、整整二十年，如今CUDA已无处不在。正是像素着色器推动了GeForce的革命。而大约八年前，我们推出了RTX——为现代计算机图形时代对架构进行了全面革新。GeForce将CUDA带给了全世界，也正因如此，让AlexKrizhevsky、IlyaSutskever、GeoffreyHinton、AndrewNg等众多学者发现，GPU可以成为加速深度学习的利器，由此点燃了十年前人工智能的大爆炸。十年前，我们决定将可编程着色与两个全新理念相融合：一是硬件光线追踪（RayTracing），这在技术上极具挑战；二是一个当时颇具前瞻性的想法——大约十年前，我们就预见到AI将彻底变革计算机图形。正如GeForce将AI带给了全世界，AI如今也将反过来重塑整个计算机图形的实现方式。今天，我要向大家展示未来。这是我们的下一代图形技术，我们称之为神经渲染（NeuralRendering）——3D图形与人工智能的深度融合。这就是DLSS5，请看。神经渲染：结构化数据与生成式AI的融合这是不是令人叹为观止？计算机图形就此焕发生机。我们做了什么？我们将可控的3D图形（虚拟世界的真实基础）与其结构化数据相结合，再融入生成式AI和概率计算。一个完全确定性，另一个概率性却高度逼真——我们将这两种理念融为一体，通过结构化数据实现精准可控，同时进行实时生成。最终，内容既美观惊艳，又完全可控。结构化信息与生成式AI融合这一理念，将在一个又一个行业中不断复现。结构化数据是可信AI的基石。结构化数据与非结构化数据的加速平台现在我要带大家看一张技术架构图。结构化数据——大家熟悉的SQL、Spark、Pandas、Velox，以及Snowflake、Databricks、AmazonEMR、AzureFabric、GoogleBigQuery等重要平台，都在处理数据框（DataFrame）。这些数据框就像巨型电子表格，承载着商业世界的全部信息，是企业计算的基本事实（GroundTruth）。在AI时代，我们需要让AI来使用结构化数据，并对其实现极致加速。过去，加速结构化数据处理是为了让企业更高效地运转。而未来，AI将以远超人类的速度使用这些数据结构，AI智能体也将大量调用结构化数据库。非结构化数据方面，向量数据库、PDF、视频、音频等构成了世界上绝大多数的数据形态——每年生成的数据中，约90%是非结构化数据。过去，这些数据几乎完全无法被利用：我们读取它们，存入文件系统，仅此而已。我们无法查询，也难以检索，原因在于非结构化数据缺乏简单的索引方式，必须理解其含义与语境。而现在，AI可以做到这一点——借助多模态感知与理解技术，AI能够读取PDF文档、理解其含义，并将其嵌入可供查询的更大结构之中。英伟达为此创建了两个基础库： cuDF：用于数据框、结构化数据的加速处理 cuVS：用于向量存储、语义数据和非结构化AI数据的处理这两个平台将成为未来最重要的基础平台之一。今天，我们宣布与多家企业达成合作。IBM——SQL语言的发明者，将使用cuDF加速其WatsonXData平台。Dell与我们联合打造了DellAI数据平台，整合cuDF与cuVS，并在NTTData的实际项目中实现了大幅性能提升。GoogleCloud方面，我们现在不仅加速VertexAI，还加速BigQuery，并与Snapchat合作将其计算成本降低了近80%。加速计算带来的好处是三位一体的：速度、规模、成本。这与摩尔定律的逻辑一脉相承——通过加速计算实现性能飞跃，同时持续优化算法，让所有人都能享受到持续下降的计算成本。英伟达构建了加速计算平台，其上汇聚了众多库：RTX、cuDF、cuVS等等。这些库整合进全球云服务和OEM体系，共同触达全球用户。与云服务商的深度合作与主要云服务商的合作 GoogleCloud：我们加速VertexAI和BigQuery，与JAX/XLA深度集成，同时在PyTorch上表现卓越——英伟达是全球唯一一家在PyTorch和JAX/XLA上均表现出色的加速器。我们将Base10、CrowdStrike、Puma、Salesforce等客户引入GoogleCloud生态。 AWS：我们加速EMR、SageMaker和Bedrock，与AWS有着深度集成。今年令我格外兴奋的是，我们将把OpenAI引入AWS，这将大幅推动AWS云计算的消耗增长，帮助OpenAI扩展区域部署和计算规模。 MicrosoftAzure：英伟达100PFLOPS超算是我们构建的第一台超级计算机，也是第一台部署在Azure上的超算，这奠定了与OpenAI合作的重要基础。我们加速Azure云服务和AIFoundry，合作推进Azure区域扩展，并在Bing搜索上深度协作。值得一提的是，我们的**保密计算（ConfidentialComputing）**能力——确保即便是运营商也无法查看用户数据和模型——英伟达GPU是全球首批支持保密计算的GPU，可支持OpenAI和Anthropic模型在全球各地区云环境中的保密部署。以Synopsys为例，我们加速其全部EDA和CAD工作流，并部署于MicrosoftAzure。 Oracle：我们是Oracle的第一个AI客户，我为能够第一次向Oracle解释AI云的概念感到自豪。此后他们发展迅猛，我们也为其引入了Cohere、Fireworks、OpenAI等众多合作伙伴。 CoreWeave：全球第一家AI原生云，专为GPU托管和AI云服务而生，拥有出色的客户群，增长势头强劲。 Palantir+Dell：三方联合打造了全新的AI平台，基于Palantir的本体论平台（OntologyPlatform）和AI平台，可在任何国家、任何气隙隔离环境下、完全本地化地部署AI——从数据处理（向量化或结构化）到AI的完整加速计算栈，无所不包。英伟达与全球云服务商建立了这种特殊的合作关系——我们将客户引入云端，这是一种互利共赢的生态。垂直整合，横向开放：英伟达的核心战略英伟达是全球第一家垂直整合、横向开放的公司。这一模式的必要性非常简单：加速计算不是芯片问题，也不是系统问题，其完整表述应为应用加速。CPU可以让计算机整体运行得更快，但这条路已走到瓶颈。未来，唯有通过应用或领域特定的加速，才能持续带来性能飞跃和成本下降。这正是英伟达必须深耕一个又一个库、一个又一个领域、一个又一个垂直行业的原因。我们是一家垂直整合的计算公司，没有其他路可走。我们必须理解应用，理解领域，深刻理解算法，并能够将其部署在任何场景下——数据中心、云端、本地、边缘乃至机器人系统。同时，英伟达保持横向开放，愿意将技术整合进任何合作伙伴的平台，让全世界都能享受到加速计算的红利。本届GTC的参会者结构充分体现了这一点。本次参会者中，金融服务行业的比例最高——希望来的是开发者，不是交易员。我们的生态系统覆盖了上游和下游供应链。无论是成立50年、70年还是150年的企业，去年都迎来了历史最佳年份。我们正处于某件非常、非常重大的事情的起点。 CUDA-X：各行业的加速计算引擎在各个垂直领域，英伟达均已深度布局：自动驾驶：覆盖范围广泛，影响深远金融服务：量化投资正从人工特征工程转向超级计算机驱动的深度学习，迎来其"Transformer时刻" 医疗健康：正在迎来属于自己的"ChatGPT时刻"，涵盖AI辅助药物发现、AI智能体支持诊断、医疗客服等方向工业：全球规模最大

点击免费查看完整报告

英伟达2026 GTC大会黄仁勋演讲全文

核心观点与关键数据

研究结论

你可能感兴趣