行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

小熊团队英伟达GTC大会更新芯片相关1V

2026-03-18 未知机构 Daisy.Aldrich

芯片相关：

Vera Rubin 芯片：
- 每瓦性能比 Blackwell 提高 10 倍。
- 与 Groq 3 LPU 芯片联合计算：
  - Groq 3 单芯片参数：500 MB SRAM，150 TB 带宽，1.2 PFlop 算力。
  - 8 芯片方案参数：4GB SRAM，1200 TB 带宽，9.6 PFlop（FP8 下），是 Rubin 的 5 倍。
  - Groq LPX 机架：单机架 256 个 LPU，置于 Rubin 机架旁，提升 Rubin GPU 每瓦 Token 处理性能 35 倍。
  - LPX 机架参数：128GB SRAM，40PB/s 带宽，315 PFlop 算力（FP8 下），256 颗芯片，scale-up 带宽 640TB/s。
  - 联合计算：
    - Vera Rubin NVL72 负责 Perfec 和 Decode ATTN 阶段。
    - Groq 3 LPX 负责Decode FFN 阶段。
    - 高 TPS/单用户环节，Rubin NVL72 的 TPS/MW 是 Blackwell NVL72 的 35 倍。
Kyber 原型机：
- 预计 2027 年发货，为 Rubin Ultra 的下一代机架级系统。
- 单托盘 144 颗 GPU，计算托盘垂直放置，提高密度并降低延迟。

其他：

DLSS 5：
- 由 AI 驱动的游戏超分辨率技术，计划今年秋季推出。
Token King：
- 英伟达拥有全球最低的单 Token 成本。
- GB300 NVL72 相比 H200 NVL8，Token 成本降低 30 倍。
AI 推理拐点：
- 云厂商算力部署占整体算力 60%。
- 强调 Token/watt 和 Token 价格。
- GB300 Performance/Watt 比竞争对手好 50 倍。
Vera CPU：
- 用于处理 Agentic AI 任务，比传统 CPU 快 50%。
太空算力：
- 研发用于太空的服务器 Vera Rubin Space-1，主要挑战是散热。
Olaf 机器人：
- 英伟达与迪士尼合作制造。
NemoClaw 参考栈：
- 针对 OpenClaw Agent 平台，使用 Nvidia AI Agent Toolkit 优化 OpenClaw，安装 OpenShell 和沙盒。
收入预期：
- Blackwell 和 Rubin 产品到 2027 年底累计创造 1 万亿美金收入。
- 2025 年 10 月预估 5000 亿美金，2026 年 2 月电话会，CFO 上调预期，将超过先前估算。

芯片相关： 1、Vera Rubin：每瓦性能比Blackwell提高10倍； 2、Groq 3（LPU芯片）：计划26Q3出货，三星代工；1）单芯片参数– 500 MB SRAM；– 150 TB带宽；– 1.2 PFlop算力；2）8芯片方案– 4GB SRAM；– 1200 TB带宽，是Rubin的5 【小熊团队】英伟达GTC大会更新芯片相关： 1、Vera Rubin：每瓦性能比Blackwell提高10倍； 2、Groq 3（LPU芯片）：计划26Q3出货，三星代工；1）单芯片参数 – 500 MB SRAM；– 150 TB 带宽；– 1.2 PFlop 算力；2）8 – 9.6PFlop（FP8下），Rubin是50 PFlop（FP4下）；3）LPX机架：单机架256个LPU，置于Vera Rubin机架旁，Groq LPX可以将其Rubin GPU的每瓦Token 处理性能提升35x；其中GPU用于高吞吐，LPU用于低延迟。 – 128GB SRAM；– 40PB/s带宽；– 315 PFlop算力（FP8下）；– 256颗芯片；– scale-up带宽：640TB/s；联合计算：通过英伟达Dynamo计算架构，Vera Rubin NVL72和Groq 3 LPX机柜联合计算，Vera Rubin负责Perfill和Decode ATTN阶段，Groq 3 LPX负责Decode FFN阶段。根据英伟达披露数据，随着TPS/单用户的提升，TPS/MW（单MW每秒Token吞吐量快速下降），再加入LPU联合计算后，在高TPS/单用户环节，Rubin NVL72的TPS/MW是Blackwell NVL72的35倍。 3、Kyber原型机：预计27年发货，为Vera Rubin Ultra的下一代机架级系统，仍属于Rubin系列，单托盘144颗GPU，计算托盘以垂直而非水平放置，以提高密度并降低延迟。其他1、DLSS 5：由AI 驱动，用于游戏的超分辨率，计划今年秋季推出。 2、Token King：老黄认为，英伟达拥有全球最低的单Token成本，是Token之王。 3、AI推理的拐点已经到来：云厂商的算力部署大约占到整体算力总需求的60%，剩下的是区域云、主权云、企业、工业、机器人、边缘计算等1）强调Token/watt、Token价格 2）GB300 Performance/Watt比竞争对手好50x；相比于H200 NVL8，GB300 NVL72的Token成本降低30x 4、Vera CPU：用于处理Agentic AI任务，比传统CPU速度快50% 。 5、太空算力：英伟达和合作伙伴正在研发一台用于太空的服务器，称其为Vera Rubin Space-1，最大的问题在于太空散热（太空中没有热传导、没有对流）。 6、Olaf机器人：英伟达和迪士尼正在制造一台Olaf机器人。 7、宣布NemoClaw参考栈：一个针对OpenClaw Agent平台的堆栈，用于创建AI Agent，其使用Nvidia AI Agent Toolkit 去优化OpenClaw，安装用于开源模型的OpenShell和沙盒。8、预计其Blackwell和Rubin产品，到2027年底，累计创造1万亿美金收入。25年10月，预估为5000亿美金，26年2月电话会，CFO上调预期，会超过先前的估算。

点击免费查看完整报告

小熊团队英伟达GTC大会更新芯片相关1V

你可能感兴趣

科创板周报：英伟达GTC大会发布下一代AI芯片Rubin

电子设备行业动态点评：英伟达GTC大会重磅发布H100 NVLINK芯片，产业链或将迎来爆发

3月接下来三件大事与四条主线1英伟达GTC大会发布LPU芯片

计算机行业周报：高通发布AI推理芯片，英伟达GTC大会揭晓战略核心

电子行业周报：英伟达GTC大会临近，关注相关投资机遇

人工智能周报（23年第46周）：微软2023Ignite大会公布多项更新，英伟达发布新一代AI芯片

小熊团队英伟达FY25Q3业绩点评业绩基本符合预期最差的季

小熊团队英伟达1000亿投资openai美股英伟达新高事

小熊团队英伟达FY4Q26业绩快评业绩指引均超预期收入

通信行业周报：英伟达GTC大会将至，关注AI算力网络与液冷新机会