您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [未知机构]:38周观点NV如何应对AgenticAI新增的算力需求 - 发现报告

38周观点NV如何应对AgenticAI新增的算力需求

2026-03-09 未知机构 Marco.M
报告封面

NV的护城河:①技术引领;②长期算力执着;③消费者洞察。 ①和②共识很强,③讲的少一些,但NV的护城河也离不开消费者洞察。 NV的产品需求帮我们确立了很多需求变化:大模型对高显存的需求(HBM)、训练对集群的需求(十万卡集群)、开发者编译对大节点的需求(NVL72)、汽车机器人对端侧大算力 3.8周观点:NV如何应对Agentic AI新增的算力需求? NV的护城河:①技术引领;②长期算力执着;③消费者洞察。 ①和②共识很强,③讲的少一些,但NV的护城河也离不开消费者洞察。 NV的产品需求帮我们确立了很多需求变化:大模型对高显存的需求(HBM)、训练对集群的需求(十万卡集群)、开发者编译对大节点的需求(NVL72)、汽车机器人对端侧大算力的需求(Orin/Thor)、上下文窗口对内存的需求(SSD边柜)、推理对PD分离的需求(CPX)等。 NV推一个新系列产品,不是单纯为了塞一个很牛的新技术给客户,而是因为存在现有产品无法精准覆盖的新需求,进而新开一个产品序列。 用深刻的消费者洞察,在全球最领先的工具库里定义产品,长期坚守算力而“等”来了AI。 26-27年,NV现已发布的产品无法精准覆盖的新需求是什么? #是由OpenClaw掀起的Agentic AI。 重度用户日均Tokens消耗量3000万-1亿,用Claude Opus 4.6计价费用约900-3000美金/天,用MiniMax M2.5计价费用约42-140美金/天。 假设100万OPC在未来一两年内,跑通以Opus 4.6驱动的OpenClaw商业模型(只需现金流回正),将新增3600亿美金的Agentic AI算力市场。 这部分市场是目前NV产品无法精准覆盖的,因为GPU在高并发推理领域无法满负荷运行,运行效率约20-50%,存在明显算力资源浪费。 NV如何应对Agentic AI新增的算力需求? 1、LPU。 GPU是“通用高性能AI工厂”,LPU是“为推理产线专门定制的流水线”。 NV 200亿美金获得Groq【非独家技术授权+核心团队整体入职】,具体包括LPU/TSP推理架构、编译器、片上SRAM非独家授权;Groq创始人Jonathan(TPU之父)、总裁Sunny及约90%核心团队加入NV。 LPU是非常明确的在Agentic AI时代补齐推理性价比短板的利剑,LPU将在推理领域与Asic芯片正面竞争。 2、单独的Vera CPU平台。 官网明确:Vera “can operate independently”且“operates as a standalone CPU compute platform”。 Vera官方定位不单是传统“host CPU”,而是直接写成了“The data movement engine for agentic reasoning”,其目标之一就是“keeps GPUs fully utilized”。 Vera CPU被强烈绑定到agentic reasoning、KV cache、workflow orchestration、AI factory control plane这些新型负载。 另外,Meta在2026年2月的合作公告里明确提到,双方已经在推进大规模Grace-only部署,并且还在合作推进Vera CPU,有潜在的大规模部署机会。 NV每一次新的产品序列,我们都会为技术迭代着迷,CPO、NVL72/576等,热心于多了什么少了什么。 但同时,NV的每一次新产品也在确立硬件设施的需求方向,其深刻的消费者洞察也在指明现阶段和下阶段需求来自哪里。 LPU与CPU在Agentic AI的需求变化在此前有很多篇报告分析,欢迎详询团队。