
当前大模型仍处于Free阶段,后续往Ultra阶段发展 NV根据单个用户每秒能获得的Tokens(TPS/User)将对应的大模型分为不同的价格档位Free:~50TPS/User,对应Qwen 3(2350亿参数,32K上下文),价格为$0/百万TokensMedium:~1 【财通电子&新科技】NV推出Groq 3 LPX机柜扩展推理算力能力边界,看好LPU在推理侧的爆发潜力0317 当前大模型仍处于Free阶段,后续往Ultra阶段发展 NV根据单个用户每秒能获得的Tokens(TPS/User)将对应的大模型分为不同的价格档位Free:~50TPS/User,对应Qwen 3(2350亿参数,32K上下文),价格为$0/百万TokensMedium:~100TPS/User,对应Kimi K2.5(1万亿参数,128K上下文),价格为$3/百万TokensHigh:~200TPS/User,对应GPT MoE(2万亿参数,128K上下文),价格为$6/百万TokensPremium:~400TPS/User,对应GPT MoE(2万亿参数,400K上下文),价格为$45/百万TokensUltra:~800TPS/User,对应GPT MoE(2万亿参数,400K上下文),价格为$150/百万Tokens NVLink可满足Free-High阶段的吞吐量需求,Groq延伸需求能力至Premium-Ultra阶段 当大模型处于Free、Medium、High阶段时,重要的在于吞吐量,NVLink可提供更高的吞吐量;进入Premium阶段,Vera Rubin相较于Blackwell可提高10倍吞吐量,当加入Groq的能力时,相较于Blackwell可提供35倍吞吐量;进入Premium阶段,NVLink受限于带宽,无法提供更高的吞吐量,收购Groq可让NV为Premium、Ultra阶段的大模型提供服务。 新一代Groq LPUv3升级SRAM与内存带宽,与Rubin呈互补作用 相较于Groq第一代LPU,LPUv3将SRAM从230MB提高到500MB,将内存带宽从80TB/s升级到150TB/s,代工厂为三星;Rubin可提供288GB HBM4,与LPUv3呈互补作用。 NV重新设计推理的执行方式,将两个极大的处理器整合在一起,一个用于高吞吐量,一个用于低延迟,并将解码生成、低延迟、带宽受限的工作负载分配给LPU。 推出Groq 3 LPX,预计26Q3发货 2026GTC大会上,NV推出Groq 3 LPX机柜,Groq 3 LPX内置8颗Groq Chip(LPU 3),可提供128GB SRAM和40PB/s的Memory Bandwidth,目前已经量产,与Rubin机柜以以太网的形式链接,预计26Q3发货。 投资建议我们认为LPU受益于低推理延时的优异表现,有望实现快速渗透,我们看好LPU的高成长性及LPU 以机柜出货时带来的PCB机会,建议关注:智微智能(参股元川微)、星宸科技(多轮增资元川微)、沪电股份(英伟达PCB供应商)、胜宏科技(英伟达PCB供应商)、深南电路。