
3 LPXGroq 500MB SRAM+Rubin 288GB内存;Scale up 256芯,带宽640TB/s,推理算力315 PFlops;Dynamo软件将“Pre-fill”阶段交给Vera Rubin,将“解码”交给Groq。 解决极速推理(1000Tokens/s)带宽瓶颈。 【申万电子】GTC发布LPU分离推理方案,NV展望27年万亿营收20260317 3 LPXGroq 500MB SRAM+Rubin 288GB内存; Scale up 256芯,带宽640TB/s,推理算力315 PFlops;Dynamo软件将“Pre-fill”阶段交给Vera Rubin,将“解码”交给Groq 。 解决极速推理(1000Tokens/s)带宽瓶颈。 高吞吐工作100%使用Vera Rubin;大量高价值编程需求25%给Groq;AI服务会据速率进行商业分级,超高速层$150/百万Token 2026-2027年出货量将400-500万颗。 单柜256颗,新架构预计26Q4量产。 26/27E出货300-500柜、1.5w-2w柜。 LPU:智微智能(投资国内LPU先行者川元微)、清微智能(RPU);SRAM:北京君正、恒烁股份、西测测试;高多层PCB:胜宏科技、沪电股份、深南电路;系统集成:工业富联; –方案:32托盘×8颗LPU,合计256颗LPU;–每托盘配8块冷板(冷板芯片一对一匹配)及24+2个快速断开接头(QD)。 –根据测算,冷板(ASP 300美元)256块、QD(ASP 20美元)超800个,Manifold 2条(ASP 8000美元),两者合计10.88万美元/机柜,#单芯片液冷ASP高达3000元(425美元)。 –对应2026/2027 LPU芯片出货量分别约7.68万-12.80万颗/384万–512万颗,#2027对应液冷增量达115.2e-153.6e