行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

国盛电子AI英伟达正式推出LPUAI进入推理Agent时代

2026-03-18 未知机构 ζޓއއKun

AI进入推理+Agent时代，硬件板块投资机会重估

随着模型规模和上下文长度大幅增长，AI进入推理+Agent时代，算力成为核心收入来源，硬件效率成为关键。PCB、存储、服务器代工板块业绩和估值有望重估。

Rubin系列：高性能计算节点

Rubin量产与出货节奏：Rubin将于2026年下半年量产，Rubin Ultra采用全新Kyber机架，支持144颗GPU构成单一NVLink域，将于2027年下半年出货。
市场预期：到2027年底，Blackwell和Rubin芯片将至少创造1万亿美元收入，实际需求可能更高。
Groq LPU协同：Groq 3 LPU拥有500MB SRAM缓存和150 TB/s片上带宽，远超Rubin GPU的22 TB/s。通过Dynamo软件解耦推理，Prefill和Attention由Rubin处理，Decode由Groq LPU承担，实现35倍每兆瓦吞吐提升。
部署设计：3 LPX机架设计为与Vera Rubin NVL72并排部署。Groq 3 LPU将于2026年第三季度出货。

Feynman系列：存储性能突破

存储策略变革：NVIDIA为Feynman GPU配备定制化HBM技术，跳过通用规格，可能采用基于HBM4E的定制增强版甚至HBM5方案。
技术优势：定制化方案将GPU数据处理逻辑嵌入存储Base Die，实现超高的带宽和极低延迟。
搭配CPU：Feynman将搭配Rosa的全新CPU。
出货时间：Feynman将于2028年出货。
扩展支持：Feynman平台将同时支持铜和CPO扩展。

相关标的

光互连产业链：东山精密（索尔思）、炬光科技、源杰科技、天孚通信、中际旭创、新易盛、长光华芯、仕佳光子、光迅科技、永鼎股份、太辰光、光库科技、致尚科技等。
PCB：胜宏科技，沪电股份，东山精密，深南电路，生益科技，菲利华，东材科技，大族数控，鼎泰高科，联瑞新材等。
服务器代工：工业富联。
存储：存储模组如香农芯创、国科微、佰维存储、江波龙等；存储芯片如兆易创新、澜起科技、东芯股份、普冉股份、聚辰股份、恒烁股份等。

#当模型越来越大，上下文长度从十万Token飙升到数百万，还要同时处理结构化和非结构化的数据，AI进入推理+Agent时代，未来每一家公司都会认真思考自己token工厂的效率问题，因为算力就是收入本身。重视AI硬件板块投资机会！PCB+存储+服务器代工板块业绩、估值有望再重估！ # Rubin系列：从节奏来【国盛电子】AI：英伟达正式推出LPU，AI进入推理+Agent #当模型越来越大，上下文长度从十万Token飙升到数百万，还要同时处理结构化和非结构化的数据，AI进入推理+Agent时代，未来每一家公司都会认真思考自己token工厂的效率问题，因为算力就是收入本身。重视AI硬件板块投资机会！PCB+存储+服务器代工板块业绩、估值有望再重估！ # Rubin系列：从节奏来看，Rubin将于26年下半年量产；Rubin Ultra采用全新Kyber机架，支持144颗GPU构成单一NVLink域。计算节点从正面插入，#NVLink交换机从背面通过中板连接，整体构成一台巨型计算机，Rubin Ultra将于27年下半年出货。到2027年底，#Blackwell和Rubin芯片将至少创造1万亿美元收入，而且这还是保守估计，实际计算需求会远超这个数字。 Groq LPU。 Groq 3 LPU拥有500MB SRAM缓存和150 TB/s的片上带宽，远超Rubin GPU的22 TB/s。黄仁勋用一款名为Dynamo的软件，把这两者完美捏合，首创了解耦推理。 AI推理前半段的Prefill和极其耗费算力的Attention，全部交给Vera Rubin；后半段的Decode直接卸载给Groq LPU来降低延迟，组合后在极高token速率下实现35倍的每兆瓦吞吐提升。 3 LPX机架设计为与Vera Rubin NVL72并排部署。 Groq 3 LPU将于26Q3出货。 # Feynman系列：存储性能是制约AI推理的瓶颈，为此NVIDIA改变了以往使用标准HBM的策略，转而为Feynman GPU配备定制化HBM技术。 Feynman将跳过通用规格，可能采用基于HBM4E的定制增强版甚至提前布局定制化HBM5方案。这种定制化方案允许NVIDIA将部分GPU的数据处理逻辑直接嵌入存储底层的Base Die中，从而实现超高的带宽与极低的延迟。此外，Feynman将搭配Rosa的全新CPU。 Feynman将于2028年出货。 #Feynman平台将同时支持铜和CPO扩展。相关标的：光互连产业链：东山精密（索尔思）、炬光科技、源杰科技、天孚通信、中际旭创、新易盛、长光华芯、仕佳光子、光迅科技、永鼎股份、太辰光、光库科技、致尚科技等PCB：胜宏科技，沪电股份，东山精密，深南电路，生益科技，菲利华，东材科技，大族数控，鼎泰高科，联瑞新材等服务器代工：工业富联存储：存储模组如香农芯创、国科微、佰维存储、江波龙等；存储芯片如兆易创新、澜起科技、东芯股份、普冉股份、聚辰股份、恒烁股份等

点击免费查看完整报告

国盛电子AI英伟达正式推出LPUAI进入推理Agent时代

AI进入推理+Agent时代，硬件板块投资机会重估

Rubin系列：高性能计算节点

Feynman系列：存储性能突破

相关标的

你可能感兴趣

电子周观点：AI进入推理+Agent时代，重视算力+存力主线

国盛电子LPU关注AI推理的下半场投资机遇英伟达与AI芯片

【电报解读】豆包将推出付费订阅版本！AI大模型从“对话时代”进入“智能体时代”下，Token消耗激增，推理算力需求或将呈“指数级”增长，这家公司产品在电源类新场景应用中已取-20260506

电子行业半年度投资策略：AI进入推理驱动时代，自主可控长期趋势明确

美股科技行业周报：英伟达GTC2026召开，推理时代正式来临，持续好看算力需求加速增长

国盛海外模型训练与Agent推理双轮驱动把握恒生科技成长机会

电子行业周度点评报告：英伟达推出RubinCPX加速推理性能，铜连接、光连接、功率需求高增

英伟达推出推理上下文内存存储平台，AI存储需求持续扩张

【财联社早知道】英伟达开源多个代码推理大模型，机构称AI大模型加速高速光模块的发展，这家公司已成功推出800G1.6T光模块产-品；松延动力..

人工智能周报（26年第12周）：腾讯 QClaw 正式开启公测，小米推出三款面向面向 Agent 时代的大模型