您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[未知机构]:国盛电子AI英伟达正式推出LPUAI进入推理Agent时代 - 发现报告

国盛电子AI英伟达正式推出LPUAI进入推理Agent时代

2026-03-18未知机构ζ***
国盛电子AI英伟达正式推出LPUAI进入推理Agent时代

#当模型越来越大,上下文长度从十万Token飙升到数百万,还要同时处理结构化和非结构化的数据,AI进入推理+Agent时代,未来每一家公司都会认真思考自己token工厂的效率问题,因为算力就是收入本身。 重视AI硬件板块投资机会!PCB+存储+服务器代工板块业绩、估值有望再重估! # Rubin系列:从节奏来 【国盛电子】AI:英伟达正式推出LPU,AI进入推理+Agent #当模型越来越大,上下文长度从十万Token飙升到数百万,还要同时处理结构化和非结构化的数据,AI进入推理+Agent时代,未来每一家公司都会认真思考自己token工厂的效率问题,因为算力就是收入本身。 重视AI硬件板块投资机会!PCB+存储+服务器代工板块业绩、估值有望再重估! # Rubin系列:从节奏来看,Rubin将于26年下半年量产;Rubin Ultra采用全新Kyber机架,支持144颗GPU构成单一NVLink域。 计算节点从正面插入,#NVLink交换机从背面通过中板连接,整体构成一台巨型计算机,Rubin Ultra将于27年下半年出货。 到2027年底,#Blackwell和Rubin芯片将至少创造1万亿美元收入,而且这还是保守估计,实际计算需求会远超这个数字。 Groq LPU。 Groq 3 LPU拥有500MB SRAM缓存和150 TB/s的片上带宽,远超Rubin GPU的22 TB/s。 黄仁勋用一款名为Dynamo的软件,把这两者完美捏合,首创了解耦推理。 AI推理前半段的Prefill和极其耗费算力的Attention,全部交给Vera Rubin;后半段的Decode直接卸载给Groq LPU来降低延迟,组合后在极高token速率下实现35倍的每兆瓦吞吐提升。 3 LPX机架设计为与Vera Rubin NVL72并排部署。 Groq 3 LPU将于26Q3出货。 # Feynman系列:存储性能是制约AI推理的瓶颈,为此NVIDIA改变了以往使用标准HBM的策略,转而为Feynman GPU配备定制化HBM技术。 Feynman将跳过通用规格,可能采用基于HBM4E的定制增强版甚至提前布局定制化HBM5方案。 这种定制化方案允许NVIDIA将部分GPU的数据处理逻辑直接嵌入存储底层的Base Die中,从而实现超高的带宽与极低的延迟。 此外,Feynman将搭配Rosa的全新CPU。 Feynman将于2028年出货。 #Feynman平台将同时支持铜和CPO扩展。 相关标的: 光互连产业链:东山精密(索尔思)、炬光科技、源杰科技、天孚通信、中际旭创、新易盛、长光华芯、仕佳光子、光迅科技、永鼎股份、太辰光、光库科技、致尚科技等PCB:胜宏科技,沪电股份,东山精密,深南电路,生益科技,菲利华,东材科技,大族数控,鼎泰高科,联瑞新材等服务器代工:工业富联存储:存储模组如香农芯创、国科微、佰维存储、江波龙等;存储芯片如兆易创新、澜起科技、东芯股份、普冉股份、聚辰股份、恒烁股份等