您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国盛证券]:电子周观点:关注LPU——AI推理的下半场投资机遇 - 发现报告

电子周观点:关注LPU——AI推理的下半场投资机遇

电子设备2026-03-01佘凌星、钟琳国盛证券S***
电子周观点:关注LPU——AI推理的下半场投资机遇

周观点:关注LPU——AI推理的下半场投资机遇 LPU:关注AI推理的下半场投资机遇。英伟达与AI芯片初创公司Groq达成协议,斥资200亿美金获取其技术非独家许可并吸纳其核心团队。Groq专门设计了LPU,LPU运行大型语言模型(LLMs)及其他主流模型的速度显著更快,在架构层面,从能源效率上比GPU高出多达10倍。LPU集成了数百兆片上SRAM作为主权重存储器(而非缓存),显著降低了访问延迟。我们认为,LPU的应用有望带动SRAM的需求提升。从供电技术来看,背面供电网络(BPDN)直接从晶圆下方向前沿晶体管供电,这种架构变革能够提升处理器性能、大幅降低功率损耗并提高电源效率,嵌埋PCB不仅让结构更小,更重要的是提供了寄生稳定、可预测的电气环境,这对于超大电流瞬间负载的稳定性至关重要,AI将带动嵌埋PCB需求,此外,我们认为LPU PCB层数有望显著提升,建议关注PCB厂商及上游材料。 增持(维持) 作者 英伟达指引超预期,重视AI硬件板块投资机会。公司FY26Q4营收681亿美元,同比+73%,其中数据中心623亿,同比+75%,环比+22%。GAAP毛利率为75%,非GAAP毛利率为75.2%,随着Blackwell继续扩大产能,毛利率实现环比增长。公司指引FY27Q1营收将达到780亿美元,上下浮动2%,不包括来自中国的任何数据中心计算营收,全年的GAAP和非GAAP毛利率预计分别为74.9%和75%,上下浮动50个基点。从产品进展来看,Grace Blackwell系统约占FY26Q4数据中心营收的三分之二,目前主要云服务商、超大规模企业、AI模型厂商及部分主权客户,已合计部署并消耗接近9吉瓦的Blackwell基础设施。 分析师佘凌星执业证书编号:S0680525010004邮箱:shelingxing1@gszq.com 分析师钟琳执业证书编号:S0680525010003邮箱:zhonglin1@gszq.com 相关研究 1、《电子:周观点:阿里字节模型密集发布,AI算力需求扩容》2026-02-142、《电子:周观点:电子板块预告总览》2026-02-073、《电子:周观点:AI闭环逐步形成,海外业绩印证存力景气周期》2026-02-01 高速HBF标准发布,产业化进程逐步推进。高带宽闪存(HBF:HighBandwidth Flash)的出现,旨在解决人工智能的内存瓶颈问题。其理念是将NAND闪存像HBM一样堆叠起来,从而在提供HBM级别带宽的同时,实现16倍的容量提升。SK海力士和闪迪正在联合开发这项技术,目标是在2026年底推出样品SK海力士与闪迪举行了HBF规范标准化联盟启动活动,宣布了面向AI推理时代的下一代存储解决方案HBF((高带宽闪存)的全球标准化战略。SK海力士表示通过与闪迪合作将HBF打造为行业标准,将为整个AI生态系统的共同成长奠定基础,SK海力士与闪迪将在开放计算项目(OCP)下与闪迪共同设立专门工作组,启动标准化工作。 周观点:见相关标的。 风险提示:下游需求不及预期、研发进展不及预期、地缘政治风险。 内容目录 一、LPU:关注AI推理的下半场投资机遇.................................................................................................41.1 LPU:基于SRAM架构创新,驱动AI推理新机遇............................................................................41.2背面供电技术有望带动嵌埋PCB需求...........................................................................................5二、英伟达指引超预期,重视AI硬件板块投资机会....................................................................................9三、高速HBF标准发布,产业化进程逐步推进..........................................................................................11四、相关标的........................................................................................................................................13风险提示..............................................................................................................................................13 图表目录 图表1:GPU工作原理...........................................................................................................................4图表2:LPU工作原理...........................................................................................................................5图表3:英特尔工艺流程........................................................................................................................6图表4:PCB演进过程与优势.................................................................................................................6图表5:Schweizer前视模块PCB嵌入方案..............................................................................................7图表6:VPD中PCB的应用...................................................................................................................7图表7:Schweizer新型雷达技术研发方案...............................................................................................8图表8:Schweizer Smart p²Pack方案....................................................................................................8图表9:英伟达FY26Q4主要财务指标.....................................................................................................9图表10:HBF结构...............................................................................................................................11图表11:HBM与HBF对比(1)...........................................................................................................12图表12:HBM与HBF对比(2)...........................................................................................................12图表13:HBF各家时间线.....................................................................................................................12 一、LPU:关注AI推理的下半场投资机遇 1.1 LPU:基于SRAM架构创新,驱动AI推理新机遇 英伟达与AI芯片初创公司Groq达成协议,斥资200亿美金获取其技术非独家许可并吸纳其核心团队。Groq独创LPU——软件定义硬件的可重构数据流架构,消除了内存带宽瓶颈,在大语言模型推理过程中可实现每秒数百Token的瞬时输出,达到TPU和传统GPU无法企及的物理极限。LPU专为顺序处理的计算密集型任务而设计,相较于传统处理器,对顺序处理进行优化,用于处理语言的复杂性和顺序性,帮助训练能够理解上下文、生成连贯响应和识别模式的模型,LLM正是顺序任务的典型代表。Groq的LPU推理引擎基于专有LPU构建,作为新型处理系统,专门用于解决LLM面临的计算与内存带宽瓶颈问题。在具备与GPU相当甚至更高计算能力的同时,其不受外部内存带宽限制,可在训练与推理过程中实现较传统处理系统数量级提升的性能表现,并在大规模部署下保持高精度运行,同时支持超大参数模型的编译与执行。 LPU通过将数据存储于片上SRAM并构建本地化数据流处理机制,减少对外部HBM的依赖,从而显著降低数据传输能耗并提升系统效率。在此基础上,其通过LPU间直接通信与确定性执行机制,实现类似“流水线”的高效计算模式,在降低系统复杂度的同时提升整体吞吐能力,因此LPU运行大型语言模型(LLMs)及其他主流模型的速度显著更快,从能源效率上比GPU高出多达10倍。 资料来源:Groq,国盛证券研究所 资料来源:Groq,国盛证券研究所 LPU集成了数百兆片上SRAM作为主权重存储器(而非缓存),大幅降低了数据访问延迟,可让计算单元全速加载权重,并通过将单层拆分到多个芯片实现张量并行;据Groq官方数据,其芯片将SRAM集成在处理器内部,访问延迟仅为HBM的几分之一,其片上带宽高达80TB/s。SRAM(Static Random Access Memory,静态随机存取存储器)常用于CPU、GPU及AI晶片内部,属于易失性存储器,即在通电状态下可持续保存数据、断电后数据即消失。相较于DRAM,SRAM采用基于双稳态触发器的存储结构,读写过程为非破坏性操作,且无需像DRAM一样进行周期性刷新或读后重写,从而减少额外时序开销并提升访问速度。同时,SRAM支持地址同时传输且通常作为片上缓存使用,避免复杂的行列寻址与跨芯片访问过程,使其访问延迟达到纳秒级水平,显著快于DRAM。 1.2背面供电技术有望带动嵌埋PCB需求 背面供电网络(BSPDN)是一种颠覆性的芯片供电架构。其核心特征是将电源网络从传统的晶圆正面重新定位至晶圆背面,直接从晶圆下方向前沿晶体管供电,彻底改变了传统正面供电的电流传输路径。这种架构变革能够提升处理