您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[未知机构]:从训练走向极致推理LPU架构重塑算力底座东北计算机范式转移 - 发现报告

从训练走向极致推理LPU架构重塑算力底座东北计算机范式转移

2026-02-28未知机构健***
AI智能总结
查看更多
从训练走向极致推理LPU架构重塑算力底座东北计算机范式转移

范式转移:推理端的“低延迟革命”催生LPU架构随着大模型进入大规模应用期,算力需求正从“暴力计算”向“极致交互”演进。 传统的GPU架构在处理LLM推理的Decode阶段时,往往面临高延迟瓶颈。 LPU(Language Processing Unit)架构应运而生。 技术核心:不同于 从训练走向极致推理—LPU架构重塑算力底座【东北计算机】 范式转移:推理端的“低延迟革命”催生LPU架构随着大模型进入大规模应用期,算力需求正从“暴力计算”向“极致交互”演进。 传统的GPU架构在处理LLM推理的Decode阶段时,往往面临高延迟瓶颈。 LPU(Language Processing Unit)架构应运而生。 技术核心:不同于GPU依赖HBM,LPU倾向于采用大规模片上SRAM直接存储模型参数,消除了内存访问延迟;同时利用静态时序调度,将计算路径精确锁定在时钟周期内。 这种ASIC化设计旨在追求推理端的绝对高吞吐与低延迟。 硬件重构:PD分离推动“计算/推理”模块异构集成 英伟达布局LPU架构(通过吸纳Groq技术路径)预示着未来机柜将实现PD分离:分工逻辑:算力密集型的Prefill由高性能GPU负责;而延迟敏感型的Decode由LPU集群接管。 硬件影响:由于LPU对信号传输的确定性要求极高,PCB板必须承载更为复杂的电路设计,直接驱动单机柜硬件规格由“通用品”向“定制化极品”跃迁。 硬件增量逻辑:高多层PCB与材料主权的“奇点” LPU架构的落地,对物理层基材提出了近乎苛刻的要求,核心增量集中在以下维度:高多层PCB(30L-50L):LPU的高集成度与无缆化趋势,使得主板层数大幅上行。 参考Google V8ax等ASIC路径,其PCB层数普遍在30层以上,且由于布线密度激增,单芯片对应的PCB价值量(ASP)较传统通用服务器提升3-5倍。 材料代际升级(M9级+石英纤维布):为了支撑LPU超低延迟的信号需求,传统的M7/M8级CCL已达物理极限。 产业链正加速转向M9级以上基材,其核心标准在于: 树脂端:必须使用极低损耗的特种树脂体系。 电子布:传统的玻璃布在介电一致性上已显疲态,石英纤维布凭借其极低且稳定的介电常数,正成为LPU架构及1.6T交换机主板的唯一指定方案。 石英布垄断标的:菲利华;高阶树脂与添加剂:东材科技、呈和科技;高阶电子布:宏和科技;铜箔:德福科技;CCL:华正新材、延江股份。 信息来源:科技快闻、微容科技、化工智库公众号 风险提示:下游需求不及预期,相关政策监管与法律风险。