技术方案与评估进展
目前 Google TPU v9 处于早期评估阶段,主要进行分模块、分线路的 IP 评估、EDA 及 CAE 仿真分析。整体方案尚未最终确定,但已明确两大关键技术方向:
- 3D 堆叠:通过堆叠计算 Die 并整合 3D DRAM/SRAM 混合体,为超大规模推理基础设施服务,支持高 batch size 的深度推理。
- 定制化 HBM:虽存在不使用 HBM 的备选方案,但非主流方向。3D 堆叠的核心挑战是片上 SRAM 缓冲容量不足,导致权重访问需频繁往返 HBM 与计算芯片,影响效能。