近内存技术发展趋势与 OMI 解决方案分析
近记忆与远记忆需求差异
- 近记忆(<10ns)与远记忆(>150ns)在延迟和带宽需求上存在显著差异。
- 高性能计算(HPC)场景下,近内存带宽需求持续增长,而时钟速度停滞不前,导致处理器核心数量激增,对内存带宽提出更高要求。
处理器趋势推动近内存需求
- 处理器晶体管数量持续增长,但时钟频率提升有限,核心数量大幅增加。
- 内存带宽需求随之膨胀,传统 DDR 技术通过增加总线时钟速度和内存通道提升带宽,但高时钟速度导致延迟增加,且每个通道成本和功耗高昂。
三种近内存选项对比
- DDR:主流且成本低,但带宽受限,需更高时钟速度和更多通道,增加成本和功耗。
- HBM:带宽高,容量大,但成本昂贵,接口复杂。
- OMI:引入 SerDes 引入数据路径,支持高带宽和大内存容量,兼具 DDR 的成本效益和 HBM 的高速特性。
OMI 技术特点与应用
- OMI DDIMM:将 DRAM 信号从主板移至 DDIMM,采用串行差分信号,类似 HBM 带宽,降低处理器 I/O 功耗,延迟低(<4ns)。
- IBM POWER10 CPU 与 OMI:支持 16 个 OMI 通道,每通道 256GB 容量,总带宽达 1TB/s,接近 HBM 带宽,通道模具面积高效。
- 混合近内存支持:OMI 可支持 DDR 和 HBM 的混合使用,灵活满足不同性能和成本需求。
未来技术可能性
- DDIMM:多种类型如 DDR4、LPDDR、DDR5 等,以及 MRAM、ReRAM、FRAM、NRAM 等新兴技术。
- XPoint:作为非易失性存储,提供高带宽和低延迟。
结论与建议
- 近内存技术需兼顾高带宽、大容量和低成本,OMI 提供理想解决方案。
- 建议在处理器设计中采用 OMI 作为近内存接口,实现低延迟、高带宽和高容量。
- 参观 OCP 展品层的 OMI 展位,深入了解技术细节。
参考文献
- CXL 联盟、Gen-Z 芯片组、LPDDR4、HBM DRAM、Karl Rupp 微处理器趋势数据、IBM POWER10 处理器、低延迟内存未来白皮书、SAP 基准测试等。