计算内存技术概述
计算内存技术旨在将计算能力移动到数据附近,以提高数据处理效率并降低延迟。主要技术类型包括:
-
内存加速器:
- 硬件加速器:包括内存加速器(如AMD Xilinx SmartNIC)和网络加速器(智能NIC)。
- 存储加速器:如计算存储设备(CMD),支持PCIe卡和EDSFF格式,具有高内存容量和可扩展性。
-
Optane内存扩展和内存加速器:
- 基于英特尔Optane技术,支持PCIe Gen4 x16接口,最高2TB容量,采用专用ARM A53内存计算引擎,支持内联压缩和加密。
计算内存设备优势
-
独立于CPU架构的内存升级:
- 通过PCIe CEM和EDSFF设备,内存可独立于CPU进行升级。
- 支持热插拔和可扩展性,提高系统利用率。
-
内存处理(PIM):
- 在数据复制前进行预过滤、搜索和组织,支持并行处理多个数据集。
- 释放CPU周期,减少数据冗余。
硬件性能对比
-
Kestral直接连接内存(DDR4/DDR5/持久内存):
- 延迟低于最快的SSD,支持内联压缩和加密。
- PCIe Gen3 x16和Gen4 x8接口,容量2TB,随机读取性能5.44GB/s,顺序读取性能14.8GB/s。
-
三星NVMe SSD(980 Pro):
- 假设双x4 SSD连接,随机读取性能12.4GB/s,顺序读取性能14.8GB/s。
- 读取延迟<6us,写入延迟<6us。
-
英特尔Optane NVMe SSD(P5800X/P5801X):
- 双盘配置随机读取性能10.2GB/s,顺序读取性能14.8GB/s。
- 读取延迟<0.3us,写入延迟<0.5us。
计算内存体系结构优点
- 独立升级内存:内存可独立于处理器进行升级。
- 成本效益高:用更少的钱实现更多功能。
- 释放CPU周期:减少数据拷贝和丢弃,提高系统效率。
核心结论
计算内存技术通过将计算能力移动到数据附近,显著降低了延迟并提高了数据处理效率。硬件加速器和计算存储设备提供了高内存容量和可扩展性,而Optane内存扩展则通过专用计算引擎进一步优化了性能。这些技术不仅提升了系统性能,还提高了资源利用率,为数据中心提供了更高效的解决方案。