核心观点与关键数据
- 服务器内存成本与功耗问题:内存成本和功耗在服务器系统中占比持续上升,而内存价格(每比特成本)因扩展挑战而保持平稳。随着CPU核心数的增加,内存需求也随之增长,对带宽和容量的要求进一步提升。
- 现有服务器设计局限性:通过增加CPU直连内存通道来提升内存容量成本高昂,提高DDR*速度面临挑战,现有内存配置的异构性不足,需要更灵活的连接方式。
- CXL技术介绍:CXL(Compute Express Link)是一种开放的行业标准处理器互连技术,具有高带宽、低延迟、支持一致性接口,并利用PCI Express®。它旨在连接设备,特别是面向高性能计算工作负载。
- CXL发展历程:CXL规范开发按计划进行,CXL 1.0于2019年3月发布,CXL 2.0于2019年9月发布,引入了交换、池化、持久内存支持和安全等新功能,CXL 3.0正在开发中。
CXL内存扩展方案
- CXL内存扩展目标:通过CXL技术扩展内存带宽和容量,并实现内存异构性。
- CXL内存扩展架构:通过CXL控制器和CXL内存模块,将内存扩展到现有服务器架构中,支持DDR4/DDR5内存。
- CXL内存扩展POC:使用Intel Sapphire Rapids CPU(预生产)和Intel CXL FPGA卡(含2x DDR4内存条)进行原型验证。
服务器设计概念与生态系统建设
- 服务器设计概念:基于CXL内存扩展的服务器设计,包括CXL控制器、内存插槽和扩展板。
- 开放互操作生态系统:构建由技术提供商(CPU、CXL控制器ASIC、内存)和系统提供商共同参与的开源、互操作生态系统是成功的关键。
- 技术提供商支持:Intel、AMD、Microchip等公司积极参与CXL规范制定,并推出基于CXL的产品。Wiwynn和Quanta Computer等系统提供商与Meta合作,开发CXL内存模块。
- 系统提供商支持:Meta积极参与CXL生态建设,并计划在2022年贡献服务器设计方案。
行动号召
- 邀请更多参与者共同开发CXL内存解决方案。
- Meta计划在2022年提供服务器设计方案。
- 信息获取渠道:OpenCompute邮件列表(http://lists.opencompute.org/mailman/listinfo/opencompute-server)、CXL官网(https://www.computeexpresslink.org/)。