您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国联证券]:CXL高速互联:破解AI时代“内存墙”新途径 - 发现报告

CXL高速互联:破解AI时代“内存墙”新途径

信息技术2024-04-28张宁国联证券睿***
AI智能总结
查看更多
CXL高速互联:破解AI时代“内存墙”新途径

AI时代“内存墙”问题愈发明显 AI大模型的快速发展推动“算力”和“存力”需求快速增长,与此同时,对“运力”也提出了更高的需求,系统需要更高的带宽、更快的传输。但内存的性能提升速度远低于处理器的性能提升速度,导致处理器无法充分发挥其计算能力。“内存墙”问题由来已久,在AI时代表现的愈发明显,“算力”和“运力”之间的差距越来越大。Transformer类的模型参数的数量呈现指数增长,每两年增加410倍,而GPU内存仅以每两年2倍的速度扩展。 CXL提高内存利用效率,技术优势明显 CXL技术是一种新型的高速互联技术,旨在提供更高的数据吞吐量和更低的延迟,同时实现内存共享、提高内存利用效率,为化解“内存墙”问题提出新的解决方案。CXL通过将计算和存储分离,形成内存池,从而能动态按需配置内存资源,提升效率。CXL技术具有优势:1)CXL延迟较低,通常为10ns,而PCIe的延迟为100ns。2)CXL支持内存一致性,一致性的缺乏限制了PCIe应用程序。3)CXL地址空间可按定义缓存,PCIe则不可以。 CXL版本持续升级迭代,国际巨头纷纷加入CXL联盟 CXL历经5个版本的升级发展。CXL1.0于2019年3月发布,后历经1.1、2.0、3.0版本,2023年11月,CXL联盟发布了最新的CXL3.1版本。随着CXL技术的不断演进,未来数据中心各个计算节点和内存节点的互联将更加快速、高效和灵活。CXL联盟由英特尔牵头成立,目前成员已经超过255个,涵盖了主要的CPU、内存、存储和网络设备制造商。国际巨头加入CXL联盟,积极布局CXL技术,推出支持CXL技术的产品,助力CXL的发展。 CXL市场空间广阔,DRAM占据主要份额 CXL高速互联目前处于市场应用的早期阶段,未来采用CXL协议服务器的占比持续提升。Yole预测到2028年,CXL市场总收入将超过150亿美元,DRAM将占据CXL市场的主要份额,Yole预计到2028年,DRAM占到CXL市场规模的79%。三星和海力士相继推出了采用CXL内存控制器的CXL内存模组,三星推出其首款支持CXL2.0的128GB DRAM,加速下一代存储器解决方案的商用化进程。 投资建议:关注国产算力和国产芯片相关领域 AI大模型的快速发展,对“运力”也提出了更高的需求。CXL凭借高速率低时延的优势,同时可以实现内存共享、提高内存利用效率,有望破除“内存墙”。CXL市场空间广阔,目前渗透率仍较低,有望迎来快速发展,同时,CXL的发展也利好国产算力和芯片的进步,我们建议对此保持高度关注。 风险提示:CXL渗透率不及预期的风险,AI发展不及预期的风险,产品技术迭代不及预期的风险。 1.本周通信板块表现回顾 1.1本周(4.22-4.26)通信板块走势 本周通信行业指数上涨4.86%,跑赢沪深300指数3.66pct,跑赢创业板指1.01pct。其中通信设备(申万)上涨6.5%,通信服务(申万)上涨1.73%。同期沪深300指数上涨1.2%,创业板指上涨3.86%。 图表1:本周(4.22-4.26)通信板块走势 1.2本周市场个股表现 本周通信板块涨幅靠前的个股有奥维通信、广哈通信、华丰科技等;跌幅靠前的个股有ST鹏博士、中新赛克、朗特智能等。 图表2:本周(4.22-4.26)通信板块个股涨跌幅前十 2.CXL高速互联:破解AI时代“内存墙”新途径 2.1AI时代“内存墙”问题愈发明显 AI大模型的快速发展推动“算力”和“存力”需求快速增长,与此同时,对“运力”也提出了更高的需求。“运力”是指在计算和存储之间传输数据的能力,AI时代,系统需要更大的运力,需要更高的带宽、更快的传输。 “内存墙”问题由来已久,在AI时代表现的愈发明显,“算力”和“运力”之间的差距越来越大。“内存墙”指内存的性能提升速度远低于处理器的性能提升速度,从而导致处理器无法充分发挥其计算能力。由于内存的读写速度相对较慢,处理器在等待数据从内存中读取或写入时会出现空闲状态,从而限制了系统的性能,即使增加处理器数量和核数,也无法有效提高整体的计算能力。Transformer类的模型参数的数量呈现指数增长,每两年增加410倍,而GPU内存仅以每两年2倍的速度扩展。 图表3:大模型参数量增长速度远超硬件迭代速度 图表4:带宽增长与算力增长差距明显 2.2CXL高速互联应运而生,提高内存利用效率 CXL(ComputeExpressLink)技术是一种新型的高速互联技术,旨在提供更高的数据吞吐量和更低的延迟,同时实现内存共享、提高内存利用效率,为化解“内存墙”问题提出新的解决方案。它最初由英特尔、AMD和其他公司联合推出,并得到了包括谷歌、微软等公司在内的大量支持。CXL的目标主要是为了解决CPU和设备、设备和设备之间的内存鸿沟,解决内存分割造成的较大浪费、不便和性能下降。CXL通过将计算和存储分离,形成内存池,从而能动态按需配置内存资源,提升效率。 图表5:CXL内存池化和共享 2.3CXL技术优势明显 与PCIe技术相比,CXL技术具有优势。1)CXL延迟较低,通常为10ns,而PCIe的延迟为100ns。2)CXL支持内存一致性,一致性的缺乏限制了PCIe应用程序。3)CXL地址空间可按定义缓存,PCIe地址空间通常不可缓存。但相较于PCIe庞大且成熟的生态系统,CXL目前应用并不广泛,仍有广阔的发展空间。 图表6:PCIe和CXL关于存储应用的特性对比 2.4CXL版本持续升级迭代 CXL历经5个版本的升级发展,内存共享和设备的灵活性增强。CXL1.0于2019年3月发布,后历经1.1、2.0、3.0版本,2023年11月,CXL联盟发布了最新的CXL3.1版本。随着CXL技术的不断演进,未来数据中心各个计算节点和内存节点的互联将更加快速、高效和灵活。 图表7:CXL的发展过程 CXL1.0及1.1版本归为一代标准,二者相比并没有较大的区别。CXL2.0发布于2020年,新增了切换、内存池化、按需内存分配、IDE(完整性和数据加密)功能。 CXL3.0版本在三个关键领域进行重大改进。1)PCIe协议由PCIe5.0上升到PCIe6.0,传输速率由32GT/s提升至64GT/s;2)CXL3.0可以支持更加灵活的Switch拓扑;3)除了支持内存池化,CXL3.0还进一步支持内存共享。 CXL3.1新版本对横向扩展CXL进行了结构改进、增加了新的可信执行环境功能,并对内存扩展器进行了改进。1)支持使用全局集成内存(GIM)通过CXL结构进行主机间的通信,这可以大大提高系统性能。2)通过CXL对内存事务的直接点对点支持来增加GPU内存的使用效率,这对于处理大规模数据集和AI工作负载非常有帮助。 图表8:不同版本CXL的对比 2.5国际巨头纷纷加入CXL联盟 CXL联盟由英特尔牵头成立,目前成员已经超过255个成员,涵盖了主要的CPU、内存、存储和网络设备制造商。国际巨头纷纷加入CXL联盟,积极布局CXL技术,推出支持CXL技术的产品,助力CXL的发展。 图表9:CXL联盟董事会成员 2.6CXL联盟定义了三种类型的设备 CXL标准定义了三个协议:1)CXL.io协议本质上是PCIe 5.0的改进,用于初始化、链接、设备发现和列举以及寄存器访问。2)CXL.cache协议定义了主机和设备间的交互,允许连接的CXL设备以极低的延迟高效地缓存主机内存。3)CXL.mem协议提供了主机处理器,使用加载和存储命令访问设备连接的内存。 CXL联盟定义了三种类型的设备,分别支持不同的子协议。CXL.io协议用于初始化和链接,所以必需获得所有CXL设备的支持,如果该协议发生故障,链接就无法运行。第一种设备用于智能NIC等设备。第二种设备用于带有内存的加速器,如CPU、GPU、FPGA等。第三种设备用于内存拓展和池化。 图表10:三种已定义的CXL设备类型 2.7CXL市场空间广阔,DRAM占据主要份额 CXL高速互联目前处于市场应用的早期阶段,未来有望迎来快速发展,采用CXL协议服务器的占比持续提升。根据Yole的预测,到2025年,采用CXL协议的数据中心服务器占比达到60%左右,到2027年,这一数据将接近100%。Yole预测到2028年,CXL市场总收入将超过150亿美元。 图表11:全球服务器中采用CXL协议的占比 DRAM占据CXL市场的主要份额,国际巨头纷纷进行布局。Yole预计到2028年,DRAM市场规模达到125亿美元,占到CXL市场规模的79%。三星和海力士相继推出了采用CXL内存控制器的CXL内存模组。2023年5月,三星电子推出其首款支持CXL2.0的128GBDRAM,加速下一代存储器解决方案的商用化进程。 图表12:CXL市场规模情况预测 3.投资建议:关注国产算力和国产芯片相关领域 AI大模型的快速发展,对“运力”也提出了更高的需求。CXL凭借高速率低时延的优势,同时可以实现内存共享、提高内存利用效率,有望破除“内存墙”。CXL市场空间广阔,目前渗透率仍然较低,未来有望迎来快速发展,同时,CXL的发展也利好国产算力和国产芯片的进步,我们建议对此保持高度关注。 4.风险提示 CXL渗透率不及预期的风险,AI发展不及预期的风险,产品技术迭代不及预期的风险。