AI智能总结
技术白皮书 中讯邮电咨询设计院有限公司2025年7月 前言 随着全球算力需求激增,传统风冷散热已逼近物理极限,液冷技术在数据中心领域近年来保持高速增长。市场分析显示,2025至2030年间,全球液冷数据中心市场的年复合增长率(CAGR)预计为19.8%,到2030年市场规模将达240亿美元,反映出液冷在提升能效、降低能耗方面的显著优势及其渗透率的加速提升。 这一增长主要由数据中心对高效散热解决方案的需求驱动:一方面,人工智能服务器和高密度计算部署(如AI大模型应用)导致功率密度骤增,形成液冷的刚性需求;另一方面,绿色节能政策成为关键推动力。从行业应用来看,电信运营商和互联网厂商是推动液冷技术应用的重要力量:互联网领域因AI部署推动液冷需求,电信运营商则基于《电信运营商液冷技术白皮书》的要求积极推广。同时,国家“碳达峰·碳中和”战略下,PUE标准趋严(如“东数西算”工程强制要求新建数据中心PUE<1.25),液冷技术能将PUE降至1.2以下,符合监管要求并获政策鼓励。 未来,随着AI技术的不断进步和发展,算力芯片功率的持续上升,液冷技术在高功率服务器中的应用将发挥更显著的散热能力和能耗优势,从而成为数据中心散热的主流选择。这一趋势推动全球和中国的液冷市场保持高速增长,尤其在冷板式液冷技术的应用上,市场规模有望大幅扩大。同时,液冷技术路线随不同的应用场景逐步完善,推动着液冷技术在更多领域应用,建立并完善数据中心液冷生态系统,驱动液冷技术创新融合,最终共筑高效、低碳的绿色算力底座。 目录 一、概述....................................................6 3.1冷却液老化与管道腐蚀............................................93.2泄漏风险.......................................................103.3建设周期长.....................................................103.4运维要求高.....................................................10 1.液冷云舱建设方案的必要性............................................................................102.液冷云舱建设方案的优势................................................................................11 3.系统架构及解决方案......................................................................................11 3.1基本技术条件...................................................123.2冷量分配单元CDU..............................................133.3解耦型液冷机柜.................................................143.4二次侧管路.....................................................183.5水氟双冷源空调.................................................18 五、冷板式液冷系统工程设计要点.............................21 1.一般规定........................................................................................................212.负荷计算........................................................................................................213.设计要求........................................................................................................21 七、结语...................................................24 一、概述 随着人工智能对算力需求的高速增长,大模型的快速迭代加速了更先进的算力芯片模组、更高带宽的大容量显存和内存、更大规模的高速互联网络的部署,数据中心呈现更高的单体算力性能、更高的算力部署密度。作为算力承载的芯片模组,单芯片功率已突破1000W,单机柜部署功率密度突破120kW。传统的风冷技术已经无法支持如此高功耗的芯片,而液冷技术采用高比热容的液体取代空气作为冷却介质,其比热容约是空气的4倍,热传导能力约是空气的25倍,散热效率远高于风冷可有效解决高功耗芯片的散热问题。 冷板式液冷是将液冷散热冷板紧贴在服务器的发热器件,通过冷板式换热器内的低温流体带走服务器中的芯片散热量。作为一种更高效的散热方式,在解决高功率芯片散热上有着得天独厚的优势,同时可满足数据中心的PUE降低到1.25以下的要求,成为智算中心的必然选择。 围绕散热能力、能效和数据中心场景适应性,冷板式液冷在架构上存在多种部署形态。一方面,随着单机柜功率密度的增加,为缓解风冷部分散热,逐渐提高液冷散热的占比,出现了风液混合散热解决方案。另一方面,随着单芯片功率密度的提升,对液冷部件的散热性能提出了更高的要求,冷板微通道强化散热、液态金属等高性能导热材料以及大通径的盲插快速互联技术等,为智算液冷解决方案提供更优异的散热条件。 二、术语和定义 下列术语和定义适用于本文件。 1)冷板式液冷系统cold plate liquid cooling system 由二次侧冷却系统、一次侧冷却系统、监控系统等组成。通过冷板将元器件的热量间接传递给封闭在循环管道中的冷却工质,通过一个或者多个冷却回路热交换传递,最终将设备热量排至室外的系统。 2)分集液器manifold 包含多路分支或接口,用于连接冷量分配单元与冷板的管道系统,为机柜内液冷冷板提供冷却工质分配及供回输送的装置。 3)二次侧管路secondary side pipeline 二次侧管路用于连接冷量分配单元CDU和液冷机柜,包含供液环管、回液环管及配套组件,分别形成闭合回路,实现连接二次侧设备和冷却工质的均匀分配。 4)冷量分配单元CDU coolant distribution unit 为冷却液提供循环动力,通过换热器将其热量传递至一次侧系统冷源,实现冷却介质的降温,服务于多台机柜的冷量分配单元。 5)水氟双冷源列间空调DualCooling Row 一种结合水冷与压缩机制冷双冷源系统的列间空调设备,通过两套冷源系统协同工作灵活运行,最大化利用自然冷源,实现高效节能。 6)解耦型液冷机柜Decoupling liquid cabinet 用于放置计算节点及交换节点,并提供节点运行所需的供电、冷却等环境条件的柜体。由机柜主体、分集液器、供电系统等组成,可按需配置盲插或快插型的供电和供冷单元。 7)一次侧冷却系统primary side cooling system 一次侧冷却系统是冷量分配单元(CDU)室外循环系统,其与外界环境之间进行热交换的循环系统。与外部冷却塔等外部散热设备相连,冷却工质在管路中循环将二次侧冷却系统内的热量传递至室外或余热回收装置的冷却系统。对于冷板式液冷设备,主要包含管道,冷却工质过滤系统,阀门、传感器等。 8)二次侧冷却系统secondary side cooling system 二次侧冷却系统是机柜与冷量分配单元之间进行热交换的循环系统。与服务器相连,冷却工质在管路内循环带出发热元件产生的热量,与一次侧冷却系统进行热交换的冷却系统。对于冷板式液冷设备,主要包含管道,冷却工质循环泵,换热器,冷却工质过滤系统,阀门、传感器等。 三、冷板式液冷系统介绍 1.冷板式液冷系统 液冷技术按照是否与发热的器件产生直接接触分为接触式和非接触式两种类型。接触式液冷中冷却液与发热器件可直接接触,具体实现方案主要包括浸没式液冷和喷淋式液冷,非接触式液冷技术的典型方案是冷板式液冷,技术路线对比见表1。上述三种液冷技术方案中,冷板式液冷技术是应用最早、普及率最高的液冷制冷方式,其可实施性和市场的成熟度也相对较高。 冷板式液冷主要通过冷板(铜、铝等高导热金属构成的封闭腔体)将元器件的热量间接传递给封闭在循环管道中的冷却液体,然后利用冷却液体将热量带走,其通过工作流体的传递特点将中间热量传输到后端进行冷却。 2.冷板式液冷系统特点 冷板式液冷系统包括二次侧冷却系统、一次侧冷却系统,如图1所示。适用于高密算力规模、智算形态和高功耗设备等场景,冷板式液冷系统具有高密度散热、高效能、高可靠性和强适用性等特点。 (1)高密散热、高效能:采用冷板式液冷系统可以实现机架功率密度的提高,有效提升单机架的计算能力,冷板式液冷系统相对风冷在能效方面具备高效能的特点。同时,通过进一步对液体、管理和设备冗余进行更为合理的设计和应用,液冷也将具有比风冷更高的散热可靠性,有效提高数据中心的能源利用率。 (2)高可靠性:冷板式液冷技术在冷却液管路中流动时,并未与主板和芯片模块进行直接的接触,材料兼容性较强,提高系统的运行安全性。此外,液体冷却芯片温度更低,可延长芯片寿命30%以上,降低因过热导致的硬件故障率。 (3)强适用性:冷板式液冷技术不改变服务器主板原有的形态,而是对现有服务器主板进行适配性改装来实现液冷散热。这种方式不仅拆卸简单、安装方便,而且在技术、产业以及规模化生产上具有更好的适用性。 3.冷板式液冷系统面临的挑战 3.1冷却液老化与管道腐蚀 随着时间的推移,冷却液可能会因为与系统中的材料发生化学反应、吸收空气中的杂质或受到微生物的污染而逐渐老化或变质。这不仅会降低冷却效果,还可能对系统中的管道、泵和其他部件造成腐蚀或堵塞,从而影响系统的稳定性。同时,冷却液的选择也需要考虑其化学稳定性和对设备的腐蚀性。 系统中的冷却液体在循环过程中可能会携带微小的颗粒或杂质,这些物质在管道或热交换器等部件中逐渐沉积,形成堵塞降低系统的冷却效率,甚至导致部件过热或损坏。 3.2泄漏风险 液冷系统中的管道、接头和密封件等部件在长期使用过程中可能会因为材料老化、振动或安装不当等原因出现泄漏。泄漏不仅会导致冷却液流失,还可能引发电气故障或设备损坏,这些问题一旦处理不当,不仅可能对设备造成损害,还可能引发安全事故。 3.3建设周期长 数据中心在建设冷板式液冷时涉及大量设备和工程管路,由于液冷设备生产加工工艺较为复杂,且二次侧冷却系统中液冷机柜的分液器和二次侧管路的洁净度要求较高,液冷系统的建设周期相比风冷系统要长。 液冷技术的初期成本相对较高,包括设备采购、安装、调试以及后期维护等费用。主要源于其复杂的系统设计、高端的制造材料以及精细的安装和维护要求。此外,液冷系统的运行和维护也需要专业的技术人员进行操作,这进一步增加了其运营成本。随着液冷技术的普及和应用,相关的生产技术和支持服务也将更加成熟和完善,这将有助于缩短建设周期及降低成本。 3.4运维要求高 液冷技术相较传统的风冷技术在运维方面存在一些挑战和难度。首先,液冷系统涉及的接口更多,这增加了故障点和潜在风险,需要运维人员具备更高的专业知识和技能,能够及时发