AI智能总结
编写单位中移动信息技术有限公司中国电信研究院京东云计算有限公司中国移动通信集团设计院有限公司华为技术有限公司超聚变数字技术有限公司中国质量认证中心有限公司张家港迪克汽车化学品有限公司中国石油天然气股份有限公司润滑油分公司中国石化北京研究院 编写组成员李圣义、杨金谕、周冬冬、张春、高从文、石莹、王贵林、许轶、单猛、李鹏、张凯蛟、金跃红、叶向阳、陈凯 版权声明 本研究报告版权属于全球计算联盟。 使用说明:未经全球计算联盟事先的书面授权,不得以任何方式复制、抄袭、影印、翻泽本文档的任何部分。凡转载或引用本文的观点、数据,请注明“来源:全球计算联盟” 目录 第一章行业背景与技术概况............................................................................................11.1政策驱动与液冷技术.........................................................................................11.2液冷系统防漏液和漏液检测技术........................................................................1第二章系统化设计原则和分级........................................................................................3第三章防漏液设计规范...................................................................................................3第四章漏液防护设计规范...............................................................................................34.1液冷节点漏液防护..............................................................................................44.2液冷机柜漏液防护..............................................................................................64.3CDU漏液防护......................................................................................................84.4液冷环路漏液防护..............................................................................................8第五章漏液检测设计规范...............................................................................................95.1水浸绳漏液检测..................................................................................................95.2传感器漏液检测................................................................................................105.3服务器冷却液流量监测设计..............................................................................11第六章漏液告警和后处理设计规范告警........................................................................116.1告警信号...........................................................................................................116.2漏液告警上传协议及具体命令要求.....................................................................12第七章建议与展望........................................................................................................197.1应场场景...........................................................................................................197.2案例:超聚变FusionPoDforAI整机柜液冷服务器............................................19第八章结论与展望........................................................................................................22 第一章行业背景与技术概况 1.1政策驱动与液冷技术 1.1.1政策 国 家 对 数 据 中 心 绿 色 低 碳 发 展 的 重 视 促 使 行 业 不 断 寻 求 降 低PUE(Power UsageEffectiveness,能源使用效率)的解决方案。随着芯片技术的进步,单芯片算力密度急剧增加,传统风冷散热的效率和能力达到瓶颈,不仅难以有效控制设备温度,还消耗大量电能。在这样的背景下,液冷技术作为一种高效、节能的散热方式,得到了广泛关注和应用。 1.1.2液冷技术发展现状 液冷服务器及液冷机柜在运营商、互联网等行业的试点应用取得了一定成效,多个服务器厂商积极投入液冷产品的研发和推广。根据IDC数据,中国液冷服务器市场在2024上半年继续保持快速增长,市场规模达到12.6亿美元,与2023年同期相比增长98.3%,其中液冷解决方案仍以冷板式为主,占到95%以上,预计2028年市场规模将达到102亿美元。 冷板式液冷系统主要由液冷机柜和服务器、分集水器、供回歧管、冷量分配单元及制冷设备等组成。冷却液通过循环管路流经冷板,与服务器内的发热元件进行热交换,将热量带走,从而实现对服务器的散热。冷板式液冷系统工作原理如图1-1所示。 冷板液冷系统作为一种成熟的液冷解决方案,具有散热效率高、可靠性强等优点,但漏液问题是其应用过程中需要重点解决的关键问题。 1.2液冷系统防漏液和漏液检测技术 1.2.1防漏液和漏液检测的重要性 防漏液和漏液检测对于液冷系统的可靠性和安全性至关重要。在数据中心等对设备运行稳定性要求极高的场景中,液冷系统一旦发生漏液,冷却液可能会渗入服务器、存储设备等核心硬件,导致精密电子元件短路、腐蚀,进而引发设备故障甚至系统瘫痪,造成不可估量的经济损失和业务中断风险。正因如此,液冷系统设计上防漏液显得尤为关键,它通过优化管路连接结构、采用高品质密封材料等方式,从源头上降低漏液概率,为系统稳定运行构筑起第一道防线。 而漏液检测则是第二道“安全闸门”,通过实时监测和精准定位漏液位置,能够及时发现并处理漏液问题,避免因液体泄漏导致的设备损坏、短路、腐蚀等故障,减少系统停机时间和维修成本。同时,冷却液若含有化学物质,泄漏后可能污染土壤、水源,防漏液和漏液检测也能防止冷却液泄漏对环境造成污染,保障数据中心的稳定运行。此外,推动防漏液和漏液检测设计规范的标准化,可以提高液冷系统的运维可靠性,促进液冷技术在更多行业的规模化应用,助力数据中心行业向更高效、更安全的方向发展。 1.2.2防漏液和漏液检测的技术概况 在防漏液技术上,各厂商方法不同。例如部分厂商为冷板式液冷系统优化流道,选用优质密封材料;有的在液冷机柜采用密封胶条与压力平衡设计;还有的对液冷服务器加强部件密封、提升结构稳固性。 漏液检测技术方面,各厂商也各有侧重。有的厂商运用基于传感器的检测,借液体、压力传感器察觉冷却液泄漏信号;有的利用基于视觉的检测,依靠摄像头或荧光剂定位漏液;还有的通过基于声学的检测,凭借超声波、声音传感器分析漏液声音。 因缺乏统一标准,不同厂商产品在兼容性、通用性上存在不足,这不仅提高了数据中心 等用户的部署与维护难度,也限制了液冷技术规模化推广。亟需行业共同努力,制定统一标准,促进技术的规范发展,提升整体性能与安全性。 第二章系统化设计原则和分级 冷板式液冷系统的防漏液和漏液检测应采用系统化设计思维,将可靠性理念贯穿于整个液冷系统的全生命周期。 系统化设计原则:预防为主,防治结合。首先通过优化设计,最大程度保障系统的高可靠性,从源头上防漏液;其次解决漏液后怎么办的,从影响轻重依次保证不扩散、不烧机、不宕机。 应针对不同类型设备,分别开展漏液防护设计、漏液检测设计以及告警后处理设计。通过这种差异化、精细化的设计策略,既能确保系统的安全性,又能兼顾成本效益。具体而言,可依据设备的重要性和漏液影响程度进行分级管理: A类:液冷节点。包括液冷服务器、液冷交换机等,作为数据中心的核心算力单元,直接关系到业务的连续性和数据的安全性。应有漏液防护、漏液检测和漏液告警后处理。 B类:液冷机柜。作为承载液冷节点的基础设施,应有漏液防护、漏液检测。 C类:CDU和液冷环路。作为液冷系统的“动力心脏”和“血液循环系统”,应有漏液防护,降低漏液风险,保障液冷系统的稳定运行。 第三章防漏液设计规范 液冷系统防漏液设计应采用高可靠、高强度、耐腐蚀的冷板组件和液冷部件,满足材料和工质的兼容性。 液冷系统使用的与工质液体接触的材料均满足工质兼容性要求,包括金属材料、非金属材料等,能够承受冷却液的长期浸泡而不发生渗漏,并严格按照相关标准进行选择和测试。 第四章漏液防护设计规范 液冷节点、液冷机柜、CDU和液冷环路等设备都应有漏液防护设计,各设备的详细设计规范如下。 4.1液冷节点漏液防护 4.1.1冷板与服务器连接部位密封设计 冷板与服务器的连接部位应采用密封性能良好的连接方式,如螺栓连接、卡扣连接等。连接部位应使用密封胶进行密封,密封胶应具有良好的耐水性、耐腐蚀性和粘结强度,其邵氏硬度应在40-60之间。 冷板与服务器的接触面应平整、清洁,无油污、杂质等,以确保密封效果。在安装冷板时,应按照规定的扭矩拧紧螺栓或卡扣,确保连接紧密。 4.1.2节点内物理隔离 物料隔离实现液体扩散方向,具体由防水泡棉挡墙+无孔底板+底部拆边排水组成。如图4-1所示。 4.1.3导流集液 冷板导流集液设计,如图4-2所示。 节点背部导流设计,如图4-3所示。 4.1.4软管保护 管增加外层硅胶套管保护:保护软管不被外部刮伤漏液;防止软件泄露后的喷射,扩大故障半径。如图4-4所示。 4.2液冷机柜漏液防护 4.2.1柜级水电分离 机柜上走电下走水实现水电分离,如图4-5所示。 4.2.2液冷门(风液热换器)导流集液 液冷门下部应设计导流集液,减少漏液扩散,如图4-6所示。 4.2.3分集水器设计 分集水器应设计合理的内部结构,确保冷却液在分配和回收过程中无泄