AI智能总结
编写单位河南昆仑技术有限公司中移动信息技术有限公司北京幻视摩方科技有限公司沐曦集成电路(上海)股份有限公司上海燧原科技股份有限公司中航光电科技股份有限公司软通计算机有限公司编写组成员杨金谕、张春、高从文、李圣义、单彤、丁俊峰、熊星、曹昉、张勇、王成龙、于超琪、张丙库、卢超、赵杨、梅敬青、蔡艳召、蒋正顺、李进宝、李亚军版权声明本研究报告版权属于全球计算联盟。使用说明:未经全球计算联盟事先的书面授权,不得以任何方式复制、抄袭、影印、翻泽本文档的任何部分。凡转载或引用本文的观点、数据,请注明“来源:全球计算联盟”。 1 序近年来,随着人工智能技术的迅猛发展和数字化转型的深入推进,全球对高性能算力的需求持续增大。特别是在AI训练和推理任务中,高密度计算集群的功耗需求日益攀升,传统的数据中心散热方案面临着严峻挑战。在此背景下,液冷技术作为一种高效、节能的散热解决方案,正在加速改变数据中心的技术架构和产业格局。本报告引用和发扬了来自全球计算领域的众多专家学者、技术领军者、优秀企业的经验总结和著作,深入探讨液冷整机柜设计、液冷智算中心架构优化及多算力兼容等关键技术,并提出了一套开放、灵活且高效的液冷智算架构解决方案。该方案兼顾技术创新和工程实践,在提升计算密度的同时有效降低了能耗,为数据中心的绿色化转型提供了有力的技术支撑。从政策层面来看,近年来国家持续加大新基建投入力度,明确提出要建设绿色低碳、高效节能的数据中心。相关部门出台了一系列指导性文件:到2025年,全国新建大型、超大型数据中心的电能利用效率(PUE)需控制在1.3以下,而重点区域如东数西算国家枢纽节点的PUE更是要求低于1.25。这些政策导向使得传统风冷式数据中心难以兼顾节能与提高上架率的双重目标,从而加速了液冷技术的应用普及。从市场发展来看,中国液冷数据中心市场规模持续增长。据统计,截至2024年,中国液冷数据中心市场规模已突破150亿元大关,年均增长率维持在35%以上。与此同时,液冷技术的标准化进程加速推进,相关组件的成本显著下降,为大规模商业化部署奠定了坚实基础。值得关注的是,在算力需求持续增长的同时,芯片技术的快速发展带来了新的散热挑战:现代CPU和GPU 1 2的热设计功耗(TDP)不断提升,传统风冷数据中心在应对高密度、高功耗计算集群时已显得捉襟见肘。从硬件形态演进来看,传统的AI产品与架构已不能完全满足新的AI集群的需求。随着计算密度的提升,采用低延迟、高带宽互联架构的AI集群因其性能优势而被广泛采用。然而,在液冷整机柜的设计与部署过程中,不同厂家的技术方案缺乏统一标准,这给终端用户的系统选型、设备部署及运维管理带来了诸多挑战。在技术发展层面,尽管面临诸多挑战,业界已在OAI(开放加速器接口)和UBB(OCP通用基板)等标准化方面取得了显著进展。特别是超节点整机柜架构设计日益受到关注,这一创新方案通过支持更多AI加速器的高速互联,为构建更高密度、更高效能的计算集群提供了新的技术方向。我们期望通过本报告的发布,能够进一步促进行业内各方的深度交流与协同创新,共同推动液冷智算中心技术的发展与应用推广,为构建高效、绿色、智能的未来计算环境贡献智慧和力量。全球计算联盟开放液冷专业委员会2025年4月 3目录智算中心液冷整机柜服务器...........................................................................................................1开放架构多样化算力兼容研究报告...............................................................................................1序......................................................................................................................................................1第一章背景与挑战.........................................................................................................................5第二章产业关键技术与创新动态.................................................................................................72.1液冷散热技术....................................................................................................................72.2智算软硬件技术................................................................................................................8第三章液冷智算开放、多算力兼容架构概述...........................................................................103.1系统架构..........................................................................................................................103.2硬件架构..........................................................................................................................113.3散热架构..........................................................................................................................123.4供电系统..........................................................................................................................183.5网络架构..........................................................................................................................213.6管理架构..........................................................................................................................24第四章智算液冷整机柜服务器...................................................................................................264.1机柜子系统......................................................................................................................264.2服务器节点......................................................................................................................274.3交换节点..........................................................................................................................284.4管理模块..........................................................................................................................294.5电源..................................................................................................................................30第五章智能运维管理...................................................................................................................32 45.1管理系统..........................................................................................................................325.2BMC软件适配................................................................................................................34第六章应用场景及案例...............................................................................................................356.1应场场景..........................................................................................................................356.2案例:超聚变FusionPoD for AI整机柜液冷服务器助力运营商打造高效、可靠、绿色的智算中心.....................................................................................................................35第七章结论与展望.......................................................................................................................37 第一章背景与挑战近年来,中国液冷数据中心市场展现出强劲的发展态势,以超过30%的年增速迅猛扩张。在此过程中,液冷组件的标准化进程不断加速,成本也随之显著下降。2022年,液冷数据中心市场规模成功突破百亿大关,达到100.5亿元,与上一年相比,同比增长率高达47.2%,凸显出市场的蓬勃活力。在芯片技术领域,先进制程的投资呈现出爆发式增长,然而上市节奏