AI智能总结
东数西算算网协同调度业务场景白皮书 版权声明● 本白皮书版权属于紫金山实验室及其合作单位所有并受法律保护,任何个人或是组织在转载、摘编或以其他方式引用本白皮书中的文字、数据、图片或者观点时,应注明“来源:紫金山实验室等”。否则将可能违反中国有关知识产权的相关法律和法规,对此紫金山实验室有权追究侵权者的相关法律责任。 编写说明 主要编写单位:● 紫金山实验室、江苏未来网络集团有限公司、江苏省未来网络创新研究院 国家信息中心大数据发展部 参与编写单位(拼音序): 安徽提尔液冷科技有限公司、北京北方算力智联科技有限责任公司、北京积算科技有限公司、北京趋动智能科技有限公司、成都交投信息科技有限公司、赣州市数字产业集团有限公司、广东华韶数智科技有限公司、贵州南智云谷数字产业发展有限公司、贵州省算力科技有限责任公司、贵州师范大学(未来网络贵州省院士创新团队工作站)、贵州算家计算服务有限公司、合肥城市云数据中心股份有限公司、湖南城市云智数科技有限公司、昆仑芯(北京)科技有限公司、南京中科逆熵科技有限公司、宁夏西云算力科技有限公司、宁夏中卫市新型互联网交换中心有限责任公司、派欧云计算(上海)有限公司、庆阳云创智慧大数据有限公司、四川省算云科技有限责任公司、苏州国科综合数据中心有限公司、算力互联(北京)科技有限公司、曙光信息产业股份有限公司、天津大学、武汉优普拉斯通信有限公司、西安特发千喜网络信息产业发展有限公司、银川中创普惠互联网科技有限公司、鹰硕(韶关)信息产业集团有限公司、宇耀未来(南京)科技有限公司、中航信云数据有限公司 主要编写人员: 罗曙晖、张晨、孙婵娟、张玉军、潘凤薇、周俊、芮美芳、陆明明、高新平、李屹、陈晓波、赵芷晴、梁木 前言 2023年底《关于深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》(简称意见)发布后,全国一体化算力网的建设浩荡展开。《意见》中多次提及“算网协同”,明确指出“加快算网协同编排调度技术部署应用”、“探索算网协同运营机制”。 实际上,自2019年业界相关研究起步,“算力网”、“算力网络”、“算力互联网”等概念层出不穷,“算网协同”、“算网融合”、“算网一体●”等路线众说纷纭。为科学推进全国一体化算力网、有效实践算网协同,务须明确“算力网”和“算网协同”的内涵。 2025年4月,《全国一体化算力网监测调度平台建设指南》(简称指南)正式公开征求意见,对算力网的内涵进行了阐述,从顶层设计来看,算力网不是对于多方传统云计算平台进行简单的封装与转售:使用方式,将从传统的“买算/租算”转为“用算”;渠道特征,将从传统的“互联网自选下单订购”转为“算力网动态调度消纳”;网络连接,可基于互联网或专用网络,专用网络相比于互联网可实现更好的服务质量保障。可以看到,算力网是一种新型的服务模式,是一种包含了网络、算力、平台的服务能力集合,而算力网络应属于算力网中的一种专用网络,算力互联网应属于一种基于互联网的算力网形态。 《指南》中的这些顶层设计,在底层逻辑上牵引了“全国一体化算力网”中“算网协同”的实践方向。当使用方式将从“买算/租算”转为“用算”、渠道特征从“互联网自选下单订购”转为“算力网动态调度消纳”,意味着算力资源将从传统的“虚拟机/裸金属”逐步转 为“容器/作业”,并提供“最优匹配、按需启停、精准计量、效用付费”的任务式计算服务。任务式计算服务的时间特征具有“临时性”、空间特征具有“跳跃性”、流量特征具有“突变性”,即平时不用时任务不存在只有用时才临时启动任务,本次启动在A地X供应方而下次可能启动在B地Y供应方,平时不用时流量为0而用时流量会随计算服务负载大幅波动。那么,传输服务如何能够满足并匹配任务式计算服务的临时性、跳跃性、突变性?这必然要求网络资源的可调度。在互联网不具备调度能力的情况下●,如何通过专用网络更好地匹配任务式计算服务的特征与需求?这就是算力网中算网协同的实践方向。进一步地,如何将这种实践能够构建在跨东西部区域的广域网络之上,就是面向东数西算的算网协同。 《东数西算算网协同调度-业务场景白皮书》(简称白皮书)的编制,是基于国家东数西算“安全新总线”项目所开展的算网协同工程实践。“安全新总线”通过400Gbps互联了国家八大枢纽节点、以及多个国家超算中心,可根据任务时延、带宽需求提供广域确定性网络传输质量,并通过网络操作系统开放网络资源的调度能力,算网协同调度平台即原生构建其上。 白皮书以业务场景视角切入,对东数西算算网协同调度的调度架构、应用场景、生态模式等进行了深入的分析论述。希望能够通过本白皮书,为业界树立面向东数西算的算网协同调度范式,为国家东数西算与全国一体化算力网的规模落地提供未来网络实践经验。 目录 V目录.................................................................................................... V一、“东数西算”概述...............................................................................11.1背景.................................................................................................. 11.2目标及意义...................................................................................... 11.3发展历程及现状.............................................................................. 21.4●本文内容结构.................................................................................. 2二、整体架构.............................................................................................3三、调度架构.............................................................................................43.1总分调度架构.................................................................................. 53.2分总调度架构.................................................................................. 83.3混合调度架构................................................................................ 14四、应用场景...........................................................................................194.1东数西算场景................................................................................ 194.2数据快递场景................................................................................294.3东数西存场景................................................................................ 354.4协同训练场景................................................................................ 444.5协同推理场景................................................................................ 664.6西训东推场景................................................................................ 79五、生态模式.........................................................................................102 5.1边云一体模式.............................................................................. 1025.2云算分离模式..............................................................................1045.3边缘共享模式.............................................................................. 106六、商业价值与前景展望.....................................................................108 一、“东数西算”概述 1.1背景 随着数字经济的迅猛发展,数据量呈爆发式增长,对算力的需求也日益迫切。然而,我国东部地区经济发达,数据需求旺盛,但面临土地●、能源等资源紧张的问题,算力供给受限;而西部地区资源丰富,具备发展数据中心的天然优势,但数据需求相对不足。在此背景下,我国“东数西算”工程应运而生。“东数西算”就是将东部地区产生的数据传输到西部地区进行计算和存储,促进东西部算力协同联动。 1.2目标及意义 目标:通过“东数西算”工程,在全国范围内规划建设多个国家级算力枢纽节点和大数据中心集群,形成布局合理、绿色集约的算力基础设施体系。实现算力的规模化、集约化发展,提升算力使用效率,降低算力使用成本,推动算力资源的高效配置。 意义:从经济角度看“东数西算”工程带动了数据中心建设、网络通信、IT设备制造、软件等相关产业的发展,促进了产业结构优化升级,为经济增长注入新动力。在资源利用方面,充分发挥了西部地区的能源优势,提高了能源利用效率,实现了东西部资源的优势互补。同时,有助于缩小东西部数字经济发展差距,推动区域协调发展,提升我国整体数字经济竞争力,为数字中国建设提供坚实支撑。 1.3发展历程及现状 2021年,国家发展改革委、中央网信办、工业和信息化部、国家能源局联合印发《全国一体化大数据中心协同创新体系算力枢纽实施方案》,为“东数西算”工程奠定了政策基础。 2022年2月,国家正式全面启动“东数西算”工程,在京津冀、长三角●、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏等8地启动建设国家算力枢纽节点,并规划10个国家数据中心集群。截至目前,各枢纽节点和数据中心集群建设稳步推进,算力规模不断扩大,网络传输能力逐步提升,初步形成了全国一体化算力网的基本框架。 2023年底,国家发改委、数据局、网信办、工信部等多部委联合印发《关于深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》,明确了全国一体化算力网的指导思想、基本原则和建设目标。《意见》多次提及