您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中国智能计算产业联盟]:国家“东数西算”工程下算力服务发展研究报告 - 发现报告

国家“东数西算”工程下算力服务发展研究报告

国家“东数西算”工程下算力服务发展研究报告

单志广张云泉何宝宏张广彬著 国家“东数西算”工程下算力服务发展研究报告编写委员会 顾问:陈润生陈国良郑纬民袁国兴 主编:单志广张云泉何宝宏张广彬 执行主编:安静王海峰 编委: 沈文海陈学斌方娟贾海鹅赖能和袁良李婧颖张延强戴或徐凌验舍日古王丹丹赵浩鸿陈棚刘殿宋心荣涂菲菲张翼张广婷 特别鸣谢: 清华大学益企研究院 参编单位: 国家信息中心信通院云大所中科院计算所清华大学国家气象中心 目录 CONTENTS P5第一章算力服务在算力经济中的定位 P6一、算力经济成为新一轮经济发展抓手P6二、算力服务形成分析P9三、算力服务与云计算服务的区别 P13第二章算力服务发展的主要挑战 P14“东数西算”背景下的新挑战P17二、算力网络的智能调度P18三、算力服务复合型人才系统构建P20四、算力服务标准确保产业健康发展 P21第三章算力服务产业链可持续发展路径 P22一、算力服务产业链商业模型P23二、多样性算力技术创新发展路径P25三、大模型时代的算力服务演进P29四、构建软硬协同的高性能、安全的公共算力设施P31五、先进制冷技术演进发展P35六、算力网络优化算力布局P40七、算力网络不同路线实践 P43第四章面向2030年算力服务展望 P44一、算力服务的综合价值展望P46二、算力服务促进算网深度融合带来算力服务变局 CHAPTERT 算力服务在算力经济中的定位 第一章算力服务在算力经济中的定位 一、算力经济成为新一轮经济发展抓手 算力作为最为重要的生产力之一,已逐步成为和水、电、燃气一样的基础资源。特别是ChatGPT的爆火出圈,以大算力、大模型、大数据为核心的生成式人工智能(GAI)引发全社会广泛关注,极大地拉动了对算力的需求,进一步“引爆了算力服务市场。 2018年,张云泉博士正式提出算力经济这个名词,最初定义的维度是比较简单的。首先计算要成为算力经济的核心,未来,以计算能力来衡量一个地方或地区的数字经济发展水平,使之成为一个很重要的指标。“东数西算"世纪工程的发布正式开启了算力经济时代,一个地区的算力产业是不是发达,也意味着数学经济是不是有机会,算力经济也成为西部地区新一轮经济发展的强力抓手。狭义的算力经济是指与算力强关联的算力服务产业链,包括算力设施提供者、算力生产者、算力运营者、算力消费者等4类参与者。他们共同闭环成为一种商业模式。随着认识的深化,“算力经济的内涵日益丰富、深化和拓展,即算力+。凡是可以用到算力的国民经济的各个方向单元,都是算力经济的范围。只要以算力为核心生产要素,以算力为引擎,就都是广义的算力经济。算力经济逐步成为数字经济的重要组成部分,并在数字经济中的比重会越来越大。综上所述,围绕算力本身产生的算力服务产业,狭义的算力经济指算力服务业产业链:广义的算力经济为数字产业化、产业数字化、城镇数字化提供各种基础设施、支撑保障的新模式、新业态,也就是算力+产业。 二、算力服务形成分析 狭义的算力经济是指与算力强关联的算力服务产业链,包括算力设施提供者、算力生产者、算力运营者、算力消费者等4类参与者。他们共同团环成为一种商业模式。随着认识的深化,“算力经济”的内涵日益丰富、深化和拓展,即算力+。 中国高性能计算机TOP100排行榜已经发布了20多年,行业一直通过排行榜观察中国超级计算产业的发展趋势。到2021年,在TOP100的前10名有7台机器,它们不是专门服务某些行业,而且这些机器没有具体的应用目标,是公司买过来之后专门用于售卖算力的,而且这些机器性能很强。面对这个新出现的状况,TOP10O的专家委员定义了一个新领域叫算力服务业。2022年,算力服务的性能指标相比上一年已经翻倍,增长速度很快。 算力服务是以云资源接入和一体化调度机制为基础,以算力网络为连接,以云计算、人工智能、大数据等技术为支撑,将异构算力统一输出管理,为用户提供通用算力、智能算力、超算算力等多样算力资源和存储资源,以及算力发现、供需摄合、交易购买、智能调度等综合服务,本质上是算力的供给方式。随着算力服务的不断演进发展,呈现“四化特征: 一是便捷普惠华。用户不必关注复杂的底层技术和庞大的架构,无需购买服务器,即可“随时、随地、随需享受便捷的一站式服务,实现算力资源人人可得、人人可用、人人适用。 二是智能泛在化。运用虚拟化、容器化等技术,将大规模、异构算力转化为标准化算力单元,通过适应性策略和敏捷性框架对算力资源进行精准匹配,满足敏捷开发、快速部署需求。 三是灵活定制化。以弹性方式灵活调度算力资源,并结合不同用户的便用场景和使用需求提供个性化的服务方案。 四是安全可信化。一方面,通过对算力提供方的资质核验及可信度评估,从源头上保证算力资源的安全可信。另一方面,通过对算力使用过程的监管,保证算力使用的全程流程可追溯。 研究表明,国家计算力指数与GDP的走势呈现出显著的正相关,计算力指数每提高1%,数字经济和GDP分别增长3.5%和1.8%。,而且该趋势预计将继续保持到2025年。全球算力竞争日益百热化,算力服务正在成为数学经济发展的新引擎和各国战略博奔的关键要素。从全球看,算力总规模保持高速稳定增长,2021年全球计算设备算力总规模达到615EFlopS,增速达到44%,预计2030年全球算力规模达到56ZFlops2。全球主要国家和地区加大算力布局,美国不断加强量子计算、超级计算、类脑计算等前沿算力布局,力保人工智能等关键领域的全球领导地位;欧盟持续加码算力基础设施建设和关键技术研发投入,陆续发布《塑造欧洲的数字未来》、《2030数字罗盘》、《欧洲工业战略》等,推动构建安全、高性能和可持续的数字基础设施,助力企业数字化转型:日本坚持以应用和绿色并重,制定人工智能(AI)及量子技术等尖端技未相美的国家战略,开频紧强调振兴半导体产业。从我国看,国家对算力服务的重视程度不断提开,国家发展改革委、中央网信办、工业和信息化部、国家能源局四部委先后联合印发《关于加快构建全国一体化大数据中心协同创新体系的指导意见》《全国一体化大数据中心协司创新体系算力枢纽实施方案》,推动汇聚联通政府和社会化算力资源,构建一体化算力服务体系。在客类政策举措的强力加持下,我国算力服务发展成效显著,梯次优化的算力供给体系初步构建。数据显示,近年来我国算力产业规模持续快速增长,年增长率近30%。截至2022年底,我国算力总规模达到18OEFLOPS,居全球第二3。电信运营商、地方政府、企业、行业机构等纷纷推出算力服务平台,已发布或建设算力平台超10个,旨在通过整合不同来源、类型和架构的算力资源,提供算力支撑服务。 三、算力服务与云计算服务的区别 算力服务是云计算服务的升级版,除了要提供虚拟化、分布式计算等云计算服务外,还包括算力调度、云网融合、供需匹配等新要求。为了更好理解两者的区别,下面从云计算和算力服务的发展背景和历程进行说明。 从单机计算到云计算。云计算将计算能力(指广义的数据存储和处理能力)抽象化,通过互联网向用户提供服务,用户在云计算平台上按需购买、使用和管理各种计算资源,而无需关心其背后的复杂实现细节。在云计算出现前,从用户的角度常存在以下痛点。一是扩容难,企业(或个人)用户自行购置运维的数字基础设施在扩容算力时,从评估、规划到实施、调试需要较长时间周期,往往以周或月计,难以及时匹配快速变化的业务需求。二是利用率有限,因扩容难,用户在应对快速变化的业务需求时通常采用留足算力亢余“的方式,以增加投入换减少扩容次数,这也造成了算力闲置现象。此外,若用户业务收缩,自行购置运维的算力难以缩容,将进一步加剧算力闲置。三是需要专业技术团队负责运维。随着企业应用需求日趋复杂,企业的数字基础设施的架构也变得复杂,为维护数字基础设施正常运行,企业需要扩大运维团队的规模和提高技术水平,提高了企业运营的人力成本。云计算以其可按需扩容、按便用计费、由服务商团队提供专业运维的特点,一定程度上解决了上述痛点。 从云计算到算力网络。随署5G与人工智能时代的发展,各类新型应用不断涌现,数据产生量呈爆发式增长,智能计算被广泛应用于工业、零售、医疗、教育等行业领域,带 “一体化算力服务”由中科曙光率先提出,该服务集“算力”“算能”“算网“三方面于一体。“计算优先网络由华为提出,“算力感知网络”由中国移动提出,“算力网络由中国电信、中国联通倡导,CCSATC3会议将三者统一为“算力网络”。 来算力需求的几何级数级增长,并对算力的实时性、可靠性、安全性等提出更高要求。当前以数据中心为单元的云计算组织方式已逐渐无法为社会发展提供丰沛的、高质量的算力供给。一是无法有效组织边缘计算节点。二是各数据中心、智算中心、超算中心等云计算中心间无法有效协同。三是云计算中心和网络间缺乏协同,难以保证算力传输的实时性和可靠性。 在此背景下,算力网络应运而生。算力网络旨在通过泛在算力与网络的融合,突破数据中心、超算中心、云计算、边缘计算等“孤岛“状态下的计算能力限制,将大量散落在全网中的各类型算力(通用计算、智算、超算等)汇聚成统一的计算资源池,进行管理和调度。算力网络以构建算网一体的新型智能、高效、按需的算力服务体系网络为目标,实现算力和连接的全局优化与高效协同,解决不同类型节点的算力分配与资源共享需求难题,形成CPaaS(算力即服务,ComputingPowerasaService),满足国家与行业需要,促进我国数字经济的发展。“计算优先网络”、“算力感知网络"与“算力网络是在算力网络的标准化研究制定过程中,不同时期由不同企业提出和倡导的概念。 “一体化算力服务”由中科曙光率先提出,该服务集“算力“算能”“算网”三方面于一体。“计国联通倡导,CCSATC3会议将三者统一为"算力网络”。 从云网融合走向算网一体。从算力网络的建设自标与技术发展理念来看,算力网络是通信、计算、存储以及智能化调度的高度融合。算力网络以泛在算力资源为基础,网络通信为纽带,智能化调度为核心,实现网、云、边、端、业务的高效协同与适配,满足行业高差异化算力服务需求。云网融合和算网一体是实现此自标的两个相辅相成的 发展阶段。对于云网融合,网络是以云为中心的。从云的视角看,一云多网对网络的主要需求是连通性、开放性,对服务质量的要求是尽力而为,网络起到支撑作用,云作为算力提供侧是价值中心。对于算网一体,网络是以用户为中心的。从用户的视角看,需要网络支持低时延、安全可信通信,对服务的质量要求是确定性,作为算力提供测的云和作为算力运输侧、用户需求感知测的网络共同成为价值中心。最终,算力网络的建设将统一融合算力与网络,同时突破算力与传统网络的技术限制,构建“统一调度、弹性适配的算力网络平台,形成端到端业务开通以及可视、可管、可控能力,实现全国范围内跨越组织、业务、运维、运营、应用的全局规划以及算力的高效协同调度与应用,为我国数字经济打下坚实的算力基础。 CHAPTER2 算力服务发展的主要挑战 第二章算力服务发展的主要挑战 一、“东数西算”背景下的新挑战 随着“东数西算工程的实施,算力基础设施建设迎来快速发展机遇的同时,也对算力服务提出了更高的要求。当前,在以数据中心为主要载体、跨区域算力需求不断增长的背景下,算力服务仍面临资源使用效率不高、场景实现成本不菲、网络时延传输不畅、供需匹配不力、体系安全布局不密等现实挑战。 资源使用效率不高。当前,数据中心建设规模迅速扩大,国内市场供大于求、同质化竞争问题突出,存在盲目投资和经营风险。预计到2025年国内IDC机架将是现在3倍。西部6省市(宁夏、甘萧、内蒙古、贵州、四川和重庆)规划远超预期,2025年机架有望增至362万架(5年增长9倍),全国占比达到41%(5年提升30pp)4。但与此并存的是现有数据中心资源利用不充分。一方面,国内现有数据中心存在"重建轻用现象,造成了数据中心资源的浪费。《2021年中国数据中心市场报告》显示,自前全国数据中心整体上架率仅为50.1%。以上海为例,据《2020-2021年上海及周