您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[ODCC]:2023中国算力调度发展研究蓝皮书 - 发现报告

2023中国算力调度发展研究蓝皮书

信息技术2023-12-20ODCCH***
2023中国算力调度发展研究蓝皮书

版权声明 ODCC(开放数据中心委员会)发布的各项成果,受《著作权法》保护,编制单位共同享有著作权。 转载、摘编或利用其它方式使用ODCC成果中的文字或者观点的,应注明来源:“开放数据中心委员会ODCC”。 对于未经著作权人书面同意而实施的剽窃、复制、修改、销售、改编、汇编和翻译出版等侵权行为,ODCC及有关单位将追究其法律责任,感谢各单位的配合与支持。 编写组 项目经理: 前言 2023年2月,中共中央、国务院印发了《数字中国建设整体布局规划》(以下简称《规划》),明确了“2522”的整体框架。其中,特别提到:“系统优化算力基础设施布局,促进东西部算力高效互补和协同联动,引导通用数据中心、超算中心、智能计算中心、边缘数据中心等合理梯次布局。”东西部算力高效互补和协同联动的实现离不开算力调度。近年来,《关于加快构建全国一体化大数据中心协同创新体系的指导意见》、《全国一体化大数据中心协同创新体系算力枢纽实施方案》、《新型数据中心发展三年行动计划(2021-2023年)》等文件明确了算力调度的重要意义,国家东数西算工程的推进和实施更是离不开算力调度。 为梳理当前算力调度的概念、技术和应用现状,中国信通院云大所数据中心团队联合上海电信基于前期研究成果编制了《中国算力调度发展研究蓝皮书(2023年)》。本蓝皮书聚焦了算力调度技术的最新研究进展,分析了目前现有的算力调度技术,对比国内各厂商算力调度平台应用情况,从而更好地指导和建议业界判断行业发展趋势,为未来算力调度发展提供思路。 如对蓝皮书有建议或意见,请联系:dceco@caict.ac.cn。 目录 版权声明...........................................................I编写组............................................................II前言...........................................................III (一)算力与异构算力......................................................................................1(二)算力网络与算网融合..............................................................................1(三)算力调度..................................................................................................2 二、算力调度技术研究.............................................................................................3 (一)跨区域算力调度技术..............................................................................3(二)闲置算力调度技术..................................................................................41.闲置算力的调度方法...............................................................................42.集群调度器的分类...................................................................................5(三)超算算力调度技术..................................................................................81.算力调度平台架构...................................................................................82.超算中心主流HPC调度器.......................................................................9(四)边缘算力调度技术................................................................................101.调度技术与算法现状.............................................................................102.边缘算力调度技术架构.........................................................................113.典型应用场景.........................................................................................12 (一)中国联通算力调度平台........................................................................131.算网一体化编排调度平台.....................................................................13 2.天穹算力运营调度平台.........................................................................143.中国联通边缘计算平台.........................................................................15(二)中国电信算力调度平台........................................................................161.甘肃省算力调度平台.............................................................................162.“息壤”算力分发网络平台.................................................................18(三)中国移动混合算力感知调度AI平台..................................................20(四)中科曙光一体化算力交易调度平台....................................................21(五)华为公共多样性算力服务平台............................................................22(六)浪潮AI计算系统及推理平台..............................................................24(七)北鲲云一站式云超算平台....................................................................25(八)趋动云AI平台......................................................................................26四、异构计算调度系统分析...................................................................................27(一)典型异构计算平台................................................................................271.阿里云震旦异构计算平台.....................................................................272.百度百舸AI异构计算平台...................................................................283.FPGA异构计算平台................................................................................29(二)异构AI算力操作平台..........................................................................301.操作平台定义.........................................................................................302.技术架构.................................................................................................31(三)异构计算调度技术................................................................................321.分布式异构计算调度技术.....................................................................322.面向FaaS的算网异构算力调度技术...................................................33五、总结...................................................................................................................34 中国算力调度发展研究蓝皮书 一、算力调度概述 (一)算力与异构算力 算力是服务器通过对数据进行处理后实现结果输出的一种能力,最常用的计量单位是每秒执行的浮点运算次数(FLOPS)。算力主要包括通用算力、智能算力、超算算力、边缘算力四类。其中通用算力以CPU芯片输出的计算能力为主;智能算力以GPU、FPGA、AI芯片等输出的人工智能计算能力为主;超算算力主要以超级计算机输出的计算能力为主;而边缘算力主要以就近为用户提供的实时计算能力为主,是以上三种算力形式的组合。 异构算力是指CPU、GPU、FPGA、ASIC等多种算力协同的处理体系,能够满足不同场景中的应用需求,实现计算效力的最大化。在市场需求的驱动下,算力的发展一方面呈现多样性,打破传统的单一架构的算力形态,实现了异构算力以应对不同场景下的数据处理应用;另一方面又呈现出异构算力下的能力开放和统一管理,不论是芯片厂商还是平台厂商目前都围绕自身的产品系统,将底层的异构算力能力进行融合,从而吸引更多的产业链上下游企业共同打造生态环境。 (二)算力网络与算网融合 算力网络是一种根据业务需求,在云、网、边、端