您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中国移动]:计算机行业:打造创新技术策源高地,推动算力网络纵深发展 - 发现报告
当前位置:首页/行业研究/报告详情/

计算机行业:打造创新技术策源高地,推动算力网络纵深发展

信息技术2023-08-31中国移动徐***
计算机行业:打造创新技术策源高地,推动算力网络纵深发展

打造创新技术策源高地推动算力网络纵深发展中国移动 黄宇红2023.08 2算力是数字经济的核心生产力网算水电① 事关核心生产要素升级过去十年,数据中心用电量以每年超10%速度递增,2020年约占全社会用电量的2.71%1.47%1.76%1.86%1.96%2.16%2.42%2.71%0.00%0.50%1.00%1.50%2.00%2.50%3.00%010000200003000040000500006000070000800002014201520162017201820192020数据中心耗电量全社会用电量数据中心耗电量占比我国算力规模平均每增长一个百分点,带动数字经济和GDP将分别增长1.6‰和0.8‰00.511.52环境和公共设施管理文教卫生与社会服务住宿餐饮业科研和技术服务能源供应金融业互联网、软件和信息服务批发零售业其他制造业计算机等设备制造直接带动产出间接带动产出② 事关数字经济增速③ 事关双碳目标实现资料来源: 国家统计局中国信息通信研究院中国数据中心耗电量及占全社会电量比 算力网络发展回顾3 算力网络体系架构4算网一体的基础设施融数注智的算网大脑融合统一的运营服务算网基础设施层OTN/OXCOTN/OXCOTN/OXC编排管理层运营服务层绿色算网运营算网大脑算网底座TaaS算力并网MaaS统一运营意图感知能力开放数据湖 基础算网管理 人工智能引擎 算网统一编排算网智能化一体编排泛在调度算力解构数字孪生意图网络算网自智统一IP算网底座全光底座分布式算力(边)分布式算力(端)分布式算力(中心)分布式算力(中心)分布式算力(边)分布式算力(端)安全 算力网络发展路径52021-2023 2024-20252025~十四五阶段 十五五阶段及更长期起步阶段:泛在协同发展阶段:融合统一跨越阶段:一体内生智能编排算网融合智慧内生算网一体协同编排网随算动算+网 互调(算网协同的资源式服务)大脑对算网等能力编排调度(多要素融合的任务式服务)算网从协议和系统层面开始融合(极致体验的智能化服务) 算力网络发展主线6中国移动从算网基础设施构建、业务融合创新、创新技术引领等多方面系统化推进算力网络建设和发展主线三面向创新技术引领主线一面向算网基础设施构建主线二面向业务融合创新物理空间、逻辑空间、异构空间、多主体算力融通“4+N+31+X”布局,1000边缘节点构建E级超大规模单体智算中心打造20ms、5ms、1ms三级时延圈实现算网高效协同,支持CHBN业务融合发展,打造算网全新生态产品算力化和算力产品化创新服务体系,发布算网服务1.0构筑融数注智算网大脑实现创新技术引领,打造算力网络原创技术策源地三横两域体系架构创新提出十大技术发展方向布局攻关三十二大核心技术 7构建核心技术体系,打造创新技术高地提出十大技术发展方向和三十二大核心技术算力网络核心技术体系加强关键核心技术攻关和原创技术突破算力网络创新技术突破运营服务层编排管理层算网基础设施层算力交易数据流通方向七:可信共享算网服务 方向一:泛在智能新型算力泛在调度算网原生编排智能网络调度算网数据感知多要素融合编排算网智能化方向六:融数注智算网大脑方向三:光电联动全光网算力原生算力卸载存算一体智能算力算力度量云原生空天地一体在网计算算力路由PON超宽全光接入400G/800G全光高速互联OTN光电联动算网SPN切片承载SRv6/G- SRv6确定性网络应用感知新一代SD-WAN绿色安全芯片节能服务器节能数据中心节能低碳能源全程可信安全编排隐私计算 方向八:端到端绿色低碳 方向九:能力内生新安全方向四:确定性IP网络方向五:算网深度融合方向二:多样性计算架构方向十:空天地星云算网2022年6月发布中国移动持续推动算力网络技术的创新突破,构建算力网络核心技术体系,打造原创技术策源高地存算一体:突破冯氏架构算力原生:融通异构生态算力路由:突破互联网架构协议通算一体:无线通算融合共生新型智算:NICC新型智算中心架构存算新型智算中心GPU算力原生通用数据中心边算力算力路由算力路由通算一体通算一体通算一体 智算设施智算原生ROCmCUDACANNTesnsorFlowPyTorchPaddlePaddleDeepspeed九天文件对象块多元融合存储GPU集群算力CPUGPU高速无损网络高性能全以太RoCE液冷整机柜高效供电智算基建冷却水系统智算框架AI 应用使能......跨架构编译器算力抽象运行时“芯合”算力原生智算运营编排调度计量计费算力交易能力开放算力管理存储管理网络管理FCAPS管理日志管理资产管理裸金属实例虚拟机实例容器实例异构算力池化算存网管效制定扣卡服务器的统一技术和评测标准,构建多样性算力格局,丰富产业生态创新提出多元融合存储技术方案,实现块、文件和对象三种存储方式统一,降低成本,提升存储效率原创提出全调度以太网GSE技术,打造开放解耦、高性能的数据中心无损网络创新基于API转发的GPU池化方案,实现资源的细粒度分配和跨资源池一体调度,提升智算资源分配灵活性和利用率1、新型智算:构建新型智算中心技术体系,打造算力高峰面向基础通用大模型孵化,中国移动构建NICC新型智算中心技术体系,围绕存、算、网、管、效五大核心技术特征全面推进,打造标准统一、技术领先、兼容开放的新型智算底座引入服务器冷板式液冷方案,推进服务器和机柜的解耦,有效降低数据中心PUENICC新型智算中心技术体系重点工作算存网管效8 2、算力原生:智算应用跨架构迁移部署9中国移动原创提出算力原生技术,打造“芯合”算力原生跨架构平台,目标打破“框架+工具链+硬件”紧耦合的智算生态,屏蔽底层硬件差异,实现智算应用的跨架构迁移部署。繁冗开发、复杂适配、各自为栈一次开发、一次封装、跨芯迁移①发布《面向智算的算力原生白皮书》 原创提出 “两层架构”和“四大核心技术”② OIF成立开源工作组,牵头国内外多项标准立项③ 打造“芯合”算力原生原型平台beta版,进行技术理念验证实现视频分析、图像识别两类智算应用在GPU T4 、MLU 370间的跨架构部署迁移牵头在OIF成立算力原生子工作组牵头在ITU、CCSA进行标准立项三阶段发展路径:异构算力资源池化- 应用跨架构迁移-全局泛在融通硬件层应用层oneAPICUDANeuWareROCm......PytorchCANN无法互识跨架构流转框架层工具链......XXXX算力原生层跨架构流转的原生程序原生运行时 编程模型转换、编译、优化程序加载动态链接oneAPICUDANeuWareROCm......CANN硬件层应用层框架层工具链Pytorch......•统一编程模型及源源转换 基于SYCL的单源编程模型范式•跨架构综合编译机制 多级IR互转,图算数融合编译优化•原生程序格式规范Host侧、Device侧指令元语及执行策略的一体承载•原生运行时算力抽象跨厂商运行时接口/指令集的可变粒度映射机制 3、 通算一体:无线算网融合共生10从“烟囱式设计”到“网络平台化”从“单一能力”到“服务多样化”从“功能独立、资源隔离”到 “通算共生化”SaaS中心云基站智能终端智能终端协同协同协同联合编排联合编排联合编排基础设施层连接计算数据模型虚拟资源网络功能层计算面功能计算执行计算控制AI推理计算应用xAI训练...算力感知通算QoS监控通算联合调度需求感知能力开放连接用户面功能连接控制面功能管理编排层RANFCAPS管理服务编排数据管理服务注册/发现/开放无线计算资源编管通算联合编排无线系统核心网络算网大脑本地服务开放应用AI编管边缘云② 联合产业开展面向5G-A和6G的标准研究,凝聚产业共识,推进技术方案标准化③ 联合产业界开展无线通算融合外场实验,初步验证无线通算融合技术的可行性和价值基于宏站的无线算力编排,下行中远点吞吐量提升10%,频谱效率提升4%基于云小站的无线算力共享,业务总耗时降低46%、传输耗时降低70%① 发表/录用多篇SCI论文 ,提出无线通算融合共生的新型无线网络架构和关键技术体系ü CCSA TC5 WG6立项业界首个无线算力网络项目,开展应用场景、关键技术和参考架构研究ü IMT-2030,面向6G无线网络设计,无线通算融合的技术特征写入《6G无线系统总体概念》 4、 算力路由:推动算网一体创新发展11中国移动创新提出算力路由体系,将算力信息引入路由域,通过统一控制和调度进行算网资源全局优化,实现用户体验、资源利用率和网络效率的最优组合②CA-BGP-LS: 出口节点向算力控制节点通告算力状态信息①CA-BGP:采集算力信息,通过扩展BGP协议进行通告③CA-OSPF:在域内泛洪算力信息为路由提供参考⑤CA-Restful/json:通过restful协议接口收集Json消息算力信息④CA-Netconf/yang:通过Netconf协议下发Yang模型算力配置算力路由协议簇算力路由组网架构历时4年推动IETF成立算力路由工作组CATS,中国移动担任主席2019~2022年5次研讨会2023年3月 CATS WG成立暨首次会议,是路由域最受欢迎的工作组之一算力路由的提出①发现问题云边以及边边调度之间出现“性能反转”②问题本质计算和网络是独立系统算的负载和网的拥塞信息没有产生关联③解决思路在路由中引入计算信息,进行联合调度工作组范畴和计划 5、存算一体:突破冯氏架构,实现极致算效传统架构AI芯片能耗问题日益严峻,存算一体新范式突破访存瓶颈,有望实现计算能效百倍提升,可中国移动积极攻关存算一体技术,构建存算一体产业生态攻关存算电路、芯片架构、软件工具、算法模型、应用场景等存算一体关键技术,发布业界首个《存算一体白皮书》张量单元向量单元标量单元寄存器buffer缓存控制指令接口SDK仿真模拟算法模型应用场景实现SRAM、RRAM、NOR FLASH等存内计算,保证最优计算能效设计芯片架构及SoC方案,提供大算力芯片研发SDK、仿真模拟等软件,推动软件生态链适配AI算法模型,提升产品能力,加快生态构筑搭建应用场景并验证,护航产品化落地与应用推广联合清华大学共同研发业内首款基于忆阻器的存算一体SoC芯片,大幅提升芯片算效比基于忆阻器的存算一体SoC芯片SoC芯片(集成300万个忆阻器)SoC芯片测试系统12可穿戴智能摄像头移动终端数据中心端低功耗、高算力,支持AI模型本地化部署,有效保护终端隐私边解决复杂边缘计算场景散热需求,提升边缘系统的智能化程度云自动驾驶边缘网关/5G云小站<100Tops500~1000Tops>1024Tops<1Tops~5Tops10~50Tops高算力有望实现AI运算能效提高1~2个数量级,大幅降低电力成本低算力 “1+9+9”节点布局北方国际信息港广东江苏浙江山东河南山西甘肃内蒙古贵州9个集团级节点福建北京湖南四川新疆云南重庆河北宁夏9个省级节点1个中枢节点形成覆盖广泛、融通东西、多节点互联的创新试验基础设施科学装置,打造算力网络科学装置启动科学装置建设:2022年中国移动携手鹏城实验室、中国科学院计算技术研究所共同启动“大规模科技研发基础设施——算力网络科学装置合作”,以构筑公共基础实验平台类国家重大科技基础设施为目标,为算网基础科学研究及应用提供关键实验平台和测试支撑构建创新试验网CFITI,打造科学装置13 总结与展望141、算力网络发展的基础在于“技术策源”,联合业界加强算力原生、算力路由、存算一体、量子计算等跨学科交叉技术的研究,打造算力网络原创技术新高地2、算力网络发展的重点在于“继往开来”,在做好技术原创的基础上,还要解决好科学的工程化问题,以打造新型信息基础设施为目标,全面支撑国家东数西算等重大工程向纵深发展3、算力网络发展的核心在于“产业共赢”,凝聚产学研用力量,加快构建统一技术路线与标准体系,促进新技术转化和产品落地