您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中国移动研究院]:赵鹏:算网大脑 助力算网服务创新发展 - 发现报告
当前位置:首页/行业研究/报告详情/

赵鹏:算网大脑 助力算网服务创新发展

赵鹏:算网大脑 助力算网服务创新发展

算网大脑 助力算网服务创新发展中国移动研究院赵鹏 背景算网大脑关键技术算网大脑产品和实践目录 算力网络发展背景和关键驱动力算力网络是国家战略的要求,产业发展的趋势和公司转型的动力,为全社会数智化转型和公司发展定位转型带来全新机遇。工信部提出“三年行动计划”四部委启动“东数西算”工程《十四五规划》加快数据中心体系建设发改委数据中心纳入“新基建”产业发展•业务创新:提升网络价值,开创算网全新业务场景•角色转型:重构运营商的服务体系,从网络管道提供商向算网服务提供商转型•技术突破:打造原创技术策源地,成为创新链技术突破的重要根基公司转型•产业创新:产业数字化转型加速,对融合信息基础设施的供给提出更高需求•技术融合:DICT技术持续融合,相互促进,共同发展•绿色低碳:碳达峰、碳中和,建设新型低排放基础设施公司转型需要算力网络国家战略要求算力网络产业发展呼唤算力网络国家战略 算力网络(Computing Force Network)的定义算力网络是以算为中心、网为根基,网、云、数、智、安、边、端、链(ABCDNETS)深度融合的新型信息基础设施,实现“算力泛在、算网共生、智能编排、一体服务”的目标 ,推动算力成为与水电一样, 可“一点接入、即取即用”的社会级服务,达成“算力无处不在、网络无所不达、智能无所不及”的愿景。基础设施层OTN/OXCOTN/OXC全光底座OTN/OXC统一IP算网底座分布式算力(端)分布式算力(边)分布式算力(网)分布式算力(中心)分布式算力(中心)分布式算力(边)分布式算力(网)分布式算力(端)编排管理层运营服务层智能编排:融数注智,构建算网大脑算力泛在:实现三融通,构建云边端多层次、立体分布式算力一体服务:实现三个融合供给①多要素融合供给:融合算网数智链安等多要素②社会算力融合供给:算力并网、可信交易③数智服务融合供给:随需满足、体验“无感”、使用智简①一体编排:实现算网统一编排/调度/管理/运维②核心能力构建:打造算网资源一体设计、全局编排、灵活调度、高效优化的核心能力①空间:融通东西,4+3+X数据中心布局②逻辑:融通云(C)、边(E)、端(T)③内核:融通异构,实现ARM/x86/GPU/FPGA等多样性算力 算网大脑是实现算力网络愿景的关键系统算网大脑通过对算力和网络资源的统一编排调度和管理运维 ,融数注智 ,向下实现泛在算力的跨层跨区域融通和网的跨域跨专业拉通,向上实现多要素融合能力供给和算网一体化服务支撑,是算力网络的关键系统。算网大脑整体定位向上:提供一体化运营运维能力编排管理层一体化运营运维能力 算网统一编排 算网智能化一体化算网编排能力“算网大脑”运营服务层算网基础设施层平台层:统一编排管理、算网自智向下:进行统一调度 继往开来,即将迈入算力网络新阶段走过算力网络“泛在协同”的重要阶段,即将迈入 “融合统一”的发展新阶段跨越阶段:一体内生2021-2023 2024-20252025~ 十四五阶段 十五五阶段及更长期起步阶段:泛在协同发展阶段:融合统一网随算动智能编排算网一体一站服务:一站开通算网服务协同运营:云网运营双入口拉通融合服务:产品融合、确定性服务统一运营:统一入口、统一平台一体服务:多层次智简无感服务模式创新:多方算力可信交易运营服务编排管理基础设施算网融合智慧内生协同编排 中国移动算力网络发展历程中国移动深刻把握算力时代发展脉搏,以网强算提出“算力网络”全新理念。两年来,继往开来、开拓创新,全力推进算力网络发展。——中国移动《算力网络白皮书》算力网络是以算为中心、网为根基 ,网、云、数、智、安、边、端、链(ABCDNETS)等深度融合、提供一体化服务的新型信息基础设施。杨杰董事长提出“算力网络”概念与愿景成为“5G+算力网络+能力中台”新型信息基础设施的关键一环启动算力网络试验网CFITI 1.0,发布算网服务体系1.0提出新概念发布《算力网络白皮书》和算网运营管理系列行业标准发布新理念融入新战略打造新平台发布《算力网络科技创新成果》,CFITI试验网与中国算力网、中科院信息高铁联合打造科学装置组建新战队5G智慧中台算力网络发布《算力网络科技创新成果》,CFITI试验网与中国算力网、中科院信息高铁联合打造科学装置构建新装置发布《算网大脑白皮书》、提出算网大脑愿景、发展路径等开创新方向 背景算网大脑关键技术算网大脑产品和实践目录 算力的含义算力用于表征单位时间进行某种计算处理的能力•狭义上,算力是设备系统的计算处理能力,包括芯片、单机、超算集群几个层面,按照所处理计算的类型区分为TOPS、FLOP/S、Hash/S等单位进行度量;•广义上,算力是系统整体处理数据的能力,在单机设备计算能力基础之上,整体系统算力的释放还取决于算力与系统内网络、存储等资源的高效协同狭义:设备的计算能力/处理数据的能力逻辑:TOPS; AI:FLOP/S; 比特币:Hash/S网络迟滞拖累整体性能网络过快等待时长增加广义:系统整体处理数据的能力释放算力需要算力、网络、存储的有机协同 算网大脑是算力网络的中枢调度决策系统•算力从狭义到广义有芯片、单机、集群和网络化算力等多种不同形态。•网络化算力需要与之匹配的中枢调度决策系统 -- 算网大脑,算网大脑的本质是算力网络操作系统,其最重要目标是实现算力网络算力供给能力、数据处理能力、网络连通能力、业务供给能力的最大化。单芯片算力控制单元CU计算任务网络化算力算网大脑算网一体化业务整机算力操作系统软件应用K8S、OpenStack...云化算力云服务 基于OODA决策循环模型的算网大脑关键能力设计基于OODA决策循环模型,其核心是观察、导向、决策、行动四个阶段;算网大脑是算力网络的中枢调度决策系统,其核心能力是算网态势感知、智能分析、编排和调度执行。OODA循环模型美国战略理论家约翰·博伊德为空军作战提出OODA循环模型,相比与PDCA,是一种更加适用于高度复杂、动态变化场景的决策思路。算网大脑关键能力设计算网大脑感知算力网络基础设施信息,基于业务需求综合分析制定算网业务方案,通过算网多要素的最优分配,实现算力的最大效力发挥。Observe通过各种设备和网络收集信息Act执行操作Decide明确制定方案,下达操作命令Orient分析判断,结合经验,将数据转化为有用的信息感知算网资源及数据采集和管理调度执行完成实际资源分配及网络配置编排算网业务一体化业务设计和编排全生命周期管理智能化算网业务智能感知、编排及调优OODA Loop 算网大脑带来的变化算网大脑在“全局”、“动态”、“智能”三方面发挥核心作用,依托底层各专业域能力的标准化供给,实现在场景定制、多要素融合和智能保障等方面的业务体验全面提升。动态:持续的最优方案交付•业务一体交付:结合实时感知的算网多方因素和策略,实现需求和资源的最优匹配和最优方案交付•业务运行期间:持续对业务和资源状态进行感知并针对业务的质差和劣化进行动态优化和调整智能:全周期的算网自智•算力:物理(空间)、逻辑(云边端)、异构(智算、通算)、多主体(三方云算力)四融通•多要素:实现“ABCDNETS”多要素算力+网络+能力的融合一体供给全局:算力融通和多要素融合•意图驱动:用户任务式意图的智能识别和需求拆解•业务体验保障:业务运行期间持续的智能分析决策,以及智能化的业务体验优化保障•服务模式创新:智能技术的深度融合推动催生新的服务模式支撑算力网络业务场景可灵活定制、多要素可融合供给、体验可动态智能保障的全面提升 关键技术能力1:全局—跨域多要素联合编排随着业务场景的复杂化和技术的融合发展,智能视频、车联网等涵盖算力、网络、AI智能、终端等多种能力要素的场景加速发展,需要算网大脑实现“ABCDNETS”多要素的纳管、设计、调度、优化等联合编排能力。重点攻关技术方向入云连接视频云接入存储抽帧AI算法人脸识别摔倒识别抽烟识别云间互联多要素协同算网产品能力:如智能视频最低时延最高可用最低成本综合平衡云专网网络能力管理CMNETSPNPON云专网核心网物联网CPUFPGAGPU存储DPU内存多算管理安全堡垒机镜像防攻击镜像防火墙镜像流量清洗镜像抗Ddos攻击安全资源池AI违停识别烟雾识别人脸识别算法抽烟识别算法火情识别视频大数据接入存储抽帧转码监控分发终端管理摄像机智能音箱智能门禁CDNCPU存储内存短信平台彩信平台IVR平台短彩CPU存储内存MEC区块链溯源服务身份服务可信存证网(N)云(C)数(D)智(A)安(S)边(E)端(T)链(B)视频存储图片抓拍视频抽帧视频转码人脸识别违停识别抽烟识别烟雾识别防火墙流量清洗堡垒机防攻击摄像机音箱门禁彩信呼叫物联网云专线短信云组网文件存储云主机渲染算力AI训练算力对象存储AI推理算力CDN内容管理能力视频/网页/下载加速CDN用户日志查询能力接入认证跨域多要素的算网业务场景跨域能力集中纳管多要素融合方案设计跨域调度联合优化 关键技术能力2:动态—持续的最优方案交付算网大脑在算网业务需求和基础设施约束之间实现的最优供需匹配需要针对不同的算网业务和SLA需求,综合算力、存储、成本等成本因素,和带宽、时延、可靠性等网络因素,以及能耗、资费、安全等环境因素,实现多要素能力的融合供给、客户需求的最优匹配和持续动态调度算网大脑支撑全局最优的业务开通(以云电脑业务为例)重点攻关技术点统一量纲联合优化算法业务指标设计业务指标分解云电脑应用客户终端云专网中心云A入云专线边缘云B云电脑应用边缘云A云电脑应用线路1线路3线路2以云电脑业务为例,算网大脑根据客户需求以及运营商自身策略通过简单算法匹配最优的网络线路和算力节点。当算网同时承载数量巨大的多种算网业务时,简单的算法无法支撑,需要借助机器学习或神经网络等AI能力进行全局最优的匹配。 关键技术能力3:智能—意图驱动的算网自智智能化是面向超大规模、高复杂度、高动态的算网环境的必然选择随着AI技术尤其是大模型的创新和发展,算网大脑引入AI能力,辅助甚至完全替代人工,实现业务、产品的智能化需求解析、编排方案智能设计、业务开通和运维的端到端智能保障。重点攻关技术点意图识别智能方案设计自动化开通智能保障优化快速获取分析全域实时的计算、存储、网络、数据资源,以及云、边、端分布情况和运行情况,实现智能态势感知感知智能需求静态信息获取实时自动感知单域信息查询跨域信息整合分析数据图谱自动构建 端到端数据链可视的分析结果··· ···业务的创新和随选要求算网编排层逐渐实现智能编排编排智能需求人工驱动意图驱动手动模型设计按需、自动设计匹配模型编排模型自优化编排准确度提升··· ···高复杂度、高动态的算网环境,以及算网的多管理对象、业务的高精度SLA需求均对运维智能提出较高要求运维智能需求运维对象高效管理业务的高实时性SLA要求资源、业务的灵活、按需动态调整 算网大脑功能架构设计算网大脑包含设计、编排调度、感知接入、能力接入和智能5方面核心功能,并通过能力网关接入标准化算网能力。算力网络运营层网络域能力网关设计编排调度算网大脑算力域能力网关···感知接入智能标准化接口标准化接口传输工作台IP工作台社会算力工作台移动云控制台IT云管...算力网络基础设施能力接入标准化接口 算网大脑的构建面临多方面挑战伴随着业务需求和技术的变化,算网大脑构建面临应用、算力、网络、安全等多方面挑战。模型降维迁移知识升维融合云端基础大模型边侧小模型端侧微模型模型降维迁移知识升维融合 内核异构逻辑异构空间异构安全技术层面从设备安全到服务内生从单点防护到全局协同应用技术层面算力技术层面网络技术层面 背景算网大脑关键技术算网大脑产品和实践目录 算网大脑典型业务场景结合业务规划,选取典型算网业务场景,试点中重点对东数西存、智能视频、安全服务、东数西训、社会算力等业务场景,开展解决方案设计、算网大脑原型研发和试点验证工作。东数西训业务业务对算网大脑的需求•调度西部算力资源支撑大模型训练;•调度跨省弹性网络资源支撑训练数据集传输等•通过算网大脑调度东西部算网资源,支撑西部大模