您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [中国移动研究院]:赵鹏:算网大脑 助力算网服务创新发展 - 发现报告

赵鹏:算网大脑 助力算网服务创新发展

信息技术 2023-07-26 中国移动研究院 一切如初
报告封面

中国移动研究院 背 景 算力网络是国家战略的要求,产业发展的趋势和公司转型的动力,为全社会数智化转型和公司发展定位转型带来全新机遇。 算力网络(Computing Force Network)的定义 算力网络是以算为中心、网为根基,网、云、数、智、安、边、端、链(ABCDNETS)深度融合的新型信息基础设施,实现“算力泛在、算网共生、智能编排、一体服务”的目标,推动算力成为与水电一样,可“一点接入、即取即用”的社会级服务,达成“算力无处不在、网络无所不达、智能无所不及”的愿景。 一体服务:实现三个融合供给 ①多要素融合供给:融合算网数智链安等多要素②社会算力融合供给:算力并网、可信交易③数智服务融合供给:随需满足、体验“无感”、使用智简 智能编排:融数注智,构建算网大脑 ①一体编排:实现算网统一编排/调度/管理/运维②核心能力构建:打造算网资源一体设计、全局编排、灵活调度、高效优化的核心能力 算力泛在:实现三融通,构建云边端多层次、立体分布式算力 ①空间:融通东西,4+3+X数据中心布局②逻辑:融通云(C)、边(E)、端(T)③内核:融通异构,实现ARM/x86/GPU/FPGA等多样性算力 算网大脑是实现算力网络愿景的关键系统 算网大脑通过对算力和网络资源的统一编排调度和管理运维,融数注智,向下实现泛在算力的跨层跨区域融通和网的跨域跨专业拉通,向上实现多要素融合能力供给和算网一体化服务支撑,是算力网络的关键系统。 继往开来,即将迈入算力网络新阶段 走过算力网络“泛在协同”的重要阶段,即将迈入“融合统一”的发展新阶段 中国移动算力网络发展历程 中国移动深刻把握算力时代发展脉搏,以网强算提出“算力网络”全新理念。两年来,继往开来、开拓创新,全力推进算力网络发展。 算 力 网 络 是 以 算 为 中 心、 网 为 根 基, 网 、 云 、数 、 智 、 安 、 边 、 端 、链 (A B C D N E T S) 等深 度 融 合 、 提 供 一 体 化服 务 的 新 型 信 息 基 础 设施。 ——中国移动《算力网络白皮书》 背 景算 网 大 脑关 键 技 术算 网 大 脑产 品 和 实 践 算力的含义 算力用于表征单位时间进行某种计算处理的能力 •狭义上,算力是设备系统的计算处理能力,包括芯片、单机、超算集群几个层面,按照所处理计算的类型区分为TOPS、FLOP/S、Hash/S等单位进行度量; •广义上,算力是系统整体处理数据的能力,在单机设备计算能力基础之上,整体系统算力的释放还取决于算力与系统内网络、存储等资源的高效协同 释放算力需要算力、网络、存储的有机协同 算网大脑是算力网络的中枢调度决策系统 •算力从狭义到广义有芯片、单机、集群和网络化算力等多种不同形态。 •网络化算力需要与之匹配的中枢调度决策系统--算网大脑,算网大脑的本质是算力网络操作系统,其最重要目标是实现算力网络算力供给能力、数据处理能力、网络连通能力、业务供给能力的最大化。 基于OODA决策循环模型的算网大脑关键能力设计 基于OODA决策循环模型,其核心是观察、导向、决策、行动四个阶段;算网大脑是算力网络的中枢调度决策系统,其核心能力是算网态势感知、智能分析、编排和调度执行。 OODA循环模型 算网大脑关键能力设计 美国战略理论家约翰·博伊德为空军作战提出OODA循环模型,相比与PDCA,是一种更加适用于高度复杂、动态变化场景的决策思路。 算网大脑感知算力网络基础设施信息,基于业务需求综合分析制定算网业务方案,通过算网多要素的最优分配,实现算力的最大效力发挥。 算网大脑带来的变化 算网大脑在“全局”、“动态”、“智能”三方面发挥核心作用,依托底层各专业域能力的标准化供给,实现在场景定制、多要素融合和智能保障等方面的业务体验全面提升。 动态:持续的最优方案交付 全局:算力融通和多要素融合 智能:全周期的算网自智 •意图驱动:用户任务式意图的智能识别和需求拆解•业务体验保障:业务运行期间持续的智能分析决策,以及智能化的业务体验优化保障•服务模式创新:智能技术的深度融合推动催生新的服务模式 •业务一体交付:结合实时感知的算网多方因素和策略,实现需求和资源的最优匹配和最优方案交付•业务运行期间:持续对业务和资源状态进行感知并针对业务的质差和劣化进行动态优化和调整 •算力:物理(空间)、逻辑(云边端)、异构(智算、通算)、多主体(三方云算力)四融通•多要素:实现“ABCDNETS”多要素算力+网络+能力的融合一体供给 关键技术能力1:全局—跨域多要素联合编排 随着业务场景的复杂化和技术的融合发展,智能视频、车联网等涵盖算力、网络、AI智能、终端等多种能力要素的场景加速发展,需要算网大脑实现“ABCDNETS”多要素的纳管、设计、调度、优化等联合编排能力。 算网大脑在算网业务需求和基础设施约束之间实现的最优供需匹配 需要针对不同的算网业务和SLA需求,综合算力、存储、成本等成本因素,和带宽、时延、可靠性等网络因素,以及能耗、资费、安全等环境因素,实现多要素能力的融合供给、客户需求的最优匹配和持续动态调度 以云电脑业务为例,算网大脑根据客户需求以及运营商自身策略通过简单算法匹配最优的网络线路和算力节点。 当算网同时承载数量巨大的多种算网业务时,简单的算法无法支撑,需要借助机器学习或神经网络等AI能力进行全局最优的匹配。 联合优化算法 关键技术能力3:智能—意图驱动的算网自智 智能化是面向超大规模、高复杂度、高动态的算网环境的必然选择 随着AI技术尤其是大模型的创新和发展,算网大脑引入AI能力,辅助甚至完全替代人工,实现业务、产品的智能化需求解析、编排方案智能设计、业务开通和运维的端到端智能保障。 算网大脑功能架构设计 算网大脑包含设计、编排调度、感知接入、能力接入和智能5方面核心功能,并通过能力网关接入标准化算网能力。 算网大脑的构建面临多方面挑战 伴随着业务需求和技术的变化,算网大脑构建面临应用、算力、网络、安全等多方面挑战。 背 景 算网大脑典型业务场景 结合业务规划,选取典型算网业务场景,试点中重点对东数西存、智能视频、安全服务、东数西训、社会算力等业务场景,开展解决方案设计、算网大脑原型研发和试点验证工作。 东数西存业务 智能视频业务 安全服务业务 东数西训业务 社会算力业务 •通过算网大脑调度东西部算网资源,支撑西部大模型训练、东部模型精简、东部边缘推理等场景 •基于算力网络,聚合视频行业生态,打造“连接+算力+能力”的 新型视频服务能力 •智能对象存储服务,调度西部存储资源支撑东部数据进行归档、备份,为客户提供位置无感的分布式数据存储服务 •盘活社会/三方算力资源,丰富异构算力基础设施,利用云专网打通各个算力节点,实现算力快速接入 •结合5G网络和零信任服务,为算网用户提供持续的双域网络可信身份接入和一站式办公安全防护 业务对算网大脑的需求 业务对算网大脑的需求 业务对算网大脑的需求 业务对算网大脑的需求 业务对算网大脑的需求 •按需合理匹配资源池,完成安全服务业务部署•依据负载智能引流空闲节点,提升资源利用率 •调度东西部存储资源支撑客户数据的冷温热分级存储;•调度跨省弹性网络资源以及数据文件等 •按需调度视频能 力 、A I能力和分布式算力资源•按需调整和匹配云专网资源传输视频数据 •调度西部算力资源支撑大模型训练;•调度跨省弹性网络资源支撑训练数据集传输等 •按需实现算力快速一点接入,能够提升资源利用率,灵活敏捷的提供社会算力资源 构建算网设计中心,快速实现算网创新业务场景 沉淀、抽象、注册、封装算网产品及其原子能力,提供可视化建模环境和建模向导,基于5级资源模型,快速完成解决方案的方案架构设计和业务流程设计的构建、集成和研发。 构建基于“感知-分析-调度-执行”的动态优化调度智能管理框架 构建“感知-分析-调度-执行”的循环决策模型,从智能感知区、智能调度区、智能分析区、记忆区等几个维度实现对算网业务实例的智能管理。 算网一体感知、多维度呈现 构建统一算网感知模型,从算网总览、算网业务、算网资源等呈现维度,实现多层次、多维度的算网资源及业务的动态感知、分析和一体化呈现。 算网大脑整体方案 面向典型业务场景,开展算网大脑整体解决方案设计,实现对底层算网能力的协同调度和对上一体化算网业务支撑明确算网多要素联合编排所需的7类要素能力,20个产品,79个标准化原子能力,南向对接9套外部系统。 算网大脑业务示例:智能视频 场景描述:面向阳光市场、交通枢纽安防、数智社区、科学防疫、平安校园、工业质检等新业务场景中大量的视频处理需求,通过对客户摄像头拍摄的视频流进行转码、抽帧、录制、AI识别等处理,提供视频直播、回看、周期存储和AI检测等智能视频服务。 算网大脑核心价值:算网大脑通过感知当前各个计算节点的资源可用情况以及成本信息,结合监测智能视频AI应用的QPS等业务指标,以及CPU使用率、内存使用率、GPU使用率等资源使用指标,实现智能视频AI应用跨节点动态扩缩容以及服务配置,在保证业务体验质量的基础上,为客户提供任务式、低成本视频AI检测等智能视频服务。 THANKS!