AI智能总结
异网异构边缘算力系统总体架构研究报告 2025年8月 版权声明 本报告版权属于中国铁塔股份有限公司、中国信息通信研究院、中国移动设计院、江苏省未来网络创新研究院所有并受法律保护,任何个人或组织在转载、摘编或以其他方式引用本报告中的文字、数据、图片或者观点时,应注明“来源:中国铁塔股份有限公司、中国信息通信研究院、中国移动设计院、江苏省未来网络创新研究院”。否则将违反中国有关知识产权的相关法律和法规,对此中国铁塔股份有限公司、中国信息通信研究院、中国移动设计院、江苏省未来网络创新研究院有权追究侵权者的相关法律责任。 前言 随着人工智能与实体经济深度融合,车联网、工业互联网、远程医疗等低时延场景爆发式增长,对我国算力基础设施提出“广覆盖、快响应”的新需求。为了落实《算力基础设施高质量发展行动计划(2023)》、《算力互联互通行动计划(2025)》的要求,我国在加速智算中心建设的同时,亟需构建服务于产业数字化的边缘算力系统,强化场景化就近算力供给能力。本报告针对当前边缘算力资源碎片化、组网方式多样化、管理孤岛化等问题,首次系统化提出“异网异构边缘算力系统”架构,通过多元异构算力融合调度与跨域网络智能协同关键技术,为边缘算力的建设和发展提供实施路径参考。 目前,产业界与学术界对异网异构边缘算力系统的研究尚处于探索起步阶段,新的架构和应用模式正在不断涌现。本研究报告为阶段性成果,尚待持续完善,诚挚期待读者批评与指导。 参编单位:中国铁塔股份有限公司、中国信息通信研究院、中国移动设计院、江苏省未来网络创新研究院 参编人员:郭宇辉、麻文军、窦笠、何杰、潘三明、聂昌、贾平胜、张民贵、闫亚旗、徐佳祥、魏华、董玉池、付韬、王哲、王计艳、王艺晨、魏亮、方辉、孙玉刚、尹鹏 目录 一、边缘算力系统背景与概述.....................1 1.1边缘算力系统发展背景....................11.2边缘算力基本概念........................31.3边缘算力系统主要功能....................3 二、边缘算力系统架构...........................5 2.1总体架构设计............................52.2边缘算力节点的部署.....................112.3网络连接与通信机制.....................122.4云边协同模式...........................13 三、边缘算力系统应用场景......................13 3.1车联网应用场景.........................143.2新型工业网络应用场景...................143.3远程医疗应用场景.......................153.4智慧城市应用场景.......................15 4.1技术发展趋势...........................164.2面临的挑战和不足.......................174.3面临的机遇.............................184.4发展建议...............................18 一、边缘算力系统背景与概述 1.1边缘算力系统发展背景 数字化转型推动新型工业网络、车联网、智慧城市等领域加速发展,人工智能和大数据应用对算力需求呈现爆发式增长。我国大力发展网络化互联设备,各行业各领域不断提升数字化和信息化水平。各类应用对于算力的需求不断增长,尤其是人工智能训练神经网络大模型需要处理海量数据,大量通用大模型、专用大模型、行业大模型等对算力提出了远超传统应用的需求,我国建设算力总规模正在稳步提升,位居全球第二。目前算力资源主要分为中心算力、边缘算力和本地算力。其中,智算中心在处理计算任务时面临实时性较弱与隐私风险,而很多设备的本地算力远不能满足人工智能、大数据等技术应用要求。在新型工业网络、车联网等场景中,算力基础设施需要满足实时响应、业务灵活、任务迁移等需求,边缘算力通过下沉至数据源头、就近处理关键任务,成为人工智能实时场景中落地的必然选择。边缘计算具有临近数据源、减轻云端数据压力以及保护用户隐私等显著优势。 我国产业界大力发展边缘算力设施,分散式建设进程导致算力硬件和互联网络呈现出较大差异,异网异构资源难以高效管控与对外服务。我国边缘算力设施存在差异巨大的异构算力硬件,芯片类型包括了通用CPU、GPU、FPGA、ASIC等,服务器架构具有并存的x86架构与ARM架构,导致算力度量、管控和调度需要克服不同芯片厂商的标准差异。单一边缘节点受限于算力容量、计算资源异构、并发服务总 数等短板,难以满足大规模用户的请求,导致各单位建设了大量的边缘计算节点,不同单位的边缘算力之间缺乏协同机制。各单位先建立了机房内局域网络,再通过多种运营商网络接入公网,边缘机房的接入网络既包含无线网络也包含数据通信网络,给算网协同调度带来了一定难度。产业界无法综合管控属主各异的算网资源,形成事实上的资源涣散,亟须面向用户提供异网异构边缘算力的统一管控能力。 为了解决上述问题,工信部2025年5月21日印发《算力互联互通行动计划》,该行动计划提出建设多级算力互联互通平台,建设区域、行业算力互联互通平台,接入通、智、超以及云、边、端等各类公共算力资源。多级算力互联互通纵向上需要实现云边端业务互联互通,横向上需要实现跨域协作。在边缘计算领域,我国需要将局部边缘算力通过多种网络方式互联,形成统一的边缘算力资源层。 为了进一步引领我国边缘算力产业的规范化协调发展,本报告提出边缘算力系统这一新型算力基础设施,解决边缘算力整合难的问题,加速边缘算力服务的落地应用。边缘算力系统通过整合分散的边缘节点资源,构建分布式算力池,进一步释放边缘算力的潜力。首先,边缘算力系统能根据业务负载动态调度算力,让算力盈余的边缘节点将闲置资源共享给算力不足的节点或用户,通过节点间任务协作实现资源高效利用。提高闲置算力的利用率。其次,边缘算力系统通过多节点冗余备份,邻近节点可快速接管故障节点的任务,显著增强系统抗风险能力。最后,边缘算力系统通过多样化的网络实现离散边缘算力 节点互联互通,具备将网络与算力统一管控的能力,支持网络对计算任务的动态适配和优化。 1.2边缘算力基本概念 边缘算力是指在靠近用户侧部署的计算能力,具体包含推理决策、执行计算任务、存储数据、训练模型等能力,它不仅包括硬件层面的计算能力,如处理器的运算速度、内存容量、存储能力等,还涵盖软件层面的算法处理能力,如数据预处理、实时分析、智能决策等算法的效率和准确性。 边缘算力为各类实时应用提供了算力底座,通过在靠近数据供需两侧的位置提供数据处理能力,大幅缩短原始数据传输距离,从物理层减少延迟产生的因素,最终大幅降低端到端延迟。人工智能的训练和推理过程需要大量算力,鉴于各领域终端设备自身算力较低,智算中心实时性较差,边缘算力成为未来承载人工智能应用的重要载体。 边缘算力系统是一种依托多种网络连接技术将多元边缘算力整合为有机整体的算力基础设施。异网异构边缘算力系统的核心目的是通过边缘侧的算网编排与调度整合分散在各地的边缘算力机房,构建可按需调度的算力服务体系,提供应用、计算、存储、网联等边缘侧服务。 1.3边缘算力系统主要功能 边缘算力系统的主要功能包括边缘算力融合、算力实时响应、跨域计算协同优化和弹性容错机制。 促进异构算力融合,形成AI算力资源池。首先,边缘算力系统需要对各种不同来源的算力统一资源抽象与调度,采用容器化和虚拟化技术将CPU、GPU、ASIC等异构硬件资源抽象为标准化虚拟单元,通过Kubernetes扩展框架实现资源池化管理。其次,边缘算力系统加强各应用业务标准化接口与协议适配,建立跨设备协议对接机制,利用ONNXRuntime等框架实现模型跨平台部署,在边缘节点可将深度学习推理速度提升,使用轻量化中间件通过异步优化消息传输,降低边缘设备内存占用。最后,边缘算力系统实现端边云协同与弹性扩展,通过大量边缘节点构建泛在算力服务能力,支持大模型推理的弹性调度,算力管控平台可动态匹配任务与算力资源。 靠近用户提供服务,支撑全域实时响应。单一边缘节点的覆盖范围有限,若实时应用需跨区域协同或复杂度过高,可能超出单个节点的算力承载能力。边缘算力系统通过“就近节点联动”打破这一局限,通过多样化的网络互连邻近节点,进而采用算网一体化资源调度支撑计算任务协同。一方面,将跨区域实时任务分解至相邻边缘节点,各节点并行处理本地数据,再通过节点间低时延通信完成全局协同决策,避免单一节点覆盖不足导致的响应盲区;另一方面,通过算力聚合调度,多个节点的异构算力可协同支撑复杂任务,解决单点算力不足的瓶颈。 优化资源利用效率,提高实时应用稳定性。单一边缘节点的资源调度具有局限性,若某区域实时任务突发激增,孤立节点可能因过载导致延迟。同时,异构算力资源若缺乏协同调度,会形成“算力孤岛”, 无法按需匹配实时任务需求。边缘算力系统可以将计算任务进行拆分,通过协调直接服务节点临近的算力,实现服务提升与资源利用最大化。 强化边缘侧算网一体化协同,形成多目标调度策略。运营商难以将互联网内所有算力资源统一管控,为了实现边缘侧的灵活调度策略,边缘算力系统可以在靠近用户侧实现资源分治,减少云端的资源调度压力,为了满足边缘业务实时性需求,需要边缘算力系统在合理分配计算任务的基础上,动态围绕计算任务类型、部署位置和执行顺序优化网络通信路径。由于边缘侧业务种类随垂直行业和应用场景不断增多,就需要具有多种调度策略,依据应用类型决定算力和网络的调度优先级和权重,形成自适应的边缘算力与网络整体调度方案。 弹性协同容错机制,提升快速抗风险能力。边缘算力系统通过“多路径冗余”与“故障自愈”机制应对节点或网络故障。组网后节点可接入多元网络,当某一网络制式故障时,自动切换至其他可用网络;同时,组网形成的节点集群可实现“故障接管”,某节点故障后,相邻节点通过实时同步的资源与任务信息,快速接管其负责的实时任务。 二、边缘算力系统架构 2.1总体架构设计 2.1.1边缘算力系统功能架构 面向异网异构的边缘算力系统需满足异构资源整合、跨域(路由管理域)互联协同、算网统一管控调度等核心功能需求,其功能架构如图2-1所示,从逻辑上可分为边缘基础设施层、边缘算网控制层和边缘算网应用层三部分。 边缘基础设施层由边缘算网资源底座和边缘算力网关两大模块构成。边缘算网资源底座通过虚拟化技术整合异构算力资源和多个区域的网络资源,实现底层资源的统一抽象与灵活调度。边缘算力网关提供关键协同功能,利用算力发现与通告构建全局算网资源视图,依托传输连接管理、边缘算力协同实现算网资源统一调度,并通过标准化云边协同接口实现与上层系统的无缝对接。其中,算力发现与通告模块用于实现异构算力资源统一注册、动态发现及全局通告,构建实时资源目录以支撑算力协同调度。链路状态分发协议(BGP-LS)是收集、分发和传递算力资源信息的协议,使网络能够基于计算资源的状态进行智能路由决策。传输连接管理模块支持跨域协议及协议转换,保障多元网络环境下业务传输质量与可靠性;边缘算力协同模块用于实现算网应用与算力资源的自动适配、路由编排及故障处理,保障业务连续性与资源协同效率;云边协同接口模块通过标准化接口集成云 原生工具链,同步云边资源状态并支持断连自治,实现云边无缝联动与灵活协同。 边缘算网控制层是异网异构边缘算力系统的核心功能层,负责全域资源的统一管控与编排调度,包括算网资源管理和算网协同调度两大部分。边缘算网控制层通过标准化南向接口与边缘基础设施层交互,实现资源指令下发与状态采集,同时通过北向接口为上层应用提供开放的算网服务能力。算网资源管理模块通过全域资源监控、算网资源纳管、资源