AI智能总结
新 型I C T基 础 设 施O & M蓝 图 2 0 2 5年0 7月 伙伴单位 编制和撰稿人 NIDA战略咨询委员会: 邓一鸥、郭晓岩、黄伟红 白皮书编制和案例贡献人: 马军锋、刘芷若、黄河、李生、林永明、施震宇、刘春、李业兴、王泽林、韩赛、洪伟杰、鲍中帅、谢锐、戴凯明、刘鹏、汪燕、蒋宇奇、王辉、朱峰、李庆恩、张许宝、赵凤华、王晨敏、王时兴、鞠久青、陈国语、吴波、王东、罗兴、李锐、刘子建、蔡文佳、赵昊 目录 01产业趋势 05 AEI演进节奏 1.1企业运维从数字化到数智化的跃升1.2企业新型ICT基础设施Agentic AI运维趋势 5.1 Phase1:域内自智5.2 Phase2:跨域自智5.3 Phase3:群体智能 02 06创新实践 愿景及关键特征 2.1 AEI定义2.2 AEI的愿景2.3 AEI的关键特征 6.1高效运维:清华大学携手华为打造业内首个园区网络智能体,驱动校园网络运维迈向“自动驾驶” 6.2高效运维:交通银行携手华为打造金融网络智能体,重构网络运维新范式6.3以网强算:科大讯飞联合华为开启双子星计划,开创AI大模型高性能网络新时代6.4数智融合:联通格力携手广东联通,打造家电制造数智融合“灯塔工厂”6.5以“智”加“数”:东风汽车联合华为数据中心ADN多云多DC方案,迈入智联时代 03价值场景 3.1数据中心价值场景3.1.1算网存故障处理3.1.2算网存利用率提升 07缩略语 3.2智慧园区价值场景3.2.1用户体验保障3.2.2网络通感一体 参考架构和使能技术 4.1参考架构4.1.1智能体的核心机制4.1.2智能体的交互方式 4.2使能技术4.2.1 AI Agents技术4.2.2 Multi-Agent技术4.2.3数字孪生技术 1产业趋势 1.1企业运维从数字化到数智化的跃升 过去数十年间,技术浪潮奔腾不息,企业管理从信息化、数字化逐渐迈入了智能时代。企业运维为企业高效运转、实现战略业务目标、从数字化到数智化的跃升发挥关键作用。 了变革的焦点,Gartner将Agentic AI列为2025顶级技术趋 势 的 第 一 名,OpenAI在2025年5月 发 布 的《Practicesfor Governing Agentic AI》 中 定 义,Agentic AI是 在 没 有事先规定行为的情况下,能够自主采取行动,在一段时间内持续达成目标的系统。Agentic AI能够解决分析复杂的目标、能够适应跨领域多相关方的复杂环境、灵活应对异常/意外情况,并在有限的人为干预下可靠的实现目标。从AI Agents走向Agentic AI系统,其最重要的变化是,1、Agentic AI的任务场景更复杂,过程中存在不确定性,需要持续地评估中间结果并动态规划;2、Agentic AI具备自我学习的能力,能够基于经验决策,任务执行过程的持久化记录和反思总结。 随着Agentic AI(代理式人工智能)的到来,企业运维也从自动化、AIOps(智能运维)向自主运维进化: •信息时代:效率提升与自动化 在信息时代,运维的核心诉求聚焦于提升效率与简化操作。告别了晦涩难记的命令行交互(CLI),直观的图形用户界面(GUI)成为主流,大幅降低了操作门槛。与此同时,自动化技术迎来了曙光,通过精心编写的脚本逐步替代繁复的手工操作,将运维人员从重复性劳动中解放出来,显著提升了基础设施管理的一致性与执行速度。这是运维工作从“原始手工”迈向“系统化、可管理”的关键转折点。 Agentic AI时代,这种具备高度自智、目标导向能力的智能体(Agents)正在成为企业基础设施运维生态的核心参与者。这些智能体不仅能独立感知环境、分析数据、做出决策并执行操作,更能通过高效的协同机制,在复杂的基础设施环境中完成跨域、跨系统的复杂运维任务。作为生产力提升的关键力量,智能体正在从根本上完成企业运维从“机器辅助人”到“人辅助机器”自主运维的进化。 •数字时代:数据驱动与智能运维(AIOps)崛起 随着大数据技术的蓬勃发展与机器学习(ML)等技术的日益成熟,运维领域迎来了深刻的变革,步入数字驱动的时代。智能运维(AIOps)成为核心特征。运维系统开始大规模、实时地采集涵盖性能指标、日志、事件、拓扑关系等维度的海量基础设施数据。借助大数据分析、模式识别和预测算法,实现异常检测、根因分析、容量预测、性能优化等复杂任务。运维工作从被动响应转向了主动洞察与预测性管理。 2024年,中国信通院发布的《企业数智化能力成熟度模型(EDMM)标准》,将企业数智化分成“数据智能基础设施”、“数据智能中台”和“数据智能应用”三层。本白皮书将重点围绕“新型ICT基础设施”,基于Agentic AI的企业自主运维进行阐述,并分析了面向2035年的三大趋势。 •Agentic AI时代:智能体协同与自主运维进化 在日新月异的AI技术革命中,具备Agentic特点的AI成为 趋势二:Agentic AI带来的运维模式变化,将促进基础设施感知、控制、韧性等能力提升,最终带来运营运维效率的提升,实现企业基础设施的极优体验。(智能原生) 1.2企业新型ICT基础设施Agentic AI运维趋势 趋势一:Agentic AI带来运维系统生产力提升,企业运维走向智能体自智的时代,运维系统无人值守成为可能,企业基础设施的极简运营将成为现实。(自智运维) 有人环境下的运维系统,由于人类精力和大脑信息处理效率的限制,其注意力必须集中在处理最重要最紧急的信息上,如果还想进一步处理那些次重要,非重要的信息,那么海量的信息将会淹没数量有限的运维人员。有人运维系统的处理能力存在上限,这就限制了基础设施为运维系统提供更多信息和能力。 Agentic AI具备环境感知、主动决策、持续学习的能力。智能体自智作为企业运维生产力提升的关键力量,系统能够在无人干预的情况下,自动完成企业ICT基础设施日常运维任务,实现7×24小时不间断运行。 Agentic AI使得运维系统能够在无人环境下运行,从此运维能力上限不再受限于运维人员素质和数量。而面向能够在无人环境下运行的Agentic AI运维系统,通过提供更多的监测数据,更敏捷的控制接口,更具韧性软件的基础设施,就能够充分发挥Agentic AI运维系统处理信息的能力强于有人运维系统的特点,实现处理海量精细的基础设施状态、性能数据,对基础设施各细分场景进行实时优化,面对突发问题自动即时地实现业务的隔离和恢复。 这种具备自智能力的Agentic AI运维系统有如下几个特点,一、具备对基础设施故障的自主诊断、自主修复能力,能够在无人条件下,由智能体可靠地应对突发情况和意外故障;二、能够通过监控设施状况,通过多种手段预测基础设施亚健康状态,通过预防性处置,降低故障产生的概率;三、运维智能体能够依据当前基础设施状态,结合业务需求,通过灵活调度资源,持续劣化调优,持续保障业务运营体验最佳。 面对未来Agentic AI错综复杂,彼此关联的场景,将能够通过包括智能体健康状态实时监控,推理过程日志保留,基础设施原生智能体要求做到交互留痕做到可追溯可追责,变更业务跟踪监测,异常情况迅速回滚等多种手段,保障企业Agentic AI系统可靠运行。Agentic AI能够打开运维能力上限的限制器,并促进基础设施感知、控制、韧性能力同步提升,最终为企业运营运维系统带来极优业务体验。 最终,Agentic AI运维系统实现自配置、自修复、自优化,运维智能体自主实现分析问题,巡检机器人自主完成上站点巡检工作,执行操作,最终实现Agentic AI企业运维时代的极简运营。 Agentic AI时代企业运维的重要课题之一就是提升这种分布式架构下多智能体协同效率和质量,其关键在于适配分布式多智能体环境的算力、存储、通信基础设施系统:高性能的算力基础设施,能够存算分离与弹性扩展;一体化算力调度平台,能够实现算力资源跨区域弹性供给和智能调度;高速高稳的通信网络,能够保障算力资源调度和多个AI之间的通信效率。 趋势三:Agentic AI将加速企业复合型分布式模式转型,提升多智能体协同效率和质量,保障企业基础设施资源的极高可用。(群体智能) 当前AI技术蓬勃发展,各类人工智能模型种类繁多,不断迭代,这些模型都有自己独特之处,并正在快速发展。没有一个单一的模型可以同时满足所有功能性和非功能性要求。例如,通用模型用途广泛,但在小众领域可能表现不佳。相比之下,专业模型在特定领域表现出色,但在处理训练范围之外的任务时,其表现不尽如人意。因此,规模和目的各不相同的多个模型协同才能最大可能满足需求。由于企业对AI产品的需求呈现出多种类,专业性的特征,多模型策略将有助于企业机构在动荡的市场环境中充分利用人工智能的能力。Gartner预测,到2027年,中国采用复合型AI的企业将比只依赖生成式人工智能模型的企业领先两年实现AI落地。Agentic AI具备专业领域内自主分析决策的能力,传统分层式架构指令交互不适合用在多Agentic AI之间,要充分发挥各智能体的能力,智能体之间通过分布式的协议约定,机机互联,以极简、智能化的交互方式,形成多智能体系统决策能力。 Agentic AI从辅助性支撑逐步走向决策性执行,智能体的可信和可解释性成为关键,企业运维通过多种手段提高Agentic AI系统可信和安全韧性。Agentic AI能够进行自主决策性的指令执行,当下发的指令出错时,可能会导致严重的后果,Agentic AI在完成从辅助性支撑到自主决策执行的转身过程中,需要与之配套的企业运维系统从多个角度尽可能的提高系统的可信度和安全韧性。 企业运维系统需要构建并维护一套适配Agentic AI时代的算网存基础设施,保障企业复合型分布式智能体发挥能力,助力企业高效稳定地完成Agentic AI转型,实现资源的极高可用。 2愿景及关键特征 2.1 AEI定义 面向智能世界2035时代,企业正在加速迈进多智能体协同决策与自主任务执行的智能化升级。Agentic AI被视为企业运营效率变革、业务极简运营的核心驱动力。在智能制造行业,Agentic AI替代人力监控ICT系统运营并故障自动处置,实现7*24销售无人不间断运行的黑灯工厂模式。Agentic AI将推动企业体验管理进入“感知-预测-执行”闭环时代,成为客户、员工、管理层极优体验保障的关键。以园区智慧通行例,Agentic AI赋能园区智能门禁、智慧泊车、智慧电梯等基础施智能化,助力客户、员工的“无感式服务”通行体验(需求未诉已满足),保障通行的安全性、便捷性、舒适性。据Gartner预测,至2028年全球15%日常决策将由Agentic AI自主完成,极高可用将成为企业智能化核心竞争力。在金融行业,Agentic AI将推动金融业务从“被动灾备”转向“主动免疫”,即便硬件故障或网络攻击,智能体网络仍可保障服务无损,金融交易Agent通过协同协议实现节点故障时毫秒级任务迁移,保障核心交易零中断。 群体智能Adaptive Multi-Agent •意图交互:智能识别客户意图,持续保障客户目标达成。•机机智联:系统间极简、智能化互联互通(MasterLink)。•多智能体:系统间通过Agent交互,多智能体交互,形成决策能力。 AEI(Agentic Enterprise ICT-Infrastructure( 以 下 简 称 为ICT-Infra)),即Agentic AI时代的企业新型ICT基础设施。围绕企业业务以极高可用、极优体验、极简运营为目标导向,从智能原生和韧性、运维运营系统智能体自智能力、群体智能的自适应性和自进化三个方面构建新型ICT基础设施。 自智运维Autonomous O&M •隐患预防:基础设施亚健康提前预测和处置,降低故障产生概率。•自主智优:主动对基础设施健康状态智能调优,持续保障业务体验最优。