AI智能总结
黄蕴思广东移动IT运维专家 广东移动AIOPS应用推广负责人,IT运维专家,曾参与信通院AIOPS、MLOPS等相关规范标准和实践指南的编写。 01 广东移动运维能力的发展 目录Content 02 AIOPS工具的中台化探索 03 实践案例分享 04 01 广东移动运维能力的发展 我们的运维工具发展历程 自主自愈无人值守 Ø绝大部分关键场景应用自动化和智能化技术,实现无人值守终极目标 目前我们已具备的运维工具广东移动新一代数智化运维管理平台(IT网管+子平台) 我们沉淀的成熟运维能力 资源优化 AI+知识经验双模智能故障诊断 AIOPS工具的中台化探索 我们参考学习的“大拿”思路 清华大学计算机系裴丹教授作了题为《智能运维(AIOps)趋势解析》报告,说到了9大趋势,其中的趋势6就是AIOps算法服务化。 中国通信标准化协会《智能化运维AIOPS能力成熟度模型》也提及了算法模型服务化能力的要求。 “搭积木”形式的运维工具复用和组装思路 中台能力组装层 Ø以API、SDK等标准化接口的方式对外提供服务Ø可选取相关运维能力进行调用并重新组装Ø可把组装好的能力进行实际的场景应用 敏捷编排能力层 Ø原子能力层、AI算法层为底座Ø基础原子操作组件、AI算法服务学件整体融通Ø实现原子操作和AI算法的互相调用融合 零件库之:算法仓库 各原子算法应用的场景数 01 各能力域包含的场景数及使用算法数 02 相同算法不同场景/作者使用情况 03 04 武器库:学件编排 应用场景 实践案例分享 实践案例1:敏捷编排,降低AIOPS工具开发门槛 每层发布为对应的算法服务,根据调用次数、满意度等信息,不断发现沉淀优秀的运维场景算法服务。降低开发门槛,快速构建AIOPS工具 实践案例1:敏捷编排,降低AIOPS工具开发门槛 多层服务->多级调用 实践案例2:快速组装,形成多场景联动的运维工具 实践案例2:快速组装,形成多场景联动的运维工具 武器作用 横向结合 AIOPS开发的门槛降低,实际使用工具的运营人员可以自行按需完成二次开发。 业务主导 通过复用已有的算法、采集数据、能力输出并形成新场景,降低同类场景再开发损耗成本。 节省场景再开发成本60% AIOps场景建设效能提升 运维效率 ü告警处理时间下降75%ü故障发现时长缩短了50%ü故障恢复时长缩短了55% 04 未来展望 后续重点研究和应用方向 ØAIOPS with大模型? 客服智能问答 工单智能处理 智能统计质检 路漫漫其修远兮。。。 u我们还在不断尝试各种XOPS场景的开发 u我们正在探索中台与智慧运维的结合 u我们也在寻求利用AIOPS实现运维的降本增效 u我们也期盼交流新技术、新理念在运维中的应用,例如元宇宙、大模型 Thanks DevOps时代社区荣誉出品