AI智能总结
基础设施运维数据体系建设实践 周鹏飞 01基 础 设 施 运 维 数 据 体 系 总 体 介 绍 02运 维 数 据 平 台 建 设 03运 维 数 据 场 景 化 应 用 04运 维 数 据 体 系 发 展 展 望 PART 01 基础设施运维数据体系总体介绍 运维数据体系建设的道法术器 运维数据体系总体架构 CMDB(应用系统、基础设施资源) PART 02 运维数据平台建设 建设挑战 基础设施运维数据体系涉及多个专业领域(云、网、数据中心、安全、操作系统),技术面广,建设门槛高。 基础设施是数字世界与物理世界的底层连接,无法完全去除人工操作,存在虚实不一致挑战。 行业特性,券商业务基础设施服务个性化场景多(极速网络,组播网络,超频计算等),标准化难度大。 建设思路 ◆消费为始,消费为终,场景驱动◆生产是源,溯本求源,标准优先◆治理为辅,度量作尺,质量优先 数据生产能力建设 数据消费能力建设 数据集中,消费分散 统一汇聚1 异构数据源统一接入数据湖仓,实现数据归集 统一建模2 按照领域建立宽表数据模型,构建扁平化数据结构 统一接口3 应用场景遵循同一套领域数据消费模式 场景分散4 根据需求自主建设基于场景化的数据计算分析和展示 G O P S全 球 运 维 大 会2 0 2 4·深 圳 站 数据治理能力建设 无场景不度量,无度量不治理 源头治理 场景驱动 指标度量 •主数据度量指标•场景化关系数据度量指标 •数据消费驱动数据完备性建设•数据应用驱动数据治理能力建设 •问题驱动制度流程优化•数据生产环节实现治理闭环 制定方案 数据治理 人工确认数据生产环节问题,形成数据生产流程优化方案 数据中心拓扑数据治理 数据治理原则: PART 03 运维数据场景化应用 服务场景—服务器上架 场景痛点 上架场景影响因子多,需要综合考虑机架机位空置,机架电流载荷,服务器额定电流,业务网络接入要求,机柜交换机端口空置,机柜使用成本和布线合理性等因素,通过人工很难挑选出合适的机位。 ◆机架机位自动分配 ◆接入交换机端口自动分配 ◆存量机柜机位合并优化策略推荐 运维场景—网络运维保障 发现 定界 场景痛点 ◆干扰告警多,导致发现难,低级告警也可能影响核心业务 ◆“X”故障监控逃逸风险,导致发现难,存在无法通过资源监控发现的故障隐患 ◆点状告警,人工无法推断面上态势,导致定界难数据化解决方案 回归运维本质,构建围绕业务的监控感知能力 面上运行质量感知 运营场景—虚拟机资源效能运营 PART 04 运维数据体系发展展望 发展展望 业务与技术双向奔赴仰望星空,脚踏实地 展望未来 ◆基础设施支撑技术(如SDI)的发展,推动业务场景标准化自动化,生产出更多优质原生数据,降低运维数据体系建设难度。◆数据分析技术(如AI)的发展,降低数据治理与应用门槛,更好地赋能营运场景。 立足当下 ◆部分新技术在场景应用方面未取得很好的效果。◆综合运用多种手段(管理或技术)实现最好的业务结果。 高效运维社区DevOps时代 荣誉出品 感谢大家观看




