AI智能总结
SELECTED CASES OF IT OPERATIONS ANDMAINTENANCE EXCELLENT CASES 博睿数据重磅发布 前言PREFACE 当前,在数字化、信息化的科技变革浪潮中,新一代信息技术与其他产业加速融合,推动新生态、新技术、新业务不断涌现。新技术的飞速发展在创造了企业数字化转型机遇的同时,也使得运维工作的重要性更加凸显,没有一个稳定、安全、可靠的IT基础环境,数字化便是空谈。 在此背景下,AIOps 智能运维正成为企业高效管控种类繁多数量庞大的物理设备、精准定位故障信息、实时防护网络攻击、快速迭代需求变更等新时代运维场景下不可或缺的科技力量和解决方案。 博睿数据作为中国智能可观测领域的领导者,15年来以深厚的技术积累不断打磨产品和服务能力,已在IT运维领域形成了自身的独特优势,并将一体化运维监控和AIOps等解决方案落地到各种客户生产环境之中,为银行、证券、保险、高端制造等行业的数字化、智能化转型持续赋能,已获得1000+头部客户的选择和信赖。 《博睿数据智能运维优秀案例全集》是中国智能运维领域首个全行业案例集,覆盖行业最广,案例数量最多。收录了15年来博睿数据服务全行业领先客户的50家标杆案例,更有多个获得信通院、《金融电子化》、爱分析等权威机构优秀获奖案例分享,涵盖金融、互联网、能源、制造业等行业上百个场景,请大家伴随我们的最佳实践开启一段“让IT运营更智能”的新旅程。 目录 01公共事务 04保险 08制造业 泰康保险70新华保险73太平金科76中宏保险79华农保险82 1230601某省级政府办公厅04济南公积金07青岛公积金10 格力电器130北方华创133广汽本田136广汽丰田140北汽集团143蓝谷极狐汽车146 02银行 05互联网 富邦华一银行13华夏银行16平安银行19中国光大银行22中国建设银行25中国农业银行29中信银行32银联云闪付35 09通信运营商 华为85腾讯视频89京东智联云93新东方96敦煌网101正保教育10451talk107 联通沃音乐149江苏有线153 10传媒 新华网156 06航空 03证券 11信息产业 东方证券38国泰君安证券42红塔证券45招商证券48中信建投证券51中银国际证券54光大证券58东北证券61华安证券64国金证券67 南方航空111深圳航空114 曙光信息160 07能源 国家能源集团117国网商旅云120中国海洋石油集团有限公司123中国石化集团公司127 博睿数据助力12306打造出行领域的智慧样本 12306是全球最大的票务系统,累计注册用户6亿+,年售票40亿张,超8成在移动端APP完成购票交易,单日最高售票量突破1700万张,互联网网售票占比超过90%。通过算法改进、云端技术的发展、数据及人工智能技术的加持,做到一天1500亿次暴击下而不崩溃,但仍有APP卡顿等问题影响旅客购票体验。 背景分析 用户体验无法量化,用户满意度提升难 用户使用体验难以分析、用户业务感受难以量化、用户体验难以准确掌握; 数字化投入产出比难以量化,造成投入浪费,成本居高不下 广告投入性价比低,成本过高;外包开发周期/质量,开发成本高;信息化扩容评估缺失,扩容成本高; 缺乏有效的监测手段,性能故障解决效率较低 IT系统上线成功率低、网络突发流量应对能力低、故障诊断效率低。 应用场景 量化分析用户体验 在正常情况下,12306一个小时的活跃会话数稳定在数百万,通过Bonree SDK可实时监控响应时间、请求错误率、应用崩溃率等重要数据,使12306能够在访问高峰期,随时掌握用户体验情况。 量化业务感受 根据12306的特性,博睿数据特地为其打造了一个特色功能,即通过Bonree SDK对用户活跃行为及用户粘性进行分析。用户活跃方面,即按照App版本和渠道维度统计DAU和MAU,以此来分析用户的活跃程度,进而可帮助12306提出具体策略,留存用户。用户粘性则是根据12306 App版本和渠道维度统计用户日启动次数,分析用户使用App的程度,进而提出解决方法。 提高用户体验 博睿数据从业务层面为12306设计了提高用户体验的方法,即从APP版本和渠道维度,统计用户的使用路径,帮助12306从用户的体验路径去留存转化用户。 为什么选择博睿数据 技术创新能力有目共睹 1000+客户的信赖与选择 国内首家,唯一通过信通院根因分析测评优秀级的厂商 博睿数据在多年的服务中得到了各行业客户的认可 应用效果 降低应用崩溃率 优化业务系统 应用崩溃率大幅度降低 可视化用户购票流程,助力业务系统优化 购票业务平均响应时长得到降低 博睿数据赋能某省级政府办公厅数字化转型与升级 博睿数据平台和探针均部署在国产化环境。通过BonreeAgent自动对宿主机上目标容器里面的应用进程进行自动识别和探针部署、配置。应用拓扑自动关联,可视化展现应用运行的状况。,时发现性能瓶颈和故障根因。 背景分析 国产化环境应用兼容性有待提升1 容器环境探针部署困难2 异构平台监控工具兼容差3 不能及时定位根因4 应用场景 针对运行在国产化环境,平台和探针对此做了适配1 探针自动化部署,无需手工干预2 完美适配华为和腾讯不同异构容器云平台3 实时关注已经上线应用的状态,分钟级定位关于响应时间延迟的类和方法级详情4 为什么选择博睿数据 品牌力强 兼容性强 客户相信博睿数据的品牌,相信博睿数据的行业地位 博睿数据已与众多国产化软件优秀厂商完成了产品兼容互认 应用效果 简化应用发布流程探针部署的时间从数周缩短为2小时 在国产化环境下软件可用性从95%提高至98.6% 应用故障的根因定位时间从过去平均需要1天以上降为5分钟 完美适配异构容器云平台填补过去应用性能监控空白 济南公积金的全面可观测性建设 博睿数据通过对济南公积金各项服务进行日常监测,实现系统的全面可观测,可主动发现问题,有效缩短了排障,周期保障了终端用户的正常使用体验,确保了电子渠道相关业务的正常运行。 背景分析 业务系统稳定性要求高 1 公积金业务面向大众,对系统的可用性和用户体验有极高要求,需对系统进行常态化保障及预警; 缺少系统性能可视化手段 2 业务系统缺少应用性能监控手段,运维人员无法全盘掌握业务运行过程中的整体性能变化趋势; 业务排障周期长3 由于缺乏完善的故障诊断流程,运维人员之间缺乏有效的协同机制;且由于微服务下的业务调用链需要多部门协同诊断,造成复杂故障的排障周期长。 应用场景 搭建基于微服务架构的应用性能监测平台 Bonree Server可自动发现济南公积金docker环境下系统的调用关系,全面展示IT架构各环节健康状况,定位集群中拖累主机,逐层问题剥离分析,提升排障效率。同时,将原本不可见的业务系统间的复杂调用逻辑进行可视化展示,完成应用性能监控从无到有的转变,帮助运维人员清晰系统架构,降低运维工作成本。 构建应用评分体系,提高运维效率 通过构建应用评分体系,以统一标准管理应用系统,使济南公积金可以高效的确定性能优化的重点;同时,让多个部门有了沟通问题的的数据桥梁,不再各自为战,做到步调一致力量一致,高效排障。 实现数据可视化,重新定义排障流程 在故障定位方面,博睿数据协助济南公积金重新定义排障流程,通过点击分析可以快速定位耗时较长的关键业务,从而实现数据可视化-确定故障域-定位故障点的排障流程,最终实现问题发现时间由小时级缩短到分钟级。 为什么选择博睿数据 顺应信创发展趋势 超高满意率的金牌服务 产品开箱即用、简捷高效,产品适配信创范围位居行业前列 7*24小时协助排障,客户满意度达到95% 应用效果 可视化应用系统性能,优化系统架构 提升排障效率 故障诊断时间从4小时下降至10分钟 主动发现业务链路中系统性能瓶颈,优化后系统整体响应时间提升5倍以上 预前发现系统数据库事件3起,404事件10起,关键业务接口调用异常5起 青岛市住房公积金管理中心 青岛住房公积金管理中心排障定位时间缩短一半以上 博睿数据通过数据采集、集中化实时监控、应用拓扑功能、多维度拓扑展示、调用链进行全量采集与代码调用追踪、线程关联与剖析、预警告警、监控调用的第三方接口或远程地址、数据处理、响应时间分布图变化、统计分析和报告书等几个方面的建设,帮助青岛住房公积金管理中心系统成功搭建统一的监控体系,有效提升排障效率。 背景分析 业务规模不断扩大,对系统稳定性提出了更高的要求 随着越来越多的公积金服务线上化与青岛住房公积金贷款业务规模的不断扩大,对青岛住房公积金管理中心系统的稳定性也提出了更高的要求; 问题排查耗时长,影响用户体验 点击卡顿、下拉失败、调用失调等问题,如何进行前瞻性排查,或是在发生之际如何快速找到原因并修复,为用户提供更加稳定优质的使用体验; 传统运维方式难以满足现在的工作需要 通过人工对数据与系统进行监控,越来越难以满足现在日益复杂的工作要求,青岛公积金亟需一套更先进的工具,赋能业务信息系统。 应用场景 搭建统一的监控体系,实现高效管理 博睿数据通过数据采集、集中化实时监控、应用拓扑功能、多维度拓扑展示、调用链进行全量采集与代码调用追踪、线程关联与剖析、预警告警、监控调用的第三方接口或远程地址、数据处理、响应时间分布图变化、统计分析和报告书等几个方面的建设,帮助青岛住房公积金管理中心系统成功搭建统一的监控体系 。 快速解决问题,提高排障效率 在Bonree Server的助力下,迅速发现程序运行的故障,帮助理解系统行为,分析性能问题。在故障发生时,帮助快速定位和并高效解决问题,平均节约一半以上的排障定位时间。 业务稳定性有保障,提升用户使用体验 用户不仅能够通过官网全面了解最新公积金政策与手续要求,同时线上缴存、转移、提取、贷款、查询等一系列动作也得到了有力支撑,大幅提升用户对该系统的使用体验。 为什么选择博睿数据 产品的稳定性与安全性无可置疑 公司实力值得信赖 博睿数据拥有十余年技术沉淀,安全稳定低侵入 国内A股唯一APM上市公司,APM市场份额排名NO.1 应用效果 实现监控一体化 监控覆盖面的各类自定义扩展 提高运维可视化能力 监控的采集、存储、检测、告警、事件、处置形成了有效闭环 支持适配传统组件和其他各类互联网组件 展现IT运维全局 实现有效管控 极大提高排障效率 提供验收指标 对于整个系统的可用性和性能进行有效评估 对于新上系统或者新上功能提供确定关键型的验收指标 博睿数据全面保障 富邦华一银行业务稳定性 博睿数据助力富邦华一银行建设以业务为中心的IT运维体系以及全面的IT架构平台系统,为富邦华一银行的应用运维和基础运维提供了多种运维管理场景,规划以流程管理、配置管理、监控管理、故障资源、日志检索、自动化能力等为基础,并考虑后续DevOps、大数据和智能运维的可扩展性。 使用产品 Bonree Server 背景分析 银行资源急剧增长,难以实现全面的监控覆盖 银行业务场景多样,运维方式面临挑战 随着IT业务持续增长,富邦华一银行应用资源规模急剧扩大,爆炸式增长导致传统面向资源的管理模式只能解决单点问题,无法实现贯穿业务的始末,导致出现场景断层,难以基于现有IT业务实现全面的监控覆盖。 运维场景化的对象是不同的业务系统,富邦华一银行业务场景复杂度的提升加大了对运维的挑战,如业务系统之间调用的关系、业务系统中的各模块状态、关联关系等都会导致故障发现、故障解决和运维时效性等难度的提升。 运行指标数据增长,业务稳定性难以保障 面对大量故障告警,定位周期长 富邦华一银行业务量、软硬件类型和数量等增长,带来数据量的增长,如监控数据类型、运行指标的数据量和业务数据等,面临无法数据整合关联,难以进行计算分析等难题