AI智能总结
总故障时间下降近60%,MTTR下降50%! 2023年9月 概述 在注草效率的今天,“建立更好、更快、更智能的系统”及“从据中获得洞察”已经成为企业取胜的基本费系。 此自皮书是关于尊容数据的最佳实践案例,作为国内首个打造一体化智能可观测平台的厂商,博客数据的运维团队也部署了BonreeONE产品,取得了令人惊喜的效果: ••••*风,险问题提前发现并修复,故障次数下降超过60%·"央速定位问题及影响范围,根因分析帮助MTTR降低50%从0到1实现故障报普收欧,收敏比达98%以上,有效避免报警风案,首次实现资滤治理:单月降低成本近30W,护合为节省的物理机数量:生产环境67台;测试环境2台 通过阅读这份最佳实践白皮书,您将能够发现更多让企业在复杂坏境下提升效率,释放港力的创新方法。 技术优势 我们做到了,你也可以 1.风险问题提前发现并修复,故障次数下降超过60% •,BréeONE平台能够发现公有云上的风险问题并及时修复,在风险增长中提前治坦运制,故障呈下降收效趋势。 •,过去,公有云平均每月故障13.67次,现在,公有云平均每月仪故境5次。 •,由上图可见,2022年下半年公有云共故障82次,而到2023年上半年,公有云故障次数减少至30次,故障次效下降63.41%! 我们做到了,你也可以 2.快速定位问题及影响范围,MTTR降低50%! •,BOnre良ONE平台的根因分功能帮助博容数据运维因队首次实现了智能的问题分析与问题定位, ••,通过根因分析功能,运维人员能够快速定位间题原因以及影响范;摆脱了一直以来出问题要登录机器驻台排查的模式,向”1人运维“的愿景又近一步。,据统计,博容数据系统2022年下半年的总故障时长为4470分,侵用0N上平台的根天分析功能后,2023年上半年总故障时长巨下降至2079分钟,MTTR下降50%! 3.故障报警收敛,避免报警风暴 •又是一个全新功能的实现与复用!博睿数据运维团队在没有ON平台之前,使用传统的Zabbix和Prorretheus,没有对改障进行收效的功能。 •:而在复用BonreeONE平台后:使用了根因告警同步收敛功能:有效降低报曾风景。 •,上图为公有云上ON对故障的收效比,由图可见,无论是近7天还是上个月一整月;收效比均达到98%以上。 我们做到了,你也可以 4.空闲资源回收,单月节省成本近30万 我们做到了,你也可以 4,空闲资源回收,单月节省成本近30万 •博数据运维团队通过BonreeONE平台初次实现了资源治理,通过发现生产环境的虚拟机资源使用情况,对于空闲资源进行回收。 •团队使用0NE的资源治理功能实现了良好效果,以刚刚过去的8月为例单月节约的成本约30万。 之前没有做过这样的事情,或没有意识到资源浪费的问题通过BonreeONE的资源治理的概念,进行了资源回收回收下来的虚拟机资源折合成物理机就是生产环境6-7台,测试环境2台。 博睿数据运维团队负责人 这些数据就是证明 我们希望这份最佳实践白皮书能对您未来的数智化发展有所启发 如需了解更多信息,请访问https:f/www.bonree.com/以获取相关资料、资源及免费试用 了解详细内容 免费试用 让IT运营更智能400-680-8085