您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [中国信通院]:可观测性技术发展研究报告 - 发现报告

可观测性技术发展研究报告

信息技术 2024-01-04 中国信通院 棋落
报告封面

(2023年) 版权声明 本报告版权属于中国信息通信研究院,并受法律保护。转载、摘编或利用其它方式使用本报告文字或者观点的,应注明“来源:中国信息通信研究院”。违反上述声明者,编者将追究其相关法律责任。 前言 现代信息系统往往呈现规模巨大、结构复杂和分布式架构等特点,使得传统的系统监控和调试方法难以满足全面观测和管理的需求,这给故障排查、性能优化和数据分析等任务带来巨大困难。在此背景下,可观测性技术应运而生。 可观测性技术通过引入实时日志记录、指标监控、分布式追踪等先进工具和技术,为企业提供全面、精确和实时的系统观测能力,从而帮助企业深入了解系统的运行状况、行为模式和性能指标。可观测性技术不仅仅是简单地监控系统状态,还可以提供对系统内部进行深度洞察的能力,有助于快速发现问题、定位故障,并采取相应措施进行故障修复和性能优化。 本报告探讨和解释了可观测性技术的概念、关键技术、落地路径和发展趋势,并深入分析了可观测性技术在故障排查、成本优化、数据分析等方面的应用和实践价值,旨在为读者提供有价值的指导和深入的理解。 最后,我们衷心感谢所有为本报告贡献宝贵意见和专业知识的专家、学者和行业从业者。我们热切期待与业界专家和用户共同探索可观测性技术的前沿发展趋势和应用场景,共同塑造一个更加可靠、高效和创新的技术世界。同时,我们也真诚地邀请各方专家和读者不吝指正,如报告中有不足之处,我们愿意倾听和改进,以提供更加优质的内容和观点。 目录 一、可观测性概述......................................................................................................1 (一)可观测性定义................................................................................................1(二)可观测性不是监控,是监控演进的下一阶段............................................1(三)可观测性应用场景广泛,多样价值获得认可............................................1二、可观测性起源......................................................................................................2(一)可观测性起源................................................................................................2(二)IT技术持续发展为系统稳定运行带来巨大挑战.........................................3(三)云时代到来,加速可观测性需求涌现........................................................5三、可观测性价值总体视图......................................................................................5四、可观测性的内核剖析..........................................................................................8(一)可观测性“三大支柱”.....................................................................................8(二)更多样的观测数据,持续丰富可观测性内核............................................9五、可观测平台能力构建........................................................................................10(一)统一构建方式..............................................................................................10(二)统一数据模型.............................................................................................. 11(三)统一信息处理..............................................................................................12(四)统一查询分析..............................................................................................13(五)统一内容消费..............................................................................................14(六)环境适配能力..............................................................................................15(七)行业标准参考..............................................................................................16六、可观测性应用场景............................................................................................17(一)系统实验与测试..........................................................................................17(二)站点可靠性工程(SRE)............................................................................18(三)数据可观测..................................................................................................20(四)故障根因分析..............................................................................................21(五)云成本可观测..............................................................................................22(六)安全可观测..................................................................................................23 七、可观测性落地效果............................................................................................24(一)提升基础设施全面控制能力......................................................................24(二)实时洞察应用性能优化需求......................................................................26(三)理解用户需求和优化体验..........................................................................28(四)精准控制变更并优化发布效果..................................................................29(五)洞悉业务状况并提升决策能力..................................................................31八、可观测性发展趋势............................................................................................32(一)可观测技术发展趋势..................................................................................32(二)可观测产业生态趋势..................................................................................33附件1……………………………………………………………………………………………………………………..35 图目录 图1可观测性价值总体视图.....................................................................................6图2链路追踪示意图.................................................................................................9图3可观测性平台架构...........................................................................................17 表目录 表1可观测性开源项目或协议................................................................................35 一、可观测性概述 (一)可观测性定义 在信息系统及云计算领域中,可观测性指的是通过系统的外部输出来度量系统内部运行状态的能力。可观测性工具的工作原理是通过不断进行探索性调查的迭代过程,确定系统问题可能出现的位置和原因。它的目标是使我们能够主动地识别任何故障模式,无论是已知的还是未知的。 (二)可观测性不是监控,是监控演进的下一阶段 从概念内涵上来说,监控和可观测性是相互依赖的不同概念,“监控”是为提高系统的可观测性而执行的操作,“可观测性”是该系统的一个属性,如功能性或可测试性。从覆盖范围来说,监控是从系统出发,关注系统本身的健康情况;可观测是从业务出发,关注业务的健康情况,因此范围更广更大。从应用目的来说,使用监控是用来判断系统是否可用,通过可观测性可以实际指出问题位置和具体原因。从操作性上来说,传统的监控工具通过对照已知阈值检测系统条件来工作,这些阈值将提示是否存在已经设定条件的错误。这是一种非常被动的方式,因为只能发现已知的问