登录
注册
个人信息
我的订单
我的报告豆
我的优惠券
我的笔记
我的阅读
我的收藏
我的下载
我的上传
我的订阅
在线客服
退出登录
回到首页
AI
搜索
发现报告
发现数据
发现专题
专题报告
专题百科
研选报告
定制报告
VIP
权益
发现大使
发现一下
行业研究
公司研究
宏观策略
财报
招股书
会议纪要
seedance2.0
低空经济
DeepSeek
AIGC
大模型
当前位置:首页
/
行业研究
/
报告详情
刘征-APM分布式追踪实践不只是埋点
信息技术
2023-04-14
2023中国DevOps社区峰会·武汉站
silence @^^@💗
核心观点与关键内容
APM 在分布式系统中的作用
核心功能
:管理和优化应用系统的性能基线,通过分布式追踪分析请求在系统中的流动过程。
优势
:与编程语言、运行时、部署环境无关,适用于各类应用或服务,提升团队协作能力,缩短问题检测与解决时间。
采样开销与成本
原则
:尽量不产生副作用,合理评估和规避采样开销。
应用开销
:
延迟增加
:创建、结束 span,添加标记、日志等事件产生延迟。缓解方案包括优化线程调度、使用可重复缓冲区、优化埋点粒度、降级影响度。
吞吐量占用
:固定基础设施处理请求数有限。缓解方案包括减少链接次数、使用长链接/压缩数据、设置合理采样率(如 Google 采用 16/1 采样率)。
基础设施成本
:
网络传输成本
:涉及私有数据中心、公有云(VPC 内外、跨区域、跨互联网),需对比 span 数据发送成本与应用计算成本。
存储成本
:云存储成本 = 容量 × 时长。Google Dapper 案例:通过降低采样率(1/1024→1/10)、合并索引等方式优化成本。
价值发掘
:聚焦采样子集数据中的价值,避免全量数据的高成本。
分布式追踪的完整性与挑战
难点
:分布式云原生应用中离散采样数据点的协同,span 数据需在离开数据中心或 VPC 前持久化存储。
解决方案
:合理运用采样策略,如预先采样(基于预期动态调整)和基于响应采样(根据响应特征决策)。
新版可观测性记分卡
核心概念
:通过相对较少的信号量理解生产系统行为。
可观测性理论
:
定义
:根据系统对外部输出信息推断内部状态,分为被动型(Closed loop feedback control)和主动型控制。
反馈优势
:应对不确定性、不稳定性、扰动,实现高效率干预。
设计目标
:
解释每个事务/交易(覆盖罕见错误、不漏报有价值事件)。
免于维度问题(支持复杂横向故障排查,平衡搜索性能与存储成本)。
成本与业务价值成正比(动态增长下确保物有所值)。
三大支柱的弱点
:指标、日志、分布式追踪分别存在解释事务、维度问题、成本与业务量成正比等缺陷。
三根管道
:收集、管理遥测数据的三种技术手段(指标、日志、追踪),工具实现者将权衡交给用户,用户从业务价值出发选择。
终极目标与活动
:
目标:改善/恢复性能基线,度量性能对用户的影响。
活动:解释性能差异。
更新版平衡记分卡
:统计保真度、元数据维度、存储容量、可用时间序列、上下文提供、影响排序、自动关联信息质量、操作体验。
技术参考
Elastic APM 参考架构
:支持 OpenTelemetry,实现可观测性解决方案集成。
社区活动
关注社区公众号了解更多活动。
你可能感兴趣
刘石伟- 字节跳动埋点数据流建设与治理实践
商贸零售
DataFunSummit2022:大数据计算架构峰会
2022-05-19
7-2 字节跳动埋点成本治理实践 - 肖茜文
商贸零售
DataFunSummit2022:数据治理在线峰会
2022-09-15
知乎埋点体系建设与治理
商贸零售
DataFunSummit2023:数据治理在线峰会
2023-07-13
iOS 全埋点技术白皮书
商贸零售
神策数据
2020-03-26
《Flutter 全埋点 SDK 技术》
商贸零售
神策数据
2022-07-21