登录
注册
回到首页
AI
搜索
发现报告
发现数据
发现专题
研选报告
定制报告
VIP
权益
发现大使
发现一下
行业研究
公司研究
宏观策略
财报
招股书
会议纪要
海南封关
低空经济
DeepSeek
AIGC
大模型
当前位置:首页
/
行业研究
/
报告详情
4-3 货拉拉全链路监控体系的落地与实践 - 曹伟
商贸零售
2022-09-15
DataFunSummit2022:数据治理在线峰会
徐***
AI智能总结
查看更多
货拉拉全链路监控体系的落地与实践
监控演进史
行业演进
:从早期简单日志记录到分布式追踪、指标监控,逐步发展为全链路监控体系。
货拉拉演进
:从原生Skywalking架构到支持百万TPS的Trace 2.0,再到采用冷热分离和差异化采样的Trace 3.0及自研KV存储的Trace 3.x。
货拉拉监控体系架构
埋点方式
:采用字节码增强技术实现无侵入式埋点,对比原生方式(依赖Filter/Intercept或修改源码)具有侵入性低、维护成本低、接入便捷的优势。
字节码增强技术
:通过Java Agent在Class加载前或内存中修改字节码,常用框架包括ASM、Javassist和ByteBuddy,其中ByteBuddy性能最优且易用。
埋点优势
:基于字节码增强的JAVA SDK可实现零代码接入,轻量且灵活。
全链路Trace建设
架构演进
:
Trace 1.0
:原生Skywalking架构,无法支撑全量业务。
Trace 2.0
:支持百万TPS,日均处理100TB Trace数据。
Trace 3.0
:采用冷热分离,1小时内全量采样,降低约60%的存储和计算资源成本。
Trace 3.x
:自研KV替换HBase,优化LSM-Tree Compaction规则,存储机器成本降低90%。
采样策略
:
常规采样
:基于TraceID无差别采样,简单但信息保留不足。
错、慢、核心采样
:基于APPID、Span等信息精细采样,保留更有价值的错、慢、核心服务数据。
完整采样
:通过Kafka延迟消费+Bloom Filter实现无损采样,保留完整调用树,对比阿里鹰眼(纯内存方案)和字节跳动(部分采样)更具优势。
冷热分离
:1小时内全量采样热数据,1小时外保留错、慢、核心链路冷数据,降低约60%资源成本。
可视化建设
“所见即所得”
:整合Metric、Trace、Log,实现业务闭环,提供全局稳定性分析和微服务治理能力。
价值
:快速定位问题、提升全局稳定性、实现微服务治理、高ROI。
发展方向
自研存储、根因分析、指标告警联动、服务拓扑,并回馈开源社区。
你可能感兴趣
全链路监控在嘉银科技的落地实践
GOPS 全球运维大会
2024-10-16
曹伟-K8s上的数据库私有云之旅:KubeBlocks架构设计与实践
信息技术
ArchSummit深圳2024|全球架构师峰会
2024-07-05
网易严选全链路数据治理的实践与总结
中国数据智能管理峰会
2023-04-15
优酷App业务架构设计与全链路应用实践
阿里巴巴
2023-02-21
新锐品牌标准化销售体系搭建与全链路年轻化价值提效-【奥兰中国 郑俊杰】-“乘云驾务”2021观远数据智能决策峰会
观远数据
2023-08-29