登录
注册
回到首页
AI
搜索
发现报告
发现数据
发现专题
研选报告
定制报告
VIP
权益
发现大使
发现一下
行业研究
公司研究
宏观策略
财报
招股书
会议纪要
海南封关
低空经济
DeepSeek
AIGC
大模型
当前位置:首页
/
行业研究
/
报告详情
7-2 字节跳动埋点成本治理实践 - 肖茜文
金融
2022-09-15
DataFunSummit2022:数据治理在线峰会
董***
AI智能总结
查看更多
字节跳动埋点成本治理解决方案
治理背景
埋点应用规模
:字节跳动日均处理10+PB存储数据,增量埋点量达10万亿/天,峰值流量超1亿+/秒。
治理原因
:机器资源成本高,运维SLA压力大。
治理效果
:应用于抖音、头条等85%业务,2021年节省成本近亿元,通过埋点分级节省100+PB HDFS存储,2022年预计节省成本3000+万元。
治理策略
从0到1建设治理
:先控增量,再治存量;降低无用埋点上报;按重要性区分埋点等级;支持采样上报。
场景1:先控增量,再治存量
:通过ByteIO平台维护“允许上报”列表,控制新增埋点,再逐步治理存量埋点。
场景2:降低无用埋点上报
:筛选并下线无用埋点,通过分析埋点的价值与成本定义无用埋点,利用平台进行下线操作。
场景3:按重要性区分埋点等级
:对埋点进行分级(P0、P1、P2),区分SLA/TTL保障,不同等级对应不同任务和分区。
场景4:支持采样上报
:通过ByteIO平台设置采样比例,SDK按比例上报埋点,减少全量上报资源消耗。
治理经验回顾
推动治理问题
:业务发展过程中治理需先控新增再治存量,中台需提供充足3W1H支持,治理方案需随深度细化。
业务治理推动
:明确治理对象(无用、不重要、可采样埋点)和措施(下线、分级、采样),评估治理效果(资源浪费、成本降低)。
观测指标
:埋点上报总量、成本、无用埋点占比、埋点密度等,用于评估治理效果。
自动化治理
:主动治理(监督式/无监督式),应用于抖音、头条等业务,2022年节省成本4000+万元。
埋点使用情况分析
:通过行血缘分析上报量与使用情况,解析ETL/查询/消费中的埋点逻辑,传播埋点关系。
智能诊断
:根据业务现状(无用埋点占比高、RD性能、HDFS成本)个性化推荐治理方案。
规划与展望
打通成本与资源
:整合资源申请、使用情况、治理评估、成本账单、业务反馈,形成闭环。
个性化推荐
:根据业务数据状况智能诊断,推荐埋点下线、分级、采样等方案。
扩展治理范围
:进一步治理无用数据、异常数据,降低资源成本,提升数据质量。
你可能感兴趣
刘石伟- 字节跳动埋点数据流建设与治理实践
信息技术
DataFunSummit2022:大数据计算架构峰会
2022-05-19
7-2 腾讯数据治理技术实践
信息技术
DataFunSummit2022:现代数据栈技术峰会
2022-11-02
知乎埋点体系建设与治理
文化传媒
DataFunSummit2023:数据治理在线峰会
2023-07-13
刘征-APM分布式追踪实践不只是埋点
信息技术
2023中国DevOps社区峰会·武汉站
2023-04-14
中国电信PaaS治理体系实践——肖彦昌
信息技术
GNSEC2022 全球下一代软件工程线上峰会
2022-12-26