登录
注册
个人信息
我的订单
我的报告豆
我的优惠券
我的笔记
我的阅读
我的收藏
我的下载
我的上传
我的订阅
在线客服
退出登录
回到首页
AI
搜索
发现报告
发现数据
发现专题
专题报告
专题百科
研选报告
定制报告
VIP
权益
发现大使
发现一下
行业研究
公司研究
宏观策略
财报
招股书
会议纪要
seedance2.0
低空经济
DeepSeek
AIGC
大模型
当前位置:首页
/
行业研究
/
报告详情
7-2 字节跳动埋点成本治理实践 - 肖茜文
金融
2022-09-15
DataFunSummit2022:数据治理在线峰会
董亚琴
字节跳动埋点成本治理解决方案
治理背景
埋点应用规模
:字节跳动日均处理10+PB存储数据,增量埋点量达10万亿/天,峰值流量超1亿+/秒。
治理原因
:机器资源成本高,运维SLA压力大。
治理效果
:应用于抖音、头条等85%业务,2021年节省成本近亿元,通过埋点分级节省100+PB HDFS存储,2022年预计节省成本3000+万元。
治理策略
从0到1建设治理
:先控增量,再治存量;降低无用埋点上报;按重要性区分埋点等级;支持采样上报。
场景1:先控增量,再治存量
:通过ByteIO平台维护“允许上报”列表,控制新增埋点,再逐步治理存量埋点。
场景2:降低无用埋点上报
:筛选并下线无用埋点,通过分析埋点的价值与成本定义无用埋点,利用平台进行下线操作。
场景3:按重要性区分埋点等级
:对埋点进行分级(P0、P1、P2),区分SLA/TTL保障,不同等级对应不同任务和分区。
场景4:支持采样上报
:通过ByteIO平台设置采样比例,SDK按比例上报埋点,减少全量上报资源消耗。
治理经验回顾
推动治理问题
:业务发展过程中治理需先控新增再治存量,中台需提供充足3W1H支持,治理方案需随深度细化。
业务治理推动
:明确治理对象(无用、不重要、可采样埋点)和措施(下线、分级、采样),评估治理效果(资源浪费、成本降低)。
观测指标
:埋点上报总量、成本、无用埋点占比、埋点密度等,用于评估治理效果。
自动化治理
:主动治理(监督式/无监督式),应用于抖音、头条等业务,2022年节省成本4000+万元。
埋点使用情况分析
:通过行血缘分析上报量与使用情况,解析ETL/查询/消费中的埋点逻辑,传播埋点关系。
智能诊断
:根据业务现状(无用埋点占比高、RD性能、HDFS成本)个性化推荐治理方案。
规划与展望
打通成本与资源
:整合资源申请、使用情况、治理评估、成本账单、业务反馈,形成闭环。
个性化推荐
:根据业务数据状况智能诊断,推荐埋点下线、分级、采样等方案。
扩展治理范围
:进一步治理无用数据、异常数据,降低资源成本,提升数据质量。
你可能感兴趣
刘石伟- 字节跳动埋点数据流建设与治理实践
商贸零售
DataFunSummit2022:大数据计算架构峰会
2022-05-19
7-2 腾讯数据治理技术实践
商贸零售
DataFunSummit2022:现代数据栈技术峰会
2022-11-02
知乎埋点体系建设与治理
商贸零售
DataFunSummit2023:数据治理在线峰会
2023-07-13
刘征-APM分布式追踪实践不只是埋点
商贸零售
2023中国DevOps社区峰会·武汉站
2023-04-14
中国电信PaaS治理体系实践——肖彦昌
商贸零售
GNSEC2022 全球下一代软件工程线上峰会
2022-12-26