AI智能总结
京东春晚活动专题亿级互动场景下的流量治理 靳智超资深技术专家 靳智超 京东资深技术专家 10年运维开发经验,目前主要负责京东APP移动端网络性能优化工作,专注于APP加载速度提升、端侧流量治理和可观测平台的建设,经历多次618、双11以及两次春晚主互动链路亿级别流量的考验。 01春 晚 互 动 业 务 及 流 量 特 点 02流 量 治 理 实 践 03异 常 流 量 探 测 04未 来 流 量 治 理 的 规 划 PART 01 春晚互动业务及流量特点 春晚用户参与流程 请求关键路径 H5活动页面 APP首页 APP启动 加载js/css等大量CDN静态资源 首页加载图片80+,涉及摇一摇动效渲染 互动后台 发奖调用链路长,上游依赖多,且均为核心依赖,无法降级。发放资金量巨大,互动场景刷子多。 流量特点 Ø根据口播时段产生多段峰值,每次持续2-4分钟 Ø峰值流量非瞬时突增突降 Ø大部分为新用户请求 PART 02 流量治理实践 启动项梳理 Hybrid离线包 启动快/低错误/省流量 JDHybrid专注于解决主站内WebView加载H5页面耗时问题,提供了离线包技术方案。直接通过硬盘读取H5资源数据,减少网络请求耗时,降低因网络引起的加载错误问题,同时也能降低CDN的峰值流量。 为什么用JDHybrid? hybrid可以提前n天由业务配置好,离线随机分散预加载活动页面资源到App客户端本地,春晚当天从本地读取缓存直接使用,降低同一时刻一起请求服务端的概率。 Hybrid离线包 Ø内置能力:离线包内置到APP中,提升覆盖率,降低CDN下载压力 Ø强制升级:300万低版本用户升级,提高内置包覆盖度 Ø灵活的素材支持能力:离线包可以仅仅打包图片素材,支持app和h5访问内置的素材,降低CDN压力 Ø离线包:覆盖80%用户,大幅减轻CDN压力,活动页面秒开率82%,页面打开时间减少30%+ 图片压缩 图片压缩 图片压缩 加载性能收益 带宽节省收益 APP原生:平均文件大小减少7%-25%左右APP H5:平均文件大小减少23%左右PC端:平均文件大小减少22%-56%左右 画质评估 图像质量的客观评估指标有PSNR、SSIM、VMAF等,一般认为PSNR超过40就接近原图,人眼基本无法区分。AVIF改造基于PSNR的结果如下 文本压缩 Ø单机压测验证Br和Gzip对服务端性的影响; Ø压缩级别相近情况下,Br压缩率较Gzip提升5%,CPU占用降低3%; Ø综合考虑压缩率、CPU消耗和TP99之间的平衡,服务端保持Br/Gzip双开,压缩级别设置为6/4; CDN调度 n全域实时热力地图 CDN根据用户分布数据对大区流量有针对性地进行调度, 最终结果与预期基本相符 n限频+托底页 互动页所用腾讯云开启按频次限流,并返回自定义托底页,保证用户体验 n缓存命中 预热充分,主要域名缓存命中率基本99%以上,关键域名100% nQPS压力 多策略(活动页雪碧图归并,域名打散,摇一摇随机等策略),减轻峰值时刻对CDN的QPS压力 质量保障 APP专项测试 全链路压测 活动专项 权益发放校验、前端兜底校验、离线资源校验、性能校验 PART 03 异常流量探测 流量拆分建设-图片请求 抽取京东CDN节点10%抽样数据进行分析,聚合referer、host、图片格式、压缩格式等指标,做到有的放矢,针对性分析改造前后模块的效果对比 流量拆分建设-接口请求 统一网关提供api接口注册及监控能力,可针对客户端版本、机房、地域等维度进行调用量拆分及监控 客户端调试工具-代理服务 解决代理无法共享 客户端调试工具-云真机 云真机覆盖Android、iOS、鸿蒙,实现实时交互的同时,提供丰富工具辅助测试 适用范围:开发调试、产品走查、功能测试、兼容测试 异常流量典型案例 每天定点超预期流量峰值,抓包实测图片缓存异常,会有重复流量 问题 未做懒加载及使用原图的情况,页面整体图片流量超过限制,导致缓存失效,带来额外流量。 原因 异常流量典型案例 问题 进入页面会重复调用两次,出入参数一致。 修复方案 针对冷启动页面初始化过程中,收敛减少接口数据上报的触发时间点,合并数据到一个时间点上报(主接口数据请求成功后上报) 异常流量典型案例 流量波动较大 非整点流量毛刺 PART 04 未来流量治理的规划 未来规划 高效运维社区DevOps时代 荣誉出品 感谢大家观看