您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[ArchSummit深圳2023|全球架构师峰会]:谭奎(public)TQUIC在腾讯的全场景优化实践 - 发现报告

谭奎(public)TQUIC在腾讯的全场景优化实践

AI智能总结
查看更多
谭奎(public)TQUIC在腾讯的全场景优化实践

腾讯/谭奎 个人介绍 •腾讯云CDN、EdgeOne•腾讯应用网关、负载均衡CLB•TQUIC(TencentQUIC)协议 现在腾讯 提纲 •EdgeOneTQUIC背景介绍 关键内容 •在线广告营收与网络传输关系•用户体验与传输指标如何对应•各种业务场景如何优化•落地效果:广告营收、视频播放等 •业务场景和挑战 •QUIC优化实践案例 •效果和应用 EdgeOneTQUIC背景介绍 QUIC协议发展和主要技术点 QuickUdpInternetConnection •主宰互联网web传输至少30年的新一代传输协议HTTP3•对标TCP+TLS+HTTP2•核心特性:全用户态协议栈、队头阻塞优化、用户态拥塞控制、连接迁移 腾讯EdgeOneTQUIC介绍 边缘安全加速平台EdgeOne •提供性能加速、安全防护、计算的边缘一体服务平台 •极速性能:覆盖全球数千个边缘节点,通过协议加速、动态链路加速等构建极致低延迟体验 TQUIC协议加速方案 •极简接入:提供客户端SDK与服务端节点全覆盖•包含主流协议标准:GQUIC、RFC9000、RFC9114等•加速能力:高比例0-RTT、多路径传输、动态路径选择、自适应拥塞控制 业务场景和挑战 •在线广告营收与网络传输关系•视频起播慢、卡顿影响用户留存•用户体验与传输指标如何对应•传统优化方案局限性 业务场景概览 登录耗时 业务场景特点•覆盖场景多:通信、办公、视频、游戏、金融、云客户•应用协议多样:RTC、XMPP、RTMP、HTTP、私有二进制•面临问题多样:秒开成功率低、登录耗时久、弱网抗性低 腾讯会议 平滑切网 弱网抖动 首帧卡顿 播放卡顿 视频号 秒开成功率 下载竞速 程序化广告:网络传输对广告营收起关键作用 网络传输影响 业务特点 面临问题•实时性要求高、依赖资源多、流程 复杂•要求网络请求速度快、成功率高 •竞价成功率低:超30%最优单超时•素材下载失败:影响广告转化效果•归因上报失败:无法与广告主结算 •严格限时:几百ms内完成请求•流程交互复杂:选单、竞价、素材、曝光、上报 视频播放:观影体验不流畅、黑屏,影响用户留存 点播常见问题 直播常见问题 •视频起播慢,缓冲时间长,用户主动退出•播放过程卡顿,用户更容易滑走、退出 •直播过程卡顿,黑屏,影响互动和直播效果 其他场景 Feed流加载慢•API拉取失败•图片加载失败 在线游戏重连 实时会议 •进出电梯网络切换,wifi质量不稳定 •RTT高、网络拥塞、网络切网 挑战一:传输优化方案存在局限 基于TCP的优化方法•限制多,落地成本极高•解决的问题范围有限 链路瓶颈问题无法解决•高频率连续丢包,难以通过拥塞算法调优 无法解决假WIFI、网络衰退、网络切换问题 挑战二:体验问题与传输指标无法直接映射 业务层数据量化用于比较问题严重程度•无法定位到根本问题 与传输层指标映射•无法与拥塞参数对应 广告超时 素材失败 起播慢 播放卡顿 会议中断 游戏重连 直播卡顿 API失败 QUIC优化实践案例 •业务体验与传输指标映射•传输策略动态配置•耗时敏感场景如何优化•跨链路传输优化•视频场景如何优化 细粒度数据上报分析,体验与传输指标映射 业务体验与细粒度传输指标上报 案例:成功率与传输指标映射•业务体验指标:成功率、请求耗时•传输层指标:sRTT、重传包量、发包量 •关键点:QUIC全用户态,可以获取窗口、丢包、受限时长、srtt等精细指标 传输策略动态配置:精确到用户粒度进行传输优化 耗时敏感场景的优化:背景及0-RTT原理 QUIC0-RTT握手•首次握手一般需要1个RTT•需要会话凭证才能完成0-RTT 现状:广告场景请求限时,对耗时敏感•短连接请求,连接耗时超过了数据传输耗时•使用HTTPS,通常需要2~3次握手 耗时敏感场景的优化:0-RTT握手比例低的原因 背景:广告业务初次上线,实际0-RTT比例只有33%•客户端未存储会话凭证•随机生成会话凭证 耗时敏感场景的优化:高比例0-RTT握手实现 •内存+磁盘存储凭证•重启后然后保持0-RTT•多app间share同一份凭证 服务端一致性生成•会话凭证无需每次生成•基于可轮转密钥的一致性生成 •不依赖统一的凭证,安全性更高•需要考虑实时性和稳定性 实时交互场景优化:跨链路传输背景 场景二:使用会议、直播等,进出电梯、停车场等;信号衰退 实验对照:在WIFI与蜂窝都打开的情况下,蜂窝可能更快 跨链路传输优化:连接迁移实现平滑跨网 启发式连接迁移•跨平台通用•弱网感知切换,及时止损 连接迁移触发:通过系统网络事件 连接迁移客户端:切换网卡进行数据发包 •对系统版本有依赖•跨平台不通用•仅网卡切换触发,无法感知弱网 思考:连接迁移存在局限性,仅用于解决当前链路不可用场景 跨链路传输优化:多路径传输背景 MPTCP(2011年发布)无法大规模部署•严格遵循TCP格式,限制多•中间设备误伤•必须在原始通道重传数据•内核升级成本高,至今未大规模应用 QUIC多路径•IETF标准化中•基于UDP,中间设备无任何感知•全应用态,实现更灵活•无连接层面的序列号,数据重传可以任意选择路径 业界实现:基于最小RTT调度数据包,效果不佳 跨链路传输优化:多路径传输MPQUIC实现 多路径调度策略 •路径异构调度•面向最终完成时动态调度•多队列重注入调度 视频场景优化:非可靠传输背景 完全可靠传输在弱网场景的问题•不断重传加剧了链路拥塞程度 •CWND窗口满导致无法发新数据•实时数据不能更快抵达 P帧丢包导致客户端缺失3个帧内容,卡顿轻微 I帧丢包导致客户端缺失9个帧内容,卡顿明显 B帧丢包导致客户端缺失1个帧内容,卡顿无感 非可靠传输:降低链路拥塞,保证用户体验 优化手段:部分数据使用非可靠传输,降低对链路影响 QUIC非可靠传输•协议扩展能力(IETF草案阶段)•丢包无需重传•共享加密连接 效果与应用 落地效果:提升广告传输质量,营收显著提升 广告闪屏、插屏、贴片、Feed流、联盟广告竞速等多场景接入 •营收显著提升•广告转换效果提升•收敛长尾耗时显著:超500ms耗时大幅减少 落地效果:提升弱网抗抖动,助力网络平滑切换 会议、直播、游戏等场景接入效果•网络切换场景,会话不中断,用户无感知•业务登录耗时下降•弱网下抗丢包率提升 落地效果:加速视频首播,有效播放时长提升 视频点播、直播场景接入 •海外视频场景落地,视频观看卡顿、成功率指标等显著提升•优化APP正片观看时长、特定页面播放等指标 如何接入腾讯TQUIC 腾讯云负载均衡(CLB) 腾讯云边缘安全加速平台EdgeOne •一键启用HTTP3•包含TQUIC-SDK,开启双端加速 Q&A 欢迎合作交流,一起推动QUIC协议的发展 Thanks