登录
注册
个人信息
我的订单
我的报告豆
我的优惠券
我的笔记
我的阅读
我的收藏
我的下载
我的上传
我的订阅
在线客服
退出登录
回到首页
AI
搜索
发现报告
发现数据
发现专题
专题报告
专题百科
研选报告
定制报告
VIP
权益
发现大使
发现一下
行业研究
公司研究
宏观策略
财报
招股书
会议纪要
seedance2.0
低空经济
DeepSeek
AIGC
大模型
当前位置:首页
/
行业研究
/
报告详情
OPPO Roy-大规模在线学习在OPPO商业算法那的设计与实践
信息技术
2022-11-02
ArchSummit杭州2022|全球架构师峰会
在路上
OPPO商业化系统架构与优化方案
OPPO商业化广告业务
业务模式
:依赖CTR/CVR模型进行预估,包括oCPX类广告(以ocpc为主)、CPC广告及外部DSP投放的CPM/CPC广告。
核心消耗产品
:Ranker作为核心服务,接入流量并调用CTR/CVR模型。
OPPO商业广告系统架构问题
天级模型架构问题
:
由多个MR任务组成,任务维护难度大。
样本产出时间受资源与流量大小双重影响。
对实时特征响应慢,attention类模型结构难以发挥作用。
离线与在线两次特征抽取导致线上特征不一致。
流式样本设计方案
设计目标
:
事件发生的时间点即是样本产出的时间点。
解决负例事件归因窗口问题。
关键问题与解决方案
:
负例事件归因
:负例事件到达时需等待确认是否为正例,通过流式设计将事件发生时刻作为样本产出时刻,负例事件直接拼接特征发送。
Delay Feedback问题
:
实际样本中正例P' = P,负例N' = α(P + N)导致预估值波动。
纠偏方案
:
Importance Sampling
:用模型代替真实观测结果,符合流式需求。
Fake Negative Calibration
:简单易实现,推导真实正负例。
参考论文
:《Addressing Delayed Feedback for Continuous Training with Neural Networks in CTR prediction》。
负例打散
:负例样本缓存于joiner中,按正例回流时间分布PDF概率打散发送,解决预估值波动问题。
架构优化目标
自研GPU同步训练
:支持T级别模型及推理。
秒级流式更新
:模型更新延时少于30秒。
性能指标
:p99增加量小于15ms。
工程问题与解决办法
问题
:开发与设计目标不一致、性能指标不达标、工期超时。
解决办法
:
设计原理分享后开发。
架构修改(换组件、读写分离等)。
制定方案时预留冗余空间。
样本排查与训练超参
样本排查
:
事件与特征join率排查。
正负例样本数量与对齐率AUC差距排查。
Reload收益(天级/流式)对比。
Shuffle收益(天级/流式)对比。
不同纠偏方式AUC收益对比。
训练超参
:
学习率调小。
去掉momenta。
AUC评估
评估方法
:
天级全天评估改为batch内/间隔时间评估。
天级/流式样本使用相同测试样本评估。
实时性收益评估
。
重点方向
流式模型常驻
:模型稳定更新。
Inference时emb更新策略
。
预估监控与报警
。
模型回滚策略
。
错误样本过滤与模型重训
。
经验总结
方案设计与代码实现差距大,需见招拆招。
流式样本对齐天级样本需繁琐细致。
流式模型AUC对齐与评估需控制变量,不放过任何差异。
在线实验与模型上线需监控齐全,稳定可靠。
你可能感兴趣
腾讯ARC 算法实践的沃土——深度学习在内容素材上复原、二次创作的研究应用_PCG ARC Lab wangxintao
商贸零售
ArchSummit杭州2022|全球架构师峰会
2022-11-02
2-3 联邦学习在电信运营商行业中的应用与实践 - 杨爱东
商贸零售
DataFunSummit2022:数据安全与隐私计算峰会
2022-07-18
1-2 个性化强化学习技术在京东新品流量分发系统中的实践与应用
商贸零售
DataFunSummit2022:决策智能在线峰会
2022-11-02
多模态预训练模型在OPPO端云场景的落地实践
商贸零售
OPPO研究院
2023-12-15
从推荐模型的基础特点看大规模推荐类深度学习系统的设计_袁镱
商贸零售
ArchSummit深圳2022|全球架构师峰会
2022-07-19