研究报告总结
业务介绍
网易严选推荐算法服务主要应用于站内多个业务场景,包括入口页(为你精选/猜你喜欢)、活动页(goods组排序)、商详页、类目页及其他业务场景。
多目标建模
精排挑战与难点
- 多业务指标优化需求
- 转化数据稀疏问题
- 长期价值探索挑战
样本与特征
- 正负样本定义:正样本为用户点击/转化,负样本为skip-above曝光未点击
- 样本构造策略:头部热门打压、短时间多次曝光处理、虚假曝光去噪、假正样本剔除
- 特征工程:数值特征归一化/RankGauss分桶、类别特征hash、序列特征embedding(包括attention pooling)、embedding初始化normalize
多目标模型
- 采用MMOE(Multi-gate Mixture-of-Experts)模型,应用广泛
- PLE(Position-wise Linear Embedding)MMOE结构:包含Shared expert和Specific expert,考虑Expert间交互
多目标优化演进
位置偏差处理
- 用户倾向于与靠前物品交互,导致部分商品过曝
- 解决方法:构建shallow tower建模bias,使用Bias feature+dropout
- 效果:CTR提升1.7%,人均点击数提升4.95%
增加业务目标
- 扩展目标:加购、评论、商品、查看促销信息、分享、收藏等
- 采用Seesaw Phenomenon或Gradnorm技术解决不同任务Loss梯度量级接近问题
- 效果:CTR提升6.92%,CTCVR提升5.87%
跨域多目标算法
长期价值探索
- 优化目标:用户交互session长度、全站加购率、曝光点击率、3日留存率
- 方法:商品卡片类型优化(商品卡片+内容卡片混排)、Bandit算法个性化曝光权重
- 效果:全站加购率提升0.5%,曝光点击率提升2.02%,3日留存率提升1.2%
多场景建模在通用推荐中的实践
核心场景
- 入口页:首猜、购物车、个人页等模块,流量大、数据丰富,承担核心业务指标
- 承接中、小、新流量场景:单模块流量较小、数据稀疏,场景丰富
什么是多场景建模
为什么使用多场景建模
- 解决不同场景数据分布差异、负迁移问题、资源浪费等问题
如何进行多场景建模
- 方法1:构建场景相关特征输入建模(效果一般)
- 方法2:将场景视为bias,构建辅助子网络(输出层相加或相乘)
- 方法3:套用MMoE框架,专家网络结构对应场景
- 方法4:MMoE输出层增加共享塔,缓解小场景学习问题
- 方法5:STAR结构,中心共享参数+场景私有参数
- 方法6:改进MMoE结构:底层MMoE专家网络+顶层并行输入+场景私有MLP
落地结果
- 各场景训练数据占比及平均CTR分析:中小场景离线AUC Mix < Single < Multi
- 线上AB实验CTR相对提升约5%~10%