背景与挑战
荣耀智能推荐中心支持多个业务领域(商城、信息流、视频)和内容类型,面临领域多、目标多、噪音大、冷启动难、数据稀疏和分散等挑战。其中,60%以上为新用户和游客,评分矩阵稀疏(density < 2%),行为序列跨度长(3-5天考虑期)。
推荐算法演进阶段
- 1.0阶段:基础推荐算法,效果有限。
- 2.0阶段:引入协同过滤,提升推荐效果。
- 3.0阶段:基于跨域特征和序列化模型,进一步优化推荐效果。
核心技术与成果
基于跨域特征的用户冷启动
- 方法:融合用户群和关键词的跨领域推荐,结合离线部分(商品品类和帖子版块映射)和在线部分(商品交互明细和帖子交互明细)进行推荐。
- 效果:CTR提升2.3%(基于用户群和关键词的跨领域推荐)和10%(基于跨域特征的长短期偏好推荐),曝光品类增加3.5%。
- 问题:前期跨域用户较少,未考虑行为序列。
基于跨域序列化的召回模型
- 方法:采用实时行为序列的双塔召回模型,结合离线训练(MPP/Hadoop)和在线推理(Kafka),使用Faiss进行检索。
- 建模思路:通过跨域行为关系建模和多兴趣建模,结合Self-Attention和Multi-head Attention机制。
- 效果:推荐效果显著提升,CTR和多样性均有改善。
总结与展望
荣耀推荐算法通过跨域特征融合、长短期偏好推荐、跨域序列化召回和多模态推荐模型,有效解决了冷启动和数据稀疏问题。未来将进一步完善基于跨领域和多模态注意力机制的推荐模型(如DeepFm),进一步提升推荐效果。