网易云音乐推荐系统冷启动与多目标的高效实现
背景介绍
网易云音乐自2013年上线以来,通过歌单、社区、音乐人和个性化推荐算法,发展成为月活过亿的音乐爱好聚集地。
基础架构
(内容未详细展开,但涉及推荐系统的整体架构)
冷启动与召回
冷启动
- 挑战:海量音乐资源(亿级歌曲、百万艺人)及每日新增,需解决探索效率与流量浪费问题。
- 冷启池选择:通过歌名、歌词、音频等特征构建潜力冷启池,利用后验行为概率迁移到先验内容概率,预测用户长时间播放概率。
- 知识图谱应用:构建包含歌曲、艺人、影视等主题的音乐内容知识图谱,解决推荐系统的稀疏性和冷启动问题。
- 基于CB2CF的冷启召回:利用用户-歌曲消费序列和基于内容的歌曲Embeding,通过行为建模和MSEloss进行召回。
- 实时冷启探索:通过实时日志平台、样本引擎、训练引擎和推理引擎,实现实时冷启探索。
召回
(内容未详细展开,但涉及召回阶段的策略和方法)
排序与多目标
排序
(内容未详细展开,但涉及排序阶段的策略和方法)
多目标
- 目标:个性化推荐系统的优化目标包括歌曲播放时长、收藏次数等多个指标,需解决“跷跷板现象”。
- 多目标建模:构建特征“共有-私有”网络结构,每个目标任务共享Expert和独有Expert,减轻“跷跷板现象”。
- 差异化多目标建模:针对红心歌曲推荐,使用歌曲mask进行差异化建模。
- 播放购买全链路多目标建模:构建播放、播放页、收银台、购买的完整链路模型。
- 虚拟链路多目标建模:提出虚拟三阶段方案(play awareness → cashier awareness → pay awareness),从用户感知角度抽象通用阶段。
- 商业化变现:通过多目标模型,会员转化率相对提升30%。
研究结论
网易云音乐通过知识图谱、多目标学习模型和虚拟链路设计,有效解决了冷启动和流量分配问题,提升了推荐系统的效率和商业化变现能力。