背景介绍
支付宝平台存在大量推荐场景,如基金推荐、消费券推荐和腰封推荐等。然而,这些场景普遍面临数据稀疏、新用户目标低活、用户自身行为数据有限等问题,导致推荐效果不佳。
基于知识图谱的推荐
- 知识图谱在推荐中的应用挑战:知识图谱包含大量关系,但并非所有关系都 полезен;不同用户对知识图谱中节点的偏好不同。
- 现有方法局限性:基于嵌入的模型无法解决知识图谱蒸馏和精炼问题;基于路径的模型依赖手工设计,无法处理用户偏好的多样性;基于 GCN 的模型只考虑同边节点,忽略了与目标节点的独立性。
- 提出的模型:KCAN 模型包含知识图谱嵌入层、知识图谱蒸馏模块、知识图谱精炼模块和 MLP 预测模块。
- 知识图谱嵌入层:使用 TransH 算法学习实体和关系表示,保留拓扑结构。
- 知识图谱蒸馏模块:通过知识 aware neighbor aggregator 和 knowledge aware attention 机制,对知识图谱进行蒸馏。
- 知识图谱精炼模块:使用 conditional-attention based aggregator 和 conditional attention 机制,根据用户偏好对知识图谱进行精炼。
- MLP 预测层和优化:使用 MLP 进行预测,并交替优化知识损失和目标损失。
- 实验结果:在基金推荐数据集上,KCAN 模型在 Top-K 推荐和 CTR 预测任务上分别提升了 2%~10% 和 2%~6%。在线 A/B 测试也验证了模型的有效性。
- 消融实验:消融实验结果表明,KCAN 模型的各个模块都对推荐性能有显著贡献。
基于社交和文本的推荐
- 动机:营销运营人员难以理解用户意图,导致内容创作效率低下。
- 挑战:传统主题模型无法处理低活跃度用户和长尾物品的意图挖掘。
- 方法:S2TM 模型结合图神经网络和 Skip-gram 模型,分别对用户意图和意图-物品分布进行编码。
- 用户意图编码:使用图神经网络对用户行为进行编码,并使用 logit-normal 分布近似用户意图的先验分布。
- 意图-物品分布编码:使用 Skip-gram 模型学习物品的语义嵌入,并使用负采样方法估计意图-物品分布。
- 实验结果:在电商数据集上,S2TM 模型在低活跃度用户和长尾物品的意图挖掘任务上取得了显著效果。
基于跨域的推荐
- 背景:社交网络中的好友浏览行为存在相关性,但活跃度用户和非活跃度用户的好友数量分布不同。
- 问题:如何向非活跃度用户推荐个性化物品。
- 模型:CD-GNN 模型通过域不变层和 GNN 层,对活跃度用户和非活跃度用户进行特征空间对齐,并迁移知识。
- 域不变层:学习域不变嵌入,解决非活跃度用户特征稀疏问题。
- GNN 层:在社交关系图上进行信息传播,学习用户表示。
- 实验结果:在线 A/B 测试结果表明,CD-GNN 模型能够有效提升非活跃度用户的推荐效果。
团队近期发表的论文
团队在图学习领域发表了多篇高水平论文,涵盖了链接预测、推荐系统、跨域推荐等多个方向。