01 背景介绍
个性化新闻推荐系统能有效提升新闻服务质量,应对互联网时代新闻过载问题。传统方法基于特征工程,而深度学习方法通过隐式语义表示进行匹配。结合知识图谱的推荐系统能提升推荐准确性和可解释性,前者通过引入更多语义关系发现用户深层兴趣,后者通过连接用户历史记录和推荐结果增强用户信任。
02 新闻知识图谱
研究动机:通用知识图谱缺乏新闻推荐任务相关信息,包含无关噪音。研究方法包括补充新闻相关信息,如增加主题节点(显式/隐式)和协同关系节点(同一新闻实体、同一用户兴趣实体、同一段会话实体)。数据统计显示,新闻知识图谱比通用知识图谱更适用于新闻推荐任务。实验数据包括个性化新闻推荐任务(MSNnews, 4周, 24,542新闻, 665,034用户, 6,776,611点击)和新闻分类任务(15个类别分类, 2个本地新闻检测, 4个新闻流行度预测)。
03 知识图谱与新闻推荐的准确性
新闻推荐特点:新闻具有时效性(冷启动问题)、丰富文本信息、用户兴趣多样且动态演化。研究动机在于新闻中的知识实体携带重要信息,不同实体重要程度不同,NLP技术可生成高质量新闻表示,但现有工作未能灵活结合NLP技术。研究方法包括:
- 实体表示层:通过实体在不同任务间传播知识信息。
- 语境嵌入层:位置嵌入、频率嵌入、类别嵌入。
- 信息蒸馏层:多任务学习(用户新闻推荐、相关新闻推荐、新闻类别分类、新闻流行度预测、本地新闻预测)。
实验结果验证了该方法在新闻推荐和分类任务上的有效性。
04 可视化分析
研究动机在于新闻实体能辅助理解用户多样化的动态兴趣。研究方法采用异构图表示学习和双记忆网络(兴趣记忆网络、用户记忆网络)。实验结果支持该方法在表示用户兴趣方面的有效性。
05 知识图谱与新闻推荐的可解释性
研究动机在于可解释推荐能提升用户满意度和接受度,但现有方法(如KPRN、PGPR)存在局限性。研究方法包括:
- 锚点知识图范式:基于强化学习选择重要实体及其邻居节点构成新闻“锚图”,生成可解释路径并提升新闻表示。
- 演员评论家(actor-critic)算法:演员选择加入锚图的实体,评论家评估动作好坏。
- 热启动训练、基于知识图谱的负采样、多任务学习联合训练推理任务和推荐任务。
实验结果验证了该方法在可解释性和推荐效果上的有效性。
06 可解释量化分析
业务落地平台工具包括训练引擎、基础研究(时空/多兴趣/跨域推荐、商品商户混合搜索、智能广告投放)、可视化图机器学习平台(大规模在线向量计算服务、单机可达百亿边规模、分布式达千亿边规模、高鲁棒GNN、动态异质图模型、大规模图预训练)。