核心观点与关键数据
知识图谱嵌入(KGE)在处理未见数据时的外推能力主要依赖于三种语义证据(SEs):关系级、实体级和三元组级。这些证据分别反映了实体间的关系共现、路径连接以及相似三元组的信息,为模型预测提供支持。
研究结论
-
语义证据的作用:通过分析不同数据集上的实验结果,发现SEs的丰富程度与模型的预测性能呈正相关。关系级SE通过实体类型信息提供预测依据,实体级SE通过路径连接增强语义相关性,三元组级SE则利用相似三元组的信息进行外推。
-
模型设计:当前KGE模型主要通过隐式且不足的方式捕捉SE信息,限制了其外推能力。为此,提出SE-GNN模型,通过显式捕捉和多层邻居聚合充分建模SE信息,提升外推性能。
-
实验验证:在知识图谱补全任务上,SE-GNN模型相较于基线模型(如ConvE)表现出更好的性能。消融实验进一步验证了三种SEs的独立贡献,且同时去除两种SE建模部分会导致性能显著下降。
总结
该研究揭示了KGE模型外推能力的关键在于语义证据的利用,并通过SE-GNN模型实现了对SE信息的显式建模,显著提升了模型在未见数据上的预测性能。