登录
注册
回到首页
AI
搜索
发现报告
发现数据
发现专题
研选报告
定制报告
VIP
权益
发现大使
发现一下
行业研究
公司研究
宏观策略
财报
招股书
会议纪要
海南封关
低空经济
DeepSeek
AIGC
大模型
当前位置:首页
/
行业研究
/
报告详情
基于知识图谱的复杂问题推理问答- 史佳欣 华为云
文化传媒
2022-03-21
DataFunSummit 2022 :第二届知识图谱在线峰会PPT汇总
c***
AI智能总结
查看更多
知识图谱复杂问题推理问答研究总结
背景介绍
知识图谱(KB)问答
分为简单问答和复杂问答:
简单问答
:包含一个实体和一个关系,如“中国的首都是哪里?”
复杂问答
:需要多跳推理、计数、比较等技能,如“xx公司的CEO有哪些朋友?”
现有方法
:
语义解析法
:可解释但需推理过程标注数据,如SPARQL、QueryGraphProgram等。
信息检索法
:仅需问题-答案对,但能力有限且过程不可解释,如Key-Value Memory Networks等。
关键问题
:
如何构建推理过程标注数据?
领域间推理过程迁移是否可行?
无标注数据时能否自动学习推理过程?
构造推理过程数据
推理过程描述语言KoPL
:
特点:强类型语言,包含7种知识类型和27个操作(14个元素操作+13个查询操作)。
优势:注重过程、符合人类思维、操作可组合,支持多源知识(结构化/非结构化)。
大规模知识库问答数据集KQAPro
:
基于KoPL操作组合生成,包含问题、SPARQL、KoPL、候选答案和标准答案。
规模:约12万条数据,首个包含自然语言、全知识类型、多种逻辑形式的大规模数据集。
生成方式:众包模板采样+转写,确保流畅性和保持原意。
跨领域迁移
迁移目标
:将领域一推理过程标注迁移到领域二。
方法
:
骨架解析器
:使用BERT编码器+GRU解码器+注意力机制提取问题结构。
参数解析器
:使用BERT编码器+GRU解码器+KG元素编码器+相似度计算提取领域特定参数。
训练方法
:
阶段一:领域一有监督学习(骨架+参数解析器)。
阶段二:领域二强化学习(仅参数解析器,正向/负向激励)。
实验结果
:
领域一:KQAPro(Wikidata子集),训练数据12万条。
领域二:WebQSP(4737条)和CWQ(34689条)。
效果:阶段一+阶段二组合效果最佳(WebQSP 76.5,CWQ 58.7)。
隐式学习
方法
:TransferNet,自动学习推理过程无需标注。
模型:
多跳问题处理:ABCRA->BRA->CRB->CABCRA等路径。
向量矩阵乘法建模实体转移,链式乘法建模多跳转移。
注意力机制关注问题不同部分。
训练:仅对最终预测实体施加loss,自动学习推理过程。
实验结果
:
MetaQA数据集上实现100%准确率,如“xx电影的导演执导的影片中主角是谁?”。
总结
构建推理过程标注数据
:基于KoPL生成KQAPro数据集。
领域间迁移
:迁移骨架和参数解析器,分阶段训练实现跨领域应用。
隐式学习
:TransferNet自动学习推理过程,无需标注数据。
你可能感兴趣
基于时序知识图谱的问答系统 - 商超 -京东硅谷研究院
商贸零售
DataFunSummit 2022 :第二届知识图谱在线峰会PPT汇总
2022-03-21
6-3 面向可解释性的知识图谱推理研究
文化传媒
DataFunSummit2022:图机器学习峰会
2022-07-18
基于知识图谱的多模内容创作技术及应用 - 卞东海 百度
文化传媒
DataFunSummit 2022 :第二届知识图谱在线峰会PPT汇总
2022-03-21
基于知识图谱的工业自动化知识发现应用及挑战 -柯基数据CEO 吴刚
文化传媒
DataFunSummit 2022 :第二届知识图谱在线峰会PPT汇总
2022-03-21
基于知识图谱的商品营销文案自动生成实践 - 李浩然 京东
文化传媒
DataFunSummit 2022 :第二届知识图谱在线峰会PPT汇总
2022-03-21