您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [复旦大学]:2023年信息提取的趋势报告 - 发现报告

2023年信息提取的趋势报告

信息技术 2024-12-01 Qi Zhang,张奇 复旦大学 小烨
报告封面

张奇 复旦大学 信息抽取 信息提取(IE) 是自动提取的任务结构化信息from非结构化和 / 或半结构化机器可读文档和其他电子代表的来源。 信息提取可以追溯到 1970 年代后期的 NLP 早期。 任务 : • 命名实体识别 • 关系抽取 • 共指消解 • 事件抽取 • 表格提取 • 表格信息抽取 • … ACL 2020 统计 ACL 2019 统计 信息抽取中的统计 •关于46%IE 论文研究命名实体识别 •关于27%IE 论文研究关系提取 •大约 9% 的 IE 论文研究事件检测 •其他人研究不同的主题 , 如方面 - 意见挖掘,参数挖掘, 等等。 命名实体识别中的统计 命名实体识别中的统计 ••••关于9%NER 论文研究的处理噪声在 NER关于18%NER 论文研究the外部知识的介绍关于14%NER 论文研究远程监督NER关于18%NER 论文研究跨域 / 跨语言NER 嵌套命名实体识别 Dateset (QUESTION, ANSWER, CONTEXT) Shannon. AI李小雅等 , 2021 , 命名实体识别的统一 MRC 框架 嵌套命名实体识别 基于外部知识的命名实体识别 •中文 NER 中更简单的词典用法 ” 基于外部知识的命名实体识别 • 在中文 NER 中使用更简单的词典 关系提取中的统计 关系提取中的统计 4论文研究可解释性神经关系提取 2论文研究开放域关系提取 •1论文研究交叉句子关系提取 •1论文研究了处理噪声在 NER 可解释和开放域关系提取 •从开放领域的事实中学习可解释的关系。 可解释和开放域关系提取 从开放领域的事实学习可解释的关系。 事件检测中的统计 •••事件检测论文进行了分析 42 篇论文研究跨句检测2 论文研究开放域检测