登录
注册
回到首页
AI
搜索
发现报告
发现数据
发现专题
研选报告
定制报告
VIP
权益
发现大使
发现一下
行业研究
公司研究
宏观策略
财报
招股书
会议纪要
海南封关
低空经济
DeepSeek
AIGC
大模型
当前位置:首页
/
行业研究
/
报告详情
18 统一命名实体识别作为字词关系分类
文化传媒
2022-11-03
国际人工智能会议AAAI 2022论文北京预讲会
申***
AI智能总结
查看更多
核心观点与关键数据
背景
联邦窃听法规中,宾夕法尼亚州广播电台的责任存在争议。
实体识别面临三种挑战:不连续实体、重叠实体和不规则实体。
现有工作主要关注实体边界识别,忽略实体词间的相邻关系。
统一命名实体识别(Unified NER)
目标:识别连续实体、重叠实体和不连续实体。
关键关系:
THW-*:表示单词网格某行是实体的尾部。
NNW:Next-Neighboring-Word,指示单词对属于实体提及。
模型架构
编码器层:
BERT + 最大池化 + 双向 LSTM。
条件层归一化 + 多粒度扩张卷积。
预测器层:
MLP 预测器 + Biaffine 预测器。
训练与解码
训练:最小化负对数似然损失。
解码:通过路径搜索识别实体提及,THW 关系辅助消歧。
实验数据集
14 个数据集涵盖:
Flat NER(连续实体)。
Overlapped NER(重叠实体)。
不连续 NER。
数据集包括:
CADEC、ShARe13/14、ACE 2004/2005、GENIA、CoNLL-2003、OntoNotes 5.0/4.0、MSRA、微博、简历等。
研究结论
W2NER 模型能有效识别连续、重叠和不连续实体。
通过 THW 和 NNW 关系提升识别精度,尤其在不连续和重叠场景中。
实验验证模型在多个数据集上的泛化能力。
联系方式
邮箱:theodorelee@whu.edu.cn 或 life_csnlp@whu.edu.cn。
代码:https://github.com/ljynlp/W2NER.git。
你可能感兴趣
环保工程及服务行业周报:社融增速放缓供应端改善逻辑不变,首部以“垃圾分类”命名地方性法规审议通过
公用事业
东吴证券
2020-08-16
使用基于贝叶斯模型的脑电图源作为动态图卷积神经网络节点的准确情绪识别
信息技术
Nature
2022-06-18
临床试验:为了加强研究生态系统,欧洲需要作为一个统一的地区发挥作用
EFPIA
2025-05-20
为海洋经济可持续发展制订统一的国际贸易分类
信息技术
联合国
2021-03-23
第 496 号试验: 识别引起严重眼损伤的化学物质和不需要分类眼刺激或严重眼损伤的化学物质的体外大分子试验方法
基础化工
经济合作与发展组织
2024-06-24