登录
注册
回到首页
AI
搜索
发现报告
发现数据
发现专题
研选报告
定制报告
VIP
权益
发现大使
发现一下
行业研究
公司研究
宏观策略
财报
招股书
会议纪要
稀土
低空经济
DeepSeek
AIGC
智能驾驶
大模型
当前位置:首页
/
行业研究
/
报告详情
医疗领域图谱的构建及应用 - 付子玉 算法工程师
医药生物
2022-03-21
DataFunSummit 2022 :第二届知识图谱在线峰会PPT汇总
大***
AI智能总结
查看更多
医疗健康图谱的构建和应用
业务场景介绍
公司介绍
:中国领先的医疗领域连接者及数字化专业服务提供商,以“聚专业力量,做靠谱产品”为使命,致力于“健康更多,生活更好”,秉持“正直、开放、投入、创新”的价值观。
业务模式
:通过丁香园平台连接 ToD(学术互动、科研需求)和 ToC(大众健康服务),包括丁香医生、丁香妈妈、丁香诊所、丁香家等。
短文本语义理解
:
传统关键词方案
:仅提取关键词,如气管、硬膜外腔等。
融合知识图谱方案
:结合知识图谱,生成更丰富的标签,如硬膜外麻醉、麻醉医学等。
标签生成增强
:利用概念知识图谱的主题模型,获得更抽象的上层标签。
Query 扩展
:
原始 Query
:如“哈萨克斯坦”、“产褥垫”。
扩展 Concept
:结合知识图谱扩展为“新冠疫情哈萨克斯坦疫情”、“生产必备品待产包”等。
扩展实体
:进一步扩展为“纸尿裤”、“卫生巾”等。
语义匹配
:利用对比学习框架(如 ConSERT、SimCSE)进行语义匹配。
医疗图谱构建
Taxonomy 概念图谱构建
:
命名实体识别(NER)
:识别疾病、身体部位、症状等实体,如“症状性动脉粥样硬化”、“椎动脉”、“狭窄”。
关系抽取
:抽取实体间的关系,如对象、关系、主体。
概念抽取
:从文本中抽取概念,参考方法包括腾讯的 Query 和 Document 理解系统、阿里巴巴的 AliCG 等。
SMedBERT
:
定义
:知识增强的预训练语言模型,首次将医学实体和结构化语义信息引入预训练模型。
特点
:
丰富的语义:包含实体类型和关系。
知识桥梁:链接相关实体。
创新
:提出 Mention-neighbor Hybrid Attention 和 Mention-neighbor Context Modeling。
未来挑战
训练数据成本高
:如何降低人工成本,构建良性的数据闭环。
图谱复用性
:随着业务扩展,如何提升图谱的复用性,实现高质量图谱融合。
用户意图识别
:如何更好地识别长尾低频用户行为背后的意图。
加入我们
联系方式
:知乎、丁香园自然语言处理公众号、邮箱(fuziyu@dxy.cn)。
你可能感兴趣
蚂蚁商家图谱的构建、融合应用及开放 - 贾强槐 蚂蚁集团
信息技术
DataFunSummit 2022 :第二届知识图谱在线峰会PPT汇总
2022-03-21
如何构建对雇主的 “要么玩要么付 ” 要求 : 加州国家医疗改革的经验教训
信息技术
Berkeley
2009-06-01
孙梦姝 - 金融事理图谱构建及应用
金融
DataFunSummit2022:智能金融在线峰会
2022-11-24
【上海:推动下一代移动通信、量子计算、光子计算等前沿技术产业布局】财联社10月14日电,上海市经济和信息化委员会日前印发《上海市智能终端产业高质量发展行动方案(2026-2027年)》,加速未来终端研发。推动下一代移动通信、量子计算、光子计算等前沿技术产业布局。开展先进无线通信、新型网络架构、空天地一体等前沿技术研究;推动量子计算领域算法纠错等核心难点研发突破,发挥量子计算的优越性,研制未来终端概念样机,并不断探索向垂直行业应用渗透,形成特色应用场景模版。
未知机构
2025-10-14
AI行业动态点评:看好垂直细分领域巨头在AI算力、算法、大数据领域的应用
信息技术
长城证券
2023-04-04