登录
注册
回到首页
AI
搜索
发现报告
发现数据
发现专题
研选报告
定制报告
VIP
权益
发现大使
发现一下
行业研究
公司研究
宏观策略
财报
招股书
会议纪要
稀土
低空经济
DeepSeek
AIGC
智能驾驶
大模型
当前位置:首页
/
行业研究
/
报告详情
Thematic role语义识别和医药知识精细挖掘- 夏静波
医药生物
2022-03-21
DataFunSummit 2022 :第二届知识图谱在线峰会PPT汇总
周***
AI智能总结
查看更多
核心观点
生物医药文本数据挖掘的发展趋势
:从命名实体识别和关系抽取,发展到构建高阶链接(知识图谱),并注重深层语义的理解。
药物重定位
:通过分析药物与疾病之间的深层语义关系,例如“GOF-antagonist/LOF-agonist”假说,可以发现药物的新用途。
语义角色语料库(AGAC)
:通过定制化知识设计语料库,对基因突变类型进行标注,揭示基因突变与疾病之间的深层语义关系。
研究范式
:结合语言学、文本挖掘、生物医药背景和数学模型,进行多来源数据的知识关联、推理和融合。
单关系和多关系数据
:构建基于单关系和多关系的异构图数据,并通过联合分解模型进行生物医药实体的嵌入计算。
医药实体嵌入的质量评价
:通过内在评估和外在评估,验证模型在基因/疾病聚类和重构tensor方面的有效性。
关联突变和类型突变
:结合BERT模型进行语义提取,推断突变类型,并通过生成模型同步突变关联和突变类型数据。
突变数据协同的图模型和变分推断求解
:构建贝叶斯图模型,通过变分推断方法,同步突变关联和突变类型数据,并推断新的基因-疾病关联。
阿尔茨海默病案例研究
:通过构建“Gene–Disease Association prediction by Mutation Data Bridging (GDAMDB)”流程,利用突变数据和突变类型数据,预测新的基因-阿尔茨海默病关联,并揭示其生理机制。
关键数据
AGAC语料库包含116 OMIM文本和53 PubMed摘要,标注了基因突变类型和功能变化。
构建的异构图数据包含27,165个基因、2,665个疾病、15,076种化学物质、108,023个突变和2,363个通路。
JDHMT模型在基因/疾病聚类和重构tensor方面优于其他模型。
GDAMDB流程预测了79个基因-阿尔茨海默病关联,其中12个来自原始GWAS,60个得到其他GWAS或文献支持,其余为新预测关联。
研究结论
语义角色标注和联合分解模型能够有效地挖掘生物医药文本中的深层语义关系。
突变类型数据有助于揭示基因-疾病关联背后的生理机制。
通过融合多模态数据,可以构建更准确的基因-疾病关联预测模型。
你可能感兴趣
医药行业专题研究:换个角度看医药,从财务指标和估值来挖掘医药领域的投资机会
医药生物
中原证券
2020-09-17
人人可用的图计算:GraphScope 的现状和未来 - 于文渊 徐静波_阿里
信息技术
DataFunSummit 2022 :第二届知识图谱在线峰会PPT汇总
2022-03-21
医药健康行业研究:板块估值和配置比例处于历史低点,底部加大配置静待改善降临
医药生物
国金证券
2024-10-27