1. 背景介绍
人工智能近年来发展迅速,GNN(图神经网络)作为分析图结构的有效工具,在科学领域展现出巨大潜力。图结构广泛存在于科学领域,如分子结构、蛋白质-药物结合、多体运动等。GNN的发展经历了从理解GNN作为RNN(循环神经网络)到理解GNN作为卷积的过程,目前最广泛使用的GNN模型是消息传播模型。
2. 相关研究
GNN在科学数据特点的基础上,面临违反物理对称性和不满足几何约束的问题。归纳偏置1:对称性,强调物理学中的对称性概念,理想情况下GNN应具备等变性。归纳偏置2:几何约束,指出多刚体系统中的广义坐标能自然满足约束,且相互独立。
3. 最新进展
GNN在科学领域的应用包括物理动力学模拟、生物医药、材料发现等。例如,GNN可用于基于物理知识的分析方法,如双摆系统、蛋白质分子动力学模拟等。GNN + 物理:基于GNN的多体动力学模拟,通过动态图建模,利用GNN刻画多体相互作用。GNN + 生物医药:分子表示学习,如GROVER模型在无监督分子上进行预训练,显著提升药物分子性质预测性能。GNN + 生物医药:相互作用和分子生成,如Geometric Deep Learning预测生物活性分子的结合构象,JT-VAE进行分子图生成。
4. 总结
GNN for Science强调只关注2D拓扑全维度数据,纯数据驱动,融入科学知识,应用于关系挖掘。清华智能产业研究院在ML或DM领域跨学科融合方面取得显著成果,团队成员包括张亚勤院长、马维英首席科学家等知名专家。研究目标与愿景是推动GNN在科学领域的应用,实现跨学科融合与创新。