AI智能总结
从未来回望,2025年将被定义为“人工智能与科学发现深度融合的元年”。而这源于2024年两项诺贝尔奖均授予了AI深度参与其中的研究。物理学奖授予了科学家John J. Hopfield和Geoffrey E. Hinton,以表彰他们在使用人工神经网络进行机器学习方面的基础性发现和开创性贡献。诺贝尔化学奖则颁发给了科学家DavidBaker、Demis Hassabis和John M. Jumper,以表彰他们在计算机蛋白设计及蛋白质结构预测领域的杰出成就。 出品:漆远吴力波张江 出品机构: 运营:孟晋宇王婷 撰稿团队: 张江杨燕青王婷王朝会十三维周莉梁金袁冰江千月刘志毅 鸣谢(按姓氏拼音顺序,排名不分先后): 曹风雷陈小杨程远杜沅岂段郁方榯楷付彦伟高悦黄柯鑫李昊刘圣超谭伟敏吴泰霖吴艳玲向红军张骥张艳朱思语 Part1 序章 Part2十大前沿观察 AIforScience 2.2 垂直领域科学大模型17 2.3 融入先验知识的AI模型27 2.3.1 背景介绍27 2.3.2 研究进展28 2.3.2.1 神经符号人工智能2.3.2.2 几何图神经网络2.3.2.3 物理启发的图神经网络282931 2.3.3 挑战与展望2.3.4 参考文献3132 2.4 AI科学家36 2.4.2.1 AI科学家与自主科研智能体2.4.2.2 科学家助手4036 2.4.3 挑战与展望2.4.4 参考文献4243 2.5 复杂世界的多智能体建模45 2.5.4 参考文献502.5.1 背景介绍2.5.2 研究进展2.5.2.1 基于LLM的多智能体系统研究宏观经济学2.5.2.2 基于LLM的多智能体系统研究社会群体行为2.5.2.3 基于多智能体系统的未来城市治理2.5.3 挑战与展望454646474950 2.6 AI 仿真器与系统模拟53 2.6.2.2 因果数字孪生2.6.2.3 AI驱动的多尺度数字有机体建模2.6.2.4 生物-环境闭环智能仿真系统2.6.2.5 具身生成式物理模拟引擎545557582.6.2.1 AI for PDE(人工智能求解偏微分方程)53 2.6.3 挑战与展望2.6.4 参考文献5859 Science for ai 2.7 物理世界的第一性原理62 2.7.1 背景介绍62 2.7.2.1 自由能原理: 智能的第一性原理2.7.2.2 泊松流模型: 物理启发的深度生成模型2.7.2.3 范畴论: 刻画大模型的能力边界636465 2.7.4 参考文献66 2.8 科学启发的AI新架构68 2.8.1 背景介绍68 2.8.2.1 Komogorov Arnold Networks (KAN)2.8.2.2 脉冲神经网络2.8.2.3 储备池计算2.8.2.4 机械神经网络2.8.2.5 傅里叶神经算子6970707273 2.8.3 挑战与展望2.8.4 参考文献7475 AIS 基础设施 2.9 合成数据和数据基础设施77 2.9.1 背景介绍2.9.2 研究进展2.9.2.1 合成数据生成: 从序列数据到复杂数据2.9.2.2 科学数据表示: 从图神经网络到多模态数据表征2.9.2.3 模型自我改进: 通过合成数据提升AI系统性能2.9.2.4 数据基础设施: 人体蛋白质组计划2.9.3 挑战与展望2.9.4 参考文献7778787980818283 2.10 新型智能计算86 2.10.1 背景介绍2.10.2 研究进展2.10.2.1 凡人计算2.10.2.2 光学计算2.10.2.3 量子计算2.10.3 挑战与展望2.10.4 参考文献86888889909394 Part3 展望 3.1 特殊挑战98 3.1.1 Science for Al: AI如何与人类共享知识3.1.2 Al for Science: Al如何具备实验思维9898 3.2 科学世界模型框架99 3.2.1 数据驱动模型3.2.2 深思者3.2.3 AI与现实的交互3.2.4 人类专家与AI系统的对齐99100100101 序章 已有的 AI for Science 案例包括: 1.1.1 AlphaFold AI X Science,即人工智能与科学研究的深度融合,具体包括两方面:将AI技术应用于领域学科的新兴研究方法(AI for Science);将领域学科知识用于AI算法和架构的理解和改进工作(Science for AI)。 斩获2024年诺贝尔化学奖的 Baker、Hassabis和 Jumper 的研究工作就是将深度学习技术应用于蛋白质结构预测与设计这一经典领域。蛋白质是生命的“基础建筑块”,它不仅可以催化生化反应、调节生理机制,还可以调控基因表达,运输生命必需物质以及用于抵抗病毒、细菌入侵等重要功能。Hassabis与 Jumper 开发的 AlphaFold 系列工作,可以精准预测蛋白质结构,准确度已经接近专家水平,速度则远超人类。最新版本的AlphaFold则可以预测几乎所有分子类型的蛋白质复合物结构。 2024年诺贝尔物理学奖授予的是将物理学用于AI 系统设计的研究,即 Science for AI ,而诺贝尔化学奖授予的是人工智能算法用于解决化学领域重要问题的研究,即 AI for Science。 1.1 AI for Science 随着数据的快速积累和文献的爆炸式增长,人类科学家自身的信息处理能力已经成为了制约某些学科快速发展的瓶颈。而越来越多的科学研究领域在面对复杂问题的挑战时难以利用传统的数学和物理方法,例如蛋白质结构预测、新材料的设计、复杂流体系统的模拟等等。 另一方面,随着大数据时代的降临和算力的提升,人工智能技术正飞速发展。以ChatGPT为代表的大语言模型(LargeLanguageModel,简称LLM)是AI发展史上的重大突破,而近期推理模型异军突起,例如GPT-o1/o3和DeepseekR1已经具备了强大的学习能力和推理能力,甚至可以成为科研人员重要的助手,辅助解决一定级别的科研问题。因此,如何将AI先进技术用于具体的科学领域,加速科学研究的速度成为了AIfor Science研究领域的重要挑战。 1.1.2 气象预测大模型 随着全球变暖,极端天气会越来越多的影响人类生活生存环境。因此,如何更加精准地对未来天气发 1.1.3 AI可控核聚变 核聚变是一种清洁、安全、便利的新型能源。与化石燃料相比,聚变能的使用可以显著减少对环境的影响,有助于应对气候变化。核聚变反应需要在极高温度和压力下进行,因此等离子体的稳定性是实现可控核聚变的关键。AI技术可以用于实时监测和控制等离子体状态,预测不稳定性并及时调整实验参数,以保持等离子体的稳定。2024年初,普林斯顿大学和普林斯顿等离子体物理实验室的研究人员在可控核聚变领域取得突破,他们发现了一种方法,可以利用AI预测这种潜在的不稳定性,并且实时防止实验中断。相关研究成果发表在了2024年2月份的Nature刊物上。 展进行准确预测,特别是防患极端天气的到来越来越成为意义重大的科学问题。然而,传统的气象学研究受限于数据的缺乏、人类知识和经验的局限以及气象系统内在的不确定性因素等影响,无法给出较长期而精准的预测。因此,如何将大模型等最新的AI技术引入气象领域,已经成为了近年来 AI for Science 研究的焦点之一。近年来,若干气象预测大模型被陆续开发出来,包括 Google 的 GraphCast 、华为的盘古大模型、英伟达的 FourCastNet 、复旦大学-上海科学智能研究院的伏羲气象大模型等都取得了显著进展。 1.2 Science for AI 即使已获重大突破,但 AI 技术仍然面临数据稀缺、算力稀缺、耗能过大、解释性较差等重大挑战。 (CNN)的提出就受到了生物神经网络研究的启发,尤其是对视觉系统的理解。早在20世纪60年代,神经科学家 David Hubel 和 Torsten Wiesel 通过对猫的视觉皮层进行实验,发现了视觉神经元的不同反应特性。他们观察到,某些神经元对特定方向的边缘或图案表现出强烈的反应,称为简单细胞;而另一些神经元则对更复杂的视觉刺激(如形状和运动)有反应,称为复杂细胞。这种对视觉神经元功能的理解为CNN 的设计提供了重要的理论基础。CNN 模拟了生物视觉系统中的层次结构,通过多层网络逐步提取特征。最初的卷积层相当于简单细胞,负责检测图像中的基本特征,如边缘和角落;而后续的层则类似于复杂细胞,能够识别更高层次的特征,如形状和物体。此外,CNN 中的卷积操作和池化操作也受到生物神经网络的启发。卷积操作通过局部感受野的方式,模拟了生物神经元对局部区域的敏感性,而池化 另一方面,人类科学家已经积累了各个学科领域的海量知识。如何将科学家的经验和知识,甚至一些不成型的启发式想法,转化为 AI 系统的能力,让 AI 系统与人类专家能够更好地互动、协作,构成了 Sciencefor AI 研究领域的重大挑战。 目前,已有的 Science for AI 案例包括: 1.2.1 Hopfield网络与受限Boltzmann机 本次诺贝尔物理学奖授予的两名学者,Hopfield和 Hinton 正是将统计物理中的经典模型的变种应用于神经网络架构设计,从而大大提升了机器学习问题的求解效率,为人类进入深度学习时代开辟了先河。Hopfield 所提出的 Hopfield 网络模型是在统计物理的 ISING 模型的基础上改进而得到的,它可以通过训练学习记忆一些固定的模式,并在应用阶段激活、回忆起这些模式。在Hopfield 网络模型的基础上,Hinton 所提出的受限 Boltzmann 机模型则可以通过大量数据的训练,学习数据的压缩表征,并可以通过拼接多层的方式,获得数据在多个尺度上的深层次表征。这些表征可以进一步用来分类或预测。 1.2.2 视觉架构启发的CNN网络 对真实生物神经网络结构的研究有助于人们提出更先进的人工智能系统架构。例如,卷积神经网络 操作则通过下采样减少特征图的维度,增强了模型对位置变化的鲁棒性。这种设计不仅提高了计算效率,还使得网络能够更好地处理图像中的变换和扭曲。 尽管刚刚起步,人工智能和科学研究的深度融合已呈现出“井喷式”增长:不同领域的科学家纷纷将AI融入自己的研究,同时科学领域的研究者也在关注人工智能发展,力求理解其工作原理,以期实现更好的改进。为了梳理这一快速发展的全新领域,上海科学智能研究院、集智科学研究中心和阿里云共同发起了“AI X Science十大前沿观察”项目,希望能够把脉和提炼这一新兴领域的最新发展动态。 1.2.3 等变神经网络 在分子建模、蛋白质预测、计算机视觉和机器人等领域中,很多数据都具备几何空间上的对称性,如一组点云在旋转、平移或缩放变换下会保持一定的不变性。如果用普通的神经网络技术处理数据就很难捕获到这种几何对称性。于是,人们提出了等变神经网络(EquivariantNeural Networks,EGNN)技术,可以将几何上的对称性作为一个先验偏置编码进神经网络的架构中,使得网络在输入经过某种变换时,输出能够以相应的方式变化,从而保持对称性和不变性。等变神经网络在建模分子结构、模拟多体物理系统、计算机视觉、机器人等领域具有广泛的应用场景,是将几何学、群论和刚体运动等数学、物理学知识应用于神经网络设计的典型案例。 在与上海科学智能研究院、复旦大学和大量集智俱乐部社区中的从事前沿研究的学者深度访谈基础上,我们做了大量的文献梳理,并最终凝练了“AI XScience十大前沿观察”的三个维度和十个具体方向三个维度包括:AI for Science、Science for AI和基础设施,其中,AI for Science 的前沿方向包括基于LLM 的科学研究、垂直领域科学大模型、融入先验