AI智能总结
AI for Science:下一个超级应用。AI For Science(AI4S)即人工智能驱动的科学研究,2024年的英伟达GTC大会中,黄仁勋将大语言模型、具身智能、AI4S并列为AI三大关键方向。通过建立相应的AI垂类模型,AI4S可以对产品配方进行优化、研发出升级迭代的新品、对测试结果进行建模预测,为企业研发效率带来切实的大幅提升。数据和算法能在多维复杂问题中比人脑更好地抓住规律,一方面,AI4S可以由原子尺度深入化学反应的本质,并通过AI与超算结合的方式寻求合成路径、化合物结构、复配体系的最优解;另一方面,近年来快速发展的机器人“黑灯实验室”可以7×24小时高效进行海量实验,让数据迎来质与量的同步飞跃,加速训练AI模型,形成飞轮效应。 新材料是AI4S的星辰大海。在新能源、半导体显示、化工、合金材料四大新材料领域,AI4S具备巨大的应用潜力。新能源:随着晶泰科技签订五年10亿元钙钛矿订单,新能源产业开始了对AI4S如何赋能钙钛矿、固态电池等前沿赛道的加速探索;半导体显示:AI4S在光刻胶、OLED有机发光材料等迭代型产品方面应用潜力巨大;化工:传统化工市场巨大,不乏有子行业面临同质化竞争,亟需研发变革,而AI4S在配方优化、过程优化、新材料迭代、自动化等领域有望全方位给化工赋能;合金材料:组合可能性极丰富,AI4S可以从微观出发提供全新的思路,助力寻找下一代超级合金;在生物医药领域,曾困扰业界50年的蛋白质折叠问题因AlphaFold而取得了巨大突破,晶泰将辉瑞新冠药上市时间缩短六个月亦是标志性案例,AI for生物医药已经迎来加速渗透的“甜蜜点”。 商业化多级跳,AI for Science远期拥抱万亿蓝海。受AI技术的发展驱动,AI4S也从早期的“科学辅助”跨越到了“范式革命”的新阶段。而DeepSeek的问世令企业可以本地化部署DeepSeek私域模型,解决了算力瓶颈,促使AI4S企业专注于能提供深度与经验的垂类模型的搭建。远期,AI4S的空间能有多大?根据深势科技创始人:AI4S有望成长为千亿美金的巨大市场。在化工、医药、新能源、合金、显示、半导体六大领域中,AI4S合计可覆盖的下游市场规模接近11万亿美元。当研发渗透率达到2.5%时,AI4S行业的规模约149亿美元,若渗透率能提升至25%,则AI4S将成长为年产值突破1400亿美元近万亿人民币)的巨大市场。 我国拥有诞生AI for Science巨头最好的土壤。根据深度原理创始人:“在美国去工业化的背景下,材料化学领域的中国企业,正积极从生产转向研发,故AI for Science在中国的落地机遇更为丰富”。我们观察到,在AI4S先行者中,不乏有晶泰科技、深度原理等海归派均孵化自美国MIT),在美国创新药产业发达的情况下毅然决定回国拥抱更大的材料市场。我国拥有最齐全的化学制造业门类、最完备的产业链。我们认为,未来的AI4S全球龙头有望率先诞生在中国。 投资建议:重视立足医药基本盘正在进军新材料的AI4S龙头晶泰控股,以及携手中科大孵化企业正进军AI4S的行业新锐志特新材。 风险提示:技术路线渗透不及预期,下游盈利不及预期,计算存在误差。 1.什么是AI for Science? 1.1.AI for Science是化学研发的超级范式 AIForScience AI4S)即人工智能驱动的科学研究,2024年的英伟达GTC大会中,黄仁勋将大语言模型、具身智能、AI4S并列为AI三大关键方向。通过建立相应的AI垂类模型,AI4S可以对产品配方进行优化、研发出升级迭代的新品、对测试结果进行建模预测,为企业带来研发效率切实的大幅提升。 AIfor Science能为化学研发做什么?以材料为例:传统的材料研发模式近乎“炼金术”,而AI能够在“读-算-做”各环节全面赋能材料研发。1)读:AI的文献阅读速度显著快于人类。通过阅读文献,AI可以识别现有论文大纲中的分子式、图片、表格等多模态数据,总结已有研究并生成新的研究思路;2)算:各种垂类模型为AI提供了进行科学分析的工具,AI可以从设计仿真、表征测试、优化制备工艺等方式实现提速增效;3)做:再与自动化流程衔接后,AI可以指导机器人自动完成试验过程,调用预训练模型分析所获得的大量真实数据,不断重复“Design-Build-Test-Learn”的闭环过程,就能得到最终优化后的产品解决方案。 图表1:AI能够在“读-算-做”各环节全面赋能材料研发 数据和算法能在多维复杂问题中比人脑更好地抓住规律。在问题维度少的时候,人脑相对容易找到规律。然而对于多维复杂问题而言,数据和算法往往能够相比人脑更好地抓住规律。同时在原理层面,AI建模可以由原子尺度深入到化学反应的本质,从而全方位地赋能化学研发。此外,AI算法的核心之一是对工具的运用能力,目前已有的工具箱已经足够丰富,因此更为核心的是知道在什么场景下去选择运用哪种工具来解决问题的能力。 将AI算法应用于科研领域时,还必须借助强大算力硬件、多尺度理论模型的帮助,进而提升速度、改善精度。 多尺度建模——提高精度:在材料研发领域,科学家需要解决从亚原子到宏观物体、从飞秒级运动到小时级生物过程等各时空尺度下的复杂问题,需要在各个尺度上进行建模。量子力学第一性原理能够在最小尺度上精确模拟物质,AI4S可以从第一性原理出发(一般深入到原子、电子尺度)进行运算,确保精度。此外,AI4S也能够综合利用分子动力学、计算流体力学等更宏观尺度下的模型,跨尺度研究,规避单尺度的局限性。 超级计算——提升速度:过去,在第一性原理精度下模拟具有1亿个原子的体系需要用时60年,但超算时代,用时可缩短至仅1天。2023年底,GNoME( 歌DeepMind的材料研发模型)准确预测了一系列稳定的晶体结构,并从中生成了220万种材料,但如果凭借人力计算出这些材料,需要花费800年。 图表2:提升速度:GNoME探索出了381,000种新的稳定材料,几乎比以前的工作大了一个数量级 图表3:提高精度:GNoME能对含有5种以上独特元素的结构进行准确预测,人类科学家几乎难以企及 AI模型的训练离不开数据的积累,近年来快速发展的机器人自动化实验能让数据迎来“质”与“量”的同步飞跃,促使AI模型加速进化。高质量数据如同大语言模型的“语料”,是AI4S的金矿山。传统科学实验过程中的数据尤其错误的数据)往往不会被很完整地记录下来,造成化学领域数据的缺失,因此需要通过AI4S结合自动化的方式积累用于训练垂类模型的数据。AI4S企业的数据来源有干实验、湿实验两种,前者是数字化建模、提供用于虚拟筛选的数据,而7×24小时不间断运行的机器人直接参与湿实验,自动化完成投料、合成、稀释、过滤和液质分析等系列过程,同时提升数据的规模和标准化程度,最终反哺给模型学习迭代,形成量变到质变的数据飞轮效应。 图表4:近年来,机器人自动化实验室快速发展 沉淀了模块和系统能力的软件架构是实现“黑灯实验室”的关键,例如,晶泰通过智能调度系统远程可以操控百台规模自动化工站和AGV小车,相比传统方式效率大幅提升。 图表5:晶泰科技的机器人自动化“黑灯实验室” AI4S大体上具备两类商业模式:1)依托数据库与技术平台,担任“铲人人”( 角色。业 内已经涌现出一批以AI4S为核心的企业,这些企业既可以为客户定制用于全新细分领域的AI垂类模型,赋能特定管线,又可以将反复淬炼后得到的AI垂类模型、平台工具授权给客户使用,平台化发展。举例而言,前者如晶泰控股为辉瑞新冠特效药确定稳定晶型,后者如深势科技开发的“(材料智能设计”科研软件SimpFine,能够广泛应用到电池原材料配方设计、溶液性能调优、合金材料成分设计、陶瓷工艺性能设计等多个领域; 2)通过AI+自动化的研发范式独立或与生产企业联合研发出“AI新材料”,产业化后销售盈利。时至今日,我们观察到已经有企业能借助算法研发出高度定制化的新材料,未来其中不乏能诞生出商业化前景巨大的超级“AI新材料”。 1.2.远景:从超算跨越至量子计算 量子计算具备颠覆现有算力格局的潜力。据新华社,我国“九章三号”量子计算原型机求解特定数学问题只需要百万分之一秒,比超算快一亿亿倍,这种速度的差异核心在于两者并行计算的逻辑大相径庭。如果说超算是通过多核协作拆分任务的线性提速如千万级CPU/GPU并行处理),量子计算则是借助量子叠加态和纠缠态实现的指数级并行n个量子比特可同时处理2ⁿ种状态)。也即传统计算机只能依次尝试推开每扇门寻找出口,而量子技术如同施展了分身术——同时推开所有门寻找出口。依靠于“既在此处又在彼处”的量子叠加特性,量子计算在处理复杂组合问题时如鱼得水,运算速度爆炸式提升。 图表6:量子计算与超算的对比 量子计算特别适合求解药物研发、分子模拟等具有“组合爆炸”特性的复杂优化问题。 例如在药物研发领域,完整描述一个药物与其目标相互作用涉及数千个原子。自由能计算需要数十亿个单点计算,超算模拟分子相互作用时,需逐个验证数以亿计的原子排列组合,而量子计算机能利用量子叠加态同步生成所有可能的分子构象,直接锁定有效药物结构,避免算力和计算时间的指数性增长,有望开启药物、材料研发的新纪元。 图表7:传统计算在处理蛋白质折叠等高复杂度问题时,难以完成搜索过程,而量子计算则可进行全局遍历 未来,AI与量子计算的深度结合有望极大拓展AI4S的能力边界。现阶段,AI4S主要由AI与超算结合实现,而AI与量子计算的结合能够加速在混沌中开辟精准推演通道的进程。在实践方面,我国企业微观纪元已与阿法纳生物合作开发了国内首个基于量子计算和生物医药的药物设计平台MiQro RNA,该平台凝聚了经典算法和量子计算的强大力量,将AI技术与量子化学技术完美结合,提供了一个超越传统的设计平台,此平台的发布不仅意味着量子计算在实际应用中的重大里程碑,也同样预示着未来mRNA药物研发领域的跨越式发展。 2. AI for Science蕴藏着巨大的应用潜力 物质科学与生命科学是AI4S的两大主战场,开发材料与新药是最典型的应用场景。曾困扰科学家50年之久的蛋白质折叠问题就是典型的高维问题,该难题因AlphaFold的出现而取得了巨大突破。这是因为在目标函数明确、数据量足够的前提下,AI学习与高性能计算的结合能够以从头计算的精度来模拟数亿个原子的系统,模拟精度提升5个数量级,特别适合解决蛋白质折叠等传统物理计算失效的多维场景。不局限于蛋白质,生命科学和物质科学领域多维问题层出不穷,而材料和药物的开发正是典型的多维问题。 图表8:药物与材料研发都是多尺度高维问题,共同关键在于探究结构与性质间的关系 2.1.新材料:AI for Science的星辰大海 材料研发的重点在于对“构效关系”的研究。不同服役环境下的材料开发过程涉及到“组分-结构-工艺-性能”多个环节,实际的研究工作非常复杂,研究时需要对材料和环境的物理、化学及力学性质进行耦合建模,例如需要求解热、力、电、辐照同时作用于固体、液体混合体系后的影响等复杂问题。针对于此,材料的研发需要采用不同尺度的模拟方法,对被研究对象的物理性质、化学性质、生物性质做分析,并用实验配合计算,以缩小材料创新的搜索空间,加速材料创新进程,尤其适合用AI智算来解决。 2.1.1.新能源:AI4S正在探索固态电池、钙钛矿等前沿领域的性能边界 AI正加速钙钛矿、超分子、锂离子电池、正极材料、碳硅材料等材料的研发。新材料的研发多属于高维非线性优化问题,AI4S这一新研究范式可以凭借统一数据建模框架、跨尺度仿真能力和自主实验平台加速材料研发,推动材料科学进入“智能设计”时代。 图表9:在新能源领域,AI可全面赋能化学研发 AI革新钙钛矿电池开发。钙钛矿材料具有优异的载流子扩散性能、易于溶液加工等优势,有望成为下一代主流太阳能电池技术。AI4S可以从钙钛矿制备工艺优化、表征数据分析和钝化层材料筛选等多方面做出贡献。举例而言,传统钙钛矿材料光谱