AI智能总结
本篇文章是AI系列深度报告第二篇,着重从AIforScience的演变,化工落地角度,应用切入口等进行分析,AI4S从效率工具升级成为智能辅助,在AI传统关注的硬件、软件之上,更多聚焦化工的应用层研究。我们从几个维度进行了方向性梳理:①AI4S发展演进,开始逐步形成了专业服务和内生研究两大方向;②AI4S先期落地解决行业痛点着重关注三个维度;③创新应用中梳理出六大方向或赛道,优化改进能够有三个维度的赋能;④高质量数据的积累和获取成为拉大企业差距的重要方向。 投资逻辑: 当前AI赛道正在快速迭代发展,我们认为AIforscience(AI4S)将对化工行业未来的竞争格局产生重大影响,本篇报告主要介绍了当前AI4S当前发展阶段,分析化工行业哪些赛道有望率先实现突破,论述化工企业应用AI中短期主要痛点和突破点,主要得出以下结论: 1、科学研究迎来“智能体主导”的新范式,已从学术层面跨入到商用层面 AI4Science正在步入“多模态大模型+自动化实验”时代,“自驱动实验室”(Self-DrivingLab)等多智能体协同平台正加速发展。未来,AI将与机器人实验密切配合,人机协同进行全流程闭环科学研究。当前AI4S已经从学术层面跨入到商用层面并产生实际的经济效益,不过并没有形成较为成熟的商业模式,业界普遍沿用合作研发模式、自主研发模式及混合模式。我们认为未来大型机构将会以混合模式为主,比如大型企业或国家级实验室可能建立自AI己的 研究平台(内部自主开发),同时对外开放部分能力,与高校、初创企业共建创新网络。小型企业则倾向于使用这些开放或商业化平台,采用合作研究模式。 2、创新应用中梳理出六大方向,实现智算平台的产品兑现;优化改进能够有三个维度的赋能,带动中长期的设备升级投资 以AlphaFold2为例,我们总结出AI4S应用场景的3类特点:①长研发周期与高成本。②数据驱动与大规模计算。③高维度设计空间。在创新研发维度,生物发酵行业菌株筛选和流程优化,新型材料的应用和适配,农药创新药等药剂产品的开发,辅材催化剂、添加剂等的升级优化及后续产物分离,微观结构带来的材料升级,配方设计、升级和应用6大方向将率先实现突破;而在优化改进方向,重复环节人工替代或者关键、危险环节检测,生产过程的智能优化, 给予充分、实时市场信息进行的资源调配3个维度可以进行优化,从而带动局部的设备投资。3、AI布局进程将逐步拉大化工企业头尾部企业的差距,其中高质量数据是决定性因素 人工智能系统的性能取决于其所依赖的数据,高质量数据将是拉开化工企业AI布局的关键。在化工领域看,高质量数据更多偏向私有化,多数企业自身积累的数据极为有限,能够进行自身赋能的相对较少。因而从数据的角度看,历史管理相对规范的头部企业、有先期的战略规划能够有效外部合作的细分龙头、能够结合“机器人”和“智算平台”的生产企业有望可以获得持续AI竞争力。 投资建议: AI垂类应用正加速向化工全链条渗透:设备端聚焦“AI+机器人”高危巡检;研发端看好“AI+自动化实验”驱动的分子发现及工艺优化;产品端关注AI辅助配方升级与新材料迭代。 风险提示: 技术快速迭代导致前期投入沉没成本风险;化工新材料验证周期长,若性能不达预期可能导致商业化验证风险;数据合规风险;高端人才争夺风险;当前AI4S标的交易拥挤度较高,存在估值回调风险 内容目录 一、AIforScience成为未来研究升级的重要路径4 1.1、AI4S已经成为科学研发领域“新范式”,进入加速发展期4 1.2、伴随AI4S发展持续深入,开始衍生出新的合作状态5 1.3、国内AI发展进一步向AI+应用落地,大型企业已经开始思索先期布局7 二、AI应用从行业痛点着手,部分赛道有望率先实现突破10 2.1、AI4S应用以高效为核心驱动,率先对症三大痛点10 2.2、创新是现阶段AI在化工应用的主旋律,关注六个细分方向12 2.3、优化生产和资源调配也是AI将逐步兑现的领域,关注设备升级带来的长期变化17 三、AI4S多行业有应用空间,但个体差异仍然明显18 3.1、高质量数据及应用将大幅拉开头尾部化工企业的差距18 3.2、AI适配性发展和高效的执行力也将是企业AI升级的重心20 3.3、AI布局,企业仍然需要硬件同步跟进21 四、投资建议22 4.1、晶泰科技22 4.2、中控技术23 4.3、志特新材24 五、风险提示25 图表目录 图表1:AI4S是继实验、理论、计算科学、数据科学之后的第五范式4 图表2:人工智能也进入深度学习和优化阶段4 图表3:人工智能已经到应用爆发阶段5 图表4:合同研究模式企业(包含混合模式)6 图表5:内部研发模式企业7 图表6:未来大型机构主要采用混合模式,而中小企业将以合作研究模式为主7 图表7:中国AI4S相关政策与提议7 图表8:AI产业链上游和中游环节在大政策支持下率先崛起和发展9 图表9:头部企业AI人才招聘情况9 图表10:AlphaFold2在CASP14以绝对优势击败其他实验室团队11 图表11:AlphaFold2工作原理分为四步12 图表12:Eiseul等用神经网络识别必需食品发酵细菌,准确率超过了97%13 图表13:周勇等用人工神经网络与遗传算法优化生物发酵培养基,产量提升63.33%13 图表14:理解并量化化学结构与性能之间的关联是复合材料核心难点13 图表15:利用对抗生成网络结合预测模型实现材料逆向生成14 图表16:农药和医药具备相似的药物研发流程15 图表17:氟虫酰胺作用于鱼尼丁受体的过程示意图15 图表18:新烟碱类农药作用机制15 图表19:碱中毒导致催化剂失活16 图表20:吸附膜材料种类众多16 图表21:利用丰富的已知结构数据,花费较低的额外计算成本即可预测新结构16 图表22:AI被用于预测新的溶剂分子、新的添加剂、新的配方和新的溶剂化17 图表23:机械狗在高位环境中辅助检测17 图表24:中控技术为湖北三宁部署AI监测系统17 图表25:全球数据交易市场规模30年将达3000亿美元18 图表26:中国数据交易市场规模30年将达5000亿元18 图表27:中国数据库规模持续提升(亿元)19 图表28:数据库的云部署目前是大方向19 图表29:数据库的发展由野蛮生长进入质量要求阶段19 图表30:AI投资的价值20 图表31:AI领军者企业对数据源的利用率更高20 图表32:AI被用于预测新的溶剂分子、新的添加剂、新的配方和新的溶剂化21 图表33:鞍钢集团依靠华为云储存和算力平台降低配煤成本22 图表34:煤矿智能化解决方案架构22 图表35:机器人实验室产生大数据训练领域AI模型,自主完成反应预测与实验设计23 图表36:晶泰科技分业务收入(亿元)23 图表37:中控技术时序大模型TPT24 图表38:中控技术分业务收入(亿元)24 图表39:志特新材分业务收入(亿元)25 一、AIforScience成为未来研究升级的重要路径 1.1、AI4S已经成为科学研发领域“新范式”,进入加速发展期 AIforScience(AI4S)是指将人工智能技术应用于科学研究之中,成为继实验、理论、计算机科学、数据科学之后的“第五范式”。它利用深度学习等方法解决生命科学、材料科学、化学反应等领域的核心难题。人工智能经历了70多年的发展,贯穿了符号主义、连结主义和行为主义,进入到深度学习阶段,不仅能够对“已有”进行高效拆解、学习和分析,也逐步能够对“未知”进行判断、模拟和自我修正,正因如此,人工智能开始在应用端具备更进一步的落地价值,不仅仅作为现有状态的效率提升工具,更能够辅助制造行业的创新、优化和预警。 DeepMind团队在2020年用AlphaFold2模型破解了蛋白质折叠难题,从而“显著加速了结构生物学研究”。2024年诺贝尔化学奖授予AlphaFold的发明者,化学奖再次凸显诺奖委员会对AI的青睐。最新的AlphaFold3模型甚至能预测蛋白质、DNA、RNA及药物分子的相互作用,时任谷歌DeepMind高级研究科学家的JohnJumper认为其将显著加速生物学研究速度5%-10%。这些实例表明,AI4S正在从原子/分子层面深化对化学反应机制的理解,大大提高了研发效率和精度, 图表1:AI4S是继实验、理论、计算科学、数据科学之后的第五范式 科学范式 时间阶段 主要方法 核心技术 优势 局限性 代表性成果 第一范式(实验科学) 古至今 观察与实验 实验仪器 直接验证现象 受限于实验条件 牛顿力学实验 第二范式 (理论科学) 文艺复兴后 抽象建模与推理 数学工具 普适性强 理想化假设 相对论 第三范式(计算机科学) 20世纪中期 数值模拟与仿真 计算机 可模拟复杂系统 计算能力约束 气象模拟 第四范式 (数据科学) 21世纪初 数据挖掘与统计分 析 数据库与统计 从数据中发现规律 数据质量依赖 人类基因组计划 第五范式(AIforScience) 现在与未来 AI驱动的科学发现 人工智能算法 自动化探索、跨学科融合 可解释性不足 AlphaFold蛋白质结构预测 来源:原野等《创新联合体赋能新质生产力的理论机制与实践路径研究》,国金证券研究所 图灵测试 逻辑理论家 反向传播算法 多层感知机回归 AlphaGo 深度强化学习 追求具备可解释性的规则推理 主张通过模拟人脑神经元的连接方式 强调通过试错与交互来优化行为 图表2:人工智能也进入深度学习和优化阶段 1950s 1980s 2010s 符号主义 连接主义 行为主义 来源:上交研究院,国金证券研究所绘制 人工智能的研发已经持续了近80年,开始有向“智能体主导”发展的新趋势。参考历史 不同生产力阶段持续时间:①狩猎采集时期(公元前38000年-公元前8000年)共3万 年;②手工业农业时期(公元前8000年-1430年)共9400年;③贸易工业时期(1430年 -1955年)共525年;④计算机科学时期(1955年至今)已有70年,从线性推演来看,由AI引爆的生产力革命已经开始并且会有极快的迭代速度。 ①1940s–1990s:机器学习和神经网络起源。1943年McCulloch与Pitts提出了数学神经元模型,通常被视为机器学习的奠基;1958年Rosenblatt提出感知器 (Perceptron),这是首个能“学习”数据的人工神经网络原型,被认为是现代神经网络的基础。此后Minsky和Papert在1969年揭示了单层感知器无法解决异或问题的局限性,引发了简单神经网络的“冰河”期。到了1980年代,研究者又提出了反向传播等多层网络算法(Bryson和Ho等),为后来的深度学习铺平了道路。 ②1990s–2010s:深度学习的兴起。进入90年代后,卷积神经网络、循环神经网络等取得突破性进展,并应用于图像识别、语音识别等领域。2006年之后,随着大数据和GPU算力的快速增长,深度学习逐渐爆发,如2012年AlexNet在ImageNet竞赛中胜出,标志着深度神经网络进入主流。这一阶段可以看作是AI算法和算力双重优化、ML算法成熟的大融合期,为后续复杂科学任务提供了算法基础。 ③2018年至今:OpenAI推出GPT,AI4Science应用相继爆发。近几年AI技术开始面向科学前沿领域落地,尤其是生物医药和材料科学等行业。2020年DeepMind的AlphaFold2模型以接近实验精度预测了数以万计蛋白质结构,被《Science》评为2021年年度科学突破。2024年AlphaFold3进一步扩展到蛋白质-蛋白质、蛋白质-DNA/RNA复合物等多分子相互作用。与此同时,大规模语言模型和生成式AI在科研工具层面成熟,为AI辅助假设生成、文献分析等提供了强力支持。 图表3:人工智能已经到应用爆发阶段 来源:Teachtarget,国金证券研究所 下一阶段,AI4Science有望进入“多模态大模型+自动化实验”时代。科研领域的基础模型构想正在