您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中邮证券]:AI制药:从降本增效到分子创新,数据生产构筑长期壁垒 - 发现报告

AI制药:从降本增效到分子创新,数据生产构筑长期壁垒

医药生物2026-01-22盛丽华、徐智敏中邮证券风***
AI智能总结
查看更多
AI制药:从降本增效到分子创新,数据生产构筑长期壁垒

行业投资评级:强大于市|维持 中邮证券研究所医药团队 盛丽华(首席分析师)SAC编号:S1340525060001徐智敏(分析师)SAC编号:S1340525100003 投资要点 前言:AI+制药行业的投资价值在于行业的现状分析和未来判断。投资思路上来看,我们认为在于理解当下AI在制药中的作用地位、商业模式和成长空间、行业成长的关键要素和竞争壁垒。 AI在制药中的作用是什么?增效和创新。 基于现有的技术和未来的发展状况,我们认为药物研发基于实验科学的本质不会因AI的迭代升级而发生颠覆。AI在制药端最成熟的落地应用在于提升了临床前的降本增效:AI虚拟筛选极大地降低了真实试验中所需要投入的化合物的数量,从而有效缩短了临床前研发周期、大幅减少研发成本。此外,AI分子生成摆脱认知偏见具有创新价值,目前的AI分子(如TNIK)进展进入临床2期阶段,有望逐步兑现其创新价值。 市场规模已超百亿美金,AI+CRO/AI+Biotech仍是企业造血盈利的大趋势 市场空间来看,全球 AI 赋能药物研发费用市场规模由 2023 年的 119 亿美元有望增长至 2032 年的 746 亿美元,CAGR达22.6%。行业投融资热度整体高昂,国内有所收缩。从长远的商业化来看,我们认为AI+CRO/AI+Biotech仍是企业造血盈利的大趋势:一方面利于快速创收,另一方面利用合作项目可以完成企业自身算法模型迭代升级,构筑自身长期竞争力。 算法+数据深度绑定,高质量数据的生产能力是核心竞争力。 算法+数据是行业核心技术迭代升级的关键生产要素。算法突破的关键因素在于研发人才团队,而数据的竞争在于高质量数据生产能力(而非传统试验数据的堆积),以实现数据积累和算法迭代之间的闭环和正向循环。大规模高质量的数据是行业稀缺资源,原因在于纳入训练集的数据要求苛刻+数据不共享(“数据孤岛”)。由于实验数据涉及核心利益,长期来看“数据孤岛”的行业特征不会改变,因而高质量数据生产能力是长期的核心竞争力。 相关标的:行业容易形成马太效应,建议关注领先布局者:英矽智能、晶泰控股、泓博医药、成都先导。 风险提示:研发失败风险、行业竞争加剧风险、地缘政治风险、政策变动风险 AI在制药中的作用是什么?增效和创新 市场规模超百亿美金,分子实体是商业化重点 高质量数据的生产能力是核心竞争力 AI在制药中的作用是什么?增效和创新 1.1 AI+药物研发:概述 AI制药是指将NLP、深度神经网络,生成模型等AI技术与传统制药环节相结合,提升新药研发效率,拓展药物创新空间的技术应用。AI医疗大模型基于深度学习、自然语言处理等技术,整合海量生物医学数据(如蛋白质结构、基因序列、临床试验数据),赋能药物研发全流程,包括新药发现(靶点发现、虚拟筛选、蛋白质结构预测)、新药开发(ADMET预测、晶型预测、合成路径)、临床试验优化(患者分层与剂量预测)。具体应用:基于物理化学原理的AI算法提升小分子药物研发效率;在细胞与基因治疗(CGT)领域,AI也可赋能抗原识 别、载体设计、放大优化等关键环节。 1.1 AI+药物研发:AI技术不会颠覆药物研发的逻辑 AI制药在谈论AI+新药研发的融合之前,首先需做出判断:AI技术是否会颠覆制药行业?我们认为,不能。基于以下因素考虑:1、应用层面:AI计算的“虚拟”数据无法替代临床的“真实”数据。AI尚未能预测药物在人体系统中的反应, 而临床试验中个体异质性还会使复杂程度几何倍增。2、监管层面:我们认为药物的安全性是监管考虑的首要因素,而临床试验是安全性证明的唯一来源。长期来看不存在替代品,药物开发的审批流程长期不会改变。因此,药物研发的基于实验科学的本质不会因AI的迭代升级而发生颠覆。 1.1 AI+药物研发:应用重心在临床前研发阶段 AI发挥降本增效的作用之处在于临床前的研发环节。其主要原因在于药物发现环节可提供技术附加值多。其中虚拟筛选或是最为重要的AI应用,可快速从上百万化合物中通过计算的方式筛选出少量更具有潜在活性的化合物,极大地降低了真实试验中所需要投入的化合物的数量, 进入临床前阶段后,通过ADMET预测等方式来协助研究优化分子降低失败风险,从而有效缩短了研发周期同时大大降低了研发成本。此外,AI主要的应用场景还包括靶点发现与验证(研发最早期,利用LLM等方式实现大范围的靶点搜寻)和分子生成(有望产生不存在的新分子)等。 资料来源:英矽智能招股书,弗若斯特沙利文,中邮证券研究所 1.1 AI+药物研发:应用重心在临床前研发阶段 AI赋能下药物发现研发费用节约达90%+,周期大幅缩减。从研发流程来看,依次为:靶点(target)发现及验证、苗头化合物(hit)筛选、先导化合物(lead)的发现、临床前候选药物(PCC)的生成。根据Nature Reviews 发表的统计数据,在由target到hit、由hit到lead和由lead优化(至PCC)的三个阶段传统方法的平均资本支出分别为94、166和414百万美元。根据Insilico Medicine公布的数据,AI能够将上述阶段花费分别缩减至0.2、0.4和2百万美元,缩减比例均为90%以上。同时,AI可将上述阶段的研发周期由传统方法的1年、1.5年和2年缩减至2个月、4个月和11个月,分别节省83%、78%和54%。(注:由于发布时间和统计范围等,两者的数据口径可能存在不一致,计算所得数据仅供参考。) 1.1 AI+药物研发:应用重心在临床前研发阶段 原理上来看,AI基于数据驱动,能够极大提升海量、多维数据的处理效率。靶点发现、hit筛选以海量的数据库为对象,lead和PCC环节需要进行多指标的评价,AI的契合有效提升了应用效率,详情可参见下方表格。我们认为,AI的效率提升的效果:1、数量上大幅减少了非必要化合物的合成与投入;2、质量上基于数据驱动的优化方法提高成功率。 1.2 AI+药物研发:Think out of box的创新价值 AI赋能的核心还在于以分子生成为代表的创新价值,即业界所说的“Think out of box”。在传统研发路径下,化合物设计需要依据已有规则,多样性会受到编码规则、构建模块库等的限制。而基于生成对抗网络、强化学习等模型,AI实现由数据驱动,通过已有数据库学习完成自主的分子设计和生成。我们认为,AI+制药的创新有三条主要落地路径: 1、靶点的创新:AI所能触及的数据空间广度与维度突破了人类的框架限制,因而利于发掘出新适应症的靶点或 者老适应症的新靶点,具备开发FIC的潜力。2、分子结构的创新:由AI生成的分子不受限于过往规则,因此在分子骨架等结构上更加具备创新意义。3、药物重定向:基于疾病/药物相似性网络等,对已有药物关联寻找新适应症。对已上市药物的重定向可以直接进入临床二期,开发效率提升显著。 1.2 AI+药物研发:Think out of box的创新价值 医疗大模型日益发展,AI创新药物在曲折中发展。上述路径具备理论上的可行性,并已有相关的进展。但需要强调的是目前尚未有AI自主设计的分子药物成功上市,同时首个进入临床的AI设计分子DSP-1181已停止研发;截止2026年,英矽智能的AI设计分子Rentosertib完成2a期临床,有望实现首个AI驱动发现的分子落地。客观来看,AI设计的分子虽然具备新颖性,但脱离“box”同样可能会使产生的分子在现有的合成框架下难以触达。 其限制来自于没有足够高质量的数据可提供。我们认为基于传统的数据,AI 在生物路径、化学反应过程等生化知识体系的“学习”并未获得理想效果,因而造成了早期项目的进展并不顺利,但我们认为新技术的突破必然是曲折的,随着技术的迭代,后继者们仍在快速补位,推动AI创新分子的落地。 1.3 底层技术决定AI效用,算法+数据是“限速步骤” 行业底层技术框架决定AI的价值效用:计算机辅助设计 ( CADD ) 的 出 现 和 应 用 先 于 AI+ 新 药 研 发(AIDD),是计算机参与新药研发的底层技术框架。AI的价值效用在于:利用AI在组合学和优化问题的计算优势,提升了CADD在具体应用层面的效果表现。具体来看,基于深度学习等AI模型加速了药物开发各环节的进展,详情可参考右图。 1.3 底层技术决定AI效用,算法+数据是“限速步骤” 回顾发展历程来看,我们认为,AI增效实现“0-1”在于以下三点:I.虚拟筛选的算法成熟,底层原理(QSAR/QSPR)清晰,能够很好地与AI模型结合; II.训练数据集丰富、公开:配体库作为虚拟筛选的数据来源,拥有数百亿分子,同时实现了商业化便于获取;III.AI算法的开发、GPU等硬件的快速升级使得AI大数据处理能力的飞速提升。 1.3 底层技术决定AI效用,算法+数据是“限速步骤” 回顾发展延用上述框架分析,分子生成(AI创新价值的代表)的限制因素为算法和数据:1、尚未有算法能够同时兼顾分子结构创新和合成性:分 子生成采用的是深度学习等模型,基于虚拟筛选形成的数据库进行“学习”,但是其学习框架依旧在CADD的基础之上:基于配体的药物设计(LBDD)/基于结构的药物设计(SBDD)。因此通过建模获得的分子符合基础的药化原理,但是往往会缺乏合成性原则导致无法在真实世界中合成。 2、分子生成所需的数据更多维,且来源往往受到保护不会公开。分子生成的数据需要考虑到多个维度:符合化学规则、生物途径、可合成等。同时,AI模型的训练需要兼顾成功与失败的数据,而往往公开的数据都是成功的案例。AI+制药公司的项目分为两类——仿制药与创新药。创新药的 研发AI的表现如前文所述,尚未概念性验证,AI管线整体偏临床早期;而在仿制药的开发上,由于靶点、阳性参考物(仿制的创新药分子)结构等已确立,以CADD的传统方法即可完成开发,AI的边际效应可能不大。综上,我们认为AI增效作用将会助力AI+药物研发在“1-10” 阶段快速发展。同时,我们看好AI的创新价值,分子生成具备诞生BIC/FIC的潜力。实现这一价值,在于算法的突破和数据的获取或者分享,而两者的攻克都需长期的付出和投入。 市场规模超百亿美金,分子实体是商业化重点所在 2.1 AI+制药融资热度有所起伏,产生结构性分化趋势 自2015年以来,全球AI+新药研发投融资快速增长,至2022年累计达246亿美元。国内融资数量及金额在2019年后开始大幅上涨,2021年达99.6亿元。2022受全球经济衰退影响,全球范围内的融资热度有所下降。24年热度回暖,但产生结构性分化。据智药局监测,2024年全球AI+药物研发融资总金额为58亿美元,融资笔数128起。 其中美国AI药物研发融资事件64起,中国37起,其他国家和地区为27起,投融资活动仍然主要活跃在中国、美国和欧洲。从资金占比来看,美国仍然占据全球AI制药的融资高地,中国的AI制药资金占比则为10%。而刨除晶泰科技、BioAgeLabs等公司IPO的影响,中国AI制药初创公司的融资额占比进一步下降,仅占全球融资额的8%。 2.1 行业尚未形成统一的范式,企业间不尽相同 目前尚未有AI自主/辅助设计的药物上市。从技术角度来看,AIDD并未证明持续有效性且并未出现突破性的算法可以跳出CADD的框架。因此,行业内不存在统一的技术范式,企业间的算法和参与研发的环节不尽相同,详情可见下表。国内外的企业参与研发环节有所差异,化合物筛选和先导化合物设计合成环节是大多企业聚焦的环节。我们认为背后的原 因在于:1、两者的底层原理清晰,scaling up效果显著;2、随着研发环节逐渐向后,产生的数据量会逐渐减少,对于AI的依赖度降低,AI+制药公司切入难度大。目前国内外龙头已表现出了全流程覆盖的趋势,如Schrodinger、Exscientia、英矽智能、Recursion等。但是同时也存在 公司只参与部分环节。 2.1行