您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [国金证券]:医药产业研究第9期:AlphaGenome首次揭开基因“暗物质”;中美创新药,监管比拼“全球首发” - 发现报告

医药产业研究第9期:AlphaGenome首次揭开基因“暗物质”;中美创新药,监管比拼“全球首发”

医药生物 2026-02-03 赵海春,甘坛焕 国金证券 善护念
报告封面

AlphaGenome首次揭开基因“暗物质”;中美创新药,监管比拼“全球首发” 分析师:赵海春 SAC:S1130514100001zhaohc@gjzq.com.cn 分析师:甘坛焕 SAC:S1130525060003gantanhuan@gjzq.com.cn 核心要点 产业前沿 (1)前沿动向:生命解密再升级,AlphaGenome首次揭开基因“暗物质”。2026年1月,DeepMind的AI模型AlphaGenome的新作荣登本期Nature封面。要点有3:①解码升级,对非编码基因组的系统性破解。此前研究多聚焦在仅占总量2%的编码基因,而该模型是对98%非编码基因变异影响趋势的预测。②功能性变异影响预测的工具化。通过对非编码区变异导致的调控变化进行高精度预测,该模型为解析复杂疾病致病机制、靶点探索及精准医疗提供新范式。③AI模型的开放与生态构建。该模型代码与权重的开源,将促使全球科研社区更快进行算法迭代与应用开发,加速基因组AI工具的普及。(2)监管动态:FDA发布新药审批年报,中美进入“全球首发”抢跑新阶段。(3)产业链:CDMO巨头Lonza“瘦身”成功,2025年业绩拐点确立。 资本风向 (1)阿斯利康再押减肥:185亿美元买入石药减肥月制剂等8项目及平台授权。(2)罗氏加码小核酸:15亿美元牵手圣因生物,RNAi再落一子。(3)药明生物CD3平台再授权:CDMO平台技术授权赋能分子创新或成新常态。 本周观点 综上所述,AI赋能,生命解密深入,创新提速;比拼升级,中美开赛“全球首发”。我们认为,随着AI应用在生命科学领域的推进,诸如,本期开篇所述,AlphaGenome实现对人类占比98%的非编码基因变异影响趋势的预测,将极大提速疾病机制剖析与新药研发进程。在此背景下,不论是投资方还是企业方,要在新格局下脱颖而出,对创新方向的选择可能远重要于对临床推进的追赶。 内容目录 一、产业前沿.........................................................................................................3 前沿动向:生命解密再升级,AlphaGenome首次揭开基因“暗物质”..............3监管动态:FDA发布新药审批年报,中美进入“全球首发”抢跑新阶段............9产业链:CDMO巨头Lonza“瘦身”成功,2025年业绩拐点确立...................12 二、资本风向.......................................................................................................14 阿斯利康再押减肥:185亿美元买入石药减肥月制剂等8项目及平台授权...14罗氏加码小核酸:15亿美元牵手圣因生物,RNAi再落一子.........................15药明生物CD3平台再授权:CDMO平台技术授权赋能分子创新或成新常态19 三、本周观点.......................................................................................................20 AI赋能,生命解密深入,创新提速;比拼升级,中美开赛“全球首发”......20四、产业链数据更新............................................................................................20风险提示..............................................................................................................24 图表目录 图表1:AlphaGenome模型架构与训练方案........................................................7图表2:AlphaGenome模型的综合评估结果............................................................7图表3:美国CDER在2016-2025年批准新药及2025年“同类首创”比例.................10图表4:2023-2025年中国内分泌及代谢系统药物IND申报数量快速上升.................11图表5:2020-2025年中国双抗/多抗及核酸领域IND数量增长................................12图表6:2025年Lonza收入新格局与全球Top20大药企资本开支趋势.....................14图表7:圣因生物的LEAD™肝外递送平台..............................................................17图表8:25/12-26/1国内新药获批上市情况(截至2026/1/30).........................21图表9:25/12-26/1国内新药申报上市情况(截至2026/1/30).........................22图表10:25/12-26/1医药跨国授权交易情况(截至2026/1/30).......................23 一、产业前沿 前沿动向:生命解密再升级,AlphaGenome首次揭开基因“暗物质” 2026年1月29日,谷歌旗下DeepMind的最新基因组AI模型AlphaGenome荣登本期国际顶级科学期刊Nature封面。Deepmind发表最新论文并开源其研究代码与模型权重。该模型被视为继AlphaFold之后DeepMind在生命科学计算领域的又一重磅进展。要点有三:(1)解码升级,对非编码基因组的系统性破解。此前研究多聚焦在仅占总量2%的编码基因,而该模型是对98%非编码基因变异影响趋势的预测。(2)功能性变异影响预测的工具化。通过对非编码区变异导致的调控变化进行高精度预测,该模型为解析复杂疾病致病机制、靶点探索及精准医疗提供新范式。(3)AI模型的开放与生态构建。该模型代码与权重的开源,将促使全球科研社区更快进行算法迭代与应用开发,加速基因组AI工具的普及。 解码升级:人类基因组约包含30亿个碱基对,其中仅约2%为蛋白质编码区,其余98%的非编码区域长期因调控机制复杂而被视为“基因暗物质”。AlphaGenome是对这部分非编码区域进行系统性建模,预测其在不同调控环境下对基因表达与功能表型的影响。我们认为,该模型有望将长期被忽略的“基因组暗物质”转化为可量化、可解释的调控信息,填补基础基因组学的关键认知空白。 意义:解读基因组序列变异的影响,一直是生物学领域的一项核心挑战。位于蛋白质编码区之外的非编码变异尤其难以解读,因为它们可以引发多种多样的分子后果。 成果:根据DeepMind 1月28日在Nature的论述,利用深度学习模型 从DNA(脱氧核糖核酸)序列预测功能基因组测量结果是解读基因调控密码的强大工具。现有方法需要在输入序列长度和预测分辨率之间进行权衡,从而限制了其模态范围和性能。AlphaGenome,一个统一的DNA序列模型,它以1 Mb的DNA序列作为输入,能够预测数千个功能基因组轨迹,分辨率可达单碱基对,并涵盖多种模态。 这些模态包括基因表达、转录起始、染色质可及性、组蛋白修饰、转录因子结合、染色质接触图谱、剪接位点使用情况以及剪接连接坐标和强度。 AlphaGenome在人类和小鼠基因组上进行训练,在26项变异效应预测评估中,有25项评估结果与目前最强大的外部模型相当或更优。AlphaGenome能够同时对所有模态的变异效应进行评分,准确地重现了TAL1癌基因附近具有临床意义的变异的机制。 变异预测工具升级:AlphaGenome使用深度学习方法,能够预测长达约100万个碱基对的DNA序列功能,并就DNA可接近性、基因表达、剪接等数千种基因组信号进行高精度预测。该模型为解析复杂疾病致病机制、靶点探索及精准医疗提供新范式。 现有模型瓶颈:目前,基于深度学习的序列-功能模型面临两个根本性的权衡,限制了它们预测变异如何影响多种生物调控模式的能力。第一,要在基因序列长度和预测分辨率之间做权衡;第二,要在捕捉多模态还是专注一种或几种模态间权衡选择。 第一,由于计算能力的限制,模型必须在捕捉长程基因组相互作用和实现核苷酸水平的预测分辨率之间做出权衡。尽管像SpliceAI、 BPNet和ProCapNet这样的模型可以提供碱基分辨率的预测,但它们仅限于较短的输入序列(例如,10 kb或更短),因此可能会忽略远端调控元件的影响。像Enformer和Borzoi这样的模型,可以处理更长的序列(约200–500 kb)以捕捉更广泛的上下文信息,但代价是降低了输出分辨率(128 bp或32 bp的区间),这可能会模糊一些精细尺度的调控特征,例如剪接位点、转录因子足迹或多聚腺苷酸化位点。 第二,矛盾存在于捕捉多种模态与专注于一种或几种模态之间。一些最先进的(SOTA)模型高度专注于单一模态,例如SpliceAI用于剪接位点预测,ChromBPNet用于局部染色质可及性,Orca用于三维基因组结构。然而,仅靠专业模型不足以捕捉不同模态下变异的多种分子后果。即使在剪接这种单一模态内,像SpliceAI或Pangolin这样的专业模型也只能预测某些方面(例如剪接位点预测),而忽略其他方面(例如剪接连接预测或剪接位点之间的竞争)DeepSEA、Basenji、Enformer、Sei和Borzoi等模型已经证明了多模态模型的实用性和可行性。它们允许用户使用单个模型处理多种模态,而无需使用多个专业模型。然而,这些更通用的模型在某些任务上可能会落后于它们的专用模型,例如拼接,或者可能缺乏某些模态,例如接触图。 AlphaGenome,则是将多模态预测、长序列上下文信息和碱基对分辨率整合到一个统一的框架中。该模型1 Mb的DNA序列作为输入,能够预测多种细胞类型中不同的基因组轨迹。AlphaGenome的 剪接预测方法包括一种新的剪接连接预测方法以及剪接位点使用预测。 下图展示了该模型的构建与训练方案。 下图a,模型架构。AlphaGenome处理1 Mb的DNA序列和物种身份信息(可以预测5930条人类或1128条小鼠基因组轨迹),涵盖多种细胞类型,并生成11种特定分辨率的输出类型。计算利用序列并行性,将1 Mb的DNA序列分割成131 kb的片段,并在多个设备上进行处理。核心架构采用U-Net式设计,包含编码器(对序列进行确保结构的降维采样)、具有设备间通信功能的转换器和解码器(对序列进行结构约束下的细粒度回映采样),这些组件分别以各自的分辨率将数据输入到特定任务的输出头。 b,预训练过程。从交叉验证折叠中抽取1 Mb的DNA区间,进行数据增强(移位和反向互补),并用于训练模型以匹配实验目标,从而生成特定折叠和全折叠的教师模型。 c,蒸馏过程。让学生模型,学习如何使用增强和突变扰动的输入序列来复现冻结的全折叠教师模型的预测,从而产生一个适用于变异效应预测的单一模型。 来源:Nature,国金证券研究所 验证:AlphaGenome在24项基因组轨迹预测任务中的22项和26项变异效应预测任务中的25项上均达到了当前最佳水平(SOTA)。下图展示了AlphaGenome模型的综合评估结果。 来源:Nature,国金证券研究所 左图d,轨迹预测。该图展示了通过预训练的折叠分割模型,