您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [国金证券]:医药产业研究月报:TurboQuant颠覆算力门槛,创新药一季度出海超600亿美元 - 发现报告

医药产业研究月报:TurboQuant颠覆算力门槛,创新药一季度出海超600亿美元

医药生物 2026-04-01 赵海春,甘坛焕 国金证券 胡诗郁
报告封面

TurboQuant颠覆算力门槛,创新药一季度出海超600亿美元 分析师:赵海春 SAC:S1130514100001zhaohc@gjzq.com.cn 分析师:甘坛焕SAC:S1130525060003 核心要点 产业前沿 近期医药行业呈现出“技术突破+监管演进+生态重构”三线共振特征:一方面,以TurboQuant为代表的低比特量化技术显著压缩算力与部署门槛,推动AI能力由中心化云端向本地化与边缘侧下沉,使高敏数据驱动的生物医药研发进入“可本地化执行”的新阶段。另一方面,in vivo CAR-T(体内CAR-T)等新一代细胞治疗路径持续取得关键进展,绕过体外制备环节、直达体内工程化改造,显著重塑生产效率与商业化路径。同时,各国监管体系亦在加速适配创新范式,从细胞基因疗法到AI辅助研发,审批机制与安全框架逐步完善,边际上降低新技术落地不确定性;在此基础上,产业链生态正由“单点技术突破”转向“算力—数据—生物平台”协同演进,叠加中国创新供给能力提升与全球合作深化,全球生物医药产业正进入由技术驱动、效率重塑与跨区域协同共同主导的新一轮结构性升级周期。 资本风向 制药巨头礼来,通过CVR结构加码CNS中后期资产配置,63亿美元并购Centessa。AI制药领军者英矽智能,则依托其AI平台高效产出创新管线而推动BD交易快速增长,同时升级其MMAI Gym来外延提速平台进化以及与前沿大模型的合作。 本周观点 我们认为,以TurboQuant为代表的低比特量化技术正在实质性压缩AI算力门槛,将推进药企AI本地化。中国创新药,在2026年一季度出海BD超600亿美元,而本月龙头年报业绩实现收入利润双增长,行业正在进入稳步成长期。AI算力范式变革与中国创新供给能力提升形成共振,创新药赛道,将加速向“中国研发+全球商业化”结构迁移。 内容目录 一、产业前沿....................................................3 数智驱动:颠覆算力门槛,TurboQuant开启医药AI本地化新纪元....3前沿风向:双载体大片段DNA定点整合,In vivo CAR-T跨越新阶段.10监管动态:从结果审批迈向全生命周期技术适配型监管.............14产业链:科技与药企巨头共推AI大基建,分工重构在即............16 二、资本风向...................................................19 BD与创新药销售业绩双兑现,中国创新药步入稳健成长期..........19英矽智能重磅BD总额近75亿美元,AI平台创新种子产出提速元年..21礼来收购Centessa:63亿美元押注中后期资产,CVR结构重塑BD范式24 三、本周观点...................................................25 算力范式重构叠加创新供给崛起,中国创新药迈入全球价值兑现新阶段25四、产业链数据更新.............................................26风险提示.......................................................28 图表目录 图表1:TurboQuant工作原理及其长上下文处理的评分...............................6图表2:低比特量化推动AI从云端计算向本地化部署迁移的技术路径示意9图表3:Cas9-EDV和HDRT-AAV共同递送产生TRAC-CAR T细胞.................13图表4:A&H市值Top30医药医疗个股24/25/26年归母净利润及趋势.....20图表5:全球医药医疗市值Top 60估值全景图............................................21图表6:MMAI Gym提升前沿基础模型的生物与化学智能..........................23图表7:MMAI Gym训练化学与生物超级智能测评......................................23图表8:2-3月国内创新药获批上市情况(截至2026/3/31)......................26图表9:2-3月国内创新药申报上市情况(截至2026/3/31)......................27图表10:2-3月创新药跨国交易情况(截至2026/3/31)...........................27 一、产业前沿 数智驱动:颠覆算力门槛,TurboQuant开启医药AI本地化新纪元 2026年3月24日,Google在arXiv(全球顶级开放获取学术预印本库)发布论文《TurboQuant: Online Vector Quantization with Near-optimalDistortion Rate》,系统披露其最新推理加速框架TurboQuant(大模型算力优化与量化加速框架)):在无需训练或微调的前提下,实现KV cache(键值缓存)约6倍压缩,并在主流基准测试中维持接近原始模型的精度表现,显著缓解长上下文推理的内存瓶颈,AI推理的算力约束由此出现结构性松动。(1)从技术本质看,TurboQuant并非单点压缩优化,而是将量化范式由传统离线压缩推进至在线向量量化框架,在低比特与高保真之间建立更优平衡,延续并整合了QJL(量化Johnson-Lindenstrauss算法)与PolarQuant等技术路径,推动KV cache从“高显存刚性约束”向“可压缩工程变量”转变;(2)从行业影响看,算力门槛的下降将直接削弱AI部署对多卡高端GPU集群的依赖,使部分推理任务具备在本地高配工作站运行的工程化可能,从而推动医药AI由“云端调用”向“本地持续运行”迁移,为数据敏感场景下的研发闭环与自动化湿实验系统提供基础条件;(3)从产业趋势看,随着推理侧成本与内存约束同步下降,AI正从辅助工具加速嵌入药研基础设施,结合Ginkgo、Recursion及跨国药企AI工厂等实践路径,行业已从单点应用迈向“模型-数据-实验”一体化闭环。我们认为,Google此次在推理侧的算法推进,将成为医药AI基础设施演进的重要拐点,开启药企AI本地化的新纪元。 技术演进:从离线量化到在线向量量化的范式演进。这次发布的核心,并非 传统意义上的“大模型压缩优化”,而是将大模型推理中最关键的KVcache(键值缓存)瓶颈,推进到“低比特、低开销且高保真”的新阶段:Google披露,TurboQuant在无需训练或微调的前提下,可将KV cache量化至约3 bit水平,在长上下文场景中实现约6倍内存压缩,并在H100等硬件平台上显著提升attention计算效率。 从技术路径看,TurboQuant并非单点创新,而是对既有量化路线的整合与推进:2024年QJL首次解决KV cache量化中需额外存储量化常数的问题,降低额外内存开销;2025年PolarQuant通过极坐标变换绕开传统归一化约束,进一步提升低比特量化效率;2026年TurboQuant在此基础上发展为更通用的在线向量量化框架,使量化从“离线压缩步骤”演进为“推理过程内生机制”。 从方法本质看,其关键在于通过非线性映射重构高维向量分布,使低比特表示能够更好刻画原始语义结构,从而在显著降低显存占用的同时,维持接近原始模型的性能表现。 QJL的零开箱和1位技巧:QJL使用一种名为Johnson- Lindenstrauss变换的数学技术来压缩复杂的高维数据,同时保留数据点之间的基本距离和关系。它将每个结果向量简化为一个符号位(+1或-1)。该算法本质上创建了一种高速简写形式,无需任何内存开销。为了保持准确性,QJL使用了一种特殊的估计器,该估计器巧妙地平衡了高精度查询和低精度简化数据。这使得模型能够准确地计算注意力分数(用于判断输入中哪些部分重要、哪些部分可以忽略的过程)。 PolarQuant的压缩新“视角”:PolarQuant采用了一种完全不同的方法来解决内存开销问题。它并非使用标准坐标(例如X、Y、Z)来表示沿各轴的距离,而是使用笛卡尔坐标系将内存向量转换为极坐标。这相当于将“向东走3个方块,向北走4个方块”替换为“以37度角总共走5个方块”。这样就得到了两个信息:半径(表示核心数据的强度)和角度(表示数据的方向或含义)。由于角度模式已知且高度集中,模型不再需要执行耗时的数据归一化步骤,因为它将数据映射到边界已知的固定、可预测的“圆形”网格上,而不是边界不断变化的“方形”网格上。这使得PolarQuant能够消除传统方法必须承担的内存开销。 下图展示了TurboQuant的核心架构(左)与算法综合评分数据(右)。在原理层面(左图):传统量化模式通常在直角坐标系(Cartesian Input)下处理原始数据,由于权重与激活值的非均匀分布特征,在低比特压缩时易产生显著的量化误差,导致精度损失。TurboQuant的核心创新在于引入了极坐标转换(Transformed PolarInput):通过将数据从直角坐标映射至极坐标空间,有效解耦了数据的幅值与相位信息。这一数学变换显著优化了数据的线性度与分布特性,在提升硬件压缩处理效率的同时,最大限度地保留了模型的表达能力。在性能表现层面(右图):谷歌研究团队基于Gemma和Mistral等主流开源模型,在LongBench、Needle In A Haystack、RULER等多项长上下文基准测试中,对TurboQuant、PolarQuant及KIVI等基线算法进行了对比评估。实验结果表明: (1)高精度:TurboQuant在点积失真(Dot Product Distortion)控制与召回率(Recall)方面均表现最优。 (2)低负载:在维持高评分的同时,显著降低了键值(KV)缓存的内存占用。 (3)泛化性:在问答、代码生成及摘要等多元任务中,其综合得分均处于领先水平,证明了其在长文本医疗数据处理及复杂推理场景中的应用价值。 来源:Google官网,国金证券研究所 从结果意义看,该路径显著弱化了“高精度依赖高显存”的传统约束,使KV cache由固定资源瓶颈转变为可工程优化变量,为后续推理侧系统级优化提供空间。 行业冲击:从加速研发本地化与自动化实验闭环形成。这一技术对医药研发的核心影响,在于推动“算力资源由集中式向分布式下沉”。在既有范式下,AI药研(AIDD)通常依赖大规模GPU集群完成模型推理与分子模拟,企业需将关键数据上传至云端环境,面临数据隐私、延迟与成本多重约束。 随着TurboQuant显著降低推理阶段的显存需求,部分原本依赖多卡高端GPU的任务,有望在本地高配工作站上实现工程化运行,从而使“本地部署+持续运行”成为可行路径。 在研发流程层面,这一变化为“计算—实验”闭环提供基础条件:AI可在本地完成分子设计与筛选,并通过本地接口驱动自动化实验设备,实时回收实验数据并迭代模型,形成不依赖外部云端的连续优化系统。 在行业实践层面,自动化湿实验室已出现可验证路径:Ginkgo Bioworks推出Cloud Lab实现实验流程远程调用与自动执行,其与OpenAI合作的自主实验体系已在多轮迭代中实现显著成本优化;Recursion则通过高通量自动化实验持续生成数据并反馈模型,构建“数据—模型”循环系统。 在工具链层面,实验自动化能力正逐步标准化与下沉,MilliporeSigma与Opentrons合作推动实验流程模块化,使更多实验环节可被程序化调用。上述趋势共同表明,随着推理资源约束下降,医药行业的核心竞争不再仅在“谁拥有更大模型”,还在“谁能构建本地可持续运行的研发闭环系统”。 未来趋势: