行业研究公司研究宏观策略财报招股书会议纪要 seedance2.0 低空经济 DeepSeek AIGC 大模型

2025医疗人工智能年度报告

医药生物 2026-02-09 卫宁健康人工智能实验室&卫宁健康市场部路仁假

核心观点与关键数据

2025年，中国医疗AI市场规模突破1,157亿元，AI技术从L2平台化走向L3闭环管理，AIAgent技术逐步成熟，让医疗AI从工具变成同事。DeepSeek-R1模型的发布标志着效率和算法创新可以打破算力军备竞赛，而中国医疗AI的突破在于实践，如在约200家医疗机构、超过300万例真实病例中验证了技术，帮助基层医生提升专业信心，改善患者治疗效果。

技术突破与行业动向

技术突破：

WiNGPT系列模型：融合临床思维与MoE架构，打造专业医疗AI工具链。WiNGPT-3.0引入“临床思维链”，WiNGPT-3.5采用MoE架构提升性能与效率，并开发了DocLoom、医学计算器等工具，实现临床落地。
演化式提示词优化：通过遗传算法迭代优化提示词，提升模型表现，如在医学影像报告质控任务中准确率提升超过5%。
医疗知识工程实践：采用双渠道检索机制，融合内部医疗知识库和外部联网检索，保障知识获取的私密性、准确性与时效性。
WiNGPT医疗智能体：深度融合Agent架构理念，实现从“知识载体”到“协同伙伴”的范式升级，具备医疗场景专属自主能力。

行业动向：

数据中心、边端设备的全面建设：中国智算总规模已达788 EFLOPS，位居全球第二，“东数西算”工程推动算力普惠化。
国产化浪潮：华为昇腾、海光信息、天数智芯等国产芯片加速迭代，小型推训一体设备进入医院场景。
人工智能迈入“智能体”时代：编程领域率先实现智能体规模化落地，医疗领域因试错成本高而相对谨慎，但技术和经济条件逐渐成熟。
行业技术发展主线：从开发孤立模型转向构建多模态领域大模型，提升模型的效率、精准度与可解释性。
落地策略演进：从中心化标杆向可信普惠化落地深度演进，关注结论可靠性和数据安全，通过多方协同治理、技术改进和人机协同模式解决问题。

研究与案例

医院AI建设成熟度研究：

提出医院AI建设成熟度模型，涵盖数据基础、模型应用、流程融合与治理机制等关键能力，引导医院AI从算法引进向系统工程进阶。
关键发现：
- 参数效率的非线性回报：中等规模模型在特定任务上可媲美超大模型。
- 逻辑能力的隐性断层：模型知识储备不代表其逻辑智商，需优先考量逻辑稳健性。
- 垂直微调的双刃剑效应：过度微调可能导致通用能力变差，需在专业深度与通用广度间寻求平衡。

超越基准：大语言模型推理的经济学分析框架：

提出“推理经济学”框架，视推理为算力驱动的生产活动，为资源配置提供科学决策依据。
实验结果：不同模型在性能、成本、质量方面存在差异，需根据实际业务选择性价比最高的配置。

基于视觉-语言模型的全身肌肉骨骼病变辅助诊断研究：

构建了基于真实世界数据的骨骼肌肉疾病全域AI视觉语言大模型（WiNGPT-BONE），经多中心验证表现出卓越的临床性能与可解释性。

智能化护理评估：

基于WiNGPT的AI辅助护理评估试点项目，将传统“人工检索填报”模式重构为“AI智能预填+人工复核”新模式，大幅降低护士文书工作负荷，提升评估准确率和效率。

AI驱动的患者病程速览：

通过多源数据进行自动感知、语义理解与结构化重组，实现病例信息准备方式的范式转变，提升医生信息获取效率，助力年轻医生成长，提升跨域协作效率。

展望与挑战

2026年，医疗AI将向自主化、专精化、数据策展、有序监管的方向发展，但需守住边界，明确责任归属和安全边界。关键挑战包括AI代理误诊责任、系统性风险规避、基层医疗技术能力获取等。治理体系将从政策文件走向落地，研发、测试、部署等环节将越来越实。

智行有度 Delegating Curating 主编 Editor in Chief陈旭执行主编 Executive Editor刘鸣谦陈瑶策划团队 Planning Team卫宁健康人工智能实验室卫宁健康市场部责任编辑 Assignment Editors洞察：刘鸣谦技术：许祥军研究：刘鸣谦案例：宋晓霞校对与传播 Proofreader & Communication朱雅文刁茁陈瑶设计 Designer唐雯婷引言 2025 年 1 月 20 日，农历春节前九天，杭州的一家 AI创业公司发布了 DeepSeek-R1 模型。训练成本不到 600 万美元，性能却逼近 OpenAI 的 o1。七天后，DeepSeek 超越 ChatGPT 登顶美国苹果应用商店免费榜首，下载量暴涨2000%。这个消息让英伟达单日蒸发 6000 亿美元市值，美国媒体称之为 AI 领域的“斯普特尼克时刻”。DeepSeek 时刻证明了一件事：效率和算法创新可以打破算力军备竞赛。复思考一个问题：技术突破与临床价值之间，究竟差着什么？我们的答案是实践。我们在病历内涵质控、智能临床决策、智能问答等方面都取得了突破，但更重要的是在约 200家医疗机构、超过 300 万例真实病例中验证了这些技术。当基层医生告诉我们，这个系统让我有了专科医生的底气时，我们知道 AI 技术找到了它真正的价值。数据很漂亮，准确率提升 20%，不良事件减少 20%。但真正让我们坚定的，是那些因为更早确诊、更精准治疗而改变命运的患者。这样的中国式突破在 2025 年已经不再罕见。中国医疗AI 市场规模突破 1,157 亿元，全球范围内，AI 辅助影像诊断将诊断时间缩短了 30%，脑卒中扫描分析准确率比专业人员高出一倍。但更重要的转折不在这些数字，而在质变：AIAgent 技术的逐步成熟，让医疗 AI 从工具变成了同事。AI系统开始主动分析、推理、决策，甚至在某些场景下独立行动。这是 AI 从 L2（平台化）走向 L3（闭环管理）的重要一步。这份报告是我们对 2025 年的系统性复盘，涵盖行业洞察、技术突破、产品迭代和临床实践。我们希望这份报告能帮大家看清 2025 年发生了什么，以及接下来会发生什么。决策者能看到 AI 技术的成熟度和应用价值，技术团队能了解实现路径和挑战，行业研究者能把握从技术可行到临床可信的演进逻辑。技术突破的同时，政策的土壤也在松动。2025 年 8 月，国务院印发《深入实施“AI+”行动的意见》，明确要求在辅助诊疗、健康管理等场景推进 AI 应用。11 月，国家卫健委等五部门联合发布《关于促进和规范“人工智能 + 医疗卫生”应用发展的实施意见》，提出到 2030 年，二级以上医院普遍开展医学影像智能辅助诊断、临床决策智能辅助等应用，基层诊疗智能辅助实现全覆盖。截至 2025 年底，已有超过四百个医疗 AI 模型完成备案，这个数字还在快速增长。监管框架从“如何限制”转向“如何赋能”，从“观望等待”转向“分类管理”。行业共识正在形成：AI 不是要不要用的问题，而是如何用好、如何用对的问题。医疗 AI 的故事，2025 年只是开了个头。技术会继续演进，从 L3 走向 L4，从多模态走向全模态 ; 应用会继续下沉，从三甲医院走向基层诊所，从辅助诊断走向全流程管理；监管会继续完善，从碎片化探索走向体系化治理。但不变的是初心，让技术服务于生命，让 AI 成就医者仁心。我们期待与行业同仁一起，把这个至关重要的判断，变成每一个患者都能感知到的现实。这是我们的使命，也是这个时代赋予我们的责任。陈旭卫宁健康作为这场变革的参与者，我们在过去一年中反速读可靠性来自工程化组件：从“模型能力”到“系统能力”：医院落地的评估视角解析、计算、证据链与权限当讨论从参数与榜单转向真实业务，决定可用性的往往是算力、数据、流程与质控的整体协同。报告提供一套分层视角，帮助判断项目处于探索期还是已具备可复制的运行能力。文档解析、可验证计算、循证检索与引用、院内知识挂载与权限约束等工程环节，决定了输出能否被信任、复核与审计。这里把这些关键能力组织为一条可落地的实现路径。提示词优化的工程化方法：选型关注点：以“可执行流程”为目标从“回答质量”转向“闭环与可追溯” 当目标是行为一致性与结果可复核，提示词需要像流程一样被设计、评估与迭代。报告提出一种更稳健的改进框架：以反馈闭环驱动优化，而非依赖零散的经验试错。医疗场景的风险不止于答错，更在于责任边界、推理可追溯性与系统融合能力不足导致的“难以闭环”。此处将选型时最应追问的问题整理为一组可执行的检查项。典型场景复盘：从“能用”到“被采纳”的关键差异临床高频任务的约束：性能、延迟与可回滚性从循证检索与可追溯结论生成，到护理评估的“预填—复核”，再到病程信息的时间轴化重组，这里用三个案例展示能力如何嵌入工作流并被一线采纳。重点不在宣传效果，而在具体环节减少了哪些不可避免的重复劳动。在一线工作流中，响应时延、交互成本与可回滚性经常比“更深的推理过程”更先决定能否落地。文中澄清了一个常见误区：能力更强的路线，未必适合作为高频默认配置。从对话系统到任务编排：智能体化的落地路径关键不在“能否对话”，而在于能否进行任务拆解、工具调用与跨系统协作，完成端到端的业务链条。文中厘清了概念性展示与工程化升级的边界，帮助判断智能体何时具备现实价值。洞察 AI 原生应用正在重构 2025 医疗秩序从工具拼接走向深度融合，AI 原生应用正重塑医疗核心流程，开启智能医疗新秩序。数据中心、边端设备的全面建设浪潮算力基础是大语言模型建设的基础，“云边端”协同看模型建设变化。 13 人工智能正式迈入“智能体”时代技术和经济条件成熟，智能体进入大众视野。 15 行业动向：技术、场景与策略的三重演进从技术落到实际，从对于性能的执着转变为如何更好地应用。技术 WiNGPT in 2025 融合临床思维与 MoE 架构，打造专业医疗 AI 工具链。 19WiNGPT-3.5-turbo更懂医疗业务流程的高效 AI 助手。演化式提示词优化一种低成本改进大语言模型应用的方法。 25 医疗知识工程实践 - 双渠道检索一种融合内外部医疗知识的检索技术实践从工具到协作者 WiNGPT 医疗智能体的技术实践。研究医院 AI 建设成熟度研究提出医院 AI 建设成熟度模型，指引医疗智能从算法引进向系统工程进阶。超越基准：大语言模型推理的经济学分析框架用经济学的思维分析人工智能应用的推理成本。基于视觉 - 语言模型的全身肌肉骨骼病变辅助诊断研究突破单模态诊断局限，为肌肉骨骼疾病智能辅助诊断提供新方案。内镜 AI 应用的新演化看 AI 新技术如何改善工作流程，提高医生工作效率。案例以循证为核心，实现院内临床任务全链条的智能规划与执行。智能化护理评估用 AI 语义推理重塑护理评估流程，将护士的时间还给患者。 AI 驱动的患者病程速览 WiNGPT 驱动的 AI 速览自动整合重组多源临床数据，生成标准化全景画像，解决信息割裂难题，辅助高效决策。展望 56参考文献洞察 2025 年，人工智能从大模型迈向智能体，技术迭代的浪潮，已不再局限于效率提升，而是尝试参与进工作场景的全流程之中。在这个背景下，尤其是医疗行业，在构建语言模型时不仅需要在考虑性能以及效率方面的需求，更重要的是不断更新提升模型的安全性、可解释性等能力。同时，从数据中心，到医院边端，算力作为基础设施正在提供更完善、更完整的算力支撑，成为医疗行业的技术底座。 AI 原生应用正在重构医疗秩序宋晓霞过去两年，医疗 AI 赛道在产品迭代中不断叠加各类算法模型，试图用更多功能应对复杂临床场景。然而，在实际应用中，但这种“功能堆砌”的方式效果有限。去年 10 月发布的《关于促进和规范“人工智能 + 医疗卫生”应用发展的实施意见》（下称《实施意见》），行业开始从功能堆砌转向实际应用。这份文件不仅明确了合规底线，更将竞争焦点从单一技术性能，转向与核心医疗业务的结合。但对一线医务人员的即时价值有限，甚至被视为“监管工具”——指出错误，却未减轻负担。进入 2025 年，供需关系正逐步优化。《实施意见》明确提出“以场景为驱动，解决真实需求”，并将“人工智能+ 基层应用”置于首位。这与市场自发的转向高度契合，行业关注点从“模型懂多少医学知识”转向“模型能省多少时间”。医生不需要在事后处理质控报警，而是在书写病历时即可获得实时辅助；护士不必频繁翻阅病史、医嘱、报告，而是由模型自动完成表单录入。《实施意见》强调的“推广医学影像智能诊断服务”和“基层医生智能辅助诊疗”，正是这一趋势的印证。唯有大语言模型成为“业务助手”，实现临床工作流的无感嵌入，才能真正消解技术抵触。这种转变，迫使底层技术架构完成范式升级。当通用问答无法满足临床要求时，行业开始追求系统级效率：Agentic AI（代理式 AI）的自主协作能力与 RAG（检索增强生成）的精准知识定位，已从附加功能变成支撑复杂业务流程的核心组件。当 AI 能够同时做到快速响应和专业准确，它将从诊疗边缘的辅助工具，变成嵌入分诊、决策和科研核心环节的智能系统。AI 原生应用正在改变 2025 年的医疗格局。从用户实践看，这一趋势也已显现。我们遴选了 11 家WiNGPT 核心用户，整理其 2025 年应用数据（见图 1、图 2）。结果显示：医疗场景应用数量持续增长，尤其是与临床效率直接相关的环节呈现爆发式增长。例如，报告质控（包括报告一致性检查、内容纠错）和病历生成（涵盖医生电子病历撰写、护理评估表单生成）使用量显著攀升。这不仅反映出行业对“即时辅助”的强烈需求，也验证了场景驱动策略的有效性——医疗大语言模型的定位正从“监管工具”向“效率引擎”转变。焦点转移：从“锦上添花”到“雪中送炭” 2024 年是医疗大语言模型场景化落地的“元年”，应用多集中在智能导诊、报告解读、病历质控等事后辅助环节，本质上是对既有结果的再加工。这类场景易落地、风险可控，问题。然而，在真实临床场景中，这些理论优势并未转化为生产力。冷思考：DeepSeek 现象与临床“慢思考”的悖论最大掣肘在于“耗时”。无论是高通量的门诊，还是住院管理、医技检查等场景，临床流程都要求高效协同。深度推理模型动辄数十秒甚至更久的“思维链”延迟，不仅难以融入问诊节奏，也在表单录入、影像质控、病历书写等环节 DeepSeek 在 2025 年的亮相，既彰显技术突破，也引发深刻反思。深度推理模型的崛起曾令行业沸腾：凭借更强的推理能力和更优的算力成本，它被寄望于攻克复杂长链路造成阻滞，直接影响整体诊疗效率。亟待司法解释跟进。参数与成本的双重博弈亦难破解。小参数模型在复杂逻辑面前力有不逮，常出现推理断层；大参数模型虽能力达标，却因高昂的算力与推理成本，难以实现规模化部署。其次是数据孤岛与全流程智能的博弈。多数医疗机构虽已建设临床数据中心（CDR），实现院内多源数据集中，但这并不意味着孤岛消除。CDR 更多解决的是“汇聚”而非“实时互通”，异构系统接口壁垒和语义差异依然存在，院外健康监测数据也难以纳入。要让Agentic AI 真正实现全流程智能，必须突破数据标准、接口开放和业务协同的多重障碍，这比单纯技术迭代更考验利益格局的重塑。这一现象意味着：深度推理模型短期内难成高频临床场景的标配。它更适用于科研探索、疑难病例会诊（MDT）或教学，而在高频、通用的临床业务中，响应更快、针对性更强的轻量化模型将成为主流。技术基建化：RAG 与 Agentic AI 的身份蜕变再者，模板化病历背后的“真实性危机”。诚然，电子病历和报告的模板化趋势在提高书写效

点击免费查看完整报告