您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[卫宁健康人工智能实验室&卫宁健康市场部]:2025医疗人工智能年度报告 - 发现报告

2025医疗人工智能年度报告

AI智能总结
查看更多
2025医疗人工智能年度报告

智行有度 Delegating Curating 主编 Editor in Chief陈旭 执行主编 Executive Editor刘鸣谦陈瑶 策划团队 Planning Team卫宁健康人工智能实验室卫宁健康市场部 责任编辑 Assignment Editors洞察:刘鸣谦技术:许祥军研究:刘鸣谦案例:宋晓霞 校对与传播 Proofreader & Communication朱雅文刁茁陈瑶 设计 Designer唐雯婷 引言 2025 年 1 月 20 日,农历春节前九天,杭州的一家 AI创业公司发布了 DeepSeek-R1 模型。训练成本不到 600 万美元,性能却逼近 OpenAI 的 o1。七天后,DeepSeek 超越 ChatGPT 登顶美国苹果应用商店免费榜首,下载量暴涨2000%。这个消息让英伟达单日蒸发 6000 亿美元市值,美国媒体称之为 AI 领域的“斯普特尼克时刻”。DeepSeek 时刻证明了一件事:效率和算法创新可以打破算力军备竞赛。 复思考一个问题:技术突破与临床价值之间,究竟差着什么?我们的答案是实践。我们在病历内涵质控、智能临床决策、智能问答等方面都取得了突破,但更重要的是在约 200家医疗机构、超过 300 万例真实病例中验证了这些技术。当基层医生告诉我们,这个系统让我有了专科医生的底气时,我们知道 AI 技术找到了它真正的价值。数据很漂亮,准确率提升 20%,不良事件减少 20%。但真正让我们坚定的,是那些因为更早确诊、更精准治疗而改变命运的患者。 这样的中国式突破在 2025 年已经不再罕见。中国医疗AI 市场规模突破 1,157 亿元,全球范围内,AI 辅助影像诊断将诊断时间缩短了 30%,脑卒中扫描分析准确率比专业人员高出一倍。但更重要的转折不在这些数字,而在质变:AIAgent 技术的逐步成熟,让医疗 AI 从工具变成了同事。AI系统开始主动分析、推理、决策,甚至在某些场景下独立行动。这是 AI 从 L2(平台化)走向 L3(闭环管理)的重要一步。 这份报告是我们对 2025 年的系统性复盘,涵盖行业洞察、技术突破、产品迭代和临床实践。我们希望这份报告能帮大家看清 2025 年发生了什么,以及接下来会发生什么。决策者能看到 AI 技术的成熟度和应用价值,技术团队能了解实现路径和挑战,行业研究者能把握从技术可行到临床可信的演进逻辑。 技术突破的同时,政策的土壤也在松动。2025 年 8 月,国务院印发《深入实施“AI+”行动的意见》,明确要求在辅助诊疗、健康管理等场景推进 AI 应用。11 月,国家卫健委等五部门联合发布《关于促进和规范“人工智能 + 医疗卫生”应用发展的实施意见》,提出到 2030 年,二级以上医院普遍开展医学影像智能辅助诊断、临床决策智能辅助等应用,基层诊疗智能辅助实现全覆盖。截至 2025 年底,已有超过四百个医疗 AI 模型完成备案,这个数字还在快速增长。监管框架从“如何限制”转向“如何赋能”,从“观望等待”转向“分类管理”。行业共识正在形成:AI 不是要不要用的问题,而是如何用好、如何用对的问题。 医疗 AI 的故事,2025 年只是开了个头。技术会继续演进,从 L3 走向 L4,从多模态走向全模态 ; 应用会继续下沉,从三甲医院走向基层诊所,从辅助诊断走向全流程管理;监管会继续完善,从碎片化探索走向体系化治理。但不变的是初心,让技术服务于生命,让 AI 成就医者仁心。我们期待与行业同仁一起,把这个至关重要的判断,变成每一个患者都能感知到的现实。这是我们的使命,也是这个时代赋予我们的责任。 陈旭 卫宁健康作为这场变革的参与者,我们在过去一年中反 速读 可靠性来自工程化组件: 从“模型能力”到“系统能力”: 医院落地的评估视角 解析、计算、证据链与权限 当讨论从参数与榜单转向真实业务,决定可用性的往往是算力、数据、流程与质控的整体协同。报告提供一套分层视角,帮助判断项目处于探索期还是已具备可复制的运行能力。 文档解析、可验证计算、循证检索与引用、院内知识挂载与权限约束等工程环节,决定了输出能否被信任、复核与审计。这里把这些关键能力组织为一条可落地的实现路径。 提示词优化的工程化方法: 选型关注点: 以“可执行流程”为目标 从“回答质量”转向“闭环与可追溯” 当目标是行为一致性与结果可复核,提示词需要像流程一样被设计、评估与迭代。报告提出一种更稳健的改进框架:以反馈闭环驱动优化,而非依赖零散的经验试错。 医疗场景的风险不止于答错,更在于责任边界、推理可追溯性与系统融合能力不足导致的“难以闭环”。此处将选型时最应追问的问题整理为一组可执行的检查项。 典型场景复盘: 从“能用”到“被采纳”的关键差异 临床高频任务的约束: 性能、延迟与可回滚性 从循证检索与可追溯结论生成,到护理评估的“预填—复核”,再到病程信息的时间轴化重组,这里用三个案例展示能力如何嵌入工作流并被一线采纳。重点不在宣传效果,而在具体环节减少了哪些不可避免的重复劳动。 在一线工作流中,响应时延、交互成本与可回滚性经常比“更深的推理过程”更先决定能否落地。文中澄清了一个常见误区:能力更强的路线,未必适合作为高频默认配置。 从对话系统到任务编排: 智能体化的落地路径 关键不在“能否对话”,而在于能否进行任务拆解、工具调用与跨系统协作,完成端到端的业务链条。文中厘清了概念性展示与工程化升级的边界,帮助判断智能体何时具备现实价值。 洞察 AI 原生应用正在重构 2025 医疗秩序 从工具拼接走向深度融合,AI 原生应用正重塑医疗核心流程,开启智能医疗新秩序。 数据中心、边端设备的全面建设浪潮 算力基础是大语言模型建设的基础,“云边端”协同看模型建设变化。 13 人工智能正式迈入“智能体”时代 技术和经济条件成熟,智能体进入大众视野。 15 行业动向:技术、场景与策略的三重演进 从技术落到实际,从对于性能的执着转变为如何更好地应用。 技术 WiNGPT in 2025 融合临床思维与 MoE 架构,打造专业医疗 AI 工具链。 19WiNGPT-3.5-turbo更懂医疗业务流程的高效 AI 助手。 演化式提示词优化 一种低成本改进大语言模型应用的方法。 25 医疗知识工程实践 - 双渠道检索 一种融合内外部医疗知识的检索技术实践 从工具到协作者 WiNGPT 医疗智能体的技术实践。 研究 医院 AI 建设成熟度研究 提出医院 AI 建设成熟度模型,指引医疗智能从算法引进向系统工程进阶。 超越基准:大语言模型推理的经济学分析框架 用经济学的思维分析人工智能应用的推理成本。 基于视觉 - 语言模型的全身肌肉骨骼病变辅助诊断研究 突破单模态诊断局限,为肌肉骨骼疾病智能辅助诊断提供新方案。 内镜 AI 应用的新演化 看 AI 新技术如何改善工作流程,提高医生工作效率。 案例 以循证为核心,实现院内临床任务全链条的智能规划与执行。 智能化护理评估 用 AI 语义推理重塑护理评估流程,将护士的时间还给患者。 AI 驱动的患者病程速览 WiNGPT 驱动的 AI 速览自动整合重组多源临床数据,生成标准化全景画像,解决信息割裂难题,辅助高效决策。 展望 56参考文献 洞察 2025 年,人工智能从大模型迈向智能体,技术迭代的浪潮,已不再局限于效率提升,而是尝试参与进工作场景的全流程之中。在这个背景下,尤其是医疗行业,在构建语言模型时不仅需要在考虑性能以及效率方面的需求,更重要的是不断更新提升模型的安全性、可解释性等能力。同时,从数据中心,到医院边端,算力作为基础设施正在提供更完善、更完整的算力支撑,成为医疗行业的技术底座。 AI 原生应用正在重构医疗秩序 宋晓霞 过去两年,医疗 AI 赛道在产品迭代中不断叠加各类算法模型,试图用更多功能应对复杂临床场景。然而,在实际应用中,但这种“功能堆砌”的方式效果有限。去年 10 月发布的《关于促进和规范“人工智能 + 医疗卫生”应用发展的实施意见》(下称《实施意见》),行业开始从功能堆砌转向实际应用。这份文件不仅明确了合规底线,更将竞争焦点从单一技术性能,转向与核心医疗业务的结合。 但对一线医务人员的即时价值有限,甚至被视为“监管工具”——指出错误,却未减轻负担。 进入 2025 年,供需关系正逐步优化。《实施意见》明确提出“以场景为驱动,解决真实需求”,并将“人工智能+ 基层应用”置于首位。这与市场自发的转向高度契合,行业关注点从“模型懂多少医学知识”转向“模型能省多少时间”。医生不需要在事后处理质控报警,而是在书写病历时即可获得实时辅助;护士不必频繁翻阅病史、医嘱、报告,而是由模型自动完成表单录入。《实施意见》强调的“推广医学影像智能诊断服务”和“基层医生智能辅助诊疗”,正是这一趋势的印证。唯有大语言模型成为“业务助手”,实现临床工作流的无感嵌入,才能真正消解技术抵触。 这种转变,迫使底层技术架构完成范式升级。当通用问答无法满足临床要求时,行业开始追求系统级效率:Agentic AI(代理式 AI)的自主协作能力与 RAG(检索增强生成)的精准知识定位,已从附加功能变成支撑复杂业务流程的核心组件。当 AI 能够同时做到快速响应和专业准确,它将从诊疗边缘的辅助工具,变成嵌入分诊、决策和科研核心环节的智能系统。AI 原生应用正在改变 2025 年的医疗格局。 从用户实践看,这一趋势也已显现。我们遴选了 11 家WiNGPT 核心用户,整理其 2025 年应用数据(见图 1、图 2)。结果显示:医疗场景应用数量持续增长,尤其是与临床效率直接相关的环节呈现爆发式增长。例如,报告质控(包括报告一致性检查、内容纠错)和病历生成(涵盖医生电子病历撰写、护理评估表单生成)使用量显著攀升。这不仅反映出行业对“即时辅助”的强烈需求,也验证了场景驱动策略的有效性——医疗大语言模型的定位正从“监管工具”向“效率引擎”转变。 焦点转移:从“锦上添花”到“雪中送炭” 2024 年是医疗大语言模型场景化落地的“元年”,应用多集中在智能导诊、报告解读、病历质控等事后辅助环节,本质上是对既有结果的再加工。这类场景易落地、风险可控, 问题。然而,在真实临床场景中,这些理论优势并未转化为生产力。 冷思考:DeepSeek 现象与临床“慢思考”的悖论 最大掣肘在于“耗时”。无论是高通量的门诊,还是住院管理、医技检查等场景,临床流程都要求高效协同。深度推理模型动辄数十秒甚至更久的“思维链”延迟,不仅难以融入问诊节奏,也在表单录入、影像质控、病历书写等环节 DeepSeek 在 2025 年的亮相,既彰显技术突破,也引发深刻反思。深度推理模型的崛起曾令行业沸腾:凭借更强的推理能力和更优的算力成本,它被寄望于攻克复杂长链路 造成阻滞,直接影响整体诊疗效率。 亟待司法解释跟进。 参数与成本的双重博弈亦难破解。小参数模型在复杂逻辑面前力有不逮,常出现推理断层;大参数模型虽能力达标,却因高昂的算力与推理成本,难以实现规模化部署。 其次是数据孤岛与全流程智能的博弈。 多数医疗机构虽已建设临床数据中心(CDR),实现院内多源数据集中,但这并不意味着孤岛消除。CDR 更多解决的是“汇聚”而非“实时互通”,异构系统接口壁垒和语义差异依然存在,院外健康监测数据也难以纳入。要让Agentic AI 真正实现全流程智能,必须突破数据标准、接口开放和业务协同的多重障碍,这比单纯技术迭代更考验利益格局的重塑。 这一现象意味着:深度推理模型短期内难成高频临床场景的标配。它更适用于科研探索、疑难病例会诊(MDT)或教学,而在高频、通用的临床业务中,响应更快、针对性更强的轻量化模型将成为主流。 技术基建化:RAG 与 Agentic AI 的身份蜕变 再者,模板化病历背后的“真实性危机”。 诚然,电子病历和报告的模板化趋势在提高书写效