您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [腾讯]:解码DeepSeek, 构建医药行业新质生产力 - 发现报告

解码DeepSeek, 构建医药行业新质生产力

2025-03-11 腾讯 车伟光
报告封面

腾讯健康李慧 ⽬录 •从DeepSeek看⼈⼯智能发展趋势 •⼤模型及DeepSeek潜在应⽤场景探索 从DeepSeek看⼈⼯智能发展趋势 AI离我们越来越近,越来越密集的“加速”信号 AI技术演变路线 •1987-2020年之前的主导是“⼤数据、⼩算⼒、专⽤决策范式”。•2020年后,GPT-3代表技术路线“⼤数据、⼤算⼒、通⽤范式”,验证⼤语⾔模型的可⾏性。•GPT3/4在深度推理和问题解决⽅⾯有所⽋缺,OpenAI-o1通过思维链(ChainofThought)增强推理能⼒,将复杂问题分解成更⼩、更易处理的步骤;⽽DeepSeekR1在展现卓越推理能⼒同时,训练和推理成本极低 再看DeepSeek,⼜⼀个“⼯程奇迹” DeepSeek是“深度求索”开发的⼀系列⼈⼯智能模型。DeepSeek通过持续的技术创新和市场拓展,在⾃然语⾔处理和⼤型语⾔模型⽅⾯取得了显著进展,在国际市场上获得了⼴泛认可。其中: •DeepSeek-V3是在14.8万亿⾼质量token上完成预训练的⼀个强⼤的混合专家(MoE)语⾔模型,拥有6710亿参数(激活参数370亿)。作为通⽤⼤语⾔模型,其在在知识类任务(知识问答、内容⽣成等)领域表现出⾊ •DeepSeek-R1是基于DeepSeek-V3-Base训练⽣成的强化推理能⼒模型,在数学、代码⽣成和逻辑推断等复杂推理任务上表现优异 更低的研发成本* 更⾼效资源利⽤ 开源模型⽐肩头部闭源 60%+指标优于Llama3.1Claude-3.5GPT-4o 使⽤~2,000GPUs,竞品使⽤10,000+GPUs $5.5Mvs.OpenAI’s$100M+ 打破⼤模型技术壁垒重挫美国科技公司股价,英伟达市值下跌5,900亿 AI的斯普特尼克时刻 被美国及其盟友列⼊各种限制 DeepSeek的创新突破 效果体验惊艳,成本极致压缩 MoESparse(稀疏专家混合模型) FPB混合精度训练 •传统模型需要⽤32位或者16位数记录数字•“⼿机号码,记最后4位”•提升训练速度同时保持精度,降低硬件门槛 •每次推理仅激活相关专家,“术业有专攻”•“专事专办、要事要办⼩事不办尽量不跨组解决”•节省42.5%训练成本 MLA(多头潜在注意⼒机制) 数据蒸馏技术 •从海量数据中提炼⾼价值信息,提升模型学习效率•蒸馏垂类⼩模型能⼒,不输于全尺⼨模型 •注意⼒机制⽐作图书检索系统•MLA建⽴⼀个智能分类系统,不记具体信息,⽽是⼀个“简单”标签•模型的占⽤率降低⾄传统的MHA5-13% GRPO(群体相对策略优化) NSA(原⽣稀疏注意⼒) •⼤道⾄简,⽤强化学习跳出题海和⼩测让模型⾃⼰学会思考 •像学霸⼀样把注意⼒消耗降到最低 •“⼀⽬⼗⾏跳记重⼼记住题点”“ 为什么⼈⼈都爱DeepSeek? 技术震撼 成本优势 开源引爆 垂直适配 从编程辅助(DeepSeek-Coder)到医疗诊断(R1临床接⼊),展现⾏业落地能⼒ •算法、训练范式、推理、算⼒利⽤全⽅⾯创新•DeepSeekV3通过快速迭代新技术,⼤幅降低了训练和推理的成本。⽽且它是个拥有推理能⼒的模型,全球可⽤ •550万美元预训练成本达到GPT-4级别性能,打破“算⼒军备竞赛”魔咒•技术成本的下降,为⾏业上下游带来更多创新的可能 •开源的论⽂和库,以及提供简易的蒸馏⽅式,让世界上不管⼤⼩的实验室,快速掌握OpenAI原来封闭的顶尖模型推理能⼒•MIT许可证,商⽤权限吸引开发者 DeepSeek天然适合医疗⾏业 ⼤模型发展的⼏⼤“基⽯” DeepSeek创新技术引发新变化 算法框架 计算资源 DeepSeek是最开源的⼤模型,便于医疗⾏业开发者使⽤和优化,垂类⼩模型不输于⼤模型 医疗⾏业独特优势 数据资源 03 04 医疗⾏业拥有⼤量数据资源,是⼤模型训练和应⽤的重要⽀撑 DeepSeek虽好,但也不是“六边形战⼠” 幻觉⾼=“创造⼒税“ •DS幻觉率更⾼,另外实际测试应⽤中有指令遵循较弱、拒答率⾼等问题•医疗领域幻觉⽐例甚⾄⾼达20-30%2 在落地过程中,仍需结合⼀定的应⽤框架(RAG、⼯作流、Agent等)和⼯程优化来保障⼤模型应⽤企业级端到端效果 ⼤模型及DeepSeek潜在应⽤场景探索 医疗⾏业⾯临前所未有的挑战 医保捉襟见肘 ⼈⼝⽼龄化 药品集采5 医院艰难 研发回报下滑6 •65岁以上⼈⼝占⽐从2014年的10.1%升⾄2023年的14.9%,医疗需求激增1 •收⽀失衡加剧,控费边际效应减弱2•职⼯医保:结余稳健但增速下滑•居民医保:收⽀失衡加剧 •国家层⾯已开展10批集采,平均降幅50%-60%,极端降幅超90%5 •成功率低•美国创新药临床成功率仅5.1% 新⽣产要素在数据,“问数据,要数字” ⾏业视⾓:DeepSeek对于医疗体系有那些影响? 患者 •患者⾏为“消费者化”:医疗信息透明化,患者有更多主动权•“数字健康”和⽣态“破壁跨圈”,产⽣更多数据•个性化诊疗和健康管理 •电⼦病历和数据管理⾰新⼤模型语义理解加速医学数据治理和流通 •医院数据开放和流通数据价值在⼤模型背景下进⼀步被凸显•精细化运营管理(DRG/DIP)Ds推理思考能⼒以及医保控费压⼒ 监管 医⽣ •数据驱动的精细化监管:⽐如药占⽐/集采vs药品经济学•数据安全和合规重构•多元⽀付体系(商业参与度更强) •学习/培训模式发⽣改变•医⽣临床决策影响模式发⽣改变•科研与学术⽅式和效率 DeepSeek对于医疗体系有那些影响?-患者 患者 •患者⾏为“消费者化”:医疗信息透明化,患者有更多主动权→⼤模型成为患者信息来源•“数字健康”和⽣态“破壁跨圈”,⽐如可穿戴设备与AI分析相结合→⼤模型汇聚和分析数据•个性化诊疗和健康管理→获取服务的路径发⽣改变 患者服务:从“千篇⼀律”到“精准匹配”信息和服务 识别⽤户现病史、⽤药和健康情况标签,关联就诊&药事服务 个性化推荐医疗信息 •分析⽤户现病史,健康状况,推荐关联科室医⽣ •结合⽤户咨询⽤药信息,提供药事以及药品购买的服务 患者新旅程:终端+数据+AI+服务,AI串联全流程,激发新需求 DeepSeek对于医疗体系有那些影响?-医⽣ 基于DeepSeek病历讨论助⼿ 科研助⼿ 基于DeepSeek推理模型,整合患者的信息,辅助医⽣深度问诊、鉴别诊断、病情分析和建议,提出治疗、预防等建议 •基于Deepseek⼤模型,再现医⽣临床思维链路的推理模型 •⾃动⽣成病情分析、IDC⾃动编码 •分析准确率达90%,为医⽣提供权威决策⽀持 •指出权威出处(如指南、专家共识等) 医⽣ •学习/培训模式发⽣改变→交互性、个性化学习模式•医⽣临床决策影响模式发⽣改变→从经验驱动→基于医学搜索、循证医学证据的驱动•科研与学术⽅式和效率→通过⼤模型进⾏科研课题筛选、⽂献收集、数据结构化提取和分析、摘要及初稿撰写等 学术推⼴:千⼈千⾯,让销售拜访更专业、更⾼效 代表培训:AI辅导,实战中提升专业能⼒ 代表学习改进,在下次拜访中做的更好 未反映真实⽔平:培训与拜访脱节,实战能⼒难考察考试流于形式:通过⾮正常⼿段完成公司任务代表⼼⽣抵触情绪:影响⼯作积极性难以规模化:培训⽼师⼈⼒与精⼒有限 反馈更真实:通过真实拜访和⾃讲过程发现问题 激发代表学习的⾃驱⼒:发现问题,⾃发改进 提升代表⼯作效率:代表把⼯作和学习结合在⼀起 可规模化:借助AI规模化打分,不再有培训⼈⼒瓶颈限制 多渠道营销:借助⼤模型,提⾼合规内容⽣产与互动效率 多种创作模式 •⽀持参照范⽂创作,或基于以疾病为中⼼的,故事-关键信息-市场细分等框架创作 AI⽣成标题、内容 •AI辅助⽣成多种风格内容标题•AI辅助⽣成内容的基础⼤纲,可进⾏⼈⼯调整或细化 AI⽣成内容⼤纲 •AI辅助⽣成内容的基础⼤纲,可进⾏⼈⼯调整或细化 整合联合搜索+企业知识库 •基于已确定的创作模式、标题、⼤纲,补全正⽂•可限制内容素材均来⾃企业知识库,保证专业度与合规性 DeepSeek对于医疗体系有那些影响?-医院 •电⼦病历和数据管理⾰→构建专病知识库,为药物研发和精准医学提供⽀持⼤模型语义理解加速医学数据治理和流通 •医院数据开放和流通→数据要素商业化变数据价值在⼤模型背景下进⼀步被凸显 •PR先⾏,但过去“纸⾯数据、⾮标数据”等困境能得到极⼤缓解,医院数据的应⽤价值可以得到释放 •精细化运营管理(DRG/DIP)DS推理思考能⼒以及医保控费压⼒(需求⾼,难度⼤)→药品定价策略 医学数据结构化提取、标准化 新药研发:借助⼤模型,提升药品研发的效率和速度 试验执⾏多元 研发⽅向探索 •去中⼼化试验⽀持:居家数据采集与依从性管理•院外数据的⾃动采集和综合分析 •检索药监、⽂献、临床指南、申报⼚家数量等选择潜在靶点(需RAG未公开数据)•知识图谱可关联临床试验数据与RWE试验,去观察有潜⼒的适应症 执⾏效率提升 试验设计优化 •医院侧:电⼦病历⾃动化•CRO/企业:辅助⽂档处理、数据分析等重复⼯作•企业:申报材料的准备 •患者分层:基于⼤模型的语义理解能⼒,从历史数据中识别符合⼊组标准的“数字孪⽣”患者群体,提⾼招募效率•剂量探索:通过强化学习算法模拟不同剂量⽅案的效果,缩短1期的试验周期 “若临床时间缩短1年,研发回报率IRR提升⾄9.5%;若研发成本降低20%,IRR升⾄10.1%”1 企业AI知识库:打造企业版ima,提升内部流程效率 “理解准”、“检索准”、“回答准” •知识萃取+模型推理,超越基础RAG,充分应⽤企业知识结构,⾃动学习理解企业信息,强化掌握知识要点关联•准确率更⾼,模型幻觉更低,更适合⼯作场景严肃问答•知识获取可融⼊⼯作流程(如财务报销),让知识可即时取⽤ 智能办公:AI辅助的智能⽂本助⼿ ⽂档智能助⼿:⽂档的doc、表格、思维导图等各⼯作⽂件中,通过AI提⾼⽤户⼯作效率 ⽂档创作 ⽂本编辑 表格公式⽣成 遵循⽤户指令,进⾏各种场景的⽂本创作 对已有内容进⾏续写、润⾊、校阅、翻译和总结 智能办公:智能会议助⼿ DeepSeek会给医药企业带来哪些变化?—“技术为⾈,业务为舵” ⼤模型虽好,使⽤需谨慎 企业应⽤ 个⼈应⽤ 数据授权和管理 •避免透露公司敏感信息:⽐如内部⽂件、政策草案、经济数据等 数据隐私和安全 •避免透露个⼈信息:⽐如⼿机号码、地址、财务状况(⽐理财建议)等•检查隐私条款是否允许数据⼆次利⽤ 安全与权限控制 •访问权限分级•数据隔离机制 ROI优化 使⽤场景与内容风险 •明确应⽤场景:不是所有场景需要AI•混合部署策略:“该省省,该花花”•模型选择和微调:“满⾎”虽好,但所需推理资源逆天•⾼并发处理 •内容准确性验证:专业内容需交叉验证、追溯来源•版权意识:避免直接商⽤模型⽣成的代码、⽂案或设计 感谢 ⼈⼯智能将如何改变医患互动?科技助医互联为健 共建医疗健康新⽣态