AI智能总结
腾讯医疗健康事业部2024.5 风口已至 从“量变”到“质变”,AI进入“大模型”时代 泛化性 对新数据的适应能力 实用性 能力国内大模型“百花齐放”,产业落地已过“尝鲜期” ……我国10亿参数规模以上的大模型已发布79个 •“百模大战”:截至23年10月底,国内已有200+大模型推出,51%的受访企业使用AIGC技术或工具用以“文本生成”场景•2024年1-4月,大模型相关中标金额达到2023年全年中标披露金额77%——《中国大模型中标项目监测报告》 腾讯能力 全球领先的AI研究能力 腾讯云智能在计算机视觉、智能语音、自然语言处理、机器学习等领域已取得多项技术突破,持续推动前沿技术的产业落地。下设多个顶级人工智能实验室。腾讯优图实验室多次在人工智能国际权威比赛中创造世界纪录,腾讯云小微、AI LAB等团队协同深耕AI语音及语义能力,多次在国际国内比赛中拔得头筹。共拥有5000+AI相关专利,发表顶会论文800+篇。 TI平台:行业大模型开发应用一体化平台 适用对象:既有业务专家团队、也有技术专家团队的客户 大模型开发 大模型精调◆一键调用:20多个主流开源及自研大模型低代码部署体验 模型管理 医疗行业大模型:深度训练学习海量优质医疗数据 •通过医生对模型结果进行打分和排序,训练奖励模型•基于奖励模型,使用强化学习算法,优化模型 根据多种医学任务数据,对基座模型进行微调 •在预训练模型的基础上,引入下游业务进行多任务微调,提升模型落地效果•任务:医患对话生成,导诊、预问诊、辅诊、智能问答、合理用药等 医学领域持续进行预训练,使模型进一步掌握医学知识 •使用大量高质量医学文献,包括腾讯医典、教科书、病历、论文等•加入大规模医学知识图谱的内容,覆盖98% ICD中疾病的知识 预训练模型,使模型掌握底层医学知识 •训练多种规模的生成式大语言基础模型,适用于不同场景•语言模型建模过程中,包含各种主题,类型,语言,渠道的数据,为适配下游任务打下基础 医疗行业大模型:深度训练学习海量优质医疗数据 海量医学知识灌注:1000亿字医疗数据,3000万个问答对,36万组标注比对数据 大模型知识引擎:企业级LLM 适用对象:既没有业务专家团队、也没有技术专家团队的客户 通用模型:垂直领域知识深度+时效性不足 模型精调:结合企业知识训练,扩展大模型内部知识 知识库增强:让模型结合相关片段的理解给出高时效的精准回复 ➢连接外部知识库,易于更改和更新信息,时效性强,➢保证知识来源,做到结果可追溯➢敏感数据无需进入模型训练➢大幅节约LLM计算成本 ➢训练数据量级要求高,成本高➢训练周期长,时效性弱,无法有效解决知识更新和扩充问题➢针对企业内部细分业务场景,无法处理访问限制和信息隔离的问题 通用模型直接回答“骑手取得市财政给予的1元/单的跑单补贴,是否需要缴纳个人所得税”,得到的答案没有意义 行业模型 大模型知识引擎:企业级LLM 基于行业大模型,专注实现知识处理和对话交互的全面升级 应用探索 应用探索1:医药知识问答 能力介绍: ➢自定义知识库检索范围➢支持联网全域搜索➢提供详细参考文献及链接➢模型多领域回复能力(不限医疗医药) 应用探索1:医药知识问答 上海某三甲医院,大模型和数字人技术加持 智能院务客服7x24h为患者答疑解惑,缓解客服压力 ✓上海市级医院“便捷就医服务”数字化转型2.0智能云客服场景试点医院 1.互联网医院如何挂号使用2.周末互联网医院是否开诊3.互联网医院是否可以用医保4.互联网医院收费标准 应用探索2:医学文献、政策文件分析处理 以医药政策追踪与AI分析比对为例: ②大模型输出: 国家三级公立医院绩效考核操作手册(2022版) ①大模型输入:指标“国家组织药品集中采购中标使 用比例”在2022年和2023年有什么差异? 应用探索3:标签提取,自动生成患者画像 对多轮对话进行分析理解,抽取其中关键信息,按照画像维度进行输出支持后续智能运营 应用探索4:医患对话自动生成病历文书 模型可以准确抽取对话中的信息,生成的小结与真人医生标注结果非常近似! 注:正在与某头部医院(出院小结、随访记录等)和医疗器械厂商(ICU每日病程记录等)合作 应用探索5:患者个性化查询 多维度检索模块: 示例问题:患者近3天的抗感染药物使用 1)病人数据长度随住院时间增长,常见几万到十几万字的长度;2)超长输入导致模型能性下降,推理速度慢,用户体验差;3)通过LLM实现问题中的实体抽取+名称标准化,可快速检索病人数据中问题相关的部分,有效控制输入长度。 *注射用哌拉西林钠他唑巴坦钠[2.25g×8瓶] 2024-01-25 11:0130ml*伏立康唑片[50mg×10s] 2024-01-25 21:09 6片*伏立康唑片[50mg×10s] 2024-01-26 00:04 6片*注射用哌拉西林钠他唑巴坦钠[2.25g×8瓶] 2024-01-26 02:0330ml*伏立康唑片[50mg×10s] 2024-01-26 10:25 30ml*注射用哌拉西林钠他唑巴坦钠[2.25g×8瓶] 2024-01-26 18:3930ml*伏立康唑片[50mg×10s] 2024-01-26 20:17 4片*注射用哌拉西林钠他唑巴坦钠[2.25g×8瓶] 2024-01-27 00:2530ml 本地知识库: 包含药物知识图谱等信息,当问题类似“病人一周内使用了哪些药物抗感染”时,基于知识图谱找到所有抗感染药物名,再根据药物名在病人数据中完成检索。 其他医疗应用场景 问医 用药 导诊 针对普通人对常见病的用药,或药物使用方法及其注意事项的问询 针对普通人对开放性的、医学常识性问题的问询 有效地指导患者在就医过程中找到适合的科室或医生,并为其提供必要的医疗服务 医学考试 疾病诊断 随访科室推荐 根据各种疾病的临床特点,对病人作出相应的诊断,确定病人所患何种疾病 通过一系列的考试来选拔具备医学专业知识和技能的从业者,包含医学知识的考核,以及从业者综合素质的综合评价; 提取疾病史、检查检验等材料的关键信息,推荐科室并生成随访建议。 医学合规 医学实体识别 术语标准化 模型需要遵循医学伦理原则,尊重病人的隐私和自主权,确保提供的建议符合伦理规范 实体识别是大模型从医学文本或病历中识别出重要的医学概念、疾病、药物和治疗方法等实体及描述 为了统一术语的使用而进行的一种规范化行为,旨在提高医学信息交流的准确性和效率 Thanks!