您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[未知机构]:专家会- AI医疗最近发生了哪些变化 - 发现报告

专家会- AI医疗最近发生了哪些变化

2025-05-25未知机构惊***
AI智能总结
查看更多
专家会- AI医疗最近发生了哪些变化

专家会- AI医疗最近发生了哪些变化-20250525_原文 2025年05月26日 14:54 发言人1 00:00 我早就选择了要做医疗的这件事情,他可能在这个方面的投入就比例就更高。然后如果说跳出AI只看医疗行业,现在整个行业里面也有一些痛点是可以通过医疗通过这个大模型的方式来解决的。眼前比较多的问题是资源的,中国的资源的分配还是不太好,基层医生还是有很多缺口,而且基层医生的误诊率也很高,然后效率也非常低。很多医生都要做一些文书工作,然后这个文书工作的质量也不太好。然后还有问题就是说它的数据本身是孤岛,医院和医院之间数据互不通,它已影响这种研究和应用。已经有一些企业,比方说像支付宝再去做这种医院之间的检查结果互认的这样的工作,但是推起来这个难度还是很大的。 发言人1 01:02 AI到底在医疗这件事到底发挥了一个什么样的价值?其实像百川是明确提出他是要告医生,他是要起到替代人的作用。但事实上医生尤其是大医院里的医生,他的主要工作并不是在于前面的诊断,而是在于手术室做手术的部分。前边的做诊断门诊性的工作,其实在大一点在医院里面算是一个比较小量的工作。但这个部分的少量工作,往往是我们普通用户接触比较多的一个场景。所以AI实际上是在解决这种做complex的compact或者是做这个替代性工作这两者之间的部分。 发言人1 01:46 如果能够做的比较好一点的话,就等于在医疗行业里面提出了更多的供给。这对解决资源不均这个方式是非常有好处的。无论从对国家层面上,对医院层面上,还是对于普通用户的角度上来讲,都是一个非常有价值的事情。另外有一点,他技术上现在已经做到了能够起到比较比一般的医生准确率更高的诊断率。所以我们作为从业人员,对于我个人而言,可能我身上出一些问题,我就完全不用去找医生了。我就可以自己通过我自己用提示词的方式来解决我身体上遇到的一些问题。 发言人1 02:28 但是因为大模型它是一个智力效率工具,我在使用它的时候可能比一般的用户使用起来要更规范、更精准,是普通用户很难做到的。所以可能未来还会有一个方向,就是如何让普通人能够在跟大模型的交互过程中,能够得到一个高质量的回复。就是让这个效率工具变得更接地气,更好用,这也是一个方向。 发言人1 02:57 它除了这个方向以外,还有两件事是要解决的,一个是记忆问题。现在的大模型对话式场的交流,随着人数越来越多,它的幻觉率会越来越高。那怎么样去解决这种长期记忆问题,怎么样去解决这个幻觉减少的问题,是一个主要要点。 发言人1 03:17 还有一个就是他信息的这个索引的问题。现在比方说大家如果用deepset,你开了这个联网搜索和不开联网搜索,你觉得它就是两个生物。因为可靠的信源这件事是很难搞定的,所以可能未来会使用一些类似于区块链的技术,把信息的信源的准确性再提升。打造一个比较好的这种知识库,会对整个医疗模型的体现会再有一些提升。这些都是肉眼可见的可以短期内完成的事情。如果能把这些做完之后,医疗的大模型的水平还会再往上提上几个台阶。 发言人1 03:58 那医疗模型到底能够使用在哪些场景,或者解决是哪些具体的问题呢?我们可以把医疗这件事就分为三个阶段,诊断、治疗和管理。首先在诊断这个阶段是肯定没有问题的。比方说有一些做这种多模态的模型,做一些肺部、肾脏这些影像结果的识别。现在的模型是能做的比较好的,但它不属于大模型,它属于上一代的模型水平。另外像讯飞和百川,他们会做这种类似于线上问诊模式的这种方式来进行交流式的诊断。收集用户信息,然后帮助信息帮助用户去做短期决策,这种也是OK的。 发言人1 04:45 然后在治疗方面上,其实大模型现在能够做一些个性化的方案,基于用户给出的信息来推荐一些药物使用,这个是能做的有限的部分。然后在管理方面上是能做的比较多的,去做这种慢病类的监控,术后的管理这些方面其实大模型你要做的比人更精细,比人更有情绪情感。然后在各个科室来说,现在其实没有具体的划分。实际上百川和讯飞,包括什么左手医生等等,都是在做一些全科类的。就是无论你是什么疾病,你不用分具体哪一个科室来跟这个大模型来去交流和沟通。目前这个部分做的还是比较OK的,所以还不错。这是一个方面。另一个方面就是如果从医院的场景上来讲,我们也可以把它分成专家型医院,然后这个基层型医院等等。 发言人1 05:50 专家型医院可能它需要大模型的能力,是MDT叫多学科会诊,做这种罕见病的疑难杂症的这种推理部分。这个是非常强的,是大模型非常擅长的部分。但对于这种基层医院来讲,它其实是等于说给基层的这种诊断率不高,然后人力不足的这种医院分配一个具有外挂属性的这样一个模型工具。能够帮助基层医生做更快速更准确的诊断。这也是一个比较容易落地的一个场景。目前看来百川有一个公司叫小的方,也在已经为这个方向上发力了。能够看出有限这个已经成型的产品出来,demo我也是见过,还是很有前景。 发言人1 06:44 然后现在整个需要解决的就医疗大模型在国内需要解决一个什么问题呢?第一是一个技术方面上还是要不断的向前优化。即使我们现在已经做到这样的准确率,但它还是有很多的这种幻觉。然后普通用户很难直接使用,然后使用成本门槛还是具有的这样一些问题,所以它在技术层面上还要不断的前进。不过应该在两年之内,基础大模型的这个能力基本上都会拉到差不多水平。所以基于此能力,底层能力的提升对产品促进的作用就基本上快耗尽了。 发言人1 07:25 后面就是看谁在这个产品盒上拿出一个比较好的效果来,然后市场的缺口也是足够的那接下来就是谁能够去推动国家拿到比方说21点器械、三级器械,然后进入到医疗这个场景,然后确定好买单方是C端买单,H端买单还是G端买单。怎么样去做类似于什么轻建工程,新视角计划,这种国家政策是不是真的能落地往前去推进,这些是比较影响未来这种医疗大模型落地的具体场景。否则他们只能去替代过去百度的位置,就是做一些基础的医疗信息的收集这个部分。只是做这个部分的话,其实做商业化其实不是特别有变现的场景。对,主要目前的情况就近期的情况大概是这样。如果有什么底层的或者是其他的一些数据,也欢迎各位提问,我们来在这里面互相交流和学习。 发言人2 08:36 好的,非常感谢专家非常详细的一个分享,就是讲的确实比较全面。我们首先请进门的会议助理播报一下提问方式。大家好,如需提问电话端的参会者,请向话机上的星号键再按数字一,网络端的参会者,您可以在直播间互动区域内文字提问,或点击旁边的举手按钮申请语音提问,谢谢。大家好,如需 提问电话端的参会者,请向话机上的星号键再按数字一。网络端的参会者,您可以在直播间互动区域内文字提问,或点击旁边的举手按钮申请语音提问,谢谢。 发言人2 09:28 好的,专家,我这边先来提问一下。因为专家前面分享的一些内容确实也是有很多大家目前现在比较关注的关心的一些话题。我首先第一个问题还是想请教一下,就是关于inspect他最近的一个进展。因为最近大家也是看到deept他可能想在医疗数据的这一块,去招一些人才,去提升医疗方面数据的一个高质量,其实有一些这种相相关的医疗的一些高质量数据的话,那这个模型的能力应该还是能有一个比较大一个提升。 发言人2 10:06 那呃我想请教的问题就是,现在这个行业里面就怎么样去看待目前这个deepseek他在医疗领域的这个能力?那可能确实也还会有一些这种患者的问题。因为但是我们也看到也有很多医院,它目前部署的话其实也是用的这个deepseek的模型。那其实请专家你们就是从一个比较专业的视角帮我们去分析一下。在大模型的不同的这一些大模型它现在这个能力上的一个差别,然后未来的眼睛的一个方向。 发言人1 10:45 好的,我觉得这是一个特别好的问题。在过年之前出来的时候,然后我们当时就上手去检验了一下。我们很惊讶于他的这种强推理模型的能力和实力。 发言人1 11:01 我们深度的去评估了之后,我们有如下的结论。首先这个deepfit的这个模型是非常好用的。而且我们在做一些罕见病、复杂病的时候,他distract给出的很多的建议是非常好的。但是他同时也存在一个问题,就是我们如果让一个非常基层的医生去调用这个deepsap的时候,往往是调用不出来defect的。他的这种非常强的逻辑的推演能力。我们让一些非常专业的医生,然后再给他一些提示词的这种简单的培训,它能极大的发挥出这个模型的效果。 发言人1 11:43 举个例子,我们在写提示词的时候可能加上一小段话,就是说请你按照人类解剖生理学或者什么什么学的角度分析一下巴拉巴拉这些结果。再去给他这个患者各种大型医院的检测结果。比方说他做了血常规,做了一个彩超,然后文字性的结果是什么?这种复杂的大的长篇幅的信息都改完之后,再去给明确的这种提问。比方说问他这是什么疾病,可能是什么有什么东西导致了什么什么现象,然后你可以建议哪些什么样的治疗方式。就你给的信息结构越清晰,prompt这种结构越完整,它调用出来的能力就越越强。 发言人1 12:37 但在实际落地场景给普通用户的时候,包括给那些不太善于使用这种大模型一个医生的时候,他们是无法激发出来这个模型的能力的。所以我们在做一些落地场景的时候就发现出了这个情况,就普通用户无法使用这个大模型的极致能力。这跟上一代的产品,比方说一般的人不太会用搜索引擎是一个逻辑。作为一个智力工具,他对使用工具的人是有要求的,所以这个事儿是一个点。 发言人1 13:13 第二个点就是说作为一个这种模型,它在引用信源的时候不是特别的透明。包括现在已经开始用一些联网搜索,联网搜索是另外一个问题。前者如果只是用它模型来做输出的时候,他到底为什么输出?这个过程整个逻辑是什么?参考文献是不是准确? 发言人1 13:34 普通用户别说普通用户了,专家都很难去在一个快速的时间里验证他说的事情是真还是假。所以就会有一些我们看到的这种幻觉的这种报道,这种信息出来。这也确实是存在。我们得知道随着这种大模型的对话的人数越来越多,它的概率本来就不断在飙升,这是第二个问题。 发言人1 14:00 第三个问题就是刚才我说的这个互联网搜索的问题。因为信源不够准确,就是互联网上现在信息越来越杂乱了。而且随着大模型的出现,很多新的信息是由大模型生成出来的,产生出来的垃圾,然后再回过头来再由大模型去引用,就是垃圾出来的东西就更垃圾。到底什么样的关键信息可以被引用?建立一个什么样一个rap库,这也是一个核心,就是不能单纯说只开联网搜索。他可能未来要成为一个专业化的产品。 发言人1 14:33 可能比方说我们做deepset的时候,它是一个多专家模式。在问遇到问题的时候,他做的联网搜索应该是有一些医疗专业的人划分的这些信息是最精准的。然后你参考的是只参考这些问题,才能让这个模型的产出是更高质量。这是我觉得他在工作过程中遇到的这些问题。然后通过引入行业内的专家来开始为他的这个强化方向做更好的部分。因为大模型就垃圾进垃圾出,优质进出优质出。他不把优质的这个行业专家拉进去,他是很难在这个部分上有提升的。 发言人1 15:14 然后我刚才也是说了一些,从行业内观察这个C医疗核心进展,核心能力它有哪些短板。总体来说我是觉得它是很好的。在目前的情况下,已经算是所有大模型里面能把这个问题往前推进非常棒的部分。他已经打败了在我看来80%到90%的真人医生了。但我们想让他成为一个纯医生水平就是值得信赖的,就像人们对自动驾驶的那种信仰感的那种状态,他可能还需要有一段路要走。但总体来说,在我作为从业者上来讲,他已经非常让我惊艳了。 发言人2 15:56 明白,专家,我明理解您这句这个问题的一个题组,一个原因,一个主要的一个重点,它是在于说关于这个信息源,包括数据质量上。所以我们也是,为什么,对他的人才的话,也是要去招医疗行业的人才,而是懂,医疗的专业知识的。那其所以其实我觉得,像这些医院,他去部署这个deep sick的话,也是自己内部也有这种医生的团队,然后也有自己内部的IT团队,他能够很好的