人工智能领域令人期待的最新进展: 利用生成式和代理式人工智能推动临床试验的效率和质量的创新 RAJNEESH PATIL, 副总裁,数字创新与战略,IQVIA 第一部分:一个四部分系列,重点介绍临床试验中的关键创新 目录表 12334455566789展望未来:支持一个共同愿景以改善患者生活 8概述如何提升标准:确保安全和高效的使用训练数据的选取性采取多管齐下的方法来保障效率和品质整理和“集装箱化”数据整合“人机协同”响应的协调一致客观性和使用情境认识到不确定性和知识差距将原则付诸实践:成功应用案例成功利用科学聊天机器人在III期试验中的应用数据回顾:赋能中央监控人员和CRAs与您的分析对话:一个用于监控支持的代理人工智能平台关于作者 概述 正如文章标题所暗示的——人工智能领域的新兴进展——这些是临床研究领域极为特殊的时期。每年,随着日益增长的期待,行业领袖和专业人士都在猜测和辩论在哪里以及如何最好地释放人工智能的潜力,以帮助提高临床试验的效率和包容性——并最终通过改善机构和患者的体验来推动医疗保健的发展。 最近,由于将通用人工智能(GenAI)工具成功应用于临床试验——其中大部分在不久前还被认为属于“天空想象”的范畴——景观已经发生了转变。 在庞大的且复杂的临床试验生态系统中,充分利用这些卓越技术的机会比比皆是——无论是在设计规划、患者参与、临床试验交付、临床监控、监管提交,还是远超商业药物开发领域。 美国食品药品监督管理局(FDA)以及其他监管机构正开始就适当的安全措施、背景和验证要求等方面提供指导,同时考虑其他关键因素,以将负责任的AI整合到临床研究中。 在这篇论文中,我们将回顾几个利用IQVIA healthcare-gradeAI的用例。®旨在满足生命科学和医疗保健领域所需的精度、速度和信任水平,概述其成功的技术和运营驱动因素,并具体阐述每种新的AI方法如何显著提高效率和品质。 最近,然而,由于实际的、成功的原因,这一格局已经发生了转变。应用将GenAI工具应用于临床试验——其中大多数工具不久前还被认为属于“蓝天设想”范畴。尽管这些进步正在证明它们在使用案例中提高了效率和品质, 执行具体的过程步骤和行动——允许开发出能够影响质量、合规性、速度和效率的创新解决方案。 如何提升标准:确保安全和高效的使用 在深入探讨这些人工智能用例的更技术性方面之前,了解通用人工智能和代理人工智能之间的区别至关重要,它们都是人工智能的子集。 在开发这些特定的AI框架时,采取了全面、哲学的方法——这在某些方面类似于育儿。就像进入世界的孩子拥有无限的潜力一样,挖掘AI的潜力需要适当的培训、强大的伦理框架、模型完整性和透明度,以及保护这些工具免走非最佳路径的安全保障。适当的培养的一个关键方面是人类的监督——有几种数据科学方法侧重于迭代培训和增强学习,以用于GenAI模型(关于这一点稍后详述)。 从根本上讲,通用人工智能(GenAI)被设计为根据它在模型训练过程中处理的数据生成响应、内容、评论和输出,包括报告或可视化内容。它倾向于交易性,比如对特定问题提供通用性回答,这可以通过提示工程的科学方法来改进。代理人工智能(Agentic AI)被构建来独立处理复杂的多步骤问题和操作,例如控制系统(例如自动驾驶汽车)。生成性人工智能(Generative AI)将大量数据转化为可行动的知识,AI代理可以在此基础上建立能力来 但是在这些成功的应用中,首要任务是确保它们得到适当的情境化和培训。 采取多管齐下的方法来保障效率和品质 训练数据的选取性 人工智能的准确性和可靠性取决于其完整性、相关性——更重要的是——关键性。选择性其训练中使用的数据输入。开源的消费者大型语言模型(LLMs),例如ChatGPT,DeepSeek并且理解。广泛撒网——通常搜索包含数十亿人产生文字的庞大数据集。 在开发和应用生成式和代理式AI解决方案于临床研究时,考虑以下5个关键的安全保障类别至关重要——无论它们的形式是聊天机器人、摘要生成器还是自动化工作流程助手(见附图)。图1). 这些原则有助于确保效率、质量和最大化安全。以下列出了这5个优化类别: 虽然处理如此广泛的数据范围的能力在技术上令人瞩目,且对许多用途有益,但在科学领域过于广泛地撒网可能会产生低质量或幻觉般的反应。 策划和容器化 在科学研究中,实际上,某些开源通用人工智能代理出现幻觉现象并不罕见——提供虚假引用、得出武断结论,甚至提供反效果的医疗建议。如果没有进行坚固的修改,这些开源大型语言模型不适合用于科学或医疗应用。 人机交互 响应的协调一致 客观性和使用情境 因此,需要一系列关键的安全保障措施来确保对训练数据进行限制、审查和适当的验证,以确保在临床试验中可以使用人工智能代理安全且高效地。 认识到不确定性和知识差距 与进入世界时就具备无限可能性的儿童一样,释放人工智能的潜力需要适当的培训、强有力的伦理框架、模型完整性和透明度,以及保护这些工具免于走下坡路的保障措施。 响应的协调一致 一致的、高质量的反应,无论问题如何提出。 参与度提高,引发了对全球范围内工人可能被取代的担忧。在IQVIA,我们坚定不移地维护——并且在我们成功开发新型应用的过程中持续观察到——在优化质量和预防幻觉反应中,人类参与和人工智能之间的健康平衡是不可或缺的。 1. 数据的整理与“容器化” 亚历山大·蒲柏长久以来所持有的谚语“一点点的知识是危险的事情”描绘了错误结论(以及过度自信)如何由于知识不足而产生。虽然这对人类来说是正确的,但合理限制知识——通过在知识和实践之间建立适当的界限——是必要的。策展—— 对于确保通用人工智能的质量和效率至关重要。 再次,经典的例子是自动驾驶汽车。尽管它通过代理人工智能具有自主决策能力,但这些车辆的安全性是经过优化的,因为当需要时,有一个人坐在控制台上以覆盖自动决策。这“人机交互组件——与智能代理AI结合——有助于确保在遇到广泛场景时生成安全且符合伦理的响应。 换句话说,为了生成可靠的临床操作级响应,训练数据必须与旁支或推测性信息完全隔绝,以避免产生模糊的回答和/或意见。 因此,任何用于临床试验的通用人工智能/代理人工智能解决方案都必须在数据生态系统、操作流程和人工干预接触点的预先确定的边界内部署。 当然,在临床试验领域也是如此。闭环人类操作可以通过集成到复杂的、多步骤的过程中——例如端到端数据流和监控多个数据流(通过)在临床试验中使用的不同数据收集系统生成的数据——来优化效率和品质。 2. 整合“人工在环” 自其诞生以来,人工智能引发了一场关于人类未来的可理解的辩论。 代理型人工智能可以在特定的流程中自主用于某些功能,尤其是行政或自动化任务(例如文档收集和合规性审查),而人机交互则可以保留用于需要更高敏感性的步骤——例如关键数据的审查和决策制定。这种综合方法可以显著简化并加速流程,同时提供更高的质量保证。 4. 客观性与使用情境 尽管在任何医学或科学互动中客观性都至关重要,但在应用GenAI方面需要更高的严谨性。例如,在诊断影像方面,不同的专家可能会看到同样的扫描结果,但分析和理解结果的差异很大。虽然这并非在传统意义上的“偏见”,但事实是, healthcare professionals(医疗保健专业人员)——就像我们所有人一样——拥有独特的背景、技能和经验,这些都可能影响结论。 3. 响应协调 基于标准评分和已建立的指南,可以运用生成式AI对医疗图像的诊断进行客观化,并准确评估严重不良事件(SAEs)的严重程度。 另一个关键成功因素是生成一致、高质量的回答的能力,这不受提问方式的影响。一个问题可以用任何一种方式来表达——这取决于用户选择的词汇、成语和修辞手法。不同的个性、背景和文化也会影响问题的表述方式。 识别不确定性和知识差距 人工智能模型产生错误或幻觉性回应的根本原因是没有内置的识别不确定性的机制。如同人类,人工智能从自我意识和认识到自身的局限中受益。因此,在医学科学中应用的新型人工智能代理必须经过严格的训练,以避免给出部分答案或猜测。 为了满足医学科学的严格要求,自然语言处理必须高度敏感,以可靠地检测上下文、发掘手头上的核心问题,并每次都能提供一致、准确的回应。虽然这是一个简单的概念,但要产生全球协调一致的回应,则需要高度复杂的专家知识、技术和深入的最佳实践经验。 既然已经概述了优化人工智能在临床研究领域效率和质量的某些重要原则,让我们深入了解目前在该生态系统中应用的某些人工智能代理。 为了最大限度地提高效率和品质,代理人工智能可以在特定工作流程的某些功能中自主使用,尤其是行政或自动化任务,而需要更高敏感度的步骤则可保留人类在回路中的参与。 与人类一样,人工智能受益于自我意识和认识到自身的局限性。因此,在医学科学中应用的新型通用人工智能(GenAI)代理被严格训练以避免给出部分答案或猜测。 将原则付诸实践:成功应用案例 既然我们已经概述了利用创新型人工智能方法提高效率和质量的多元化核心方法,现在让我们回顾一些令人激动且成功的模型,在这些模型中,IQVIA应用了这些原则(参见)。图2). 成功利用科学聊天机器人在III期试验中的应用 一个关键性的进展在于利用生成式人工智能(GenAI),实现了对话式问答聊天机器人的部署,该聊天机器人能够有效回答与协议相关的问题。在2024年第四季度,这个聊天机器人在一项大型三期临床试验中由现场工作人员和监控人员使用,它迅速且准确地解答了各种科学和特定于协议的问题——这些问题包括知识产权(IP)管理、登记筛选程序、患者活动日程、基于合规性的安全性和不良事件文档以及其他影响临床试验现场过程合规性质量的关键控制措施。 通过提供这一范围广泛的快速、信息丰富的响应,聊天机器人加快了协议澄清的回复时间,同时在回答查询时减轻了专家、医疗监控人员和/或赞助商所承受的部分负担。 联系我们iqvia.com/rds