AI智能总结
选择衡量医疗保健服务有效性的方法 凯蒂·里德奥斯汀·巴林顿凯特·鲍威尔 随着新型医疗治疗方法、产品和护理途径的快速增长,制定一个稳健且周全的方法来衡量其有效性和结果,可能是一个医疗保健交付战略的有价值组成部分。 一项观察性结果或有效性研究是一项分析工作,旨在评估新型医疗保健服务(在本白皮书中统称为“项目”和/或“干预措施”)的现实影响。当寻求评估医疗保健项目是否实现其预期目标并为投入的资源创造价值时,这些研究非常重要。此外,这些研究还可以揭示如何调整项目以优化结果以及如何在有限资源下优先考虑多个项目的宝贵见解。 有效性研究用于测量项目效果,涵盖多种指标,包括但不限于:收入、成本、利用率、临床结果以及医疗服务差距的缩小。这些研究为各类医疗保健组织提供了有价值的工具,例如健康科技公司和数字健康公司、医疗服务提供者、支付方以及政府项目。本文档探讨了正确执行的有效性研究的效益、可选用方法的类型选择,以及每种方法的优缺点。 有效性研究的好处 效果研究在评估项目在真实医疗环境中的实际影响方面发挥着关键作用,考虑其影响与随机波动的统计显著性。它们支持一系列战略举措,从识别增强项目设计的方法到吸引新患者和合作伙伴。这些研究在方法上有所不同,但最全面的方法提供了一系列战略利益和挑战。 有效性研究的好处 □循证决策 □面向提升患者护理和体验的智慧 □市场差异化 □增强可信度 □提升金融认知 循证决策 有效性研究提供经验证据,定量了新治疗方案对财务和临床指标影响的估计,这些证据也可用于未来项目改进策略。 面向提升患者护理和体验的智慧 这些研究的发现可以用于完善和提升临床服务,有助于改善患者护理和结果,以及整体的患者体验。类似地,可以最小化在低影响或负面影响举措上投入的资源。 市场差异化 正面的有效性研究结果可以支持一个组织与其竞争对手在护理模式上的差异化,有可能提高患者、雇主和付款人的忠诚度。它们也可以用作营销工具来吸引更多患者、投资者和合作伙伴;根据所采用的方法,一些组织选择公开报告这些评估的发现,将其作为一种营销和扩大供应的方式。负面或中性的结果可以帮助确定护理或定价模式中可以改进的部分。 增强可信度 采用统计上可靠的方法,有效性研究可以促进项目影响评估的可靠性,并在医疗服务提供者、患者和其他利益相关者之间建立信任。对于寻求额外资源的初创公司而言,这些研究有助于支持持续的投资讨论;此外,它们可以通过展示项目成果的可信证据来帮助支付方谈判。 提升金融认知 根据分析层次,这些研究可以提供必要的评估,以衡量项目对医疗保健利用和成本的影响,即其预估的投资回报率(ROI)。这些结果可以作为财务预测、合同投标或绩效担保的一部分使用。一个案例研究将在本白皮书后面进行描述。 最终,有效性研究直接基于现实情况衡量治疗或干预措施带来的益处。它们使组织能够就其护理提供和流程做出明智的决策,这些提供和流程在日常临床实践中有切实的益处,而不仅仅是高度控制试验中预期的结果。 有效性研究方法的类型、益处和挑战 存在几种不同优势和挑战的有效性研究。这里我们关注研究项目有效性的最稳健方法:随机对照试验和观察性匹配队列研究。 随机对照试验(RCTs) 随机对照试验被认为是评估项目有效性的“黄金标准”。随机对照试验是一种旨在通过将研究参与者在测试新项目时随机分配到两个或多个组中来减少某些偏倚(尤其是下文讨论的选取偏倚)的方法:至少有一个实验组(接受正在测试的治疗)和一个对照组(接受标准治疗或安慰剂)。然后通过比较两组结果的统计盲法来确定这些治疗或干预对患者结果的因果效应。 优点 缺点 通过最小化选择偏差随机患者选择。 复杂难设计管理。 展示了因果关系一项干预及其结果。 昂贵且耗时监控和分析。介绍伦理考量 帮助确保一致性通过 由于扣留潜在的 严格的参与协议。 有益干预以“控制“团体”参与者。 减轻偏差风险结果解释。 常难以监控和执行参与标准。 图1随机对照试验的利与弊 一项随机对照试验(RCT)具有很高的优先性,因为它有严格的方案和标准化要求,有助于确保参与者的结果一致性,并降低解释结果时出现偏倚的风险。然而,RCT不应被视为能保证有效结果的单一模式。RCT也可能在设计和/或执行方面存在问题,从而影响结果的再现性和普遍性 。此外,RCT的实施既昂贵又耗时,并且在某些情况下还可能存在伦理考量。1与对控制组隐瞒潜在有益的干预措施有关。这些问题可以通过(例如知情同意和非传统研究设计等机制)得到减轻,尽管这样做通常会随着研究目标变得更加复杂而增加复杂性。2 观察性匹配队列研究 当由于经济、伦理或后勤问题而使随机对照试验不可行或不切实际时,观察性匹配队列研究是一种越来越被用作合理且可信的有效性研究方法的研究设计。与随机分配参与者到治疗或对照组的随机对照试验不同,观察性研究仅仅是观察自然发生的患者暴露差异的结果。这些研究旨在通过比较接受治疗或干预的成员的结果变化与未接受治疗或干预的成员的结果变化来估计干预的效果。重要的是,精心设计的观察性研究要求这两组中观察到的个体不是自我选择,例如参与者与非参与者,因为在比较参与者与非参与者时会存在选择偏倚。 图2:观察性匹配队列研究的利与弊 优点 缺点 降低混杂影响变量的治疗结果。 仅限于变量在倾向性中用于分数计算,剩余存在潜在偏见。 减轻道德随机对照试验的考量。 需要复杂且有时复杂统计技术专长。 适用于现有现实世界中的数据集设置。 常依赖于广泛性现实世界的索赔数据。 其他RCTs的替代方案 观察到的无控制模型的键绩效指标(KPI) 对一段时间内观察到的KPI进行跟踪和分析的模型,而不试图隔离特定变量对性能的影响.一个直截了当但仅停留在表面的绩效趋势和结果的观点,但不推荐用于公共报告. 焦点小组试验 组织与一组选定利益相关者的讨论,以收集详细信息,观点,以及关于特定项目的态度.一种灵活的、交互式的方法,相对容易管理,但易于偏见。 假设干预影响模型 基于从研究中得出的假设,预测分析程序理论上如何影响某些结果,专家意见,并且统计框架。用于估计尚未实施或无法直接测试的潜在项目政策变化的影响。 选择偏倚代表了研究中的个体或群体与研究目标人群系统性地存在差异的问题。这种偏倚可以通过多种方式引入,包括但不限于研究自我选择 (如上所述)、研究招募方法、提供者相关或其他决策者选择、地理选择以及其他测量和未测量的临床差异。关于观察性研究中的自我选择,主要关注点是选择参与项目(参与者)的合格成员与其他因素(如改变行为的动机)也影响结果的选择不参与或不参加项目的合格成员之间存在差异。为减轻选择偏倚,一项研究可以将提供干预措施的所有合格成员的群体与未提供干预措施且具有相似资格的成员的群体进行比较。 1.royall,r.m.(1991年2月).随机临床试验中的伦理与统计学.统计学杂志6(1)52-62.来自(2024年11月5日检索) https://doi.org/10.1214/ss/11770119342.纳尔迪尼,C.(2014年1月16日).临床试验的伦理学.Ecancermedicalscience;8:387.doi:10.3332/ecancer.2014.387.PMID:24482672;PMCID:PMC3894239. 也可以使用匹配过程来确保治疗组和对照组除了符合研究资格标准外,还共享相似的特征,这些特征可能与研究结果相关(例如,人口统计学特征和/或前瞻性风险评分)。在设计研究中的这些组(也就是说,符合干预措施资格的个人与符合相同资格标准的对照组)时,有各种数据来源可用于对照组。例如,可以使用基于大型保险理赔的数据资产来形成对照组数据,除非资格标准基于无法仅使用理赔数据合理估算的指标。 除了偏差之外,观察性匹配队列研究还必须考虑其他因素。从根本上说,这些研究需要对统计技术有深入的理解和应用。匹配程序可能很复杂,必须仔细设计,要考虑整体研究目标、识别和考虑每个潜在的混杂变量,以及所选匹配变量的可用性和收集方法。研究结果可能非常技术化,并且可能难以向没有扎实统计学基础的人传达。同时也要考虑,来自设计良好的研究的统计显著结果可能不一定能转化为临床适用的结果。在评估观察性研究设计产生的研究结果时,临床相关性和预期研究目标生物学上的合理性是需要考虑的重要方面。 此外,两组的样本量应足够大,以检测假设由治疗产生的结果中的统计显著差异。由于结果的波动水平不同,样本量可能对某些指标足以测量统计显著差异,但对其他指标则不足。主要和次要结果指标,如死亡率、护理成本、医院再入院率以及可避免的急诊室(ER)就诊次数,可能被用作衡量项目有效性的一个途径。 为促进透明度并增加信任,组织也可以包含任何统计上显著的负面影响。展示项目影响的完整图景至关重要;例如,一个项目可能会以减少急诊科就诊次数为代价,换取增加初级保健诊所就诊次数或更强的药物依从性,但这需要额外的药店支出。 进行有效性研究的其他考虑因素 特定程序成本 与被衡量效果的项目相关联的广泛成本应在总体项目影响估算中予以考虑,包括: □与提供治疗或干预相关的费用 □程序设置费用 □合作承包成本 □提供者/会员磨损的影响 机会成本 □不论某些项目的财务可行性或成本节约,患者、提供者和付款人已经期待着某些服务或护理管理产品 □组织中其他照护项目的成员参与损失 统计含义 □因果干扰取决于方法,研究结果可能被与其他干预措施、解决方案和事件相互作用所混淆。这可能使组织确定真实项目影响的能力复杂化。 □均值回归这是一个现象,当由于测量与一个急性事件发生期间的差异,程序的影响在第一次测量时非常极端,但随后的测量往往更接近于人群平均值。这是有效性研究中一个常见的问题,应该仔细考虑并加以说明。在关键结果变量的基线水平上匹配研究和控制人群可能有助于避免均值回归。 数据可用性 □有些医疗组织正处于其项目的早期建设阶段,可用的数据有限,只有自我选择治疗组的数据,或者只有几类医疗服务的数据 。 □在这些情况下,重点应放在以下方面: –开发一个可在更多患者数据变得可用时再次评估的程序性能评估框架。 –对目标人群进行基准测试,对于那些至少有一些相关数据的组织,将其与一套稳健的基于声明的基准进行比较。 □在某些情况下,可能可以通过基于市场基准数据,与对照群体进行匹配和比较,来进行成果研究,如上所述。 其他因素 不可抗力事件,如大流行病或其他外部力量,可能给结果带来无法避免的异常。 案例研究 使用观察性匹配队列研究来确定项目的投资回报率客户 一家专注于患者健康的国家级虚拟医疗公司(在本案例研究中称为“WellnessHealth”),涵盖肥胖、糖尿病和高血压等慢性病。 目标 为进行一项有效性研究,测量在WellnessHealth护理模式下的群体与由WellnessHealth未管理的雇主群体混合组成的对照组之间在支出和使用方面的变化。最终结果旨在支持WellnessHealth项目的投资回报率计算。 方法 米尔曼计算了WellnessHealth客户群体从基线期(即成为WellnessHealth客户前的时期)到后期(即成为WellnessHealth客户后的时期)在支出和使用方面的变化。这些变化与一个对照组进行了比较,该对照组由来自参考数据集的雇主群体索赔组成,通常使用除WellnessHealth以外的干预措施。WellnessHealth的分析基于所有符合获得WellnessHealth干预措施资格标准的成员(即不仅限于使用干预措施的成员)。对照组也仅限于符合相同资格标准但未获得干预措施的成员。WellnessHealth人群中的每个成员都根据与研究结果预期相关的额外标准(例如,风险评分)与一个对照组成员进行匹配。此外,我们的分析还依赖于WellnessHealth项目的其他临床和财务结果,以估算潜在节约,并最终计算相对于项目费用的投资回报率。 结果 米尔曼的分析重点关注满足全健康护理计划资格标准的患者