您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [世界银行]:CLARE:一种用于弹性估计的因果机器学习方法(英) - 发现报告

CLARE:一种用于弹性估计的因果机器学习方法(英)

文化传媒 2026-01-01 世界银行 乐
报告封面

政策研究工作论文 CLARE 一种用于韧性估计的因果机器学习方法 塔利普·基利奇 马可·莱塔 皮耶鲁吉·蒙塔兰博诺 菲德丽卡·佩鲁切利 政策研究工作论文 11292 摘要 本文提出了一种新的韧性指数,CLARE(基于因果机器学习方法的韧性评估方法),该方法基于影响评估框架,并将其应用于纵向家庭调查数据中的因果机器学习算法。该指标具有模型无关性、数据驱动、可扩展性,并以福祉阈值为规范基础,并且可以是针对特定冲击的韧性指标或通用的韧性度量。本文提供了构建CLARE韧性指数的经验证明,利用了来自马拉维、尼日利亚、坦桑尼亚和乌干达国家统计局在2009-20年间与世界银行生活水平测量研究合作实施的19项全国代表性纵向多主题调查的超过28000个家庭观测数据。尽管本文主要集中于衡量对干旱的韧性,但所提出的指数适用于任何类型的冲击。分析显示 它表明 CLARE 在预测食物不安全方面的表现优于现有的韧性指标和替代方法,无论是未来(动态预测)还是对未参与的国家(横截面预测)。该指数可以被分解,以便因果地识别能够使人口免受冲击的韧性能力的相对重要性。因此,它可以在设计、定位和监测旨在加强韧性的政策和投资中得到应用。CLARE 的部署——配合对国家纵向调查平台的持续投资——可以提升预警系统和韧性建设干预措施的有效性,同时允许将韧性政策建议从数据丰富的环境转移到数据匮乏的环境,这些环境可能无法立即提供指数估计所需的纵向调查数据。 本文是发展数据组、发展经济学部门的产品。它是世界银行更大努力的一部分,旨在向公众开放其研究成果,并为全球发展政策讨论做出贡献。政策研究报告也发布在 http://www.worldbank.org/prwp 上。作者可通过 tkilic@worldbank.org 和 marco.letta@uniroma1.it 联系。本论文的验证可重复性包可在 http://reproducibility.worldbank.org 提供,点击这里用于直接访问。 政策研究工作论文系列发布工作进行中的研究成果,以促进关于发展问题的思想交流。该系列的目的是尽快发布研究成果,即使展示的内容不够完善。论文署有作者姓名,应相应引用。本文表达的研究成果、解释和结论完全是作者的观点。它们不一定代表国际复兴开发银行/世界银行及其附属机构的观点,也不一定代表世界银行的执行董事或他们所代表的政府。 塔利普·基利奇‡, 马可·莱塔§, 彼埃鲁吉·蒙塔尔巴诺§, 费德里卡·佩特鲁切利§1 JEL分类号:C31;O12;O15。 关键词韧性;因果机器学习;纵向家庭调查,影响评估;预测分析;政策瞄准。 1. 简介 在多重危机时代,识别最需要韧性建设干预的主体至关重要。有效瞄准和评估这些干预措施的基本要求包括韧性指标的规模可扩展性、它们明确地与影响福祉的众多冲击和压力源挂钩,以及所采用的韧性措施与它们旨在反映的福祉结果之间的契合度。换句话说,韧性指标应能准确预测样本外(out-of-sample)的福祉指标。我们所说的“样本外预测”(out-of-sample prediction)是指韧性指标在应用于先前未见数据时,能正确识别福祉结果的能力。这些数据可以是与其他家庭、地区或国家在同一时间点参考的相关数据,也可以是未来时间段的新的数据。然而,现有的韧性措施往往缺乏可扩展性,没有明确地与冲击挂钩,并且在预测样本外的福祉结果方面,其能力最多也就是一般(Upton等,2022)。随着韧性概念被越来越多的捐助者、机构和国际组织所接受,并正在塑造人道主义和发展议程(Béné等,2017),这些问题转化为对日益扩大的以韧性为导向的干预措施的重大政策障碍。事实上,政策讨论日益强调,气候韧性——作为更广泛韧性议程的一个突出维度——不仅受限于资源有限,也受制于薄弱的测量体系,该体系无法识别人们是否具有韧性、面对何种冲击以及通过何种渠道。例如,世界银行最近的工作强调,追踪韧性仍然有限,并且为了在韧性建设政策中进行瞄准和学习,需要更好、更与决策相关的指标(Shilpi等,2025)。 我们通过利用机器学习(ML)算法来构建一种新的家庭韧性指标。这些算法擅长于预测样本外数据,并且被设计用来解决预测政策问题(Kleinberg等人,2015年;Athey & Imbens,2019年)。然而,我们不仅仅依赖于预测性的机器学习技术,这些技术现在已成为实证经济学家计量经济学工具箱中的标准工具。我们的方法结合了因果机器学习(Wager & Athey,2018年;Chernozhukov等人,2018年;Chernozhukov等人,2024年)的最新创新,通过采用最先进的机器学习算法,这些算法专门用于预测异质性因果效应,而不是结果。我们指标构建背后的原理——标记为CLARE(一个表征因果机器学习方法用于韧性估计的缩写)——是简单的。CLARE是对专业文献中常见识别的标准化的韧性子成分的简单加权平均,在0-100尺度上归一化以方便解释,并通过对超过规范福祉概率进行重新缩放。 冲击下的阈值。2新颖之处在于使用因果机器学习来构建一个数据驱动的权重方案,用于聚合韧性组件,这些韧性组件源自于福祉、冲击和韧性驱动因素之间潜在因果关系的反事实评估。因此,CLARE基于一种使用非线性估计权重的线性聚合方法,从而在复杂性和可解释性之间取得平衡。通过这种方式,CLARE 解决了将不同的韧性子分量可信地聚合为一个韧性综合指标的挑战性问题。虽然综合指标提供了对所研究现象的综合和全面的理解,特别是对于韧性这样的潜在变量,但它们也使得难以确定每个成分的具体作用和权重。在聚合过程中普遍采用且通常是随意假定相等权重或做出其他主观选择的做法——通常是为了简化——带来了重大的方法论和实践挑战。这些挑战包括与现实世界数据生成过程的复杂性不一致,以及对政策定位的潜在威胁,政策定位经常依赖综合指标来指导优先级排序和资源分配。 这就是我们的因果机器学习方法发挥作用的地方:我们用它来为每个韧性子组件推导重要性权重,以中介因果关系在兴趣的冲击与旨在被弹性能力所衡量的结果之间。因此,整个因果机器学习程序的主要目的是进行福祉结果、协变量冲击和中介变量之间关系的事前反事实估计。这种估计最终会为CLARE中包含的每个韧性子组件产生凸性聚合权重,以及冲击下高于给定规范性福祉门槛(例如,粮食不安全)的样本外概率。然后,最终指数在家庭层面作为所有子组件的加权平均值计算,聚合权重(非负且总和为1)根据从数据中学习的因果模式确定,并通过家庭在冲击下粮食安全的特定概率进行缩放。这种方法与合成控制法中为构建处理后单元结果的反事实演变而对捐赠池中的控制单元进行重新加权有些相似(Abadie等人,2010)。 重要的是,虽然在我们的示例应用中我们展示了如何使用特定技术——因果森林(Athey等人,2019年;Wager和Athey,2018年)来计算CLARE,但CLARE并不局限于任何特定方法。只要所选方法能够估计粒状和异质的治疗效应,并能够建立异质性驱动因素之间的客观层次,任何因果机器学习技术都可以被用于识别潜在的因果关系。同样,'变量重要性'的定义也可能因所采用的方法和重要性排序方法的不同而有所差异(例如,SHAP值、排列特征重要性)。因此,尽管CLARE基于因果机器学习技术家族中的一种方法的运用,但它却是模型无关的。 尽管CLARE以数据驱动为基础,但它并非黑箱。首先,对潜在因果关系的识别完全根植于潜在结果框架(Imbens & Rubin, 2015)。其次,虽然CLARE对于各个子组成部分在缓冲冲击影响方面的相对重要性保持中立,但纳入估计过程的子组成部分——即所谓的“处理效应调节器”(Athey & Imbens, 2016)——完全依赖于关于家庭韧性主要驱动因素和决定因素的前期研究(Upton et al., 2022)。与此同时,CLARE的灵活性使其能够在捕捉韧性所有相关维度全面表征与识别稳健样本外预测所需的最小变量集之间的权衡中取得平衡。这使它即使在数据收集困难、昂贵或两者都存在的情况下,也能进行干预措施的精准定位,并做出优先选择。因此,我们指标的建设并未牺牲透明度和可解释性。 在这个以冲击为重点的韧性建模框架中,冲击起着核心作用,CLARE的估计完全围绕并将冲击从一开始就纳入分析中,解释了每个分析的韧性子组件在决定冲击的异质性效应中发挥的保护作用。3因此,CLARE得分可以被解释为“确保压力和冲击不会产生长期不利发展后果的能力”(Constas等人,2014年)。在本文中,我们应用该方法来构建一个指标干旱韧性, 以干旱作为关键冲击,以粮食安全作为结果。我们还讨论并展示如何在CLARE框架中结合多种冲击,并估计一个“通用型”韧性指标。更普遍地,CLARE可以适应任何影响福祉的冲击和任何福祉结果。 这种多功能性以及对冲击的明确锚定与现有指标相比是新颖的,这源于一个事实,即以核心而言,CLARE是基于影响评估思维的,这方面我们与其他关于韧性的近期研究(Alloush & Carter, 2024)有共鸣。 CLARE的一个重要特征是其可扩展性:一旦使用因果机器学习估计了权重和条件概率,在冲击、结果和韧性子成分之间关系所依据的数据生成过程中的稳定性或不变性假设下,对新数据计算指标就变得简单直接。只需在冲击情景下,对样本外预测超过或低于规范阈值的概率,并将新的韧性子成分值代入,使用预计算的权重计算其加权平均值即可。关键点在于,当从另一个区域(甚至国家)计算新数据的指标时(因此旨在进行横截面预测),用户必须假设各种成分的相对重要性权重保持不变。使用机器学习算法对保留的测试数据进行预测可以提供关于这一假设可信度的间接证据。例如,在一个国家集合上训练的模型在由来自未见国家的观察值组成的测试集上表现良好,将表明不存在分布偏移,模型能够很好地泛化到新数据,因此可以用于迁移学习。类似地,如果新数据代表未来数据点(预测),假设是福祉结果、冲击和条件变量之间的关系随时间保持稳定。重要性权重的稳定性也可以通过后续章节中我们展示的方法进行实证评估。 在这些假设下,CLARE可应用于数据稀缺的环境中的迁移学习,这些环境只有横截面数据可用;或者用于预测目的,旨在为易受冲击地区的脆弱家庭(或更综合的单位)实施危机准备和预警机制。4此外,估算数据驱动权重能够建立韧性组成部分之间的客观层次。这反过来又为机构和政策制定者提供了机会,从成本效益的角度出发,优先考虑最重要的可靶向家庭特征,这些特征将在给定的情境中产生最大的整体韧性能力提升。 这项工作属于发展韧性文献中的定量研究。具体而言,我们借鉴了Upton等人(2022年)建立的方法论框架——尽管在不同的背景下 以关注脆弱性为重点,Doan等人(2023)—构建和测试我们的韧性指标,使用全国代表性、多主题纵向上世界银行生活标准测量研究(LSMS)的家户调查数据。这些数据集因其对构建韧性指标至关重要的关键属性而被选中,包括其纵向结构、多主题覆盖、数据协调以及地理参考数据收集,这些数据允许与关于气候、冲突和环境的地理空间数据进行整合,从而提供冲击暴露的客观度量。具体而言,我们分析了来自四个撒哈拉以南非洲国家:马拉维、尼日利亚、坦桑尼亚和乌干达的纵向调查数据,这些国家目前都将韧性作为主要的政策议题。该数据集比先前在专业文献中使用的那些数据集要大得多,在外部效度方面为我们的研究结果提供了比较优势。我们的结果表明,CLARE表现出良好的样本外性能,无论是在预测保留国家(跨截面预测)的数据中的粮食不安全,还是在预测未来时期被遗漏观测值(动态预测)的粮食不安全方面。在这些任务中,CLARE始终优于Upton等人(2022)研究中表现最佳的韧性指标——即基于Cissé和Barrett(2018)条件矩方法得出的经验参数化规范——以及其他现有的韧性指标和替代估计方法。CLARE的更好表现可能归因于因果机器学习工具的能力,这些工具能够灵活地捕捉协变量冲击对福祉的影响中的家户层面异质性,这是由