您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[世界银行]:构建可比较的全球贫困趋势(英) - 发现报告

构建可比较的全球贫困趋势(英)

建筑建材2025-07-06世界银行心***
AI智能总结
查看更多
构建可比较的全球贫困趋势(英)

2025年6月 全球贫困监测技术说明 45摘要全球贫困监测技术说明系列出版简短论文,记录世界银行全球贫困估计的方法论方面。这些论文载有作者姓名,并应相应引用。本文表达的调查结果、解释和结论完全是作者的。它们不一定代表国际复兴开发银行/世界银行及其附属机构或其代表的执行董事或政府的观点。全球贫困监测技术说明可在https://pip.worldbank.org/publication.所有作者均来自世界银行。通讯作者:Daniel Gerszon Mahler (dmahler@worldbank.org). 作者感谢全球贫困监测工作组提供的反馈。作者感谢英国政府通过“解决极端贫困的数据与证据”(DEEP)研究计划提供的资金支持。国家经常由于其数据收集和问卷设计的改变而修订其收入或消费的衡量方式。这些改变在贫困趋势随时间变化的过程中造成了可比性问题。本文提出了三种方法来创建全球、区域和国家层面的贫困趋势,以使国家内部的趋势具有纵向可比性。这是通过使用国民账户增长来衔接不可比序列来实现的。考虑到可比性断裂会造成某些国家层面贫困趋势的巨大差异,但这些可比的贫困序列构建的全球极端贫困趋势基本上保持不变。 1. 简介数据收集和问卷设计指南随时间推移发生了变化,因为更多关于各种测量方法的准确性和偏差的信息被揭露出来,以及各国消费模式发生了变化(Deaton and Grosh 2000, Deaton and Zaidi 2002,Mancini and Vecchi 2022)。为了确保家庭调查处于贫困测量的前沿,基础的数据收集和问卷设计偶尔需要重新审视。尽管这能创造更可靠的贫困估计,但也导致估计的贫困率出现可比性问题。有时,由于调查设计和消费综合体的构建发生变化,测量的消费增加了50%以上,如果不考虑这一点,就会使使用固定贫困线的贫困趋势出现偏差(Mahler et al. 2024)。在低收入和中收入国家,货币贫困是通过对代表性样本的家庭进行调查收集数据来衡量的,这些调查引出的是一个国家中家庭收入或消费模式。如果一个家庭的收入或消费低于给定的贫困线,该家庭就被归类为贫困者。大量研究表明,家庭调查的设计会影响收集的数据、测量的收入或消费,并因此也影响测量的贫困率(Beegle等人2012年,De Weerdt等人2020年,Jolliffe2001年,Friedman等人2017年,Kilic等人2019年)。例如,在衡量食物消费时,询问家庭是否记录消费日记或回忆消费很重要。在后一种情况下,是回忆过去七天还是30天的消费很重要。对于食品和非食品消费,引出的消费类别如何细分也很重要,例如,询问家庭是报告大米消费总量,还是分别报告糙米和白米。因此,替代性调查工具引入的系统差异意味着,根据一种设计产生的福利和贫困指标不能直接与根据另一种设计产生的指标进行比较。在这篇论文中,我们提出了三种方法来解决这个问题:国家内部随着时间的推移,消费测量标准无法进行比较。这些方法利用国民账户数据的增长来弥补可比性问题,并利用不同程度的信息来自较旧设计的调查。我们将这些方法应用于世界银行在贫困与不平等平台(PIP)中发布的全球贫困数据,以阐明贫困趋势是否对消费测量方式的不同具有稳健性。我们发现许多国家出现了巨大变化,但在区域和全球层面上,变化相对较小。当在区域和全球层面出现变化时,它们通常反映了那些极有可能是不切实际的趋势的修正。对于单个国家,解决这个问题的方法广为人知且经常应用,包括预测在没有改变问卷设计的情况下消费分布的跨调查插补(Dang等,2017年,Dang等,2019年,Mathiassen和Wold,2021年,Roy和Van der Weide,2025年),或在新调查中对子样本收集旧消费总和的桥接调查。然而,问题超出了单个国家。要了解全球和按地区的贫困是如何演变的,这些方法无法一致地应用。因此,在衡量全球贫困时,这个问题最常被忽视。 1 22. 数据3. 方法我们开发了三种方法来生成国家内部随时间变化的可比序列,这些方法的不同之处在于它们利用了多少过去调查的信息。在阐述它们的构建方式之前,总结一下PIP目前如何进行福利总额的插值和外推是有用的。这是为了创建一个全球贫困估计,该估计需要对每个国家每年进行贫困估计,即使在某一特定年份没有进行家庭调查也是如此。本文其余部分组织如下:第二节简要概述了我们使用的数据,第三节详细介绍了方法,第四节包含结果,第五节总结。我们使用世界银行贫困和不平等平台(PIP)2025年6月版的数据,其中包含172个国家的超过2,500个贫困估计值。这些福利向量以2021年购买力平价(PPP)美元表示。在分析贫困趋势时,我们将主要使用每天3.00美元(2021年PPP)的极端贫困线(Foster ⓡ al. 2025)。超越最新福利总额,PIP外推福利向量向前,假设福利随着人均实际GDP或人均实际HFCE增长。人均GDP用于低收入和下中等收入国家(LICs和LMICs),而人均HFCE用于上中等和高收入国家(UMICs和HICs)。对于消费向量,它将增长打折扣30%,这样只有70%传递到家庭调查中观察到的增长率,反映了剩余的部分很可能被储蓄。这种增长以中性分配的方式应用,这意味着在推断期间不平等保持不变。在第一个数据点之前,采用了类似的方法向回推断。更多细节和这些选择的理由在Mahler和Newhouse(2024)中呈现。pip包含了关于一个国家内部消费和收入总是否可比较的信息。除非数据收集、调查方法或福利总构建发生已知且重大的变化,否则假设随着时间的推移,贫困估计是可比较的。可比性评估依赖于国家,并依赖于过去和目前世界银行工作人员积累的知识,以及与国家数据生产者的密切对话。可比性指标是二元的,这意味着要么两个调查是可比的,要么不可比。在实践中,可比性不是二元的,而应该理解为一个从完全可比到不可比的谱系。我们也使用国民账户数据,特别是人均GDP序列或人均家庭最终消费支出(HFCE)。这两个序列都来自世界发展指标。 3表1:三种方法构建可比序列所使用的信息注意:所有更改均指对分布和均值的更改。序列变化ABCPIP最新可比全部使用使用使用使用全部不要使用使用使用使用旧可比使用不要使用使用使用分布式的不要使用不要使用不可比较均值不要使用 不要使用我们所发展的三种方法都以不同的方式应用了这些外推和内插规则。我们称它们为方法A、B和C,并且随着我们详细说明并在表1中总结的那样,它们越来越多地利用了过去调查中可获得的信息。在整个过程中,我们将以越南的案例为例,说明和可视化三种方法是如何运作的。目前,我们忽略了这样一个事实,即一些国家既有收入总括指标又有消费总括指标,这使问题变得复杂,并描述了仅提供收入或消费总括指标的案例。两者都提供的情况将在第3.1节中讨论。对于所有三种方法,我们的出发点是每个国家最新可比的福利总量序列。对于某些国家,这可能是一个单一的福利总量,如果这个总量与该国的任何先前估计不可比。最新可比序列是我们当然想要使用的,因为它反映了衡量各国收入或消费的最最近和通常最高质量的标准。该序列使用PIP的默认外推方法外推到2024年,是我们所有方法共有的,也是PIP当前数字共有的。使用这些信息意味着我们得出的可比序列在最新年份与PIP在国家层面、区域层面和全球层面的序列保持一致。1方法A不使用最新可比序列之前的任何信息。在此最新可比序列开始之前,它使用 PIP 的外推规则将福利向量向时间回推(或更有可能向时间回缩)。这意味着,在最新可比序列中的第一次调查之前,假设不平等状况保持不变。这一假设背后的1对于同时具有收入和消费总体的国家,存在一些例外情况。正如我们在3.1节中概述的,对于少数情况,我们将最新估计从消费改为收入,或反之,这意味着近年来全球和地区贫困率并不完全重叠。这涉及阿尔巴尼亚、科索沃和菲律宾。PIP插值在两个调查的福利总量之间,无论它们是否可比。根据国民账户增长(低收入国家人均真实GDP、中等低收入国家人均真实GDP、中等收入国家人均真实最终消费支出、高收入国家人均真实最终消费支出)与福利增长是否同号,存在两种插值方法。直观地看,这两种方法都逐渐给后一个调查数据点赋予更大权重,并使用国民账户增长率来影响福利变化的速率。具体方法在World Bank (2025)中有描述。 401+𝑔𝑤𝑒𝑙𝑓,𝑝,𝑡0,𝑡1,这种方法是,任何使用与最新可比序列不同的福利总量收集的信息都反映了不同的福利概念,这是当前福利测量方法的微弱信号。保持不平等不变的一个理由可能是预测不平等的变化非常具有挑战性(Mahler等人,2022年)。具体地,考虑一个在t和t之间存在一个古老的可比序列的国家,及其最01近期푡与푡之间的可比序列(从而也导致一个不可比序列)23在푡和푡之间).设푤푒푙푓为调查的福利分布(或来自PIP的)12 t外推和内插(如果没有调查估计)在时间 푡 和 푔be theB A, t, ti j两个时间段之间的国民账户的passthrough调整增长。然后,福利̂FNeilF由方法A估计的聚合,푤푒푙푓,等于 푤푒푙푓 对于 푖 ≥ 2和t^2for i < 2.A,ttii 1+gB A, t, t^2 i方法B与方法A的不同之处在于,该方法利用了来自旧可比福利向量的增长和分配变化。这些旧的福利向量可能质量较差,但该方法认为,与使用PIP的推断规则相比(即,与假设国民账户中没有分配变化和增长相比),来自旧的福利向量的增长和分配变化在期望上能更好地捕捉到如果使用最新方法本应测量的结果。为了连接不可比序列,它像方法A一样使用PIP的推断规则。继续前面的例子,方法B从푡起将与方法A相同1̂̂从那时起,即 푤푒푙푓 = 푤푒푙푓 对于 푖 ≥ 1。然而,在 푡 之前,它会使用调查-B,tA,t 1ii基于 푡 和 푡 之间的增长发生率。与方法A相反,这意味着方法01B 允许在最新可比序列之前进行分布变化。具体地,将这两次调查之间的第 푝 百分位的匿名增长记为 푔. 然后,牛顿,p,t,t0 1̂̂FNeilF第푝百分位在푡的福利将由푤푒푙푓给出=B, p, t1.0B, p, t越南提供了一个有趣的案例,说明这种方法是如何运作的。越南尤其具有代表性,因为PIP的估计值与我们得出的可比序列之间存在显著差异。越南拥有2010-2022年期间最新的可比消费数据,这意味着从2010年起,方法A给出的均值、不平等率和贫困率与PIP相同(图1)。然而,在2008年至2010年期间,消费的衡量方式发生了变化。2010-2022年的序列包括估算租金和耐用品(以及其他变化),而截至2008年的序列则不包括,这导致从2010年起测算的福利机械性增加(世界银行,2022年)。如果忽略这一点,就会导致2008-2010年的贫困率从17.6%下降到5.2%。方法A忽略了2010年以前的调查数据,而是使用国民账户增长来向后预测福利向量。2008年国民账户向后外推的贫困率为6.4%,远低于调查估计值,这反映了2008-2010年贫困的部分下降很可能是由可比性中断所引起的。 5根据前面的假设例子,从푡开始,方法C将与方法A和B相同。对于푡,它使用当时的调查分布,但将分布重新缩放21与国民账户中本应增长的均值相匹配。也就是说,在越南,方法A和方法B在2008-10年期间相似,其中趋势是根据国民账户增长率计算的,同时保持不平等程度不变。在2008年之前,它们出现分歧,因为可比的福利数据在2002-2008年期间可用,方法B使用了这些数据。2002-2008年的数据显示的福利增长高于国民账户的传递调整增长,而调查数据表明不平等程度在2002-2008年有所下降,而不是保持不变。这表明,方法B在2002年建议的贫困程度高于方法A(方法A在2002年具有较低的不平等程度和更高的平均值)。方法C与方法B相同,但它利用了过往调查的一个更多方面。它假设分布变化之间不可比序列,尽管部分反映了数据收集、福利总量构建等方面的方法论变化