AI智能总结
2025年6月 全球贫困监测技术笔记45摘要全球贫困监测技术简报系列发布简短论文,记录世界银行全球贫困估计的方法论方面。论文署有作者姓名,应注意引用。本文表达的观点、解释和结论完全是作者的观点。它们不一定代表世界银行/国际复兴开发银行及其附属机构,或世界银行的执行董事或他们所代表政府的观点。全球贫困监测技术简报可在https://pip.worldbank.org/publication.所有作者均来自世界银行。通讯作者:丹尼尔·格兹森·马勒(dmahler@worldbank.org). 作者感谢全球贫困监测工作组的反馈。作者衷心感谢英国政府通过极端贫困应对数据与证据研究计划(DEEP)提供的资金支持。国家由于数据收集和问卷设计的改变而频繁修订收入或消费的衡量方式。这些变化导致贫困趋势随时间推移出现可比性断裂。本文发展了三种方法来创建在全球、区域和国家层面可比的贫困趋势,即在时间内部可比的贫困趋势。它通过使用国民账户增长来连接不可比的序列来实现这一点。考虑可比性断裂在一些国家层面的贫困趋势上造成了巨大差异,但由这些可比贫困序列构建的全球极端贫困趋势基本保持不变。 1. 简介关于数据收集和问卷设计指南随着时间的推移发生了变化,随着更多关于各种测量方法的准确性和偏差的信息被揭露,以及随着各国消费模式的变化(Deaton and Grosh 2000,Deaton and Zaidi 2002,Mancini and Vecchi 2022)。为了确保家庭调查处于贫困测量的前沿,基础数据收集和问卷设计有时需要重新审视。虽然这创造了更可靠的贫困估计,但也导致了估计贫困率的可比性中断。有时,由于调查设计和消费综合体的变化,测量的消费增加了超过50%,如果不加以考虑,就会扭曲使用固定贫困线的贫困趋势(Mahler等人 2024)。在低收入和中等收入国家,货币贫困是通过家庭调查的数据来衡量的,这些调查收集了一个国家有代表性样本家庭的收入或消费模式。如果一户家庭的收入或消费低于给定的贫困线,该家庭就被归类为贫困。许多研究表明,家庭调查的设计会影响收集的数据、测量的收入或消费,因此也影响测量的贫困率(Beegle 等人 2012 年,De Weerdt 等人 2020 年,Jolliffe 2001 年,Friedman 等人 2017 年,Kilic 等人 2019 年)。例如,在衡量食物消费时,重要的是是询问家庭记录他们的消费日记还是回忆他们的消费。在后一种情况下,重要的是询问他们回忆过去七天还是 30 天的消费。对于食物和非食物消费,收集到的消费类别的分解程度很重要,例如,询问家庭是报告他们的大米消费总量,还是分别报告糙米和白米的消费。因此,不同调查工具引入的系统差异意味着根据一种设计产生的福利和贫困指标与根据另一种设计产生的指标不能直接比较。在本文中,我们提出了三种方法来应对国家内部随时间推移的消费衡量不可比性问题。这些方法利用国民账户数据增长来弥补可比性断裂,并使用不同程度的旧式设计调查的信息。我们将这些方法应用于世界银行在贫困与不平等平台(PIP)中的全球贫困数据,以阐明贫困趋势是否对消费衡量方式的不同具有稳健性。我们发现许多国家发生了巨大变化,但在区域和全球层面上的变化相对较小。当在区域和全球层面出现变化时,它们通常反映了非常可能是不切实际的趋势修正。对于单个国家,解决该问题的方法已被广泛知晓并经常应用,包括调查间插补,这种方法预测若问卷设计未发生变化时的消费分布(Dang等人,2017年,Dang等人,2019年,Mathiassen和Wold,2021年,Roy和Van der Weide,2025年),或者桥梁调查,这种方法在更新的调查中对子样本收集旧的消费总量。然而,该问题已超越单个国家。为了理解全球及区域贫困的演变情况,这类方法无法得到一贯的应用。因此,在衡量全球贫困时,该问题通常被忽略。 1 22. 数据3. 方法我们开发了三种方法来生成国家内部随时间变化的可比序列,这些方法的不同之处在于它们利用了多少来自过去调查的信息。在阐述它们是如何构建之前,总结PIP目前如何在福利总额之间进行外推和插值是很有用的。这是为了创建一个全球贫困估计,该估计需要对每个国家的每年贫困情况进行估计,即使在某一年没有进行家庭调查也是如此。本文其余部分组织如下。第二节简要概述了我们所使用的数据,第三节详细介绍了方法,第四节包含结果,第五节总结。我们使用世界银行贫困和不平等平台(PIP)2025年6月版的数据,其中包含172个国家的超过2,500个贫困估计值。这些福利向量以2021年购买力平价(PPP)美元表示。在分析贫困趋势时,我们将主要使用每天3.00美元(2021年PPP)的极端贫困线(Foster ⓡ al. 2025)。超出最新福利总额,PIP外推福利向量向前,假设福利与人均实际GDP或人均实际HFCE增长。人均GDP用于低收入和下中等收入国家(LICs和LMICs),而人均HFCE用于上中等和高收入国家(UMICs和HICs)。对于消费向量,它会将增长打折30%,使得只有70%会传递到家庭调查中观察到的增长率,反映了剩余部分可能被储蓄。这种增长以分布中性的方式应用,这意味着在推断期不平等程度保持不变。在第一个数据点之前采用了类似方法以向后推断。更多细节和这些选择的理由在Mahler和Newhouse (2024)中有阐述。PIP包含了关于一个国家内部的消费和收入总量是否可以相互比较的信息。除非数据收集、调查方法或福利总量构建存在已知且重大的变化,否则假定随时间的贫困估计是可以比较的。可比性评估是依赖国家的,并依赖于过去和现任世界银行工作人员的积累的知识,以及与国家数据生产者的密切对话。可比性指标是二元的,这意味着要么两个调查是可比的,要么不可比。在实践中,可比性从来不是二元的,而应该被理解为从完全可比到不可比的一个光谱。我们还使用国民账户数据,特别是人均GDP或人均家庭最终消费支出(HFCE)系列。这两个系列都来自世界发展指标。 3表1:三种方法构建可比序列所使用的信息注意:所有更改均指分布和均值的更改。序列更改ABCPIP最新可比全部使用使用使用使用全部不要使用使用使用使用旧可比较使用不要使用使用使用分布式的不要使用不要使用不可比较均值不要使用 不要使用我们所提出的这三种方法都以不同的方式利用了这些外推和内插规则。我们称它们为方法A、B和C,并且随着我们详细阐述并在表1中总结,它们越来越多地利用过去调查中可用的更多信息。在整个过程中,我们将以越南为例来说明和可视化这三种方法的工作原理。目前,我们忽略了有些国家既有收入总括数据又有消费总括数据这一事实,这会使问题复杂化,而是描述了只有收入或消费总括数据可用的情况。这两种数据都可用的情况将在第3.1节中讨论。对于所有三种方法,我们的起点是每个国家最新的可比福利总量序列。对于某些国家,这可能是一个单一的福利总量,如果这个总量与该国家的任何先前估计都不可比。最新的可比序列是我们当然想要使用的,因为它反映了每个国家衡量收入或消费时所使用的最新且通常质量最高的标准。这个序列使用PIP的默认外推方法外推至2024年,是我们所有方法的共同点,也是PIP当前数字的共同点。使用这些信息意味着我们推导出的可比序列与PIP在国家层面、区域层面和全球层面的最新序列保持一致。1方法一不使用最新可比序列之前的任何信息。在最新可比序列开始之前,它使用 PIP 的外推规则将福利向量向后推时间(或更可能的是缩小)。这意味着在最新可比序列中的第一次调查之前,假设不平等保持不变。这一假设背后的1对于同时具有收入和消费总量的国家,存在一些例外情况。正如我们在第3.1节中概述的,在少数情况下,我们将最新估计从消费更改为收入,反之亦然,这意味着近年来的全球和地区贫困率并不完全重叠。这涉及到阿尔巴尼亚、科索沃和菲律宾。PIP内插在两个调查的福利总量之间,无论它们是否可以比较。有两种插值方法,取决于国民帐户(低收入国家的实际人均GDP和中等收入国家的实际人均GDP,中等收入国家的实际人均家庭最终消费支出和高中收入国家的实际人均家庭最终消费支出)的增长与福利增长是否具有相同的符号。直观上,这两种方法都会逐渐给予后者调查数据点更大的权重,并使用国民帐户的增长率来影响福利变化的速率。具体方法在世界银行(2025)中有描述。 401+𝑔𝑤𝑒𝑙𝑓,𝑝,𝑡0,𝑡1,该方法认为,使用与最新可比较序列不同的福利总量收集到的任何信息都反映了不同的福利概念,这是当前福利测量方式的微弱信号。保持不平等恒定的理由可能是预测不平等的变化非常具有挑战性(Mahler等人,2022年)。具体地,考虑一个国家,它在 푡 和 푡 之间存在一个古老的 comparable 序列,以及它最01푡与푡之间最近的可比序列(因此也是一个不可比序列)23在 푡 和 푡 之间)。令 푤푒푙푓 为来自调查(或来自PIP)的福利分布12τ外推和内插(如果没有调查估算是)在时间t和g时做B A, t, ti j两个时期之间的国民经济账户的passthrough调整增长。然后,福利̂푤푒푙푓由方法 A 估计的聚合,푤푒푙푓 ,对于 푖 ≥ 2 等于 푤푒푙푓t^2对于 i < 2。A,tτii 1+gB A, t, t^2 i方法B与方法A不同,该方法利用了旧的可比福利向量中的增长和分配变化。这些旧的福利向量可能质量较差,但该方法认为,与使用PIP的延伸规则相比,旧福利向量的增长和分配变化在期望上能更好地捕捉到如果使用最新方法本应测量的结果(即比假设国民账户中没有分配变化和增长要好)。为了连接不可比序列,它像方法A一样使用PIP的延伸规则。继续前面的例子,方法B在t处将与方法A相同1̂̂从那时起,也就是说 푤푒푙푓 = 푤푒푙푓 对于 푖 ≥ 1。然而,在 푡 之前,它将利用调查B,tA,t 1ii基于在푡和푡之间的增长发生率。与方法A相反,这意味着方法01B允许在最新的可比序列之前进行分布变化。具体来说,将这两次调查之间푝个百分位的匿名增长记作푔. 然后,音符,p,t,t0 1̂̂푤푒푙푓t百分位在t的福利将由 neflt 给出=B, p, t1.0B, p, t越南提供了一个如何运作此方法的有趣案例。由于 PIP 的估计值与我们得出的可比序列之间存在显著差异,因此越南特别具有说明性。越南拥有 2010-2022 期间的最新可比消费数据,这意味着从 2010 年起,方法 A 给出的均值、不平等率和贫困率与 PIP 相同(图 1)。然而,在 2008 年至2010 年间,消费的衡量方式发生了变化。2010-2022 年的序列包括估算租金和耐用品(以及其他变化),而截至 2008 年的序列则不包括,导致从 2010 年起测量的福利机械性增加(世界银行 2022 年)。如果不考虑这一点,这将导致 2008-2010 年的贫困率从 17.6% 下降到 5.2%。方法 A 忽略了 2010 年之前的所有调查数据,而是使用国民账户增长来向后预测福利向量。2008 年的国民账户向后外推的贫困率为 6.4%,远低于调查估计值,反映了 2008-2010 年贫困的部分下降可能是由于可比性中断造成的。 5根据之前的假设例子,从 푡 时刻起,方法 C 将与方法 A 和 B 相同。对于 푡 ,它使用当时的调查分布,但重新缩放分布以21与国民账户会建议的增长均值相匹配。也就是说,在越南,方法A和方法B在2008-10年间相似,其趋势是根据不变的不平等性计算的国民账户增长率。2008年之前它们出现分歧,因为可比的福利数据从2002-2008年可用,而方法B使用了这些数据。2002-2008年的数据所显示的福利增长大于经转售调整的国民账户增长,而调查数据显示不平等性在2002-2008年有所下降而不是保持不变。这意味着方法B在2002年显示的贫困程度高于方法A(方法A在2002年具有较低的不平等性和更高的均值)。方法C与之相同的是方法B,但它利用了过去调查的一个更多