您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[世界银行]:利用 SWIFT 实际进展中本国 - 发现报告

利用 SWIFT 实际进展中本国

信息技术2024-04-01世界银行程***
AI智能总结
查看更多
利用 SWIFT 实际进展中本国

启用高频和实时贫困监测发展中的世界SWIFT通过福利调查即时和频繁跟踪授权公开披露 NobuoYoshida和DanielleVictoriaAron授权公开披露 ©2024国际复兴开发银行/世界银行1818HStreetNW华盛顿特区20433电话:202-473-1000互联网:www.worldbank.org 这项工作是世界银行工作人员在外部贡献下的产物。这项工作中表达的调查结果、解释和结论不一定反映世界银行、其执行董事会或他们所代表的政府的观点。 世界银行不保证本工作中包含的数据的准确性、完整性或货币性,也不对信息中的任何错误、遗漏或差异承担责任,也不对使用或未能使用所规定的信息、方法、过程或结论承担责任。本作品中任何地图上显示的边界、颜色、面额和其他信息并不意味着世界银行对任何领土的法律地位或认可或接受这些边界的任何判断。 此处的任何内容均不构成或被解释为或被视为对特权的限制或放弃和世界银行的豁免权,所有这些都是特别保留的。 权限和权限 本作品中的材料受版权保护。由于世界银行鼓励传播其知识,因此只要给予该作品的全部归属,就可以出于非商业目的全部或部分复制该作品。 有关权利和许可,包括附属权利的任何疑问,应向世界银行出版物,世界银行集团,华盛顿特区西北1818号H街,美国,DC 20433;传真:202 - 522 - 2625;电子邮件:pubrights @ worldbank. org。 CKNOWLEDGMENT 我们衷心感谢撰稿人对本报告第6节中对国家案例研究的重要见解。特别提到的包括李雪琪和巴拉圭的埃莉安娜·卡罗来纳·卢比亚诺·马图列维奇;博茨瓦纳的卡罗来纳·迪亚兹-博尼利亚;ParipooraBaxi,在高松伸也为刚果民主共和国提供的协助下;AjaliKii,来自DhirajSharma,ShiyaTaamats和RobSwiels为津巴布韦提供的投入;JeremyScheider,来自AzizAtamaov为乌干达提供的见解;AjaliKii和XqiLi,以及LydiaKim为蒙古提供的贡献;MariaGabrielaFarfaBetra和SebastiaPatricAlexadreSilva他们的专业知识极大地丰富了本报告,突出了SWIFT方法在全球范围内的不同应用和影响。 特别感谢杰里米·埃文·施耐德在起草本报告时的专注协助。我们也感谢塔拉·维什瓦纳斯、加布里埃尔·拉拉·伊巴拉、玛丽亚·尤金尼亚·热诺尼、卡罗来纳州·迪亚兹-博尼拉、南迪尼·克里希南、玛丽亚·费尔南达·冈萨雷斯·伊卡萨、劳拉·里亚娜·莫里诺·埃 H. Dang,David Newhouse,Dean Mitchell Jolliffe,Talip Kilic,Ksenia Abanokova,Ksenia Bolch,Kimberly Blair Bolch,HenryStemmler以及世界银行审查会议的所有参与者。我们还感谢卡洛斯·萨巴蒂诺的编辑评论,并感谢路易斯·费利佩·洛佩兹·卡尔瓦和贝努·比 目录 1.导言6 2.SWIFT贫困估计框架8 A.模型开发9B.目标数据的收集或统一10C.Imputation11D.使用SWIFT Plus和SWIFT 2.0 11改进模型稳定性E.基于SWIFT的贫困估计的可靠性12F.SWIFT框架的优势及其注意事项13 3.SWIFT的贫困估计:多样化用例的灵活框架14 A.利用现有的频繁调查增加贫困统计数据的频率14B.在没有适当的培训数据集时生成贫困统计数据(SWIFT2.0)15C.通过非传统数据收集进行快速贫困监测16D.恢复可比性以重建贫困趋势16 4.SWIFT框架的成本影响18 (i)已提供频繁的家庭调查18(ii)没有用于培训的适当数据19(iii)没有频繁的家庭调查可用,但经常电话调查的计划19(iv)没有频繁的家庭调查,但基于社区的数据收集计划20 5.SWIFT框架概述22 6.国家示例26 (i)巴拉圭:利用季度调查提供贫困统计数据26(ii)博茨瓦纳:利用季度劳动力调查进行贫困统计28(iii)刚果民主共和国:尽管缺乏可比较的家庭调查,但仍存在贫困趋势31(iv)津巴布韦:在意外的经济变化后使用SWIFT提供贫困统计数据32(v)马拉维:在气候危机背景下提供及时的贫困数据34(vi)乌干达:在难民危机背景下提供及时的贫困数据36(vii)蒙古:在改进家庭调查后恢复贫困趋势38(viii)赞比亚:由于家庭调查的差异而恢复贫困趋势40(ix)尼日利亚:利用现有的过去调查揭示贫困趋势43 7.结论46 附件1.国家案例的元数据50附件2.模拟过程52 数字 图1SWIFT框架的步骤23图2巴拉圭季度贫困预测结果28图3博茨瓦纳贫困预测结果30图4使用RFMS的马拉维南部农村贫困估计35图5乌干达难民的贫困估计数37图6蒙古验证工作-按aimag比较2016年实际和估算的贫困人数group ............................................................................................................39图7赞比亚贫困和不平等趋势42 Tables 表1贫困率的比较— —实际支出和SWIFT估算支出(%) 12表2SWIFT分析的分类和活动24表3巴拉圭模型验证结果27表4刚果民主共和国贫困估计数32Table5津巴布韦按上,下和粮食贫困划分的贫困率线条........................................................................................................................................33表62016年、2018年和2020年蒙古实际基尼系数和推算基尼系数40表7赞比亚模型2015年数据表现结果41Table8根据GHS第44波,尼日利亚在国际贫困线上的贫困估计 Introduction 通过即时和频繁跟踪的福利调查(SWIFT)是一个创新的框架,用于编制贫困统计数据,显著降低成本和时间。Lajow和Yoshida(2022)透露,低收入国家的官方贫困数据平均每7年提供一次,这导致无法完全了解贫困率的年度波动。官方贫困率之间的长期差距主要是由于传统贫困估计方法的缓慢和费力。传统方法需要详细的消费或收入数据,这些数据是通过精心设计的计算机辅助个人访谈(CAPI)问卷收集的,涉及由训练有素的枚举员进行的广泛访谈。在数据收集之后,贫困测量专家花费至少三个月(有时最多十二个月)来得出贫困估计。总体而言,使用传统方法收集和分析数据可能需要1.5到3年的时间,花费数百万美元。所需的高成本和高时间导致贫困数据很少获得。 相比之下,SWIFT能够以显著的效率更频繁、更及时地编制贫困估计。通过利用经过最新家庭调查培训的机器学习模型,SWIFT可以计算出10到15个与贫困相关的贫困估计值。当这些相关性存在于现有数据集中时,估计成本是最小的。即使这些投入并不容易获得,每个家庭都需要简短的2到3分钟的访谈来收集数据-与传统的家庭调查相比,这是相当节省时间。尽管成本和时间大幅减少,但基于SWIFT的贫困估计的准确性很高。吉田等人的研究。(2022)表明,SWIFT的估计与实际贫困率的偏差通常不超过+/-2个百分点。这种准确性水平,再加上易于实施,导致SWIFT在70个国家的200多个项目中得到广泛采用。 DRC-获取健康数据。图片来源:VincentTremeau/世界银行 本报告旨在使参与估算官方贫困统计数据的人员熟悉SWIFT框架,以提高贫困数据的频率和质量。它介绍了SWIFT的工作原理,讨论了该方法的优势和注意事项,并提供了特定国家/地区的应用示例,涵盖了以下情况: 前三类案例强调了利用SWIFT来增加贫困数据的频率,而第四类案例则讨论了SWIFT如何通过确保长期可比性来提高贫困数据的质量,这是官方贫困监测的一个关键障碍。 报告组织如下:第2节描述了SWIFT框架,第3节列出了本报告中包含的SWIFT的应用,第4节描述了成本预期,第5节提供了关于如何以及何时应用SWIFT的决策指导,第6节显示了如何利用SWIFT的具体国家示例,第7节总结了报告,第8节列出了对撰写本报告做出贡献的人。 1.提高使用贫困统计数据的频率现有的频繁家庭调查,2.在现有培训时编制贫困统计数据数据集尚未可用,3.探索将新的数据收集方法(如电话调查和基于社区的数据收集)整合到SWIFT框架中,以及4.随着时间的推移,恢复贫困数据的可比性。 SWIFT贫困估计框架 用于估算贫困的SWIFT框架包含三个主要组成部分。首先是从家庭调查(我们将此数据集称为训练数据集)中开发了一个归责模型。训练数据集可以是具有全国代表性的任何足够大的数据集,并且包含福利汇总和贫困相关数据,例如家庭人口统计,居住条件,资产所有权,劳动力市场统计,食品消费,粮食安全等。SWIFT框架的第二个组成部分是创建家庭支出的二级数据集。1可以通过在新调查中收集贫困相关的必要数据或通过协调现有调查以与训练数据集具有可比性来创建数据集。2最后,第三个组成部分是将开发的模型应用于目标数据集以估算家庭支出和估计贫困率。SWIFT框架的三个组成部分的顺序将取决于培训和目标数据的现有可用性。 巴拉圭-巴拉圭的Capibary生产者博览会照片:FarrahFrick/世界银行 A.模型开发 在SWIFT框架中,通常假设家庭人均支出的自然对数(或每成人等值)h遵循线性模型(1),其中xh是贫困的(kx1)向量,ß是贫困相关系数的(kx1)向量,以及误差项(uh)服从正态分布(N(0,o)).3 产生指标:(1)的绝对值 实际贫困率和预测贫困率之间的差异 (2)所选择的显著性水平是最小的p值,其中绝对差被最小化或MSE被最小化。 lnyh=xh'β+uh(1)uh~N(0, o) 一旦创建了具有最佳显著性水平的模型,就可以通过为每个家庭计算20次家庭支出来测试训练数据中的性能。5然后可以将平均估算的家庭支出和相关的贫困率与培训数据的实际家庭支出和贫困率进行比较。尽管这是一个“样本内”测试,但由于CV练习选择的显著性水平,结果可以防止过度拟合问题。 使用逐步OLS回归在训练数据内训练插补模型。4逐步回归从训练数据中的大量变量开始,并使用迭代过程将变量的数量缩减为一个对因变量具有独立解释力的小集合,即家庭支出的自然对数。如果在给定阈值下,贫困候选人与记录家庭支出的关系微不足道,则较大池中的变量将被删除,因为贫困候选人在模型中相关。 建模过程是一种迭代方法,性能测试允许分析师查看何时应该重新完成模型以产生更好的结果。分析师还应特别注意模型变量系数的符号,检查每个变量是否以预期的方式影响对数家庭支出。当变量没有以可预测的方式影响支出时,应重新评估培训数据和/或与国家专家展开对话,然后才能更好地了解基础数据。 该显著性阈值通过交叉验证(CV)练习来选择。交叉验证经常用于机器学习应用程序,以避免在同一数据集中开发和测试模型时可能出现的“过度拟合”问题。过度拟合发生在模型在训练数据中表现非常好,但在外部数据集中可能表现不佳的情况下,这可能是模型相对于训练数据的样本大小包含过多变量的结果。CV将训练数据随机分成称为折叠的子样本。在SWIFT建模练习中,使用了十个折叠。使用逐步回归估计一系列模型,该模型具有9倍的不同显著性阈值,然后在剩余的1倍中进行测试。因为测试折叠在用于训练模型的观察样本之外,所以结果不存在过拟合问题。重复该过程,使得每个折叠用作测试折叠。从这个练习中,两个表现。 最后,最准确的贫困估计所需的模型数量取决于项目背景。通常情况下,将需要按地区或人口类型分类的多个模型。例如,如果一个国家的北部省份与南部省份相比,已知的消费