AI智能总结
10738 使用调查对调查的估算以低成本填补贫困数据缺口 来自随机调查实验的证据 Hai - Anh DangTalip Kilic VladimirHlasny KseniyaAbanokovaCalogero Carletto 政策研究工作文件10738 Abstract 在许多低收入和中等收入国家,随着时间的推移,关于家庭消费的调查数据往往不可用或不可比较。基于在坦桑尼亚实施的一项独特的随机调查实验,这项研究提供了新的严格证据,表明调查到调查的估算可以填补消费数据空白,并提供低成本和可靠的贫困估计。以公用事业支出为特征的基本估算模型,以及对人口统计,就业,家庭资产和住房的适度预测指标,可以产生准确的预测。估算准确性对于变化的调查问卷长度,估算估算模型的基础调查的选择,不同的贫困线,都具有鲁棒性。 和替代(季度或月度)消费者价格指数平减指数。所提出的插补方法也比多重插补和一系列机器学习技术表现更好。在具有修改(缩短或汇总)食物或非食物消费模块的目标调查的情况下,只有在预测因子的分布相对于基础调查标准化的情况下,包括食物或非食物消费作为预测因子的估算模型才会很好。为了使性能最佳的模型达到可接受的准确性水平,基本调查和目标调查的最低要求样本量应为1, 000。讨论扩大了调查结果对未来调查设计的影响。 本文是发展经济学发展数据组的产物。这是世界银行为开放其研究并为世界各地的发展政策讨论做出贡献的更大努力的一部分。政策研究工作文件也在http: / / www上发布。世界银行。org / prwp.可以通过hdag @ worldba与作者联系。org和tilic @worldba。 政策研究工作文件系列传播了正在进行的工作结果,以鼓励就发展问题交换意见。该系列的目标是快速得出发现,即使演示文稿还不够完善。论文带有作者的姓名,应相应地引用。本文表达的发现、解释和结论完全是作者的观点。它们不一定代表国际复兴开发银行/世界银行及其附属组织的观点,也不代表世界银行执行董事或它们所代表的政府的观点。 使用调查对调查的估算以低成本填补贫困数据差距:来自随机调查实验的证据Hai - Anh Dang、Talip Kilic、Vladimir Hlasny、Kseniya Abanokova和Calogero Carletto * JEL代码:C15,I32,O15。 1.Introduction 作为低收入和中等收入国家货币贫困估计基础的家庭消费调查数据往往不可用、不可靠或不可比较。为了应对这些挑战,基于估算的方法变得越来越普遍,不仅可以在数据稀缺和资源有限的情况下填补贫困数据空白,而且还可以确定项目/计划的受益者并以低成本评估开发项目/计划对贫困的影响(世界银行,2021年;Smythe和Blmestoc,2022年;Dag和Lajow,2023年)。 基于开创性的技术,该技术通过将家庭消费调查纳入人口普查来获得小面积的货币贫困估计(Elbers等人。,2003),调查对调查的估算使用现有的旧消费调查(基础调查)中的适当预测变量建立了一个估算模型,该模型随后可以应用于另一个非消费调查(目标调查)中的相同变量,以提供贫困估计为后者的调查。目标调查可以是现有的非消费调查,例如人口与健康调查(DHS)或劳动力调查(Stifel和Christiaese,2007;Doidich等人。,2016),或仅收集必要的预测因子的有目的地委托的调查。最近的应用还包括从行政记录中获取必要预测因素的数据,以将贫困归因于难以到达的难民人口(Altidag等人。,2021年;Dag和Verme,2023年),或针对超贫困者的电话呼叫细节记录(Aie等人。,2023年)。 三个关键的概念性但未充分研究的问题激发了我们的工作。首先,有关调查到调查归因的文献长期以来一直强调具有相同问题的要求 基础调查和目标调查中的贫困预测因子。但是,即使满足了这一要求,在问卷的长度,主题范围和复杂性方面,基本调查与目标调查之间仍可能存在重大差异。这些差异可能导致面试时间和受访者负担的相当大的差异,这可能以不同的方式影响测量,这些方式最终是针对上下文和主题的(Kreter等人。,2011;埃克曼等人。, 2014)。在我们的案例中,未被充分研究的主题是,目标调查问卷在设计上比其较旧的基础调查问卷更轻,负担更少,这一事实是否会影响贫困估算的准确性,即使贫困预测因素的必要问题在基础和目标调查问卷中是相同的。关于这个问题的唯一可用证据来自一项在马拉维实施但未在其他地方复制的随机实验,这表明贫困预测因子的测量确实会受到目标调查长度的影响,从而也会影响预测的贫困估计(Kilic和Sohese,2019)。 第二个和相关的问题是,目标调查中是否包括较短的消费模块(例如Procedre与基础调查相比,项目列表减少或汇总)可以提供更便宜但可靠的预测指标,可以在数据收集的边际额外成本下进一步提高贫困预测的准确性。在这种情况下,贫困预测因素的必要问题在基本调查问卷和目标调查问卷中可能不相同,从而放宽了上述传统的调查对调查的要求。在这方面,只有两项研究存在,它们提供了不确定的证据。而克里斯蒂安森等人。(2022)建议,只有在某些严格的条件下,使用消费子总量进行贫困填补才有效,Dag等人。(即将出版)分析了来自各个国家的14项调查,并证明了将家庭公用事业支出添加到家庭的基本估算模型中。 人口和就业属性可以产生准确的贫困预测-始终在95%的内部信心内,并且通常在观察到的“真实”贫困率的一个标准误差内。 最后,激励我们工作的最后一个问题是,“验证”估算贫困估计的现有研究是在人为环境中实施的。具体而言,这些研究通常通过在较旧的基本消费调查中估计估算模型并将该模型应用于较新的目标消费调查来进行验证,假装在后者的调查中没有消费数据。这些研究随后根据目标调查中的实际消费数据,将由此得出的估计与实际贫困率进行比较。较新的一轮调查既是目标调查,也是真正贫困的来源,这一事实从最初激发我们工作的基本调查设计与目标调查设计的现实生活差异中抽象出来。这些传统的人工设置也不同于用于调查到调查归算的许多实际应用,其中将具有不同设计的新调查作为目标调查(例如Procedre,一项不收集消费数据或管理较轻的消费模块的调查-就像大多数代理手段测试一样)。 在这种背景下,我们报告了一个独特的随机和具有全国代表性的家庭调查实验,该实验于2022年在坦桑尼亚实施,以系统地调查尚未研究的主题,这些主题与调查到调查的填补贫困数据差距的操作/实际应用有关。该实验以三个治疗组(TA)为特征,随机分配了抽样家庭,并且在问卷设计方面有所不同。对治疗组1(TA 1)的家庭进行了问卷调查,该问卷收集了有关家庭消费的全面数据,并可以计算。 基准贫困估计,这与基础调查的问卷相同,该问卷允许估计各种竞争性的估算模型。对TA 2个家庭进行了轻度问卷调查变体,其中仅包括允许估计估算模型的数据适度子集的问题,该模型还包括TA 1食品消费模块,但减少了关键食品清单。最后,对TA 3家庭进行了替代光问卷,该问卷与TA 2问卷具有相同的核心,并且包括TA 1食品和非食品消费模块的替代汇总版本。这些数据反过来又补充了具有国家代表性的坦桑尼亚国家小组调查(TZNPS)的数据,特别是TZNPS 2020 / 21和2019 / 20轮的数据,这些数据被用作估算的基础调查。 通过我们的研究,我们通过(a)提供有关目标调查设计对贫困估算的影响的实验证据,(b)通过提供现实生活中的“验证”来回避对估算估算值的通常担忧基准数据,(c)提供有关最低要求的基数和目标调查样本量的新证据。据我们所知,我们提供了第一项研究,该研究利用随机和全国代表性的调查实验来严格研究这些相互关联但很少探索的研究问题,这些问题是调查到调查归因的核心。从这个意义上讲,我们的工作也与越来越多的文献广泛相关,这些文献依赖于低收入和中等收入环境中的随机调查实验,以衡量竞争性调查方法相对于黄金标准测量方法的相对准确性和成本效益(Beegle等人。,2012;Arthi等人。,2018;Gorlay等人。,2019年;De Weerdt等人,2020年;Kilic等人。,2021年;阿巴特等人。,2023年)。 分析表明,如果目标调查中的预测因子是通过与基础调查中的对应对象相同的问题得出的,则估算准确性不会受到基础调查和目标调查之间在范围和复杂性方面的剩余差异的影响。基本的估算模型,包括一组有关人口统计,就业,家庭资产和住房和/或公用事业支出的核心预测指标,可以相对于真实的贫困率产生高度准确的预测。此外,关于具有改良(缩短或汇总)食品和非食品消费模块的TA 2或TA 3,只有在预测因子的分布相对于基础调查(可以是TZNPS或TA 1)标准化的情况下,包括食品消费或非食品消费支出作为预测因子的归责模型才会很好。最后,为了使性能最佳的模型达到可接受的精度水平,分析表明,对于基础调查和目标调查,最低要求的样本量应为1, 000个观察值。结果对于用于估算模型估计的基础调查的选择是稳健的;不同的贫困线;和替代(季度或每月)CPI平减指数。我们提出的插补方法也显示出比多重插补和一系列机器学习技术更好的表现。 本文由六个部门构成。第2节介绍了实验设计(第2.1节)和描述性统计(第2.2节)。第三部分讨论了分析框架。第4节介绍了主要的估计结果(第4.1节)和稳健性检查(第4.2节),然后是第5节关于各种扩展。第六节结束。我们在附录A中提供了其他估计结果,在附录B中提供了对消费总量的进一步描述,以及对附录C中方法背后的公式和直觉的更详细讨论。 2.实验设计和描述性统计 2.1.实验设计 数据来自坦桑尼亚国家统计局于2022年4月至7月进行的坦桑尼亚家庭消费计量方法调查实验,该实验得到了世界银行生活水平计量研究(LSMS)计划的技术支持。根据过去几轮坦桑尼亚国家小组调查(TZNPS)和家庭预算调查(HBS)的功率计算,该实验跨越了坦桑尼亚大陆和桑给巴尔的143个枚举区域(EA),包括城市和农村地区。在每个采样EA中,从进行的新家庭列表中随机选择25个家庭,其中5个采样家庭被随机分配到5个调查治疗组之一。 我们分析了与我们的研究最相关的三个调查治疗组。3治疗组1(TA 1)管理了标准的TZNPS家庭问卷,该问卷提供了观察到的消费和贫困估计,并允许估计Dag等人提出的所有归因模型。(即将出版),其坦桑尼亚特有的部分研究依赖于前几轮TZNPS的数据。附录A中的表A.1显示了每个模型及其预测因素。TA 1样本由711个家庭组成。 治疗组2(TA 2)进行了轻度问卷调查,其中包括: (1)“核心模块”,仅包括计算Dang等人(即将出版)中提出的模型的数据适度子集的预测因子所需的问题。 模型1、2、8和9,它们需要与家庭人口统计、就业属性、住房特征、资产、公用事业支出和 (2)TA 1食品消费模块的较短版本-具有相同的设置/问题集,但减少了食品清单-与较早的坦桑尼亚家庭福利和劳工调查(SHWALITA),特别是“短清单”该研究中的治疗部门保持一致。4 TA 2食品消费模块在TA 2核心模块之后立即开槽,涵盖TA 1.5中包含的71个项目中的26个项目。这些选定的项目占TA 1中食品消费货币价值的69%,这表明,与全部TA 1食品消费模块相比,TA2下减少的食品消费项目清单错过了相当大的食品支出份额。如后面所讨论的,关于食物消费的TA 2数据用于估计额外的插补模型,即Dag等人提出的模型3。(即将出版),其中包括家庭食品消费支出作为预测指标。TA 2样本由701个家庭组成。附录A中的表A.2列出了与TA 1相比,TA 2和TA 3在这些食品类别上的支出。 最后,治疗组3(TA 3)进行了另一种光问卷变体,包括: (1)与Dang等人(即将出版)中介绍的允许估计模型1、2、8和9的TA2核心模块相同, (2)与SHWALITA研究中的“崩溃列表”治疗臂相对应的汇总食物消耗模块,以及