您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[世界银行]:使用重新加权和贫困预测模型校正电话调查贫困估计中的抽样和无响应偏差(英) - 发现报告
当前位置:首页/行业研究/报告详情/

使用重新加权和贫困预测模型校正电话调查贫困估计中的抽样和无响应偏差(英)

公用事业2023-12-01世界银行健***
使用重新加权和贫困预测模型校正电话调查贫困估计中的抽样和无响应偏差(英)

政策研究工作文件10656使用加权和贫困投影模型校正电话调查贫困估计中的抽样和无响应偏差Kexin Zhang Shinya Takamatsu Nobuo Yoshida贫困与公平全球实践 2023 年 12 月授权公开披露授权公开披露 政策研究工作文件系列传播了正在进行的工作结果,以鼓励就发展问题交换意见。该系列的目标是快速得出发现,即使演示文稿还不够完善。论文带有作者的姓名,应相应地引用。本文表达的发现、解释和结论完全是作者的观点。它们不一定代表国际复兴开发银行 / 世界银行及其附属组织的观点,也不代表世界银行执行董事或它们所代表的政府的观点。Abstract为了监测 COVID - 19 大流行期间家庭生活条件的演变,世界银行在大约 80 个国家开展了 COVID - 19 高频电话调查。电话调查既便宜又容易实施,但它们有一些主要的局限性,例如缺乏贫困数据,由于许多发展中国家的电话覆盖不完整而导致的抽样偏差以及对电话采访的免费答复。为了克服这些限制,世界银行在 20 个国家进行了试点,在这些国家中,采用了一种快速贫困监测工具,即通过即时和经常跟踪进行的福祉调查,以根据通过电话采访收集的 10 至 15 个简单问题估算贫困率,以及抽样权重。进行了调整,以纠正抽样和无反应偏差。本文基于 COVID - 19 高频电话调查,研究了重新加权程序和通过即时和频繁跟踪方法进行的幸福感调查是否可以消除贫困估计中的偏差。使用人工电话调查样本的实验表明,( i ) 重新加权程序不能完全消除贫困估计中的偏差,正如先前的研究所证明的那样,但是 ( ii ) 当通过即时和频繁跟踪贫困预测与幸福调查相结合时,它们有效地消除了贫困估计和其他统计数据中的偏差。本文是贫困与公平全球实践的产物。这是世界银行为开放其研究并为世界各地的发展政策讨论做出贡献的更大努力的一部分。政策研究工作文件也发布在 http: / / www. worldbank. org / prwp 的 Web 上。可以通过 kzhang2 @ worldbank. org 与作者联系。由研究支持团队制作政策研究工作文件 10656 使用加权和贫困投影模型校正电话调查贫困估计中的抽样和无响应偏差*张可欣、高松新也、吉田信夫a关键词 : 电话调查 , 加权 , 贫困预测 / 估计 , 抽样偏差和无反应偏差的校正JEL 代码: I32, C83, C81* 作者要感谢克里斯汀 · 希姆林,李雪琪,阿齐兹 · 阿塔马诺夫,克里斯蒂娜 · 维瑟,安娜 · 路易莎 · 帕夫豪森对本研究的支持。作者还感谢同行评审员 Kevi McGee 和 Daiel Gerszo Mahler,以及 2021 年 11 月在世界银行举行的质量增强审查会议,2022 年欧洲经委会欧洲统计学家会议以及 2022 年 IARIW 会议的所有参与者的有用评论。a)张可欣, 中国人民大学农业经济与农村发展学院, zhangkexin629 @ ruc. edu. cnShinya Takamatsu , 贫困与公平全球实践 , 世界银行 , stakamatsu @ worldbank. org Nobuo Yoshida , 贫困与公平全球实践 , 世界银行 , nyoshida @ worldbank. org 2I.简介和背景电话访谈为社会科学的实证研究开辟了新的可能性。它大大降低了进行调查的成本,因为所有交流都没有传统调查中习惯的面对面互动。随着 COVID - 19 大流行的爆发限制了面对面的采访,电话调查在学术机构、调查公司和个人研究人员中更为普遍,用于个人层面和家庭层面的数据收集。为了在大流行期间及时跟踪家庭的生活条件,世界银行启动了新冠肺炎高频电话调查 (HFPS),自 2020 年 3 月以来,该调查已在大约 80 个国家进行。这些调查使决策者能够及时和频繁地监测各种社会经济指标。电话调查有缺点。首先,使用 COVID - 19 HFPS 很难监测贫困。COVID - 19 HFPS 不收集消费或收入数据,这对于在传统贫困监测方法下衡量贫困和不平等是必要的。收集这样的数据是耗时、昂贵且复杂的。面试官必须向家庭询问许多有关其最近消费,支出和详细收入组成部分的复杂问题。这样的面试需要至少 30 分钟和两个小时,即使是训练有素和合格的面试官。在电话连接并不总是足够稳定以完成如此长的面试的发展中国家管理面试也具有挑战性。挑战 1 的解决方案 : 作为快速贫困监测工具的 SWIFT2020 年 3 月,世界银行启动了一项试点,使用快速贫困监测工具 “通过即时,频繁跟踪的幸福调查 ” ( SWIFT ),使用 COVID - 19 HFPS 估算货币贫困。SWIFT 在 COVID - 19 HFPS 问卷中增加了 10 到 15 个简单问题,这些额外的问题需要 3 到 5 分钟才能提问。根据家庭对这些问题的回答,可以采用 SWIFT 方法来估算感兴趣人群中的贫困和不平等率。SWIFT 在许多贫困预测方法中被选中,因为它已经过世界银行内外专家的全面测试和审查。结果令人鼓舞 - 真实和基于 SWIFT 的贫困预测之间的差异平均为 1.2 个百分点,并且在 + / - 2 个百分点内,除了一个案例 ( 请参阅附录 5 或 Yoshida 等人的更多详细信息。, 2022a ) 。该试点在全球 20 个国家进行,吉田等人总结了七个国家的结果。( 2022b ) 。其次,COVID - 19 HFPS 的样本不太可能具有全国代表性。在许多发展中国家,移动电话或陆地线路的覆盖范围有限。没有电话的贫困家庭被排除在电话采访之外。此外,电话面试通常比面对面面试面临更高的无回应率。这种不回应通常集中在忙于参加面试的城市居民中。因此,在电话调查中收集的样本往往远非全国代表性,可能导致贫困预测出现偏差。挑战 2 的解决方案 : 重新加权 - 采样权重调整以解决采样偏差已经开发了许多调整采样权重或 “重新加权 ” 的方法来校正各种类型的采样偏差。本文将它们分为两大类 : ( 1 ) 倾向得分加权 ( PSW ) 和 ( 2 )“ 非 PSW 调整 ” 。倾向得分加权是一种根据倾向得分调整抽样权重的方法,是根据 Rbi 和 Rosebam ( 1983 年和 1984 年 ) 提出的倾向得分匹配方法发展而来的。在因果推断的背景下,倾向得分匹配使对照组和治疗组具有可比性,从而最大程度地减少了估计治疗效果的偏差。除非随机选择对照组和治疗组的样品 ( 观察数据通常不是这种情况 ),否则可能会表现出基线特征。 3两组之间的差异。通常估计倾向得分来解决这个非可比性问题。倾向评分是以协变量为条件从群体中选择样本家庭或个体进入治疗组的概率。如果满足一组假设 ( 有关详细信息,请参阅 Rosebam 和 Rbi 1983 和 1984 ),则对照组和治疗组之间结果指标的加权平均值的比较为治疗效果提供了无偏估计。Taylor (2000) 和 Lee (2006) 在网络调查中采用了倾向得分匹配技术来调整抽样权重和纠正抽样偏差。首先,他们选择了代表感兴趣人群的参考调查 ( 例如Procedre, 一个国家的全部人口,城市人口或一个国家的所有难民 ) 。他们结合了参考和网络调查,并使用此组合样本估计了倾向得分。然后,他们根据倾向得分将组合样本分为五分位数,并调整了网络调查的抽样权重,以使网络调查的权重之和与每个五分位数中的参考调查的权重之和相等。另一种倾向得分加权方法是 “逆概率方法 ”,该方法使用倾向得分来构造样本被选择进行参考调查的几率,该几率进一步用作网络或电话调查的抽样权重 ( Morga 和 Todd 2008,Schafer 和 Kag 2008 和 Asti 2011 ) 。本文根据倾向得分将这些类型的重加权技术分类为倾向得分加权 ( PSW ) 方法。如果满足 Rbi 和 Rosembam ( 1983 年和 1984 年 ) 中的假设,则在网络或电话调查中应用基于 PSW 的权重的汇总统计数据将代表感兴趣的人群。第二类重加权技术,我们称之为非 PSW 方法,在电话或网络调查和参考调查之间的指标比在家庭 / 个人层面上更全面地匹配。这组方法包括 raig,后分层和最大熵。非 PSW 方法选择一组指标并调整采样权重,以便所选指标的加权平均值在电话 / 网络调查和参考调查之间紧密 / 精确匹配。PSW 和非 PSW 调整通常一起进行。我们考虑 PSW 和非 PSW 方法的组合应用的两个优点。首先,为了使 PSW 消除采样偏差,需要满足一组假设,比如强可忽略性,这些假设不能轻易测试,对于这些假设,非 PSW 作为加权目的的补充。其次,非 PSW 方法匹配电话 / 网络调查和参考调查之间的关键指标的手段,但不能保证这些指标的分布也匹配。相比之下,PSW 方法与倾向得分的分布相匹配。由于两种方法都有自己的优势,因此进行 PSW 和非 PSW 调整都是合理的。本文研究了重新加权是否可以纠正 SWIFT 方法产生的贫困预测偏差。重新加权技术的性能因匹配的数据和目标指标而异,文献中一致认为,重新加权技术可以减少目标统计中的偏差,但不能消除它们 ( Lee ( 2006 ) 和 Dreze ad Somachi ( 2023 ) ) 。Dreze 和 Somachi ( 2023 ) 通过从家庭调查中删除贫困家庭来创建有偏差的样本,并测试了非 PSW 重新加权技术 ( 最大熵重新加权或最大熵 ) 是否可以减少贫困率和平均家庭支出的偏差。尽管贫困率估计和家庭支出手段的偏见有所下降,但仍然存在很大比例。然而,现有的文献缺乏评估重新加权技术如何能够减少 SWIFT 或任何其他贫困预测方法产生的贫困预测偏差。使用电话或网络调查来估计贫困需要使用贫困预测方法。Dreze 和 Somachi ( 2023 ) 使用了实际的消费和收入数据,并表明即使在重新加权后,贫困率和平均家庭支出仍然存在很大的偏差,但没有评估重新加权与贫困预测方法相结合的情况。 4ℎ=1实际上 , 我们的研究发现 , 当与 SWIFT 等贫困估算方法相结合时 , 加权估算贫困的性能可以得到改善。实验本文研究了重新加权技术和 SWIFT 贫困预测方法的结合是否以及在多大程度上可以消除基于有偏差调查样本的贫困估计中的抽样偏差。为了看到这一点,我们首先使用卢旺达,圣卢西亚和乌干达的参考家庭调查,并通过选择至少拥有移动电话或固定电话的家庭来构建子样本。这些样品受到结构抽样偏差的影响。如果没有重新加权和 SWIFT 贫困预测,这些电话所有者子样本中的贫困率低于完整样本中的贫困率。然后,我们研究重新加权和 SWIFT 贫困预测是否可以纠正上述偏差。电话和网络调查数据收集面临抽样和无响应偏差,但上述实验仅关注因手机所有权不均而产生的抽样偏差。为了了解 SWIFT 和重新加权技术调整无响应偏差的能力,本文使用埃塞俄比亚高频电话调查第 7 轮 ( HFPS7 ) 的样本进行了额外的实验,该样本是 2018 / 19 年埃塞俄比亚社会经济调查第 4 轮 ( ESS4 ) 的子样本。由于 ESS4 的此子样本仅包括电话所有者,因此存在采样偏差。此外,由于它仅包括对 HFPS7 做出反应的 ESS4 家庭,因此它也受到无反应偏见的影响。使用此子样本,我们进行了与上述相同的分析,以评估重新加权技术和 SWIFT 是否可以纠正因采样和无响应偏差而导致的贫困估计偏差。本文组织如下。第二节介绍了 SWIFT 贫困预测方法和重新加权技术,第三节展示了四项实验研究 ( 圣卢西亚、卢旺达、乌干达和埃塞俄比亚 ) 的结果。第四节最后,根据四个案例研究,评估了重新加权和基于 SWIFT 的贫困预测模型在消除贫困估计中的偏差方面的组合。II.SWIFT 和重新加权方法II.1.SWIFT 贫困预测方法SWIFT 是一种应用调查到调查的估算技术 ( S2S ) 来快速监测贫困。SWIFT 通过对贫困代理的家庭支出 / 收入进行回归