您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[世界银行]:地方福利的非正态经验贝叶斯预测 - 发现报告

地方福利的非正态经验贝叶斯预测

房地产2025-04-28世界银行林***
AI智能总结
查看更多
地方福利的非正态经验贝叶斯预测

11107 局部福利的非正态经验贝叶斯预测 Chris Elbers Roy van der Weide 政策研究工作论文11107 摘要 基于142项来自16个不同国家的家庭调查、用于制作贫困地图的基础模型——即家庭收入和消费回归模型,对区域和户内特殊误差分布的估计表明,存在显著的偏离正态分布的情况。在经验最佳估计中考虑非正态性 在地方福利方面,研究发现相对于普通经验最佳估计,其精确度有所提高。尽管精确度的提升范围在有意义至边缘之间,但始终为正值。鉴于非普通经验最佳估计易于实施,使用它没有任何弊端。 局部福利的非正态经验贝叶斯预测 Chris Elbers和Roy van der Weide* 1 引言 Elbers等人(2003年;以下简称ELL)推广了在小区域层面进行贫困和不平等的估计,也被称为“贫困地图”。1此处贫困衡量的是收入或消费低于某一贫困线标准的个人所占的份额。收集家庭收入和消费数据成本高昂。这在许多收入主要非来自工资就业的发展中国家尤其如此。因此,收入和消费数据通常仅以家庭收入和消费支出调查的形式获取。这些调查的样本规模足够用于估计国家和可能的地级区域福祉,但太小以至于无法估计小区域层面的福祉。此处的小区域指的是低于省级别的行政区域,例如区级甚至市级。 在较小区域层面估算贫困水平是通过结合家庭调查数据与单位记录人口普查数据来实现的。2人口普查包含关于人口结构、教育、就业和住房等变量的数据,这些变量可作为家庭收入的预测指标,但并不包含家庭收入变量本身。关键在于,这些预测变量的数据也由收入调查收集。收入调查用于训练一个家庭收入模型,该模型随后用于预测人口普查中每个家庭的收入。这些预测收入可以被汇总,以获得小区域层面的贫困估计值。这种方法已应用于全球60多个国家获取贫困地图。有关小区域估计的文献综述,可参见例如Haslett(2013,2016)、Rao和Molina(2015)、Tzavidis等(2018)、Das和Haslett(2019)以及Corral等(2020)。 为适应误差的空间相关性,假定采用嵌套误差结构,其中总误差是特定家庭误差和位置误差的总和。位置误差通常在小区域层面进行建模。对抽样家庭观察到的总误差显然包含有关区域随机效应的信息。经验贝叶斯(EB)估计,也称为经验最佳估计,利用这一点进行预测,即利用调查中的残差来预测抽样小区域的位置效应,进而用于预测当地贫困率。 推导位置误差的条件分布(基于观测残差)需要做出分布假设。这在EB文献中是标准的做法。 1首次尝试使用汇总数据在小区域层面估算贫困,可追溯到Fay和Herriott (1979)的奠基性研究。2人口普查为国家提供全面覆盖,并收集与家庭福利高度相关的住户和个体属性,如家庭构成、教育、就业和住房特征,使其成为贫困地图编制的理想数据来源。另一种同样能提供国家全面覆盖数据来源是遥感数据,例如夜间灯光、人口密度、土地类型和利用、绿化程度以及当地气候和污染变量。在这种情况下,将这些数据与家庭调查相连接的观测单位是村庄层面而非家庭层面。关于探索使用遥感数据获得小区域贫困估计的研究,例如 Burke等人(2021年)、Chi 等人(2022年)、Engstrom 等人(2022年)、Jean 等人(2016年)、Merfeld 和 Newhouse(2023年)、Newhouse 等人(2022年)、Newhouse(2023年)、Pokhriyal 和 Jacques(2017年)、Vander Weide 等人(2024年)以及其中引用的参考文献。研究在使用的影像分辨率上存在差异,更高分辨率的影像允许从中提取更丰富的预测变量(例如参见 Marx 等人,2019年)。 假设误差服从正态分布的估计,在这种情况下,条件分布也是正态分布(参见Molina和Rao,2010)。然而,假设正态性并非没有成本。由于贫困和不平等是家庭消费的非线性函数(进而也是误差的非线性函数),误差分布的设定错误可能会在小区域贫困估计中引入误差。 ELL对误差的假设最小,这源于其经验应用中的实证情况,即误差不符合正态分布。遗憾的是,ELL采用的分布函数的非参数估计方法并不适用于经验贝叶斯(EB)估计。Molina和Rao(2010年,以下简称MR)则优先考虑在误差正态分布的假设下进行EB估计。其中,ELL通过不实施EB估计而接受精度损失,而MR则接受可能源于误差分布函数设定错误的精度损失。全文中,更高的精度将指代更低的均方根误差(RMSE)。 本文提出的方法兼顾了EB估计和非正态分布误差的考虑。我们通过将有限正态混合物(NM)拟合到误差分布函数中来实现这一点。正态混合物具有极高的灵活性;它们能够拟合任何良好行为的分布函数,并且非常适合用于兼顾EB估计。关于家庭特殊误差项,我们遵循ELL的方法,从特殊误差的经验实现中抽取样本(可重复)。3为验证哪些偏离常态(或非常态的程度)在经验上具有相关性,我们使用来自16个不同地区和不同收入群体的142份家庭调查数据,估计了相应的误差分布。 我们的研究结果如下。对142项家庭调查中估计的区域性和特殊误差分布的检验显示,其与正态性的显著偏离,尤其是在家庭特殊误差成分方面。家庭误差的偏度在-1.5至1.5之间,峰度在4至10之间(区域误差的偏度在-1至1之间,峰度在2至8之间,忽略离群值)。当区域误差较小时(2.若总误差小于5%或更低), 那么考虑非正态性的益处将被放弃经验最佳预测所带来的损失所抵消。一旦区域误差的占比达到5%或更高, 经验最佳预测在几乎所有经验观察到的误差分布中均优于非经验最佳预测。非正态-经验最佳预测在所有情况下表现最佳。相对于正态-经验最佳预测, 在位置效应较高的水平上, 性能提升相对较边际。同样, 在位置效应接近零的水平上, 与经验线性最小二乘预测相比, 性能提升也较边际。虽然收益可能在边际(RMSE减少接近于零)和有意义(RMSE减少高达15-25%)之间变化, 但它们总是正值。鉴于非正态-经验最佳预测易于实施, 使用它没有任何弊端。 高度细分的贫困和不平等估计激发了广泛的应用。 作用之一是针对社会援助项目进行目标设定,例如参见Banerjee等人(2025年)和Smythe与Blumenstock(2022年)的研究。Elbers等人(2007年)在马达加斯加、柬埔寨和厄瓜多尔的实证应用中表明,若通过区级或市级贫困评估进行目标转移,则实现同等减贫成果所需的预算不到一半。小区域估计值越来越多地被用作实证分析的回归变量,例如参见Araujo等人(2008年)、Baird等人(2013年)、Bazzi(2017年)、Crost等人(2014年)、Demombynes和Ozler(2005年)、Elbers等人(2005年)、Maloney和Caicedo(2015年)以及Mendez和Van Patten(2022年)的研究。4为了举例说明,Araujo等人(2008年),利用厄瓜多尔的资料研究发现,收入不平等程度较高的村庄不太可能投资于能够惠及穷人的公共物品(他们将此归因于精英俘获)。Demombynes和Ozler(2005年)在南非的实证应用中发现,小区域层面的不平等与当地犯罪率之间存在正相关关系。最后,在小区域估计所依据的多重插补方法也在更宏观的层面上被应用于监测贫困状况,特别是在家庭消费调查中断或中止的背景下,促使研究人员将家庭消费数据插补到替代性调查中,例如Tarozzi(2007年)和SinhaRoy与Van der Weide(2025年)。 本文其余部分的结构安排如下。问题陈述在第二节中提出。在第三节中,我们简要总结了现有文献中采用的两种竞争性方法:非正态-非EB方法和正态-EB方法。新提出的方法Non-normal-EB在第四节中介绍。第五节基于16个国家142份家庭调查的实证数据分别进行了一项仿真研究。最后,第六节进行总结。 2 问题陈述:福利的小区域估计 Lety衡量人均收入(或支出)指标。h居住在地区a,和ahlets表示同一家庭中的成员数量。5假设在ah在家庭层面的数据生成过程(DGP)满足: wherex是一个具有自变量的向量,并且u andεare zero expectationaahah相互独立的误差项。6下标表示目标区域(或领域)a ahah ah 4数据组合模型也可应用于小区域估计应用之外,例如,Graham等人(2016)。理想情况下,家庭收入或消费支出数据应调整空间和时间价格差异,即以实际值衡量。由于这并非本研究的重 5点,我们将忽略这一点,但建议有兴趣的读者参考例如Gibson等人的研究(2017年)以及van Veelen和van derWeide(2008年的研究)。所假设的嵌套误差结构是一种常见且实用的方式,用以解释误差之间的空间相关性。嵌套误差结构可扩展为双 6重嵌套误差模型,例如参见Marhuenda等人(2017)的研究。或者,可以假设空间自相关结构,例如参见Bell和Bockstael(2000)、Pratesi和Salvati(2008)以及Kelejian和Prucha(2010)的研究。在这种情况下,误差之间的相关性可以建模为距离的平滑衰减函数,而不是嵌套误差结构所隐含的阶跃函数。所包含的回归变量包括x typically includes interactions and transformations of selectedah aand householdh.7让我们假设误差是同方差性的,因此对于每个家庭hand areaa我们拥有:var[y | x] =σ2+σ2Throughout the paper it is assumed that consistentah ah u ε :方差的估计量是可用的,我们将其表示为ˆ。σ2and ˆσ2.8我们 LetA是收入调查所涵盖的地区的总数,并让n be the numberaPuε在此阶段,我们不会对误差分布的形状做出任何假设。 n等于总体样本在抽样区域内被调查的家庭中a, 所以n= A aa=1 ) 它是一个长度为向量的n that我们将也使用符号e= (e , . . . , e调查的规模。我们将总家庭误差表示为:e=y −x Tβ, 和它的区域ah ah ah aa,1 a,naa平均为 ¯e= ¯y −x¯Tβwhere ¯e=e /n.a aa a 包含来自该地区所有家庭的残差。a. 在术语使用上略有不当,我们有时会称其为错误e and ¯e as data (as if we know the parameter vectorβ). Letaahah yande denote vectors of lengthN with elementsy ande从所有家庭来看,aahah wherep(u|e)是位置区域误差的条件概率密度函数u(con-)ay,e andx将表示调查样本类似物。最后,让概率分布a aa函数(概率密度函数)对于u andε被表示为F(p(u)) andG(p(ε)).auεah≃W(x β+u+ε)p(ε)p(u|e)dεdu,a(a)aa(a) (a)(a) 附加在观察到的残差上)和福利函数W通常将呈现非线性特征。常用选项包括W是低于预设贫困线(亦称人头贫困率)的个人收入份额以及收入不平等的基尼指数。人头贫困是福斯特—格里尔—索贝克贫困指数体系中的一个特例,参见福斯特等人(1984)。目标是估算: 实际上,EB估计是通过积分消除面积误差获得的u使用概率密度ap(u |e), 即概率密度u条件是e从调查中观察到。非EBa aa a估计值是通过使用无条件密度获得的p(u). The challenge is to work outap(u |e) 沿着边际p(u) andp(ε) 而不对其施加限制。a aa ah形成,以便得到的条件密度p(u |e)也可以采取任何形式。目