您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[世界银行]:利用地理空间数据对贫困和财富进行小面积估算:到目前为止我们学到了什么?(英) - 发现报告
当前位置:首页/行业研究/报告详情/

利用地理空间数据对贫困和财富进行小面积估算:到目前为止我们学到了什么?(英)

房地产2023-06-01世界银行.***
利用地理空间数据对贫困和财富进行小面积估算:到目前为止我们学到了什么?(英)

政策研究工作文件10512Pov ert y 的小区域估计和 Wealt h 使用 Geosp 数据到目前为止 , 我们赚了吗 ?大卫 · 纽豪斯开发 E conom ics开发数据框架 p2023 年 6 月 政策研究工作文件 10512Abstract<unk> 是对精选的 p p p lic 的非技术介绍 -结合 su rvey 和 geosp 数据来生成小地区财富或过度财富的估计。来自卫星和 p hones 的数据当根据人口普查数据进行评估时 ,它们在基于模型的估计中的使用削弱了准确性 -A lthou gh证据很少 , 基于 interp retable fee 的模型 -TURS 似乎至少可以预测以及得出的估计值FROM C onvolu t ional Neu ral Netw orks. Estimates forsamp led 区域比 fi 更准确由于信息丰富的采样 , 非采样导致的区域。一般来说 ,最多使用地理空间数据估计 fi t f分类水平 p ossible. Tree - b ased 机器学习方法似乎比线性混合模型。使用地理空间的小区域估计数据可以影响社会援助的设计 ,明确地说 , 当现有的瞄准系统不足时设计的。<unk> is paper is a p roduct of the Development ment Data Group, Development Economics. It is p art of a larger e 夫ort by the世界银行将提供对其研究成果的访问 , 并为发展和在 http: / / www. worldbank. org / p rwp 上 , Poli cy Research Working Pap ers 也可以在 Web 上进行操作。 <unk> e 作者可能请致电 d new hou se @ w orld b ank. org 。<unk> e 政策研究工作文件系列传播正在进行的工作的 fi 内容 , 以鼓励交流有关发展的想法issues. An objective of the series is to get the fi ndings out quickly, even if the presentations are less than fully polished. We papers carry the作者的名字 , 并应相应地引用。本文中表达的 <unk> e fi 编码、解释和结论完全是这些作者的意见不一定代表国际复兴开发银行 / 世界银行和它的组织 , 或世界银行执行董事或他们所代表的政府。由研究支持团队制作 使用地理空间数据对贫困和财富的小区域估算 :到目前为止 , 我们学到了什么 ? 1大卫 · 纽豪斯 (世界银行集团)1 JEL 代码 : C53 , I32 。关键词 : 贫困 , 小区域估计 , 贫困制图 , 卫星数据 , 机器学习我们感谢 Partha Lahiri 鼓励他写这篇文章 , William Bell , Chris Elbers , Carolina Franco 和Josh Merfeld 对 2022 年小面积估算会议的参与者先前草案的有用评论在马里兰大学学院公园 , 以及 Haishan Fu 和 Keith Garrett 的支持和鼓励。 1. Introduction使用地理空间数据作为小区域估计的辅助数据是一个古老的想法。最初在三十五年前由 Battese 、 Harter 和 Fuller (1988) 证明 , 他们结合了调查来自 Landsat 卫星的早期图像数据 , 以预测玉米和大豆下的面积在爱荷华州的 11 个县生产。该论文在小面积估计领域被广泛引用统计数据 , 截至 2023 年 5 月 , Google Scholar 上有近 1, 100 个引用。但该论文以另一个开创性的贡献 , 因为它是第一个开发和应用众所周知的嵌套错误单元 -水平模型 , 具有在目标区域水平指定的条件随机效应 , 用于估计小领域。从 1988 年到 2015 年左右 , 经济学家和统计学家投入了相当大的努力以各种方式完善这一模型 , 莫利纳和Rao (2010) 使用模拟方法估计贫困人数率等手段以外的指标技术。同时 , Elbers 、 Lanjouw 和 Lanjouw (2003) 的出版物使用了略有不同的单位级模型 , 在世界银行推广了小面积估算的使用。尽管如此 , 直到最近 , 这段时间几乎所有的应用程序都使用了人口普查或其他行政数据作为辅助数据 , 忽略地理空间数据作为辅助数据的潜在来源哪些调查可以 “借用力量 ” 来改善对社会经济数据的衡量。地理空间数据在 2010 年代中期被重新发现为辅助数据的潜在来源 , 随着计算能力和存储使地理空间数据能够广泛公开 ;开始定期对收集地理坐标的平板电脑进行调查 ; 作为一个新的数据科学家、经济学家和统计学家的产生发现了地理空间数据的潜力提高社会经济测量。反过来 , 这引发了人们对结合调查和卫星的兴趣用于小区域估计的指标。对这种类型的 “数据 ” 使用适当的方法融合 “是重要的 , 因为小区域贫困估计对目标和对公共干预措施的评估 , 可以更广泛地揭示经济地理学。在与此同时 , 部分原因是机器学习算法的最新进展 , 不同的学科和作者采取了非常不同的方法来结合地理空间数据和调查用于小区域估计的数据。本文提供了从这些相对较新的文献中选择的证据的非技术综述。它建立在最近的两个评论 (伯克 , 2021 年 , 麦克布莱德等人 , 2022 年) , 但只关注小财富和贫困的区域估计 , 特别关注统计差异methodology across studies. In particular, it ignored some of the excellent recent work on agricultural作物和产量 (Lobell 等人 , 2020 年 , Erciulescu 等人 , 2019 年) , 劳动力 (Merfeld 等人 , 2022 年) 和其他指标。现在有大量文献记录了对财富和贫困的估计来自调查和地理空间数据与来自调查或人口普查的基准相关。这些相关性的强度差异很大 , 取决于无数的因素 , 包括国家背景、预测方法、预测目标区域、确切指标被预测 , 地理空间变量的选择 , 以及训练和评估数据的性质。由于文献相对较新 , 因此尚未就最佳预测达成共识。方法在不同的背景下。此外 , 在相同的情况下 , 替代预测方法的比较地理环境仍然很少见 , 这些比较的一些例子还没有1 已在同行评审的期刊上发表。因此 , 下面提供的大多数证据跨替代模型的比较应解释为基于有限的暂定先验来自特定环境的证据。这篇综述分为三个部分。第一部分首先非常简要地描述了一些许多公开可用的地理空间指标。然后 , 它回顾了来自快速增长的选定研究文献使用地理空间数据评估小区域财富和贫困估计的准确性 ,与基于人口普查的估计相比 , 记录了几项研究之间的强相关性。 I然后简要谈谈三个相关问题 : 准确性对训练数据性质的敏感性 ;地理空间数据预测福利随时间变化的能力比变化更有限跨空间 ; 以及采样和非采样目标区域之间的重要区别考虑估计的准确性。第二部分侧重于不同的比较横截面预测的统计方法类型 , 包括地理空间的性质用于预测的特征和不同类型的模型。第三部分简要讨论了最近的重要论文描述了如何将调查和地理空间数据结合起来以针对穷人多哥的家庭 (Aiken 等人 , 2022 年) 。最后一节总结了关键点和进一步研究的建议。2. 利用地理空间数据对贫困和财富的小区域估计a. 什么类型的地理空间要素是公开可用的 ?地理空间数据通常来自卫星、移动电话或互联网活动。卫星与手机和互联网活动相比 , 指标有一些关键优势 , 包括大量指标的公共可用性 , 在许多情况下来自公开可用的图像由 Sentinel 2 和 Landsat 卫星提供。专有高分辨率卫星图像 - 来自Maxar 、 Planet 、 Airbus 等公司也可以直接用作输入深度学习模型 , 或作为输入得出可解释的特征 , 如建筑足迹、道路、和车辆。与呼叫详细记录不同 , 基于卫星的指标通常覆盖整个国家和因此避免选择偏差。除了仅从移动电话呼叫详细记录 (CDR)代表手机用户 , 出于隐私原因也更难获得。然而 , CDR在某些情况下可以提供更多的信息指标 , 如位置信息 , 手机行为、连接质量和设备类型。 Twitter 使用情况等 Internet 记录也可以提供信息 (Tonneau et al, 2022)。来自网络平台的信息也存在选择偏差 ,然而 , 由于发展中国家只有一部分人口使用它 , 很难估计这种偏差来源对估计的影响程度。来自卫星图像的各种地理空间指标已经公开可以在 Google Earth Engine , Microsoft Planetary Computer 和其他免费访问中找到网站. These offer access to several climate - related variables as well as a host of predictive features例如夜间灯光 , 土地分类 , 从透水表面切换到不透水表面的年份 ,净初级产量、手机放置、各种气候和温度的估计变量 , Sentinel 5 - P 卫星的污染估计 , 各种土壤质量措施 , 以及无数其他地理空间指标。 Meta 还公开发布了相对财富指数 , 基于关于 Chi 等人的开创性工作。 (2021) 。从 Worldpop 、 Meta 或2 谷歌也是小区域估计的关键投入 , 因为它们都是福利的有力预测指标对于将预测汇总到更高的行政级别也是至关重要的。当可以获得有关建筑物足迹的信息时 , 这些信息也很有价值。 Worldpop 已经使关于非洲大部分地区可用的建筑足迹的统计信息 (Dooley 等人 , 2020 年) ; 这些是由 Ecopia 使用 Maxar 图像派生。 Microsoft 行星计算机现在还包含建筑物包括欧洲和美洲大部分地区以及非洲部分地区在内的各个国家的足迹数据和东南亚。谷歌最近发布了一个新版本的开放建筑层覆盖非洲和东南亚 , 德国航空航天中心最近发布了《世界解决方案》三维建筑足迹全球数据库 ( Esch 等人 , 2023 年 ) 。 Liu 等人 ( 2023 年 ) 最近显示可以使用 Sentinel 1 和 Sentinel 2 图像准确地建模建筑物的足迹 , 但是结果指标数据尚未公开发布。建筑物足迹的动态信息应该在不久的将来变得越来越可用。此外 , 各种数据农业和粮食安全通过粮农组织的手拉手地理空间平台在线发布包含有关粮食安全、作物和植被的信息。最近国家以下各级对作物类型的估计产量估计目前仅适用于少数国家 , 但覆盖面可能会扩大在未来几年显着。总体而言 , 令人印象深刻的地理空间图像和指标是已经公开可用 , 未来几年应该会有更多的网络。b. 地理空间数据跨空间准确预测贫困和财富一些研究已经研究了财富或贫困的预测是如何从调查和地理空间数据与基于调查或人口普查的贫困和福利衡量标准进行比较。准确性通常使用 R 进行评估2, 定义为:∑ (푦 −푦̂ )2(1) 푅2 = 1 −푖푖푖∑ (푦 −푦̅)2푖푖Where푖是目标区域 ,푦是目标地区贫困或福利的参考衡量标准푖,푦是푖푖目标区域 i 的预测值 , 以及푦̅푖是目标区域的平均值。一些研究报告了预测量和参考量之间的皮尔逊相关性 , 可以平方得到 R2.表 1 列出了实际或隐含的 R2几项研究报告的值。关于地理空间数据如何预测贫困和财富的重要早期论文是 Jean 等人 (2016) 。这论文使用卷积神经网络 (CNN) 形式的 “深度学习 ” 来预测福利 ,使用从 Google Earth 拍摄的白天图像和夜间灯光的光度撒哈拉以南非