您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[ADB]:利用地理空间信息编译粒度人口数据(英) - 发现报告
当前位置:首页/行业研究/报告详情/

利用地理空间信息编译粒度人口数据(英)

信息技术2021-12-01ADB如***
利用地理空间信息编译粒度人口数据(英)

使用地理空间信息编译细粒度的人口数据托马斯·米特林、凯瑟琳娜·芬茨、小阿图罗·马丁内斯、约瑟夫·布兰、米尔德里德·阿达威、罗恩·莱斯特·杜兰特和玛丽梅尔·马蒂兰不。 6432021 年 12 月亚行经济学工作文件丛书亚洲开发银行 亚行经济学工作论文系列使用地理空间信息编译粒度人口数据托马斯·米特林、凯瑟琳娜·芬茨、小阿图罗·马丁内斯、约瑟夫·布兰、米尔德里德·阿达威、罗恩·莱斯特·杜兰特和玛丽梅尔·马蒂兰643号| 2021 年 12 月Thomas Mitterling 和 Katharina Fenz 都是世界数据实验室的高级数据科学家。 Arturo Martinez Jr. 是一名统计学家; Joseph Bulan 是一名副统计分析师; Mildred Addawe、Ron Lester Durante 和 Marymell Martillan 是亚洲开发银行经济研究和区域合作部的顾问。亚洲开发银行 知识共享署名 3.0 IGO 许可 (CC BY 3.0 IGO)© 2021 亚洲开发银行6 ADB Avenue, Mandaluyong City, 1550 Metro Manila, Philippines 电话 63 2 8632 4444;传真 63 2 8636 2444保留部分权利。 2021 年出版。ISSN 2313-6537(印刷版)、2313-6545(电子版)出版物库存号 WPS210519-2DOI:http://dx.doi.org/10.22617/WPS210519-2本出版物中表达的观点是作者的观点,并不一定反映亚洲开发银行 (ADB) 或其理事会或其所代表的政府的观点和政策。亚行不保证本出版物中数据的准确性,也不对使用这些数据的任何后果承担任何责任。提及特定公司或制造商的产品并不意味着它们得到亚行的认可或推荐,而不是其他未提及的类似性质的公司。通过指定或提及特定领土或地理区域,或在本文件中使用“国家”一词,亚行无意对任何领土或地区的法律或其他地位做出任何判断。这项工作在知识共享署名 3.0 IGO 许可 (CC BY 3.0 IGO) https://creativecommons.org/licenses/by/3.0/igo/ 下可用。使用本出版物的内容,即表示您同意受本许可条款的约束。有关归属、翻译、改编和许可,请阅读 https://www.adb.org/terms-use#openaccess 上的规定和使用条款。此 CC 许可不适用于本出版物中的非 ADB 版权材料。如果该材料归属于其他来源,请联系该来源的版权所有者或出版商以获得复制的许可。对于因您使用该材料而产生的任何索赔,亚行不承担任何责任。如果您对内容有任何疑问或意见,或者如果您希望获得不属于这些条款的预期用途的版权许可,或获得使用亚行标志的许可,请联系 pubsmarketing@adb.org。亚行出版物的勘误表可在 http://www.adb.org/publications/corrigenda 找到。笔记:在本出版物中,“$”是指美元。亚行承认“美国”为美国。亚行经济学工作论文系列提供了正在进行的研究和研究的数据、信息和/或结果,以鼓励思想交流,并就亚太地区的发展问题征求意见和反馈。由于本系列中的论文旨在快速轻松地传播,因此内容可能会也可能不会经过完全编辑,并且可能会在以后进行修改以供最终出版。 内容I.II.A.B.III.A.随机森林 6B.贝叶斯模型平均 8IV.V. 表格和数字表1人口密度预测的均方根误差和平均误差14A12017年泰国用于估计人口密度的变量描述19数据1亚洲和太平洋发展中国家的调查和普查频率经济体22亚太地区统计能力指标地区33人口密度的随机森林预测2015114泰国前 10 个协变量的随机森林变量重要性2015125土地覆盖等级 190 与曼谷的人口密度2015136乌隆他尼人口密度预测2020157乌泰他尼 (Uthai Thani) 人口密度预测2020158泰国夜功府人口密度预测2020169从 2013 年到乌隆他尼 Mak Khaeng 人口密度的预期变化202017 抽象的关于人口分布的精细空间信息与健康、经济和公共部门规划的其他领域等各种领域相关。本文应用集成方法,旨在评估它们在网格级别分析和预测人口密度的适用性。第一步,我们使用随机森林方法在 100 米乘 100 米的水平上估计菲律宾和泰国的人口密度。其次,我们使用不同规格的随机森林和贝叶斯模型平均技术来创建泰国三个省的网格级人口密度预测并评估它们的预测能力。关键词:人口图谱、大数据、随机森林估计、菲律宾、泰国JEL代码:C19、D30、O15 I.介绍要了解拥有关于人口分布的准确和及时数据的重要性,了解如何使用这些数据很重要。 人口数量为广泛的决策领域提供信息,并帮助政府评估需要分配资源和投资的地方(Balk 等人,2017 年)。 2006;萨尔瓦多等人。 2005;泰特姆等人。 2012)。 随着人口规模在未来几十年继续保持动态变化,准确的数据和人口分布预测变得更加重要(联合国经社部,2018 年)。 通过空间分解的人口数据集,政府可以确定需要新道路、学校、医院以及其他基础设施和服务设施的区域。 2030 年可持续发展议程进一步强调了人口数据的重要性,其中人口计数对于监测广泛的指标是不可或缺的。 此外,在按收入、年龄、性别、种族、移民和残疾状况以及地理区域评估人们的状况时,需要进行人口计数。 准确和更新的人口数量对于规划应对灾害和其他经济冲击的干预计划也很重要。最近,当冠状病毒疾病大流行来袭时就证明了这一点,因为各国和经济体严重依赖人口数据,不仅要确定广泛感染的潜在热点,还要确定需要为特定人群和地理区域提供多少救济工作。鉴于拥有准确、及时和精细的人口数据的重要性,人口数量构成了国家统计局或其他政府机构收集的基本数据类型之一,其任务是收集对政策规划有用的数据。编制人口数据有多种渠道。在许多发达国家,人口数据是从国家出生和死亡登记册中提取的。国家登记册中记录的信息的准确性、从地方到国家级登记系统的同步以及其中记录数据的更新频率决定了可从国家登记册中提取的人口数量的质量。国家人口登记如果管理得当,具有产生近乎实时的人口数据的优势。除了国家登记册,人口和住房普查也被认为是编制人口数字的常用数据收集工具之一。事实上,世界人口和住房普查计划是历史最悠久的全球统计计划之一,它承认家庭和人口普查作为提供人口分布数据的重要来源的重要性。国家统计局或类似的政府机构在进行人口和住房普查的模式上有所不同,这些模式中的每一种都在以具有成本效益的方式最大化响应率,同时保持高质量数据方面各有优缺点。传统方法依赖于面对面的采访。通过训练有素的访谈员,面对面访谈确保了对问题的共同理解,从而促进了全国数据的可比性。显然,这种模式需要更大的成本来进行人口和住房普查。另一方面,其他国家通过邮寄调查问卷并让人们选择通过邮件或互联网回答来进行普查。这些方法可能更具成本效益,但可能更容易出现系统性无响应模式。其他国家也进行电话采访。尽管有多种方法可以将进行人口和住户普查的成本降至最低,但事实仍然是财政拮据的国家无法经常进行普查。平均每 10 年进行一次人口和住户普查。在亚洲和 图 1:亚洲和太平洋发展中国家的调查和普查频率 注:分析使用了亚洲开发银行 28 个区域成员经济体的结果。资料来源:改编自亚行。 2021。2021 年亚洲及太平洋地区的主要指标.马尼拉。 (图 4.1)。2 亚行经济学工作论文系列第 643 号在太平洋地区,不到 10 个国家比每 10 年更频繁地进行一次人口普查,因为进行一次的人均成本约为 2.04 美元(SDSN 2015)。这证实了亚洲开发银行 (ADB) 统计和数据创新部 (SDIU) 进行的一项调查的结果,该调查结果表明,尽管随着时间的推移,整体统计能力的改进(图 2)。冠状病毒病大流行进一步加剧了及时进行人口普查的挑战。全球有 120 个国家或经济体推迟、推迟或取消了各自的人口普查(UNCTAD 2021)。其中一些国家改变了他们的数据收集方法以推进他们的普查活动。在亚洲和太平洋地区,SDIU 调查的 10 个成员经济体中有 6 个将其普查实地活动重新安排到 2020 年末或 2021 年。促进及时的普查数据汇编。人口数据的代表性是另一个可以进行潜在改进的领域。遥控器或CON流动性地区的人口估算的准确性和质量可能会受到批评,因为收集这些地区的数据挑战,特别是当面对面访谈是所选数据收集模式时。由于人口数据可以在空间上分解的程度受到数据收集工具中包含的地理信息范围的限制,因此粒度也可以改进。然而,随着研究和决策变得越来越复杂,对更及时、更具代表性和粒度的人口数据的需求也在增加。为满足此类数据要求,正在探索编制人口数据的替代方法。这些方法多种多样,但其中许多方法利用传统上不用于人口估计的数据源。 使用地理空间信息编译粒度人口数据 3图 2:亚太地区统计能力指标注:该分析使用来自亚行区域成员经济体的数据,这些数据具有统计能力指标 (SCI) 的估计值。资料来源:改编自亚行。 2021。2021 年亚洲及太平洋地区的主要指标.马尼拉。 (图 4.2)。 4 亚行经济学工作论文系列第 643 号创建非常精细的人口地图的一项主要资源是基于卫星图像的数据。遥感数据的使用已经在人口密度研究中得到很好的证实,并且在最近和准确的人口普查数据有限的国家中被证明尤其重要。然而,即使在拥有丰富可靠的人口普查和调查信息的国家,卫星图像在将估算推向更精细的地理层面方面也发挥着核心作用(Tatem 等人,2007 年)。这就是为什么相当多的研究已经将遥感数据用作输入数据的主要来源,或者将其与人口普查信息结合使用(Anderson 和 Anderson 1973;Bhaduri 等人 2007;Chen 2002;Linard、Gilbert,和 Tatem 2011;Linard 等人 2012;Sutton 等人 2001)。除了粒度之外,卫星图像的另一个优点是它甚至可以在面对面采访等干预不可行时进行更新。因此,在大流行期间等特殊情况下,该来源变得更加重要。通常,大多数编制网格级人口密度的举措都依赖于基本的dasymetric 人口映射的应用(Balk 和Yetman 2004;Balk 等人,2004 年)。 2006;托布勒等人。 1995)。 Dasymetric 人口映射需要将行政区域划分为更小的空间单位,在这些空间单位上平均人口规模以计算人口密度。 世界网格人口数据库和全球农村城市测绘项目是使用这种方法生成的全球数据集的示例。 为了获得他们的估计,世界网格人口使用了跨普查单位的简单重新分配,而全球农村城市测绘项目专门考虑了人口普查单位内人口空间分布的农村和城市地区。 另一个覆盖全球的数据集是 WorldPop 的网格人口计数数据库。 WorldPop 应用了一种更加精细的方法,该方法基于随机森林估计技术(Stevens 等人,2017 年)。 2015)。 这种 dasymetric 重新分配方法允许包含范围广泛的输入数据,包括来自不同尺度的遥感和地理空间数据。 此外,随机森林受益于非参数空间预测,然后使用当代行政边界关联的地理信息系统人口普查数据跨空间锚定。 这种方法也代表了本文中描述的估计的基础。LandScan 和联合国环境规划署 (Bhaduri et al. 2007;戴希曼 1996 年;多布森等人。 2000)。 一些研究,如 Azar 等人的研究。 (2010);阿扎尔等人。 (2013);和 Lung 等人。 (2013) 还使用高分辨率卫星图像来获得特定国家人口密度的粒度估计。最近,史蒂文斯等人。 (2015) 提出了利用遥感和地理空间数据进行人口测绘的集成方法。特别是,他们开发了一种新的半自动 dasymetric 建模方法,该方法在灵活的随机森林估计技术中结合了详细的人口普查和辅