AndrewKerrMxolisiZondi 政策研究工作文件10836 Abstract 本文描述了准确衡量低收入和中等收入国家收入和财富分布上尾部的挑战。它回顾了文献中关于衡量收入分配顶部的开创性贡献,然后是最近的工作,重点是这样做的挑战和提出的解决方案。本文主要关注收入,但专门用一节来研究收入的衡量。 财富分配的顶部以及与衡量收入相比的关键差异。然后,它确定了文献中的差距以及对从事该领域研究的人的影响。最后,本文提出了一个研究议程,以缩小已确定的从业人员的关键差距,区分当前数据集可以采取的步骤和需要新数据的步骤。 政策研究工作文件系列传播了正在进行的工作结果,以鼓励就发展问题交换意见。该系列的目标是快速得出发现,即使演示文稿还不够完善。论文带有作者的姓名,应相应地引用。本文表达的发现、解释和结论完全是作者的观点。它们不一定代表国际复兴开发银行/世界银行及其附属组织的观点,也不代表世界银行执行董事或它们所代表的政府的观点。 衡量收入和财富分配的上尾 Andrew Kerr1和Mxolisi Zondi2 JEL分类: D31, C81 关键词:收入分配,财富分配,上尾,测量,家庭调查 Introduction 本文描述了准确衡量低收入和中等收入国家收入和财富分布上尾部的挑战。我们首先回顾了文献中关于衡量收入分配顶部的开创性贡献,然后是最近的工作,重点是这样做的挑战和提出的解决方案。我们最初关注的是收入,但随后专门研究了财富分配顶部的衡量以及与衡量收入相比的关键差异。然后,我们确定了文献中的空白以及对从事该领域研究的人们的影响。最后,我们提出了一个研究议程,以缩小已确定的从业人员的关键差距,区分那些可以用当前数据集进行的和那些需要新数据的。 Kzets和Jes(1953)具有里程碑意义的研究汇集了税收数据,新创建的国民账户和美国人口估计,以估计最高百分位数获得的收入份额。随后在其他国家进行了类似的研究,但是由于Pietty(2001年,2003年)的工作,分布的顶部被忽略,直到在过去20年中恢复。在Pietty的工作之后,研究人员使用了官方报告中的税收表格,但是Pietty也使用的税收微观数据的可用性也进一步推动了调查收入和财富分配顶部的研究议程。《经济不平等杂志》2022年特刊的标题为“寻找上尾巴”,表明这是一个活跃的研究领域。我们从下面的特刊以及Lstig(2020)的几篇文章中得出,在讨论衡量收入和财富分配的顶尾以及解决方案时出现的挑战时。 阿特金森(2007)提供了两个动机来更好地衡量收入分配的顶端— —提高对国家通过增加税收水平来增加额外收入的能力的认识,并衡量高收入的人在多大程度上拥有对其他人的指挥权或权力,包括阿特金森所说的“精英分离”的支付能力,他强调这是一件坏事。 更好地衡量收入分配顶部尾部的另一个动机是,虽然许多研究承认顶部尾部在调查中没有得到很好的衡量,但它被低估的程度是未知的。一个常见但非常近似的统计数据表明了许多国家存在的问题,即调查中的总收入或消费与国民账户之间的差异(Laer和Milaovic,2016)。Prydz等人.Al.(2022)表明这些差异是巨大的,并认为顶部尾部收入或消费的低估是解释的一部分,尽管有多少解释低估了。 目前尚不清楚最高的尾部账户以及这在不同国家或时间之间的差异。本文讨论的研究提供了来自许多国家的证据,表明对顶尾的更好测量会增加分配顶部的估计份额,因此可以解释调查和国民账户对总收入或消费的估计之间的大部分差异。 开创性论文 在缺乏关于收入的代表性调查数据的情况下,Kzets和Jes(1953)的开创性研究使用了来自美国税收统计的汇总数据来衡量分布顶部的收入,以及来自国民账户的人口和国民总收入作为控制。库兹涅茨(1963)从包括11个发展中国家在内的18个国家的各种来源收集了类似的信息。3他的结论是,发展中国家中收入最高的5%的份额比发达国家大得多,尽管发达国家和发展中国家中收入最低的60%的份额相似。由于某些数据来自税收统计数据,因此有时会使用参数方法估算分布中下层的份额,例如通过使用税收数据估算收入分布顶部的帕累托系数,并以此来估算其余分布的不同部分的份额(Kzets,1963:15)。 最近的文学 Pietty等人。(2022)注意,在库兹涅茨在1950年代和1960年代的工作之后,家庭调查和由此产生的微观数据变得更加普遍。这意味着可以对整个收入分配进行审查,而不是仅对最高(或最高和中间)进行审查,从而鼓励在进行有代表性的家庭调查的更多国家中对贫困和不平等进行研究。这意味着几十年来,对收入分配高端的关注大多被忽略,而对不平等的指数衡量并没有把重点放在分配的高端,这与库兹涅茨的工作不同(Milaovic,2014)。 对收入分配最高端的忽视以皮凯蒂发表了对法国20世纪最高收入和财富份额的长期估计(皮凯蒂,2001年,2003年),重新激发了对收入和财富分配最高端的研究。Pietty(2003)在分析20世纪大部分时间法国的不平等时使用了类似于库兹涅茨(1953)使用的数据和方法-国民账户数据,已发布的带有汇总数据的税表。 on taxers in various tax stores and interpolation using the Pareto distribution. But Piketty (2003: 1007) notes that hecould check the reliability of such methods because tax microdata was available for later period, in addition to thetax table. Pietty的工作刺激了2011年世界最高收入数据库(WTID)的创建,该数据库使用与Pietty原始工作中使用的类似数据创建了30个国家的最高收入不平等统计数据(Alvaredo等人。, 2016)。WTID后来被纳入世界不平等数据库,该数据库扩展了WTID以创建分布式国民账户(DINA)。DINA项目旨在提供与国民账户一致并随时间和国家统一的收入和财富分配估计数(Alvaredo等人。2016)。为此,需要家庭调查数据,国民账户数据,理想情况下需要税收微观数据或汇总数据。而且,由于对这些数据源的比较通常表明,家庭调查确实无法捕获收入和财富,因此我们在下一节中讨论的一些关于衡量收入分配顶部尾部的研究以及这样做的挑战来自与DINA项目直接相关的研究人员。 收入不平等的程度 对收入分配的顶部尾部的合理定义是顶部的10%。使用世界不平等数据库(WID),我们简要描述了收入分配的前10%的份额,使用每个地区或国家的最新估计。在所有有数据的国家中,不包括外推或内推的统计数据,前10%的份额为47%。这一比例在欧洲仅为37%,但在美国为48%,在撒哈拉以南非洲为56%,在拉丁美洲为58%,在中国为43%,在印度为57%。这些估计来自各种来源,质量各不相同,但最重要的是,分配的顶部获得总收入的很大一部分。下一节将讨论使用调查和管理数据准确捕获顶尾的挑战。 在家庭调查中准确捕捉头尾的挑战 在本节中,我们记录了希望使用家庭调查来衡量收入分配顶部的研究人员所面临的挑战。在此之后,我们将重点放在使用其他类型数据时的挑战上,主要是行政数据,如税收或社会保障记录或房价。正是由于在使用家庭调查时遇到的挑战,因此使用了行政数据。然而,这些类型的行政数据在低收入国家非常罕见,在中等收入国家仍然不寻常。因此,家庭调查仍然非常重要,这就是为什么我们花一些时间记录与使用它们相关的挑战。在此过程中,我们遵循Lstig(2020)和Ravallio(2022)的最新论文,尽管我们以各种方式补充了这些论文。 In the discussion below we refer most to the challenges of measuring the top tail of the income distribution. Butmost of the challenges we discussed apply to measuring the wealth distribution as well. We provide a specificsection on how these challs differ 单位无响应 衡量收入分配顶部尾部的一个关键挑战是单位不响应。这意味着样本中包括了一个家庭,但没有收集到关于该家庭的信息。单位无反应的主要原因是拒绝和非接触,拒绝可能更常见(Ravallio,2022)。单位无反应通常被分类为完全随机丢失(MCAR),随机丢失(MAR)或不随机丢失(NMAR)(Lohr,2009)。这些分别意味着非响应是可忽略的,非响应是在某些协变量的条件下可忽略的,或者它是不可忽略的,i。Procedres.,它与利息的结果相关,这里是收入或财富。 我们没有找到世界银行生活水平测量调查(LSMS)的单位不响应水平和趋势的全面概述。斯科特等人。(2005)确实审查了20世纪90年代末和21世纪初8个LSMS的反应率,发现无反应率为11%。Vaesse et al.(2005年)报告说,1990年至2000年期间,在44个发展中国家进行的人口和健康调查的平均不答复率为2.5%。这一点,再加上收入问题可能低于健康问题或对健康问题同样敏感的事实,表明低收入国家对包括收入问题在内的调查的单位不答复率可能比富裕国家低得多。Hlasy(2020)使用卢森堡收入研究对38个中高收入国家进行整理和协调的调查显示,未答复率与人均GDP相关。人均购买力平价GDP约为10, 000美元的国家的平均未答复率为10%左右,而人均收入约为25%。 在衡量收入分配的顶部时,关注的是分配顶部的单位不响应率。Ravallio(2022)指出,缺乏调查中富人失踪的直接证据。作为他们失踪的证据,他引用了Sz é ely和Hilgert(2007)的一篇论文,他使用了18个南美国家的家庭调查数据,该数据显示,每次调查中收入最高的人的收入与中型公司的经理的收入相似,这意味着分配的顶部缺失了。Ravallio(2022)指出,认为富人失踪的一个原因是富人的机会成本较高,因此可能不太愿意做出回应。Chomert - Nolo等人。(2023)关注无反应,并断言低收入和中等收入国家(LMICs)的高收入家庭经常生活在门控中。 更难以进入的社区,导致通过非接触的无反应率更高,尽管他们没有为这种(合理的)断言提供证据。 Keicel (2019)显示,美国消费者金融调查中的非回应率对于收入分配最顶端的人来说要高得多。该调查有两个样本框架,一个是使用常规家庭调查框架得出的,另一个是针对富裕家庭的,该框架是根据纳税申报人的数据得出的。对于纳税申报人衍生样本框架中最富有的阶层,被描述为“位于前1%的上游的群体”,2013年的回应率不到10%,而从普通家庭样本框架中获得的样本中,回应率为66% (Keicel,2019:446)。 Hlasy和Verme(2018)使用埃及收入和支出调查的数据显示,人均平均收入较高的埃及各省的单位无回应率较高。南非的国民收入动态研究(NIDS)获得的单位无响应率远远高于先前提到的LMIC调查- 31%。初级抽样单位(PSU)中主要种族群体的种族不响应率也有所不同。主要的白色区域的无反应率为64%,而主要的黑色区域的无反应率为24% (Leibbradt等人。2009).由于南非的种族与收入呈强烈正相关,因此这意味着无反应率随着收入的增加而增加,这是衡量收入分配顶部时的一个问题。 项目无响应 我们已经注意到,如果富人的不回应率很高,拒绝或不接触可能会限制一个人衡量收入分配顶部的程度。但那些对调查做出回应的人可能不会回答关于收入、财富或消费的具体问题,因为这些问题更敏感。此问题称为项目未响应。与单位无反应一样,这可能是完全随机