2摘要关键词:母性,劳动成果,非参数,伪面板,事件研究JEL编码:D63、J13、J16、J22、J31我们提出一种非参数方法来研究准事件,以检验母职收入惩罚。通过结合非参数匹配和准事件研究,我们解决了文献中强调的局限性,例如男性与女性在不同时期和时间段内缺乏共同支持,以及使用逆概率加权在观测单元内的处理分配异质性。与现有方法相比,我们的方法还提供了一种更有效的准事件估计量。我们使用萨尔瓦多的数据证明了我们方法的优势,以往的研究发现该地存在相对较高的母职收入惩罚。与这些发现相反,我们发现母职收入惩罚低于标准估计所显示的水平。 _一。引言1.国家统计和普查局(ONEC,2023a)。我们的方法比当前方法具有优势。首先,分析收入惩罚依赖于Blinder-Oaxaca分解,该方法使用一种逆概率加权的方式来估计考虑了社会人口学特征效应后的收入惩罚。然而,Blinder-Oaxaca由于没有正确地将比较限制在男性和女性的可观测特征共同支持范围内,经常低估收入惩罚。此外,随着市场和社会的变化,可观测特征的分布也可能发生变化,导致在比较跨期截面时缺乏共同支持。生育子女对个体层面的各种结果具有重要影响,尤其对女性而言。实证证据表明,首个孩子的出生会导致女性劳动收入下降,这种现象被称为母职收入惩罚——这种现象也扩展到了其他劳动力市场结果。在本篇笔记中,我们提出了一种使用重复横截面数据来估计这种收入惩罚的方法,结合了非参数匹配和伪事件研究设计,基于 Kleven (2023) 的最新研究,并将其应用于萨尔瓦多。其次,虽然性别工资差距可以解释为平均处理效应,但这些参数回归中包含的控制变量通常是后处理的,因为几乎所有用作控制的观测特征通常都是性别和出生选择的函数。我们的方法通过使用非参数匹配在一定程度上规避了这些问题:有证据表明,以随时间变化的整个处理历史倾向得分倒数为权重的做法, 3混杂因素,在细胞层面,可以在不引入事后处理偏差的情况下,提高“其他条件不变”的比较,从而恢复更多结构估计。我们的方法使我们能够在可观察变量的分布中的每个细胞内均值差异,作为对共同支持范围内定向控制效应的平均计算。此外,它允许我们解决由于男性和女性之间可观察变量分布的差异以及随着时间的推移采样框架的变化所导致的分布差异,通过适当的重新加权。然而,随着非参数匹配程序中包含的可观察特征数量的增加,共同支持的大小会减小,即维度灾难。因此,研究人员必须平衡内部和外部效度的担忧。最后,我们的匹配估计是可加分离的,允许将“天真”的母亲收入惩罚分解为其组成部分,包括其因果效应。这使得研究人员能够在可观察变量的分布中研究惩罚的异质性,并附带标准维数灾难的警告。我们将我们的方法论应用于萨尔瓦多的原因有几点。首先,尽管在过去几十年里关于母亲身份对女性劳动成果的影响进行了大量研究,但我们对于发展中国家母亲身份收益惩罚的理解仍然有限。例如,在拉丁美洲和加勒比地区,先前的研究涵盖了该地区一些最发达的成员国(例如阿根廷、巴西、智利、哥伦比亚、墨西哥和秘鲁),但由于估计策略和数据质量,估计的母亲身份收益惩罚显示出高度的可变性。最近, 4第三,一份最近的报告显示,与其他所有国家相比,萨尔瓦多的结果有些奇特,这本身就使其成为一个有趣案例。母亲身份对收入的影响在所有样本国家中是最小的,减少了34个百分点,而下一个最小的影响估计值是萨尔瓦多的两倍(−12个百分点)。难以理解为什么与其他同地区的国家相比,萨尔瓦多的这种惩罚如此之低,一份报告采用了克列文(2023)开发的伪事件研究设计方法,估计了母职的显著盈余惩罚以及各国相对相似的惩罚。有趣的是,他们的估计在某些情况下与其它类似报告的估计相差约10个百分点。问题在于后者使用的样本与前者的样本不同,从而非同小异地影响了(研究)结果。其次,母亲身份对发展中国家劳动力市场结果的影响可能与发达国家有所不同,考虑到劳动力市场非正规程度更高、儿童保育覆盖率较低、带薪休假制度较不慷慨以及社会规范更加保守。例如,乌拉圭的非正规就业份额(未获得与工作相关的退休金)为8%,智利为13%,秘鲁为46%,墨西哥为57%。根据萨尔瓦多的家庭调查,劳动力非正规化的程度为56%。同样地,导致这种收入差距的因素可能与发达国家发现的因素有所不同。在具有更保守的社会规范或更弱的工作-生活平衡政策的社会中,劳动力市场对母亲身份的响应规模更大。因此,鉴于当地社会经济背景,有必要进行案例研究,以了解可能驱动这些收入惩罚的独特因素,即使考虑到比较评估的重要性。 要提及,这项处罚与一些发达的西欧国家和美国、加拿大相当。然而,萨尔瓦多在拉美人类发展指数中排名第20位,与其他拉丁美洲国家相比,在性别方面的各种结果与发达国家相似(附录A)。总而言之,我们的研究有助于性别收入差距的文献,特别是与母亲身份对这种差距的影响——即性别收入惩罚相关的研究。一方面,我们提出了一种非参数伪事件研究方法来估计收入差距,该方法解决了由于可观察特征的分布随时间变化以及处理分配的差异而导致的实证缺陷。我们证明这种偏差可能非常显著。另一方面,我们表明,我们的方法可能通过我们方法产生的非参数分解这一副产品,使研究人员能够更深入地分析母亲身份的惩罚。最后,我们分享了Kleven(2023)对于使用伪事件研究设计研究劳动经济学相关问题的乐观态度,通过讨论我们的非参数伪事件研究如何被用来调查其他社会经济结果。我们的结果表明,总的来说,收入差距在统计上与标准方法获得的数值相当,除了在考虑产后女性与男性相比在兼职工作中的差异化分布时。我们的方法表明,五年母亲身份带来的收入惩罚约为男性有利3%,而在不考虑这些分布差异时,该惩罚约为男性不利26%。虽然从长远来看,惩罚更高,但我们发现它约为男性有利7%——大约是我们使用标准参数方法估计的惩罚的三分之一。 方法论估算生育决策对男性和女性收入结果的影响——即女性的生育代价——是一项艰巨的任务。生育孩子的决定以及调整偏好和劳动力市场选择,是个体和家庭状况以及发挥作用中的性别角色的内生决定。例如,一些女性可能选择较少的教育或家庭友好的职业道路,因为她们知道最终会生很多孩子。同样地,在性别角色更为传统的家庭中,女性更有可能从事低薪工作,这些工作能为抚育孩子提供灵活性,但代价是较低的收入。同样地,在(男性)伴侣有高薪稳定工作的家庭中,也更容易处理女性配偶收入较低的交易——无论这是否来自花较少时间于职业发展,接受低薪工作,还是劳动力市场歧视。在其他情况下,女性可能需要哪里Y表示劳动收入;C是一个指标它信息技术那个取值为1的单独i生下他们的第一个孩子后;F取值为i一个个体i是女性,否则为0;X是出生前可观察的向量它特征(例如,工作小时数和职业);μ是一个个体层面的固定向量i捕获时不变不可观测效应 Y=δF×C+X+μ+γ+ε它i它它i t它 5为了使我们的方法更具说服力,让我们假设我们拥有面板数据,并且首次生育决定被认为是外生的。因此,让我们考虑比较首次生育对收入的影响:总而言之,上述内生性问题来源意味着存在复合的自我选择效应和女性收入潜在的不可观测决定因素。这些不可观测因素超越了性别差异(在其他条件相同的情况下),因为生育决定可能会加剧性别偏见。因此,任何对生育性别惩罚的“天真”分析都容易受到难以区分的大量偏差影响。为了必要性而接受较低的收入,如在低收入、单亲家庭中。协变量;和γ捕捉任何非单调t样本中所有个体共有的趋势。这里感兴趣的是参数δ,这对应于女性与男性相比在收入方面所经历的儿童惩罚。 这并不意味着我们对另一个会观察到相同的情况。此外,传统方法并不一定具有异质性鲁棒性,因为它们既没有解决跨组治疗分配中的异质性,也没有解决组间治疗采纳中的异质性。这成问题,因为治疗效果本质上是从有效的多重回归权重中得出的加权平均值。生育了首胎,女性受此事件的影响远比男性大。因此,女性生育一个孩子的收入惩罚可以被估算δ在上面的公式中:δ=E(Y|F= 1,C= 1) —E(Y|F= 0,— [E(Y|F= 1,C= 0) —E(Y|F= 0,Cδ=E(Y|F= 1,C= 1) —E(Y|F= 1,C— [E(Y|F= 0,C= 1) —E(Y|F= 0,C这些问题在使用重复横截面时会加剧,重复横截面通常用于研究性别结果,因为我们不会随时间观察到相同的观测值。因此,处理前后的观测值甚至可能不可比,而这是DID设计中一个必要的假设。实际上,让我们重新整理表达式δ以上: 6C= 1)it i它it i它= 0)]it i它it i它为了进一步使我们的论述更加稳固,我们将生育子女视为处理,并将性别视为接受处理的水平。标准假设是,在随机分配的情况下关于DID的文献表明δ如果我们有治疗前的平行趋势,那么就会被识别出来。这种“平行趋势”假设意味着在那些有孩子的人没有孩子的反事实情况下,他们在平均收入随时间变化的轨迹上必须与那些有孩子的人相同。然而,最近关于双向固定效应(TWFE)的文献表明,满足平行趋势假设可能是不够的。首先,平行趋势假设表明,在可观察协变量的条件下,处理组和控制组之间的趋势是相同的。然而,如果我们用一组协变量观察到平行趋势,它= 0)it i它it i它= 0)]it i它it i它δ生育对男性和女性造成的差异效应,即收入惩罚。注意这种设计本质上是一个双重差分(DID)设计。 7虽然上述问题可以通过结构方法捕获,或在一定程度上利用双向固定效应估计器的新发展来解决,但我们认为采用伪事件设计有很大收获,因为它允许我们创建合成替代品。这紧密遵循了合成控制匹配背后的思想。但一个重要的注意事项是,我们必须考虑到随着劳动力市场和人口结构的变化,抽样框可能会发生重大变化。此外,男性和女性必须在每个时间点都是可比的,以正确控制合成个体和时间固定效应。然而,男性和女性的可观察特征不同,并且这些差异随时间变化。这很重要,因为我们可能面临共同支持不足的重要问题为估计母亲惩罚,伪事件研究设计旨在利用围绕第一个孩子出生的事件研究,索引为事件时间t= 0。然后,每个人都在事件时间匹配t= 0 to a childless person n years younger and thus n years before, using aset of observable demographic characteristics. Thismatched observation provides a substitute for thoseobservations measured att< 0 且对于同样成立t>0. 要做到这一点,我们需要假设生育孩子的决策时间是外生的,条件是可观测的并且条件是收入。问题是,生育孩子的决策在这方面不是准随机的。只有一个孩子或生育更多孩子的决定取决于孩子的历史,并且可能取决于过去结果的实际实现,因为对孩子的需求是一个动态过程。通常,我们可以假设当满足某些条件时人们会生育孩子,比如达到一定的收入水平或工作稳定性——尽管在某些情况下,意外怀孕、失去孩子或其他类似的变量源也可以被认为是外生的。 一个等价解释为δ生育对男性和女性的差异化影响。这种等同性在处理或处理接受是外生的情况下会出现,众所周知,我们在交互项中只需要一个外生成分就可以将其解释为因果关系。相反,这意味着所分析的对象在事件前后必须相似——这在面板数据中是通过构建满足的,但在我们进行的重复横截面数据中不满足,因为我们没有观察同一对象随时间变化的情况。换句话说,我们在事件后可能会观察到类似于自我选择的现象。为解决这些不足,我们可以采用事件研究设计,因为这些设计有助于我们在事件(例如,生育孩子)前后确保协变量平衡,从而我们知道我们在进行“其他条件相同”的比较。通常这意味着要限制事件发生时间周围的时间带宽,“紧邻事件之前和之后”,因为远离事件发生时间的观测值很可能彼此不同。然而,在使用横截面数据时,我们无法控制个体层面的时间不变协变量。为了规避这些问题,当存在重复截面数据时,可以使用伪面板来从队列总和中获得一致的估计量。这些队列相当于拥有合成个




