AI智能总结
10695 记录时分 基于智能手机和召回的时间使用测量方法的比较研究 Talip KilicGayatri KoolwalWilbertDraziVundruThomasDaumHannesBuchwaldGregSeymourPeter Mvula AlisterMunthali MoniceKachinjika 政策研究工作文件10695 Abstract 基于马拉维的一项随机调查实验,本研究探讨了时间使用数据收集中的创新技术如何与传统的基于召回的时间使用测量相回避测量问题。该实验将家庭和成年男女的随机样本分配给两个治疗组之一的时间使用测量:传统的24小时回忆时间使用日记和自我管理的基于智能手机的图片时间日记,称为 手臂,除了估计性别差距增加的护理工作。召回处理导致下午6点之后的活动大量减少,否则这占了智能手机手臂每日报告时间的近30%。同样,在召回机构中,同时活动的程度,特别是在妇女中,明显较低。然而,由于用于记录24小时召回日记的活动的持续时间至少为15分钟,因此召回臂的总体报告时间更高,而超过三分之一的活动在智能手机臂中持续不到15分钟。分析还表明,使用程式化的时间使用问题进行7天的召回,而不是24小时的召回日记,会导致报告的就业和无薪工作时间的高估。 TimeTracer应用程序,用于实时数据收集。与召回部门相比,智能手机部门的男性和女性参与就业和无偿家务和护理工作的比例都较高。由此产生的性别差距估计虽然仍然很大,但在智能手机中却缩小了。 本文是发展经济学发展数据组的产物。这是世界银行为开放其研究并为世界各地的发展政策讨论做出贡献的更大努力的一部分。政策研究工作文件也在http: / / www上发布。世界银行。org / prwp.可以通过tilic @ worldba与作者联系。org和goolwal@ worldba。 政策研究工作文件系列传播了正在进行的工作结果,以鼓励就发展问题交换意见。该系列的目标是快速得出发现,即使演示文稿还不够完善。论文带有作者的姓名,应相应地引用。本文表达的发现、解释和结论完全是作者的观点。它们不一定代表国际复兴开发银行/世界银行及其附属组织的观点,也不代表世界银行执行董事或它们所代表的政府的观点。 塔利普·基利卡,加亚特里·库尔瓦拉,威尔伯特·德拉齐·文德鲁亚,托马斯·道姆,Hannes Buchwaldc, Greg Seymourd, Peter Mvulae, Alister Munthalie, Monice Kachinjikae1 JEL代码:C83,J16,J22。 关键词:时间使用,就业,无报酬工作,召回偏差,智能手机时间使用日记,调查方法,家庭调查,性别,马拉维,撒哈拉以南非洲 1.背景 关于个人时间使用的代表性调查对于理解男女经济决策和强调家庭内部和家庭之间更广泛的不平等非常重要。有效设计、确定目标和评价与劳动力发展、提供儿童保育和改善运输服务等有关的政策/项目,还需要准确衡量不同亚群体中男女的时间使用和时间使用差异。 可用的时间使用调查显示,在不同活动的时间分配方面,包括无偿家务和护理工作,这在劳动力调查和社会经济家庭调查中经常被遗漏(Charmes,2019; Hirway,2017)。虽然各国以不同的格式实施了时间使用数据收集——无论是作为独立时间使用调查的一部分,还是作为劳动力调查或社会经济家庭调查一部分的时间使用模块的一部分,低收入和中等收入环境中的时间使用数据收集要么依赖于采访者协助的基于回忆的时间使用日记— —通常是过去24小时,要么依赖于回忆程式化的问题,即在给定的参考期内,可以是最后一天、最后7天或最后30天(妇女署,2021年)。 这些调查设计选择引起了人们对回忆时间使用中潜在认知错误的担忧(Seymor等人。,2020年),特别是在识字和计算能力较低、经济活动难以预测的情况下,包括在小农农业盛行的国家(Arthi et。艾尔,2018;菲尔德等人。,2023)。3串联进行的活动也可能更难以回忆,这取决于活动发生的频率(规律性)以及与其他活动的可区分性(显着性)(Meo,1993;Brow等。,2007)。这些错误也可能在较短的参考期内发生(Sdma和Bradbr,1973)。 尽管这些测量挑战可能对我们对时间使用中的性别差异的理解(Floro和Miles,2003;Bdig和Folbre,2004)以及依赖于时间使用数据的分析应用有直接影响,包括设计和评估对性别问题有敏感认识的政策,以改善男女的经济机会和福祉(世界经济论坛,2021年;Kig等。,2021),很少有证据表明依赖基于召回的调查方法可能会如何影响时间使用数据的准确性和可靠性。基于回忆的日记实施起来也很耗时,最近的工作也很耗时(Field等人。,2023年,国际劳工组织,2023年;Folbre,2021年)讨论了简化时间使用日记的作用(例如,通过减少或汇总活动类别的数量),作为更密集的数据收集的替代方案。 在此背景下,我们提出了在马拉维进行的大规模随机调查实验的新发现,以记录基于召回的时间使用调查数据收集方法的相对准确性。该实验将家庭和成年男女的随机样本分配给两个治疗臂中的一个时间使用测量:传统的24小时回忆时间使用日记;和一个自我管理的基于智能手机的图形时间日记,称为TimeTracer应用程序。虽然在高收入环境中的其他调查中已经探索了实时数据收集的使用时间(Gershy等人。,2020年),我们的研究是迄今为止在低收入国家实施的规模最大的研究,扩展了关于基于智能手机的时间使用数据收集的可行性和实用性的新生证据基础-以前仅适用于赞比亚,尽管适用于小得多的农村样本(Dam等人。,2018年,2019年)。除了我们工作的方法论贡献外,我们还揭示了有关日内变化和时间使用同时性的新的政策相关见解。 该分析比较了11天报告期内两个调查治疗组的男性和女性自我报告的时间分配,以对较短(24小时)和较长(7天)召回期的实时和基于召回的调查方法进行分类,比较分析: (1)在第一个治疗部门中,每个家庭中的一名成年男子和成年女子(15 - 64岁)都收到了一个基于Adroid智能手机的图形时间使用日记应用程序,称为TimeTracer4,可以连续,实时地自我报告他们在一系列活动中的时间使用情况。该应用程序是专门为低识字率环境中的时间使用数据收集而开发的(Dam等人。,2018),受访者不一定有基于时钟的时间概念,也没有智能手机的先前经验。(2)在第二治疗组,在本报告所述期间,每个家庭的一名成年男子和成年妇女在不同的三天接受了传统的基于回忆的24小时日记访谈,面试官要求受访者回忆过去24小时的时间分配,并根据受访者的叙述将报告的活动编码为15分钟的间隔,每个15分钟的间隔最多可以记录两个同时进行的活动。召回日记臂中的报告涵盖了与智能手机臂中相同的活动设置。(3)最后,在本报告所述期间结束时,两个治疗组的受访者都收到了一个程式化的基于访谈的7天召回模块,涵盖了智能手机/召回日记方法中的一部分活动。7天模块遵循劳动力调查或社会经济家庭调查中通常实施的结构(Seymor等人。,2020),并允许我们调查相同的群体在不同长度的召回期内如何改变他们的反应。 我们的发现涵盖了三个关键领域,对文献有重要贡献。首先,关于不同活动的参与和时间,我们表明智能手机和召回武器提供了非常不同的观点,以及在两个武器中突出显示的活动集的有趣二分法。例如,回想一下,导致参与就业和无偿工作的报告不足,包括较低的。 农村妇女分担护理工作。另一方面,我们观察到召回部门对休闲和自我护理活动的参与度更高,包括个人护理,睡眠和食物消费。重要的是,智能手机部门还反映出男性更多地参与无偿工作的不同领域-因此,与召回部门相比,智能手机样本中无偿工作的性别差距虽然仍然很大,但仍在缩小。此外,我们表明,在召回部门中,男性和男性以及城市和农村地区,大多数活动的总报告时间平均较高。这一发现的主要驱动因素是设置24小时时间使用日记,以15分钟为间隔记录活动,而智能手机部门报告的活动中约有三分之一实际上持续不到15分钟,其中非农业就业,无偿家政和护理工作以及自我护理活动占这些任务的最大份额。鉴于时间使用日记的15分钟结构的常见用法(联合国妇女署,2021年;Seymor等人。,2020年),我们的发现强调了这种结构如何导致“四舍五入”和高估报告时间。 其次,智能手机数据收集提供了关于全天进行的活动的多样性和频率的更深入的见解,并且相对于召回治疗部门,彼此同时进行的活动(特别是非休闲活动)的发生率明显更高。这些关于时间分配的细微差别也可以帮助解释我们在召回部门中观察到的参与活动的一些下降。例如,回想一下,导致傍晚时分(下午6点之后)活动时间的报告大幅下降,尤其是在女性中。这些时间占日常时间的很大一部分-在智能手机领域,女性约占日常时间的26%,男性占日常时间的29%。我们讨论了召回部门晚上活动的漏报可能是由于受访者疲劳-因为每次召回面试可能持续30到40分钟-以及其他与面试相关的因素。我们还讨论了智能手机数据收集中与活动相关的弹出式窗口如何记录其他儿童的存在,可能突出了被动儿童保育的一个重要但未得到充分研究的维度(Folbre,2005),超出了受访者自己对儿童保育的估计。 第三,我们表明,与24小时召回日记相比,具有7天参考期的程式化召回模块对报告的每日时间的估计甚至更高。因此,从实时数据收集到24小时召回,再到7天召回,导致对就业和无偿家务和护理工作的时间分配的估计增加。最近对农场劳动的研究(Arthi等人,,2018;加迪斯等人。,2021)还发现更长的召回期(例如。Procedre,在过去30天或过去的季节相对于过去7天)高估了劳动时间。 我们的发现在不同的报告日是一致的,并且治疗效果对于控制一系列个人,家庭和社区特征是稳健的。我们还讨论了基于智能手机的数据收集的成功经验,包括以下事实:选定的参与者之间的下降是有限的;在记录的活动和时间方面有很高的持续参与;并且在整个研究期间使用应用程序的熟练程度不断提高。这些发现可以帮助加快对个人层面数据的可扩展、改进方法的验证。 按时使用的收集,包括通过不同的方法扩大按时使用的实时数据收集的努力5. 本文的结构如下。第二节讨论了研究设计。第3节概述了时间跟踪器和现场性能指标。第4节比较了智能手机和24小时召回日记臂的时间分配,以及与向两个臂管理的7天召回模块中报告的时间的比较。第5节提供了有关报告中的日内变化以及各治疗组活动的同时性的其他详细信息。第6节最后讨论了未来的研究需求以及在低收入环境下的大规模调查中扩大基于智能手机的时间使用数据收集的想法。 2.研究设计 马拉维时间使用测量方法学实验于2022年7月至2023年3月实施,在马拉维南部和中部9个人口最多的地区中选择了72个枚举区(EA),概率与2018年人口和住房普查EA -水平家庭计数成正比。研究期间涵盖了10月结束的旱季的一部分,以及11月至4月的大部分雨季,以便尽可能多地捕捉季节性的时间使用。 此外,EA样本在马拉维南部和中部以及城市/农村状况中平均分配。在每个EA中,都进行了完整的家庭清单,以确定至少有一名成年男子和一名成年妇女(工作年龄15 - 64岁)的家庭。从这个家庭中,随机选择了五个家庭,用于两种时间使用数据收集方法中的每一个:(1)基于Adroid的智能手机日记,带有图片时间追踪器应用程序,由受访者自我报告;(2)传统的时间使用日记,24小时回忆,由面试官作为面对面采访的一部分进行管理。在每个家庭中,在管理家庭问卷的家庭名册模块之后,随机选择一名成年男子和一名成年妇女作为研究参与者。 这种设计产生了720个家庭和1, 440个参与者的目标样本,按治疗部门和性别平均分配。但是,由于前两周的数据收集中的应用程序性能问题(i.Procedres.,前五个EA)被迅速整理,但这导致智能手机数据的部分丢失(i。Procedres.对于居住在这些EA中的受访者的报告天数的