您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [纽约联储]:基于大数据的人流量需求冲击估算方法(英) - 发现报告

基于大数据的人流量需求冲击估算方法(英)

信息技术 2026-04-01 纽约联储 Explorer丨森
报告封面

编号 11 91四月二十六日 Marina Azzimonti | David Wiczer | 杨璇 估算客流冲击的需求:大数据方法Marina Azzimonti, David Wiczer, 杨璇联邦储备银行纽约分行工作人员报告第1191号 2026年4月 https://doi.org/10.59576/sr.1191 摘要 本研究利用SafeGraph提供的高频客流量数据来估计纽约市零售、服务与健康行业顾客服务机构的需求波动。鉴于客流量波动可能源于不可预测的需求冲击和企业吸引客户的战略策略,我们提出一个理论框架,将机构级别的需求波动与公司战略选择进行隔离。在实证应用中,我们采用无监督机器学习方法将机构划分为与地理位置和行业基本无关的特定类别。我们发现冲击的持续性、趋势的重要异质性和对汇总样本的估计显著低估了某些机构经历的风险差异。 JEL分类:E21,L14,L80关键词:面向消费者的品牌、服务、零售业、健康、需求动态、需求冲击、客流量 Wiczer:纽约联邦储备银行(邮箱:david.wiczer@ny.frb.org)。Azzimonti:里士满联邦储备银行(邮箱:marina.azzimonti@rich.frb.org)。Xuan:什里夫波特路易斯安那州立大学(邮箱:yang.xuan@lsus.edu)。 本文提出了初步的研究成果,仅向经济学家和其他感兴趣的读者分发,旨在激发讨论并征询意见。本文中表达的观点是作者的观点,并不一定反映纽约联邦储备银行或联邦储备系统的立场。任何错误或遗漏均由作者负责。 1 简介 服务业、零售贸易和医疗保健行业是面向客户的行业,占美国就业人口的约三分之一,对GDP的贡献价值增加值超过制造业。1 然而,这些领域的需求冲击难以衡量,因为只有在顾客到达场所时才会产生产出。制造业部门有详细的场所级数据,使研究人员能够分析影响生产力的输入成本或技术冲击。相比之下,面向消费者的场所的生产力主要受消费者到达的驱动,这实际上充当了场所的生产力过程。换句话说,只有当有头发的顾客到达理发店时,才能进行理发,无论梳子和熟练的理发师是否可用。为了填补这一空白,我们引入了一种新颖的方法,该方法利用高频客流数据来量化纽约市面向客户的行业中的需求冲击。 我们使用了新近可用的移动位置数据集,该数据集以月度频率将客流与特定场所联系起来,从而使得我们可以对需求进行精确估计,而这种精度在以前是不可实现的。通过观察客户到达及其特征,我们揭示了客流模式中的残余成分,并将其解释为场所层面的需求冲击。因为……k 这些冲击的波动性在不同机构之间存在差异,我们使用“均值聚类”方法对机构进行分组,并分别对每个集群估计冲击过程。理解这些需求冲击有助于机构调整策略、减轻风险、调整投入并作出明智的投资决策。我们关注2018-2019年这一时期,以便建立疫情前需求自然波动的基线——这是现有文献中没有探讨过的。 我们的分析表明,面向客户的行业需求动态在本质上具有异质性:各机构在其需求过程的持续性、波动性和增长模式上存在系统性差异。这些差异不能由行业、地理或品牌层面的策略来解释。相反,机构可以分为三种具有经济意义的需求过程——快速增长、低流量和高流量——每种过程都意味着不同的波动特征和长期增长前景。这种异质性与异质企业模型中的标准假设形成对比。单一els ǐn suǒyǒu gúfǎn jiào chū shòu hào随机过程,这种假设会掩盖这些差异并歪曲冲击的潜在 分布。随着具有异质企业的模型变得越来越动态——包括投资、企业增长、生产率分散和商业周期波动中的应用——这样的企业所面临的冲击动态过程变得越来越重要。决定哪些企业处于边缘的企业级冲击的随机过程在其中扮演着核心角色。因此,我们的实证结果为调整那些政策响应取决于企业级冲击分布和边缘企业身份的模型提供了指导。 地点为了估算这些过程,我们使用SafeGraph的数据集,包括超过300万家“兴趣点(POI)”的详细人流量数据,如零售店、餐厅和医疗机构,具有高时空精度。SafeGraph跟踪这些地点的移动情况,以 通过手机定位数据,我们随着时间的推移构建了一个大型的商店访问模式面板。尽管这些数据完全匿名,但它提供了关于每个场所访问次数和独特访客数量的详细信息,以及商业属性(品牌、类别、NAICS)和地理标识符。 品牌机构An essential aspect of our study is the focus on这使我们能够将需求的随机变化与内生的市场营销或产品决策分开。SafeGraph将品牌定义为“拥有多个分店且使用相同标志或店铺横幅的商店。”这包括拥有所有分支机构的企业(例如,梅西百货)、特许经营商(例如,麦当劳)和许可商(例如,星巴克)。对于这些企业,产品供应和营销策略通常由总部统一决定,使我们能够将外生需求冲击与企业层面的战略分离。 我们的主要技术贡献是调整SafeGraph数据,以纠正各地区和时间的样本偏差。虽然SafeGraph提供州级标准化变量,但这些变量对于像区这样的较小地理市场来说是不足够的。通过将数据与美国社区调查相链接,我们为每个区构建了一个时间序列的普查区群调整因子,并且还创建了特定时间点的调整因子,以纠正时间趋势中的偏差。 从那里,我们的实证分析由一个理论框架指导,该框架将由企业层面战略调整引起的机构级别客流变化分离出来,使我们能够利用高频面板数据估计需求过程。我们考察了每个机构年度和月度访客数量增长以及波动性。一个引人注目的是,在年内增长方面,机构间的差异很大,特别是在高增长机构中,甚至在平均增长几乎为零的机构中也是如此。 为了系统地处理这种跨机构差异,我们采用均值聚类方法。我们将品牌机构根据平均年增长率、月波动率和平均月客流量分为三个组。第一组(“快速增长”)表现出高增长和高波动。剩余的组(“高流量”和“低流量”)主要区别在于其客流量水平。 对于每个集群,我们估计一个自回归(1)过程来预测年度需求增长,并纳入移动平均误差分量。高流量场所遵循高度持久、低变差的过程;低流量场所表现出低持久性和大创新方差;而快速增长的场所介于两者之间。将所有场所汇总会导致持久性和方差都过高,混淆了场所类型之间的结构差异与随机波动。 重要的是,这些差异并非由地区或部门构成所解释。每个集群在各个地区和部门中的比例相似。因此,需求动态的异质性反映了企业层面的差异,而不是行业或地区之间的结构性差异。 这篇论文与将需求冲击作为公司动力学、市场结构和总体波动模型中基本输入的研究者相关。我们针对企业级别的需求冲击进行的细腻、高频测量为调整依赖对真实层面上公司级别需求过程异质性表述的模型提供了一个基础。 1.1 文献综述 本文为理解影响企业的需求冲击的性质和动态的文献做出了贡献。例如,斯特克等人(2021提供关于不同规模企业需求过程中异质性的关键见解。然而,尽管规模通常与需求或生产力相关联,但它作为对潜在冲击的直接衡量指标的作用较小,因为它反映了企业对需求条件变化的内生反应。早期关于企业或企业层面需求的文献大多集中在制造业,如综述所述。Syverson(2011然而,制造业只占美国增值的约11%,其冲击的性质可能与零售和服务行业不同,这是我们分析的重点。 随着新的数据集出现,例如纵向商业数据库(LBD)和ORBIS,研究人员已将企业层面收入分析的范畴扩展到制造业之外,如下所示:Haltiwanger et al. 休尔蒂旺格等(2016然而,这些来源主要依赖于年度数据,可能错过需求的高频变化,并且通常会有较大的延迟发布。相比之下,本文中使用的SafeGraph数据集提供了近乎实时的、高频的观察结果,使人们对需求动态有更细致的了解。2 越来越多的研究利用基于位置的数据来分析围绕各种场所的移动模式,例如:梁等(2020然而,这些论文仍然属于描述性研究,主要关注到达模式。本文通过构建需求过程的理论框架,并利用高频客流数据对其进行实证估计,推进了该领域的研究。 我们的论文与两项近期研究密切相关,这两项研究探讨了公司层面冲击过程的异质性。贾伊莫维奇等人(2023分析来自欧洲国家年度频率的历史ORBIS数据,非参数研究企业收入动态,发现冲击持续性的显著异质性和变化性。同样,梅尔坎吉和萨皮埃特罗(2024通过Compustat年度销售数据研究公开上市的美国制造公司,发现当这些公司的销售受到冲击时,规模较小的公司持续性最低。补充这些研究,我们还确定了冲击过程中的异质性,但重点关注美国面向客户的行业中品牌公司的客流量,而不是收入。客流量更接近需求冲击的原始状态,捕捉了客户面向行业中主要的驱动因素,同时避免了价格、营销策略或输入调整的扭曲。此外,通过利用细粒度、特定位置的数据,我们的分析更接近客户面向行业理论模型。 我们所衡量的过程,即顾客到达面向消费者的场所,在理论上已被强调,但在实证上仍研究不足。具体而言,在摩擦性商品市场模型中,顾客到达是生产率波动的关键驱动力,因为许多面向消费者的行业生产依赖于顾客到达。 2新冠疫情加剧了对SafeGraph数据的利用研究。Farboodi等人(2021使用匿名化手机数据来估计自愿社交距离。Goldfarb and Tucker(2020分析零售场所的客流模式,以评估潜在的新冠病毒传播风险。古尔斯比和西弗森(2021调查政府在疫情期间实施的限制措施和个人预防行为对经济活动的影响。克罗宁和埃文斯(2020利用Safe-Graph移动数据进行分析,了解公众限制和COVID-19大流行期间的恐惧如何导致零售和服务行业产生异质需求冲击。 关于买家的实物到访。在这些论文中,客户到访的变化被证明是业务波动的基本驱动力之一,正如所显示的:卡普兰和门齐奥(2016) 以及Storesletten 等人(2011),放大其他摩擦,例如皮特罗斯基-纳度 和 哈斯默(2015),并在公司动态中扮演核心角色,正如以下所示:Gourio 和 Rudanko(2014然而,到达过程本身在数据中一直保持潜伏。我们的一项主要贡献是从基本原理出发对这一过程进行实证描述,为顾客到达的理论模型和建立级别的证据之间提供缺失的连接。 2 数据描述 本研究中使用的建立层面的客流量数据来自SafeGraph,这是一家私营公司,为包括5500家连锁店和300万家小型企业在内的500万家企业和组织汇总客流量模式。 SafeGraph通过合作移动应用程序每天不断对大约1800万智能手机进行ping操作以收集GPS位置数据。由此产生的数据集跟踪了个人在其住宅普查区块组(CBGs)和特定兴趣点(POIs)之间的移动。在本文中,我们将企业和POI互换使用。CBGs是包含约1,200个人的地理区域。POI的例子包括零售连锁店、夫妻店以及其他公共和私营机构,如宗教组织、学校和医院。SafeGraph数据集覆盖了美国的许多城市,但数据在人口密集地区最为可靠。因此,在分析中,我们将重点限制在纽约市的三個区:曼哈顿、布鲁克林和布朗克斯。 2.1 SafeGraph数据 核心地点我们在本文中使用了SafeGraph数据的三个组成部分。数据集,提供了每个兴趣点(POI)的机构级别特征,包括其位置、名称、六位数NAICS代码、ZIP代码、商业类别、品牌和唯一的POI标识符。这些固定属性使我们能够根据商业类型和地理区域对机构进行分类。为了捕捉空间分布 首页面板摘要邻里模式苏美尔人,我们使用从数据集,其中包含每个社区基站(CBG)中设备数量的信息,以及最放置帕特具体到细颗粒度的美国人口普查局报告的数据,最终我们使用 terns数据集,记录了自2018年1月至2019年12月CBGs和POIs之间每月的客流流动。这个数据集使我们能够追踪每个地点访客的源CBGs随时间的变化。 The SafeGraph data are valuable not only because they provide a detailed and high-frequency me