结构方程的基本概念、核心步骤、技术难点与前沿进展∗ 李星宇彭依菁易君健 内容摘要:随着约简式研究局限性的显现和技术方法的进步,结构方程研究范式在经济学领域被重新重视起来。为了帮助更多研究者了解和使用结构方程,本文介绍了结构方程的基本概念和核心步骤。结合具体案例和已有研究,本文详细阐述了结构方程的模型构建、参数识别、参数估计、统计推断、模型验证和模型应用等步骤中的现有理论和方法,也指出了其中存在的技术困难。此外,本文还讨论了结构方程研究的前沿进展,即将约简式研究和机器学习与结构方程相结合,从而一定程度上解决模型构建、参数识别、参数估计和模型验证等方面的困难。我们希望本文能够推进结构方程研究范式被更广泛地应用于探索社会经济发展的一般规律,从而为科学的最优政策设计提供严谨的分析基础。 关键词:结构方程约简式机器学习高维模型 一、引言 作为社会科学的皇冠,经济学为人类经济社会发展做出了重要贡献。这些贡献离不开经济学用科学的方法探索经济规律并服务于现实世界的精神。然而,经济学学科在当前的发展过程中出现了一种趋势:经济学理论与经验数据分析之间日益脱节,理论研究难以有效指导现实实践。这一趋势引发了一系列挑战。第一,经济学研究在政策制定中的影响力下降。许多以“原因的结果”为导向的因果推断研究侧重关注政策实施后的影响,在缺少经济学理论支撑的情况下,这些经验研究结论难以直接为事前的政策比较和设计提供帮助。与此同时,纯粹的经济学理论研究通常在较为抽象和理想化的环境中展开,与现实的政策制定环境有较大差异。因此,目前的经济学研究成果只能为科学的政策决策过程提供有限的帮助。第二,在商业分析和产业研究等现实应用场景中,经济学方法正逐渐被以机器学习为代表的数据驱动的量化分析方法替代。在以预测表现为核心目标的应用环境下,机器学习方法展现出了优势。相比之下,目前的经济学经验研究更强调模型的内部有效性和方法规范性,而对外部有效性的关注相对不足。尽管基于经济学理论模型的分析方法在预测方面具有潜在优势,但由于理论与应用之间存在脱节,其预测能力并未在实践中得到充分发挥。这导致经济学方法在现实问题中的应用表现落后于机器学习方法,从而被后者逐步替代。第三,人才正在逐渐从经济学科流向其它学科。经济学理论研究虽秉持科学的研究范式并具有一定的智力挑战性,但其现实应用需求相对有限;而部分经济学经验研究与理论脱节,在一定程度上弱化了科学探索精神和智力上的挑战,从而降低了对高能力研究者的吸引力。与此同时,经济学在政策制定、商业分析和产业研究等领域的式微则进一步加速 了人才的外流。 我国的经济学研究在面对上述全球共同挑战的同时,还承担着我国经济发展历史进程所赋予的特殊使命。随着中国经济的持续增长和经济体制改革的不断深化,既有的理论框架和单纯的经验分析已经难以为创新性的政策实践提供系统性和前瞻性的科学分析基础。因此,当前中国经济学研究亟需构建自主的知识体系。这一自主知识体系需要在充分吸收经济学经典理论和科学分析工具的前提下,围绕中国具体国情和具体实践,对相关经济现象进行系统总结和理论化提炼,进而揭示其背后一般性科学规律,并利用这些规律回应新的现实问题、指导新的政策实践。然而,当下流行的量化分析方法在实现上述目标时仍存在一定局限。一方面,约简式经济学研究虽然具有统计严谨性和模型内部效度,也能够进行事后的政策评估,但是其行为假定的经济学含义不够清晰、缺少对于深层机制和经济规律的分析、研究结果难以推广到存在结构变迁的场景。另一方面,机器学习等数据驱动的方法基于历史数据训练的模型在相对稳定的环境中具有很好的预测能力,但是在数据生成过程发生结构性变动时,这类模型也难以对未来情境做出准确的预测。事实上,要实现构建经济学自主知识体系的目标,我国的广大经济学研究者需要在研究过程中将经济学理论创新和经验数据分析有机地结合起来。 结构方程研究范式为我们提供了应对上述挑战的一种可行方案。我们的现实世界由已实现的均衡结果构成,经济学家应当从这些均衡结果中发现各种有趣、困惑和重大的现象,进而探索这些现象背后的原因、机制和一般科学规律,最后用这些科学的规律指导政策实施。结构方程范式基于明确的经济理论建模,将经济系统中相对稳定的结构与可能发生变化的结构加以区分,在不变结构(如偏好、技术和制度)所构成的大框架下,用变量和(或)参数描述变化的结构,使得整体模型的未知参数可以从已有数据中估计,并在此基础上通过反事实分析(counterfactual analysis)预测未来的均衡结果。因此,结构方程研究有助于还原基础参数、厘清经济运行机制并开展事前分析,从而为回应上述挑战提供系统性的分析工具。一个具有代表性的基于结构方程的事前预测研究是McFadden et al.(1977),该研究创造性地构建了随机效用模型,并在旧金山湾区捷运系统尚未建成时预测其客运需求,而系统投入使用后的实际数据表明,这些事前预测相当准确。 我国目前已经具备开展结构方程研究的经验数据基础。本世纪初以来,中国健康与养老追踪调查(China Health and Retirement Longitudinal Study,CHARLS)和中国家庭追踪调查(China Family Panel Studies,CFPS)等大规模微观数据库的建立为我国的经济学研究者提供了丰富的高质量数据。与此同时,计算机算力的快速提升以及高效算法的不断涌现为研究者处理形式较为复杂且假定相对较弱的结构方程模型提供了可行工具。在此背景下,结构方程研究范式开始被逐步应用于我国经济学的多个研究领域,包括产业组织(李国栋等,2019;冯笑和王楚男,2022;郭晓丹和王帆,2024)、劳动与公共经济学(杨继生和邹建文,2021;徐彤等,2023;易行健等,2025)、城市与区域经济学(刘修岩和李松林,2017; 陈诗一等,2019;余淼杰等,2025)、国际贸易经济学(王子和周雁翎,2019;谭用等,2024a;谭用等,2024b;冯笑等,2024)等。 当然,因为结构方程结合经济学理论和经验数据分析,所以它需要研究者熟练掌握微观或宏观经济学理论和计量经济学方法,并对现实经济问题和经验数据有深入理解。这使得结构方程研究相较于约简式研究有更高的技术门槛和更大的操作难度。为了帮助研究者更好地了解和掌握结构方程研究范式,并为自主知识体系构建和最优政策设计提供严谨的分析基础,本文对结构方程的基本概念、核心步骤、技术难点与前沿进展进行系统回顾和讨论。 一个完整的经济学经验研究(empirical study),无论采用约简式还是结构方程范式,都应当包含6个步骤:模型构建(construction)、参数识别(identification)、参数估计(estimation)、统计推断(statistical inference)、模型验证(validation)和模型应用(application)。这6个步骤并不是相互割裂的,而是有机地融合在一起。因此研究者在开展经验研究时并不是机械地顺次执行每个步骤,而是站在整体的视角,在每个步骤中考虑其它步骤的需求或者对其它步骤进行修改,以一种螺旋上升的方式完成研究。本文将依次介绍结构方程研究的上述6个步骤。对于每个步骤,我们将基于已有理论和应用文献,回顾现有理论和方法,指出其中存在的困难,介绍相关的前沿进展并展望未来研究方向。与此同时,我们也会关注结构方程与其它三种量化分析方法—约简式、校准、机器学习的关系,具体包括这4种量化分析方法的特征对比(见表1的总结)和结构方程与约简式、机器学习相结合的优势(见表2的总结)。 本文的主要贡献体现在三个方面。第一,据作者所知,本文是中文文献中首篇对结构方程研究范式进行系统性综述的文章。与已有的外文综述(例如侧重概念介绍的Low & Meghir(2017)和站在应用微观经济学特别是劳动经济学视角的Galiani & Pantano(2021))相比,本文尽可能做到了视角更加全面且内容更加丰富。第二,本文努力平衡了叙述的严谨性和易读性,争取为广大读者提供一个可行的操作指南。在表述核心概念和方法时,本文使用了严格的数学语言;为了便于读者理解,本文同时采用了平实的语言和简单的例子对上述概念和方法进行解释和说明。此外,本文还为读者提供了大量的理论方法和经验应用文献,前者可以帮助读者更加深入地学习具体的理论和方法,后者则可以为读者提供结构方程在实际问题中的应用范例。第三,本文高度关注结构方程研究的前沿进展。本文总结了结构方程与约简式、机器学习相结合的优势,介绍了参数识别和高维模型估计方法等领域最新进展,并讨论了未来值得研究的开放性问题。 本文其余部分安排如下。第二节简要回顾计量经济学的发展脉络,并在经济学经验研究六个步骤的框架下介绍结构方程的定义与基本流程,同时通过一个简单的供给—需求模型加以说明。第三节讨论结构方程模型构建中的关键要素与主要难点。第四节给出参数识别的严格定义,并介绍常用的识别方法及其局限性。第五节介绍结构方程模型的求解与参数估计方法,重点讨论机器学习思想和算法在复杂模型求解中的作用,以及高维模型估计的最新进展。第六节讨论结构方程 模型的统计推断方法。第七节讨论结构方程模型的验证与透明度分析。第八节介绍结构方程模型在经济分析中的若干应用。第九节总结全文。 注1:正如Cocci & Plagborg-Møller(2025)第2952页介绍的,文献中对于校准有狭义和广义两种定义。狭义的定义指的是宏观经济学中以非计量的方式获取参数的做法,而广义的定义是经典最小距离估计方法。本文所讨论的校准采用狭义定义。 注2:为了方便,在没有额外说明的情况下,本文所称的机器学习均特指有监督学习(supervisedlearning)。 二、结构方程概述 (一)历史 结构计量模型的思想可追溯至新古典经济学的兴起。马歇尔的供需分析为后续构建基于代表性行为人最优化的宏观模型提供了雏形。20世纪30年代,考尔斯经济研究委员会(Cowles Foundation for Research in Economics)主张通过结构方程研究刻画偏好、技术和制度的“基础参数”(primitive parameters),并在此基础上预测政策变动下的新均衡。然而,结构方程研究范式在那个年代的局限性很 快暴露出来:受制于数据和算力,研究者需要对模型施加较强的且难以检验的假定条件以保证可操作性,但这也使得研究结果很大程度上依赖于这些假定,在现实经济中的预测能力欠佳。因此,结构方程研究范式在此后很长一段时间没有受到重视。 与此同时,计量经济学在宏观与微观领域走向分化。宏观计量早期依赖向量自回归(vector autoregression)、协整分析(co-integration analysis)和误差修正模型(error correction model)等非结构化的时间序列分析方法。随着真实商业周期(real business cycle)与动态随机一般均衡(dynamic stochastic general equilibrium,DSGE)模型的兴起,宏观计量的研究开始强调其经济学理论基础。然而,由于模型包含动态性、随机性、异质性和互动性导致形式非常复杂,宏观模型通常难以实现计量经济学意义上的参数识别、估计和推断,因而多在数值求解模型的基础上采用校准(calibration)的方式得到参数,包括但不限于使用文献已有结果、借助理论和经验判断或匹配数据特征。相比之下,微观计量则沿约简式路径快速发展:以随机对照实验(randomized controlled trial)和准实验设计(quasi-experimental design)为代表的研究范式强调在施加尽可能少的行为假定的情形下识别因果效应。随机对照实验通过随机化设计,从根本上避免了混杂因素和样本选择问题,但是大量经济学研究问题不适合或者没有条件开展随机对照实验。准实验设计则在给定观察数据(observational data)的条件