在因果推断研究中,识别“X导致Y”之后,如何进一步回答“X通过什么渠道影响Y”是一个尚未解决的方法论问题。心理学和管理学中常用的Baron and Kenny(1986)逐步回归法1,在经济学以准自然实验为主流的场景下面临显著的识别障碍。本文梳理相关文献,讨论逐步回归法的局限、现有替代方案以及写作中应注意的措辞规范。

一、逐步回归法在经济学中的识别困难

Baron and Kenny(1986)的三步法是讨论中介效应的起点:先估计处理对结果的总效应,再估计处理对中介变量的效应,最后将中介变量和处理同时纳入回归,观察处理系数的衰减幅度。在实验室环境中,随机化使处理和中介变量均近似外生,该方法尚可适用。但移植到准自然实验场景后,文献反复强调三个层面的困难。

第一,中介变量的外生性难以保障。 Angrist and Pischke(2009)在教材中反复强调2:准实验设计中处理变量的外生性或可由制度冲击保障,但中介变量几乎不具备这一条件。以高铁开通与知识溢出的研究为例:铁路连通性是旅行成本的一次外生冲击,但一座城市在高铁开通后是否举办更多学术会议,取决于高校密度、行政效率、地方财政状况等难以观测的因素,而这些因素本身也会影响知识溢出。Imai et al.(2010)将此问题形式化,提出序贯可忽略性假设3:在控制协变量后,中介变量可视为条件随机分配。该假设在经济学数据中通常无法成立。

第二,控制中介变量可能引入偏误。 Angrist and Pischke(2009)将中介变量归入"坏控制变量"(bad controls)的范畴。中介变量是处理的结果,属于后处理变量;将其纳入回归,实质上是在控制一条研究者试图打开的因果路径。此时处理系数不再等于平均处理效应,而是控制某一处理后果后的条件效应,其含义取决于中介变量与处理、结果之间的因果结构,一般不具有明确的政策解释。Green et al.(2010)在更宽泛的讨论中得出类似结论4:中介效应的识别比多数学者预期的更为困难。

第三,机制识别本身具有固有复杂性。 Bullock et al.(2010)的核心观点5是即便在随机实验中,识别机制也远比识别平均处理效应复杂,往往需要更强的假设和更精细的实验设计。如果随机实验都难以实现干净的机制识别,那么使用双重差分或断点回归的研究在依赖逐步回归法声称“中介效应占总效应的X%”时,更应审慎对待。

中文文献中,江艇(2022)对上述问题做了系统梳理6,批评了因果推断研究中套用逐步回归法的普遍做法,并提倡以交互项和异质性分析作为替代。其判断与英文文献中的方法论共识一致。

二、替代方案

既然逐步回归法在准实验框架下缺乏识别基础,替代路径有哪些?文献大致给出了三种策略,它们在对“机制”的操作化定义和对因果识别强度的要求上存在差异。

(一)检验处理对机制变量的因果效应

一种被广泛接受的策略是:仅检验处理变量是否影响了机制变量本身,而不将机制变量纳入主回归进行系数比较。在中介变量无法随机化的条件下,研究者至少可以沿用与主回归相同的识别策略(如相同的双重差分设计),估计处理对机制变量的因果效应。例如,估计高铁开通是否增加了学术会议频次。若该效应显著,即获得了与“面对面交流渠道”假说相一致的证据。但这一策略止步于此——它不声称将总效应分解为直接效应和间接效应,仅为机制假说提供一条佐证。Imai et al.(2011)也持类似看法7,认为借助实验设计(如鼓励设计)识别机制变量上的效应,比试图拆分总效应更为可靠。

(二)异质性分析与调节效应

另一种更有力的策略是利用异质性处理效应间接验证机制。其逻辑是:如果某一机制确实在起作用,处理效应应当在该机制更容易运作的子样本中更强。江艇(2022)明确提倡这一思路,认为这是准实验框架下检验机制最可行的路径。以高铁为例:若学术会议是知识溢出的重要渠道,高铁开通的效应应在高校密度更高的城市更为显著。通过估计铁路连通性与事前高校密度的交互项,研究者可在不引入后处理变量的前提下获得与机制假说一致的证据。

交互项分析的识别优势在于:其估计依赖于与主效应相同的研究设计,无需额外的序贯可忽略性假设。Acharya et al.(2016)对此有更深入的讨论8。他们指出,当处理效应存在异质性时,传统中介分析所定义的自然直接效应和自然间接效应可能失去政策含义,因此建议采用随机化干预效应(randomized intervention effect)作为替代。在这一框架下,交互项分析是检验机制假说的适当工具。

(三)因果中介分析框架

对于以机制识别为核心贡献的研究,Imai et al.(2010)提出了基于潜在结果框架的因果中介分析方法。该框架明确定义了平均因果中介效应(ACME)和平均直接效应(ADE),并通过非参数方法进行估计。然而,正如 Imai et al.(2011)所指出的,该框架的可靠性高度依赖序贯可忽略性假设。为此,文献建议研究者进行敏感性分析,评估假设被违反到何种程度时结论将发生逆转。在缺乏针对中介变量的工具变量或其他外生变异来源的情况下,敏感性分析的置信区间往往较宽,因果中介效应的点估计难以获得令人信服的识别。

三、写作措辞

除方法论选择外,描述机制证据时的措辞分寸也值得关注。Bullock et al.(2010)强调,讨论机制时必须清晰区分相关性与因果性,措辞的暗示强度不应超出证据的支撑力度。

具体而言,以下表述应当避免:“中介效应”、“解释了总效应的X%”、“直接效应”等。这些术语隐含的因果结构超出了多数准实验设计所能支撑的范围(Jiang, 2022)。同样,Sobel检验和Bootstrap置信区间是统计推断工具,解决的是估计精度问题,无法弥补序贯可忽略性假设不成立时的识别缺陷——当该假设被违反时,估计量本身就是有偏的,推断方法再精确也无法纠正偏误(Green et al., 2010)。

更稳妥的做法是采用审慎的措辞,如“结果与……假说一致”、“证据支持……渠道”、“发现暗示了……路径”。这类表述承认自己提供的只是与某一机制相容的证据,而不声称对该机制做了严格的因果识别。例如:“高铁连通性提升了来源城市的学术会议活动,这与面对面交流作为知识传播渠道的假说相一致”;或“高铁连通性对知识溢出的效应在高校密度更高的城市中更大,符合学术会议促进知识转移的预期”。

四、小结

综上,在准自然实验设计中,逐步回归法声称的中介效应分解缺乏识别基础,这一点在方法论文献中争议不大。替代路径有三条——直接机制证据、异质性分析、以及在特定条件下使用因果中介分析框架——它们提供的都是与机制假说“相容”的证据,而非因果链条的铁证。识别机制的难度往往被低估,研究者在呈现证据时应保持审慎,避免将统计相关性等同于因果路径。


  1. Reuben M. Baron and David A. Kenny, “The Moderator-Mediator Variable Distinction in Social Psychological Research: Conceptual, Strategic, and Statistical Considerations,” Journal of Personality and Social Psychology 51, no. 6 (1986): 1173–1182. ↩︎

  2. Joshua D. Angrist and Jörn-Steffen Pischke, Mostly Harmless Econometrics: An Empiricist’s Companion (Princeton: Princeton University Press, 2009), 61–64. ↩︎

  3. Kosuke Imai, Luke Keele, and Dustin Tingley, “A General Approach to Causal Mediation Analysis,” Psychological Methods 15, no. 4 (2010): 309–334. ↩︎

  4. Donald P. Green, Shang E. Ha, and John G. Bullock, “Enough Already about ‘Black Box’ Experiments: Studying Mediation Is More Difficult than Most Scholars Suppose,” Annals of the American Academy of Political and Social Science 628, no. 1 (2010): 200–208. ↩︎

  5. John G. Bullock, Donald P. Green, and Shang E. Ha, “Yes, But What’s the Mechanism? (Don’t Expect an Easy Answer),” Journal of Personality and Social Psychology 98, no. 4 (2010): 550–558. ↩︎

  6. 江艇,“因果推断经验研究中的中介效应与调节效应”,《中国工业经济》2022年第5期,第100–120页。 ↩︎

  7. Kosuke Imai, Luke Keele, Dustin Tingley, and Teppei Yamamoto, “Unpacking the Black Box of Causality: Learning about Causal Mechanisms from Experimental and Observational Studies,” American Political Science Review 105, no. 4 (2011): 765–789. ↩︎

  8. Avidit Acharya, Matthew Blackwell, and Maya Sen, “Explaining Causal Findings without Bias: Detecting and Assessing Direct Effects,” American Political Science Review 110, no. 3 (2016): 512–529. ↩︎