因果推断

从相关到因果

计量经济学的终极目标不是描述相关性，而是识别因果效应（Causal Effect）。"相关不等于因果"是社会科学中最重要的警示。因果推断（Causal Inference）方法论为从观测数据中提取因果关系提供了严谨的框架。

潜在结果框架

鲁宾因果模型

潜在结果框架（Potential Outcomes Framework），也称鲁宾因果模型（Rubin Causal Model），是现代因果推断的基础。

对于个体 \(i\)，定义两个潜在结果：

\(Y_i(1)\)：接受处理时的结果
\(Y_i(0)\)：未接受处理时的结果

个体处理效应（Individual Treatment Effect）：

\[\tau_i = Y_i(1) - Y_i(0)\]

因果推断的根本问题

对于任何个体，我们只能观察到一个潜在结果——要么接受处理，要么不接受。\(Y_i(1)\) 和 \(Y_i(0)\) 不可能同时被观察到，这就是因果推断的根本问题（Fundamental Problem of Causal Inference）。因此，个体处理效应无法直接计算，我们转而关注群体层面的平均效应。

平均处理效应（Average Treatment Effect, ATE）：

\[\tau_{ATE} = E[Y_i(1) - Y_i(0)]\]

处理组的平均处理效应（Average Treatment Effect on the Treated, ATT）：

\[\tau_{ATT} = E[Y_i(1) - Y_i(0) | D_i = 1]\]

选择偏差

简单比较处理组和控制组的均值差异：

\[E[Y_i | D_i=1] - E[Y_i | D_i=0] = \underbrace{E[Y_i(1) - Y_i(0) | D_i=1]}_{ATT} + \underbrace{E[Y_i(0)|D_i=1] - E[Y_i(0)|D_i=0]}_{\text{选择偏差}}\]

选择偏差（Selection Bias）——处理组即使不接受处理也与控制组系统性不同——是因果推断面临的核心障碍。随机实验通过使 \(D_i\) 独立于潜在结果来消除选择偏差。

双重差分法

基本设计

双重差分法（Difference-in-Differences, DID）是应用最广泛的准实验方法之一。基本设定：两组（处理组和控制组）、两期（政策前和政策后）。

\[Y_{it} = \beta_0 + \beta_1 \cdot Post_t + \beta_2 \cdot Treat_i + \beta_3 \cdot (Post_t \times Treat_i) + \epsilon_{it}\]

DID 估计量 \(\hat{\beta}_3\) 等于：

\[\hat{\beta}_3 = (\bar{Y}_{T,post} - \bar{Y}_{T,pre}) - (\bar{Y}_{C,post} - \bar{Y}_{C,pre})\]

即处理组的前后变化减去控制组的前后变化。

平行趋势假设

DID 的核心识别假设是平行趋势假设（Parallel Trends Assumption）：在没有处理的反事实世界中，处理组和控制组的结果变量会遵循相同的时间趋势。该假设无法直接验证（因为涉及反事实），但可以通过检验处理前两组的趋势是否平行来提供间接证据——即事件研究图（Event Study Plot）。

交错 DID 的新发展

当不同个体在不同时间接受处理（Staggered Adoption）时，传统的双向固定效应回归（TWFE）可能给出有偏的估计。近年来的研究（Goodman-Bacon, 2021; Callaway & Sant'Anna, 2021; Sun & Abraham, 2021）揭示了问题所在：

TWFE 估计量是多个 \(2 \times 2\) DID 的加权平均，其中部分比较使用已接受处理的个体作为控制组，权重可能为负。解决方案包括使用稳健的 DID 估计量，如堆叠回归（Stacked Regression）或群组时间 ATT 估计。

断点回归设计

基本思想

断点回归设计（Regression Discontinuity Design, RDD）利用处理分配规则中的断点来识别因果效应。当处理状态由某个运行变量（Running Variable）\(X\) 是否超过阈值 \(c\) 决定时：

\[D_i = \mathbf{1}(X_i \geq c)\]

在阈值两侧，个体几乎相同（"局部随机化"），唯一的系统性差异是是否接受处理。

RDD 估计量：

\[\hat{\tau}_{RDD} = \lim_{x \downarrow c} E[Y_i | X_i = x] - \lim_{x \uparrow c} E[Y_i | X_i = x]\]

即结果变量在断点处的跳跃。

尖锐断点 vs. 模糊断点

尖锐断点（Sharp RDD）：处理状态完全由阈值决定（\(D_i = \mathbf{1}(X_i \geq c)\)）。模糊断点（Fuzzy RDD）：超过阈值仅增加接受处理的概率，但不是决定性的。模糊 RDD 本质上是以阈值作为工具变量的 IV 估计，得到的是局部平均处理效应（LATE）。

实践中，RDD 通常使用局部线性回归（Local Linear Regression），在阈值附近一定带宽 \(h\) 内拟合线性函数：

\[Y_i = \alpha + \tau D_i + \beta_1(X_i - c) + \beta_2 D_i(X_i - c) + \epsilon_i, \quad |X_i - c| \leq h\]

带宽选择至关重要——太窄则方差大，太宽则偏差大。Imbens-Kalyanaraman (IK) 和 Calonico-Cattaneo-Titiunik (CCT) 提供了数据驱动的最优带宽选择方法。

合成控制法

方法概述

合成控制法（Synthetic Control Method, SCM）由阿巴迪等人（Abadie et al., 2003, 2010）提出，适用于比较案例研究——一个处理单位、多个潜在控制单位。

核心思想是用多个控制单位的加权组合构造一个合成控制组，使其在处理前尽可能与处理单位相似：

\[\hat{Y}_{1t}^{(0)} = \sum_{j=2}^{J+1} w_j^* Y_{jt}, \quad t \leq T_0\]

权重 \(w_j^* \geq 0\) 且 \(\sum w_j^* = 1\)，通过最小化处理前预测变量的差异来确定。

处理效应估计：

\[\hat{\tau}_t = Y_{1t} - \hat{Y}_{1t}^{(0)}, \quad t > T_0\]

合成控制法的推断

传统统计推断在只有一个处理单位时不适用。SCM 使用安慰剂检验（Placebo Test / Permutation Test）：对每个控制单位假装其为处理单位，重复合成控制分析。如果真实处理效应在安慰剂分布中极端，则认为效应显著。

方法选择指南

方法	适用场景	核心假设	效应类型
DID	政策前后、处理控制组	平行趋势	ATT
RDD	基于阈值的处理分配	连续性/局部随机化	阈值处 LATE
IV/2SLS	存在外生变异来源	排除性约束	LATE
SCM	单一处理单位的政策评估	可预测性	处理单位效应

因果推断方法的核心在于识别策略（Identification Strategy）——找到可信的外生变异来源或准实验情境。方法本身是工具，研究设计的创造性和识别假设的可信度才是实证研究质量的根本保障。