内生性问题与工具变量

内生性：计量经济学的核心挑战

内生性（Endogeneity）是指自变量与误差项相关（\(\text{Cov}(X, u) \neq 0\)），违反了 OLS 的零条件均值假设。内生性导致 OLS 估计量有偏且不一致，是实证研究中最重要也最棘手的问题。

内生性的三大来源

遗漏变量偏差

遗漏变量偏差（Omitted Variable Bias, OVB）是最常见的内生性来源。当一个影响 \(Y\) 的变量被遗漏，且该变量与 \(X\) 相关时，\(X\) 的系数估计将吸收遗漏变量的效应。

真实模型：\(Y = \beta_0 + \beta_1 X + \beta_2 Z + u\)

估计模型（遗漏 \(Z\)）：\(Y = \beta_0 + \beta_1 X + v\)，其中 \(v = \beta_2 Z + u\)

OVB 公式：

\[E(\tilde{\beta}_1) - \beta_1 = \beta_2 \cdot \delta_{ZX}\]

其中 \(\delta_{ZX}\) 为 \(Z\) 对 \(X\) 回归的系数。偏差等于遗漏变量对 \(Y\) 的效应乘以遗漏变量与 \(X\) 的关联。

OVB 偏差方向判断

偏差方向取决于两个因素的乘积：（1）\(\beta_2\) 的符号——遗漏变量对 \(Y\) 的影响方向；（2）\(\delta_{ZX}\) 的符号——遗漏变量与 \(X\) 的相关方向。例如，教育回报的估计中，能力是遗漏变量，能力正向影响收入（\(\beta_2 > 0\)）且与教育正相关（\(\delta_{ZX} > 0\)），因此 OLS 高估教育回报。

反向因果

反向因果（Reverse Causality / Simultaneity）指 \(X\) 影响 \(Y\) 的同时，\(Y\) 也反过来影响 \(X\)。例如：

警察数量与犯罪率：更多警察降低犯罪，但高犯罪地区会部署更多警察
经济增长与制度质量：好制度促进增长，但增长也推动制度改善

测量误差

测量误差（Measurement Error）指自变量的观测值与真实值有偏差。若 \(X_i^* = X_i + \epsilon_i\)，经典测量误差导致衰减偏差（Attenuation Bias）：

\[\text{plim} \, \hat{\beta}_1 = \beta_1 \cdot \frac{\sigma_X^2}{\sigma_X^2 + \sigma_\epsilon^2} = \beta_1 \cdot \lambda\]

其中 \(\lambda \in (0,1)\)，系数被向零压缩。信噪比越低（\(\sigma_\epsilon^2\) 相对 \(\sigma_X^2\) 越大），偏差越严重。

工具变量方法

工具变量的定义

工具变量（Instrumental Variable, IV）\(Z\) 必须满足两个条件：

相关性条件（Relevance）：\(\text{Cov}(Z, X) \neq 0\)，工具变量与内生变量相关
外生性条件（Exogeneity / Exclusion Restriction）：\(\text{Cov}(Z, u) = 0\)，工具变量仅通过 \(X\) 影响 \(Y\)

好工具变量的直觉

好的工具变量像是一个"自然实验"，它影响了 \(X\) 的变动，但这种变动与 \(Y\) 的其他决定因素无关。例如，安格里斯特和克鲁格（Angrist & Krueger, 1991）用出生季度作为教育年限的工具变量——出生季度通过义务教育法影响入学年限，但本身不直接影响收入。

IV 估计量

简单 IV（恰好识别）估计量：

\[\hat{\beta}_1^{IV} = \frac{\text{Cov}(Z, Y)}{\text{Cov}(Z, X)} = \frac{\sum(Z_i - \bar{Z})(Y_i - \bar{Y})}{\sum(Z_i - \bar{Z})(X_i - \bar{X})}\]

这也称为瓦尔德估计量（Wald Estimator）。

两阶段最小二乘法

两阶段最小二乘法（Two-Stage Least Squares, 2SLS）是 IV 估计的标准方法，尤其适用于过度识别（工具变量多于内生变量）的情况：

第一阶段（First Stage）：将内生变量对工具变量和其他外生变量回归：

\[X_i = \pi_0 + \pi_1 Z_i + \mathbf{W}_i'\boldsymbol{\gamma} + v_i\]

得到预测值 \(\hat{X}_i\)。

第二阶段（Second Stage）：用 \(\hat{X}_i\) 替代 \(X_i\) 进行回归：

\[Y_i = \beta_0 + \beta_1 \hat{X}_i + \mathbf{W}_i'\boldsymbol{\delta} + \epsilon_i\]

为什么 2SLS 有效？

第一阶段将 \(X\) 的变异分解为两部分：被 \(Z\) 解释的部分（\(\hat{X}\)，外生的）和残差部分（\(v\)，包含内生性）。第二阶段仅使用外生部分来估计 \(\beta_1\)，从而消除了内生性偏差。

矩阵形式下，2SLS 估计量为：

\[\hat{\boldsymbol{\beta}}_{2SLS} = (\hat{\mathbf{X}}'\mathbf{X})^{-1}\hat{\mathbf{X}}'\mathbf{Y} = (\mathbf{X}'\mathbf{P}_Z\mathbf{X})^{-1}\mathbf{X}'\mathbf{P}_Z\mathbf{Y}\]

其中 \(\mathbf{P}_Z = \mathbf{Z}(\mathbf{Z}'\mathbf{Z})^{-1}\mathbf{Z}'\) 为投影矩阵。

弱工具变量问题

弱工具变量的后果

弱工具变量（Weak Instruments）指 \(Z\) 与 \(X\) 的相关性虽然不为零但非常微弱。弱工具变量导致：

2SLS 估计量在有限样本中严重偏向 OLS
标准误低估真实不确定性
检验过度拒绝零假设

斯托克和赖特（Stock & Yogo, 2005）提出了检验弱工具变量的方法。第一阶段的 F 统计量是关键诊断指标：

\[F = \frac{(\hat{\pi}_1)^2}{\text{Var}(\hat{\pi}_1)} \quad \text{（单一内生变量、单一工具的情形）}\]

F > 10 经验法则

斯塔格（Staiger）和斯托克（Stock, 1997）提出的经验法则：第一阶段 F 统计量应大于 10。若 \(F < 10\)，弱工具变量问题严重，2SLS 不可靠。现代标准（如李等人 2022 年提出的有效 F 统计量）更加严格。

弱工具变量的替代方法

有限信息最大似然（LIML）：在弱工具变量下偏差小于 2SLS
安德森-鲁宾检验（Anderson-Rubin Test）：即使工具变量弱也有效的推断方法
寻找更强的工具：根本解决方案

过度识别检验

当工具变量数量 \(m\) 大于内生变量数量 \(k\) 时（\(m > k\)），模型过度识别（Overidentified），可以检验工具变量的外生性。

萨尔甘-汉森检验（Sargan-Hansen Test / J-test）：

\[J = n \cdot R^2_{\hat{u}, Z} \sim \chi^2_{m-k}\]

将 2SLS 残差对所有工具变量回归，若工具变量均外生，则残差与工具变量不相关。

过度识别检验的局限

该检验只能在至少一个工具变量外生的前提下检验其余工具的外生性。如果所有工具变量都内生但方向一致，检验可能无法拒绝零假设。因此，工具变量外生性最终依赖于经济理论和制度知识的论证，而非统计检验。

工具变量方法是应对内生性问题的核心工具。好的实证研究需要清晰地论证内生性的来源、工具变量的合理性，以及通过各种诊断检验验证估计结果的稳健性。