Skip to content

统计套利

统计套利概述 (Statistical Arbitrage)

统计套利 (Statistical Arbitrage, StatArb) 是一类基于统计关系偏离与回归的系统化交易策略。与经典无风险套利不同,统计套利依赖概率优势而非确定性利润,因此承担一定风险。

核心特征:

  • 市场中性 (Market Neutral):多空对冲,消除系统性风险暴露
  • 均值回归 (Mean Reversion):利用价格偏离均衡关系后的回归趋势
  • 高频交易与再平衡:需要频繁调仓以捕捉微小价差

配对交易 (Pairs Trading)

配对交易是最经典的统计套利策略,由 Morgan Stanley 的 Nunzio Tartaglia 团队在 1980 年代首创。

基本思路

  1. 找到两只历史上价格走势高度相关的股票 \(A\)\(B\)
  2. 当价差 (Spread) 偏离历史均值时建仓
  3. 做多相对便宜的股票,做空相对昂贵的股票
  4. 等待价差回归时平仓获利

距离法 (Distance Method)

最简单的配对选择方法:

\[D_{AB} = \sum_{t=1}^{T}\left(\tilde{P}_t^A - \tilde{P}_t^B\right)^2\]

其中 \(\tilde{P}\) 为标准化价格序列。选取距离最小的 Top-\(N\) 对。

距离法的局限

距离法缺乏统计理论支撑,容易受伪回归 (Spurious Regression) 影响。更稳健的方法是基于协整检验。

协整策略 (Cointegration-based Strategy)

协整关系 (Cointegration)

两个非平稳序列 \(X_t \sim I(1)\)\(Y_t \sim I(1)\),若存在 \(\beta\) 使得残差平稳:

\[Z_t = Y_t - \beta X_t \sim I(0)\]

则称 \(X_t\)\(Y_t\) 协整,\(\beta\) 为协整系数 (Cointegrating Coefficient)。

检验方法

  • Engle-Granger 两步法:第一步 OLS 回归得到残差,第二步对残差做 ADF 检验
  • Johansen 检验:基于 VAR 模型的似然比检验,可同时检测多个协整关系

协整 vs. 相关

高相关性不意味着协整,反之亦然。相关性衡量短期共动,协整衡量长期均衡关系。例如,两只石油股可能高度相关但不协整;一只股票与其 ADR 可能低频相关性一般但存在强协整关系。

交易信号

基于协整残差 \(Z_t\) 构造交易信号:

\[s_t = \frac{Z_t - \bar{Z}}{\sigma_Z}\]
  • \(s_t > +k\)(通常 \(k = 2\)):价差过大,做空 \(Y\)、做多 \(X\)
  • \(s_t < -k\):价差过小,做多 \(Y\)、做空 \(X\)
  • \(|s_t| < c\)(如 \(c = 0.5\)):平仓

Ornstein-Uhlenbeck 过程

均值回归的连续时间数学模型是 Ornstein-Uhlenbeck (OU) 过程

\[dX_t = \theta(\mu - X_t)\,dt + \sigma\,dW_t\]

参数含义:

  • \(\mu\):长期均值水平
  • \(\theta > 0\):均值回复速度 (Mean Reversion Speed)
  • \(\sigma\):波动率

OU 过程的解析解

\[X_t = \mu + (X_0 - \mu)e^{-\theta t} + \sigma\int_0^t e^{-\theta(t-s)}\,dW_s\]

关键统计量:

\[\mathbb{E}[X_t | X_0] = \mu + (X_0 - \mu)e^{-\theta t}\]
\[\text{Var}(X_t | X_0) = \frac{\sigma^2}{2\theta}\left(1 - e^{-2\theta t}\right)\]

半衰期 (Half-life):价差偏离回归一半所需时间:

\[t_{1/2} = \frac{\ln 2}{\theta}\]

参数估计与交易决策

对离散观测数据,可通过 AR(1) 回归估计 OU 参数:

\(X_{t+1} - X_t = a + bX_t + \varepsilon_t\)

\(\theta = -b/\Delta t\)\(\mu = -a/b\)\(\sigma = \sigma_\varepsilon / \sqrt{\Delta t}\)

半衰期过短(如 < 1 天)难以执行,过长(如 > 60 天)风险过大。通常选择半衰期在 5-30 天的配对。

市场中性构建 (Market Neutral)

完整的统计套利组合需要实现多维度中性:

  1. Beta 中性\(\sum_i w_i \beta_i \approx 0\),消除市场风险
  2. 行业中性:各行业多空头寸相抵
  3. 因子中性:控制对常见风险因子(价值、动量等)的暴露

组合构建可表述为约束优化:

\[\max_w \; \alpha^T w \quad \text{s.t.} \quad \beta^T w = 0, \; \|w\|_1 \leq L, \; |w_i| \leq u\]

实践风险

统计套利面临的主要风险包括:协整关系断裂(结构性变化导致策略失效)、流动性风险(危机时流动性枯竭无法平仓)、策略拥挤(过多参与者导致利润稀释和同向平仓风险)。2007 年 8 月的"量化地震" (Quant Quake) 即为典型案例。