统计套利
统计套利概述 (Statistical Arbitrage)
统计套利 (Statistical Arbitrage, StatArb) 是一类基于统计关系偏离与回归的系统化交易策略。与经典无风险套利不同,统计套利依赖概率优势而非确定性利润,因此承担一定风险。
核心特征:
- 市场中性 (Market Neutral):多空对冲,消除系统性风险暴露
- 均值回归 (Mean Reversion):利用价格偏离均衡关系后的回归趋势
- 高频交易与再平衡:需要频繁调仓以捕捉微小价差
配对交易 (Pairs Trading)
配对交易是最经典的统计套利策略,由 Morgan Stanley 的 Nunzio Tartaglia 团队在 1980 年代首创。
基本思路
- 找到两只历史上价格走势高度相关的股票 \(A\) 和 \(B\)
- 当价差 (Spread) 偏离历史均值时建仓
- 做多相对便宜的股票,做空相对昂贵的股票
- 等待价差回归时平仓获利
距离法 (Distance Method)
最简单的配对选择方法:
其中 \(\tilde{P}\) 为标准化价格序列。选取距离最小的 Top-\(N\) 对。
距离法的局限
距离法缺乏统计理论支撑,容易受伪回归 (Spurious Regression) 影响。更稳健的方法是基于协整检验。
协整策略 (Cointegration-based Strategy)
协整关系 (Cointegration)
两个非平稳序列 \(X_t \sim I(1)\) 和 \(Y_t \sim I(1)\),若存在 \(\beta\) 使得残差平稳:
则称 \(X_t\) 和 \(Y_t\) 协整,\(\beta\) 为协整系数 (Cointegrating Coefficient)。
检验方法:
- Engle-Granger 两步法:第一步 OLS 回归得到残差,第二步对残差做 ADF 检验
- Johansen 检验:基于 VAR 模型的似然比检验,可同时检测多个协整关系
协整 vs. 相关
高相关性不意味着协整,反之亦然。相关性衡量短期共动,协整衡量长期均衡关系。例如,两只石油股可能高度相关但不协整;一只股票与其 ADR 可能低频相关性一般但存在强协整关系。
交易信号
基于协整残差 \(Z_t\) 构造交易信号:
- 当 \(s_t > +k\)(通常 \(k = 2\)):价差过大,做空 \(Y\)、做多 \(X\)
- 当 \(s_t < -k\):价差过小,做多 \(Y\)、做空 \(X\)
- 当 \(|s_t| < c\)(如 \(c = 0.5\)):平仓
Ornstein-Uhlenbeck 过程
均值回归的连续时间数学模型是 Ornstein-Uhlenbeck (OU) 过程:
参数含义:
- \(\mu\):长期均值水平
- \(\theta > 0\):均值回复速度 (Mean Reversion Speed)
- \(\sigma\):波动率
OU 过程的解析解:
关键统计量:
半衰期 (Half-life):价差偏离回归一半所需时间:
参数估计与交易决策
对离散观测数据,可通过 AR(1) 回归估计 OU 参数:
\(X_{t+1} - X_t = a + bX_t + \varepsilon_t\)
则 \(\theta = -b/\Delta t\),\(\mu = -a/b\),\(\sigma = \sigma_\varepsilon / \sqrt{\Delta t}\)。
半衰期过短(如 < 1 天)难以执行,过长(如 > 60 天)风险过大。通常选择半衰期在 5-30 天的配对。
市场中性构建 (Market Neutral)
完整的统计套利组合需要实现多维度中性:
- Beta 中性:\(\sum_i w_i \beta_i \approx 0\),消除市场风险
- 行业中性:各行业多空头寸相抵
- 因子中性:控制对常见风险因子(价值、动量等)的暴露
组合构建可表述为约束优化:
实践风险
统计套利面临的主要风险包括:协整关系断裂(结构性变化导致策略失效)、流动性风险(危机时流动性枯竭无法平仓)、策略拥挤(过多参与者导致利润稀释和同向平仓风险)。2007 年 8 月的"量化地震" (Quant Quake) 即为典型案例。