线性判别与特征选择
在非侵入式 EEG BCI(运动想象、P300、SSVEP)中,数据量小、信噪比低、类别有限,线性判别分析(LDA) 和特征选择仍是多年统治性方法。它们代表了"小数据 BCI"与"大数据侵入式 BCI"完全不同的技术哲学。
一、为什么 EEG 需要线性判别
- 训练数据少(单用户单 session 可能只有几百试次)
- 维度高(64 通道 × 多频段 × 时间窗)
- 类别少(通常 2–4 类)
- 过拟合风险极高
深度学习在这种环境下训练不稳定——线性分类器 + 精心的特征工程反而成为最优。这在 BCI Competition IV-2a 等基准上长期不变。
二、LDA(线性判别分析)
核心思想
找一个投影方向 \(\mathbf{w}\),使得: - 两类均值之差最大 - 两类内方差之和最小
解析解:\(\mathbf{w}^* = (\Sigma_1 + \Sigma_2)^{-1} (\mu_1 - \mu_2)\)
在 BCI 的应用
- P300 分类:信号 vs 非信号
- 运动想象:左手 vs 右手
- SSVEP 目标判定:哪个频率响应最强
优势
- 闭式解、训练快
- 对少数据鲁棒
- 可解释
局限
- 线性判别面
- 假设协方差高斯
- 高维时 \(\Sigma\) 估计不稳
三、Shrinkage LDA(正则化 LDA)
Blankertz et al. 2011 NeuroImage 提出 shrinkage LDA:
\(\gamma \in [0, 1]\) 是收缩系数。shrinkage 让协方差估计在高维下稳定——是 EEG BCI 的标配。
四、CSP 特征 + LDA
Common Spatial Pattern (CSP) + LDA 是运动想象 BCI 十年金标准。
CSP
学习一组空间滤波器 \(W\) 最大化两类协方差比:
滤波后的信号方差(log-variance)作为特征,再送入 LDA。
FBCSP(Filter Bank CSP)
Ang et al. 2008 扩展:
- 把信号分成多个频带(4–40 Hz,步长 4 Hz)
- 每个频带独立做 CSP
- 合并所有频带的 CSP 特征
- 特征选择(mutual information)
- LDA 或 SVM 分类
FBCSP 在 BCI Competition IV 2a 夺冠,长期作为 EEG MI-BCI 标杆。
五、Riemannian 几何
把 EEG 试次的协方差矩阵 \(\mathbf{C}_i \in \mathbb{R}^{d \times d}\) 看作对称正定流形(SPD manifold) 上的点,用流形距离分类。
关键操作
- Log 映射:把 SPD 矩阵映到切空间
- Riemannian mean:流形上的中心
- MDM(Minimum Distance to Mean):分类器就是"到哪个类均值最近"
表现
Barachant et al. 2012 IEEE TBME 首次把 Riemannian 方法应用于 BCI: - 在 BCI Competition IV 上 击败 FBCSP - 无需通道选择、频带选择 - 跨被试迁移好
pyRiemann 是目前最流行的开源实现。
六、特征选择
高维 EEG 特征常需特征选择减少过拟合:
Filter 方法
基于特征与标签的关系独立评分: - Fisher score - Mutual information - ReliefF
Wrapper 方法
- Sequential Forward/Backward Selection
- 每次加/减一个特征看分类性能
Embedded 方法
- L1 正则化(LASSO):训练时自动置零
- 弹性网:L1 + L2
稳定特征选择
Nogueira & Brown 2016 提出 stability selection——对多个 bootstrap 训练集选特征,保留高稳定度的。
七、P300 与 SSVEP 的特殊方法
P300 分类器
- SWLDA(Stepwise Wise LDA):Bender 1988,P300 拼写器标准
- xDAWN 空间滤波:提升 P300 信噪比
SSVEP 分类器
CCA(Canonical Correlation Analysis) 是 SSVEP 的经典方法:
其中 \(X\) 是 EEG,\(Y\) 是参考正弦/余弦模板。哪个频率对应最大 \(\rho\) 就是用户选择。
扩展: - FBCCA(滤波器组 CCA):Chen 2015,多频带集成 - TRCA(Task-Related Component Analysis):利用多试次模板
八、在现代 BCI 中的位置
线性判别和特征选择是消费级/非侵入 BCI 的主力:
- Muse 冥想器:α/β/γ 带功率 + LDA 分类
- Emotiv Cortex:基于频带功率的状态分类
- OpenBCI:CSP + LDA 教学标准
也是深度学习方法的基线——任何新 EEG 深度网络必须超过 shrinkage-LDA 才有意义。
九、与深度学习的比较
| 场景 | 线性判别 | 深度学习 |
|---|---|---|
| 少数据 (<500 试次) | ✓ 更好 | 过拟合 |
| 大数据 (>10000) | 瓶颈 | ✓ 更好 |
| 跨被试迁移 | Riemannian 好 | ✓ 更好 |
| 可解释 | ✓ 高 | 低 |
| 在线 | ✓ 快 | 需优化 |
现代混合策略:Riemannian 特征 + 浅层 CNN,或 EEGNet + shrinkage LDA 头——融合两者优势。
十、逻辑链
- EEG BCI 是小数据问题,传统统计方法因此反而占优。
- LDA + shrinkage 是 EEG 分类的基础方法。
- CSP / FBCSP 是运动想象 BCI 多年金标准。
- Riemannian 几何 把协方差矩阵视为流形点,提供更强跨被试能力。
- 深度学习超越经典方法仍需大数据;小数据场景下特征工程 + 线性分类器仍是最佳选择。
参考文献
- Blankertz et al. (2011). Single-trial analysis and classification of ERP components—a tutorial. NeuroImage. — shrinkage LDA
- Ang et al. (2008). Filter Bank Common Spatial Pattern (FBCSP) in brain-computer interface. IJCNN.
- Barachant et al. (2012). Multi-class brain-computer interface classification by Riemannian geometry. IEEE TBME. https://ieeexplore.ieee.org/document/6046114
- Chen et al. (2015). Filter bank canonical correlation analysis for implementing a high-speed SSVEP-based brain-computer interface. J Neural Eng.
- Lotte et al. (2018). A review of classification algorithms for EEG-based brain-computer interfaces: a 10 year update. J Neural Eng.