信号预处理
神经信号从电极到解码器之间必须经过一系列预处理(preprocessing):滤波、去噪、降采样、特征提取、spike sorting。这些步骤决定了下游解码的信噪比天花板。
一、预处理管道
原始信号 → 滤波 → 去伪迹 → 降采样 → 特征提取 → 解码器
↓ ↓ ↓ ↓
spike / ICA / decimate / bandpower /
LFP wavelet resample high-γ
二、滤波
带通滤波
神经信号的各频段对应不同事件,预处理首步是带通分离:
| 目标 | 带通 | 方法 |
|---|---|---|
| Spike | 300 Hz–6 kHz | 高阶 Butterworth |
| LFP | 1–300 Hz | 低阶 Butterworth + notch |
| Mu rhythm | 8–12 Hz | 窄带 |
| High-γ | 80–200 Hz | 宽带 + Hilbert 包络 |
陷波滤波
去除 60 Hz 电源干扰(中国 50 Hz)及其谐波。常用 notch filter(Q 因子 30–50)。
因果 vs 非因果
- 非因果滤波(filtfilt):零相位延迟,适合离线分析
- 因果滤波:适合在线 BCI(实时解码不能用未来数据)
实时 BCI 必须用因果滤波或 sliding window 方案,这引入了 5–20 ms 延迟——必须在延迟预算内。
三、伪迹(Artifact)处理
生理伪迹
- 眼电(EOG):眨眼产生 ~100 μV 跨 Fp1/Fp2 电位
- 肌电(EMG):咀嚼、下颌紧张污染 20 Hz 以上
- 心电(ECG):远程电极受心脏 ECG 影响
运动伪迹
- 电极移动、线缆拖拽
- 步态运动产生低频节律
去伪迹方法
独立成分分析(ICA) 是 EEG 去伪迹的金标准:
- 把 N 通道信号分解为 N 个独立源
- 人工(或自动)识别哪些源是眼电/肌电
- 只保留"脑源"重建信号
工具:MNE-Python、EEGLAB 的 ICLabel 自动分类插件。
小波去噪、自适应滤波(LMS/RLS) 是其他常用方法。
四、Spike Sorting
Spike sorting 把多神经元混合信号分离为单神经元发放序列。这是侵入式 BCI 的核心预处理步骤。
标准管道
- 带通滤波(300 Hz–6 kHz)
- 阈值检测(3–5 × 噪声 RMS)
- 窗口提取(±1 ms 波形)
- 对齐(峰值对齐或 minimum-absolute 对齐)
- 降维(PCA 或 wavelet)
- 聚类(GMM、template matching)
主流工具
| 工具 | 适用场景 | 特点 |
|---|---|---|
| Kilosort | Neuropixels、Utah | 快速、GPU、工业标准 |
| MountainSort | 通用 | 全自动、精度高 |
| SpyKING CIRCUS | 密集阵列 | 处理重叠 spike |
| YASS | 大规模 | 端到端深度学习 |
无 spike sorting 的替代
近年研究表明 spike sorting 对 BCI 解码可能不必要:
- Threshold crossing(TCR):只记录阈值超过事件,不区分 unit
- Spike rate:直接用 binned 事件率
- Waveform-preserving decoders:端到端从滤波信号学习
Willett 2023 语音 BCI 用的是 TCR + high-γ——跳过 spike sorting,让深度学习直接处理。这是"sortless decoding" 的新趋势。
五、特征提取
时域特征
- 峰峰值(PP)
- 过零率
- 线长(line length)
- Hjorth 参数
频域特征
- 带功率(band power):δ/θ/α/β/γ 的功率谱密度
- SSVEP 频率锁相:目标频率相位一致性
- 连接度(PLV、coherence):跨电极相位关系
时频特征
- 短时傅立叶变换(STFT)
- 小波(Morlet)
- 多锥 tapers(Slepian)
非线性特征
- 样本熵(sample entropy)
- 多尺度熵
- 分形维数
大部分经典 EEG BCI(P300, SSVEP, MI)依赖这些手工特征;深度学习 BCI 则多从滤波原信号或功率谱学习。
六、降维与正则化
PCA / ICA
减小特征维度,防止过拟合。
CSP(Common Spatial Pattern)
运动想象 EEG BCI 的金标准:学习一组空间滤波器,使两类想象(左/右手)方差差异最大:
扩展:FBCSP(Filter Bank CSP) 在多个频带上做 CSP 然后特征选择。
Riemannian Geometry
把 EEG 协方差矩阵看作对称正定流形上的点,用 Riemannian 距离做分类。这一方法在 BCI Competition IV-2a 上多年领先。
七、对齐与归一化
Z-score 归一化
x_norm = (x - μ) / σ
在每个通道独立做。BCI 数据通常用 per-session 或 per-trial baseline 归一化。
通道对齐
不同 session 电极偏移导致同一物理位置对应不同通道。解决: - Procrustes 对齐(刚性变换) - Domain adaptation(深度网络 + adversarial loss) - CEBRA / LFADS-style 潜空间对齐(把潜变量对齐,跳过通道对齐)
八、开源工具链
| 工具 | 语言 | 主要功能 |
|---|---|---|
| MNE-Python | Python | EEG/MEG 全链路(滤波/ICA/源定位) |
| EEGLAB | MATLAB | EEG 经典工具 |
| Brainstorm | MATLAB | MEG/EEG 源重建 |
| Kilosort | MATLAB/Python | Spike sorting |
| Neo / NWB | Python | 神经数据 I/O 标准 |
| DPSH / DABEST | Python | 统计 |
| Braindecode | Python | 深度学习 EEG |
九、NWB 与标准化
Neurodata Without Borders (NWB) 是神经数据的 HDF5-based 标准: - 电生理、行为、元数据统一 - Allen Institute、IBL、BrainGate 均用 - 支持 SpikeInterface、MNE 转换
标准化数据格式让 POYO、NDT3 这类神经基础模型得以训练——跨实验室数据才能聚合。
十、逻辑链
- 预处理是解码器性能的上限——糟糕的去伪迹会让深度学习也无能为力。
- Spike sorting 仍是侵入式 BCI 标准流程,但"sortless decoding"开始挑战。
- CSP/Riemannian 是 EEG BCI 的经典特征工程,被深度学习逐步取代。
- 通道对齐是跨 session BCI 的关键,潜空间对齐是现代替代方案。
- NWB 标准化 + 开源工具链 让 BCI 研究进入协作时代。
参考文献
- Gramfort et al. (2013). MEG and EEG data analysis with MNE-Python. Front Neurosci. https://www.frontiersin.org/articles/10.3389/fnins.2013.00267
- Pachitariu et al. (2024). Spike sorting with Kilosort4. Nat Methods.
- Lotte et al. (2018). A review of classification algorithms for EEG-based brain-computer interfaces: a 10 year update. J Neural Eng.
- Teeters et al. (2015). Neurodata Without Borders: creating a common data format for neurophysiology. Neuron. — NWB
- Barachant et al. (2012). Multi-class brain-computer interface classification by Riemannian geometry. IEEE TBME.