跳转至

信号预处理

神经信号从电极到解码器之间必须经过一系列预处理(preprocessing):滤波、去噪、降采样、特征提取、spike sorting。这些步骤决定了下游解码的信噪比天花板。

一、预处理管道

原始信号 → 滤波 → 去伪迹 → 降采样 → 特征提取 → 解码器
            ↓         ↓          ↓          ↓
          spike /   ICA /      decimate / bandpower /
          LFP      wavelet    resample    high-γ

二、滤波

带通滤波

神经信号的各频段对应不同事件,预处理首步是带通分离

目标 带通 方法
Spike 300 Hz–6 kHz 高阶 Butterworth
LFP 1–300 Hz 低阶 Butterworth + notch
Mu rhythm 8–12 Hz 窄带
High-γ 80–200 Hz 宽带 + Hilbert 包络

陷波滤波

去除 60 Hz 电源干扰(中国 50 Hz)及其谐波。常用 notch filter(Q 因子 30–50)。

因果 vs 非因果

  • 非因果滤波(filtfilt):零相位延迟,适合离线分析
  • 因果滤波:适合在线 BCI(实时解码不能用未来数据)

实时 BCI 必须用因果滤波或 sliding window 方案,这引入了 5–20 ms 延迟——必须在延迟预算内。

三、伪迹(Artifact)处理

生理伪迹

  • 眼电(EOG):眨眼产生 ~100 μV 跨 Fp1/Fp2 电位
  • 肌电(EMG):咀嚼、下颌紧张污染 20 Hz 以上
  • 心电(ECG):远程电极受心脏 ECG 影响

运动伪迹

  • 电极移动、线缆拖拽
  • 步态运动产生低频节律

去伪迹方法

独立成分分析(ICA) 是 EEG 去伪迹的金标准:

  1. 把 N 通道信号分解为 N 个独立源
  2. 人工(或自动)识别哪些源是眼电/肌电
  3. 只保留"脑源"重建信号

工具:MNE-Python、EEGLAB 的 ICLabel 自动分类插件。

小波去噪自适应滤波(LMS/RLS) 是其他常用方法。

四、Spike Sorting

Spike sorting 把多神经元混合信号分离为单神经元发放序列。这是侵入式 BCI 的核心预处理步骤。

标准管道

  1. 带通滤波(300 Hz–6 kHz)
  2. 阈值检测(3–5 × 噪声 RMS)
  3. 窗口提取(±1 ms 波形)
  4. 对齐(峰值对齐或 minimum-absolute 对齐)
  5. 降维(PCA 或 wavelet)
  6. 聚类(GMM、template matching)

主流工具

工具 适用场景 特点
Kilosort Neuropixels、Utah 快速、GPU、工业标准
MountainSort 通用 全自动、精度高
SpyKING CIRCUS 密集阵列 处理重叠 spike
YASS 大规模 端到端深度学习

无 spike sorting 的替代

近年研究表明 spike sorting 对 BCI 解码可能不必要

  • Threshold crossing(TCR):只记录阈值超过事件,不区分 unit
  • Spike rate:直接用 binned 事件率
  • Waveform-preserving decoders:端到端从滤波信号学习

Willett 2023 语音 BCI 用的是 TCR + high-γ——跳过 spike sorting,让深度学习直接处理。这是"sortless decoding" 的新趋势。

五、特征提取

时域特征

  • 峰峰值(PP)
  • 过零率
  • 线长(line length)
  • Hjorth 参数

频域特征

  • 带功率(band power):δ/θ/α/β/γ 的功率谱密度
  • SSVEP 频率锁相:目标频率相位一致性
  • 连接度(PLV、coherence):跨电极相位关系

时频特征

  • 短时傅立叶变换(STFT)
  • 小波(Morlet)
  • 多锥 tapers(Slepian)

非线性特征

  • 样本熵(sample entropy)
  • 多尺度熵
  • 分形维数

大部分经典 EEG BCI(P300, SSVEP, MI)依赖这些手工特征;深度学习 BCI 则多从滤波原信号功率谱学习。

六、降维与正则化

PCA / ICA

减小特征维度,防止过拟合。

CSP(Common Spatial Pattern)

运动想象 EEG BCI 的金标准:学习一组空间滤波器,使两类想象(左/右手)方差差异最大:

\[W = \arg\max_W \frac{\text{tr}(W^T \Sigma_1 W)}{\text{tr}(W^T (\Sigma_1 + \Sigma_2) W)}\]

扩展:FBCSP(Filter Bank CSP) 在多个频带上做 CSP 然后特征选择。

Riemannian Geometry

把 EEG 协方差矩阵看作对称正定流形上的点,用 Riemannian 距离做分类。这一方法在 BCI Competition IV-2a 上多年领先。

七、对齐与归一化

Z-score 归一化

x_norm = (x - μ) / σ

每个通道独立做。BCI 数据通常用 per-sessionper-trial baseline 归一化。

通道对齐

不同 session 电极偏移导致同一物理位置对应不同通道。解决: - Procrustes 对齐(刚性变换) - Domain adaptation(深度网络 + adversarial loss) - CEBRA / LFADS-style 潜空间对齐(把潜变量对齐,跳过通道对齐)

八、开源工具链

工具 语言 主要功能
MNE-Python Python EEG/MEG 全链路(滤波/ICA/源定位)
EEGLAB MATLAB EEG 经典工具
Brainstorm MATLAB MEG/EEG 源重建
Kilosort MATLAB/Python Spike sorting
Neo / NWB Python 神经数据 I/O 标准
DPSH / DABEST Python 统计
Braindecode Python 深度学习 EEG

九、NWB 与标准化

Neurodata Without Borders (NWB) 是神经数据的 HDF5-based 标准: - 电生理、行为、元数据统一 - Allen Institute、IBL、BrainGate 均用 - 支持 SpikeInterface、MNE 转换

标准化数据格式让 POYO、NDT3 这类神经基础模型得以训练——跨实验室数据才能聚合。

十、逻辑链

  1. 预处理是解码器性能的上限——糟糕的去伪迹会让深度学习也无能为力。
  2. Spike sorting 仍是侵入式 BCI 标准流程,但"sortless decoding"开始挑战。
  3. CSP/Riemannian 是 EEG BCI 的经典特征工程,被深度学习逐步取代。
  4. 通道对齐是跨 session BCI 的关键,潜空间对齐是现代替代方案。
  5. NWB 标准化 + 开源工具链 让 BCI 研究进入协作时代。

参考文献

  • Gramfort et al. (2013). MEG and EEG data analysis with MNE-Python. Front Neurosci. https://www.frontiersin.org/articles/10.3389/fnins.2013.00267
  • Pachitariu et al. (2024). Spike sorting with Kilosort4. Nat Methods.
  • Lotte et al. (2018). A review of classification algorithms for EEG-based brain-computer interfaces: a 10 year update. J Neural Eng.
  • Teeters et al. (2015). Neurodata Without Borders: creating a common data format for neurophysiology. Neuron. — NWB
  • Barachant et al. (2012). Multi-class brain-computer interface classification by Riemannian geometry. IEEE TBME.

评论 #