信号预处理

神经信号从电极到解码器之间必须经过一系列预处理（preprocessing）：滤波、去噪、降采样、特征提取、spike sorting。这些步骤决定了下游解码的信噪比天花板。

一、预处理管道

原始信号 → 滤波 → 去伪迹 → 降采样 → 特征提取 → 解码器
            ↓         ↓          ↓          ↓
          spike /   ICA /      decimate / bandpower /
          LFP      wavelet    resample    high-γ

二、滤波

带通滤波

神经信号的各频段对应不同事件，预处理首步是带通分离：

目标	带通	方法
Spike	300 Hz–6 kHz	高阶 Butterworth
LFP	1–300 Hz	低阶 Butterworth + notch
Mu rhythm	8–12 Hz	窄带
High-γ	80–200 Hz	宽带 + Hilbert 包络

陷波滤波

去除 60 Hz 电源干扰（中国 50 Hz）及其谐波。常用 notch filter（Q 因子 30–50）。

因果 vs 非因果

非因果滤波（filtfilt）：零相位延迟，适合离线分析
因果滤波：适合在线 BCI（实时解码不能用未来数据）

实时 BCI 必须用因果滤波或 sliding window 方案，这引入了 5–20 ms 延迟——必须在延迟预算内。

三、伪迹（Artifact）处理

生理伪迹

眼电（EOG）：眨眼产生 ~100 μV 跨 Fp1/Fp2 电位
肌电（EMG）：咀嚼、下颌紧张污染 20 Hz 以上
心电（ECG）：远程电极受心脏 ECG 影响

运动伪迹

电极移动、线缆拖拽
步态运动产生低频节律

去伪迹方法

独立成分分析（ICA） 是 EEG 去伪迹的金标准：

把 N 通道信号分解为 N 个独立源
人工（或自动）识别哪些源是眼电/肌电
只保留"脑源"重建信号

工具：MNE-Python、EEGLAB 的 ICLabel 自动分类插件。

小波去噪、自适应滤波（LMS/RLS） 是其他常用方法。

四、Spike Sorting

Spike sorting 把多神经元混合信号分离为单神经元发放序列。这是侵入式 BCI 的核心预处理步骤。

标准管道

带通滤波（300 Hz–6 kHz）
阈值检测（3–5 × 噪声 RMS）
窗口提取（±1 ms 波形）
对齐（峰值对齐或 minimum-absolute 对齐）
降维（PCA 或 wavelet）
聚类（GMM、template matching）

主流工具

工具	适用场景	特点
Kilosort	Neuropixels、Utah	快速、GPU、工业标准
MountainSort	通用	全自动、精度高
SpyKING CIRCUS	密集阵列	处理重叠 spike
YASS	大规模	端到端深度学习

无 spike sorting 的替代

近年研究表明 spike sorting 对 BCI 解码可能不必要：

Threshold crossing（TCR）：只记录阈值超过事件，不区分 unit
Spike rate：直接用 binned 事件率
Waveform-preserving decoders：端到端从滤波信号学习

Willett 2023 语音 BCI 用的是 TCR + high-γ——跳过 spike sorting，让深度学习直接处理。这是"sortless decoding" 的新趋势。

五、特征提取

时域特征

峰峰值（PP）
过零率
线长（line length）
Hjorth 参数

频域特征

带功率（band power）：δ/θ/α/β/γ 的功率谱密度
SSVEP 频率锁相：目标频率相位一致性
连接度（PLV、coherence）：跨电极相位关系

时频特征

短时傅立叶变换（STFT）
小波（Morlet）
多锥 tapers（Slepian）

非线性特征

样本熵（sample entropy）
多尺度熵
分形维数

大部分经典 EEG BCI（P300, SSVEP, MI）依赖这些手工特征；深度学习 BCI 则多从滤波原信号或功率谱学习。

六、降维与正则化

PCA / ICA

减小特征维度，防止过拟合。

CSP（Common Spatial Pattern）

运动想象 EEG BCI 的金标准：学习一组空间滤波器，使两类想象（左/右手）方差差异最大：

\[W = \arg\max_W \frac{\text{tr}(W^T \Sigma_1 W)}{\text{tr}(W^T (\Sigma_1 + \Sigma_2) W)}\]

扩展：FBCSP（Filter Bank CSP） 在多个频带上做 CSP 然后特征选择。

Riemannian Geometry

把 EEG 协方差矩阵看作对称正定流形上的点，用 Riemannian 距离做分类。这一方法在 BCI Competition IV-2a 上多年领先。

七、对齐与归一化

Z-score 归一化

x_norm = (x - μ) / σ

在每个通道独立做。BCI 数据通常用 per-session 或 per-trial baseline 归一化。

通道对齐

不同 session 电极偏移导致同一物理位置对应不同通道。解决： - Procrustes 对齐（刚性变换） - Domain adaptation（深度网络 + adversarial loss） - CEBRA / LFADS-style 潜空间对齐（把潜变量对齐，跳过通道对齐）

八、开源工具链

工具	语言	主要功能
MNE-Python	Python	EEG/MEG 全链路（滤波/ICA/源定位）
EEGLAB	MATLAB	EEG 经典工具
Brainstorm	MATLAB	MEG/EEG 源重建
Kilosort	MATLAB/Python	Spike sorting
Neo / NWB	Python	神经数据 I/O 标准
DPSH / DABEST	Python	统计
Braindecode	Python	深度学习 EEG

九、NWB 与标准化

Neurodata Without Borders (NWB) 是神经数据的 HDF5-based 标准： - 电生理、行为、元数据统一 - Allen Institute、IBL、BrainGate 均用 - 支持 SpikeInterface、MNE 转换

标准化数据格式让 POYO、NDT3 这类神经基础模型得以训练——跨实验室数据才能聚合。

十、逻辑链

预处理是解码器性能的上限——糟糕的去伪迹会让深度学习也无能为力。
Spike sorting 仍是侵入式 BCI 标准流程，但"sortless decoding"开始挑战。
CSP/Riemannian 是 EEG BCI 的经典特征工程，被深度学习逐步取代。
通道对齐是跨 session BCI 的关键，潜空间对齐是现代替代方案。
NWB 标准化 + 开源工具链 让 BCI 研究进入协作时代。

参考文献

Gramfort et al. (2013). MEG and EEG data analysis with MNE-Python. Front Neurosci. https://www.frontiersin.org/articles/10.3389/fnins.2013.00267
Pachitariu et al. (2024). Spike sorting with Kilosort4. Nat Methods.
Lotte et al. (2018). A review of classification algorithms for EEG-based brain-computer interfaces: a 10 year update. J Neural Eng.
Teeters et al. (2015). Neurodata Without Borders: creating a common data format for neurophysiology. Neuron. — NWB
Barachant et al. (2012). Multi-class brain-computer interface classification by Riemannian geometry. IEEE TBME.