非侵入式采集
非侵入式 BCI 通过头皮、颅骨外或外部设备采集信号——无需开颅、监管简单、成本低,但信号质量显著低于侵入式。它是消费级 BCI 和大规模科研的唯一现实方案。
一、四大非侵入技术
| 技术 | 测量量 | 时间分辨率 | 空间分辨率 | 便携 | 成本 |
|---|---|---|---|---|---|
| EEG | 头皮电位 | ms | 2–3 cm | 很高 | \(100–\)5000 |
| MEG | 脑磁场 | ms | 5 mm | 低(磁屏蔽室) | $$$$$ |
| fMRI | BOLD(血氧) | ~1 s | 1–3 mm(全脑) | 无 | $$$$$ |
| fNIRS | 血氧光谱 | ~100 ms | ~1 cm | 中 | $$ |
二、EEG(脑电图)
电极配置
- 国际 10–20 系统:21 电极标准;扩展至 10–10(64/128 通道)
- 干电极 vs 湿电极:干电极便携(Muse、Emotiv),湿电极信噪比更好(科研级 Biosemi ActiveTwo)
- 采样率:256–2048 Hz
带宽 & 成分
| 成分 | 频率/触发 | 特征 |
|---|---|---|
| δ/θ/α/β/γ | 频带 | 状态监测、意图想象 |
| P300 | 事件相关(300 ms) | 稀有刺激响应 |
| SSVEP | 稳态视觉(6–30 Hz) | 视觉 flicker 同步响应 |
| μ rhythm | 8–12 Hz 运动感觉 | 运动想象抑制 |
| N400 | 400 ms | 语义异常 |
典型 BCI 范式
- P300 拼写器(Farwell-Donchin 1988):字符矩阵闪烁,EEG 解码注视字符
- SSVEP 拼写器(ITR 可达 300 bits/min)
- 运动想象(MI-BCI):想象左右手 → μ rhythm 抑制 → 二维光标
限制
颅骨低通滤波 + 空间模糊让 EEG 难以解码: - 精细手指运动(空间分辨不足) - 单词级语音(带宽不足) - 复杂连续动作
Meta 在 2023 年放弃 EEG 转向 MEG 的原因正是信号精度上限。
三、MEG(脑磁图)
原理
神经电流产生微弱磁场(~10 fT,比地磁场弱 10⁸ 倍);用 SQUID(超导量子干涉仪) 检测。
优点
- 不受颅骨衰减(磁场几乎不被颅骨衰减)
- 空间分辨 ~5 mm(比 EEG 好 5–10 倍)
- 时间分辨 ms 级
缺点
- 需要磁屏蔽室(消除地磁与环境磁干扰)
- 需要液氦冷却 SQUID(近年 OPM(光泵磁力计) 开始替代,无需液氦、可头盔化)
- 单台 $200 万起
代表研究
Meta AI / Défossez et al. (2023) 用 MEG 解码听到的语音: - 3 秒窗口内从 ~1500 候选中识别所听词汇 - 41% top-10 accuracy - 纯非侵入、无需训练(用预训练语音表征)
意义:证明非侵入式也能做 brain-to-speech,但数据类型是听觉感知(用户"听"),不是"主动想"。
四、fMRI
原理
BOLD(Blood Oxygen Level Dependent) 信号:神经活动 → 局部血流增加 → 氧合血红蛋白变化 → 磁共振信号变化。
特点
- 时间分辨率差(~1 s,hemodynamic response 延迟 4–6 s)
- 空间分辨率极好(1–3 mm,覆盖全脑)
- 无法便携(3T/7T 扫描仪)
代表 BCI 研究
fMRI 是解码语义和视觉内容的主力:
- Takagi & Nishimoto 2023:Stable Diffusion + fMRI 重建所见图像
- MindEye / MindEye2(2023/2024):CLIP + diffusion 重建自然图像,达到 human-level 识别
- Tang et al. 2023 Nat Neurosci:GPT 语义解码"所听故事大意"
fMRI 适合思想/语义解码而非实时控制——hemodynamic 延迟让实时闭环 BCI 不可行。
五、fNIRS
功能近红外光谱(functional Near-Infrared Spectroscopy) 用 近红外光(700–900 nm)穿透颅骨测量血氧:
- 比 fMRI 便携(头盔化)
- 比 EEG 空间分辨好
- 时间分辨 ~100 ms(比 fMRI 好,比 EEG 差)
- 穿透深度仅 ~3 cm,只能测浅层皮层
Kernel Flow 是消费级 fNIRS 代表(2022 发布)。Meta(Facebook Reality Labs) 2019–2021 曾投入 fNIRS BCI,2021 放弃转 EMG。
六、EMG:非侵入式的"第五支"
严格说 EMG(肌电)不是脑信号,但在 "silent speech" / "gesture BCI" 的消费级应用里非常流行:
- Meta Reality Labs Orion(2024 展示):腕带 EMG 识别意图级手势
- CTRL-Labs(Meta 2019 收购)的 EMG 腕带
- 无声语音:检测喉咙/面部肌电推断未说出的词(MIT AlterEgo 2018)
EMG 优势:精度远高于 EEG(肌肉信号强度比脑电高 100 倍);但不是"读脑"。
七、非侵入式 BCI 的信息论天花板
Wolpaw ITR(information transfer rate) 框架下,非侵入式 BCI 的极限:
- 典型 EEG SSVEP:100–300 bits/min(很快接近打字速度)
- 运动想象 EEG:20–30 bits/min(光标控制)
- MEG 语音:约 10–20 bits/min(词级识别)
- 侵入式 spike(Willett 2023):~62 WPM ≈ 1800 bits/min
结论:非侵入 BCI 在高 ITR 任务上与侵入式差 50–100 倍。这决定了消费级和临床级是完全不同的产品类别。
八、非侵入式的 AI 前沿
近年深度学习显著提升非侵入式 BCI:
- EEGNet(Lawhern 2018):通用 EEG CNN 架构
- EEGPT(Pu 2024):百万级 EEG 预训练 Transformer
- Meta MEGFormer 2023:MEG 语音解码基础模型
- DeWave(Duan 2024):EEG → 离散 token → LLM 语义重建
这些工作的共同模式:自监督预训练 + 下游微调——把 NLP / CV 基础模型范式迁移到非侵入式 BCI。
九、逻辑链
- 非侵入式 BCI = 消费级 BCI,EEG 是唯一大规模商业化的非侵入方案。
- fMRI 适合语义解码,MEG 适合快速解码,fNIRS 适合便携状态监测。
- EMG 是 Meta 等选择的替代路径——跳过"读脑"直接做 gesture BCI。
- 非侵入式 ITR 比侵入式低 50–100 倍,决定了两类 BCI 是不同产品。
- EEG 基础模型 + LLM 融合 是非侵入式 BCI 追赶侵入式的 AI 突破口。
参考文献
- Wolpaw & Wolpaw (2012). Brain-Computer Interfaces: Principles and Practice. Oxford. — 非侵入式 BCI 权威教材
- Défossez et al. (2023). Decoding speech perception from non-invasive brain recordings. Nat Machine Intelligence. https://www.nature.com/articles/s42256-023-00714-5
- Takagi & Nishimoto (2023). High-resolution image reconstruction with latent diffusion models from human brain activity. CVPR.
- Tang et al. (2023). Semantic reconstruction of continuous language from non-invasive brain recordings. Nat Neuroscience. https://www.nature.com/articles/s41593-023-01304-9
- Lawhern et al. (2018). EEGNet: a compact convolutional neural network for EEG-based brain-computer interfaces. J Neural Eng.