视觉皮层假体
视觉皮层假体(cortical visual prosthesis) 是 BCI 的写入版本——通过皮层刺激让盲人"看到"视觉。这是医学、神经科学、AI 的三方交汇点,Fernández 2021 Science Advances 成为这一方向的现代里程碑。
一、视觉皮层组织(复习)
- V1:retinotopy(视网膜地形图)——皮层上每个位置对应视野上某区域
- 中心视觉(fovea)占 V1 的巨大比例
- 刺激 V1 能诱发 "phosphene"——一个空间位置上的光点感知
这是视觉皮层假体的解剖基础。
二、三条视觉假体路径
| 路径 | 位置 | 分辨率 | 限制 |
|---|---|---|---|
| 视网膜假体 | 视网膜 | 60 像素(Argus II) | 视网膜还需健康 |
| 视神经 | 视神经 | ~40 像素 | 对失明后神经退化者不适用 |
| V1 皮层 | 枕叶 V1 | 96 通道(Fernández) | 跳过所有下游——广泛适用 |
V1 是失明 BCI 的"最后机会"——视网膜退化、视神经丢失者只有皮层路径可行。
三、历史:Dobelle 到 Fernández
Dobelle 1968(第一代)
William Dobelle 1968 首次尝试: - 64 电极置于皮层表面 - 激发 phosphene - 病人能"看"简单形状(字母、十字) - 但分辨率极低、稳定性差
2000s 停滞
Dobelle 系统未商业化。研究转向视网膜假体(Argus II 2013 批准)。
Fernández 2021(第二代)
Fernández et al. (2021, Sci Adv) 带来现代突破。
四、Fernández 2021 Science Advances
被试
- Bernardeta Gómez(失明 16 年,先前有残余视觉概念)
- 96 通道 Utah Array 植入 V1 内
实验
- 电刺激阈值测定:70 μA 即可诱发 phosphene
- 空间分辨率测试:相邻电极激发不同空间位置的 phosphene
- 识别任务:用户能识别字母(E、O、H)
- 视觉 + 摄像头:戴摄像头 + 计算机视觉处理 → 图像特征 → 电极刺激模式
关键发现
- V1 皮层刺激能诱发稳定、可重复的视觉感知
- 阈值低(70 μA 远低于视网膜假体所需)
- 首次皮层假体实现"阅读字母"
意义
- 证明 V1 皮层视觉假体路径可行
- 96 通道不够清晰图像,但原理性证明已达成
- 打开 1000+ 通道下一代路径
五、Phosphene 工程
可控性
通过调整电流幅度、频率、脉冲宽度,phosphene 特性可调:
| 参数 | 影响 |
|---|---|
| 电流幅度 | 亮度 |
| 频率 | 闪烁 |
| 脉冲宽度 | 大小 |
| 电极选择 | 空间位置 |
多电极刺激
同时刺激多个电极产生拼接图案——类似低分辨率屏幕。
但存在非线性互扰:相邻电极同时刺激不等于两个单独 phosphene 叠加。
Phosphene 形状
经验上 phosphene 多为圆点,但也有: - 线段 - 色块 - 甚至简单形状
六、差分可微 Phosphene 模拟
2024 最新进展:differentiable phosphene simulation。
问题
直接优化"电极模式 → 用户感知"需要患者大量反馈——慢、主观。
解决
- 构建可微 phosphene 生成模型:输入电极模式,输出预测的 phosphene 图像
- 用户反馈训练生成模型
- 给定目标图像,梯度优化电极模式
优势
- 端到端可优化:目标图像 → 最佳电极模式
- 不需每次问用户
- 支持动态视觉
代表
- Beauchamp 2020 Moran Eye Institute 的相关工作
- Duret 2024 Differentiable phosphene simulation
七、下一代高通量假体
Moran Eye / BLV(Baylor-Illinois-NIH-VA)
- 1000+ 通道硅基
- 多区域(V1 + V2 + LGN)
- 预计 2026+ 人体试验
Second Sight(破产后重组)
- Orion 项目(V1 假体)
- 60+ 通道
- 临床前
中国视觉假体项目
- 上海交大、清华 Neuracle 相关研究
- 2025–2027 预期人体试验
八、与计算机视觉的融合
视觉假体不单独工作——需要摄像头 + 计算机视觉处理:
摄像头图像
↓
物体识别 + 重要区域提取
↓
低分辨率 phosphene 映射
↓
电极刺激模式
↓
用户感知
AI 优化
- 重要性感知:只刺激关键物体(YOLO + 注意力)
- 边缘增强:强化边界
- 运动突出:移动物体亮
- 个性化:为每用户优化
BrainGate 也要用 AI 处理视觉——让 96 像素"感知"尽可能有用。
九、脑-视频解码 vs 视觉假体
这两条路径是对偶的:
- 脑-视频解码:大脑 → 视觉内容(读)
- 视觉假体:视觉内容 → 大脑(写)
两者共享: - 视觉皮层解剖 - CLIP / 视觉表征 - 生成模型先验
未来可能融合系统: - 盲人戴摄像头 → AI 处理 → V1 刺激(写) - 同时记录 V1 响应 → 解码"用户看到什么"(读) - 闭环优化
这是双向视觉 BCI 的方向。
十、伦理与患者体验
视觉假体不等于恢复视觉
用户不会看到"正常图像",而是低分辨率 phosphene 拼图——需要学习解释。
适应过程
大脑需要数月整合 phosphene 为有意义的视觉——神经可塑性关键。
风险
- 电极感染
- 长期稳定性
- 心理适应(视觉 vs 期望)
知情同意
复杂的期望管理——患者需要理解"不会像正常看一样"。
十一、逻辑链
- V1 retinotopy 是皮层视觉假体的解剖基础。
- Fernández 2021 用 96 通道 Utah 让失明 16 年的患者看到字母。
- Phosphene 是皮层刺激的基本视觉单位,多电极拼成低分辨率图。
- 差分可微 phosphene 模拟 让电极模式可被 AI 优化。
- 下一代 1000+ 通道假体是目标——向实用视觉接近。
- AI + 摄像头 + 视觉假体是完整系统:CV 处理 + 皮层写入。
- 读写融合是视觉 BCI 的未来方向。
参考文献
- Fernández et al. (2021). Visual percepts evoked with an intracortical 96-channel microelectrode array in a blind patient. Science Advances. https://www.science.org/doi/10.1126/sciadv.abf8986
- Dobelle et al. (1974). Phosphenes produced by electrical stimulation of human occipital cortex, and their application to the development of a prosthesis for the blind. J Physiol.
- Beauchamp et al. (2020). Dynamic stimulation of visual cortex produces form vision in sighted and blind humans. Cell. https://www.cell.com/cell/fulltext/S0092-8674(20)30437-2
- Chen et al. (2020). Shape perception via a high-channel-count neuroprosthesis in monkey visual cortex. Science.
- Duret et al. (2024). End-to-end optimization of phosphene patterns via differentiable simulation. bioRxiv.