跳转至

视觉皮层假体

视觉皮层假体(cortical visual prosthesis) 是 BCI 的写入版本——通过皮层刺激让盲人"看到"视觉。这是医学、神经科学、AI 的三方交汇点,Fernández 2021 Science Advances 成为这一方向的现代里程碑。

一、视觉皮层组织(复习)

  • V1retinotopy(视网膜地形图)——皮层上每个位置对应视野上某区域
  • 中心视觉(fovea)占 V1 的巨大比例
  • 刺激 V1 能诱发 "phosphene"——一个空间位置上的光点感知

这是视觉皮层假体的解剖基础

二、三条视觉假体路径

路径 位置 分辨率 限制
视网膜假体 视网膜 60 像素(Argus II) 视网膜还需健康
视神经 视神经 ~40 像素 对失明后神经退化者不适用
V1 皮层 枕叶 V1 96 通道(Fernández) 跳过所有下游——广泛适用

V1 是失明 BCI 的"最后机会"——视网膜退化、视神经丢失者只有皮层路径可行。

三、历史:Dobelle 到 Fernández

Dobelle 1968(第一代)

William Dobelle 1968 首次尝试: - 64 电极置于皮层表面 - 激发 phosphene - 病人能"看"简单形状(字母、十字) - 但分辨率极低、稳定性差

2000s 停滞

Dobelle 系统未商业化。研究转向视网膜假体(Argus II 2013 批准)。

Fernández 2021(第二代)

Fernández et al. (2021, Sci Adv) 带来现代突破。

四、Fernández 2021 Science Advances

被试

  • Bernardeta Gómez(失明 16 年,先前有残余视觉概念)
  • 96 通道 Utah Array 植入 V1 内

实验

  1. 电刺激阈值测定:70 μA 即可诱发 phosphene
  2. 空间分辨率测试:相邻电极激发不同空间位置的 phosphene
  3. 识别任务:用户能识别字母(E、O、H)
  4. 视觉 + 摄像头:戴摄像头 + 计算机视觉处理 → 图像特征 → 电极刺激模式

关键发现

  • V1 皮层刺激能诱发稳定、可重复的视觉感知
  • 阈值低(70 μA 远低于视网膜假体所需)
  • 首次皮层假体实现"阅读字母"

意义

  • 证明 V1 皮层视觉假体路径可行
  • 96 通道不够清晰图像,但原理性证明已达成
  • 打开 1000+ 通道下一代路径

五、Phosphene 工程

可控性

通过调整电流幅度、频率、脉冲宽度,phosphene 特性可调:

参数 影响
电流幅度 亮度
频率 闪烁
脉冲宽度 大小
电极选择 空间位置

多电极刺激

同时刺激多个电极产生拼接图案——类似低分辨率屏幕。

但存在非线性互扰:相邻电极同时刺激不等于两个单独 phosphene 叠加。

Phosphene 形状

经验上 phosphene 多为圆点,但也有: - 线段 - 色块 - 甚至简单形状

六、差分可微 Phosphene 模拟

2024 最新进展differentiable phosphene simulation

问题

直接优化"电极模式 → 用户感知"需要患者大量反馈——慢、主观。

解决

  1. 构建可微 phosphene 生成模型:输入电极模式,输出预测的 phosphene 图像
  2. 用户反馈训练生成模型
  3. 给定目标图像,梯度优化电极模式

优势

  • 端到端可优化:目标图像 → 最佳电极模式
  • 不需每次问用户
  • 支持动态视觉

代表

  • Beauchamp 2020 Moran Eye Institute 的相关工作
  • Duret 2024 Differentiable phosphene simulation

七、下一代高通量假体

Moran Eye / BLV(Baylor-Illinois-NIH-VA)

  • 1000+ 通道硅基
  • 多区域(V1 + V2 + LGN)
  • 预计 2026+ 人体试验

Second Sight(破产后重组)

  • Orion 项目(V1 假体)
  • 60+ 通道
  • 临床前

中国视觉假体项目

  • 上海交大清华 Neuracle 相关研究
  • 2025–2027 预期人体试验

八、与计算机视觉的融合

视觉假体不单独工作——需要摄像头 + 计算机视觉处理:

摄像头图像
  ↓
物体识别 + 重要区域提取
  ↓
低分辨率 phosphene 映射
  ↓
电极刺激模式
  ↓
用户感知

AI 优化

  • 重要性感知:只刺激关键物体(YOLO + 注意力)
  • 边缘增强:强化边界
  • 运动突出:移动物体亮
  • 个性化:为每用户优化

BrainGate 也要用 AI 处理视觉——让 96 像素"感知"尽可能有用。

九、脑-视频解码 vs 视觉假体

这两条路径是对偶的

  • 脑-视频解码:大脑 → 视觉内容(读)
  • 视觉假体:视觉内容 → 大脑(写)

两者共享: - 视觉皮层解剖 - CLIP / 视觉表征 - 生成模型先验

未来可能融合系统: - 盲人戴摄像头 → AI 处理 → V1 刺激(写) - 同时记录 V1 响应 → 解码"用户看到什么"(读) - 闭环优化

这是双向视觉 BCI 的方向。

十、伦理与患者体验

视觉假体不等于恢复视觉

用户不会看到"正常图像",而是低分辨率 phosphene 拼图——需要学习解释。

适应过程

大脑需要数月整合 phosphene 为有意义的视觉——神经可塑性关键。

风险

  • 电极感染
  • 长期稳定性
  • 心理适应(视觉 vs 期望)

知情同意

复杂的期望管理——患者需要理解"不会像正常看一样"。

十一、逻辑链

  1. V1 retinotopy 是皮层视觉假体的解剖基础。
  2. Fernández 2021 用 96 通道 Utah 让失明 16 年的患者看到字母
  3. Phosphene 是皮层刺激的基本视觉单位,多电极拼成低分辨率图。
  4. 差分可微 phosphene 模拟 让电极模式可被 AI 优化。
  5. 下一代 1000+ 通道假体是目标——向实用视觉接近。
  6. AI + 摄像头 + 视觉假体是完整系统:CV 处理 + 皮层写入。
  7. 读写融合是视觉 BCI 的未来方向。

参考文献

  • Fernández et al. (2021). Visual percepts evoked with an intracortical 96-channel microelectrode array in a blind patient. Science Advances. https://www.science.org/doi/10.1126/sciadv.abf8986
  • Dobelle et al. (1974). Phosphenes produced by electrical stimulation of human occipital cortex, and their application to the development of a prosthesis for the blind. J Physiol.
  • Beauchamp et al. (2020). Dynamic stimulation of visual cortex produces form vision in sighted and blind humans. Cell. https://www.cell.com/cell/fulltext/S0092-8674(20)30437-2
  • Chen et al. (2020). Shape perception via a high-channel-count neuroprosthesis in monkey visual cortex. Science.
  • Duret et al. (2024). End-to-end optimization of phosphene patterns via differentiable simulation. bioRxiv.

评论 #