视觉皮层假体

视觉皮层假体（cortical visual prosthesis） 是 BCI 的写入版本——通过皮层刺激让盲人"看到"视觉。这是医学、神经科学、AI 的三方交汇点，Fernández 2021 Science Advances 成为这一方向的现代里程碑。

一、视觉皮层组织（复习）

V1：retinotopy（视网膜地形图）——皮层上每个位置对应视野上某区域
中心视觉（fovea）占 V1 的巨大比例
刺激 V1 能诱发 "phosphene"——一个空间位置上的光点感知

这是视觉皮层假体的解剖基础。

二、三条视觉假体路径

路径	位置	分辨率	限制
视网膜假体	视网膜	60 像素（Argus II）	视网膜还需健康
视神经	视神经	~40 像素	对失明后神经退化者不适用
V1 皮层	枕叶 V1	96 通道（Fernández）	跳过所有下游——广泛适用

V1 是失明 BCI 的"最后机会"——视网膜退化、视神经丢失者只有皮层路径可行。

三、历史：Dobelle 到 Fernández

Dobelle 1968（第一代）

William Dobelle 1968 首次尝试： - 64 电极置于皮层表面 - 激发 phosphene - 病人能"看"简单形状（字母、十字） - 但分辨率极低、稳定性差

2000s 停滞

Dobelle 系统未商业化。研究转向视网膜假体（Argus II 2013 批准）。

Fernández 2021（第二代）

Fernández et al. (2021, Sci Adv) 带来现代突破。

四、Fernández 2021 Science Advances

被试

Bernardeta Gómez（失明 16 年，先前有残余视觉概念）
96 通道 Utah Array 植入 V1 内

实验

电刺激阈值测定：70 μA 即可诱发 phosphene
空间分辨率测试：相邻电极激发不同空间位置的 phosphene
识别任务：用户能识别字母（E、O、H）
视觉 + 摄像头：戴摄像头 + 计算机视觉处理 → 图像特征 → 电极刺激模式

关键发现

V1 皮层刺激能诱发稳定、可重复的视觉感知
阈值低（70 μA 远低于视网膜假体所需）
首次皮层假体实现"阅读字母"

意义

证明 V1 皮层视觉假体路径可行
96 通道不够清晰图像，但原理性证明已达成
打开 1000+ 通道下一代路径

五、Phosphene 工程

可控性

通过调整电流幅度、频率、脉冲宽度，phosphene 特性可调：

参数	影响
电流幅度	亮度
频率	闪烁
脉冲宽度	大小
电极选择	空间位置

多电极刺激

同时刺激多个电极产生拼接图案——类似低分辨率屏幕。

但存在非线性互扰：相邻电极同时刺激不等于两个单独 phosphene 叠加。

Phosphene 形状

经验上 phosphene 多为圆点，但也有： - 线段 - 色块 - 甚至简单形状

六、差分可微 Phosphene 模拟

2024 最新进展：differentiable phosphene simulation。

问题

直接优化"电极模式 → 用户感知"需要患者大量反馈——慢、主观。

解决

构建可微 phosphene 生成模型：输入电极模式，输出预测的 phosphene 图像
用户反馈训练生成模型
给定目标图像，梯度优化电极模式

优势

端到端可优化：目标图像 → 最佳电极模式
不需每次问用户
支持动态视觉

代表

Beauchamp 2020 Moran Eye Institute 的相关工作
Duret 2024 Differentiable phosphene simulation

七、下一代高通量假体

Moran Eye / BLV（Baylor-Illinois-NIH-VA）

1000+ 通道硅基
多区域（V1 + V2 + LGN）
预计 2026+ 人体试验

Second Sight（破产后重组）

Orion 项目（V1 假体）
60+ 通道
临床前

中国视觉假体项目

上海交大、清华 Neuracle 相关研究
2025–2027 预期人体试验

八、与计算机视觉的融合

视觉假体不单独工作——需要摄像头 + 计算机视觉处理：

摄像头图像
  ↓
物体识别 + 重要区域提取
  ↓
低分辨率 phosphene 映射
  ↓
电极刺激模式
  ↓
用户感知

AI 优化

重要性感知：只刺激关键物体（YOLO + 注意力）
边缘增强：强化边界
运动突出：移动物体亮
个性化：为每用户优化

BrainGate 也要用 AI 处理视觉——让 96 像素"感知"尽可能有用。

九、脑-视频解码 vs 视觉假体

这两条路径是对偶的：

脑-视频解码：大脑 → 视觉内容（读）
视觉假体：视觉内容 → 大脑（写）

两者共享： - 视觉皮层解剖 - CLIP / 视觉表征 - 生成模型先验

未来可能融合系统： - 盲人戴摄像头 → AI 处理 → V1 刺激（写） - 同时记录 V1 响应 → 解码"用户看到什么"（读） - 闭环优化

这是双向视觉 BCI 的方向。

十、伦理与患者体验

视觉假体不等于恢复视觉

用户不会看到"正常图像"，而是低分辨率 phosphene 拼图——需要学习解释。

适应过程

大脑需要数月整合 phosphene 为有意义的视觉——神经可塑性关键。

风险

电极感染
长期稳定性
心理适应（视觉 vs 期望）

知情同意

复杂的期望管理——患者需要理解"不会像正常看一样"。

十一、逻辑链

V1 retinotopy 是皮层视觉假体的解剖基础。
Fernández 2021 用 96 通道 Utah 让失明 16 年的患者看到字母。
Phosphene 是皮层刺激的基本视觉单位，多电极拼成低分辨率图。
差分可微 phosphene 模拟 让电极模式可被 AI 优化。
下一代 1000+ 通道假体是目标——向实用视觉接近。
AI + 摄像头 + 视觉假体是完整系统：CV 处理 + 皮层写入。
读写融合是视觉 BCI 的未来方向。

参考文献

Fernández et al. (2021). Visual percepts evoked with an intracortical 96-channel microelectrode array in a blind patient. Science Advances. https://www.science.org/doi/10.1126/sciadv.abf8986
Dobelle et al. (1974). Phosphenes produced by electrical stimulation of human occipital cortex, and their application to the development of a prosthesis for the blind. J Physiol.
Beauchamp et al. (2020). Dynamic stimulation of visual cortex produces form vision in sighted and blind humans. Cell. https://www.cell.com/cell/fulltext/S0092-8674(20)30437-2
Chen et al. (2020). Shape perception via a high-channel-count neuroprosthesis in monkey visual cortex. Science.
Duret et al. (2024). End-to-end optimization of phosphene patterns via differentiable simulation. bioRxiv.