共享自主
共享自主(Shared Autonomy) 是 BCI 与机器人融合的核心设计范式:用户提供意图,机器人提供执行。它解决了"信号低带宽、机器人需要高带宽命令"这一根本矛盾,是当前辅助机器人 BCI 的工程标配。
一、为什么需要共享自主
BCI 的信号瓶颈
- 即便最好的 BCI(Neuralink, Willett 2023)传输率仅 ~8–30 bps
- 人类说话约 40 bps,打字约 10 bps
- 7-DoF 机械臂每秒需要 ~200 bps 的控制信号
结论:BCI 带宽永远不够直接控制复杂机器人——需要机器人"自己填空"。
认知负担
即便带宽够,用户同时控制 7 个自由度太累——疲劳、错误、挫败感。
执行精度
人的神经噪声导致控制抖动;机器人精确、稳定。
共享自主的承诺:用户 = 意图层、机器人 = 执行层。
二、Javdani-Srinivasa 框架
Javdani, Srinivasa & Bagnell (2018, IJRR) 提出共享自主的标准 POMDP 框架:
状态
- 机器人状态 \(s\)(已知)
- 用户目标 \(g\)(未知,部分可观测)
- 用户输入 \(u_t\)(噪声版意图)
POMDP 结构
机器人维护 goal belief,选择动作最大化期望 utility:
Hindsight Optimization
精确 POMDP 求解不可行——Javdani 的 Hindsight Optimization 假设"未来信念就是当前后验"来近似:
这把 POMDP 退化为在信念加权下做 MDP——可计算,性能相近。
三、经典共享自主行为
辅助抓取
用户推控制杆 → 机器人识别"向哪个物体" → 自动调整手臂轨迹 + 手姿。
辅助移动
用户给个大致方向 → 机器人避障 + 跟随。
辅助喂食
用户选"吃什么" → 机器人识别位置 + 规划抓取 + 送到嘴边。
辅助打字
用户的 BCI 意图低带宽 → LLM 猜测补全(见 LLM后处理融合)。
四、Arbitration(权威分配)
共享自主的核心设计问题:用户 vs 机器人谁说了算?
几种策略
- 固定混合:\(a = \alpha \cdot a_{\text{user}} + (1-\alpha) \cdot a_{\text{robot}}\),固定 \(\alpha\)
- 置信度加权:机器人置信高时自主多;用户信号强时让权
- 用户覆盖:用户明确意图出现就打断机器人
- 分层:机器人规划高层,用户微调低层
最佳设计(经验)
- 新手 / 疲劳期:机器人主导
- 专家 / 精细阶段:用户主导
- Arbitration 应可调——让用户选择自主程度
"User-in-the-loop" vs "Human-in-the-loop":前者是实时闭环,后者是按事件触发。BCI 通常是 user-in-the-loop。
五、LLM 作为共享自主的新大脑
2023 后,LLM 成为共享自主的"机器人大脑":
BrainBody-LLM 架构
BCI 意图 (低带宽)
↓
LLM (GPT-4 / Claude) — 扩展为完整计划
↓
机器人规划 (ROS2 / MoveIt)
↓
执行
- BCI 传 100 bps 级"语义"
- LLM 扩展成 1000+ 步的动作序列
- 机器人执行
代表工作
- HiCRISP(Chen 2023):LLM + BCI 分层规划
- PaLM-E(Google 2023):多模态 LLM 做机器人推理
- RT-2(Google 2023):视觉-语言-动作端到端
BCI + LLM + 机器人栈是 2024-2026 最活跃方向。详见 分层规划_BCI_LLM_机器人。
六、共享自主的评估指标
超越"任务成功率",需要评估:
- 任务完成时间(越短越好)
- 用户干预频率(少更好)
- 用户认知负担(NASA-TLX 量表)
- 错误恢复(用户能否打断/修正)
- 满意度(用户主观评分)
理想曲线:随自主程度增加,完成时间↓、认知负担↓、但"用户控制感"↓。需要在中间找到最佳点。
七、Shared Autonomy 的哲学问题
意图的归属
当机器人代用户做了 90% 决策,"这是用户的行为吗?"——具身哲学问题。
错误的责任
机器人自主决策导致的事故由谁承担?用户、BCI 公司、机器人公司?
神经权利
机器人能从 BCI 持续推断用户意图——这种推断是否属于用户的"精神隐私"?(见 13 章 神经权利)
八、标志性系统
Pitt 机械臂(2013)
Collinger 团队:7-DoF 机械臂 + 低层共享自主。用户控制 3D 位置 + 夹爪,机器人自动处理关节冗余。
Walk Again 外骨骼(2016)
Nicolelis 团队:瘫痪者用 BCI 开启步态 + 外骨骼生成具体步态。这是事件触发式共享自主。
BrainGate Coffee(2012)
Hochberg 团队:瘫痪患者 Cathy Hutchinson 拿咖啡喝——首次共享自主的人类演示。
Neuralink PRIME(2024)
Noland Arbaugh 用 N1 控制鼠标 + OS 级辅助(自动补全、AI 助理)——消费级共享自主。
九、与 HRI(人机交互)的交集
共享自主不只是 BCI 问题,也是 HRI(Human-Robot Interaction) 的中心课题:
- 机器人如何推断用户意图?
- 机器人如何传达自己的规划给用户?
- 错误发生时如何恢复?
BCI 增加一维——用户直接通过神经信号输入意图——但所有 HRI 原则仍适用。
十、逻辑链
- BCI 带宽永远不够直接控制复杂机器人——共享自主是唯一解法。
- POMDP + Hindsight Optimization 是共享自主的数学标准。
- Arbitration 机制决定用户 vs 机器人的权力分配,需可调。
- LLM 让共享自主进入"语义级"——BCI 意图 → LLM 扩展 → 机器人执行。
- 共享自主引出哲学、伦理、法律问题——这些是 BCI 商业化的关键讨论。
参考文献
- Javdani, Srinivasa & Bagnell (2018). Shared autonomy via hindsight optimization for teleoperation and teaming. IJRR. https://journals.sagepub.com/doi/10.1177/0278364918776480
- Jain & Argall (2019). A probabilistic framework for collaborative human-robot problem-solving. Auton Robot.
- Collinger et al. (2013). High-performance neuroprosthetic control by an individual with tetraplegia. Lancet.
- Hochberg et al. (2012). Reach and grasp by people with tetraplegia using a neurally controlled robotic arm. Nature. https://www.nature.com/articles/nature11076
- Chen et al. (2023). HiCRISP: An LLM-driven hierarchical closed-loop robotic intelligent self-correction planner. arXiv.