共享自主

共享自主（Shared Autonomy） 是 BCI 与机器人融合的核心设计范式：用户提供意图，机器人提供执行。它解决了"信号低带宽、机器人需要高带宽命令"这一根本矛盾，是当前辅助机器人 BCI 的工程标配。

一、为什么需要共享自主

BCI 的信号瓶颈

即便最好的 BCI（Neuralink, Willett 2023）传输率仅 ~8–30 bps
人类说话约 40 bps，打字约 10 bps
7-DoF 机械臂每秒需要 ~200 bps 的控制信号

结论：BCI 带宽永远不够直接控制复杂机器人——需要机器人"自己填空"。

认知负担

即便带宽够，用户同时控制 7 个自由度太累——疲劳、错误、挫败感。

执行精度

人的神经噪声导致控制抖动；机器人精确、稳定。

共享自主的承诺：用户 = 意图层、机器人 = 执行层。

二、Javdani-Srinivasa 框架

Javdani, Srinivasa & Bagnell (2018, IJRR) 提出共享自主的标准 POMDP 框架：

状态

机器人状态 \(s\)（已知）
用户目标 \(g\)（未知，部分可观测）
用户输入 \(u_t\)（噪声版意图）

POMDP 结构

\[P(g | u_{1:t}) \propto P(g) \prod_{\tau=1}^t P(u_\tau | g, s_\tau)\]

机器人维护 goal belief，选择动作最大化期望 utility：

\[a^* = \arg\max_a \mathbb{E}_{g \sim P(g|u)} [V(s', g)]\]

Hindsight Optimization

精确 POMDP 求解不可行——Javdani 的 Hindsight Optimization 假设"未来信念就是当前后验"来近似：

\[a_{\text{HO}}^* = \arg\max_a \sum_g P(g|u) \cdot Q^{\text{full-obs}}(s, a, g)\]

这把 POMDP 退化为在信念加权下做 MDP——可计算，性能相近。

三、经典共享自主行为

辅助抓取

用户推控制杆 → 机器人识别"向哪个物体" → 自动调整手臂轨迹 + 手姿。

辅助移动

用户给个大致方向 → 机器人避障 + 跟随。

辅助喂食

用户选"吃什么" → 机器人识别位置 + 规划抓取 + 送到嘴边。

辅助打字

用户的 BCI 意图低带宽 → LLM 猜测补全（见 LLM后处理融合）。

四、Arbitration（权威分配）

共享自主的核心设计问题：用户 vs 机器人谁说了算？

几种策略

固定混合：\(a = \alpha \cdot a_{\text{user}} + (1-\alpha) \cdot a_{\text{robot}}\)，固定 \(\alpha\)
置信度加权：机器人置信高时自主多；用户信号强时让权
用户覆盖：用户明确意图出现就打断机器人
分层：机器人规划高层，用户微调低层

最佳设计（经验）

新手 / 疲劳期：机器人主导
专家 / 精细阶段：用户主导
Arbitration 应可调——让用户选择自主程度

"User-in-the-loop" vs "Human-in-the-loop"：前者是实时闭环，后者是按事件触发。BCI 通常是 user-in-the-loop。

五、LLM 作为共享自主的新大脑

2023 后，LLM 成为共享自主的"机器人大脑"：

BrainBody-LLM 架构

BCI 意图 (低带宽)
  ↓
LLM (GPT-4 / Claude) — 扩展为完整计划
  ↓
机器人规划 (ROS2 / MoveIt)
  ↓
执行

BCI 传 100 bps 级"语义"
LLM 扩展成 1000+ 步的动作序列
机器人执行

代表工作

HiCRISP（Chen 2023）：LLM + BCI 分层规划
PaLM-E（Google 2023）：多模态 LLM 做机器人推理
RT-2（Google 2023）：视觉-语言-动作端到端

BCI + LLM + 机器人栈是 2024-2026 最活跃方向。详见分层规划_BCI_LLM_机器人。

六、共享自主的评估指标

超越"任务成功率"，需要评估：

任务完成时间（越短越好）
用户干预频率（少更好）
用户认知负担（NASA-TLX 量表）
错误恢复（用户能否打断/修正）
满意度（用户主观评分）

理想曲线：随自主程度增加，完成时间↓、认知负担↓、但"用户控制感"↓。需要在中间找到最佳点。

七、Shared Autonomy 的哲学问题

意图的归属

当机器人代用户做了 90% 决策，"这是用户的行为吗？"——具身哲学问题。

错误的责任

机器人自主决策导致的事故由谁承担？用户、BCI 公司、机器人公司？

神经权利

机器人能从 BCI 持续推断用户意图——这种推断是否属于用户的"精神隐私"？（见 13 章神经权利）

八、标志性系统

Pitt 机械臂（2013）

Collinger 团队：7-DoF 机械臂 + 低层共享自主。用户控制 3D 位置 + 夹爪，机器人自动处理关节冗余。

Walk Again 外骨骼（2016）

Nicolelis 团队：瘫痪者用 BCI 开启步态 + 外骨骼生成具体步态。这是事件触发式共享自主。

BrainGate Coffee（2012）

Hochberg 团队：瘫痪患者 Cathy Hutchinson 拿咖啡喝——首次共享自主的人类演示。

Neuralink PRIME（2024）

Noland Arbaugh 用 N1 控制鼠标 + OS 级辅助（自动补全、AI 助理）——消费级共享自主。

九、与 HRI（人机交互）的交集

共享自主不只是 BCI 问题，也是 HRI（Human-Robot Interaction） 的中心课题：

机器人如何推断用户意图？
机器人如何传达自己的规划给用户？
错误发生时如何恢复？

BCI 增加一维——用户直接通过神经信号输入意图——但所有 HRI 原则仍适用。

十、逻辑链

BCI 带宽永远不够直接控制复杂机器人——共享自主是唯一解法。
POMDP + Hindsight Optimization 是共享自主的数学标准。
Arbitration 机制决定用户 vs 机器人的权力分配，需可调。
LLM 让共享自主进入"语义级"——BCI 意图 → LLM 扩展 → 机器人执行。
共享自主引出哲学、伦理、法律问题——这些是 BCI 商业化的关键讨论。

参考文献

Javdani, Srinivasa & Bagnell (2018). Shared autonomy via hindsight optimization for teleoperation and teaming. IJRR. https://journals.sagepub.com/doi/10.1177/0278364918776480
Jain & Argall (2019). A probabilistic framework for collaborative human-robot problem-solving. Auton Robot.
Collinger et al. (2013). High-performance neuroprosthetic control by an individual with tetraplegia. Lancet.
Hochberg et al. (2012). Reach and grasp by people with tetraplegia using a neurally controlled robotic arm. Nature. https://www.nature.com/articles/nature11076
Chen et al. (2023). HiCRISP: An LLM-driven hierarchical closed-loop robotic intelligent self-correction planner. arXiv.