跳转至

共享自主

共享自主(Shared Autonomy) 是 BCI 与机器人融合的核心设计范式:用户提供意图,机器人提供执行。它解决了"信号低带宽、机器人需要高带宽命令"这一根本矛盾,是当前辅助机器人 BCI 的工程标配。

一、为什么需要共享自主

BCI 的信号瓶颈

  • 即便最好的 BCI(Neuralink, Willett 2023)传输率仅 ~8–30 bps
  • 人类说话约 40 bps,打字约 10 bps
  • 7-DoF 机械臂每秒需要 ~200 bps 的控制信号

结论:BCI 带宽永远不够直接控制复杂机器人——需要机器人"自己填空"。

认知负担

即便带宽够,用户同时控制 7 个自由度太累——疲劳、错误、挫败感。

执行精度

人的神经噪声导致控制抖动;机器人精确、稳定。

共享自主的承诺用户 = 意图层、机器人 = 执行层

二、Javdani-Srinivasa 框架

Javdani, Srinivasa & Bagnell (2018, IJRR) 提出共享自主的标准 POMDP 框架

状态

  • 机器人状态 \(s\)(已知)
  • 用户目标 \(g\)(未知,部分可观测)
  • 用户输入 \(u_t\)(噪声版意图)

POMDP 结构

\[P(g | u_{1:t}) \propto P(g) \prod_{\tau=1}^t P(u_\tau | g, s_\tau)\]

机器人维护 goal belief,选择动作最大化期望 utility:

\[a^* = \arg\max_a \mathbb{E}_{g \sim P(g|u)} [V(s', g)]\]

Hindsight Optimization

精确 POMDP 求解不可行——Javdani 的 Hindsight Optimization 假设"未来信念就是当前后验"来近似:

\[a_{\text{HO}}^* = \arg\max_a \sum_g P(g|u) \cdot Q^{\text{full-obs}}(s, a, g)\]

这把 POMDP 退化为在信念加权下做 MDP——可计算,性能相近。

三、经典共享自主行为

辅助抓取

用户推控制杆 → 机器人识别"向哪个物体" → 自动调整手臂轨迹 + 手姿。

辅助移动

用户给个大致方向 → 机器人避障 + 跟随。

辅助喂食

用户选"吃什么" → 机器人识别位置 + 规划抓取 + 送到嘴边。

辅助打字

用户的 BCI 意图低带宽 → LLM 猜测补全(见 LLM后处理融合)。

四、Arbitration(权威分配)

共享自主的核心设计问题:用户 vs 机器人谁说了算?

几种策略

  1. 固定混合\(a = \alpha \cdot a_{\text{user}} + (1-\alpha) \cdot a_{\text{robot}}\),固定 \(\alpha\)
  2. 置信度加权:机器人置信高时自主多;用户信号强时让权
  3. 用户覆盖:用户明确意图出现就打断机器人
  4. 分层:机器人规划高层,用户微调低层

最佳设计(经验)

  • 新手 / 疲劳期:机器人主导
  • 专家 / 精细阶段:用户主导
  • Arbitration 应可调——让用户选择自主程度

"User-in-the-loop" vs "Human-in-the-loop":前者是实时闭环,后者是按事件触发。BCI 通常是 user-in-the-loop

五、LLM 作为共享自主的新大脑

2023 后,LLM 成为共享自主的"机器人大脑"

BrainBody-LLM 架构

BCI 意图 (低带宽)
  ↓
LLM (GPT-4 / Claude) — 扩展为完整计划
  ↓
机器人规划 (ROS2 / MoveIt)
  ↓
执行
  • BCI 传 100 bps 级"语义"
  • LLM 扩展成 1000+ 步的动作序列
  • 机器人执行

代表工作

  • HiCRISP(Chen 2023):LLM + BCI 分层规划
  • PaLM-E(Google 2023):多模态 LLM 做机器人推理
  • RT-2(Google 2023):视觉-语言-动作端到端

BCI + LLM + 机器人栈是 2024-2026 最活跃方向。详见 分层规划_BCI_LLM_机器人

六、共享自主的评估指标

超越"任务成功率",需要评估:

  1. 任务完成时间(越短越好)
  2. 用户干预频率(少更好)
  3. 用户认知负担(NASA-TLX 量表)
  4. 错误恢复(用户能否打断/修正)
  5. 满意度(用户主观评分)

理想曲线:随自主程度增加,完成时间↓、认知负担↓、但"用户控制感"↓。需要在中间找到最佳点。

七、Shared Autonomy 的哲学问题

意图的归属

当机器人代用户做了 90% 决策,"这是用户的行为吗?"——具身哲学问题。

错误的责任

机器人自主决策导致的事故由谁承担?用户、BCI 公司、机器人公司?

神经权利

机器人能从 BCI 持续推断用户意图——这种推断是否属于用户的"精神隐私"?(见 13 章 神经权利

八、标志性系统

Pitt 机械臂(2013)

Collinger 团队:7-DoF 机械臂 + 低层共享自主。用户控制 3D 位置 + 夹爪,机器人自动处理关节冗余。

Walk Again 外骨骼(2016)

Nicolelis 团队:瘫痪者用 BCI 开启步态 + 外骨骼生成具体步态。这是事件触发式共享自主

BrainGate Coffee(2012)

Hochberg 团队:瘫痪患者 Cathy Hutchinson 拿咖啡喝——首次共享自主的人类演示。

Noland Arbaugh 用 N1 控制鼠标 + OS 级辅助(自动补全、AI 助理)——消费级共享自主。

九、与 HRI(人机交互)的交集

共享自主不只是 BCI 问题,也是 HRI(Human-Robot Interaction) 的中心课题:

  • 机器人如何推断用户意图
  • 机器人如何传达自己的规划给用户?
  • 错误发生时如何恢复

BCI 增加一维——用户直接通过神经信号输入意图——但所有 HRI 原则仍适用。

十、逻辑链

  1. BCI 带宽永远不够直接控制复杂机器人——共享自主是唯一解法。
  2. POMDP + Hindsight Optimization 是共享自主的数学标准。
  3. Arbitration 机制决定用户 vs 机器人的权力分配,需可调。
  4. LLM 让共享自主进入"语义级"——BCI 意图 → LLM 扩展 → 机器人执行。
  5. 共享自主引出哲学、伦理、法律问题——这些是 BCI 商业化的关键讨论。

参考文献

  • Javdani, Srinivasa & Bagnell (2018). Shared autonomy via hindsight optimization for teleoperation and teaming. IJRR. https://journals.sagepub.com/doi/10.1177/0278364918776480
  • Jain & Argall (2019). A probabilistic framework for collaborative human-robot problem-solving. Auton Robot.
  • Collinger et al. (2013). High-performance neuroprosthetic control by an individual with tetraplegia. Lancet.
  • Hochberg et al. (2012). Reach and grasp by people with tetraplegia using a neurally controlled robotic arm. Nature. https://www.nature.com/articles/nature11076
  • Chen et al. (2023). HiCRISP: An LLM-driven hierarchical closed-loop robotic intelligent self-correction planner. arXiv.

评论 #