In DevelopmentV1.01

SOMA Arm

当前最具体的 reference implementation

一个以桌面机械臂为载体的语言驱动机器人项目,用来验证 ANIMA 的认知闭环、视觉 grounding、技能执行与失败恢复。

它不是最终产品,而是通向家庭机器人的操作能力层与 benchmark。

SOMA Arm
真实工作台、机械臂与棋盘构成了现在最能说明问题的系统载体。
Demo

演示视频

V1.01 演示 — 最新进展(感知基础阶段)
Hardware
机械臂
Waveshare RoArm-M2-S 4-DOF
相机
Logitech C922 顶视工作台配置
工作台
棋盘、棋子、固定灯光
Software
认知层
ANIMA + Claude parser + py_trees
感知层
Grounding DINO + SAM2
执行层
ROS 2 + MoveIt2 + ACT / LeRobot
当前范围
  • 在棋盘上识别可吃的子、理解棋规、执行吃子动作
  • 视觉感知与棋盘状态识别
  • 失败检测、重试与自然语言反馈
当前推进
  • 相机参数锁定、内参标定、eye-to-hand 标定、世界坐标 grounding
  • 工作区可达性验证与感知 pipeline 搭建
后续扩展
  • 棋盘状态识别与棋规引擎集成
  • 从固定桌面臂迁移到更完整的家庭机器人平台
Milestones

版本路线图

2026-04-07 ~ 2026-04-13

V1.00 — 开发环境与基础控制

WSL2 + ROS 2 环境搭建、RoArm-M2-S 串口驱动、MoveIt2 bridge、PDP Xbox 手柄遥操、C922 相机 TCP bridge。

2026-04-14 ~

V1.01 — 感知基础

相机参数锁定、内参标定、eye-to-hand 标定、世界坐标 grounding、工作区可达性验证。

Planned

V1.02P — 棋子操作

MoveIt2 primitives、Teleop 数据采集、ACT 训练。

Planned

V1.03P — 棋盘感知与引擎

棋盘状态识别、引擎框架(在 ANIMA 中)、棋规引擎。

Planned

V1.04P — ANIMA 集成与 Demo

行为树编排、吃子流程、NL 前端、演示视频。

Demo / Media
演示视频占位
后续补充公开视频入口
FAQ

常见问题

为什么现在主攻下棋路线?

因为它是一个足够具体、可验证、又能在桌面环境中完成闭环的 benchmark。它不是终点,而是通向家务机器人能力层的过渡路线。

哪些部分是开源的?

当前公开主线包括 ANIMA 与 soma-arm。更未来的产品化形态与某些后续路线可能进入私有仓库,但这个站会明确标注状态,不把未来规划伪装成已公开内容。

SOMA 和 ANIMA 到底是什么关系?

SOMA 是机器人身体与产品线,ANIMA 是共享认知框架。首页永远先讲 SOMA,是因为访客更容易先理解具体机器人,再理解底层框架。