产学研合作
概述
具身智能是一个高度依赖产学研协作的领域。学术界贡献基础算法和开源数据,产业界推动工程化和规模化,而开源社区则加速知识共享。本文梳理全球主要研究实验室、中国力量及关键开源项目。
一、北美顶级实验室
1.1 Stanford IRIS Lab(Chelsea Finn)
| 维度 | 内容 |
|---|---|
| 全称 | Intelligence through Robotic Interaction at Scale |
| 核心方向 | 模仿学习、VLA 模型、低成本遥操作 |
| 代表工作 | ALOHA / Mobile ALOHA, RT-2 (合作), Octo (合作) |
| 技术特色 | Action Chunking Transformer (ACT),低成本双臂系统 |
| 产业影响 | ALOHA 硬件被 10+ 实验室复现;Physical Intelligence 联合创始人 |
| 开源贡献 | ALOHA 硬件方案、ACT 代码、DROID 数据集(合作) |
为什么重要
Finn 实验室是 VLA 和低成本机器人学习的事实标准制定者。ALOHA 系统证明了 $32K 即可做出先进的双臂操作。
1.2 UC Berkeley BAIR(Pieter Abbeel / Sergey Levine)
| 维度 | 内容 |
|---|---|
| 全称 | Berkeley Artificial Intelligence Research |
| 核心方向 | 强化学习、机器人基础模型、泛化操作 |
| 代表工作 | Octo, RT-2 (合作), Bridge V2 数据集, DROID |
| 技术特色 | 大规模机器人数据收集、跨机器人迁移学习 |
| 产业影响 | Levine - 多家公司顾问; Abbeel - Covariant 创始人 |
| 开源贡献 | Octo 模型、Bridge 数据集、Open X-Embodiment (主导) |
1.3 CMU Robotics Institute(Deepak Pathak)
| 维度 | 内容 |
|---|---|
| 核心方向 | 视觉运动策略、四足机器人敏捷运动 |
| 代表工作 | LEAP Hand, 四足 Parkour, HomeRobot |
| 技术特色 | 好奇心驱动探索、视觉-运动端到端策略 |
| 产业影响 | LEAP 低成本灵巧手设计被广泛引用 |
| 开源贡献 | LEAP Hand 硬件/软件开源 |
1.4 MIT CSAIL
| PI | 方向 | 代表工作 |
|---|---|---|
| Pulkit Agrawal | 灵巧操作、触觉 | GelSight 触觉传感器、接触丰富操作 |
| Russ Tedrake | 优化控制、仿真 | Drake 仿真/控制平台、机器人力学教材 |
| Leslie Kaelbling | 任务与运动规划 | TAMP、长时域推理 |
Drake 平台:MIT 开发的多体动力学仿真与优化控制框架,在轨迹优化和接触动力学方面有独特优势,被 TRI 深度使用。
1.5 其他重要北美实验室
| 实验室 | PI | 机构 | 特色方向 |
|---|---|---|---|
| REAL Lab | Shuran Song | Stanford | 3D 视觉操作、布料操作 |
| GRAIL | Dieter Fox | UW | 物体姿态估计、FoundationPose |
| PAIR | Ken Goldberg | UC Berkeley | 抓取、云机器人 |
| Robotic Exploration Lab | Zac Manchester | CMU | 轨迹优化、微型航天器 |
二、企业研究实验室
2.1 Google DeepMind Robotics
| 维度 | 内容 |
|---|---|
| 核心方向 | 机器人基础模型、VLA |
| 代表工作 | RT-1, RT-2, RT-X, SayCan, Robotics Transformer 系列 |
| 技术特色 | 大规模真实机器人数据收集(RT 系列)、LLM/VLM 与机器人结合 |
| 数据规模 | Open X-Embodiment:100 万+ episodes,22 种机器人 |
| 团队 | Vincent Vanhoucke, Karol Hausman, Quan Vuong 等 |
2.2 Toyota Research Institute (TRI)
| 维度 | 内容 |
|---|---|
| 核心方向 | 扩散策略、家庭服务机器人 |
| 代表工作 | Diffusion Policy 部署验证、大规模遥操作数据收集 |
| 技术特色 | 强调可部署性:真实家庭环境中的长期测试 |
| 方法论 | 使用 Drake 平台 + 扩散策略 + 人类遥操作闭环 |
| 规模 | 1000+ 台机器人的数据收集集群(目标) |
2.3 NVIDIA Robotics
| 维度 | 内容 |
|---|---|
| 核心方向 | 仿真平台、基础模型、GPU 加速 |
| 代表工作 | Isaac Sim/Lab/Gym, GR00T, Cosmos, Eureka |
| 技术特色 | GPU 大规模并行仿真、世界模型生成合成数据 |
| 产业影响 | Isaac 平台是事实上的机器人仿真标准之一 |
2.4 其他企业实验室
| 企业 | 研究方向 | 代表成果 |
|---|---|---|
| Physical Intelligence (π) | 通用机器人策略 | π0, π0.5 |
| Meta FAIR | 触觉、具身导航 | Habitat, DIGIT 触觉 |
| Microsoft Research | 基础模型、仿真 | PromptCraft, ChatGPT for Robotics |
| Hugging Face | 开源机器人学习 | LeRobot |
三、欧洲研究力量
3.1 ETH Zurich RSL(Marco Hutter)
| 维度 | 内容 |
|---|---|
| 全称 | Robotic Systems Lab |
| 核心方向 | 四足机器人、腿式运动、强化学习控制 |
| 代表工作 | ANYmal 系列四足机器人、腿式 RL 控制 |
| 技术特色 | Sim2Real 四足运动、极端地形适应 |
| 产业化 | ANYbotics 公司(工业巡检四足机器人) |
3.2 其他欧洲实验室
| 实验室 | 机构 | 特色 |
|---|---|---|
| IIT Humanoid Lab | 意大利理工学院 | iCub 人形机器人平台 |
| TU Munich Learning Systems | 慕尼黑工大 | 安全学习、贝叶斯优化 |
| Imperial Dyson Robotics | 帝国理工 | 家庭服务机器人 |
| LAAS-CNRS | 法国国家科学研究中心 | 人形运动规划 |
四、中国研究力量
4.1 清华大学交叉信息研究院(Hao Dong 董豪)
| 维度 | 内容 |
|---|---|
| 核心方向 | 机器人基础模型、灵巧操作 |
| 代表工作 | RDT (Robotics Diffusion Transformer) |
| 技术特色 | 扩散 Transformer 在机器人操作中的应用 |
| 开源贡献 | RDT 模型及训练代码 |
4.2 北京通用人工智能研究院 BIGAI(朱松纯)
| 维度 | 内容 |
|---|---|
| 核心方向 | 认知架构、通用人工智能 |
| 代表工作 | TONG 架构、具身认知 |
| 技术特色 | 从认知科学出发的具身智能,强调常识推理 |
| 理念 | "小数据、大任务"—通过认知架构减少数据需求 |
4.3 上海人工智能实验室
| 维度 | 内容 |
|---|---|
| 核心方向 | 具身智能仿真、大模型 |
| 代表工作 | GRUtopia(通用机器人乌托邦仿真平台) |
| 技术特色 | 大规模城市级仿真环境、多机器人协作 |
| 合作 | 与多所高校联合研究 |
4.4 其他中国研究力量
| 机构 | 代表方向 | 特色 |
|---|---|---|
| 北京大学(王鹤) | 灵巧操作、通用操作 | UniDexGrasp 系列 |
| 中科院自动化所 | 人形机器人控制 | 运动控制与规划 |
| 上海交通大学 | 机器人操作 | 工业应用导向 |
| 哈尔滨工业大学 | 空间机器人 | 航天机械臂 |
| 香港大学(Pan Jia) | 具身导航 | 视觉语言导航 |
| 清华大学 MARS Lab(赵行) | 自动驾驶/具身 | 端到端自动驾驶 |
五、开源生态
5.1 LeRobot(Hugging Face)
| 维度 | 内容 |
|---|---|
| 定位 | 机器人学习的 "Hugging Face" |
| 功能 | 预训练模型、数据集托管、训练框架 |
| 支持模型 | ACT, Diffusion Policy, TDMPC, VQ-BeT 等 |
| 支持硬件 | ALOHA, Koch v1.1, SO-100, Moss 等 |
| 地址 | https://github.com/huggingface/lerobot |
| 意义 | 降低机器人学习入门门槛至"安装即用" |
5.2 Open X-Embodiment
| 维度 | 内容 |
|---|---|
| 发起者 | Google DeepMind + 21 个机构 |
| 数据规模 | 100 万+ 真实机器人 episodes |
| 机器人类型 | 22 种不同机器人(单臂、双臂、移动等) |
| 数据格式 | RLDS (Reinforcement Learning Datasets) |
| 意义 | 首个大规模跨形态机器人数据集 |
5.3 其他重要开源项目
| 项目 | 类型 | 维护者 | 说明 |
|---|---|---|---|
| DROID | 数据集 | Stanford/Berkeley | 7.6 万轨迹,多样场景 |
| ManiSkill | 仿真基准 | UCSD/Hillbot | GPU 并行操作环境 |
| robosuite | 仿真基准 | Stanford/NVIDIA | 机器人操作基准 |
| Habitat | 仿真平台 | Meta | 具身导航 |
| SAPIEN | 仿真平台 | UCSD | 关节物体交互 |
| Isaac Lab | 仿真平台 | NVIDIA | GPU 加速 RL 训练 |
六、产学研合作模式
6.1 主要合作模式
| 模式 | 示例 | 特点 |
|---|---|---|
| 企业赞助实验室 | TRI 资助 MIT/Stanford | 长期稳定,目标导向 |
| 联合发表论文 | DeepMind + 21 机构(RT-X) | 大规模协作,高影响力 |
| 人才双向流动 | Finn → Physical Intelligence → Stanford | 学术创业常态化 |
| 开源生态 | Open X-Embodiment | 数据和模型共享 |
| 竞赛驱动 | RoboCup, DARPA Challenge | 推动技术突破 |
| 政府项目 | 中国人形机器人攻关、欧盟 Horizon | 顶层设计引导 |
6.2 趋势观察
2024-2025 趋势
- 学术创业爆发:顶级 PI 纷纷创业或担任顾问(Finn→π, Abbeel→Covariant, Levine→π)
- 数据联盟形成:从单实验室数据到跨机构数据联盟
- 开源基础设施成熟:LeRobot + HuggingFace 生态降低入门门槛
- 中国快速追赶:政策支持 + 资本涌入 + 人才回流
- 硬件标准化趋势:ALOHA、Koch 等开源硬件方案推动标准化
七、关键学术会议
| 会议 | 全称 | 频率 | 重要性 | 方向侧重 |
|---|---|---|---|---|
| CoRL | Conference on Robot Learning | 年度 | ★★★★★ | 机器人学习核心 |
| RSS | Robotics: Science and Systems | 年度 | ★★★★★ | 机器人理论与系统 |
| ICRA | IEEE Int'l Conf. Robotics and Automation | 年度 | ★★★★★ | 机器人最大会议 |
| IROS | IEEE/RSJ Int'l Conf. Intelligent Robots | 年度 | ★★★★ | 机器人系统 |
| NeurIPS/ICML/ICLR | 机器学习三大会 | 年度 | ★★★★ | 基础算法、基础模型 |
| CVPR | Computer Vision | 年度 | ★★★★ | 视觉感知相关 |
| HRI | Human-Robot Interaction | 年度 | ★★★ | 人机交互 |
延伸阅读
- 关键会议与期刊 - 具身智能学术会议详细介绍
- Open X-Embodiment: https://robotics-transformer-x.github.io/
- LeRobot: https://github.com/huggingface/lerobot
- DROID: https://droid-dataset.github.io/