跳转至

π0 / π0.5(Physical Intelligence)

最后更新:2026-04-24

π0 是 Physical Intelligence(π)2024-11 发布的通用机器人基础模型——第一个真正 zero-shot 跨任务 / 跨机器人的 VLA 模型。基于 PaliGemma(Google 3B VLM)+ Flow Matching 动作头,训练数据覆盖 7 种机器人 + 68 项任务π0.5(2025-04)更小 + 更强 OOD 泛化。

一、产品定位

π0 = "机器人的 GPT-3 时刻" —— 第一个通用 VLA 模型能看图 + 听话 + 做未见过的任务。不做硬件,只做大脑π0.5 解决了"家务场景" 泛化

二、核心能力与架构

π0(3.3B 参数)

  • VLM backbone:PaliGemma 3B
  • Action head:Flow Matching(连续动作生成)
  • 数据:7 种机器人,68 任务,10k+ 小时
  • 能力:叠衣、收桌、制作三明治

π0.5(2025-04)

  • 规模相近但数据更多样
  • 重点:OOD 泛化(新环境、新物体)

π0.5-KI

  • Knowledge Insulation 版本
  • 家庭场景 demo(整理 Airbnb)

三、版本与路线图

时间 版本
2024-11 π0 发布
2025-01 开源部分权重
2025-04 π0.5
2025-Q3 π1.0(推测)

四、定价与商业化

  • π 不做硬件
  • API / 模型授权给硬件公司
  • 早期商业化

五、用户反馈

  • "真机器人 GPT 时刻" —— 研究圈震撼
  • HuggingFace LeRobot 集成 π0 得到广泛使用
  • 批:实际场景 success rate 仍 < 70%

六、竞品对比

维度 π0 / 0.5 OpenVLA / RT-2 NVIDIA GR00T Gemini Robotics
开源 部分
参数 3.3B 7B / RT-2 2B 大规模
跨机器人 ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐
任务数 68+ 数十 扩展中 未公开

七、使用笔记

  • 最适合:机器人研究 + 原型验证
  • 部分开源 让学术圈广泛采用
  • 2025 成为 LeRobot 标配

八、信息源