π0 / π0.5(Physical Intelligence)
最后更新:2026-04-24
π0 是 Physical Intelligence(π)2024-11 发布的通用机器人基础模型——第一个真正 zero-shot 跨任务 / 跨机器人的 VLA 模型。基于 PaliGemma(Google 3B VLM)+ Flow Matching 动作头,训练数据覆盖 7 种机器人 + 68 项任务。π0.5(2025-04)更小 + 更强 OOD 泛化。
一、产品定位
π0 = "机器人的 GPT-3 时刻" —— 第一个通用 VLA 模型能看图 + 听话 + 做未见过的任务。不做硬件,只做大脑。π0.5 解决了"家务场景" 泛化。
二、核心能力与架构
π0(3.3B 参数)
- VLM backbone:PaliGemma 3B
- Action head:Flow Matching(连续动作生成)
- 数据:7 种机器人,68 任务,10k+ 小时
- 能力:叠衣、收桌、制作三明治
π0.5(2025-04)
- 规模相近但数据更多样
- 重点:OOD 泛化(新环境、新物体)
π0.5-KI
- Knowledge Insulation 版本
- 家庭场景 demo(整理 Airbnb)
三、版本与路线图
| 时间 | 版本 |
|---|---|
| 2024-11 | π0 发布 |
| 2025-01 | 开源部分权重 |
| 2025-04 | π0.5 |
| 2025-Q3 | π1.0(推测) |
四、定价与商业化
- π 不做硬件
- API / 模型授权给硬件公司
- 早期商业化
五、用户反馈
- "真机器人 GPT 时刻" —— 研究圈震撼
- HuggingFace LeRobot 集成 π0 得到广泛使用
- 批:实际场景 success rate 仍 < 70%
六、竞品对比
| 维度 | π0 / 0.5 | OpenVLA / RT-2 | NVIDIA GR00T | Gemini Robotics |
|---|---|---|---|---|
| 开源 | 部分 | ✅ | ✅ | ❌ |
| 参数 | 3.3B | 7B / RT-2 | 2B | 大规模 |
| 跨机器人 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐ |
| 任务数 | 68+ | 数十 | 扩展中 | 未公开 |
七、使用笔记
- 最适合:机器人研究 + 原型验证
- 部分开源 让学术圈广泛采用
- 2025 成为 LeRobot 标配
八、信息源
- Physical Intelligence 官方(physicalintelligence.company)
- π0 论文(2024-11)
- π0.5 博客 2025-04
- 本站 · Physical Intelligence 公司 · 技术路线