无人机
概述
无人机(Unmanned Aerial Vehicle, UAV)是具身智能在三维空间中的重要载体。从农业植保到物流配送、从影视航拍到军事侦察,无人机正深刻改变多个行业。自主无人机代表了感知、规划、控制的高度集成——在高速三维运动中实时决策。
无人机分类
旋翼、固定翼与 VTOL
| 类型 | 代表 | 优点 | 缺点 | 典型应用 |
|---|---|---|---|---|
| 多旋翼 | DJI Mavic, Crazyflie | 悬停、低速机动、简单 | 续航短、效率低 | 航拍、巡检 |
| 固定翼 | senseFly eBee | 长航时、高速、高效 | 不能悬停、需跑道/弹射 | 测绘、长距巡检 |
| VTOL | 纵横 CW-25, Wingtra | 兼顾悬停和巡航 | 机械复杂、过渡模式难 | 物流、长距巡检 |
| 单旋翼 | 传统直升机构型 | 大负载、长航时 | 机械复杂、振动大 | 农业植保 |
四旋翼作为研究平台
四旋翼(quadrotor)是最常用的研究平台,原因:
- 机械结构简单(4 个电机 + 螺旋桨)
- 动力学模型解析可得
- 小型化容易(室内飞行)
- 丰富的开源生态
四旋翼动力学
坐标系定义
- 世界坐标系 \(\{W\}\):NED(North-East-Down)或 ENU(East-North-Up)
- 机体坐标系 \(\{B\}\):原点在质心,\(x\) 前方,\(z\) 向上
旋转矩阵 \(R \in SO(3)\) 将机体坐标系变换到世界坐标系。
牛顿-欧拉方程
平动方程:
其中 \(\mathbf{p} = [x, y, z]^T\) 是世界坐标系中的位置,\(T = \sum_{i=1}^{4} f_i\) 是总推力。
转动方程:
其中 \(J\) 是惯性张量,\(\boldsymbol{\omega}\) 是机体角速度。
推力与力矩分配
四个电机产生的推力 \(f_i\) 与转速 \(\omega_i\) 的关系为:
总推力和力矩:
其中 \(L\) 是电机到质心的距离。这个分配矩阵是可逆的,因此可以通过期望的推力和力矩求解各电机转速。
微分平坦性(Differential Flatness):四旋翼系统是微分平坦的——系统的全部状态和输入可以用平坦输出 \([x, y, z, \psi]^T\)(位置 + 偏航角)及其导数表示。这意味着只需规划位置轨迹,就能推导出完整的状态和控制输入。
控制架构
PX4 / ArduPilot 飞控栈
graph TB
subgraph 地面站
GCS[QGroundControl / Mission Planner]
end
subgraph 机载计算机
COMP[Jetson / RPI / NUC] --> VIO[视觉里程计]
COMP --> DET[目标检测]
COMP --> PLAN[路径规划]
end
subgraph 飞控 PX4/ArduPilot
POS[位置控制器<br/>PID] --> ATT[姿态控制器<br/>PID / Quaternion]
ATT --> RATE[角速率控制器<br/>PID]
RATE --> MIX[电机混控器<br/>Mixer]
MIX --> ESC[电调 ESC]
EKF[扩展卡尔曼滤波<br/>状态估计] --> POS
IMU[IMU] --> EKF
BARO[气压计] --> EKF
GPS[GPS] --> EKF
MAG[磁力计] --> EKF
end
GCS -->|MAVLink| COMP
COMP -->|MAVLink| POS
VIO -->|位姿| EKF
ESC --> M1[电机 1-4]
级联 PID 控制器
PX4 的默认控制器是三层级联 PID:
外环——位置控制:
中环——姿态控制:从期望加速度提取期望姿态,然后计算期望角速度。
内环——角速率控制:
高级控制方法
模型预测控制(MPC):在有限时间窗内优化控制序列,处理约束:
SE(3) 几何控制:直接在 \(SE(3)\) 李群上设计控制器,避免万向锁问题,适用于大角度机动。
自主导航
GPS 拒止环境下的导航
室内或隧道等 GPS 不可用的场景中,无人机需要依靠自身传感器进行定位:
视觉惯性里程计(VIO):融合相机和 IMU 数据估计位姿
- VINS-Mono / VINS-Fusion:香港科大开源 VIO 系统
- MSCKF:多状态约束卡尔曼滤波
- ORB-SLAM3:支持 VIO 模式
LiDAR SLAM:
- LOAM / LIO-SAM:LiDAR 里程计 + IMU 紧耦合
- 精度高但传感器重量大,适合大型无人机
运动规划
无人机路径规划需要考虑:
- 动力学约束(最大速度、加速度、角速率)
- 碰撞避免(静态障碍 + 动态障碍)
- 能耗优化(最小化总推力变化)
常用方法:
- 最小 snap 轨迹:最小化四阶导数(snap),保证轨迹平滑:
- EGO-Planner:基于 ESDF(欧氏距离场)的梯度规划,实时性好
- Fast-Planner:浙大开源的快速运动规划系统
基于学习的敏捷飞行
UZH RPG 组的工作
苏黎世大学机器人与感知组(RPG)在学习型敏捷飞行方面取得了突破性成果:
Swift (2023):RL 训练的无人机在竞速比赛中击败人类冠军飞手
- 使用 PPO 在仿真中训练
- 视觉感知通过 RGB 相机 + 门检测
- 实现了超越人类极限的速度和加速度
Agile Autonomy (2021):端到端学习的高速避障
- 深度图像输入 → 轨迹点输出
- 在密林中 10 m/s 飞行
仿真到真实(Sim-to-Real)
无人机 RL 的 Sim-to-Real 需要考虑:
- 空气动力学效应(旋翼气流、地效应)
- 电机响应延迟
- IMU 噪声和偏差
- 通信延迟
空中操作
无人机抓取
空中操作(Aerial Manipulation)将无人机与机械臂结合,实现空中抓取和操作:
- 挑战:抓取引入的外力/力矩严重影响飞行稳定性
- 方案:全驱动(over-actuated)平台或自适应控制
- 应用:高空检修、危险物品处理、建筑施工
多机协作搬运
多架无人机通过绳索或刚性连接协同搬运大型物体:
需要分布式控制和通信。
集群智能
多智能体协调
无人机集群(swarm)的核心问题:
- 队形控制:保持预定的几何构型
- 碰撞避免:集群内部不碰撞
- 任务分配:多机分工合作
Reynolds 规则(受鸟群启发):
- 分离(Separation):避免与邻居太近
- 对齐(Alignment):与邻居保持相同速度方向
- 聚合(Cohesion):向邻居中心移动
数学形式:
通信与去中心化
- 中心化:所有无人机向中心节点报告,中心节点下发指令。简单但单点故障。
- 去中心化:每架无人机仅与邻居通信。鲁棒但协调困难。
- 分层:领导者-跟随者结构,折中方案。
代表性集群系统
- Crazyswarm2:基于 Crazyflie 2.1 微型四旋翼的集群研究平台
- 浙大/港科大高飞团队:大规模集群穿越密林
- EHang:载人 AAM(Advanced Air Mobility)集群编队表演
开源研发平台
| 平台 | 尺寸 | 特点 | 适合场景 |
|---|---|---|---|
| Crazyflie 2.1 | 27g | 超轻微型,Python/ROS,集群友好 | 室内研究/教学 |
| PX4 + QAV250 | ~400g | 标准竞速机架 + PX4 飞控 | 室外自主飞行 |
| DJI RoboMaster TT | 87g | Tello EDU 升级版,编程接口 | 教育/入门 |
| Agilicious (UZH) | ~850g | 专为敏捷飞行研究设计 | 高速/竞速研究 |
| Flightmare (仿真) | - | UZH RPG 开源仿真器,Unity 渲染 | RL 训练 |
| AirSim / Colosseum | - | 微软开源仿真,Unreal 渲染 | 视觉导航研究 |
参考资料
- Mellinger & Kumar, "Minimum Snap Trajectory Generation and Control for Quadrotors", ICRA, 2011
- Lee et al., "Geometric Tracking Control of a Quadrotor UAV on SE(3)", CDC, 2010
- Song et al., "Reaching the Limit in Autonomous Racing: Optimal Control Meets Reinforcement Learning", Science Robotics, 2023
- Loquercio et al., "Learning High-Speed Flight in the Wild", Science Robotics, 2021
相关笔记: