无人机

概述

无人机（Unmanned Aerial Vehicle, UAV）是具身智能在三维空间中的重要载体。从农业植保到物流配送、从影视航拍到军事侦察，无人机正深刻改变多个行业。自主无人机代表了感知、规划、控制的高度集成——在高速三维运动中实时决策。

无人机分类

旋翼、固定翼与 VTOL

类型	代表	优点	缺点	典型应用
多旋翼	DJI Mavic, Crazyflie	悬停、低速机动、简单	续航短、效率低	航拍、巡检
固定翼	senseFly eBee	长航时、高速、高效	不能悬停、需跑道/弹射	测绘、长距巡检
VTOL	纵横 CW-25, Wingtra	兼顾悬停和巡航	机械复杂、过渡模式难	物流、长距巡检
单旋翼	传统直升机构型	大负载、长航时	机械复杂、振动大	农业植保

四旋翼作为研究平台

四旋翼（quadrotor）是最常用的研究平台，原因：

机械结构简单（4 个电机 + 螺旋桨）
动力学模型解析可得
小型化容易（室内飞行）
丰富的开源生态

四旋翼动力学

坐标系定义

世界坐标系 \(\{W\}\)：NED（North-East-Down）或 ENU（East-North-Up）
机体坐标系 \(\{B\}\)：原点在质心，\(x\) 前方，\(z\) 向上

旋转矩阵 \(R \in SO(3)\) 将机体坐标系变换到世界坐标系。

牛顿-欧拉方程

平动方程：

\[ m\ddot{\mathbf{p}} = \begin{bmatrix} 0 \\ 0 \\ -mg \end{bmatrix} + R \begin{bmatrix} 0 \\ 0 \\ T \end{bmatrix} \]

其中 \(\mathbf{p} = [x, y, z]^T\) 是世界坐标系中的位置，\(T = \sum_{i=1}^{4} f_i\) 是总推力。

转动方程：

\[ J\dot{\boldsymbol{\omega}} = -\boldsymbol{\omega} \times J\boldsymbol{\omega} + \boldsymbol{\tau} \]

其中 \(J\) 是惯性张量，\(\boldsymbol{\omega}\) 是机体角速度。

推力与力矩分配

四个电机产生的推力 \(f_i\) 与转速 \(\omega_i\) 的关系为：

\[ f_i = k_f \omega_i^2, \quad \tau_i = k_m \omega_i^2 \]

总推力和力矩：

\[ \begin{bmatrix} T \\ \tau_\phi \\ \tau_\theta \\ \tau_\psi \end{bmatrix} = \begin{bmatrix} 1 & 1 & 1 & 1 \\ 0 & -L & 0 & L \\ L & 0 & -L & 0 \\ -k_m/k_f & k_m/k_f & -k_m/k_f & k_m/k_f \end{bmatrix} \begin{bmatrix} f_1 \\ f_2 \\ f_3 \\ f_4 \end{bmatrix} \]

其中 \(L\) 是电机到质心的距离。这个分配矩阵是可逆的，因此可以通过期望的推力和力矩求解各电机转速。

微分平坦性（Differential Flatness）：四旋翼系统是微分平坦的——系统的全部状态和输入可以用平坦输出 \([x, y, z, \psi]^T\)（位置 + 偏航角）及其导数表示。这意味着只需规划位置轨迹，就能推导出完整的状态和控制输入。

控制架构

PX4 / ArduPilot 飞控栈

graph TB
    subgraph 地面站
        GCS[QGroundControl / Mission Planner]
    end

    subgraph 机载计算机
        COMP[Jetson / RPI / NUC] --> VIO[视觉里程计]
        COMP --> DET[目标检测]
        COMP --> PLAN[路径规划]
    end

    subgraph 飞控 PX4/ArduPilot
        POS[位置控制器<br/>PID] --> ATT[姿态控制器<br/>PID / Quaternion]
        ATT --> RATE[角速率控制器<br/>PID]
        RATE --> MIX[电机混控器<br/>Mixer]
        MIX --> ESC[电调 ESC]

        EKF[扩展卡尔曼滤波<br/>状态估计] --> POS

        IMU[IMU] --> EKF
        BARO[气压计] --> EKF
        GPS[GPS] --> EKF
        MAG[磁力计] --> EKF
    end

    GCS -->|MAVLink| COMP
    COMP -->|MAVLink| POS
    VIO -->|位姿| EKF
    ESC --> M1[电机 1-4]

级联 PID 控制器

PX4 的默认控制器是三层级联 PID：

外环——位置控制：

\[ \mathbf{a}_{cmd} = K_p^{pos}(\mathbf{p}_{ref} - \mathbf{p}) + K_d^{pos}(\mathbf{v}_{ref} - \mathbf{v}) + K_i^{pos} \int (\mathbf{p}_{ref} - \mathbf{p}) dt + \mathbf{g} \]

中环——姿态控制：从期望加速度提取期望姿态，然后计算期望角速度。

内环——角速率控制：

\[ \boldsymbol{\tau}_{cmd} = K_p^{rate}(\boldsymbol{\omega}_{ref} - \boldsymbol{\omega}) + K_d^{rate}\dot{\boldsymbol{\omega}} + K_i^{rate}\int(\boldsymbol{\omega}_{ref} - \boldsymbol{\omega})dt \]

高级控制方法

模型预测控制（MPC）：在有限时间窗内优化控制序列，处理约束：

\[ \min_{u_{0:N-1}} \sum_{k=0}^{N} \|\mathbf{x}_k - \mathbf{x}_{ref}\|_Q^2 + \sum_{k=0}^{N-1} \|\mathbf{u}_k\|_R^2 \]

\[ \text{s.t.} \quad \mathbf{x}_{k+1} = f(\mathbf{x}_k, \mathbf{u}_k), \quad \mathbf{u}_{min} \leq \mathbf{u}_k \leq \mathbf{u}_{max} \]

SE(3) 几何控制：直接在 \(SE(3)\) 李群上设计控制器，避免万向锁问题，适用于大角度机动。

自主导航

GPS 拒止环境下的导航

室内或隧道等 GPS 不可用的场景中，无人机需要依靠自身传感器进行定位：

视觉惯性里程计（VIO）：融合相机和 IMU 数据估计位姿

VINS-Mono / VINS-Fusion：香港科大开源 VIO 系统
MSCKF：多状态约束卡尔曼滤波
ORB-SLAM3：支持 VIO 模式

LiDAR SLAM：

LOAM / LIO-SAM：LiDAR 里程计 + IMU 紧耦合
精度高但传感器重量大，适合大型无人机

运动规划

无人机路径规划需要考虑：

动力学约束（最大速度、加速度、角速率）
碰撞避免（静态障碍 + 动态障碍）
能耗优化（最小化总推力变化）

常用方法：

最小 snap 轨迹：最小化四阶导数（snap），保证轨迹平滑：

\[ \min \int_0^T \left\|\frac{d^4 \mathbf{p}}{dt^4}\right\|^2 dt \]

EGO-Planner：基于 ESDF（欧氏距离场）的梯度规划，实时性好
Fast-Planner：浙大开源的快速运动规划系统

基于学习的敏捷飞行

UZH RPG 组的工作

苏黎世大学机器人与感知组（RPG）在学习型敏捷飞行方面取得了突破性成果：

Swift (2023)：RL 训练的无人机在竞速比赛中击败人类冠军飞手

使用 PPO 在仿真中训练
视觉感知通过 RGB 相机 + 门检测
实现了超越人类极限的速度和加速度

Agile Autonomy (2021)：端到端学习的高速避障

深度图像输入 → 轨迹点输出
在密林中 10 m/s 飞行

仿真到真实（Sim-to-Real）

无人机 RL 的 Sim-to-Real 需要考虑：

空气动力学效应（旋翼气流、地效应）
电机响应延迟
IMU 噪声和偏差
通信延迟

空中操作

无人机抓取

空中操作（Aerial Manipulation）将无人机与机械臂结合，实现空中抓取和操作：

挑战：抓取引入的外力/力矩严重影响飞行稳定性
方案：全驱动（over-actuated）平台或自适应控制
应用：高空检修、危险物品处理、建筑施工

多机协作搬运

多架无人机通过绳索或刚性连接协同搬运大型物体：

\[ \sum_{i=1}^{N} \mathbf{f}_i + m_L \mathbf{g} = m_L \ddot{\mathbf{p}}_L \]

需要分布式控制和通信。

集群智能

多智能体协调

无人机集群（swarm）的核心问题：

队形控制：保持预定的几何构型
碰撞避免：集群内部不碰撞
任务分配：多机分工合作

Reynolds 规则（受鸟群启发）：

分离（Separation）：避免与邻居太近
对齐（Alignment）：与邻居保持相同速度方向
聚合（Cohesion）：向邻居中心移动

数学形式：

\[ \mathbf{u}_i = c_s \sum_{j \in \mathcal{N}_i} \frac{\mathbf{p}_i - \mathbf{p}_j}{\|\mathbf{p}_i - \mathbf{p}_j\|^2} + c_a \frac{1}{|\mathcal{N}_i|}\sum_{j \in \mathcal{N}_i} \mathbf{v}_j + c_c \left(\frac{1}{|\mathcal{N}_i|}\sum_{j \in \mathcal{N}_i} \mathbf{p}_j - \mathbf{p}_i\right) \]

通信与去中心化

中心化：所有无人机向中心节点报告，中心节点下发指令。简单但单点故障。
去中心化：每架无人机仅与邻居通信。鲁棒但协调困难。
分层：领导者-跟随者结构，折中方案。

代表性集群系统

Crazyswarm2：基于 Crazyflie 2.1 微型四旋翼的集群研究平台
浙大/港科大高飞团队：大规模集群穿越密林
EHang：载人 AAM（Advanced Air Mobility）集群编队表演

开源研发平台

平台	尺寸	特点	适合场景
Crazyflie 2.1	27g	超轻微型，Python/ROS，集群友好	室内研究/教学
PX4 + QAV250	~400g	标准竞速机架 + PX4 飞控	室外自主飞行
DJI RoboMaster TT	87g	Tello EDU 升级版，编程接口	教育/入门
Agilicious (UZH)	~850g	专为敏捷飞行研究设计	高速/竞速研究
Flightmare (仿真)	-	UZH RPG 开源仿真器，Unity 渲染	RL 训练
AirSim / Colosseum	-	微软开源仿真，Unreal 渲染	视觉导航研究

参考资料

Mellinger & Kumar, "Minimum Snap Trajectory Generation and Control for Quadrotors", ICRA, 2011
Lee et al., "Geometric Tracking Control of a Quadrotor UAV on SE(3)", CDC, 2010
Song et al., "Reaching the Limit in Autonomous Racing: Optimal Control Meets Reinforcement Learning", Science Robotics, 2023
Loquercio et al., "Learning High-Speed Flight in the Wild", Science Robotics, 2021

相关笔记：

无人机

概述