跳转至

无人机

概述

无人机(Unmanned Aerial Vehicle, UAV)是具身智能在三维空间中的重要载体。从农业植保到物流配送、从影视航拍到军事侦察,无人机正深刻改变多个行业。自主无人机代表了感知、规划、控制的高度集成——在高速三维运动中实时决策。


无人机分类

旋翼、固定翼与 VTOL

类型 代表 优点 缺点 典型应用
多旋翼 DJI Mavic, Crazyflie 悬停、低速机动、简单 续航短、效率低 航拍、巡检
固定翼 senseFly eBee 长航时、高速、高效 不能悬停、需跑道/弹射 测绘、长距巡检
VTOL 纵横 CW-25, Wingtra 兼顾悬停和巡航 机械复杂、过渡模式难 物流、长距巡检
单旋翼 传统直升机构型 大负载、长航时 机械复杂、振动大 农业植保

四旋翼作为研究平台

四旋翼(quadrotor)是最常用的研究平台,原因:

  • 机械结构简单(4 个电机 + 螺旋桨)
  • 动力学模型解析可得
  • 小型化容易(室内飞行)
  • 丰富的开源生态

四旋翼动力学

坐标系定义

  • 世界坐标系 \(\{W\}\):NED(North-East-Down)或 ENU(East-North-Up)
  • 机体坐标系 \(\{B\}\):原点在质心,\(x\) 前方,\(z\) 向上

旋转矩阵 \(R \in SO(3)\) 将机体坐标系变换到世界坐标系。

牛顿-欧拉方程

平动方程

\[ m\ddot{\mathbf{p}} = \begin{bmatrix} 0 \\ 0 \\ -mg \end{bmatrix} + R \begin{bmatrix} 0 \\ 0 \\ T \end{bmatrix} \]

其中 \(\mathbf{p} = [x, y, z]^T\) 是世界坐标系中的位置,\(T = \sum_{i=1}^{4} f_i\) 是总推力。

转动方程

\[ J\dot{\boldsymbol{\omega}} = -\boldsymbol{\omega} \times J\boldsymbol{\omega} + \boldsymbol{\tau} \]

其中 \(J\) 是惯性张量,\(\boldsymbol{\omega}\) 是机体角速度。

推力与力矩分配

四个电机产生的推力 \(f_i\) 与转速 \(\omega_i\) 的关系为:

\[ f_i = k_f \omega_i^2, \quad \tau_i = k_m \omega_i^2 \]

总推力和力矩:

\[ \begin{bmatrix} T \\ \tau_\phi \\ \tau_\theta \\ \tau_\psi \end{bmatrix} = \begin{bmatrix} 1 & 1 & 1 & 1 \\ 0 & -L & 0 & L \\ L & 0 & -L & 0 \\ -k_m/k_f & k_m/k_f & -k_m/k_f & k_m/k_f \end{bmatrix} \begin{bmatrix} f_1 \\ f_2 \\ f_3 \\ f_4 \end{bmatrix} \]

其中 \(L\) 是电机到质心的距离。这个分配矩阵是可逆的,因此可以通过期望的推力和力矩求解各电机转速。

微分平坦性(Differential Flatness):四旋翼系统是微分平坦的——系统的全部状态和输入可以用平坦输出 \([x, y, z, \psi]^T\)(位置 + 偏航角)及其导数表示。这意味着只需规划位置轨迹,就能推导出完整的状态和控制输入。


控制架构

PX4 / ArduPilot 飞控栈

graph TB
    subgraph 地面站
        GCS[QGroundControl / Mission Planner]
    end

    subgraph 机载计算机
        COMP[Jetson / RPI / NUC] --> VIO[视觉里程计]
        COMP --> DET[目标检测]
        COMP --> PLAN[路径规划]
    end

    subgraph 飞控 PX4/ArduPilot
        POS[位置控制器<br/>PID] --> ATT[姿态控制器<br/>PID / Quaternion]
        ATT --> RATE[角速率控制器<br/>PID]
        RATE --> MIX[电机混控器<br/>Mixer]
        MIX --> ESC[电调 ESC]

        EKF[扩展卡尔曼滤波<br/>状态估计] --> POS

        IMU[IMU] --> EKF
        BARO[气压计] --> EKF
        GPS[GPS] --> EKF
        MAG[磁力计] --> EKF
    end

    GCS -->|MAVLink| COMP
    COMP -->|MAVLink| POS
    VIO -->|位姿| EKF
    ESC --> M1[电机 1-4]

级联 PID 控制器

PX4 的默认控制器是三层级联 PID:

外环——位置控制

\[ \mathbf{a}_{cmd} = K_p^{pos}(\mathbf{p}_{ref} - \mathbf{p}) + K_d^{pos}(\mathbf{v}_{ref} - \mathbf{v}) + K_i^{pos} \int (\mathbf{p}_{ref} - \mathbf{p}) dt + \mathbf{g} \]

中环——姿态控制:从期望加速度提取期望姿态,然后计算期望角速度。

内环——角速率控制

\[ \boldsymbol{\tau}_{cmd} = K_p^{rate}(\boldsymbol{\omega}_{ref} - \boldsymbol{\omega}) + K_d^{rate}\dot{\boldsymbol{\omega}} + K_i^{rate}\int(\boldsymbol{\omega}_{ref} - \boldsymbol{\omega})dt \]

高级控制方法

模型预测控制(MPC):在有限时间窗内优化控制序列,处理约束:

\[ \min_{u_{0:N-1}} \sum_{k=0}^{N} \|\mathbf{x}_k - \mathbf{x}_{ref}\|_Q^2 + \sum_{k=0}^{N-1} \|\mathbf{u}_k\|_R^2 \]
\[ \text{s.t.} \quad \mathbf{x}_{k+1} = f(\mathbf{x}_k, \mathbf{u}_k), \quad \mathbf{u}_{min} \leq \mathbf{u}_k \leq \mathbf{u}_{max} \]

SE(3) 几何控制:直接在 \(SE(3)\) 李群上设计控制器,避免万向锁问题,适用于大角度机动。


自主导航

GPS 拒止环境下的导航

室内或隧道等 GPS 不可用的场景中,无人机需要依靠自身传感器进行定位:

视觉惯性里程计(VIO):融合相机和 IMU 数据估计位姿

  • VINS-Mono / VINS-Fusion:香港科大开源 VIO 系统
  • MSCKF:多状态约束卡尔曼滤波
  • ORB-SLAM3:支持 VIO 模式

LiDAR SLAM

  • LOAM / LIO-SAM:LiDAR 里程计 + IMU 紧耦合
  • 精度高但传感器重量大,适合大型无人机

运动规划

无人机路径规划需要考虑:

  • 动力学约束(最大速度、加速度、角速率)
  • 碰撞避免(静态障碍 + 动态障碍)
  • 能耗优化(最小化总推力变化)

常用方法

  • 最小 snap 轨迹:最小化四阶导数(snap),保证轨迹平滑:
\[ \min \int_0^T \left\|\frac{d^4 \mathbf{p}}{dt^4}\right\|^2 dt \]
  • EGO-Planner:基于 ESDF(欧氏距离场)的梯度规划,实时性好
  • Fast-Planner:浙大开源的快速运动规划系统

基于学习的敏捷飞行

UZH RPG 组的工作

苏黎世大学机器人与感知组(RPG)在学习型敏捷飞行方面取得了突破性成果:

Swift (2023):RL 训练的无人机在竞速比赛中击败人类冠军飞手

  • 使用 PPO 在仿真中训练
  • 视觉感知通过 RGB 相机 + 门检测
  • 实现了超越人类极限的速度和加速度

Agile Autonomy (2021):端到端学习的高速避障

  • 深度图像输入 → 轨迹点输出
  • 在密林中 10 m/s 飞行

仿真到真实(Sim-to-Real)

无人机 RL 的 Sim-to-Real 需要考虑:

  • 空气动力学效应(旋翼气流、地效应)
  • 电机响应延迟
  • IMU 噪声和偏差
  • 通信延迟

空中操作

无人机抓取

空中操作(Aerial Manipulation)将无人机与机械臂结合,实现空中抓取和操作:

  • 挑战:抓取引入的外力/力矩严重影响飞行稳定性
  • 方案:全驱动(over-actuated)平台或自适应控制
  • 应用:高空检修、危险物品处理、建筑施工

多机协作搬运

多架无人机通过绳索或刚性连接协同搬运大型物体:

\[ \sum_{i=1}^{N} \mathbf{f}_i + m_L \mathbf{g} = m_L \ddot{\mathbf{p}}_L \]

需要分布式控制和通信。


集群智能

多智能体协调

无人机集群(swarm)的核心问题:

  • 队形控制:保持预定的几何构型
  • 碰撞避免:集群内部不碰撞
  • 任务分配:多机分工合作

Reynolds 规则(受鸟群启发)

  1. 分离(Separation):避免与邻居太近
  2. 对齐(Alignment):与邻居保持相同速度方向
  3. 聚合(Cohesion):向邻居中心移动

数学形式

\[ \mathbf{u}_i = c_s \sum_{j \in \mathcal{N}_i} \frac{\mathbf{p}_i - \mathbf{p}_j}{\|\mathbf{p}_i - \mathbf{p}_j\|^2} + c_a \frac{1}{|\mathcal{N}_i|}\sum_{j \in \mathcal{N}_i} \mathbf{v}_j + c_c \left(\frac{1}{|\mathcal{N}_i|}\sum_{j \in \mathcal{N}_i} \mathbf{p}_j - \mathbf{p}_i\right) \]

通信与去中心化

  • 中心化:所有无人机向中心节点报告,中心节点下发指令。简单但单点故障。
  • 去中心化:每架无人机仅与邻居通信。鲁棒但协调困难。
  • 分层:领导者-跟随者结构,折中方案。

代表性集群系统

  • Crazyswarm2:基于 Crazyflie 2.1 微型四旋翼的集群研究平台
  • 浙大/港科大高飞团队:大规模集群穿越密林
  • EHang:载人 AAM(Advanced Air Mobility)集群编队表演

开源研发平台

平台 尺寸 特点 适合场景
Crazyflie 2.1 27g 超轻微型,Python/ROS,集群友好 室内研究/教学
PX4 + QAV250 ~400g 标准竞速机架 + PX4 飞控 室外自主飞行
DJI RoboMaster TT 87g Tello EDU 升级版,编程接口 教育/入门
Agilicious (UZH) ~850g 专为敏捷飞行研究设计 高速/竞速研究
Flightmare (仿真) - UZH RPG 开源仿真器,Unity 渲染 RL 训练
AirSim / Colosseum - 微软开源仿真,Unreal 渲染 视觉导航研究

参考资料

  • Mellinger & Kumar, "Minimum Snap Trajectory Generation and Control for Quadrotors", ICRA, 2011
  • Lee et al., "Geometric Tracking Control of a Quadrotor UAV on SE(3)", CDC, 2010
  • Song et al., "Reaching the Limit in Autonomous Racing: Optimal Control Meets Reinforcement Learning", Science Robotics, 2023
  • Loquercio et al., "Learning High-Speed Flight in the Wild", Science Robotics, 2021

相关笔记


评论 #