Skip to content

Offline强化学习

Offline强化学习(也叫Batch RL)研究如何从预先收集的静态数据集中学习最优策略,而不需要与环境进行任何额外交互。这是强化学习走向医疗、自动驾驶、机器人等高风险实际应用的关键技术。

本章内容:

  • Offline RL综述 — 分布偏移问题、CQL、IQL、TD3+BC、Decision Transformer、Offline-to-Online Fine-tuning

评论 #