Offline强化学习

Offline强化学习（也叫Batch RL）研究如何从预先收集的静态数据集中学习最优策略，而不需要与环境进行任何额外交互。这是强化学习走向医疗、自动驾驶、机器人等高风险实际应用的关键技术。

本章内容：