Model-Based强化学习
Model-Based强化学习通过学习环境的动力学模型(World Model),在"想象"中生成经验来辅助决策,大幅提升样本效率。从经典的Dyna架构到现代的Dreamer和MuZero,MBRL已经在从棋类到像素级控制的广泛任务中展现出强大能力。
本章内容:
- Model-Based RL综述 — Model-Free vs Model-Based、环境模型学习、Dyna架构、MBPO、Dreamer系列、MuZero
Model-Based强化学习通过学习环境的动力学模型(World Model),在"想象"中生成经验来辅助决策,大幅提升样本效率。从经典的Dyna架构到现代的Dreamer和MuZero,MBRL已经在从棋类到像素级控制的广泛任务中展现出强大能力。
本章内容: