强化学习概览

本章节提供强化学习领域的全局视角,帮助读者建立从经典方法到前沿应用的完整知识框架。

内容导航

主题	说明
强化学习全景	RL方法论体系:从Bellman方程到RLHF,涵盖模型无关/模型基础、在线/离线、单智能体/多智能体等分类维度
RL里程碑	强化学习发展史上的关键突破:TD-Gammon、DQN、AlphaGo、ChatGPT、o1等标志性成果