规划与推理
本章深入探讨智能体的规划与推理能力——从经典规划到思维链、树搜索、反思机制,以及最新的推理模型前沿进展。
本章内容:
- 规划与推理综述 — 从STRIPS到LLM推理的演进全景
- 思维链与推理模式 — Chain-of-Thought及其变体
- ReAct与工具推理 — 思考-行动-观察循环与工具增强推理
- 树搜索与蒙特卡洛 — Tree of Thoughts、Graph of Thoughts与MCTS
- 反思与自我改进 — Reflexion、Self-Refine与语言强化学习
- 规划执行框架 — Plan-and-Execute、LLMCompiler与层级规划
- 推理前沿进展 — o1/o3推理模型、DeepSeek-R1与推理缩放定律