跳转至

刘杰夫的人工智能学习笔记

规划与推理

规划与推理

本章深入探讨智能体的规划与推理能力——从经典规划到思维链、树搜索、反思机制，以及最新的推理模型前沿进展。

本章内容：

规划与推理综述 — 从STRIPS到LLM推理的演进全景
思维链与推理模式 — Chain-of-Thought及其变体
ReAct与工具推理 — 思考-行动-观察循环与工具增强推理
树搜索与蒙特卡洛 — Tree of Thoughts、Graph of Thoughts与MCTS
反思与自我改进 — Reflexion、Self-Refine与语言强化学习
规划执行框架 — Plan-and-Execute、LLMCompiler与层级规划
推理前沿进展 — o1/o3推理模型、DeepSeek-R1与推理缩放定律

评论 #