智能体分类学
概述
对智能体进行系统分类是理解其设计空间的基础。从 Russell & Norvig 的经典四分类到 Wooldridge 的弱/强智能体性,再到 LLM 时代的新分类维度,本文梳理智能体分类学的完整体系。
分类体系总览
graph TD
A[智能体分类学] --> B[经典分类<br/>Russell & Norvig]
A --> C[智能体性分类<br/>Wooldridge]
A --> D[架构分类<br/>反应式/慎思式/混合式]
A --> E[LLM时代分类<br/>现代维度]
B --> B1[简单反射型]
B --> B2[基于模型的反射型]
B --> B3[基于目标型]
B --> B4[基于效用型]
C --> C1[弱智能体性]
C --> C2[强智能体性]
D --> D1[反应式]
D --> D2[慎思式]
D --> D3[混合式]
E --> E1[单轮对话型]
E --> E2[多轮交互型]
E --> E3[自主型]
E --> E4[多智能体型]
1. Russell & Norvig 经典分类
Russell 和 Norvig 在《Artificial Intelligence: A Modern Approach》中提出了按复杂度递增的四种智能体类型。
1.1 简单反射型智能体(Simple Reflex Agent)
直接根据当前感知选择动作,不维护任何内部状态。
决策规则:
其中 \(a\) 为选择的动作,\(\text{percept}\) 为当前感知。
特点:
- 基于条件-动作规则(if-then rules)
- 无记忆,仅依赖当前观测
- 适用于完全可观测环境
- 示例:恒温器、简单聊天机器人的关键词匹配
局限性:
- 无法处理部分可观测环境
- 无法进行长期规划
- 规则数量随环境复杂度指数增长
1.2 基于模型的反射型智能体(Model-Based Reflex Agent)
维护环境的内部模型,能处理部分可观测环境。
状态更新:
特点:
- 维护内部状态(世界模型)
- 状态转移模型描述世界如何变化
- 传感器模型描述如何从观测推断状态
- 示例:自动驾驶中的车辆跟踪
1.3 基于目标的智能体(Goal-Based Agent)
除了当前状态,还考虑目标来选择动作。
决策过程:
特点:
- 引入目标表示(Goal Representation)
- 需要搜索和规划来达成目标
- 可以处理复杂的多步骤任务
- 示例:路径规划、STRIPS 规划器
1.4 基于效用的智能体(Utility-Based Agent)
使用效用函数来量化不同状态的好坏程度,选择期望效用最大的动作。
决策过程:
其中 \(U(s')\) 是状态 \(s'\) 的效用值,\(P(s' \mid s, a)\) 是状态转移概率。
特点:
- 效用函数提供了状态偏好的连续度量
- 能够处理多目标冲突和不确定性
- 理论上最优但计算复杂度高
- 示例:经济学中的理性决策者、AlphaGo 的价值网络
从目标到效用
目标是"是否满足"的二值判断,而效用是"满足程度"的连续度量。效用允许智能体在多个可行方案中选择最优解,而非仅仅找到可行解。
2. Wooldridge 智能体性分类
Michael Wooldridge 在《An Introduction to MultiAgent Systems》中区分了弱智能体性和强智能体性。
2.1 弱智能体性(Weak Agency)
弱智能体性要求智能体具备以下基本属性:
| 属性 | 描述 |
|---|---|
| 自主性 (Autonomy) | 无需外部直接干预即可运行 |
| 社会性 (Social Ability) | 能与其他智能体(或人类)交互 |
| 反应性 (Reactivity) | 能感知环境并及时响应变化 |
| 主动性 (Pro-activeness) | 能主动采取行动以达成目标 |
2.2 强智能体性(Strong Agency)
在弱智能体性基础上,强智能体性还包括心理状态属性:
| 属性 | 描述 |
|---|---|
| 信念 (Belief) | 关于世界状态的知识和假设 |
| 愿望 (Desire) | 希望达成的目标集合 |
| 意图 (Intention) | 承诺执行的行动计划 |
| 情感 (Emotion) | 影响决策的情感状态 |
BDI 联系
强智能体性直接对应 BDI 模型,详见 BDI模型。
3. 架构分类:反应式 vs 慎思式 vs 混合式
3.1 反应式智能体(Reactive Agent)
不维护世界模型,直接从感知映射到动作。
代表:
- Brooks 的包容架构(Subsumption Architecture)
- 行为树(Behavior Trees)
优点:响应速度快、实现简单、鲁棒性强 缺点:无法进行长期规划、难以处理复杂目标
3.2 慎思式智能体(Deliberative Agent)
维护世界的显式符号模型,通过推理和规划选择动作。
代表:
- STRIPS/PDDL 规划器
- BDI 系统(PRS、Jason)
优点:能处理复杂目标、可解释性强 缺点:响应速度慢、世界模型可能不准确
3.3 混合式智能体(Hybrid Agent)
结合反应层和慎思层的分层架构。
经典架构:
┌─────────────────────┐
│ 慎思层 (Planning) │ ← 长期规划,符号推理
├─────────────────────┤
│ 中间层 (Sequencing) │ ← 短期决策,协调
├─────────────────────┤
│ 反应层 (Reactive) │ ← 即时响应,紧急行为
└─────────────────────┘
↕ 环境
代表:
- InteRRaP 三层架构
- TouringMachines
- 现代 LLM 智能体(prompt 解析 + 工具调用 + 反思)
4. LLM 时代的智能体分类
4.1 按交互模式分类
graph LR
A[按交互模式] --> B[单轮对话型<br/>Single-turn]
A --> C[多轮交互型<br/>Multi-turn]
A --> D[自主型<br/>Autonomous]
B --> B1[ChatGPT 单次问答]
B --> B2[代码补全]
C --> C1[Claude Code 交互式开发]
C --> C2[客服对话系统]
D --> D1[AutoGPT 自主任务执行]
D --> D2[Devin 自主编程]
D --> D3[OpenAI Operator]
4.2 按能力维度分类
| 维度 | Level 0 | Level 1 | Level 2 | Level 3 |
|---|---|---|---|---|
| 推理 | 无推理 | 单步推理 | 多步 CoT | 树搜索/反思 |
| 记忆 | 无记忆 | 上下文窗口 | 外部存储 | 分层记忆系统 |
| 工具 | 无工具 | 单工具调用 | 多工具编排 | 工具发现/创造 |
| 规划 | 无规划 | 单步规划 | 多步规划 | 动态重规划 |
| 协作 | 单智能体 | 人机协作 | 多智能体固定角色 | 动态多智能体 |
4.3 按自主程度分类
受自动驾驶 L0-L5 分级启发,可以对智能体的自主程度进行分级:
| 等级 | 描述 | 示例 |
|---|---|---|
| L0 | 无自主:纯工具,人完全控制 | 计算器、搜索引擎 |
| L1 | 辅助型:建议动作,人确认 | GitHub Copilot 代码建议 |
| L2 | 半自主:自动执行子任务,人监督 | Claude Code 编辑模式 |
| L3 | 条件自主:大部分自主,异常时求助人类 | Cursor Agent 模式 |
| L4 | 高度自主:完成完整任务流,仅结果审查 | Devin 自主编程 |
| L5 | 完全自主:无需人类干预 | 理论上的 AGI Agent |
5. 多维度综合分类框架
智能体的分类不应局限于单一维度,而应综合考虑多个维度:
例如,Claude Code 可以表征为:
- 架构:混合式(LLM 慎思 + 工具调用反应)
- 推理:Level 2-3(多步 CoT + 自我纠正)
- 记忆:Level 2(上下文窗口 + 文件系统)
- 工具:Level 2(多工具编排:bash、文件读写、搜索)
- 自主性:Level 2-3(半自主到条件自主)
- 交互:多轮交互型
总结
智能体分类学从单一维度走向多维度、从静态分类走向动态评估。理解不同分类框架有助于:
- 设计决策:根据需求选择合适的智能体架构
- 能力评估:系统化地评估智能体的各项能力
- 研究定位:明确研究工作在智能体设计空间中的位置
- 技术路线:规划从当前水平到目标水平的发展路径
参考文献
- Russell, S. & Norvig, P. (2020). Artificial Intelligence: A Modern Approach (4th ed.). Pearson.
- Wooldridge, M. (2009). An Introduction to MultiAgent Systems (2nd ed.). Wiley.
- Brooks, R.A. (1991). Intelligence without Representation. Artificial Intelligence, 47(1-3), 139-159.
- Müller, J.P. et al. (1995). The Design of Intelligent Agents: A Layered Approach. LNCS 1177.
- Wang, L. et al. (2024). A Survey on Large Language Model based Autonomous Agents. Frontiers of Computer Science.