智能体分类学

概述

对智能体进行系统分类是理解其设计空间的基础。从 Russell & Norvig 的经典四分类到 Wooldridge 的弱/强智能体性，再到 LLM 时代的新分类维度，本文梳理智能体分类学的完整体系。

分类体系总览

graph TD
    A[智能体分类学] --> B[经典分类<br/>Russell & Norvig]
    A --> C[智能体性分类<br/>Wooldridge]
    A --> D[架构分类<br/>反应式/慎思式/混合式]
    A --> E[LLM时代分类<br/>现代维度]

    B --> B1[简单反射型]
    B --> B2[基于模型的反射型]
    B --> B3[基于目标型]
    B --> B4[基于效用型]

    C --> C1[弱智能体性]
    C --> C2[强智能体性]

    D --> D1[反应式]
    D --> D2[慎思式]
    D --> D3[混合式]

    E --> E1[单轮对话型]
    E --> E2[多轮交互型]
    E --> E3[自主型]
    E --> E4[多智能体型]

1. Russell & Norvig 经典分类

Russell 和 Norvig 在《Artificial Intelligence: A Modern Approach》中提出了按复杂度递增的四种智能体类型。

1.1 简单反射型智能体（Simple Reflex Agent）

直接根据当前感知选择动作，不维护任何内部状态。

决策规则：

\[ a = \text{rule-match}(\text{percept}) \]

其中 \(a\) 为选择的动作，\(\text{percept}\) 为当前感知。

特点：

基于条件-动作规则（if-then rules）
无记忆，仅依赖当前观测
适用于完全可观测环境
示例：恒温器、简单聊天机器人的关键词匹配

局限性：

无法处理部分可观测环境
无法进行长期规划
规则数量随环境复杂度指数增长

1.2 基于模型的反射型智能体（Model-Based Reflex Agent）

维护环境的内部模型，能处理部分可观测环境。

状态更新：

\[ s_{t+1} = \text{update}(s_t, a_t, \text{percept}_{t+1}) \]

\[ a_{t+1} = \text{rule-match}(s_{t+1}) \]

特点：

维护内部状态（世界模型）
状态转移模型描述世界如何变化
传感器模型描述如何从观测推断状态
示例：自动驾驶中的车辆跟踪

1.3 基于目标的智能体（Goal-Based Agent）

除了当前状态，还考虑目标来选择动作。

决策过程：

\[ a^* = \arg\max_{a \in A} P(\text{goal} \mid s, a) \]

特点：

引入目标表示（Goal Representation）
需要搜索和规划来达成目标
可以处理复杂的多步骤任务
示例：路径规划、STRIPS 规划器

1.4 基于效用的智能体（Utility-Based Agent）

使用效用函数来量化不同状态的好坏程度，选择期望效用最大的动作。

决策过程：

\[ a^* = \arg\max_{a \in A} \sum_{s'} P(s' \mid s, a) \cdot U(s') \]

其中 \(U(s')\) 是状态 \(s'\) 的效用值，\(P(s' \mid s, a)\) 是状态转移概率。

特点：

效用函数提供了状态偏好的连续度量
能够处理多目标冲突和不确定性
理论上最优但计算复杂度高
示例：经济学中的理性决策者、AlphaGo 的价值网络

从目标到效用

目标是"是否满足"的二值判断，而效用是"满足程度"的连续度量。效用允许智能体在多个可行方案中选择最优解，而非仅仅找到可行解。

2. Wooldridge 智能体性分类

Michael Wooldridge 在《An Introduction to MultiAgent Systems》中区分了弱智能体性和强智能体性。

2.1 弱智能体性（Weak Agency）

弱智能体性要求智能体具备以下基本属性：

属性	描述
自主性 (Autonomy)	无需外部直接干预即可运行
社会性 (Social Ability)	能与其他智能体（或人类）交互
反应性 (Reactivity)	能感知环境并及时响应变化
主动性 (Pro-activeness)	能主动采取行动以达成目标

2.2 强智能体性（Strong Agency）

在弱智能体性基础上，强智能体性还包括心理状态属性：

属性	描述
信念 (Belief)	关于世界状态的知识和假设
愿望 (Desire)	希望达成的目标集合
意图 (Intention)	承诺执行的行动计划
情感 (Emotion)	影响决策的情感状态

BDI 联系

强智能体性直接对应 BDI 模型，详见 BDI模型。

3. 架构分类：反应式 vs 慎思式 vs 混合式

3.1 反应式智能体（Reactive Agent）

不维护世界模型，直接从感知映射到动作。

代表：

Brooks 的包容架构（Subsumption Architecture）
行为树（Behavior Trees）

优点：响应速度快、实现简单、鲁棒性强缺点：无法进行长期规划、难以处理复杂目标

3.2 慎思式智能体（Deliberative Agent）

维护世界的显式符号模型，通过推理和规划选择动作。

代表：

STRIPS/PDDL 规划器
BDI 系统（PRS、Jason）

优点：能处理复杂目标、可解释性强缺点：响应速度慢、世界模型可能不准确

3.3 混合式智能体（Hybrid Agent）

结合反应层和慎思层的分层架构。

经典架构：

┌─────────────────────┐
│    慎思层 (Planning)   │  ← 长期规划，符号推理
├─────────────────────┤
│    中间层 (Sequencing) │  ← 短期决策，协调
├─────────────────────┤
│    反应层 (Reactive)   │  ← 即时响应，紧急行为
└─────────────────────┘
        ↕ 环境

代表：

InteRRaP 三层架构
TouringMachines
现代 LLM 智能体（prompt 解析 + 工具调用 + 反思）

4. LLM 时代的智能体分类

4.1 按交互模式分类

graph LR
    A[按交互模式] --> B[单轮对话型<br/>Single-turn]
    A --> C[多轮交互型<br/>Multi-turn]
    A --> D[自主型<br/>Autonomous]

    B --> B1[ChatGPT 单次问答]
    B --> B2[代码补全]

    C --> C1[Claude Code 交互式开发]
    C --> C2[客服对话系统]

    D --> D1[AutoGPT 自主任务执行]
    D --> D2[Devin 自主编程]
    D --> D3[OpenAI Operator]

4.2 按能力维度分类

维度	Level 0	Level 1	Level 2	Level 3
推理	无推理	单步推理	多步 CoT	树搜索/反思
记忆	无记忆	上下文窗口	外部存储	分层记忆系统
工具	无工具	单工具调用	多工具编排	工具发现/创造
规划	无规划	单步规划	多步规划	动态重规划
协作	单智能体	人机协作	多智能体固定角色	动态多智能体

4.3 按自主程度分类

受自动驾驶 L0-L5 分级启发，可以对智能体的自主程度进行分级：

等级	描述	示例
L0	无自主：纯工具，人完全控制	计算器、搜索引擎
L1	辅助型：建议动作，人确认	GitHub Copilot 代码建议
L2	半自主：自动执行子任务，人监督	Claude Code 编辑模式
L3	条件自主：大部分自主，异常时求助人类	Cursor Agent 模式
L4	高度自主：完成完整任务流，仅结果审查	Devin 自主编程
L5	完全自主：无需人类干预	理论上的 AGI Agent

5. 多维度综合分类框架

智能体的分类不应局限于单一维度，而应综合考虑多个维度：

\[ \text{Agent Profile} = (\text{Architecture}, \text{Reasoning}, \text{Memory}, \text{Tools}, \text{Autonomy}, \text{Interaction}) \]

例如，Claude Code 可以表征为：

架构：混合式（LLM 慎思 + 工具调用反应）
推理：Level 2-3（多步 CoT + 自我纠正）
记忆：Level 2（上下文窗口 + 文件系统）
工具：Level 2（多工具编排：bash、文件读写、搜索）
自主性：Level 2-3（半自主到条件自主）
交互：多轮交互型

总结

智能体分类学从单一维度走向多维度、从静态分类走向动态评估。理解不同分类框架有助于：

设计决策：根据需求选择合适的智能体架构
能力评估：系统化地评估智能体的各项能力
研究定位：明确研究工作在智能体设计空间中的位置
技术路线：规划从当前水平到目标水平的发展路径

参考文献

Russell, S. & Norvig, P. (2020). Artificial Intelligence: A Modern Approach (4th ed.). Pearson.
Wooldridge, M. (2009). An Introduction to MultiAgent Systems (2nd ed.). Wiley.
Brooks, R.A. (1991). Intelligence without Representation. Artificial Intelligence, 47(1-3), 139-159.
Müller, J.P. et al. (1995). The Design of Intelligent Agents: A Layered Approach. LNCS 1177.
Wang, L. et al. (2024). A Survey on Large Language Model based Autonomous Agents. Frontiers of Computer Science.