跳转至

智能体分类学

概述

对智能体进行系统分类是理解其设计空间的基础。从 Russell & Norvig 的经典四分类到 Wooldridge 的弱/强智能体性,再到 LLM 时代的新分类维度,本文梳理智能体分类学的完整体系。


分类体系总览

graph TD
    A[智能体分类学] --> B[经典分类<br/>Russell & Norvig]
    A --> C[智能体性分类<br/>Wooldridge]
    A --> D[架构分类<br/>反应式/慎思式/混合式]
    A --> E[LLM时代分类<br/>现代维度]

    B --> B1[简单反射型]
    B --> B2[基于模型的反射型]
    B --> B3[基于目标型]
    B --> B4[基于效用型]

    C --> C1[弱智能体性]
    C --> C2[强智能体性]

    D --> D1[反应式]
    D --> D2[慎思式]
    D --> D3[混合式]

    E --> E1[单轮对话型]
    E --> E2[多轮交互型]
    E --> E3[自主型]
    E --> E4[多智能体型]

1. Russell & Norvig 经典分类

Russell 和 Norvig 在《Artificial Intelligence: A Modern Approach》中提出了按复杂度递增的四种智能体类型。

1.1 简单反射型智能体(Simple Reflex Agent)

直接根据当前感知选择动作,不维护任何内部状态。

决策规则

\[ a = \text{rule-match}(\text{percept}) \]

其中 \(a\) 为选择的动作,\(\text{percept}\) 为当前感知。

特点

  • 基于条件-动作规则(if-then rules)
  • 无记忆,仅依赖当前观测
  • 适用于完全可观测环境
  • 示例:恒温器、简单聊天机器人的关键词匹配

局限性

  • 无法处理部分可观测环境
  • 无法进行长期规划
  • 规则数量随环境复杂度指数增长

1.2 基于模型的反射型智能体(Model-Based Reflex Agent)

维护环境的内部模型,能处理部分可观测环境。

状态更新

\[ s_{t+1} = \text{update}(s_t, a_t, \text{percept}_{t+1}) \]
\[ a_{t+1} = \text{rule-match}(s_{t+1}) \]

特点

  • 维护内部状态(世界模型)
  • 状态转移模型描述世界如何变化
  • 传感器模型描述如何从观测推断状态
  • 示例:自动驾驶中的车辆跟踪

1.3 基于目标的智能体(Goal-Based Agent)

除了当前状态,还考虑目标来选择动作。

决策过程

\[ a^* = \arg\max_{a \in A} P(\text{goal} \mid s, a) \]

特点

  • 引入目标表示(Goal Representation)
  • 需要搜索和规划来达成目标
  • 可以处理复杂的多步骤任务
  • 示例:路径规划、STRIPS 规划器

1.4 基于效用的智能体(Utility-Based Agent)

使用效用函数来量化不同状态的好坏程度,选择期望效用最大的动作。

决策过程

\[ a^* = \arg\max_{a \in A} \sum_{s'} P(s' \mid s, a) \cdot U(s') \]

其中 \(U(s')\) 是状态 \(s'\) 的效用值,\(P(s' \mid s, a)\) 是状态转移概率。

特点

  • 效用函数提供了状态偏好的连续度量
  • 能够处理多目标冲突和不确定性
  • 理论上最优但计算复杂度高
  • 示例:经济学中的理性决策者、AlphaGo 的价值网络

从目标到效用

目标是"是否满足"的二值判断,而效用是"满足程度"的连续度量。效用允许智能体在多个可行方案中选择最优解,而非仅仅找到可行解。


2. Wooldridge 智能体性分类

Michael Wooldridge 在《An Introduction to MultiAgent Systems》中区分了弱智能体性和强智能体性。

2.1 弱智能体性(Weak Agency)

弱智能体性要求智能体具备以下基本属性:

属性 描述
自主性 (Autonomy) 无需外部直接干预即可运行
社会性 (Social Ability) 能与其他智能体(或人类)交互
反应性 (Reactivity) 能感知环境并及时响应变化
主动性 (Pro-activeness) 能主动采取行动以达成目标

2.2 强智能体性(Strong Agency)

在弱智能体性基础上,强智能体性还包括心理状态属性:

属性 描述
信念 (Belief) 关于世界状态的知识和假设
愿望 (Desire) 希望达成的目标集合
意图 (Intention) 承诺执行的行动计划
情感 (Emotion) 影响决策的情感状态

BDI 联系

强智能体性直接对应 BDI 模型,详见 BDI模型


3. 架构分类:反应式 vs 慎思式 vs 混合式

3.1 反应式智能体(Reactive Agent)

不维护世界模型,直接从感知映射到动作。

代表

  • Brooks 的包容架构(Subsumption Architecture)
  • 行为树(Behavior Trees)

优点:响应速度快、实现简单、鲁棒性强 缺点:无法进行长期规划、难以处理复杂目标

3.2 慎思式智能体(Deliberative Agent)

维护世界的显式符号模型,通过推理和规划选择动作。

代表

  • STRIPS/PDDL 规划器
  • BDI 系统(PRS、Jason)

优点:能处理复杂目标、可解释性强 缺点:响应速度慢、世界模型可能不准确

3.3 混合式智能体(Hybrid Agent)

结合反应层和慎思层的分层架构。

经典架构

┌─────────────────────┐
│    慎思层 (Planning)   │  ← 长期规划,符号推理
├─────────────────────┤
│    中间层 (Sequencing) │  ← 短期决策,协调
├─────────────────────┤
│    反应层 (Reactive)   │  ← 即时响应,紧急行为
└─────────────────────┘
        ↕ 环境

代表

  • InteRRaP 三层架构
  • TouringMachines
  • 现代 LLM 智能体(prompt 解析 + 工具调用 + 反思)

4. LLM 时代的智能体分类

4.1 按交互模式分类

graph LR
    A[按交互模式] --> B[单轮对话型<br/>Single-turn]
    A --> C[多轮交互型<br/>Multi-turn]
    A --> D[自主型<br/>Autonomous]

    B --> B1[ChatGPT 单次问答]
    B --> B2[代码补全]

    C --> C1[Claude Code 交互式开发]
    C --> C2[客服对话系统]

    D --> D1[AutoGPT 自主任务执行]
    D --> D2[Devin 自主编程]
    D --> D3[OpenAI Operator]

4.2 按能力维度分类

维度 Level 0 Level 1 Level 2 Level 3
推理 无推理 单步推理 多步 CoT 树搜索/反思
记忆 无记忆 上下文窗口 外部存储 分层记忆系统
工具 无工具 单工具调用 多工具编排 工具发现/创造
规划 无规划 单步规划 多步规划 动态重规划
协作 单智能体 人机协作 多智能体固定角色 动态多智能体

4.3 按自主程度分类

受自动驾驶 L0-L5 分级启发,可以对智能体的自主程度进行分级:

等级 描述 示例
L0 无自主:纯工具,人完全控制 计算器、搜索引擎
L1 辅助型:建议动作,人确认 GitHub Copilot 代码建议
L2 半自主:自动执行子任务,人监督 Claude Code 编辑模式
L3 条件自主:大部分自主,异常时求助人类 Cursor Agent 模式
L4 高度自主:完成完整任务流,仅结果审查 Devin 自主编程
L5 完全自主:无需人类干预 理论上的 AGI Agent

5. 多维度综合分类框架

智能体的分类不应局限于单一维度,而应综合考虑多个维度:

\[ \text{Agent Profile} = (\text{Architecture}, \text{Reasoning}, \text{Memory}, \text{Tools}, \text{Autonomy}, \text{Interaction}) \]

例如,Claude Code 可以表征为:

  • 架构:混合式(LLM 慎思 + 工具调用反应)
  • 推理:Level 2-3(多步 CoT + 自我纠正)
  • 记忆:Level 2(上下文窗口 + 文件系统)
  • 工具:Level 2(多工具编排:bash、文件读写、搜索)
  • 自主性:Level 2-3(半自主到条件自主)
  • 交互:多轮交互型

总结

智能体分类学从单一维度走向多维度、从静态分类走向动态评估。理解不同分类框架有助于:

  1. 设计决策:根据需求选择合适的智能体架构
  2. 能力评估:系统化地评估智能体的各项能力
  3. 研究定位:明确研究工作在智能体设计空间中的位置
  4. 技术路线:规划从当前水平到目标水平的发展路径

参考文献

  1. Russell, S. & Norvig, P. (2020). Artificial Intelligence: A Modern Approach (4th ed.). Pearson.
  2. Wooldridge, M. (2009). An Introduction to MultiAgent Systems (2nd ed.). Wiley.
  3. Brooks, R.A. (1991). Intelligence without Representation. Artificial Intelligence, 47(1-3), 139-159.
  4. Müller, J.P. et al. (1995). The Design of Intelligent Agents: A Layered Approach. LNCS 1177.
  5. Wang, L. et al. (2024). A Survey on Large Language Model based Autonomous Agents. Frontiers of Computer Science.

评论 #