AI 研究范式
概述
人工智能研究从不同的哲学立场出发,形成了三大主要范式:符号主义、连接主义和行为主义。本文深入比较这三种范式的理论基础、方法论和适用场景,并讨论现代混合方法的发展趋势。
相关内容:符号主义 AI、机器学习、The Master Algorithm(Domingos 的 ML 五派分法 —— 与本文三派分类正交互补)
1. 符号主义(Symbolism / GOFAI)
1.1 哲学基础
符号主义源于理性主义传统,核心假设:
物理符号系统假说(Newell & Simon, 1976):一个物理符号系统拥有通用智能行为的充分必要条件。
即智能可以通过对符号(物理模式)进行操作(搜索、推理、组合)来实现。
1.2 知识表示
知识表示是符号主义的核心问题:
| 表示方法 | 描述 | 示例 |
|---|---|---|
| 命题逻辑 | 命题 + 逻辑联结词 | \(P \wedge Q \Rightarrow R\) |
| 一阶谓词逻辑 | 变量、量词、谓词 | \(\forall x: \text{Human}(x) \Rightarrow \text{Mortal}(x)\) |
| 语义网络 | 节点 + 关系边 | "鸟 → 有翅膀" |
| 框架 | 结构化的属性槽 | Object(name=..., color=...) |
| 本体 | 概念层次 + 关系 | OWL, WordNet |
| 知识图谱 | 实体-关系-实体三元组 | (爱因斯坦, 出生于, 乌尔姆) |
1.3 推理方法
- 演绎推理:从一般到特殊。\(\{P \Rightarrow Q, P\} \vdash Q\)
- 归纳推理:从特殊到一般。观察多个实例归纳规则
- 溯因推理:从结果推原因。已知 \(Q\) 和 \(P \Rightarrow Q\),推测 \(P\)
1.4 专家系统
知识库(IF-THEN 规则)
+
推理引擎(前向/后向链)
+
解释模块
=
专家系统
示例规则(MYCIN):
IF 感染部位 = 血液
AND 革兰氏染色 = 阴性
AND 形态 = 杆状
AND 患者烧伤面积 > 30%
THEN 致病菌 = 绿脓杆菌 (置信度 0.7)
1.5 局限性
- 知识获取瓶颈:专家知识难以完全编码
- 常识问题:CYC 项目 30+ 年仍未完成
- 脆弱性:规则覆盖范围外的情况无法处理
- 感知困难:难以处理图像、语音等非结构化数据
2. 连接主义(Connectionism)
2.1 哲学基础
连接主义源于经验主义传统,受神经科学启发:
智能涌现于大量简单单元(人工神经元)的大规模连接和协同活动中。
- 知识不是显式存储的符号,而是分布在连接权重中
- 学习就是调整连接权重
2.2 发展脉络
感知机 (1958) → 多层前馈网络 (1986, 反向传播)
→ CNN (1998, LeNet) → 深度学习 (2012, AlexNet)
→ RNN/LSTM → Transformer (2017)
→ 预训练模型 (2018, BERT/GPT)
→ 大语言模型 (2020+, GPT-3/4)
2.3 核心思想
通用近似定理:一个足够宽的单隐层前馈网络可以以任意精度近似任何连续函数。
\[
f(x) = \sum_{i=1}^{N} w_i \sigma(a_i^T x + b_i)
\]
表示学习:深度网络通过多层抽象自动学习从原始数据到任务目标的层级表示:
像素 → 边缘 → 纹理 → 部件 → 物体
↑ 自动学习的层级特征
2.4 关键成就
| 领域 | 方法 | 成就 |
|---|---|---|
| 图像识别 | CNN | 超越人类准确率 |
| 机器翻译 | Transformer | 接近人类水平 |
| 蛋白质折叠 | AlphaFold | 解决 50 年难题 |
| 文本生成 | GPT-4 | 通用语言能力 |
| 图像生成 | Diffusion | 照片级图像生成 |
2.5 局限性
- 可解释性差:黑箱模型,难以理解决策过程
- 数据饥渴:需要大量标注数据
- 计算密集:训练成本高昂(GPT-4 ~$100M)
- 泛化脆弱:对抗样本、分布偏移
- 缺乏因果推理:学习相关性而非因果关系
3. 行为主义(Behaviorism / Situated AI)
3.1 哲学基础
行为主义受进化论和控制论影响:
智能不需要内部表示,而是通过与环境的交互涌现。
Brooks(1990)的"无表示智能"主张:
"世界本身就是最好的模型。"
3.2 强化学习
核心框架:智能体(Agent)通过试错学习在环境中最大化累积奖励。
\[
\pi^* = \arg\max_\pi \mathbb{E}\left[\sum_{t=0}^{\infty} \gamma^t r_t \mid \pi\right]
\]
关键算法:
| 算法 | 类型 | 特点 |
|---|---|---|
| Q-Learning | 值方法 | 学习状态-动作值函数 |
| SARSA | 值方法 | 在策略学习 |
| Policy Gradient | 策略方法 | 直接优化策略 |
| Actor-Critic | 混合 | 值 + 策略 |
| PPO | 策略方法 | 稳定的策略优化 |
| DQN | 深度 RL | 深度 Q 网络 |
| AlphaZero | 深度 RL | 自博弈学习 |
3.3 进化算法
模拟自然选择过程:
初始种群 → 评估适应度 → 选择 → 交叉 → 变异 → 新种群
↑ │
└────────────────────────────────────┘
变体:遗传算法(GA)、遗传编程(GP)、进化策略(ES)、神经进化(NEAT)。
3.4 群体智能
| 方法 | 灵感来源 | 应用 |
|---|---|---|
| 蚁群算法 | 蚂蚁觅食 | 路径优化 |
| 粒子群优化 | 鸟群飞行 | 连续优化 |
| 人工蜂群 | 蜜蜂采蜜 | 多目标优化 |
3.5 局限性
- 样本效率低:需要大量交互经验
- 奖励设计困难:不恰当的奖励导致意外行为
- 探索-利用困境:如何平衡探索新策略和利用已知好策略
- 安全性:训练过程中可能产生危险行为
4. 范式对比
| 维度 | 符号主义 | 连接主义 | 行为主义 |
|---|---|---|---|
| 知识来源 | 专家编码 | 数据学习 | 环境交互 |
| 知识表示 | 显式符号 | 分布式权重 | 隐式策略 |
| 推理方式 | 逻辑推理 | 模式匹配 | 试错搜索 |
| 可解释性 | 高 | 低 | 中 |
| 感知能力 | 弱 | 强 | 中 |
| 规划能力 | 强 | 弱 | 中 |
| 适应性 | 低 | 中 | 高 |
| 代表系统 | 专家系统 | GPT-4 | AlphaGo |
5. 混合方法与现代趋势
5.1 神经符号 AI(Neuro-Symbolic AI)
结合连接主义的感知/学习能力和符号主义的推理/解释能力:
感知(神经网络)
→ 符号提取(概念、关系)
→ 符号推理(逻辑、规划)
→ 决策/生成
代表工作:
- DeepProbLog:神经网络 + 概率逻辑编程
- Graph Neural Networks + Knowledge Graphs
- LLM + 外部工具/知识库(RAG)
5.2 LLM 作为推理引擎
大语言模型在某种程度上融合了三种范式:
- 连接主义:Transformer 架构,从数据学习
- 符号主义:Chain-of-Thought 推理、代码生成
- 行为主义:RLHF 通过反馈优化行为
5.3 世界模型(World Model)
结合感知、预测和规划:
\[
\text{感知}(o_t) \xrightarrow{\text{编码}} z_t \xrightarrow{\text{世界模型}} \hat{z}_{t+1} \xrightarrow{\text{规划}} a_t
\]
代表:Dreamer(RL)、JEPA(LeCun)、Sora(视频生成)。
6. 范式选择指南
| 场景 | 推荐范式 |
|---|---|
| 有明确规则、需要解释 | 符号主义 |
| 大量数据、感知任务 | 连接主义 |
| 交互环境、序贯决策 | 行为主义 |
| 感知 + 推理 | 神经符号混合 |
| 复杂开放问题 | 多范式融合 |
参考资料
- "Artificial Intelligence: A Modern Approach" - Russell & Norvig
- "The Society of Mind" - Marvin Minsky
- "Intelligence without Representation" - Rodney Brooks (1990)
- "Neuro-Symbolic AI: The 3rd Wave" - Garcez & Lamb (2020)