AI 研究范式

概述

人工智能研究从不同的哲学立场出发，形成了三大主要范式：符号主义、连接主义和行为主义。本文深入比较这三种范式的理论基础、方法论和适用场景，并讨论现代混合方法的发展趋势。

相关内容：符号主义 AI、机器学习、The Master Algorithm（Domingos 的 ML 五派分法 —— 与本文三派分类正交互补）

1. 符号主义（Symbolism / GOFAI）

1.1 哲学基础

符号主义源于理性主义传统，核心假设：

物理符号系统假说（Newell & Simon, 1976）：一个物理符号系统拥有通用智能行为的充分必要条件。

即智能可以通过对符号（物理模式）进行操作（搜索、推理、组合）来实现。

1.2 知识表示

知识表示是符号主义的核心问题：

表示方法	描述	示例
命题逻辑	命题 + 逻辑联结词	$P \wedge Q \Rightarrow R$
一阶谓词逻辑	变量、量词、谓词	$\forall x: \text{Human}(x) \Rightarrow \text{Mortal}(x)$
语义网络	节点 + 关系边	"鸟 → 有翅膀"
框架	结构化的属性槽	Object(name=..., color=...)
本体	概念层次 + 关系	OWL, WordNet
知识图谱	实体-关系-实体三元组	(爱因斯坦, 出生于, 乌尔姆)

1.3 推理方法

演绎推理：从一般到特殊。$\{P \Rightarrow Q, P\} \vdash Q$
归纳推理：从特殊到一般。观察多个实例归纳规则
溯因推理：从结果推原因。已知 $Q$ 和 $P \Rightarrow Q$，推测 $P$

1.4 专家系统

知识库（IF-THEN 规则）
    +
推理引擎（前向/后向链）
    +
解释模块
    =
专家系统

示例规则（MYCIN）：
IF   感染部位 = 血液
AND  革兰氏染色 = 阴性
AND  形态 = 杆状
AND  患者烧伤面积 > 30%
THEN 致病菌 = 绿脓杆菌 (置信度 0.7)

1.5 局限性

知识获取瓶颈：专家知识难以完全编码
常识问题：CYC 项目 30+ 年仍未完成
脆弱性：规则覆盖范围外的情况无法处理
感知困难：难以处理图像、语音等非结构化数据

2. 连接主义（Connectionism）

2.1 哲学基础

连接主义源于经验主义传统，受神经科学启发：

智能涌现于大量简单单元（人工神经元）的大规模连接和协同活动中。

知识不是显式存储的符号，而是分布在连接权重中
学习就是调整连接权重

2.2 发展脉络

感知机 (1958) → 多层前馈网络 (1986, 反向传播)
    → CNN (1998, LeNet) → 深度学习 (2012, AlexNet)
    → RNN/LSTM → Transformer (2017)
    → 预训练模型 (2018, BERT/GPT)
    → 大语言模型 (2020+, GPT-3/4)

2.3 核心思想

通用近似定理：一个足够宽的单隐层前馈网络可以以任意精度近似任何连续函数。

\[ f(x) = \sum_{i=1}^{N} w_i \sigma(a_i^T x + b_i) \]

表示学习：深度网络通过多层抽象自动学习从原始数据到任务目标的层级表示：

像素 → 边缘 → 纹理 → 部件 → 物体
              ↑ 自动学习的层级特征

2.4 关键成就

领域	方法	成就
图像识别	CNN	超越人类准确率
机器翻译	Transformer	接近人类水平
蛋白质折叠	AlphaFold	解决 50 年难题
文本生成	GPT-4	通用语言能力
图像生成	Diffusion	照片级图像生成

2.5 局限性

可解释性差：黑箱模型，难以理解决策过程
数据饥渴：需要大量标注数据
计算密集：训练成本高昂（GPT-4 ~$100M）
泛化脆弱：对抗样本、分布偏移
缺乏因果推理：学习相关性而非因果关系

3. 行为主义（Behaviorism / Situated AI）

3.1 哲学基础

行为主义受进化论和控制论影响：

智能不需要内部表示，而是通过与环境的交互涌现。

Brooks（1990）的"无表示智能"主张：

"世界本身就是最好的模型。"

3.2 强化学习

核心框架：智能体（Agent）通过试错学习在环境中最大化累积奖励。

\[ \pi^* = \arg\max_\pi \mathbb{E}\left[\sum_{t=0}^{\infty} \gamma^t r_t \mid \pi\right] \]

关键算法：

算法	类型	特点
Q-Learning	值方法	学习状态-动作值函数
SARSA	值方法	在策略学习
Policy Gradient	策略方法	直接优化策略
Actor-Critic	混合	值 + 策略
PPO	策略方法	稳定的策略优化
DQN	深度 RL	深度 Q 网络
AlphaZero	深度 RL	自博弈学习

3.3 进化算法

模拟自然选择过程：

初始种群 → 评估适应度 → 选择 → 交叉 → 变异 → 新种群
              ↑                                    │
              └────────────────────────────────────┘

变体：遗传算法（GA）、遗传编程（GP）、进化策略（ES）、神经进化（NEAT）。

3.4 群体智能

方法	灵感来源	应用
蚁群算法	蚂蚁觅食	路径优化
粒子群优化	鸟群飞行	连续优化
人工蜂群	蜜蜂采蜜	多目标优化

3.5 局限性

样本效率低：需要大量交互经验
奖励设计困难：不恰当的奖励导致意外行为
探索-利用困境：如何平衡探索新策略和利用已知好策略
安全性：训练过程中可能产生危险行为

4. 范式对比

维度	符号主义	连接主义	行为主义
知识来源	专家编码	数据学习	环境交互
知识表示	显式符号	分布式权重	隐式策略
推理方式	逻辑推理	模式匹配	试错搜索
可解释性	高	低	中
感知能力	弱	强	中
规划能力	强	弱	中
适应性	低	中	高
代表系统	专家系统	GPT-4	AlphaGo

5. 混合方法与现代趋势

5.1 神经符号 AI（Neuro-Symbolic AI）

结合连接主义的感知/学习能力和符号主义的推理/解释能力：

感知（神经网络）
    → 符号提取（概念、关系）
    → 符号推理（逻辑、规划）
    → 决策/生成

代表工作：

DeepProbLog：神经网络 + 概率逻辑编程
Graph Neural Networks + Knowledge Graphs
LLM + 外部工具/知识库（RAG）

5.2 LLM 作为推理引擎

大语言模型在某种程度上融合了三种范式：

连接主义：Transformer 架构，从数据学习
符号主义：Chain-of-Thought 推理、代码生成
行为主义：RLHF 通过反馈优化行为

5.3 世界模型（World Model）

结合感知、预测和规划：

\[ \text{感知}(o_t) \xrightarrow{\text{编码}} z_t \xrightarrow{\text{世界模型}} \hat{z}_{t+1} \xrightarrow{\text{规划}} a_t \]

代表：Dreamer（RL）、JEPA（LeCun）、Sora（视频生成）。

6. 范式选择指南

场景	推荐范式
有明确规则、需要解释	符号主义
大量数据、感知任务	连接主义
交互环境、序贯决策	行为主义
感知 + 推理	神经符号混合
复杂开放问题	多范式融合

参考资料

"Artificial Intelligence: A Modern Approach" - Russell & Norvig
"The Society of Mind" - Marvin Minsky
"Intelligence without Representation" - Rodney Brooks (1990)
"Neuro-Symbolic AI: The 3rd Wave" - Garcez & Lamb (2020)

表示方法	描述	示例
命题逻辑	命题 + 逻辑联结词	\(P \wedge Q \Rightarrow R\)
一阶谓词逻辑	变量、量词、谓词	\(\forall x: \text{Human}(x) \Rightarrow \text{Mortal}(x)\)
语义网络	节点 + 关系边	"鸟 → 有翅膀"
框架	结构化的属性槽	Object(name=..., color=...)
本体	概念层次 + 关系	OWL, WordNet
知识图谱	实体-关系-实体三元组	(爱因斯坦, 出生于, 乌尔姆)