跳转至

AI 研究范式

概述

人工智能研究从不同的哲学立场出发,形成了三大主要范式:符号主义、连接主义和行为主义。本文深入比较这三种范式的理论基础、方法论和适用场景,并讨论现代混合方法的发展趋势。

相关内容:符号主义 AI机器学习The Master Algorithm(Domingos 的 ML 五派分法 —— 与本文三派分类正交互补)


1. 符号主义(Symbolism / GOFAI)

1.1 哲学基础

符号主义源于理性主义传统,核心假设:

物理符号系统假说(Newell & Simon, 1976):一个物理符号系统拥有通用智能行为的充分必要条件。

即智能可以通过对符号(物理模式)进行操作(搜索、推理、组合)来实现。

1.2 知识表示

知识表示是符号主义的核心问题:

表示方法 描述 示例
命题逻辑 命题 + 逻辑联结词 \(P \wedge Q \Rightarrow R\)
一阶谓词逻辑 变量、量词、谓词 \(\forall x: \text{Human}(x) \Rightarrow \text{Mortal}(x)\)
语义网络 节点 + 关系边 "鸟 → 有翅膀"
框架 结构化的属性槽 Object(name=..., color=...)
本体 概念层次 + 关系 OWL, WordNet
知识图谱 实体-关系-实体三元组 (爱因斯坦, 出生于, 乌尔姆)

1.3 推理方法

  • 演绎推理:从一般到特殊。\(\{P \Rightarrow Q, P\} \vdash Q\)
  • 归纳推理:从特殊到一般。观察多个实例归纳规则
  • 溯因推理:从结果推原因。已知 \(Q\)\(P \Rightarrow Q\),推测 \(P\)

1.4 专家系统

知识库(IF-THEN 规则)
    +
推理引擎(前向/后向链)
    +
解释模块
    =
专家系统

示例规则(MYCIN):
IF   感染部位 = 血液
AND  革兰氏染色 = 阴性
AND  形态 = 杆状
AND  患者烧伤面积 > 30%
THEN 致病菌 = 绿脓杆菌 (置信度 0.7)

1.5 局限性

  • 知识获取瓶颈:专家知识难以完全编码
  • 常识问题:CYC 项目 30+ 年仍未完成
  • 脆弱性:规则覆盖范围外的情况无法处理
  • 感知困难:难以处理图像、语音等非结构化数据

2. 连接主义(Connectionism)

2.1 哲学基础

连接主义源于经验主义传统,受神经科学启发:

智能涌现于大量简单单元(人工神经元)的大规模连接和协同活动中。

  • 知识不是显式存储的符号,而是分布在连接权重中
  • 学习就是调整连接权重

2.2 发展脉络

感知机 (1958) → 多层前馈网络 (1986, 反向传播)
    → CNN (1998, LeNet) → 深度学习 (2012, AlexNet)
    → RNN/LSTM → Transformer (2017)
    → 预训练模型 (2018, BERT/GPT)
    → 大语言模型 (2020+, GPT-3/4)

2.3 核心思想

通用近似定理:一个足够宽的单隐层前馈网络可以以任意精度近似任何连续函数。

\[ f(x) = \sum_{i=1}^{N} w_i \sigma(a_i^T x + b_i) \]

表示学习:深度网络通过多层抽象自动学习从原始数据到任务目标的层级表示:

像素 → 边缘 → 纹理 → 部件 → 物体
              ↑ 自动学习的层级特征

2.4 关键成就

领域 方法 成就
图像识别 CNN 超越人类准确率
机器翻译 Transformer 接近人类水平
蛋白质折叠 AlphaFold 解决 50 年难题
文本生成 GPT-4 通用语言能力
图像生成 Diffusion 照片级图像生成

2.5 局限性

  • 可解释性差:黑箱模型,难以理解决策过程
  • 数据饥渴:需要大量标注数据
  • 计算密集:训练成本高昂(GPT-4 ~$100M)
  • 泛化脆弱:对抗样本、分布偏移
  • 缺乏因果推理:学习相关性而非因果关系

3. 行为主义(Behaviorism / Situated AI)

3.1 哲学基础

行为主义受进化论控制论影响:

智能不需要内部表示,而是通过与环境的交互涌现。

Brooks(1990)的"无表示智能"主张:

"世界本身就是最好的模型。"

3.2 强化学习

核心框架:智能体(Agent)通过试错学习在环境中最大化累积奖励。

\[ \pi^* = \arg\max_\pi \mathbb{E}\left[\sum_{t=0}^{\infty} \gamma^t r_t \mid \pi\right] \]

关键算法:

算法 类型 特点
Q-Learning 值方法 学习状态-动作值函数
SARSA 值方法 在策略学习
Policy Gradient 策略方法 直接优化策略
Actor-Critic 混合 值 + 策略
PPO 策略方法 稳定的策略优化
DQN 深度 RL 深度 Q 网络
AlphaZero 深度 RL 自博弈学习

3.3 进化算法

模拟自然选择过程:

初始种群 → 评估适应度 → 选择 → 交叉 → 变异 → 新种群
              ↑                                    │
              └────────────────────────────────────┘

变体:遗传算法(GA)、遗传编程(GP)、进化策略(ES)、神经进化(NEAT)。

3.4 群体智能

方法 灵感来源 应用
蚁群算法 蚂蚁觅食 路径优化
粒子群优化 鸟群飞行 连续优化
人工蜂群 蜜蜂采蜜 多目标优化

3.5 局限性

  • 样本效率低:需要大量交互经验
  • 奖励设计困难:不恰当的奖励导致意外行为
  • 探索-利用困境:如何平衡探索新策略和利用已知好策略
  • 安全性:训练过程中可能产生危险行为

4. 范式对比

维度 符号主义 连接主义 行为主义
知识来源 专家编码 数据学习 环境交互
知识表示 显式符号 分布式权重 隐式策略
推理方式 逻辑推理 模式匹配 试错搜索
可解释性
感知能力
规划能力
适应性
代表系统 专家系统 GPT-4 AlphaGo

5. 混合方法与现代趋势

5.1 神经符号 AI(Neuro-Symbolic AI)

结合连接主义的感知/学习能力和符号主义的推理/解释能力:

感知(神经网络)
    → 符号提取(概念、关系)
    → 符号推理(逻辑、规划)
    → 决策/生成

代表工作:

  • DeepProbLog:神经网络 + 概率逻辑编程
  • Graph Neural Networks + Knowledge Graphs
  • LLM + 外部工具/知识库(RAG)

5.2 LLM 作为推理引擎

大语言模型在某种程度上融合了三种范式:

  • 连接主义:Transformer 架构,从数据学习
  • 符号主义:Chain-of-Thought 推理、代码生成
  • 行为主义:RLHF 通过反馈优化行为

5.3 世界模型(World Model)

结合感知、预测和规划:

\[ \text{感知}(o_t) \xrightarrow{\text{编码}} z_t \xrightarrow{\text{世界模型}} \hat{z}_{t+1} \xrightarrow{\text{规划}} a_t \]

代表:Dreamer(RL)、JEPA(LeCun)、Sora(视频生成)。


6. 范式选择指南

场景 推荐范式
有明确规则、需要解释 符号主义
大量数据、感知任务 连接主义
交互环境、序贯决策 行为主义
感知 + 推理 神经符号混合
复杂开放问题 多范式融合

参考资料

  • "Artificial Intelligence: A Modern Approach" - Russell & Norvig
  • "The Society of Mind" - Marvin Minsky
  • "Intelligence without Representation" - Rodney Brooks (1990)
  • "Neuro-Symbolic AI: The 3rd Wave" - Garcez & Lamb (2020)

评论 #