人工智能综述
概述
人工智能(Artificial Intelligence, AI)是计算机科学中致力于创建能模拟人类智能行为的系统的分支。从 1956 年正式提出至今,AI 经历了多次兴衰,如今已深刻改变了人类社会。
1. AI 的定义
不同学者从不同角度定义 AI:
| 维度 | 像人类思考 | 理性地思考 |
|---|---|---|
| 思考 | 认知建模方法:模拟人类思维过程 | 思维法则方法:基于逻辑的推理 |
| 行动 | 图灵测试方法:行为上不可区分 | 理性智能体方法:做出最优决策 |
主要定义:
- 图灵(1950):如果一台机器在对话中不能被区分为非人类,则该机器具有智能
- McCarthy(1956):制造智能机器的科学和工程
- Russell & Norvig:研究智能体(Agent)——感知环境并采取行动以最大化成功的系统
- 现代观点:从数据中学习模式,在复杂环境中做出决策的计算系统
2. AI 的三大学派
graph TD
A[人工智能] --> B[符号主义 Symbolism]
A --> C[连接主义 Connectionism]
A --> D[行为主义 Behaviorism]
B --> B1[知识表示与推理]
B --> B2[专家系统]
B --> B3[逻辑编程]
C --> C1[神经网络]
C --> C2[深度学习]
C --> C3[大语言模型]
D --> D1[强化学习]
D --> D2[进化算法]
D --> D3[机器人学]
style B fill:#f9f,stroke:#333
style C fill:#bbf,stroke:#333
style D fill:#bfb,stroke:#333
2.1 符号主义(Symbolism)
- 核心思想:智能 = 符号操作。用形式化的符号表示知识,用逻辑规则进行推理
- 代表方法:专家系统、知识图谱、逻辑编程(Prolog)
- 优势:可解释、可验证、知识可编码
- 局限:知识获取瓶颈、难以处理不确定性和感知任务
2.2 连接主义(Connectionism)
- 核心思想:智能来源于大量简单单元的连接。模拟神经元网络
- 代表方法:人工神经网络、深度学习、Transformer
- 优势:自动从数据中学习、擅长感知任务
- 局限:需要大量数据、缺乏可解释性、高计算成本
2.3 行为主义(Behaviorism)
- 核心思想:智能体通过与环境交互来学习行为。无需内部知识表示
- 代表方法:强化学习、进化算法、群体智能
- 优势:适合决策和控制问题、不需要标签数据
- 局限:样本效率低、探索困难
延伸:Domingos 的 ML 五派分法 Pedro Domingos 在《The Master Algorithm》(2015) 中从 ML 内部视角把学习算法切成五派:Symbolists / Connectionists / Bayesians / Evolutionaries / Analogizers。这与上面三派分法正交互补:三派从"智能从哪里来"切,五派从"学习器用什么数学工具"切。详见 The Master Algorithm 笔记本。
3. 图灵测试
3.1 原始图灵测试(1950)
┌──────────┐ 文字对话 ┌──────────┐
│ 人类评判者 │ ◄───────────→ │ 被测试者 │
│ │ │ (人/机器) │
└──────────┘ └──────────┘
规则:如果评判者无法可靠地区分被测试者是人还是机器,
则认为机器通过了图灵测试。
3.2 图灵测试的局限
| 批评 | 论点 |
|---|---|
| 只测试模仿 | 模仿人类不等于拥有智能 |
| 仅限文字 | 忽略感知、运动等智能维度 |
| 人类偏见 | 评判者的期望影响结果 |
| 欺骗可能 | ELIZA(1966)就能"欺骗"部分用户 |
4. 中文房间论证
Searle(1980)提出的思想实验:
房间外:中文输入 → [房间] → 中文输出
房间内:
一个不懂中文的人
+ 一套详细的中文处理规则手册
→ 按规则机械地操作符号
→ 产生"正确"的中文回复
结论:虽然从外部看系统"理解"中文,
但房间内的人并不理解中文的含义。
→ 语法处理 ≠ 语义理解
意义:强 AI(机器真正理解和思考)与弱 AI(机器模拟智能行为)的根本区分。
5. 弱 AI vs 强 AI
| 维度 | 弱 AI(Narrow AI) | 强 AI(AGI) |
|---|---|---|
| 能力范围 | 特定任务 | 通用智能 |
| 理解 | 无真正理解 | 具有理解和意识 |
| 当前状态 | 已实现 | 尚未实现 |
| 例子 | AlphaGo、ChatGPT、自动驾驶 | 科幻中的 AI |
超级智能(Superintelligence)
- 定义:在几乎所有领域都远超人类最聪明个体的智能
- Bostrom 观点:一旦实现 AGI,可能迅速递归自我改进到超级智能
- 争议:是否可能?是否危险?时间框架?
6. AI 的当前格局
graph LR
subgraph 感知
A1[计算机视觉]
A2[语音识别]
A3[自然语言理解]
end
subgraph 推理与决策
B1[知识图谱]
B2[规划与搜索]
B3[强化学习]
end
subgraph 生成
C1[文本生成 LLM]
C2[图像生成 Diffusion]
C3[代码生成 Copilot]
end
subgraph 应用
D1[自动驾驶]
D2[医疗诊断]
D3[科学发现]
D4[AI Agent]
end
A1 & A2 & A3 --> B1 & B2 & B3
B1 & B2 & B3 --> C1 & C2 & C3
C1 & C2 & C3 --> D1 & D2 & D3 & D4
当前关键趋势
- 大语言模型(LLM):GPT-4、Claude、Gemini 展现了通用语言能力
- 多模态:统一处理文本、图像、音频、视频
- AI Agent:LLM 驱动的自主智能体,能使用工具和规划
- 科学 AI:AlphaFold(蛋白质结构)、GNoME(材料发现)
- 具身智能:将 AI 与物理世界交互结合
7. AI 的分类体系
| 分类维度 | 类别 |
|---|---|
| 按学习方式 | 监督学习、无监督学习、强化学习、自监督学习 |
| 按任务类型 | 分类、回归、生成、决策、推理 |
| 按模态 | 文本、视觉、语音、多模态 |
| 按应用领域 | NLP、CV、机器人、推荐系统、科学计算 |
| 按智能水平 | 弱 AI → AGI → ASI |
参考资料
- "Artificial Intelligence: A Modern Approach" - Russell & Norvig
- "Computing Machinery and Intelligence" - Alan Turing (1950)
- "Minds, Brains, and Programs" - John Searle (1980)
- "Superintelligence" - Nick Bostrom