人工智能综述

概述

人工智能（Artificial Intelligence, AI）是计算机科学中致力于创建能模拟人类智能行为的系统的分支。从 1956 年正式提出至今，AI 经历了多次兴衰，如今已深刻改变了人类社会。

1. AI 的定义

不同学者从不同角度定义 AI：

维度	像人类思考	理性地思考
思考	认知建模方法：模拟人类思维过程	思维法则方法：基于逻辑的推理
行动	图灵测试方法：行为上不可区分	理性智能体方法：做出最优决策

主要定义：

图灵（1950）：如果一台机器在对话中不能被区分为非人类，则该机器具有智能
McCarthy（1956）：制造智能机器的科学和工程
Russell & Norvig：研究智能体（Agent）——感知环境并采取行动以最大化成功的系统
现代观点：从数据中学习模式，在复杂环境中做出决策的计算系统

2. AI 的三大学派

graph TD
    A[人工智能] --> B[符号主义 Symbolism]
    A --> C[连接主义 Connectionism]
    A --> D[行为主义 Behaviorism]

    B --> B1[知识表示与推理]
    B --> B2[专家系统]
    B --> B3[逻辑编程]

    C --> C1[神经网络]
    C --> C2[深度学习]
    C --> C3[大语言模型]

    D --> D1[强化学习]
    D --> D2[进化算法]
    D --> D3[机器人学]

    style B fill:#f9f,stroke:#333
    style C fill:#bbf,stroke:#333
    style D fill:#bfb,stroke:#333

2.1 符号主义（Symbolism）

核心思想：智能 = 符号操作。用形式化的符号表示知识，用逻辑规则进行推理
代表方法：专家系统、知识图谱、逻辑编程（Prolog）
优势：可解释、可验证、知识可编码
局限：知识获取瓶颈、难以处理不确定性和感知任务

2.2 连接主义（Connectionism）

核心思想：智能来源于大量简单单元的连接。模拟神经元网络
代表方法：人工神经网络、深度学习、Transformer
优势：自动从数据中学习、擅长感知任务
局限：需要大量数据、缺乏可解释性、高计算成本

2.3 行为主义（Behaviorism）

核心思想：智能体通过与环境交互来学习行为。无需内部知识表示
代表方法：强化学习、进化算法、群体智能
优势：适合决策和控制问题、不需要标签数据
局限：样本效率低、探索困难

延伸：Domingos 的 ML 五派分法　Pedro Domingos 在《The Master Algorithm》(2015) 中从 ML 内部视角把学习算法切成五派：Symbolists / Connectionists / Bayesians / Evolutionaries / Analogizers。这与上面三派分法正交互补：三派从"智能从哪里来"切，五派从"学习器用什么数学工具"切。详见 The Master Algorithm 笔记本。

3. 图灵测试

3.1 原始图灵测试（1950）

┌──────────┐     文字对话     ┌──────────┐
│  人类评判者 │ ◄───────────→ │  被测试者  │
│           │                │ (人/机器)  │
└──────────┘                └──────────┘

规则：如果评判者无法可靠地区分被测试者是人还是机器，
      则认为机器通过了图灵测试。

3.2 图灵测试的局限

批评	论点
只测试模仿	模仿人类不等于拥有智能
仅限文字	忽略感知、运动等智能维度
人类偏见	评判者的期望影响结果
欺骗可能	ELIZA（1966）就能"欺骗"部分用户

4. 中文房间论证

Searle（1980）提出的思想实验：

房间外：中文输入 → [房间] → 中文输出

房间内：
  一个不懂中文的人
  + 一套详细的中文处理规则手册
  → 按规则机械地操作符号
  → 产生"正确"的中文回复

结论：虽然从外部看系统"理解"中文，
      但房间内的人并不理解中文的含义。
      → 语法处理 ≠ 语义理解

意义：强 AI（机器真正理解和思考）与弱 AI（机器模拟智能行为）的根本区分。

5. 弱 AI vs 强 AI

维度	弱 AI（Narrow AI）	强 AI（AGI）
能力范围	特定任务	通用智能
理解	无真正理解	具有理解和意识
当前状态	已实现	尚未实现
例子	AlphaGo、ChatGPT、自动驾驶	科幻中的 AI

超级智能（Superintelligence）

定义：在几乎所有领域都远超人类最聪明个体的智能
Bostrom 观点：一旦实现 AGI，可能迅速递归自我改进到超级智能
争议：是否可能？是否危险？时间框架？

6. AI 的当前格局

graph LR
    subgraph 感知
        A1[计算机视觉]
        A2[语音识别]
        A3[自然语言理解]
    end

    subgraph 推理与决策
        B1[知识图谱]
        B2[规划与搜索]
        B3[强化学习]
    end

    subgraph 生成
        C1[文本生成 LLM]
        C2[图像生成 Diffusion]
        C3[代码生成 Copilot]
    end

    subgraph 应用
        D1[自动驾驶]
        D2[医疗诊断]
        D3[科学发现]
        D4[AI Agent]
    end

    A1 & A2 & A3 --> B1 & B2 & B3
    B1 & B2 & B3 --> C1 & C2 & C3
    C1 & C2 & C3 --> D1 & D2 & D3 & D4

当前关键趋势

大语言模型（LLM）：GPT-4、Claude、Gemini 展现了通用语言能力
多模态：统一处理文本、图像、音频、视频
AI Agent：LLM 驱动的自主智能体，能使用工具和规划
科学 AI：AlphaFold（蛋白质结构）、GNoME（材料发现）
具身智能：将 AI 与物理世界交互结合

7. AI 的分类体系

分类维度	类别
按学习方式	监督学习、无监督学习、强化学习、自监督学习
按任务类型	分类、回归、生成、决策、推理
按模态	文本、视觉、语音、多模态
按应用领域	NLP、CV、机器人、推荐系统、科学计算
按智能水平	弱 AI → AGI → ASI

参考资料

"Artificial Intelligence: A Modern Approach" - Russell & Norvig
"Computing Machinery and Intelligence" - Alan Turing (1950)
"Minds, Brains, and Programs" - John Searle (1980)
"Superintelligence" - Nick Bostrom

人工智能综述

概述

1. AI 的定义

2. AI 的三大学派

2.1 符号主义（Symbolism）

2.2 连接主义（Connectionism）

2.3 行为主义（Behaviorism）

3. 图灵测试

3.1 原始图灵测试（1950）

3.2 图灵测试的局限

4. 中文房间论证

5. 弱 AI vs 强 AI

超级智能（Superintelligence）

6. AI 的当前格局

当前关键趋势

7. AI 的分类体系

参考资料

评论 #