跳转至

人工智能综述

概述

人工智能(Artificial Intelligence, AI)是计算机科学中致力于创建能模拟人类智能行为的系统的分支。从 1956 年正式提出至今,AI 经历了多次兴衰,如今已深刻改变了人类社会。


1. AI 的定义

不同学者从不同角度定义 AI:

维度 像人类思考 理性地思考
思考 认知建模方法:模拟人类思维过程 思维法则方法:基于逻辑的推理
行动 图灵测试方法:行为上不可区分 理性智能体方法:做出最优决策

主要定义

  • 图灵(1950):如果一台机器在对话中不能被区分为非人类,则该机器具有智能
  • McCarthy(1956):制造智能机器的科学和工程
  • Russell & Norvig:研究智能体(Agent)——感知环境并采取行动以最大化成功的系统
  • 现代观点:从数据中学习模式,在复杂环境中做出决策的计算系统

2. AI 的三大学派

graph TD
    A[人工智能] --> B[符号主义 Symbolism]
    A --> C[连接主义 Connectionism]
    A --> D[行为主义 Behaviorism]

    B --> B1[知识表示与推理]
    B --> B2[专家系统]
    B --> B3[逻辑编程]

    C --> C1[神经网络]
    C --> C2[深度学习]
    C --> C3[大语言模型]

    D --> D1[强化学习]
    D --> D2[进化算法]
    D --> D3[机器人学]

    style B fill:#f9f,stroke:#333
    style C fill:#bbf,stroke:#333
    style D fill:#bfb,stroke:#333

2.1 符号主义(Symbolism)

  • 核心思想:智能 = 符号操作。用形式化的符号表示知识,用逻辑规则进行推理
  • 代表方法:专家系统、知识图谱、逻辑编程(Prolog)
  • 优势:可解释、可验证、知识可编码
  • 局限:知识获取瓶颈、难以处理不确定性和感知任务

2.2 连接主义(Connectionism)

  • 核心思想:智能来源于大量简单单元的连接。模拟神经元网络
  • 代表方法:人工神经网络、深度学习、Transformer
  • 优势:自动从数据中学习、擅长感知任务
  • 局限:需要大量数据、缺乏可解释性、高计算成本

2.3 行为主义(Behaviorism)

  • 核心思想:智能体通过与环境交互来学习行为。无需内部知识表示
  • 代表方法:强化学习、进化算法、群体智能
  • 优势:适合决策和控制问题、不需要标签数据
  • 局限:样本效率低、探索困难

延伸:Domingos 的 ML 五派分法 Pedro Domingos 在《The Master Algorithm》(2015) 中从 ML 内部视角把学习算法切成五派:Symbolists / Connectionists / Bayesians / Evolutionaries / Analogizers。这与上面三派分法正交互补:三派从"智能从哪里来"切,五派从"学习器用什么数学工具"切。详见 The Master Algorithm 笔记本


3. 图灵测试

3.1 原始图灵测试(1950)

┌──────────┐     文字对话     ┌──────────┐
│  人类评判者 │ ◄───────────→ │  被测试者  │
│           │                │ (人/机器)  │
└──────────┘                └──────────┘

规则:如果评判者无法可靠地区分被测试者是人还是机器,
      则认为机器通过了图灵测试。

3.2 图灵测试的局限

批评 论点
只测试模仿 模仿人类不等于拥有智能
仅限文字 忽略感知、运动等智能维度
人类偏见 评判者的期望影响结果
欺骗可能 ELIZA(1966)就能"欺骗"部分用户

4. 中文房间论证

Searle(1980)提出的思想实验:

房间外:中文输入 → [房间] → 中文输出

房间内:
  一个不懂中文的人
  + 一套详细的中文处理规则手册
  → 按规则机械地操作符号
  → 产生"正确"的中文回复

结论:虽然从外部看系统"理解"中文,
      但房间内的人并不理解中文的含义。
      → 语法处理 ≠ 语义理解

意义:强 AI(机器真正理解和思考)与弱 AI(机器模拟智能行为)的根本区分。


5. 弱 AI vs 强 AI

维度 弱 AI(Narrow AI) 强 AI(AGI)
能力范围 特定任务 通用智能
理解 无真正理解 具有理解和意识
当前状态 已实现 尚未实现
例子 AlphaGo、ChatGPT、自动驾驶 科幻中的 AI

超级智能(Superintelligence)

  • 定义:在几乎所有领域都远超人类最聪明个体的智能
  • Bostrom 观点:一旦实现 AGI,可能迅速递归自我改进到超级智能
  • 争议:是否可能?是否危险?时间框架?

6. AI 的当前格局

graph LR
    subgraph 感知
        A1[计算机视觉]
        A2[语音识别]
        A3[自然语言理解]
    end

    subgraph 推理与决策
        B1[知识图谱]
        B2[规划与搜索]
        B3[强化学习]
    end

    subgraph 生成
        C1[文本生成 LLM]
        C2[图像生成 Diffusion]
        C3[代码生成 Copilot]
    end

    subgraph 应用
        D1[自动驾驶]
        D2[医疗诊断]
        D3[科学发现]
        D4[AI Agent]
    end

    A1 & A2 & A3 --> B1 & B2 & B3
    B1 & B2 & B3 --> C1 & C2 & C3
    C1 & C2 & C3 --> D1 & D2 & D3 & D4

当前关键趋势

  1. 大语言模型(LLM):GPT-4、Claude、Gemini 展现了通用语言能力
  2. 多模态:统一处理文本、图像、音频、视频
  3. AI Agent:LLM 驱动的自主智能体,能使用工具和规划
  4. 科学 AI:AlphaFold(蛋白质结构)、GNoME(材料发现)
  5. 具身智能:将 AI 与物理世界交互结合

7. AI 的分类体系

分类维度 类别
按学习方式 监督学习、无监督学习、强化学习、自监督学习
按任务类型 分类、回归、生成、决策、推理
按模态 文本、视觉、语音、多模态
按应用领域 NLP、CV、机器人、推荐系统、科学计算
按智能水平 弱 AI → AGI → ASI

参考资料

  • "Artificial Intelligence: A Modern Approach" - Russell & Norvig
  • "Computing Machinery and Intelligence" - Alan Turing (1950)
  • "Minds, Brains, and Programs" - John Searle (1980)
  • "Superintelligence" - Nick Bostrom

评论 #