指令集架构（ISA）

1. ISA 的本质

指令集架构（Instruction Set Architecture）是硬件与软件之间的契约：

定义了处理器能执行哪些操作
定义了操作数如何存取
定义了指令如何编码为二进制

ISA 是一个抽象规范，与具体实现（微架构）无关。同一 ISA 可以有截然不同的微架构实现。

graph TB
    subgraph "软件层"
        A[高级语言 C/C++/Rust]
        B[编译器]
        C[汇编语言]
    end
    subgraph "ISA 契约层"
        D[指令集架构]
    end
    subgraph "硬件层"
        E[微架构实现 A]
        F[微架构实现 B]
        G[微架构实现 C]
    end

    A --> B --> C --> D
    D --> E
    D --> F
    D --> G

    style D fill:#fff9c4,stroke:#f9a825

2. ISA 分类

2.1 按操作数存放位置

类型	操作数来源	示例
栈架构	操作数隐式在栈顶	JVM 字节码
累加器架构	一个操作数隐式为累加器	早期 x86
寄存器-存储器	一个操作数可来自内存	x86
寄存器-寄存器（Load-Store）	操作数必须在寄存器中	ARM, RISC-V, MIPS

2.2 CISC vs RISC

graph LR
    subgraph "CISC 设计哲学"
        C1[复杂指令]
        C2[变长编码]
        C3[指令可直接操作内存]
        C4[丰富的寻址模式]
        C5[微码实现]
    end

    subgraph "RISC 设计哲学"
        R1[简单指令]
        R2[定长编码]
        R3[Load-Store 架构]
        R4[少量寻址模式]
        R5[硬连线控制]
    end

    C1 ---|对比| R1
    C2 ---|对比| R2
    C3 ---|对比| R3

特性	CISC（x86）	RISC（ARM/RISC-V）
指令长度	可变（1–15 字节）	固定（4 字节）
指令数量	数千条	数百条
访存指令	任意指令可访存	仅 Load/Store
寄存器数	较少（x86: 16 GPR）	较多（ARM: 31, RISC-V: 32）
译码复杂度	高（需微码）	低（硬连线）
代码密度	较高	较低（但 Thumb-2/RVC 缓解）

现代融合

现代 x86 处理器内部将 CISC 指令译码为 micro-ops（微操作），本质上在微架构层面执行 RISC 风格的操作。CISC vs RISC 的界限在微架构层已经模糊。

3. 主流 ISA 详解

3.1 x86 / x86-64

历史：Intel 8086（1978）→ IA-32 → AMD64/x86-64
特点：向后兼容性极强；变长指令编码（前缀 + 操作码 + ModR/M + SIB + 位移 + 立即数）
扩展：SSE → AVX → AVX-512（SIMD 向量扩展）
生态：桌面、服务器市场主导

3.2 ARM（AArch64 / ARMv9）

特点：定长 32-bit 指令；条件执行；高能效
寄存器：31 个 64-bit 通用寄存器（X0-X30）+ SP + PC
扩展：NEON（SIMD）、SVE/SVE2（可变长向量）
生态：移动设备主导；Apple Silicon、AWS Graviton 进入桌面/服务器

3.3 RISC-V

起源：UC Berkeley，2010 年启动
核心优势：开源、模块化、可扩展

RISC-V 采用模块化设计：

模块	名称	功能
RV32I/RV64I	基础整数	47 条基础指令
M	乘除	整数乘除法
A	原子操作	原子内存操作
F/D	浮点	单/双精度浮点
C	压缩	16-bit 压缩指令
V	向量	可变长向量扩展

常见组合：RV64GC = RV64I + M + A + F + D + C

RISC-V 的意义

RISC-V 之于处理器，类似 Linux 之于操作系统——开源生态打破 ISA 垄断，降低芯片设计门槛。

4. 指令编码

以 RISC-V RV32I 为例，所有指令固定 32 位，有 6 种基本格式：

R-type: [funct7(7)] [rs2(5)] [rs1(5)] [funct3(3)] [rd(5)] [opcode(7)]
I-type: [imm[11:0](12)]         [rs1(5)] [funct3(3)] [rd(5)] [opcode(7)]
S-type: [imm[11:5](7)] [rs2(5)] [rs1(5)] [funct3(3)] [imm[4:0](5)] [opcode(7)]
B-type: [imm(7)]       [rs2(5)] [rs1(5)] [funct3(3)] [imm(5)]      [opcode(7)]
U-type: [imm[31:12](20)]                              [rd(5)] [opcode(7)]
J-type: [imm(20)]                                     [rd(5)] [opcode(7)]

设计原则：

rs1、rs2、rd 在所有格式中位置固定 → 简化译码硬件
opcode 和 funct3/funct7 组合确定具体操作
立即数符号扩展，最高位始终在 bit 31 → 简化符号扩展电路

5. 寻址模式

寻址模式	操作数来源	示例（RISC-V 风格）
立即数寻址	指令中的常数	`addi x1, x2, 42`
寄存器寻址	寄存器内容	`add x1, x2, x3`
基址偏移寻址	寄存器 + 偏移量 → 内存地址	`lw x1, 8(x2)`
PC 相对寻址	PC + 偏移量	`beq x1, x2, label`

RISC-V 仅使用上述 4 种寻址模式，保持简洁。x86 则支持更复杂的模式如 [base + index*scale + displacement]。

6. 应用二进制接口（ABI）

ABI 定义了：

调用约定：参数如何传递（寄存器 vs 栈）、返回值位置
寄存器使用规则：caller-saved vs callee-saved
栈帧布局：局部变量、返回地址、帧指针

RISC-V ABI 寄存器约定

寄存器	ABI 名称	用途	保存者
x0	zero	硬连线零值	—
x1	ra	返回地址	Caller
x2	sp	栈指针	Callee
x5-x7	t0-t2	临时寄存器	Caller
x8	s0/fp	保存寄存器/帧指针	Callee
x10-x17	a0-a7	参数/返回值	Caller
x18-x27	s2-s11	保存寄存器	Callee
x28-x31	t3-t6	临时寄存器	Caller

7. 系统级 ISA 特性

7.1 特权级别

现代 ISA 定义多个特权级别以隔离软件层：

级别	RISC-V	x86	用途
最高特权	Machine (M)	Ring 0	固件/Hypervisor
中间	Supervisor (S)	Ring 0	操作系统内核
最低	User (U)	Ring 3	用户程序

7.2 中断与异常

中断（Interrupt）：外部异步事件（I/O 完成、定时器）
异常（Exception）：指令执行中的同步事件（缺页、非法指令、系统调用）
陷阱（Trap）：有意触发的异常（ecall / int 0x80 用于系统调用）

处理流程：保存 PC → 切换特权级 → 跳转到处理程序 → 恢复执行

7.3 内存模型

定义多核环境下内存访问的可见性顺序：

顺序一致性（Sequential Consistency）：最直观，性能开销大
TSO（Total Store Order）：x86 默认，允许 Store-Load 重排
弱序（Weak Ordering）：ARM/RISC-V 默认，需 fence 指令保证顺序

\[ \text{SC} \subset \text{TSO} \subset \text{Weak Ordering} \]

（约束从强到弱，性能潜力从低到高）

8. ISA 设计权衡

设计决策	取舍
指令长度固定 vs 可变	译码简单 vs 代码密度
寄存器数量多 vs 少	减少访存 vs 增大指令编码位宽
复杂指令 vs 简单指令	单条指令功能强 vs 流水线友好
强内存序 vs 弱内存序	编程简单 vs 硬件优化空间大
专用扩展 vs 通用指令	特定场景性能 vs ISA 简洁性

导航