Yutong's Site

[中文] Operating Systems Notes: 07 - 文件系统

Wed, 23 Apr 2025 02:09:00 GMT

import { Aside } from '@/components/user'

Model: gemini-2.5-pro-exp-03-25

This article uses LLM to improve efficiency, which can make mistakes. I have tried my best to check and proofread, but still cannot guarantee complete accuracy.

For personal use, may be nagging for you.

0. 引言与基本问题

0.1 核心问题

怎样理解"文件系统是对磁盘的抽象"这句话?
- 解释: 磁盘就像一个巨大的、没有任何组织的仓库 (物理存储) , 里面存放着无数的字节数据, 地址可能是某个盘片、某个磁道、某个扇区. 直接管理这个仓库是非常复杂的. 文件系统就像一个仓库管理员, 它提供了一套管理方法和视图 (逻辑结构) , 将杂乱无章的字节组织成一个个有名字、有结构的文件和文件夹 (目录) . 用户只需要告诉管理员想要哪个文件 (通过文件名) , 管理员就会负责找到文件在哪里、如何读取出来, 用户无需关心仓库底层的物理细节. 这种隐藏底层复杂性, 提供更高层、更易用接口的过程, 就是"抽象".
从用户角度怎样看文件系统的功能?
- 回答: 对用户来说, 文件系统是一个工具箱, 可以用来：
  - 组织信息: 创建文件夹 (目录) 来分类存放文件.
  - 存储信息: 创建文件 (如文档、图片、程序) , 将数据保存进去.
  - 检索信息: 通过文件名或路径找到需要的文件.
  - 修改信息: 打开文件, 编辑内容, 然后保存.
  - 管理信息: 复制、移动、删除、重命名文件或文件夹.
  - 控制访问: 设置文件的权限, 决定谁可以读取、写入或执行文件.
从系统的角度看待文件系统如何实现?
- 回答: 从操作系统的角度, 文件系统是一个复杂的软件模块, 需要完成以下任务：
  - 元数据管理: 为每个文件维护详细信息 (如文件名、大小、创建时间、存储位置等) , 通常存储在像FCB或inode这样的数据结构中.
  - 命名空间管理: 实现目录结构 (如树形结构) , 并将用户提供的文件名 (路径) 映射到对应的文件元数据.
  - 存储空间管理: 跟踪磁盘上哪些空间是空闲的、哪些已被占用, 并在需要时分配空闲空间给文件, 在文件删除时回收空间.
  - 数据存储与检索: 实现文件的物理存储方式 (连续、链接、索引等) , 并根据元数据中的地址信息, 将用户对文件逻辑位置 (如第100个字节) 的访问请求转换为对磁盘物理块的读写操作.
  - 数据一致性与可靠性: 确保文件操作 (尤其是涉及多个步骤的操作) 要么完全成功, 要么完全失败 (原子性) , 并在系统崩溃后能恢复到一致状态 (如通过日志) .
  - 性能优化: 使用缓存、预读、合理的块分配策略等技术提高文件访问速度.
  - 接口提供: 向应用程序提供标准的系统调用接口 (如 open, read, write, close, seek) .
文件系统还要考虑哪些需求?
- 回答: 除了基本功能, 现代文件系统还需关注：
  - 性能: 读写速度、处理大量小文件或大文件的效率.
  - 安全性: 防止未授权访问 (权限控制) 、数据加密.
  - 可靠性/容错性: 数据冗余 (如RAID) 、错误检测与恢复、日志功能防止意外中断导致数据损坏.
  - 可扩展性: 支持大容量磁盘和海量文件.
  - **并发控制:**允许多个进程同时访问文件系统而不会相互干扰或破坏数据.
文件系统与其他操作系统功能的接口?
- 回答: 文件系统不是孤立的, 它需要与OS其他部分紧密协作：
  - I/O子系统: 文件系统最终需要通过I/O子系统向设备驱动程序发出指令, 来读写物理存储设备 (如磁盘、SSD) .
  - 内存管理: 文件系统广泛使用内存缓存 (Buffer Cache / Page Cache) 来提高性能, 减少磁盘I/O次数. 数据的读写通常先经过内存缓存.
  - 进程管理: 文件系统需要管理每个进程打开的文件 (如通过文件描述符表) , 维护进程的当前工作目录等.

0.2 本章要求掌握的概念

(这些是学习本章后需要理解的核心术语)

文件系统 (File System)
文件 (File)
文件分类 (File Classification)
文件控制块 (File Control Block, FCB)
文件目录 (File Directory)
目录文件 (Directory File)
文件系统布局 (File System Layout)
文件逻辑结构 (File Logical Structure)
文件物理结构 (File Physical Structure)
文件描述符/文件句柄 (File Descriptor/Handle)
FAT/UNIX (File System Examples)
文件基本操作 (Basic File Operations)
内存结构 (In-memory Structures)
文件共享 (File Sharing)
磁盘空间管理 (Disk Space Management)

0.3 本章内容大纲

(本章将围绕以下主题展开)

文件和文件目录
文件系统的实现
文件系统实例 (FAT、UNIX)
Windows文件系统 NTFS
文件系统的管理
文件系统的性能
文件系统结构

1. 文件系统基础概念

1.1 文件 (File)

核心定义: 文件是操作系统对持久性存储介质 (主要是磁盘) 上存储数据的一种抽象. 它将底层存储的物理细节 (如扇区、磁道) 隐藏起来, 提供给用户一个逻辑上的、带名字的数据单元.
逻辑视图: 文件被视为一组带标识 (文件名) 的、在逻辑上有完整意义的信息项的序列.
- 信息项: 可以是字节、字符、记录 (如数据库中的一行) 等, 具体取决于文件的类型和用途. 关键在于它们是有序的.
- 意义: 文件存储什么内容、这些内容如何解释 (是文本、图像还是程序？) , 是由创建和使用该文件的用户或应用程序决定的, 文件系统本身通常不关心.
读写指针: 文件系统通常为每个打开的文件维护一个内部指针, 指示下一次读或写操作应该在文件的哪个位置进行. 这个指针会随着读写操作自动移动.
Unix/Linux的哲学 - "万物皆文件":
- 这是一个极具影响力的设计思想. 在Unix/Linux中, 不仅普通的用户数据存储在文件中, 系统中的许多其他资源也被抽象成了文件.
- 例子:
  - 硬件设备: 磁盘分区 (/dev/sda2)、终端 (/dev/tty2)、打印机等都表现为 /dev 目录下的特殊文件. 对这些文件进行读写操作就相当于与对应的硬件设备交互.
  - 内核信息: 内核本身 (/boot/vmlinuz...) 和内核运行时的状态、参数 (/proc 目录下的各种"文件") 也都以文件形式存在.
- 好处: 提供了统一的访问接口. 应用程序可以使用相同的系统调用 (open, read, write, close) 来处理普通文件、设备、管道等, 大大简化了编程模型.

1.2 文件系统 (File System)

定义: 文件系统是操作系统中负责管理文件 (即管理持久性数据) 的子系统. 它是硬件 (磁盘) 和用户/应用程序之间的桥梁.
核心功能:
- 组织与管理: 统一管理存储介质上的信息资源, 提供文件的存储、检索、更新机制.
- 共享与保护: 允许多个用户安全、可靠地共享文件, 并提供权限控制机制.
- 易用性: 提供一个方便用户使用的接口 (命令行、图形界面) 和管理工具.
具体职责 (更详细):
- 空间管理: 像一个地产商, 管理磁盘这块"土地", 知道哪些"地块" (磁盘块) 空着, 哪些已经"盖了房子" (被文件占用) . 负责"批地" (分配块) 和"拆迁回收" (回收块) .
- 命名与定位: 实现"按名存取". 用户提供一个"地址" (文件名或路径) , 文件系统负责找到对应的"房子" (文件数据) 在磁盘上的实际物理位置. 这是一个从逻辑名字到物理地址的映射过程.
- 共享与安全: 允许多人"合租"一个文件 (共享) , 并设置门禁 (权限控制) , 保证数据的安全和可靠.
- 用户接口: 提供一套标准的操作工具 (系统调用) , 让用户能方便地"建房子" (创建文件) 、"装修" (写入数据) 、"查看" (读取数据) 、"改名" (重命名) 、"拆除" (删除文件) 等.
- 性能优化: 通过缓存、预读、合理的布局等手段, 让文件的读写尽可能快.
- 设备无关性: 与I/O子系统协作, 使得上层应用不需要关心底层是HDD、SSD还是其他存储设备.

1.3 文件分类 (按UNIX)

(这是UNIX/Linux系统中常见的文件类型, 可以通过 ls -l 命令的第一个字符看到)

- 普通文件 (Regular File): 最常见的文件类型, 包含用户数据. 可以是文本文件 (ASCII/UTF-8) 、二进制文件 (可执行程序、图片、音视频) . 内容由应用程序解释.
d 目录文件 (Directory File): 特殊的文件, 其内容是该目录下包含的文件和子目录的列表 (目录项) . 它提供了文件系统的层级结构.
c 字符特殊文件 (Character Special File): 用于与字符设备 (一次传输一个字符, 无缓冲) 进行交互的文件. 例如：
- 终端 (/dev/tty1)
- 串口 (/dev/ttyS0)
- 空设备 (/dev/null)：写入它的数据被丢弃, 读取它得到文件结束符.
- 随机数生成器 (/dev/random, /dev/urandom)
b 块特殊文件 (Block Special File): 用于与块设备 (一次传输固定大小的数据块, 有缓冲) 进行交互的文件. 例如：
- 硬盘驱动器 (/dev/sda, /dev/nvme0n1)
- 磁盘分区 (/dev/sda1)
- 光驱 (/dev/sr0)
p 管道文件 (Pipe File / FIFO): 用于实现进程间通信. 一个进程写入管道的数据可以被另一个进程读取, 遵循"先进先出" (FIFO) 原则.
s 套接字 (Socket): 用于网络通信或本地进程间通信. 网络通信的端点.
l 符号链接文件 (Symbolic Link File): 包含指向另一个文件或目录的路径名. 访问符号链接时, 系统会沿着它指向的路径去访问目标. 类似于Windows快捷方式.

1.4 文件属性与文件控制块 (FCB)

文件属性 (Metadata): "关于文件的数据", 描述文件本身特征的信息, 而不是文件内容.
文件控制块 (File Control Block, FCB):
- 核心数据结构: 操作系统为了管理文件而创建和维护的一个内部数据结构. 每个文件都有一个对应的FCB.
- 内容: 存储了该文件的所有属性信息. 可以理解为文件的"身份证"或"档案".
- 位置: FCB通常存储在磁盘上, 当文件被打开时, 其FCB (或部分信息) 会被加载到内存中.
常用属性 (FCB中包含的信息):
- 标识信息:
  - 文件名 (用户可见的名字)
  - 文件内部标识符 (文件号/inode号, 系统内部使用的唯一ID)
- 所有权与权限:
  - 创建者ID、当前拥有者ID、用户组ID
  - 访问权限 (如读、写、执行权限, 通常分为拥有者、用户组、其他用户三类)
  - 口令 (较少见, 用于额外保护)
- 结构与类型:
  - 文件类型 (普通、目录、特殊文件等)
  - 文件逻辑结构 (流式、记录式等)
  - 文件物理结构 (连续、链接、索引)
- 存储信息:
  - 文件大小 (字节数)
  - 文件地址: 指向文件数据在磁盘上存储位置的关键信息 (如：起始块号和长度；或指向第一个块的指针；或指向索引块的指针). 这是FCB最重要的部分之一.
- 时间戳:
  - 创建时间
  - 最后修改时间
  - 最后访问时间
- 管理信息:
  - 共享计数 (有多少进程打开了这个文件)
  - 各种标志位: 只读、隐藏、系统、归档 (备份标记)、ASCII/二进制、顺序/随机访问、临时文件、锁状态等.

2. 文件结构与访问

2.1 文件的逻辑结构

定义: 从用户视角看, 文件内部的数据是如何组织的. 这决定了用户如何访问文件内容 (是按字节流、按记录, 还是按某种结构化方式) . 它与文件如何在磁盘上物理存储 (物理结构) 是不同的概念.
常见类型:
- 流式文件 (Stream File):
  - 结构: 文件被看作一个无结构的、连续的字节序列. 这是最简单、最通用的逻辑结构.
  - 访问: 通常按字节顺序读写, 也可以通过 seek 操作定位到任意字节位置进行随机访问.
  - 例子: UNIX/Linux 文件、C语言标准I/O流处理的文件.
- 记录式文件 (Record File):
  - 结构: 文件由一系列逻辑记录组成. 记录可以是定长的, 也可以是变长的.
  - 访问: 通常按记录为单位进行读写. 可以顺序访问记录, 或 (如果支持) 直接访问第 N 条记录.
  - 例子: 某些数据库文件、COBOL等语言处理的商业数据文件.
- 其他结构化文件:
  - 堆 (Heap): 记录无序存放, 通常用于临时存储或需要快速插入的场景.
  - 顺序文件: 记录按某个键值有序排列. 适合顺序处理, 随机访问效率低.
  - 索引文件: 包含一个或多个索引, 根据键值快速定位记录. 索引本身可能是一个小文件或文件的一部分.
  - 索引顺序文件 (Indexed Sequential File): 结合了顺序存储和索引, 既支持高效的顺序处理, 也支持较快的随机访问.
  - 散列文件 (Hashed File): 通过散列函数将记录键值映射到存储地址, 提供非常快的随机访问速度, 但可能存在冲突和空间浪费问题.

2.2 文件的访问方式

顺序存取 (Sequential Access):
- 方式: 文件信息按其逻辑顺序 (字节或记录) 被依次处理. 读写指针自动向前移动.
- 特点: 最简单、最常用. 适用于大多数文件处理场景. 磁带等设备只支持顺序访问.
- 例子: 编辑文本文件、编译源代码、播放音视频.
随机存取 (Random Access) / 直接存取 (Direct Access):
- 方式: 可以不按顺序, 直接读写文件中的任意位置 (字节或记录) .
- 前提: 文件系统需要提供定位操作 (如 seek) , 允许程序显式地移动读写指针到指定位置.
- 特点: 效率取决于文件的物理结构. 对于采用连续或索引结构的文件, 随机访问效率较高；对于链接结构, 效率很低.
- 例子: 数据库文件访问 (快速定位到某条记录) 、编辑大型文件的中间部分.

3. 存储介质与文件物理结构

3.1 存储介质与物理块

存储介质: 文件最终需要存储在物理设备上, 这些设备具有持久性 (断电后数据不丢失) .
- 常见类型: 机械硬盘 (HDD)、固态硬盘 (SSD)、U盘 (Flash Drive)、光盘 (CD/DVD/Blu-ray)、磁带.
磁盘结构 (HDD - Hard Disk Drive):
- 物理组成: 由一个或多个高速旋转的盘片 (Platter) 叠加而成, 盘片表面涂有磁性材料. 每个盘面都有一个对应的读写磁头 (Head), 安装在可移动的磁臂 (Arm) 上.
- 数据组织:
  - 磁道 (Track): 盘面上的同心圆.
  - 扇区 (Sector): 磁道被划分为若干个弧形小段, 是磁盘物理读写的最小单位 (传统为512字节, 现在也有4KB的). 扇区包含数据本身, 以及用于定位和校验的额外信息 (如扇区头、ECC) .
  - 柱面 (Cylinder): 所有盘面上半径相同的磁道组成的虚拟圆柱. 磁头臂一次移动到位后, 可以访问同一柱面上的所有磁道, 无需再次寻道, 因此访问同一柱面的数据效率较高.
- 物理地址: 传统上用 (柱面号, 磁头号, 扇区号) 来定位一个物理扇区.
物理块 (Block) / 簇 (Cluster):
- 文件系统的视角: 文件系统为了方便管理, 不直接操作物理扇区, 而是将磁盘空间划分为若干个大小相等的逻辑单元, 称为块 (Block) 或 簇 (Cluster).
- 定义: 一个块/簇通常包含一个或多个连续的物理扇区 (大小通常是2的幂, 如512B, 1KB, 2KB, 4KB, 8KB...) .
- 作用: 块/簇是文件系统进行空间分配、数据传输、寻址的基本单位. 文件占用的空间是块/簇的整数倍.
- 选择块大小的影响:
  - 小块: 空间利用率高 (内部碎片少) , 但管理开销大 (需要更多元数据来跟踪小块) , 访问文件可能需要更多次I/O.
  - 大块: 管理开销小, 读写大文件效率高 (一次I/O传输更多数据) , 但空间浪费可能严重 (内部碎片多, 一个小文件也要占用一个大块) .
- 寻址: 文件系统使用逻辑块号 (LBA - Logical Block Addressing) 来访问这些块, 屏蔽了底层的物理地址 (柱面/磁头/扇区或 SSD内部地址) .
磁盘访问时间 (HDD): 一次磁盘I/O操作的时间主要由三部分构成：
1. 寻道时间 (Seek Time): 移动磁臂将磁头定位到目标磁道所需的时间. 这是最主要的耗时部分, 通常是毫秒级.
2. 旋转延迟 (Rotational Latency): 等待磁盘旋转, 使得目标扇区的起始位置到达磁头下方所需的时间. 取决于磁盘转速, 平均为旋转一周时间的一半. 也是毫秒级.
3. 数据传输时间 (Transfer Time): 数据在磁盘和内存之间实际传输所需的时间. 取决于传输数据量和磁盘传输速率, 通常远小于前两者.
- 优化关键: 减少寻道次数和旋转延迟是提高磁盘I/O性能的关键. 文件系统设计 (如块的物理布局) 会直接影响这些时间.
SSD vs HDD 寻址:
- LBA (Logical Block Addressing): 操作系统 (文件系统) 与存储设备交互时使用的地址. 它是一个线性的、从0开始编号的逻辑块地址空间.
- PBA (Physical Block Address): 存储设备内部实际存储数据的物理位置.
- LBA到PBA的映射:
  - HDD: 映射相对固定和简单, LBA地址可以通过公式大致计算出对应的柱面、磁头、扇区.
  - SSD: SSD内部结构复杂 (由闪存页、块组成, 有擦写次数限制) . FTL (Flash Translation Layer) 是SSD控制器中的一个关键固件层, 负责管理LBA到PBA的动态映射. FTL进行磨损均衡 (Wear Leveling) (将写操作分散到不同物理块, 延长寿命) 和垃圾回收 (Garbage Collection) (回收无效数据页所在的块以便重新写入) , 因此同一个LBA可能在不同时间映射到不同的PBA. 这对文件系统是透明的.

3.2 文件的物理结构 (磁盘空间分配方式)

定义: 指文件的数据块在磁盘上是如何组织和存放的. 这直接影响文件的访问效率和存储空间的利用率.
核心问题: 如何为文件的逻辑块序列分配物理磁盘块？

3.2.1 连续结构 (顺序分配 / Contiguous Allocation)

方式: 将文件所需的所有物理块连续地分配在一起.
FCB记录: 只需记录文件的起始物理块号和文件的总长度 (块数).
优点:
- 实现简单: 管理开销小.
- 访问速度快:
  - 顺序访问: 磁头只需一次寻道定位到起始块, 然后可以连续读取, 无需额外寻道和旋转延迟.
  - 随机访问: 可以通过简单的计算 (起始块号 + 逻辑块号) 直接得到物理块号, 定位速度快.
缺点:
- 文件大小需预知: 创建文件时通常需要指定文件大小, 以便分配足够的连续空间.
- 文件动态增长困难: 如果文件需要扩展超出预留空间, 很难找到相邻的足够大的连续空闲区. 可能需要移动整个文件到别处, 开销巨大.
- 外部碎片 (External Fragmentation): 随着文件的创建和删除, 磁盘上会产生许多不连续的小空闲块. 即使空闲总空间足够, 也可能因为找不到足够大的连续空闲区而无法创建新文件. 需要运行磁盘碎片整理程序来合并空闲空间, 但这很耗时.
- 存储空间浪费: 即使预分配了空间, 如果文件实际大小小于预分配大小, 剩余部分也无法被其他文件使用 (除非文件被删除) .

3.2.2 链接结构 (链式分配 / Linked Allocation)

方式: 将组成文件的物理块分散地存放在磁盘各处, 通过在每个块中设置一个指针指向下一个物理块, 将这些块链接成一个链表.
FCB记录: 只需记录文件的起始物理块号和结束物理块号 (或者只记录起始块号, 文件结束通过块内特殊指针值判断) .
优点:
- 解决了外部碎片问题: 可以利用任何位置的空闲块, 提高了磁盘空间利用率.
- 文件动态增长容易: 只需在链表末尾追加新的空闲块即可.
- 插入删除相对方便: (理论上) 只需修改相邻块的指针.
缺点:
- 仅适合顺序访问: 随机访问效率极低. 要访问第 N 块, 必须从第一块开始, 沿着指针链顺序访问 N-1 次才能找到.
- 可靠性差: 链表中任何一个指针损坏或丢失, 都会导致后续所有数据丢失.
- 指针开销: 每个块都需要额外空间存储指针, 降低了实际数据存储空间.
- 寻道次数多: 由于块物理上不连续, 读取文件时磁头可能需要频繁移动, 访问速度慢.
变形：文件分配表 (FAT - File Allocation Table)
- 核心思想: 将所有块的链接指针集中存放在磁盘开头的一个特殊区域 (FAT表) , 而不是分散在每个数据块内部.
- 结构: FAT表是一个大数组, 数组的下标对应磁盘数据区的物理块 (簇) 号. 数组单元的内容则表示该块的下一块的块号.
- FCB记录: 只需记录文件的起始块 (簇) 号.
- FAT表项值:
  - 0: 表示该块未使用 (空闲) .
  - 下一个块号: 指向文件逻辑上的下一块.
  - 文件结束标记 (如-1, FFF, FFFFFFFF): 表示这是文件的最后一个块.
  - 坏块标记: 表示该块已损坏, 不可用.
- 优点:
  - 随机访问性能改善: 要访问第 N 块, 只需在内存中 (如果FAT表已缓存) 查找FAT表 N-1 次即可找到块号, 无需访问数据块本身.
  - 指针不占用数据块空间.
- 缺点:
  - FAT表可能很大: 需要占用额外的磁盘空间. 为了提高效率, FAT表通常需要全部或部分加载到内存中.
  - 访问文件仍需两次访问: 第一次访问FAT表确定物理块号, 第二次才访问实际数据块.
  - 可靠性: FAT表是关键数据结构, 损坏会导致整个文件系统瘫痪 (因此通常有备份FAT) .

3.2.3 索引结构 (索引分配 / Indexed Allocation)

方式: 为每个文件创建一个索引块 (Index Block) (或称为索引表) . 索引块中存储一个地址数组, 数组的每个元素指向文件占用的一个物理数据块. 文件的数据块可以分散存储在磁盘各处.
FCB记录: 只需记录该文件的索引块的地址.
优点:
- 支持高效的随机访问: 要访问文件的第 N 个逻辑块, 只需读取索引块, 从中直接获取第 N 个物理块的地址, 然后访问该物理块即可.
- 没有外部碎片问题: 可以利用任何空闲块.
- 文件动态增长容易: 只需分配新的数据块, 并在索引块中添加指向新块的条目. (但索引块本身可能需要扩展) .
缺点:
- 索引块开销: 每个文件都需要一个或多个索引块, 这占用了额外的磁盘空间. 对于非常小的文件, 索引块的空间开销可能比文件数据本身还大.
- 访问开销: 访问文件数据至少需要两次磁盘访问：一次读取索引块, 一次读取实际数据块. 对于小文件, 这比连续分配效率低.
处理大文件的索引表组织方式: 当一个文件非常大, 其所有数据块的地址无法放在一个索引块中时, 需要扩展索引机制：
- 链接索引块 (Linked Index Blocks): 将多个索引块链接起来. FCB指向第一个索引块, 每个索引块包含指向下一个索引块的指针. 缺点是访问后面的数据块需要遍历索引块链.
- 多级索引 (Multilevel Index): 建立索引的索引. 例如, 两级索引：FCB指向一个一级索引块, 一级索引块中的每个条目指向一个二级索引块, 二级索引块中的条目才指向实际的数据块. 级数可以继续增加. 优点是支持非常大的文件, 且访问任意块所需的最大索引查找次数是固定的 (等于级数) .
- 综合模式 / 混合索引 (Combined Scheme - 如UNIX i-node):
  - 思想: 结合直接地址和间接 (多级) 索引的优点.
  - 结构 (典型i-node):
    - 直接块指针 (Direct Blocks): i-node 中直接包含 N 个 (如12个) 指针, 分别指向文件的前 N 个数据块. 访问这些块只需要一次间接访问 (读i-node) + 一次直接访问 (读数据块) .
    - 一级间接指针 (Single Indirect): i-node 中有一个指针, 指向一个索引块, 该索引块包含 M 个指向数据块的指针. 访问这些块需要两次间接访问 (i-node -> 一级索引块 -> 数据块) .
    - 二级间接指针 (Double Indirect): i-node 中有一个指针, 指向一个一级索引块, 该块包含 M 个指向二级索引块的指针, 每个二级索引块又包含 M 个指向数据块的指针. 访问需三次间接访问.
    - 三级间接指针 (Triple Indirect): 再加一层间接. 访问需四次间接访问.
  - 优点:
    - 小文件访问快: 大部分文件较小, 可以直接通过直接块指针快速访问.
    - 支持大文件: 多级间接索引可以支持非常巨大的文件.
    - 结构相对紧凑: i-node 本身大小固定.
  - 计算示例: 假设块大小为 4KB (4096 B), 块地址为 4B. 一个索引块可以存放 $4096 / 4 = 1024$ 个地址 (M=1024). i-node 有 12 个直接指针, 1个一级、1个二级、1个三级间接指针.
    - 直接块: $12 \times 4KB = 48 KB$
    - 一级间接: $1024 \times 4KB = 4 MB$
    - 二级间接: $1024 \times 1024 \times 4KB = 4 GB$
    - 三级间接: $1024 \times 1024 \times 1024 \times 4KB = 4 TB$
    - 最大文件大小约为 4TB + 4GB + 4MB + 48KB.

4. 文件目录

文件目录 (File Directory):
- 作用: 文件系统用于组织和管理文件的核心机制. 它提供了从文件名到文件属性和位置信息的映射.
- 逻辑结构: 通常表现为层次结构 (树形) , 方便用户组织文件.
- 实现: 本质上是一个符号表, 存储了文件名与其对应文件控制信息 (FCB或inode) 之间的关联.
目录项 (Directory Entry):
- 定义: 目录文件中的基本组成单位. 每个目录项代表目录下的一个文件或子目录.
- 内容: 通常至少包含两部分信息：
  1. 文件名: 用户看到的名字.
  2. 文件属性或其指针: 指向该文件/子目录的 FCB 或 inode (或其编号) . 可能还包含少量常用属性 (如文件类型) 以加速某些操作.
目录文件 (Directory File):
- 存储: 文件目录本身也需要持久化存储在磁盘上. 操作系统通常将目录实现为一种特殊类型的文件, 称为目录文件.
- 内容: 目录文件的内容就是一系列的目录项.
- 访问: 对目录的操作 (如创建文件、删除文件、列出目录内容) 实际上就是对相应目录文件的读写操作. 但为了维护文件系统的一致性, 通常只允许操作系统内核直接修改目录文件, 应用程序通过系统调用间接访问.

4.2 目录结构

树形目录结构 (Tree-structured Directory):
- 结构: 目前操作系统最广泛采用的目录结构. 有一个根目录 (Root Directory) 作为起点, 每个目录可以包含文件和其他子目录, 形成一个倒置的树状结构.
- 优点: 结构清晰, 易于组织和管理文件, 不同用户可以拥有自己的子目录, 文件名只需在同一目录下唯一.
- 关键概念:
  - 路径名 (Pathname): 从根目录或当前目录出发, 到达指定文件或目录所经过的目录序列. 是文件/目录在树中的唯一标识.
    - 绝对路径名 (Absolute Pathname): 从根目录开始的完整路径, 通常以特定字符开头 (如 / in Unix/Linux, C:\ in Windows) . 示例: /home/user/documents/report.txt
    - 相对路径名 (Relative Pathname): 从当前工作目录开始的路径. 不以根目录起始符开头. 示例: 如果当前目录是 /home/user, 则相对路径 documents/report.txt 指向与上面绝对路径相同的文件.
  - 当前目录 (Current Directory) / 工作目录 (Working Directory): 每个运行的进程都有一个关联的当前目录. 当用户使用相对路径名时, 系统会从这个目录开始查找. 用户可以通过命令 (如 cd) 改变当前目录.
目录操作 (常用系统调用或命令):
- mkdir / CreateDirectory: 创建一个新的空目录.
- rmdir / RemoveDirectory: 删除一个空目录.
- opendir: 打开一个目录以准备读取其内容. 返回一个目录流指针.
- readdir: 读取目录流中的下一个目录项.
- closedir: 关闭先前打开的目录流.
- rename: 重命名文件或目录, 或将其移动到同一文件系统下的另一个目录.
- link: 创建一个指向现有文件的新链接 (硬链接) .
- unlink / remove: 删除一个文件名 (目录项) . 如果是硬链接, 减少链接计数；如果是最后一个链接, 则删除文件.
- ls / dir: 列出目录内容.
示例：解析文件名 /User_B/Draw/ABC (在提供的示例图中)
1. 从根开始: 文件系统从已知的根目录 (或主控目录 Master Directory) 的目录文件开始查找.
2. 查找 User_B: 在根目录文件中搜索名为 "User_B" 的目录项.
3. 进入 User_B: 找到该项, 获取它指向的 "User_B" 目录文件的位置 (比如起始块号或inode号) . 读取 "User_B" 目录文件.
4. 查找 Draw: 在 "User_B" 目录文件中搜索名为 "Draw" 的目录项.
5. 进入 Draw: 找到该项, 获取 "Draw" 目录文件的位置并读取.
6. 查找 ABC: 在 "Draw" 目录文件中搜索名为 "ABC" 的文件项.
7. 定位文件: 找到该项, 获取文件 "ABC" 的FCB或inode信息. 至此, 文件名解析完成, 系统知道了访问文件 "ABC" 所需的所有元数据.

4.3 目录文件的组织方式

顺序表 (Linear List):
- 方式: 将目录项一个接一个地顺序存放在目录文件中. 可以是定长记录 (简单) 或变长记录.
- 优点: 实现简单.
- 缺点:
  - 查找效率低: 需要线性扫描目录项来查找特定文件名, 对于大目录非常慢 (O(n)).
  - 删除复杂: 删除目录项可能需要在文件中留下空洞, 或者需要移动后续项来填补空洞.
  - 插入复杂: 如果保持有序, 插入可能需要移动大量项.
散列表 (Hash Table):
- 方式: 使用文件名作为键, 通过散列函数计算出一个索引值, 直接定位到散列表中的一个桶 (slot) . 目录项存储在对应的桶中.
- 冲突处理: 如果多个文件名散列到同一个桶, 需要使用链表或其他方法解决冲突.
- 优点: 查找速度非常快 (平均 O(1)) .
- 缺点: 需要设计好的散列函数和冲突解决策略. 表的大小需要预估. 删除操作相对简单.
B树 / B+树:
- 方式: 使用平衡树结构 (特别是B+树) 来组织目录项. 目录项按文件名排序存储在树的叶子节点中.
- 优点:
  - 查找、插入、删除效率都较高且稳定 (O(log n)).
  - 支持范围查询 (按字母顺序列出文件).
  - 树结构可以动态增长和收缩.
- 缺点: 实现相对复杂.
- 应用: 现代文件系统 (如 NTFS, ext4, APFS) 常用 B 树或 B+ 树来组织目录.

4.4 文件目录检索

核心任务: 将用户提供的文件名 (可能带路径) 转换为文件在磁盘上的物理位置.
过程: 分为两个主要步骤：
1. 目录检索 (Directory Lookup / Name Resolution):
  - 输入: 文件路径名 (绝对或相对) .
  - 过程: 文件系统根据路径名, 从根目录或当前目录开始, 逐级在目录文件中查找路径中的每个分量 (目录名或最终的文件名) , 直到找到目标文件或目录对应的目录项/FCB/inode.
  - 输出: 目标文件的 FCB 或 inode (或其在磁盘上的地址) .
2. 文件寻址 (File Addressing):
  - 输入: 目录检索找到的 FCB 或 inode, 以及用户想要访问的文件内逻辑地址 (如字节偏移量或逻辑块号) .
  - 过程: 根据 FCB/inode 中记录的文件物理结构信息 (起始块号、块链指针、索引表地址等) , 计算出该逻辑地址对应的物理磁盘块号和块内偏移.
  - 输出: 最终要读写的物理磁盘地址.

动机: 目录检索是文件访问的必经之路, 其效率直接影响系统性能. 如果目录文件很大 (因为FCB包含很多信息) , 线性搜索会很慢.
解决方案：目录项分解法 (以UNIX i-node为例)
- 思想: 将原来庞大的 FCB 拆分成两部分, 减小目录文件的大小.
- 拆分:
  1. 符号目录项 (Symbolic Directory Entry): 只包含最基本的查找信息：文件名 和指向完整文件信息的文件号 (i-node number). 这部分非常小.
  2. 基本目录项 (Inode / Basic FCB): 包含除文件名外的所有其他文件属性 (权限、大小、时间戳、磁盘地址等) .
- 存储:
  - 目录文件: 只存储符号目录项的列表. 由于符号项很小, 一个磁盘块可以容纳很多项, 整个目录文件占用的块数大大减少.
  - i-node区 (Inode Table): 所有文件的基本目录项 (i-node) 集中存放在磁盘的一个或多个专用区域. 可以通过 i-node 号快速定位并读取对应的 i-node.
- 查找过程:
  1. 在 (较小的) 目录文件中查找文件名, 获取对应的 i-node 号. 这一步访盘次数较少.
  2. 根据 i-node 号, 直接去磁盘上的 i-node 区读取完整的 i-node 信息. 这一步通常只需要一次额外的访盘.
- 优点:
  - 显著减少目录检索时的平均访盘次数: 因为大部分查找工作是在较小的目录文件中进行的.
  - **提高了查找速度. **
  - 方便文件共享 (硬链接) ： 多个目录项可以包含相同的 i-node 号, 指向同一个 i-node.
- 计算示例对比: (课件中的例子, 说明效果)
  - 分解前: FCB=48B, 块大小=512B, 目录有128项. 需13块存目录. 平均查找访盘 ≈ (1+13)/2 = 7 次.
  - 分解后: 符号项=8B, 基本项(inode)=42B.
    - 符号目录文件只需 2 块 ($128 \times 8 / 512 = 2$).
    - 基本项(i-node)集中存放 (假设需11块, 但这部分查找是直接按号定位) .
    - 查找过程：平均读 $\frac{1+2}{2} = 1.5$ 次目录块 + 1 次 i-node 块 ≈ 2.5 次访盘.
  - 结论: 访盘次数从 7 次减少到 2.5 次, 效率大幅提升.

5. 文件系统的实现

5.1 概述

挑战: 如何在磁盘这种线性存储介质上高效地实现文件和目录的抽象, 并管理好存储空间.
核心考虑:
- 磁盘布局 (On-Disk Layout): 文件系统如何在磁盘分区上组织其自身的控制信息 (元数据) 和用户数据？引导信息放哪里？目录怎么存？文件数据怎么存？空闲空间怎么记录？
- 内存结构 (In-Memory Structures): 当文件被访问时, 操作系统需要在内存中维护哪些数据结构来加速访问、跟踪状态、管理并发？

5.2 相关术语

磁盘分区 (Partition): 将一个物理磁盘 (如 HDD 或 SSD) 在逻辑上划分为一个或多个独立的区域. 每个分区可以安装不同的操作系统或格式化成不同的文件系统. 分区信息通常记录在磁盘的主引导记录 (MBR) 或 GUID 分区表 (GPT) 中.
文件卷 (Volume): 一个已格式化的逻辑存储单元, 包含一个完整的文件系统.
- 一个卷通常对应一个分区, 但也可能跨越多个分区或磁盘 (如逻辑卷管理 LVM 或 RAID) .
- 卷是文件系统管理的独立单元, 拥有自己的根目录、元数据 (如超级块、空闲空间图、inode表等) 和数据区.
- 在 Windows 中, 卷通常被分配一个驱动器号 (如 C:, D:) . 在 Unix/Linux 中, 卷需要被挂载 (mount) 到目录树的某个挂载点才能访问.
物理块 (Block) / 簇 (Cluster): 见 3.1 节. 文件系统在卷上进行空间分配和数据读写的最小单位.
格式化 (Format): 在一个卷 (分区) 上创建文件系统的过程.
- 主要工作是写入文件系统的元数据结构, 并将卷的数据区初始化为空闲状态. 例如, 创建超级块、inode 表、空闲块位图、根目录等.
- 格式化会清除该卷上原有的所有数据.
元数据 (Metadata): "描述数据的数据". 在文件系统中, 指描述文件系统结构、状态以及文件属性的信息.
- 例子: 超级块、空闲空间图/链表、inode/FCB、目录项、日志文件等. 元数据对于文件系统的正常运行至关重要.

5.3 磁盘上的内容布局

(不同文件系统布局不同, 但通常包含以下部分)

引导区 (Boot Block / Boot Sector):
- 位于卷的最开始部分 (通常是第一个扇区) .
- 包含一小段引导代码 (Bootloader), 用于加载操作系统.
- 还可能包含该卷的文件系统参数 (如块大小、卷大小等) , 有时称为 BIOS 参数块 (BPB) 或 卷引导记录 (VBR).
文件系统控制块 / 超级块 (Superblock):
- 包含整个文件卷的全局关键信息. 是文件系统的"总控台".
- 内容: 文件系统类型、版本、块大小、块总数、inode 总数、空闲块数、空闲 inode 数、指向空闲管理区和 inode 区的指针、魔数 (用于识别文件系统类型) 、卷名、挂载状态等.
- 重要性: 超级块损坏会导致文件系统无法识别或挂载, 因此通常在磁盘上有多个备份副本.
空闲空间管理信息:
- 用于记录卷上哪些块是空闲可用的数据结构.
- 可能是位图 (Bitmap)、空闲块链表 (Free Block List) 或其他结构 (如成组链接法的专用块) .
文件元数据区 (Inode Table / MFT):
- 用于存储文件的核心属性信息 (除文件名外) .
- UNIX: i-节点区 (i-node Area), 集中存放所有文件的 i-node.
- NTFS: 主控文件表 (Master File Table, MFT), 存放所有文件 (包括系统文件) 的文件记录.
根目录区: 存放文件系统根目录的目录文件内容.
数据区 (Data Area): 磁盘上剩余的大部分空间, 用于存放普通文件的数据和除根目录外的其他目录文件.

5.3.1 UNIX 文件系统布局示例

分区布局:
1. 引导块 (Boot Block): (可选, 通常分区第一个块)
2. 超级块 (Superblock): 存储文件系统全局信息.
3. 空闲空间管理: i-node 位图、数据块位图 (或链表信息).
4. i-节点区 (Inode Table): 连续存放所有 i-node.
5. 数据块区 (Data Blocks): 存放根目录、其他目录文件和普通文件的数据块.

5.3.2 FAT 文件系统布局示例

分区/卷布局:
1. 引导扇区 (Boot Sector): 含 BPB 和引导代码.
2. 文件分配表 1 (FAT1): 主要 FAT.
3. 文件分配表 2 (FAT2): FAT1 的备份.
4. 根目录区 (Root Directory Area): (FAT12/16 中大小固定, 位于 FAT 之后；FAT32 中是数据区的一部分, 大小可变).
5. 数据区 (Data Area): 存放所有文件 (包括根目录和子目录) 的数据簇.

5.3.3 NTFS 文件系统布局示例

卷布局: (相对复杂, 核心是 MFT)
1. 分区引导扇区 (Partition Boot Sector): 含引导代码和 BPB.
2. 主控文件表 (MFT): 包含卷上所有文件 (包括元数据文件) 的文件记录. MFT 自身也是一个文件, 其位置在引导扇区中指定. 通常 MFT 的一部分会被预留, 并有 $MftMirr 作为备份.
3. 系统文件: MFT 中的前若干条记录描述重要的元数据文件, 如 $LogFile (日志), $Volume (卷信息), $AttrDef (属性定义), $\ (根目录), $Bitmap (卷空间位图), $Boot (引导文件副本), $BadClus (坏簇文件) 等. 这些文件的内容可以分布在数据区.
4. 文件存储区: 磁盘上除 MFT 预留空间和引导扇区外的其余部分, 用于存放用户文件数据和非常驻属性.

5.4 内存中的数据结构 (以UNIX为例)

目的: 为了提高文件访问效率和管理并发访问, 操作系统在内存中维护一系列与文件系统相关的数据结构.
主要结构:
- 1. (用户)进程打开文件表 (Per-Process Open File Table):
  - 归属: 每个进程都有自己独立的一张表. 通常位于进程控制块 (PCB) 中.
  - 索引: 文件描述符 (File Descriptor, fd). 这是一个小的非负整数 (如 0, 1, 2...) , 是用户程序用来指代打开文件的"句柄". fd 0, 1, 2 通常预留给标准输入、标准输出、标准错误.
  - 内容: 每个表项对应一个由该进程打开的文件, 包含：
    - 指向系统打开文件表对应表项的指针: 连接到全局信息.
    - 当前读写指针 (Current File Offset/Pointer): 记录该进程对此文件下一次读写的位置. 每个进程对同一文件的读写指针是独立的 (除非文件以特定共享模式打开) .
    - 访问模式 (Access Mode): 记录打开文件时指定的权限 (如只读 O_RDONLY, 只写 O_WRONLY, 读写 O_RDWR) .
    - 打开标志 (Flags): 如 O_APPEND (追加写) , O_CREAT (创建) , O_TRUNC (截断) 等.
- 2. 系统打开文件表 (System-Wide Open File Table):
  - 归属: 整个操作系统只有一张表.
  - 索引: 由进程打开文件表中的指针指向.
  - 内容: 每个表项对应一个当前被至少一个进程打开的文件, 包含：
    - 文件 FCB/i-node 信息 (内存副本): 包含文件的元数据, 如文件大小、权限、所有者、时间戳、物理块地址信息 (或指向更详细地址信息的指针) . 这是从磁盘读入的缓存信息.
    - 引用计数 (Reference Count): 记录当前有多少个进程打开文件表项指向此表项. 当进程关闭文件时, 计数减1. 当计数变为0时, 表示没有任何进程再使用这个文件, 该系统表项可以被释放, 内存中的 i-node 缓存可能需要写回磁盘 (如果被修改过) .
    - 文件类型和访问权限: (从 i-node 获取).
    - 可能包含全局读写指针或锁信息: 用于某些类型的文件或共享模式.
- 3. (可选) 目录项缓存 / 活动 i-node 缓存:
  - 为了加速路径名解析和 i-node 访问, 系统通常还会维护一个最近使用的目录项和 i-node 的缓存. 即使文件没有被显式打开, 其 i-node 或相关目录项也可能被缓存.
文件打开流程关联: 当进程 open() 一个文件时：
1. 内核解析路径名, 找到文件的 i-node.
2. 内核检查系统打开文件表：
  - 如果该 i-node 已在表中, 则引用计数加1.
  - 如果不在, 则从磁盘读取 i-node, 在表中创建一个新表项, 引用计数置1.
3. 内核在进程打开文件表中找到一个空闲槽位 (得到 fd) .
4. 进程表项指向系统表项, 记录访问模式和初始读写指针.
5. open() 返回 fd 给用户进程.
文件读写流程关联: 当进程 read(fd, ...) 或 write(fd, ...) 时：
1. 内核通过 fd 找到进程打开文件表项.
2. 通过进程表项找到系统打开文件表项, 获取 i-node 信息.
3. 使用进程表项中的当前读写指针和 i-node 中的物理地址信息来定位磁盘块.
4. 执行读写操作.
5. 更新进程表项中的读写指针.

5.5 磁盘空间管理

目标: 高效地跟踪和管理磁盘上哪些块是空闲的, 以便进行分配和回收.

5.5.1 位图法 (Bitmap / Bit Vector)

方式: 使用一个位向量 (Bit Array), 其中每一位对应磁盘上的一个物理块. 例如, 位图的第 i 位代表磁盘上的第 i 块.
状态表示: 通常用 1 表示块空闲, 0 表示块已分配 (或者反过来, 约定一致即可) .
分配: 需要分配 k 个块时, 在位图中搜索 k 个连续的 1 (对于连续分配) 或任意 k 个 1 (对于非连续分配). 找到后, 将对应的位设置为 0, 并返回块号.
回收: 文件删除释放块 i 时, 将位图中第 i 位设置为 1.
优点:
- 实现简单直观.
- 很容易找到连续的空闲块.
缺点:
- 位图本身可能很大: 对于大容量磁盘, 位图需要占用相当大的存储空间. 例如, 一个 1TB ( $2^{40}$ Bytes) 的磁盘, 如果块大小为 4KB ($2^{12}$ Bytes), 则需要 $2^{40} / 2^{12} = 2^{28}$ 个块, 对应需要 $2^{28}$ 位 = $2^{25}$ 字节 = 32 MB 的位图. 位图通常需要加载到内存以提高效率.

5.5.2 空闲块链表 (Free Block Linked List)

方式: 将所有空闲的磁盘块通过指针链接成一个链表. 文件系统只需要在超级块或特定位置存储链表的头指针 (指向第一个空闲块) . 每个空闲块内部存储指向下一个空闲块的指针.
分配: 从链表头部取下一个块进行分配, 并更新头指针指向原来的第二个块.
回收: 将被释放的块插入到链表的头部 (最简单) , 更新其指针指向原来的头块, 然后更新头指针指向这个新回收的块.
优点: 实现简单, 管理开销小 (只需一个头指针) .
缺点:
- 分配回收效率低: 每次分配/回收都需要读写磁盘块来获取/修改指针.
- 难以分配连续块: 无法方便地找到连续的空闲块.
- 链表可能遍历整个磁盘: 如果空闲块分散, 效率更低.

5.5.3 成组链接法 (Grouping / Counting - UNIX V6 采用)

方式: 对空闲链表的改进, 旨在减少磁盘 I/O 次数.
1. 将空闲块分成若干组 (例如, 每组最多100个块) .
2. 每组的第一个块 ("组长块") 不直接存储数据, 而是用来存储：
  - 下一组空闲块的组长块号 (指针).
  - 本组内包含的空闲块数量 (如 count = 99).
  - 本组内其余 99 个空闲块的块号列表.
3. 文件系统在内存中 (如超级块的一部分, 称为"专用块"或栈) 维护当前可直接分配的一组块的信息：
  - 当前组剩余空闲块数量 (s.n).
  - 当前组空闲块的块号列表 (s.free[1]...s.free[s.n]).
  - (隐含) 下一组的组长块号 (存储在 s.free[0] 或类似位置) .
分配:
1. 检查内存中当前组的空闲块数 s.n.
2. 如果 s.n > 0, 直接从内存列表 s.free 中取出一个块号 (如 s.free[s.n]) , 将 s.n 减 1, 返回该块号. (无磁盘 I/O)
3. 如果 s.n == 0 (内存中的组已用完) ：
  - 获取下一组的组长块号 next_group_leader (可能存在 s.free[0] 中).
  - 如果 next_group_leader == 0, 表示磁盘空间已满, 分配失败.
  - 否则, 读取 next_group_leader 这个磁盘块的内容 (包含下一组的数量和块号列表) 到内存的 s.n 和 s.free 中. (一次磁盘读)
  - 将 next_group_leader 这个块本身作为本次分配的结果返回.
回收: (回收块号为 block_num)
1. 检查内存中当前组的空闲块列表是否已满 (比如 s.n == 100).
2. 如果未满, 将 block_num 加入内存列表 s.free, 并将 s.n 加 1. (无磁盘 I/O)
3. 如果已满:
  - 将内存中 s.n 和 s.free 列表 (包含100个块号) 写入到要回收的 block_num 这个磁盘块中, 使其成为新的组长块. (一次磁盘写)
  - 将内存中的 s.n 置为 1.
  - 将内存列表 s.free[1] (或 s.free[0]) 设置为 block_num (现在只知道这一个新的组长块是空闲的).
优点:
- 分配和回收通常在内存中完成, 速度快. 只有当内存中的组用完或满了时才需要进行一次磁盘 I/O.
- 可以方便地一次性获取或管理一组空闲块.

6. 文件操作的实现

6.1 文件访问模式

典型的生命周期: 应用程序访问文件通常遵循以下模式：
1. 打开 (Open): 告诉操作系统要访问哪个文件, 以及打算如何访问 (读、写、追加等) . 操作系统进行权限检查, 并在内存中建立管理该文件访问所需的数据结构 (如打开文件表项) . 成功则返回一个文件描述符 (File Descriptor) 或文件句柄 (File Handle) 给应用程序.
2. 读 (Read) / 写 (Write) / 定位 (Seek): 使用上一步获取的文件描述符/句柄, 对文件进行读数据、写数据或移动读写指针的操作.
3. 关闭 (Close): 通知操作系统访问结束. 操作系统会释放相关的内存数据结构, 并将缓存中可能修改过的数据写回磁盘.
示例代码流程: f = open(name, flag); ... read(f, ...); write(f,...); seek(f,...); ... close(f);

6.2 创建文件 (Create)

目标: 在文件系统中注册一个新文件, 分配必要的元数据结构, 并在指定的目录下建立一个指向它的条目.
大致步骤: create(文件路径名, 访问权限) (可能作为 open 的一个标志 O_CREAT)
1. 解析路径, 找到父目录: 确定新文件应该在哪个目录下创建. 检查父目录是否存在以及是否有写入权限.
2. 检查文件名冲突: 查看父目录下是否已存在同名文件. 如果存在, 根据 open 标志决定是报错还是覆盖 (截断) .
3. 分配 FCB/i-node: 从文件系统的空闲 FCB/i-node 池中获取一个新的.
4. 初始化 FCB/i-node: 设置文件类型 (普通文件) 、权限 (基于参数和系统默认设置) 、所有者、时间戳、链接计数 (初始为1) 、文件大小 (初始为0) 、磁盘地址 (初始为空) .
5. 在父目录中添加目录项: 在父目录文件中找到一个空闲位置 (或扩展目录文件) , 写入新文件的文件名和对应的 FCB/i-node 号.
6. 写回磁盘: 将修改过的父目录文件和新分配的 FCB/i-node 写回磁盘持久化.
7. 返回: 成功则可能返回文件描述符 (如果 open 时创建) , 或返回成功状态.

6.3 打开文件 (Open)

目标: 根据文件名找到文件, 检查权限, 将文件元数据加载到内存, 并返回一个文件描述符供后续操作使用.
大致步骤: fd = open(文件路径名, 打开方式)
1. 路径名解析与目录检索: 从根目录或当前目录开始, 逐级查找路径中的目录, 最终找到目标文件的目录项, 从中获取其 FCB/i-node 号.
2. 检查系统打开文件表: 使用 FCB/i-node 号查找系统范围的打开文件表.
  - 找到 (文件已被其他进程打开): 获取指向该表项的指针, 并将该表项的引用计数加 1.
  - 未找到 (文件首次被打开):
    - 从磁盘读取该文件的 FCB/i-node 到内存.
    - 在系统打开文件表中分配一个新表项.
    - 将 FCB/i-node 信息填入新表项, 并将引用计数初始化为 1.
3. 权限检查: 根据请求的 打开方式 (读/写/读写) 和用户的身份 (UID/GID), 与从 FCB/i-node 中获取的文件权限进行比较. 如果权限不足, 打开失败, 返回错误.
4. 分配进程打开文件表项: 在当前进程的打开文件表中找到一个未使用的槽位, 获取其索引作为文件描述符 fd.
5. 填写进程表项:
  - 设置指向系统打开文件表对应表项的指针.
  - 记录打开方式 (读/写/读写) .
  - 设置初始读写指针 (通常为 0, 文件开头) .
6. 返回 fd: 将文件描述符返回给调用进程.

6.4 关闭文件 (Close)

目标: 断开进程与文件的关联, 释放内存资源, 确保数据持久化.
大致步骤: close(fd)
1. 查找进程表项: 使用 fd 在当前进程的打开文件表中定位到对应的表项. 如果 fd 无效, 返回错误.
2. 获取系统表项指针: 从进程表项中得到指向系统打开文件表项的指针.
3. 释放进程表项: 将该进程打开文件表项标记为可用 (清空或置无效) .
4. 递减系统表项引用计数: 将系统打开文件表项的引用计数减 1.
5. 检查引用计数:
  - 如果引用计数仍大于 0, 表示还有其他进程在使用该文件, close 操作完成, 直接返回.
  - 如果引用计数变为 0, 表示这是最后一个关闭该文件的进程：
    - 检查内存中的 FCB/i-node 副本是否有未保存的修改 (例如, 文件大小改变、内容被写入缓存但未刷盘) . 如果有, 则将修改写回磁盘 (Flush Cache) .
    - 释放系统打开文件表项, 使其可被重用.
    - (可选) 释放内存中缓存的 i-node 或其他相关资源.
6. 返回: 操作成功或失败状态.

6.5 读文件 (Read)

大致步骤: bytes_read = read(fd, buffer, length)
1. 查找表项: 通过 fd 定位到进程打开文件表项, 再找到系统打开文件表项, 获取 i-node/FCB 信息和当前进程的读写指针.
2. 权限检查: 确认文件是以可读方式打开的.
3. 确定读取范围: 从当前读写指针开始, 最多读取 length 字节, 但不能超过文件末尾. 计算出需要读取的逻辑块号范围和块内偏移.
4. 逻辑块到物理块转换: 使用 i-node/FCB 中的地址信息 (直接块、间接块指针或 FAT 链) , 将逻辑块号转换为物理磁盘块号.
5. 缓存检查 (Buffer Cache): 检查所需的数据块是否已经在内存缓存中.
  - 命中 (Cache Hit): 直接从缓存中将数据拷贝到用户提供的 buffer.
  - 未命中 (Cache Miss):
    - 申请内核缓冲区: 分配一块内存作为临时缓冲区.
    - 启动磁盘 I/O: 向磁盘驱动发出读请求, 将对应的物理块从磁盘读入内核缓冲区. 可能需要多次 I/O.
    - 拷贝数据: 将数据从内核缓冲区拷贝到用户 buffer.
6. 更新读写指针: 将进程表项中的读写指针向后移动实际读取的字节数 (bytes_read).
7. 更新访问时间: (可选) 更新 i-node/FCB 中的最后访问时间戳.
8. 返回: 返回实际读取的字节数 bytes_read (可能小于 length, 如果遇到文件尾或错误) .

6.6 写文件 (Write)

大致步骤: bytes_written = write(fd, buffer, length)
1. 查找表项: 同读操作, 获取 i-node/FCB 和读写指针.
2. 权限检查: 确认文件是以可写方式打开的.
3. 确定写入位置和范围: 从当前读写指针开始, 准备写入 length 字节. 计算涉及的逻辑块号.
4. 空间分配 (如果需要): 如果写入操作超出了当前文件大小, 需要调用磁盘空间管理模块分配新的物理块. 并将新块的地址信息更新到 i-node/FCB (如添加到地址列表、索引块或 FAT 链) . 同时更新 i-node/FCB 中的文件大小.
5. 逻辑块到物理块转换: 将要写入的逻辑块号转换为物理块号.
6. 缓存处理: 通常写入操作是写到内存缓存 (Write Cache) 中. 数据从用户 buffer 拷贝到内核管理的缓存页. 这些缓存页被标记为"脏页 (Dirty Page)".
7. 延迟写回 (Write Back): 操作系统通常不会立即将脏页写入磁盘, 而是等待一段时间 (如几秒钟) 或积累一定量的脏页后, 或在特定事件 (如 sync 命令、close 文件且引用计数为0) 发生时, 才批量地将脏页数据写回磁盘. 这可以提高性能 (合并写操作、利用磁盘调度) . 也可以配置为写穿 (Write Through) 模式, 即每次写都立即同步到磁盘, 可靠性更高但性能较低.
8. 更新读写指针: 将进程表项中的读写指针向后移动实际写入的字节数 (bytes_written).
9. 更新修改时间: 更新 i-node/FCB 中的最后修改时间戳.
10. 返回: 返回实际写入的字节数 bytes_written (通常等于 length, 除非磁盘空间不足或发生错误) .

6.7 指针定位 (Seek)

目标: 改变后续读写操作在文件中的起始位置, 实现随机访问.
大致步骤: new_offset = lseek(fd, offset, whence)
1. 查找进程表项: 通过 fd 定位到对应的进程打开文件表项.
2. 计算新位置:
  - whence 参数指定 offset 的基准：
    - SEEK_SET: offset 是相对于文件开头的绝对位置.
    - SEEK_CUR: offset 是相对于当前读写指针的相对位移.
    - SEEK_END: offset 是相对于文件末尾的相对位移 (通常 offset 为负或0) .
  - 根据 whence, offset 和当前文件大小, 计算出新的绝对偏移量 new_offset. 需要检查新位置是否有效 (如不能为负, 有时不允许超出文件尾) .
3. 更新读写指针: 将进程表项中的读写指针设置为计算出的 new_offset.
4. 返回: 返回新的绝对偏移量 new_offset, 或返回 -1 表示错误.

6.8 其他操作讨论

重命名 (Rename): rename(old_path, new_path)
- 核心: 操作目录项, 通常不涉及文件数据的移动.
- 场景1: 同一目录下重命名 (mv oldname newname)
  - 找到 old_path 父目录中的 oldname 目录项.
  - 修改该目录项中的文件名部分为 newname.
  - 检查 newname 是否已存在 (可能需要先删除或报错) .
- 场景2: 移动到同一文件系统下的不同目录 (mv old_path /new_dir/newname)
  - 找到 old_path 的目录项, 获取其指向的 FCB/i-node 号.
  - 检查目标目录 /new_dir 是否存在且有写权限.
  - 检查目标路径 /new_dir/newname 是否已存在.
  - 在 /new_dir 目录文件中创建一个新的目录项, 文件名为 newname, 指向与 old_path 相同的 FCB/i-node 号.
  - 从 old_path 的父目录文件中删除原来的目录项.
  - 注意: 对于硬链接, 这意味着源目录项的链接计数减1, 目标目录项的链接计数加1 (如果FCB/i-node有链接计数的话, 如Unix) . 如果目标目录项已经存在且是目录, 操作可能失败或有不同行为.
- 跨文件系统移动: rename 系统调用通常不支持跨文件系统移动. 需要应用程序先复制文件, 再删除源文件.
复制文件 (Copy): cp source_path destination_path
- 核心: 创建一个全新的、独立的文件, 其内容与源文件相同. 这不是一个单一的原子系统调用, 而是由库函数或 shell 实现的一系列操作.
- 步骤:
  1. 打开源文件: open(source_path, O_RDONLY) 获取源文件描述符 fd_src.
  2. 打开/创建目标文件: open(destination_path, O_WRONLY | O_CREAT | O_TRUNC) 获取目标文件描述符 fd_dest. (O_TRUNC 表示如果目标文件已存在则清空) .
  3. 循环读写:
    - while ((bytes_read = read(fd_src, buffer, BUFFER_SIZE)) > 0): 从源文件读取一块数据到内存缓冲区 buffer.
    - write(fd_dest, buffer, bytes_read): 将缓冲区的数据写入目标文件.
  4. 关闭文件: close(fd_src); close(fd_dest);
  5. (可选) 复制属性: 获取源文件的权限、时间戳等元数据, 并设置到目标文件上.

7. 文件共享

定义: 允许多个用户或进程访问同一个文件.
目的:
- 节省存储空间: 避免相同内容存储多份副本.
- 方便协作与信息交换: 多个用户可以共同处理一个文件.
主要实现方式: 文件别名 (File Alias), 即让多个不同的路径名指向同一个物理文件.

7.1 硬链接 (Hard Link)

概念: 创建一个新的目录项 (可以在不同目录下, 文件名也可不同) , 该目录项与原始文件的目录项指向完全相同的底层文件表示 (即同一个 FCB 或 i-node) .
工作原理 (以 i-node 为例):
- 每个 i-node 内部维护一个链接计数 (Link Count) 字段, 记录当前有多少个目录项指向这个 i-node.
- 创建硬链接 (ln target link_name):
  1. 找到 target 文件的 i-node.
  2. 在指定位置创建新的目录项 link_name.
  3. 将 link_name 目录项中的 i-node 号设置为与 target 相同的 i-node 号.
  4. 将该 i-node 的链接计数加 1.
- 删除链接 (rm link_name 或 rm target):
  1. 找到要删除的名字对应的目录项.
  2. 获取其指向的 i-node 号.
  3. 删除该目录项.
  4. 将对应 i-node 的链接计数减 1.
  5. 检查链接计数: 如果减为 0, 表示这是最后一个指向该 i-node 的目录项, 此时操作系统才会真正删除文件 (回收 i-node 和其占用的所有数据块) . 如果计数仍大于 0, 则文件数据和 i-node 保持不变.
特点:
- 地位平等: 所有指向同一个 i-node 的硬链接都是平等的, 没有主次之分. 删除任何一个链接都不影响其他链接 (除非是最后一个) .
- 指向 inode: 硬链接直接指向文件的 inode.
- 限制:
  - 通常不能对目录创建硬链接. 这是为了防止在目录结构中形成循环, 导致遍历算法 (如查找、磁盘空间计算) 陷入死循环.
  - 通常不能跨文件系统 (分区/卷) 创建硬链接. 因为 i-node 号只在当前文件系统内唯一且有意义.
- 示例: 用户 A 创建文件 /home/A/data.txt. 用户 B 执行 ln /home/A/data.txt /home/B/shared_data.txt. 此时, 两个路径指向同一个 inode, 链接计数为 2. 用户 A 删除 /home/A/data.txt 后, 文件依然存在, 用户 B 仍可通过 /home/B/shared_data.txt 访问, 链接计数变为 1. 只有当用户 B 也删除 /home/B/shared_data.txt 后, 文件才会被真正删除.

7.2 软链接 / 符号链接 (Soft Link / Symbolic Link)

概念: 创建一个特殊类型的文件 (类型为 Link) , 该文件的内容仅仅是另一个文件或目录的路径名字符串.
工作原理:
- 创建软链接 (ln -s target link_name): 创建一个类型为 'l' 的新文件 link_name, 并将字符串 target (可以是绝对路径或相对路径) 写入该文件的内容区域.
- 访问软链接: 当操作系统访问 link_name 时, 它会识别出这是一个软链接文件, 然后读取其内容 (即路径字符串 target) , 并重新开始从该路径 target 去查找目标文件. 这个过程称为符号链接解析 (Dereferencing).
- 不涉及 inode 链接: 软链接本身有自己的 i-node, 它并不直接指向目标文件的 i-node, 链接计数也不相关.
特点:
- 类似快捷方式: 功能上类似于 Windows 的快捷方式.
- 可以指向目录: 可以为目录创建软链接.
- 可以跨文件系统: 因为它存储的是路径名字符串, 所以可以指向位于其他分区或网络共享上的文件.
- 可以指向不存在的文件 (悬空链接 / Dangling Link): 如果目标文件被删除或移动, 软链接依然存在, 但访问它时会报告"文件未找到"错误.
- 删除原始文件不影响软链接本身: 软链接文件依然存在, 只是失效了. 删除软链接本身不影响原始文件.
- 系统开销: 解析软链接需要额外的路径查找步骤, 比硬链接访问稍慢.
- 可能形成链接环路: 例如 A 指向 B, B 又指向 A. 文件系统需要有机制检测并处理这种情况 (如限制解析深度) .
- 权限: 软链接文件本身的权限通常不重要, 访问权限取决于最终解析到的目标文件的权限.

8. 文件系统挂载 (Mount) 与卸载 (Unmount)

挂载 (Mount):
- 概念: 将一个独立的、已存在的文件系统 (通常位于另一个存储设备或分区上, 如U盘、硬盘分区、网络共享) 接入到当前操作系统的主文件系统目录树中的一个指定位置, 使其内容可见并可访问.
- 挂载点 (Mount Point): 这个指定的接入位置, 通常是主文件系统目录树中的一个空目录.
- 过程:
  1. 用户 (通常是管理员) 执行 mount 命令, 提供两个主要参数：
    - 设备/源: 要挂载的文件系统所在的设备名 (如 /dev/sdb1) 、卷标、UUID 或网络路径 (如 server:/share).
    - 挂载点: 主目录树中用于接入的目录路径 (如 /mnt/usb, /media/cdrom).
  2. 操作系统验证设备和挂载点是否有效, 检查权限.
  3. 操作系统读取源设备上的文件系统超级块, 获取文件系统类型和信息.
  4. 在内存中记录挂载信息 (例如, 在 VFS 层的挂载表中记录设备、挂载点、文件系统类型、根 inode 等) .
  5. 将挂载点目录在内存中的 VFS 表示 (dentry/inode) 标记为"已挂载", 并链接到被挂载文件系统的根目录 inode.
- 效果: 挂载后, 访问挂载点目录 (如 ls /mnt/usb) 实际上访问的是被挂载文件系统的根目录. 挂载点目录下原来的内容会被临时隐藏, 直到卸载.
卸载 (Unmount):
- 概念: 断开已挂载文件系统与主目录树的连接.
- 过程:
  1. 用户执行 unmount 命令, 提供设备名或挂载点路径.
  2. 操作系统检查该文件系统当前是否没有被任何进程使用 (没有进程的当前目录在此文件系统内, 也没有打开的文件在此文件系统上) . 如果有, 卸载通常会失败 (提示 "device is busy") .
  3. 将内存中缓存的属于该文件系统的脏数据写回磁盘 (Flush Cache) .
  4. 从内存的挂载表中移除该文件系统的挂载信息.
  5. 恢复挂载点目录原来的状态 (解除"已挂载"标记, 恢复对其下原来内容的访问) .
- 重要性: 在移除可移动设备 (如U盘) 前, 应先执行卸载操作, 以确保所有数据已写入设备, 防止数据丢失或文件系统损坏.

9. 文件系统实例

9.1 UNIX 文件系统 (以传统 System V 或 BSD 风格为例)

核心设计哲学: 简洁、一致性、"万物皆文件".
关键组件:
- 超级块 (Superblock): 文件系统的"心脏", 包含全局元数据.
- i-node (Index Node): 每个文件或目录对应一个 i-node, 存储其所有元数据 (类型、权限、所有者、时间戳、大小、数据块地址等) , 除了文件名. i-node 有一个唯一的编号 (i-number). 所有 i-node 集中存储在磁盘的 i-node 表 (Inode Table) 中.
- 目录项 (Directory Entry): 存储在目录文件中, 只包含两项内容：文件名 和该文件名对应的 i-node 号.
- 数据块 (Data Blocks): 存储文件实际内容和目录文件内容.
文件表示: 一个文件由一个目录项 (提供文件名和 i-node 号) 和一个 i-node (提供所有其他属性和数据块地址) 共同定义.
数据块寻址 (混合索引): i-node 中包含指向数据块的指针, 通常采用混合策略：
- 直接指针 (Direct Pointers): 10-12个指针直接指向文件的前几个数据块.
- 一级间接指针 (Single Indirect Pointer): 指向一个索引块, 该索引块包含一批指向数据块的指针.
- 二级间接指针 (Double Indirect Pointer): 指向一个一级索引块, 该块再指向二级索引块, 二级索引块才指向数据块.
- 三级间接指针 (Triple Indirect Pointer): 再加一级间接.
查找示例: /usr/ast/mbox (结合课件图)
1. 定位根目录 i-node: 超级块中通常记录了根目录 (/) 的 i-node 号 (假设为 2) .
2. 读取根 i-node: 从 i-node 表中读取 i-node 2.
3. 读取根目录数据块: 根据 i-node 2 中的地址信息, 找到并读取根目录文件的数据块.
4. 查找 "usr": 在根目录数据块中搜索目录项, 找到名为 "usr" 的项, 获取其 i-node 号 (图中为 7) .
5. 读取 "usr" i-node: 从 i-node 表读取 i-node 7.
6. 读取 "/usr" 目录数据块: 根据 i-node 7 的地址信息, 读取目录 "/usr" 的数据块 (图中块 128) .
7. 查找 "ast": 在块 128 中搜索目录项 "ast", 获取其 i-node 号 (图中为 62) .
8. 读取 "ast" i-node: 从 i-node 表读取 i-node 62.
9. 读取 "/usr/ast" 目录数据块: 根据 i-node 62 的地址信息, 读取目录 "/usr/ast" 的数据块 (图中块 496) .
10. 查找 "mbox": 在块 496 中搜索文件项 "mbox", 获取其 i-node 号 (图中为 80) .
11. 读取 "mbox" i-node: 从 i-node 表读取 i-node 80.
12. 访问文件: 现在拥有了文件 "mbox" 的 i-node 80, 其中包含了访问其数据块所需的所有地址信息.

9.2 FAT 文件系统 (FAT12/FAT16/FAT32)

设计思想: 结构简单, 广泛兼容 (尤其在早期 PC 和移动存储中) .
核心组件:
- 引导扇区 (Boot Sector): 包含 BPB (BIOS Parameter Block), 定义文件系统布局和参数.
- 文件分配表 (FAT - File Allocation Table): 核心数据结构. 本质上是一个数组, 每个元素对应数据区的一个簇 (Cluster). 元素的值表示：0 (空闲) 、下一簇号 (形成文件链) 、文件结束标记、坏簇标记. FAT 表通常有两份备份.
- 目录项 (Directory Entry): 每个文件或子目录在父目录中都有一个 32 字节的目录项.
- 数据区 (Data Area): 存储文件内容和目录文件内容的区域, 被划分为簇 (最小分配单位) .
文件表示: 一个文件由一个目录项 (包含文件名、属性、起始簇号、大小) 和 FAT 表中的簇链共同定义.
查找文件数据:
1. 从根目录 (或子目录) 开始, 查找文件的目录项.
2. 从目录项中获取文件的起始簇号.
3. 以起始簇号作为索引访问 FAT 表.
4. FAT 表中该簇号对应的内容是文件的下一个簇号.
5. 继续以新的簇号访问 FAT 表, 直到遇到文件结束标记.
6. 这个过程中得到的簇号序列就是文件占用的所有簇.
长文件名 (LFN) 支持 (VFAT - 在 FAT32 中普遍使用):
- 问题: 原始 FAT 只支持 8.3 格式的短文件名 (8个字符主名 + 3个字符扩展名, 大写) .
- 解决方案:
  1. 引入一种特殊的、隐藏的目录项类型, 称为 LFN 项.
  2. 一个长文件名 (支持 Unicode, 大小写混合) 被分割成若干段 (每段最多13个字符) .
  3. 每个 LFN 项存储一段长文件名字符, 并包含一个序号和一个校验和 (根据短文件名计算) .
  4. 多个 LFN 项逆序存储在目录文件中, 紧邻在其对应的短文件名 (SFN) 目录项之前.
  5. 系统会自动为长文件名生成一个兼容的 8.3 格式短文件名 (如 LONGFI~1.TXT) .
- 兼容性: 支持 LFN 的系统会读取并组合 LFN 项来显示长文件名；不支持 LFN 的旧系统会忽略这些特殊项, 只看到自动生成的短文件名.
FAT32 vs FAT16:
- 簇地址: FAT32 使用 28 位 (理论 32 位, 高 4 位保留) 表示簇号, 支持更大的卷容量 (最大 2TB 理论, 实际常限制到 32GB-2TB) 和更多的簇, 可以使用更小的簇大小, 减少空间浪费. FAT16 使用 16 位, 卷大小限制通常在 2GB 或 4GB.
- 根目录: FAT32 的根目录是数据区的一部分, 大小可变, 像普通目录一样管理；FAT16 的根目录在磁盘上有固定位置和固定大小 (条目数有限) .
- 效率和鲁棒性: FAT32 结构上有所改进, 但仍缺乏现代文件系统的高级特性.

9.3 NTFS (New Technology File System)

设计目标: 取代 FAT, 提供更高的可靠性、安全性和性能, 支持大容量存储. Windows NT 及后续版本的主要文件系统.
核心概念:
- 万物皆文件, 文件即属性 (Everything is a File, File is a Set of Attributes): NTFS 中几乎所有东西, 包括文件系统自身的元数据, 都被视为文件. 而每个文件 (包括目录) 被看作是一系列属性 (Attributes) 的集合.
- MFT (Master File Table): NTFS 卷的核心数据库. 它本身也是一个特殊文件 ($Mft$). MFT 由一系列文件记录 (File Record) 组成 (通常 1KB 大小) , 卷上的每一个文件或目录都至少对应一个 MFT 记录. 这个记录存储了该文件的所有属性 (或指向属性的指针) .
- 属性 (Attribute): 文件信息的基本单元. 每个属性由类型、名称 (可选) 和值 (流 Stream) 组成.
  - 例子:
    - $STANDARD_INFORMATION: 包含时间戳、权限标志等标准信息.
    - $FILE_NAME: 文件名 (可以有多个, 如长文件名、DOS 短文件名、硬链接名) .
    - $DATA: 文件的数据内容 (默认的、未命名的流) . 一个文件可以有多个数据流 (备用数据流 Alternate Data Streams) .
    - $SECURITY_DESCRIPTOR: 文件的访问控制列表 (ACL).
    - $INDEX_ROOT, $INDEX_ALLOCATION, $BITMAP: 用于实现目录 (索引) 的属性.
  - 存储:
    - 常驻属性 (Resident): 如果属性值很小, 可以直接存储在 MFT 文件记录内部.
    - 非常驻属性 (Non-resident): 如果属性值很大 (如文件数据流) , 则存储在 MFT 外部的数据区 (Runs/Extents) 中. MFT 记录只存储指向这些数据区的映射信息 (描述一系列连续簇的起始位置和长度) .
目录实现:
- 目录也被视为文件, 其核心属性是用于索引其内容的属性.
- 小目录: 其所有目录项 (包含文件名和对目标文件 MFT 记录的引用) 可以直接存储在 MFT 记录内的 $INDEX_ROOT 属性中 (常驻) , 并按文件名排序.
- 大目录: $INDEX_ROOT 只存储部分信息和 B+ 树的根节点. 实际的目录项存储在 MFT 外部的索引缓冲区 (通常 4KB 大小的簇) 中, 这些缓冲区通过 B+ 树结构组织和链接. MFT 记录中的 $INDEX_ALLOCATION 属性 (非常驻) 存储指向这些索引缓冲区的映射信息, $BITMAP 属性跟踪索引缓冲区的分配情况. 这使得大目录的查找、插入、删除效率很高.
可靠性:
- 日志 (Journaling): NTFS 是一个日志文件系统. 所有对文件系统元数据的修改操作, 在实际执行前都会先将操作意图写入一个特殊的日志文件 ($LogFile). 如果在操作过程中系统崩溃, 重启后可以通过检查日志来重做 (Redo) 未完成的操作或撤销 (Undo) 部分完成的操作, 使文件系统快速恢复到一致状态. 这大大减少了运行磁盘检查工具 (如 chkdsk) 的需要.
- 元数据冗余: MFT 的关键部分有镜像备份 ($MftMirr).
其他特性: 文件压缩、加密 (EFS)、磁盘配额、卷影副本 (VSS)、硬链接和符号链接 (称为 Junction Points 和 Symbolic Links) 等.

9.4 其他文件系统 (简述)

ext4: Linux 主流文件系统. 是 ext3 的演进, 引入了区段 (Extents) (用一个指针描述一大片连续块, 替代传统的块映射, 减少大文件元数据开销和碎片) 、延迟分配 (Delayed Allocation) (写数据时先缓存, 推迟物理块分配, 以便分配更连续的空间) 、日志功能、支持超大卷和文件.
Btrfs (B-Tree File System): Linux 下较新的文件系统, 设计目标是解决 ext 文件系统的一些限制. 核心基于写时复制 (Copy-on-Write, CoW) B 树. 特性包括：快照 (Snapshots)、子卷 (Subvolumes)、内建 RAID 支持、在线碎片整理、数据和元数据校验和等.
ZFS: 最初由 Sun Microsystems 为 Solaris 开发, 后移植到 Linux、BSD 等. 集成了文件系统和逻辑卷管理功能. 以数据完整性为核心设计目标. 特性包括：端到端校验和、写时复制 (CoW)、快照、克隆、动态条带化 (类似 RAID-0)、镜像 (类似 RAID-1)、RAID-Z (类似 RAID-5/6)、透明压缩、重复数据删除等.
APFS (Apple File System): 苹果为 macOS, iOS 等平台设计, 针对闪存/SSD 优化. 特性包括：写时复制 (CoW)、快照、克隆 (文件或目录的快速、低空间占用的副本) 、空间共享 (同一容器内多个卷共享空闲空间) 、强加密支持.
NFS (Network File System): 一种分布式文件系统协议, 允许客户端计算机通过网络像访问本地文件一样访问远程服务器上的文件. 它定义了客户端和服务器之间的通信规则.
VFS (Virtual File System / Virtual Filesystem Switch):
- 目的: 在操作系统内核中提供一个统一的、抽象的文件系统接口, 以屏蔽底层具体文件系统 (如 ext4, NTFS, FAT, NFS 等) 的差异.
- 作用: 应用程序可以使用一套标准的文件操作相关的系统调用 (如 open, read, write, stat 等) , VFS 层会根据操作的文件路径判断其属于哪个实际的文件系统 (通过挂载点信息) , 然后调用该具体文件系统驱动提供的相应实现函数.
- 核心对象: 通常涉及 inode (代表文件元数据) 和 dentry (Directory Entry Cache, 代表路径名组件) 等 VFS 层抽象对象, 以及 file (代表打开的文件实例) 和 superblock (代表挂载的文件系统实例) 对象, 这些对象都包含指向具体文件系统实现的操作函数指针表.
FUSE (Filesystem in Userspace): 一个框架, 允许开发者在用户空间实现文件系统, 而无需修改内核. 内核中的 FUSE 模块会将 VFS 请求转发给用户空间的守护进程来处理. 这使得开发新类型的文件系统 (如访问云存储、压缩文件、网络资源等) 更加容易.

10. 练习与工具

10.1 练习题

练习1 (Exercise 1)

题目 (Problem Statement):
- 有一个文件系统，根目录常驻内存，如图所示的目录结构。
- 目录文件采用链接结构，规定一个目录下最多存放60个下级文件/目录项。每个磁盘块可存放10个目录项。若下级文件为目录文件，则目录项给出该目录文件的第一块地址；若为普通文件，则目录项给出该普通文件的FCB的地址。
- 假设文件按自左向右的顺序建立 (A->B->C, D->E, F->G, etc.)。图中省略号表示有若干内容未显示。
```
      ROOT (内存中 In Memory)
       |
   +---+---+
   |   |   |
   A   B   C ...
   |
+--+--+
|     |
D     E ...
|
+--+--+
|     |
F     G ...
      |
   +--+--+
   |     |
   H     I ...
         |
      +--+--+
      |     |
      J     K ...
```
- (1) 假设普通文件采用UNIX的三级索引结构： FCB中给出13个磁盘地址。前10个是直接地址，指向文件前10块；第11个指向一级索引表 (含256个地址)；第12个指向二级索引表 (含256个一级索引表地址)；第13个指向三级索引表 (含256个二级索引表地址)。若要读取文件 /A/D/G/I/K 中的某一块，最少要启动磁盘几次？最多要启动磁盘几次？
- (2) 若普通文件采用链接结构： 要读取 /A/D/G/I/K 的第55块，最少启动硬盘几次？最多几次？
- (3) 若普通文件采用顺序结构 (连续分配)： 要读取 /A/D/G/I/K 的第5555块，最少启动硬盘几次？最多几次？
解答 (Solution):
- 分析共同部分：路径查找 (Path Traversal)
  - 目标文件路径：/A/D/G/I/K
  - 根目录 (ROOT) 在内存中，访问它不计入磁盘 I/O 次数。
  - 需要依次访问目录 A, D, G, I 来找到文件 K 的目录项 (其中包含 K 的 FCB 地址)。
  - 目录文件采用链接结构。一个目录最多 60 项，每块存 10 项，因此一个目录文件最多占用 60 / 10 = 6 个磁盘块。
  - 访问链接结构的目录文件以查找某个目录项：
    - 最少情况 (Min): 该目录项位于目录文件的第 1 块。需要读 1 次磁盘。
    - 最多情况 (Max): 该目录项位于目录文件的最后一块 (第 6 块)。因为是链接结构，必须先读取前 5 块才能找到第 6 块。需要读 6 次磁盘。
  - 路径 /A/D/G/I 的磁盘访问次数：
    - 访问 A (Root 在内存): 读目录 A 找 D，最少 1 次，最多 6 次。
    - 访问 D (在 A 中找到入口): 读目录 D 找 G，最少 1 次，最多 6 次。
    - 访问 G (在 D 中找到入口): 读目录 G 找 I，最少 1 次，最多 6 次。
    - 访问 I (在 G 中找到入口): 读目录 I 找 K 的 FCB 地址，最少 1 次，最多 6 次。
    - 总路径查找次数:
      - 最少 (Path_min): 1 + 1 + 1 + 1 = 4 次磁盘访问。
      - 最多 (Path_max): 6 + 6 + 6 + 6 = 24 次磁盘访问。
- 分析文件访问部分 (File Access - K):
  - 找到 K 的目录项后，需要读取 K 的 FCB。
  - 读取 FCB (FCB_read): 需要 1 次磁盘访问。
- 综合计算各问题：
  - (1) UNIX 三级索引结构
    - 读取 FCB 后 (已用 Path + 1 次)，根据要访问的块的位置决定后续读盘次数：
      - 直接块 (前 10 块): 再读 1 次数据块。
      - 一级间接块: 读 1 次一级索引块 + 读 1 次数据块 = 2 次。
      - 二级间接块: 读 1 次二级索引块 + 读 1 次一级索引块 + 读 1 次数据块 = 3 次。
      - 三级间接块: 读 1 次三级索引块 + 读 1 次二级索引块 + 读 1 次一级索引块 + 读 1 次数据块 = 4 次。
    - 最少次数 (Min): 假设访问的是直接块。
      - Min_Total = Path_min + FCB_read + Data_read = 4 + 1 + 1 = 6 次。
    - 最多次数 (Max): 假设访问的块必须通过三级间接索引。
      - Max_Total = Path_max + FCB_read + Index_reads + Data_read = 24 + 1 + 3 + 1 = 29 次。 (3 次索引块读取 + 1 次数据块读取)
  - (2) 链接结构
    - 要读取第 55 块。需要从 FCB 指向的第一块开始，顺序读取 54 次指针，再读第 55 块本身，共 55 次数据读取。
    - 最少次数 (Min):
      - Min_Total = Path_min + FCB_read + Data_reads = 4 + 1 + 55 = 60 次。
    - 最多次数 (Max):
      - Max_Total = Path_max + FCB_read + Data_reads = 24 + 1 + 55 = 80 次。
  - (3) 顺序结构 (连续分配)
    - 要读取第 5555 块。FCB 中有起始地址，可以直接计算第 5555 块的地址。
    - 只需要读取目标数据块本身 (1 次数据读取)。
    - 最少次数 (Min):
      - Min_Total = Path_min + FCB_read + Data_read = 4 + 1 + 1 = 6 次。
    - 最多次数 (Max):
      - Max_Total = Path_max + FCB_read + Data_read = 24 + 1 + 1 = 26 次。
- 总结:
  - (1) UNIX 索引: 最少 6 次，最多 29 次。
  - (2) 链接结构: 最少 60 次，最多 80 次。
  - (3) 顺序结构: 最少 6 次，最多 26 次。

练习2 (Exercise 2)

题目 (Problem Statement):
- 假设一块刚格式化好的磁盘大小为 2MB；每块/簇大小为 512 字节。
- 要求画出（或描述）在执行下列操作后，一个简化的 UNIX 文件系统和一个 FAT16 文件系统的布局。
- 操作序列:
  1. mkdir /A
  2. mkdir /A/B
  3. create /A/B/File1 (占用 4 块/簇)
  4. mkdir /C
  5. mkdir /D
  6. mkdir /C/E
  7. create /C/E/File2 (占用 16 块/簇)
  8. mkdir /C/E/F
  9. create /C/E/F/File3 (占用 8 块/簇)
  10. create /C/E/F/File4 (占用 2 块/簇)
解答 (Solution):
- 磁盘和块信息:
  - 磁盘大小: 2MB = 2 * 1024 * 1024 Bytes = 2,097,152 Bytes
  - 块/簇大小: 512 Bytes
  - 总块/簇数: 2,097,152 / 512 = 4096 个
- 1. 简化 UNIX 文件系统布局描述:
  - 假设布局:
    - Block 0: Boot Block
    - Block 1: Superblock
    - Block 2: Inode Bitmap
    - Block 3: Data Bitmap
    - Blocks 4-19: Inode Table (假设)
    - Blocks 20 onwards: Data Blocks
  - 最终状态概述:
    - Superblock (Block 1): 记录总块数 4096, inode 数 (假设), 数据块起始 20 等。
    - Inode 位图 (Block 2): 标记 inode 0 (root), inode 1 (A), ..., inode 10 (File4) 已使用。
    - 数据块位图 (Block 3): 标记 blocks 20 (root dir data), 21 (A dir data), ..., 46 (File2 index block), ..., 57 (File4 data) 已使用。
    - Inode 表 (Blocks 4-19):
      - Inode 0 (/): type=dir, block[0]=20, ...
      - Inode 1 (A): type=dir, block[0]=21, ...
      - Inode 2 (B): type=dir, block[0]=22, ...
      - Inode 3 (File1): type=file, size=2048, direct[0-3] -> 23-26, ...
      - Inode 4 (C): type=dir, block[0]=27, ...
      - Inode 5 (D): type=dir, block[0]=28, ...
      - Inode 6 (E): type=dir, block[0]=29, ...
      - Inode 7 (File2): type=file, size=8192, direct[0-9] -> 30-39, indirect[0] -> 46, ...
      - Inode 8 (F): type=dir, block[0]=47, ...
      - Inode 9 (File3): type=file, size=4096, direct[0-7] -> 48-55, ...
      - Inode 10 (File4): type=file, size=1024, direct[0-1] -> 56-57, ...
    - 数据块区 (Blocks 20-4095):
      - Block 20: Root Dir data (entries: A, C, D)
      - Block 21: Dir A data (entries: B)
      - Block 22: Dir B data (entries: File1)
      - Blocks 23-26: File1 data
      - Block 27: Dir C data (entries: E)
      - Block 28: Dir D data
      - Block 29: Dir E data (entries: File2, F)
      - Blocks 30-45: File2 data
      - Block 46: File2 index block (pointers to blocks 40-45)
      - Block 47: Dir F data (entries: File3, File4)
      - Blocks 48-55: File3 data
      - Blocks 56-57: File4 data
      - Blocks 58-4095: Free
- 2. FAT16 文件系统布局描述:
  - 假设布局: (1 Cluster = 1 Block = 512 Bytes)
    - Block 0: Boot Sector
    - Blocks 1-16: FAT1
    - Blocks 17-32: FAT2
    - Blocks 33-64: Root Directory Area
    - Blocks 65-4095: Data Area (Clusters 2-4032)
  - 最终状态概述:
    - Boot Sector (Block 0): 含 BPB 信息。
    - FAT1/FAT2 (Blocks 1-32):
      - Entry 0, 1: Reserved
      - Entry 2: FFFF (End of Chain for Dir A)
      - Entry 3: FFFF (End of Chain for Dir B)
      - Entries 4-7: 5, 6, 7, FFFF (Chain for File1)
      - Entry 8: FFFF (End of Chain for Dir C)
      - Entry 9: FFFF (End of Chain for Dir D)
      - Entry 10: FFFF (End of Chain for Dir E)
      - Entries 11-26: 12, 13, ..., 26, FFFF (Chain for File2)
      - Entry 27: FFFF (End of Chain for Dir F)
      - Entries 28-35: 29, 30, ..., 35, FFFF (Chain for File3)
      - Entries 36-37: 37, FFFF (Chain for File4)
      - Other entries (38-4095): 0000 (Free)
    - 根目录区 (Blocks 33-64):
      - Entry for "A": Attr=DIR, StartCluster=2
      - Entry for "C": Attr=DIR, StartCluster=8
      - Entry for "D": Attr=DIR, StartCluster=9
    - 数据区 (Blocks 65-4095):
      - Block 65 (Cluster 2): Dir A data (entry for B)
      - Block 66 (Cluster 3): Dir B data (entry for File1)
      - Blocks 67-70 (Clusters 4-7): File1 data
      - Block 71 (Cluster 8): Dir C data (entry for E)
      - Block 72 (Cluster 9): Dir D data
      - Block 73 (Cluster 10): Dir E data (entries for File2, F)
      - Blocks 74-89 (Clusters 11-26): File2 data
      - Block 90 (Cluster 27): Dir F data (entries for File3, File4)
      - Blocks 91-98 (Clusters 28-35): File3 data
      - Blocks 99-100 (Clusters 36-37): File4 data
      - Blocks 101-4095 (Clusters 38-4032): Free

10.2 mkfs 工具

作用: 在指定的存储设备 (分区) 上创建 (即格式化) 一个新的、空的文件系统.
过程:
1. 向设备写入文件系统的引导扇区 (如果需要) .
2. 创建并初始化文件系统的核心元数据结构, 如：
  - 超级块 (Superblock): 写入文件系统类型、块大小、总大小等信息.
  - 空闲空间管理结构: 初始化位图或空闲链表, 标记所有 (或大部分) 块为空闲.
  - i-node 表 / MFT: 创建并初始化 i-node 表或 MFT 区域.
  - 根目录: 创建根目录的 i-node/FCB 和对应的目录文件 (通常包含 . 和 .. 两个特殊项) .
3. 根据文件系统类型, 可能还会创建其他预定义的系统文件或目录.
常用选项:
- -t <type>: 指定要创建的文件系统类型 (如 ext4, vfat, ntfs, xfs).
- -F <fat_type> (for mkfs.vfat): 指定 FAT 类型 (如 12, 16, 32).
- -b <block_size>: 指定块大小.
- -L <label>: 设置卷标.
- -N <number_of_inodes> (for mkfs.ext*): 指定 i-node 数量.
用途:
- 准备新的硬盘分区以供使用.
- 格式化 U 盘或其他可移动介质.
- 创建用于虚拟机或容器的磁盘映像文件.

11. 重点小结

核心抽象: 文件系统将物理存储抽象为逻辑的文件和目录, 提供按名存取.
关键数据结构: FCB/i-node (存储文件元数据)、目录项 (文件名到元数据的映射)、文件分配表/索引块 (文件数据块定位)、超级块 (文件系统全局信息)、空闲空间管理结构 (位图/链表).
逻辑 vs 物理: 理解文件逻辑结构 (用户视角：字节流、记录) 与物理结构 (磁盘存储：连续、链接、索引) 的区别与联系.
目录实现: 目录本身是特殊文件, 其组织方式 (顺序、哈希、B+树) 影响查找效率. 目录项分解 (如 UNIX i-node) 是重要优化.
内存中的作用: 打开文件表 (进程级、系统级) 和缓存是提高性能、管理并发的关键.
基本操作流程: 理解 Create, Open, Read, Write, Close, Seek 等操作在文件系统内部的执行步骤和涉及的数据结构.
共享机制: 硬链接 (多名同体, 基于 i-node 链接计数) vs 软链接 (快捷方式, 基于路径名).
实例对比: 掌握 FAT (简单, 基于 FAT 表簇链)、UNIX (基于 i-node 和混合索引) 和 NTFS (基于 MFT 和属性流, 日志化) 的核心设计思想和主要特点.

[中文] Course Review for PKU Students

Fri, 18 Apr 2025 01:15:00 GMT

import { Aside } from '@/components/user'

使用电脑, iPad 等宽屏设备的浏览器访问可以看到右侧的目录.

课程资料的链接在每个课程的介绍后, 请前往每个课程的介绍.

如果帮助到了你, 可以在下面评论区留下你的反馈, 也可以帮助到其他同学, 同时欢迎给我的 GitHub 仓库点个 star 🌟 !

Update on 2025.04.18: 这里有一个北大同学开发的课程资料网站, 在开发团队的邀请下我上传了部分资料, 也可以看到别的同学上传的资料, 非常好的项目!

祝大家选课顺利, 学习愉快!

春秋学期均开设的课程

编译原理

刘先华, 王迪, 张路 2024秋

课程听感

大四了就去过三次课, 但是我感觉讲的还挺清楚的, 但是如果只看 slides 可能会很迷惑, 尤其是语法分析和 SDT 部分, 所以建议要么看书作为补充, 要么看看下面资料中的笔记.

作业/任务量

十五次作业, 九个 lab. 有的时候一周两次作业, 有的时候一周没有作业.

建议在没有绩点压力的大四选这门课, 就可以不写 Lv9 了, 因为 Lv9 非常浪费时间并且占所有 Lab 的 27% 的分数, 也就是总评的 8 分, 如果在绩点压力下完成所有 Lab 会浪费很多时间.

考试

最后一节课有三十分钟的 Lab 小测, 开卷可以查阅任何资料, 我们的小测问题是:

目前完成的程度及功能得分.
简介你的编译器是如何处理符号表及嵌套作用域的.
简介你的寄存器分配方案的设计和实现.
SysY 文法是否有二义性问题, 你的编译器是如何解决的.
简述 KoopalR (或你所使用的 IR) 的主要特点.

期中期末都有考试, 期中之前好好学习了, 每周看 slides ; 期中之后没看过, 期末考试前两天速成, 对往年题做 few-shot learning 可以做到期中 90 分, 期末也差不多, 同样写写往年题就行了.

相关资料

成绩

2025.01.26: 81

大四满足了 🎊

射箭

张冰 2024秋

课程听感

超难选超好玩给分超好体育课.

这个博主射箭超厉害

最后一节课的有趣射箭小游戏, 第一名有奖牌

作业/任务量

只有期末理论方面的一篇手写论文, 和射箭相关写多少字都行, 我就写了两段话半张 A4 纸.

考试

期末会有两节课的射箭排位赛, 具体方式就是每节课每人射 8 组箭, 前两组用作热身不算成绩, 每组箭 6 枝, 两节课总共算 72 枝箭的成绩, 最后全班按照总环数排名.

基本上 650 环可以拿到第一名, 博主 610 环第四名.

相关资料

无

成绩

2024.12.30: 97

疑似体测扣了 3 分, 射箭本体满分...🌚...

秋季学期课程

信息安全引论

王昭 2024秋

课程听感

大四专业选修凑学分课, 疑似没听过. Slides 也非常非常极尽迷惑之事, 根本看不明白, 感觉不如看课本, 但是课本太多了, 所以建议前几节课学学后面的就不用学了, 尤其是期中之后的知识考试涉及不多.

作业/任务量

三次书面作业, 六次小测, 两次作业小测, 四次课堂小测, 但是课堂小测可以下来问同学密码是多少然后补测.

一次写代码的 Lab, 若干次在一个在线平台上的 Lab, 第一个 Lab 需要费点时间, 后面的 Lab 比较简单, 一个小时就能做一个.

考试

没有期中考试, 期末考试 60% 为作业题, 大四同学好好复习作业题和小测题即可, 在仓库里有详细解析的作业题和小测题自取~

期末题型为填空, 判断, 选择, 简答, 大题, 体感来讲如果好好复习了作业题和小测题确实至少能拿 60 分, 博主体感正经写了 80 分左右的题目, 剩下 20 分就瞎写了.

相关资料

信息安全引论资料仓库

成绩

2025.01.16: 84

大四满足了哇咔咔 🎊

强化学习

李文新 2024秋

课程听感

大四就去过两次课, 感觉不如看 slides, 但是上课回答问题可以加分, 最高加三分. 同时时不时就有传纸条签到的环节, 但是完全可以让同学帮忙写姓名学号.

作业/任务量

八次作业, 一次大作业, 一次课程大作业 Presentation.

每次小作业差不多花一两个小时, 就是复现一些经典的 RL 算法, 有的调参还挺烦的. 其中最后一个作业是在开悟平台上的控制 agent 走迷宫, 只需要调整 reward 然后续训就能达到 1430 左右的分数.

大作业是在四个项目里选择, 分别是开悟平台王者1v1对战, 国标麻将, 双升, 和掼蛋的强化学习模型训练, 每个大作业按照跟同学的对战胜负排名天梯给分. 建议选择王者1v1对战, 因为可以复用最后一次小作业的经验, 并且不用修改代码就能跑起来, 最后只需要调整 reward 和模型架构即可.

大作业 Presentation 就是每组上台汇报自己的 RL agent 训练经验, 汇报持续两周, 第一周汇报的同学因为训练时间更少所以有一分加分.

考试

没有期中考试, 期末考试 60 道选择题. 拟合小测题和往年题即可.

相关资料

强化学习资料仓库

成绩

给分吹爆, 没有任何额外加分都能给大四这么高, 优秀率 60%.

来自树洞 7073734:

学长学长，你的地概确实很强，但还是太吃优秀率限制了，有没有什么更加简单又好拿分的课程推荐一下吗？

有的兄弟！有的！像这么好的课程北大当然是不止一个了，一共有九个，当时当前学期t0.5的优质课程，随便选上一个都能够轻松彩虹，如果九门都选上那你的院系排名将会冲顶，如果九门课都像学长一样拿到满分的水平，那我可以说你的成绩可以直接冲五四奖学金都是没有问题的了。

2025年，zkc教员宣告水课地概已不复存在，考试重点不再勾画，优秀率也不再给满，新形势下，老九门课程讲何去何从？我们还有没有机会重铸彩虹荣光？

有的兄弟！有的！我推荐你来选嘻嘻科学技术学院课程：强化学习。本课程由李文新教授讲授，课堂幽默风趣互动良多愉快有加分，且加分有上限无内卷，作业两周一个轻松容易，不考勤有慕课复习无压力，考核内容有趣不紧张，助教贴心全程陪学有问必答答必解惑，lab框架清晰同学交流密切，更有前沿讲座各界大佬分享技术交流思想，考题不超纲全是单选且与教学内容绝对平行不正交，有往年题提供开源自信从不隐瞒，大作业选题宽泛麻将掼蛋王者荣耀应有尽有，即使你对强化学习算法一窍不通也可以简单多次训练拿到很好的表现加强对强化学习的了解与认知。

选择强化学习，重铸彩虹荣光！

兄弟！有没有心动！

兄弟！有的！

智能机器人概论

赵卉菁 2023秋

课程听感

听感一般, 老师讲课很认真, 但是三教的教室实在是太温暖了, 让人不得不睡觉...

最后来的人越来越少, 老师就会以前一节课的 slides 内容作为小测内容, 在下一节课小测, 但是准确率不重要, 是用作签到的.

作业/任务量

三次写代码的小作业, 每次也就几十行代码, 很快就写完了, 但是要写实验报告, 大概是使用课上讲过的算法来构建地图这样的简单任务.

期中期末两次大作业.

期中是绕行理科二号楼一圈, 今年额外加了最后的绕桶项目, 难度较大, 前面的拐弯使用启发式算法即可.

期末是自选题目, 最重要的事情是选择一个有趣的题目, 强烈建议借助小车完成期末作业, 然后可以做一个视频讲一个故事, 越有趣越好, 代码难度没有什么影响.

附上我们组的期末大作业视频以供参考: Bilibili

考试

无

相关资料

智能机器人概论资料仓库

这个仓库包括:

三次作业的代码
期中大作业的代码和评分标准
期末大作业的视频链接

成绩

感觉是大作业的 idea 让老师感觉很有趣.

计算机网络

黄群 2023秋

课程听感

黄群老师讲课是自顶向下的, 和同一个学期的计网实验班是相反的顺序.

老师讲得挺好的, 可以把 slides 和口述部分连接起来形成逻辑链条, 课程值得一听.

讲课的时候老师还喜欢加入长者的梗, +1s

作业/任务量

没有平时作业.

四个 lab 选三个最高分, 我选择的是 1, 2, 4, 首先第四个 lab 半个小时就能写完, 一定要选; 第一个 lab 也不难, 而且是刚开学时间充裕, 建议选; 最后我还建议选第二个 lab, 因为第三个 lab 可能和期末考试时间有冲突, 难度也不低.

MOOC 水过, ddl 是期末之后, 及格就行.

考试

期中考试无, 期末考试会给往年题和考试范围.

相关资料

计算机网络资料仓库

这个仓库包括:

我的期末复习笔记.
Labs , 但是第三个 Router Lab 仍然有 bug , 但是由于只需要完成四个 lab 中的三个即可, 所以这个 lab 就没有彻底完成.
一些相关资源, 包括一些往年题.

成绩

疑似期末考得一般.

博弈论

刘霖 2023秋

课程听感

这是政府学院的刘霖教授开设的三学分博弈论课程, 课程分为四个部分介绍了不同种类的博弈论, 知识内容还是比较丰富的, 老师上课也会积极与同学互动, 叫同学上台回答问题.

但是刘霖教授的讲课方式注定了这门课需要下课自己好好思考学习. 因为老师的 slides 只有大纲, 具体的知识点都是口述, 所以上课是必要的, 但是又由于老师讲课有的时候比较模糊, 所以需要下课复习回放. 在复习回放的基础上, 没有必要看其他的补充教材.

作业/任务量

作业次数不多, 但是每次作业都有较难的题, 需要多花一些时间认真思考.

考试

老师的考试方式也是很有特点, 考试类似简单的数学课考试, 所以吸引了很多数学, 物理, 信科学院的同学选修.

不过如果对考试非常有信心, 是可以冲击彩虹的, 我仅使用了自己记的笔记就拿到了彩虹, 没有使用其它的参考资料, 欢迎参考!

相关资料

博弈论资料仓库

这个仓库包括:

课件
带有笔记的课件 (我的主要贡献是给老师较为简陋的 slides 上记录了非常详尽的笔记, 基本上都是根据老师口述所整理的, 感觉对这门课的学习会有非常大的帮助)
课程作业
一些相关资源 (包括往年的考试和往年带有答案的作业题)

成绩

100

魅力化学

黄建滨 2022秋

课程听感

老师风趣幽默, 每节课会请不同方向的教授来做讲座, 每节课课前会发一个有两三道题的小测, 听完讲座交上去, 用作签到.

作业/任务量

一篇期末论文

考试

没有考试

相关资料

我的魅力化学课程论文

成绩

唯一一个上 90 的论文课... 想必是论文写出了真情实感吧🥹

计算机系统导论

管雪涛 2022秋

2024.09.05 Update: 兹喜闻zzy同学当选为24届27班ICS助教, 特此表示热烈祝贺!

课程听感

这门课的课程测评很多了, 就不重复说了.

在此推荐唯一真神: 更适合北大宝宝体质的 XXX Lab 踩坑记

相关资料

计算机系统导论资料仓库

这个仓库包括:

所有lab的满分解答 (针对2022年版本的labs, 由于包含面向样例优化, 之后的年份可能由于测试样例的改变导致性能急剧下降, 比如下降到80分左右)

成绩

历史成绩不具备现实意义.

数据结构与算法 (A)

邹磊 2022秋

课程听感

中规中矩, 感觉看看 slides 就可以了. 对于学习巩固算法知识还是有用的.

作业/任务量

中规中矩, 每一章有一些算法题和几道书面算法题, 尽量熟练使用 STL 可以提高编程效率.

考试

期中考试:

期中是线下考试, 大部分就是正常的算法模拟题, 拟合一下往年题就好了

期末考试:

线上考试, 不具有参考意义. 但是是根据样例通过个数给分, 与之前的程设和计算概论都不同.

相关资料

数据结构与算法资料仓库

这个仓库包括:

上机作业题
书面作业题
往年考试题

成绩

历史成绩不具备现实意义.

中级微观经济学 (Legacy)

秦晋 2023秋

Update 2024.09.25: 看老师在朋友圈发了一暑假照片哈哈哈

Update 2024.06.06: 听说老师要走了, 真的很可惜, 虽然在考试和难度方面有争议, 但是老师讲的还是很认真的, 也对教书这件事情很热情. 希望老师能找到可以实现理想的地方.

课程听感

非常不错, Dr.J 讲课条理清晰, 用填空的形式带领补全思维链条, 微观经济学本身就有清晰的理论依据, 这更使得这门课听起来简洁明了. 如果学过吴泽南的经济学原理, 那么这门课的内容大部分是在经济学原理中已经讲授过的, 所以给我一种在复习经济学原理的错觉(x

作业/任务量

作业不难, 可能偶尔有一两道比较tricky的问题

考试

出分之后在树洞上引起了不小的讨论, 主要是在讨论这样给分是否合理. 由于调分力度很大, 树洞里大量的彩虹和 84.5 样本说明成绩分布有极端化的趋势, 我觉得在调分的时候适当引入一些梯度可以更好评价每一位同学的付出程度. 当然无论如何调分力度都很大, 期末是助教出题, 题目较难, 但是最后的成绩很满意!

相关资料

中级微观经济学资料仓库

这个仓库包括:

填补完成的课程笔记
课程作业
一些期末模拟题以供训练

成绩

100

历史成绩不具备现实意义.

春季学期课程

操作系统

陈向群 2025春

课程听感

{/* 一次都没去, 全靠 Gemini 和 Claude 总结课件. */}

作业/任务量

{/* xv6 实验, 半个学期两次书面作业 (基本上都用 Gemini 完成的), 十几次上课小测 (就做了两次), 一次期中考试 (半开卷, 可以带五张正反面 A4 纸), 一次期末考试. */}

考试

期中考试:

考到第六章虚拟内存技术.

非常抽象的事情是考试方式阴晴不定, 我了解到的信息 (大概是这样):

2023年春季学期没有期中考试
2023年秋季学期期中考试闭卷
2024年春季学期期中考试闭卷
2024年秋季学期期中考试完全开卷, 可以带任意多资料
2025年春季学期期中考试部分开卷, 可以带 5 张 A4 纸

期末考试:

Unknown

相关资料

课程笔记:

{/* - 操作系统资料仓库

这个仓库包括:

课程笔记
课程作业
Lab 代码
考试往年题
课堂小测总结 */}

成绩

Unknown

计算机视觉导论

王鹤 2024春

2024.07.12 Update: 出分哩, 大三结束!

2024.06.18 Update: PDF 格式的笔记在 GitHub 上作为 Releases 发布

Github 仓库所有笔记更新完毕, 完结撒花!!!

2024.06.08 Update: Embodied AI 相关笔记

2024.06.01 Update: Generative Model 相关笔记

2024.05.25 Update: Detection and Instance Segmentation 相关笔记

2024.05.18 Update: Transformer 相关笔记

课程听感

(以下是在课程笔记前写的前言)

作为北京大学信息科学技术学院的学生, 长期以来饱受糟糕课程质量, 糟糕课程作业, 糟糕考试难度的折磨. 比如算法设计与分析的等课程的教学质量极低, 教考分离, ICS 考试一面黑板的考试错误题目订正等等. 在这样的环境下, 遇到了王鹤老师开设的计算机视觉导论课程, 这门课程的内容丰富, 作业质量高, 考试难度适中, 称得上是精品课程 (与算分这种国家精品课程相区别) .

王鹤老师将计算机视觉的发展脉络呈现给大家, 在这个深度学习时代, 老师并没有完全忽视传统 CV 的方法, 而是挑选了其中具有代表性的工作, 这些工作为深度学习时代的 CV 打下了良好的基础, 提供了许多基础工具和数据集的构建方式. 同时老师也更加注重深度学习的基础知识, 如 BatchNorm 的特性和与其他 Norm 的区别, 许多人仅仅只是会 PyTorch 的积木搭建, 但是对于这些基础知识的原理和性质却不甚了解, 导致在实际使用中遇到问题时无法解决, 王老师在这方面往往提出 intuitive 的问题, 引人深思.

我是在大三下学期选修了这门课程, 即使我已经具有了一定的深度学习基础, 但是我仍然很享受上课 (看回放) 的过程, 因为对于许多已经了解的知识, 王老师会再度给出解释, 总是让我在同一个地方有不同的收获.

我在本学期期中考试之前偶然了解到曾经有学长撰写了一本笔记, 但是许多内容已经进行了更新或者删改, 因此我联系上林晓疏 (笔名) 学长, 获取了这份笔记的源代码, 并在此基础上进行更新, 以飨后人.

该笔记按照讲授先后顺序进行排列, 但是章节编排按照知识结构划分, 因此章节划分可能与课程进度有所不同. 同时本笔记不能替代课程, 只是对这部分知识的总结和思考, 建议与课程回放配合食用.

作业/任务量

作业是四次 lab , 没有其它作业, 对我来讲周更笔记算是比较有趣的事情, 一边看回放一边记记笔记需要两三个小时, 预计总时长会在25小时左右 (更新完之后发现总时长在35小时左右) .

Lab1

都不能使用 for 循环

实现卷积, 包括 pedding , 使用 Toeplitz Matrix 实现卷积, 使用 Sliding Window 实现卷积
实现 Canny Edge Detector, 包括包括 NMS 和 Edge Linking with Hysteresis Threshold
实现 Harris Corner Detector
使用 RANSAC 进行平面 fitting

Lab2

手工实现反向传播 (不是很要求矩阵求导, 考试也不考察矩阵求导)
手工实现 Batch Norm
使用前两问的函数在 Cifar-10 上训练一个 CNN
使用 PyTorch 实现一个 CNN

Lab3

除了 Marching Cube 都不能使用 for 循环

实现相机校准
从 depth image 重建点云
从 mesh sample 点云, 使用两种 metric 计算点云距离
使用 Marching Cube 从 SDF 重建 mesh

Lab4

可以使用 for 循环

实现 Point Net
Mask RCNN
RNN

时间: 3-4个小时

lab质量较前三个有所下降, 大概是因为这几个网络复杂度提高了太多了, 想要好好写任务量太大了.

考试

期中考试

还是有一些难度的, cheatsheet实际上用处不大, 记录一些公式或者课上老师口述的例子就够了, 我考试的时候就看了两三次, 还是确认一下我记的名词是不是对的

需要对CV的知识和老师上课讲的 insight 比较熟悉才能拿到90+的分数

期末考试

几个记忆比较深刻的地方

对于 RCNN, Fast RCNN, Faster RCNN 的算法流程要熟悉, 比如具体为什么 Fast RCNN 比 RCNN 快, 快在哪里了
Embodied AI 和一些相关知识点我的笔记都有提到
SDF 哪边是正数, 因为我有个同学记错了🙂‍↔️
Object detection 的 IoU, PR曲线, AP计算模拟

不过大三大四应该是不调分的, 我的原始成绩98.15, 最后还向下取整了🥹

相关资料

计算机视觉导论资料仓库

这个仓库包括:

Latex 格式的课程笔记, 编译好的 PDF 格式笔记可以在 Releases 中下载
Lab 及其解答
一些相关 Cheatsheet

成绩

计算机组织与体系结构

陆俊林 2024春

课程听感

老师讲的挺好的, 讲课水平算信科中上等, 并且3学分的课按理来说有一天是奇偶周上课, 但是这一天不用上课, 老师安排自己看MOOC, 所以上起来就像两学分的课.

作业/任务量

一次 Report on the EDVAC
每周MOOC课后题

考试

考试考的是老师上课和MOOC的并集, 所以既需要上课也需要看MOOC, 很抽象.

期中考试比较简单, 拟合往年题.

期末考试: 我在写这段话的时候刚考完期末, 15道不定项选择题.

大题:

读一段小汇编代码
流水线分析, 数加入气泡之后总共几个周期, 有点像 ICS 的考试题
外部中断的流程填空, 串行和并行数据传输的优缺点, MSI的优缺点
经典Burst传输图, 背slides上的图就可以了

相关资料

计算机组织与体系结构资料仓库

这个仓库包括:

课程讲义 (not available, copyright belongs to Prof. Junlin Lu)
MOOC笔记
课程作业
一些其它资料 (往年考题和考试提纲)

成绩

数据库概论

陈立军 2024春

课程听感

听感一般, 老师讲课还可以, 但是上课人数是真的越来越少, 我基本上不上课就看回放, 这个学期好像也没有签到.

大家都喜欢入主中南海😍🥰

作业/任务量

六次作业, 五次实习, 虽然每次都借助 ChatGPT 完成, 用不了半天时间, 但是东西还挺多的, 主要是 ChatGPT 面对这种问题答案往往是不对的.

考试

没有期中考试, 这是好的.

期末考试听说会考很多 sides 上面的东西, 过拟合一下可怜的一点点往年题好了.

考完之后发现需要好好拟合往年题, 不论是期中还是期末.

首先是15道填空, 一个一分, 考的很细致, 比如如何使用关系代数判定函数依赖和多值依赖

大题:

五个简答题, 元组关系演算, 期中往年题计算一个SQL查询的结果, 另外的记不清了
期中往年题, 关系代数计算, 比如左外链接, 计算最小值, 基础关系运算表示除法, 四个小题还有一个忘了
期中往年题, 股票SQL查询
第一小题是计算一个比较复杂的函数依赖的候选码, 判断是哪个范式; 第二小题是期末往年题, 给定关系模式 R 和函数依赖集 F, 画出合适的 E-R 图 (提示: 先给出保持函数依赖的分解, 再观察各关系主外码的关系)
期中往年题, 篮球比赛ER图
视图可串行化+三个并发协议, 看看 slides 上面的例题即可

相关资料

数据库概论资料仓库

这个仓库包括:

课程讲义
笔记 (基本上包含了老师上课口述的问题和知识, 从 Releases 下载)
课程作业 (包含六次作业和五次实习)
一些其它资料 (往年考题和考试提纲)

成绩

89.5

经济学原理 (Ⅱ)

庄晨 2023春

Update June 5th, 2024: 祝愿带了我两个学期的经济学原理的李亦丁助教学长在美国的博士研究顺利!

课程听感

这门课程是庄晨教授在北大第一次授课, 课程听起来难以通过 slides 和老师的口述建立起连贯的知识体系, 或许这也是宏观经济学本身的问题, 不像微观经济学那样有明确的唯一的数学模型.

感觉课程难度偏难, 这是因为老师强调经济学直觉, 对于一些问题没有拿出数学工具进行分析, 这就导致在一些宏观问题上有些迷惑, 一知半解.

作业/任务量

较少, 作业比课程 slides 清楚

考试

期中期末老师都给出了样例, 可以缓解题目参考较少的焦虑, 助教哥哥姐姐也在考试之前开腾讯会议带大家复习, 讲解考试样例🥰.

另外其实可以找找庄晨教授在国外开课的课程讲义等资料作为参考复习.

相关资料

经济学原理 (Ⅱ)资料仓库

这个仓库包括:

自己总结的课程笔记, 在一些数学推导上下了一些功夫总结, 可供参考
隔壁李博班的讲义
期中期末的样例题目
课程作业 (还被李亦丁学长发到小红书上去了)

成绩

AI引论

刘利斌 2023春

Update 2025.02.20: 我来当助教啦

课程听感

这门课程是在2023年课程改革后的第一年, 比之前的AI引论好了不少 (之前的AI引论纯 flybitch), 在课程结构上更加符合认知规律了. 但是对于比较重要的 deep learning 部分, 和隔壁的 AI 基础相比讲授还是偏少, 期中之前的搜索讲的太多太细致了.

作业/任务量

作业不多, 但是lab想要满分还是需要一些时间的

考试

期中期末可以携带一张手写的 cheatsheet, 并且 cheatsheet 会被收走 (猜想可能是为了不让祖传cheatsheet) , 有难度, cheatsheet也用不上. 在此感慨隔壁 AI 基础考试半个小时拿到满分的卓宝同学真是太强了...

相关资料

AI引论资料仓库

这个仓库包括:

自己总结的课程笔记 (较为粗糙, 仅供参考)
课程lab解答
一些python练习 (许多同学没有python基础)

成绩

程序设计实习

刘家瑛 2022春

课程听感

这门课程的教学质量算是信科中上水平的, 尤其是刘家瑛老师讲课还是很有趣可爱的, 有的时候还会讲一些关于保研出国的建议.

这门课程前半学期是 c++ 类和对象的语法部分, 跟着 openjudge 上面的题目和课件正常学习就好了, 后半学期是算法部分, 对于非竞赛生可能需要多努力一些, 并且学着多使用 STL 会提高不少编程效率.

因为疫情原因, 数学考试延期至下学期开学进行, 所以我有充足的时间练习算法题, 这就是仓库里为什么会有那么多算法题的解答.

作业/任务量

作业就是每周写语法, 算法题, 平时任务量不大, 但是著名的魔兽世界还是需要一些时间完成的, 笔者当时是五一之前上午期中考完试, 下午写的终极版魔兽世界, 对上一版魔兽世界做了非常多的修改, 之后又零零碎碎花了一些时间对拍 debug , 魔兽世界对拍 debug 真是非常好的方法.

考试

因为是疫情期间线上期末考试, 不太具有参考价值.

相关资料

程序设计实习资料仓库

这个仓库包括:

作业
课下练习
期中整理好的题目, 答案以及一些手写笔记
期末考题
算法模板整理
Qt 大作业

成绩

[中文] Operating Systems Notes: 06 - 虚拟内存技术

Fri, 11 Apr 2025 01:36:00 GMT

import { Aside } from '@/components/user'

Model: gemini-2.5-pro-exp-03-25

This article uses LLM to improve efficiency, which can make mistakes. I have tried my best to check and proofread, but still cannot guarantee complete accuracy.

For personal use, may be nagging for you.

1. 虚拟内存基础概念

1.1 虚拟地址空间 (Virtual Address Space)

定义: 操作系统为每个进程提供的、看起来连续的、私有的内存空间。它是对物理内存和磁盘空间的抽象。
作用:
- 隔离进程，提供保护。
- 简化内存管理，允许程序使用比物理内存更大的地址空间。
- 实现内存共享。
提问：CPU取到的地址是什么地址？物理地址还是虚拟地址？
- 解答: CPU发出的地址通常是 虚拟地址 (Virtual Address)。这个虚拟地址随后会被 内存管理单元 (MMU) 转换为物理地址 (Physical Address)。
```
graph LR
    CPU -- Virtual Address --> MMU;
    MMU -- Physical Address --> PhysicalMemory[物理内存];
    MMU -- Page Fault --> OS[操作系统];
    OS -- Data from Disk --> PhysicalMemory;
    PhysicalMemory <--> Disk[磁盘];
```

1.2 虚拟内存管理的目标

透明性 (Transparency): 运行的程序不应感知到虚拟内存机制的存在。程序员可以像操作一个巨大的连续内存一样编程。
效率 (Efficiency): 地址转换和页面调度应尽可能快，减少性能开销。需要 硬件支持 (如MMU, TLB)。
保护 (Protection): 确保进程之间、进程与操作系统之间相互隔离，互不干扰。

1.3 存储体系 (Memory Hierarchy)

结构: 寄存器 -> Cache -> 内存 (RAM) -> 磁盘 (Disk)
操作系统角色: 协调各级存储器的使用。
目标: 结合速度快但容量小的存储（如Cache, RAM）和速度慢但容量大的存储（如磁盘），为用户提供一个既“快”又“大”的逻辑内存（虚存）。

1.4 相关术语辨识

虚拟内存 (Virtual Memory):
- 解释: 将物理内存与磁盘结合使用，为程序提供一个容量远大于物理内存的逻辑存储空间。
- 关键: 程序引用的地址（虚拟地址）与物理内存地址不同，由系统自动转换。虚存大小受限于计算机寻址能力和可用磁盘空间。
虚拟地址空间 (Virtual Address Space):
- 解释: 分配给一个进程的逻辑地址范围。
虚拟地址 (Virtual Address):
- 解释: 虚拟地址空间中的某个地址。进程通过虚拟地址访问数据，仿佛它就在内存中。
虚拟存储技术 (Virtual Memory Technology):
- 解释: 一种内存管理技术。程序运行时，只将其一部分装入内存，其余部分留在磁盘。当需要访问不在内存中的部分时，操作系统自动将其从磁盘调入内存。

2. 虚拟页式存储管理 (Paged Virtual Memory)

2.1 基本思想

按需加载: 装载程序时，只装入部分（甚至零个）页面到物理内存。
动态调页: 当进程执行需要访问不在内存中的页面时，产生 页错误 (Page Fault)，操作系统负责将所需页面从磁盘动态调入内存。
页面换出: 当内存不足时，将内存中暂时不用的页面交换（写回）到磁盘，以腾出空间。
实现方式:
- 请求调页 (Demand Paging): 只有当页面被访问时才调入。（最常用）
- 预先调页 (Prepaging): 预测进程可能需要的页面并提前调入。
本质: 资源转换技术，用CPU时间和磁盘空间换取（看似无限的）物理内存空间。

2.2 核心策略 (Coffman & Denning)

取页策略 (Fetch Policy): 决定何时将页面从磁盘调入内存。
- 请求调页: 发生缺页时才调入。
- 预调页: 预测并提前调入。
放置策略 (Placement Policy): 决定将调入的页面放置在物理内存的哪个 页框 (Page Frame) 中。
- 解释: 在分页系统中，任何空闲页框都可以存放任何页面，所以此策略相对简单。
置换策略 (Replacement Policy): 当内存没有空闲页框时，决定选择哪个页框中的页面换出到磁盘。

2.3 设计与实现问题

页表表项 (PTE) 的设计。
如何处理页表过大的问题（如多级页表）。
地址重定位与快表 (TLB)。
缺页异常 (Page Fault) 的处理机制。
驻留集 (Resident Set) 管理。
置换策略 (Replacement Algorithms)。
清除策略 (Cleaning Policy)。
加载控制 (Load Control)。

3. 硬件支持与核心机制

3.1 页表表项 (Page Table Entry - PTE) 设计

关键字段:
- 页框号 (Page Frame Number - PFN): 该虚拟页对应的物理内存块号。
- 有效位/驻留位 (Valid/Present Bit - P): 标记该页是否在物理内存中 (1=在内存, 0=不在内存/在磁盘)。
- 访问位/引用位 (Accessed/Referenced Bit - A/R): 标记该页近期是否被访问过 (硬件在访问时设置，OS定期清零)。用于置换算法。
- 修改位/脏位 (Dirty/Modified Bit - D/M): 标记该页在内存中是否被修改过 (硬件在写入时设置)。如果为1，换出时必须写回磁盘。
- 保护位 (Protection Bits - R/W/X): 控制对该页的访问权限（读/写/执行）。
i386 PDE/PTE 示例: (展示了具体位域)
- P (Present), A (Accessed), D (Dirty), R/W (Read/Write), U/S (User/Supervisor), PWT (Page Write Through), PCD (Page Cache Disable), PS (Page Size - for large pages).

3.2 处理页表过大的问题

问题:
- 32位地址空间 (4KB页面, 4B PTE): 页表本身占用内存 2^20 个 PTE * 4B = 4MB = 2^22 = 1024 个 4KB 页面 的空间。
- 若用户拥有 2G = 2^31 = 2^19 个 4KB 页面 的物理空间，索引这块内存的**有效 (有效位 P=1)**的页表就占 512 页 (2^19 * 4B / 4KB = 512)。
- 64位地址空间: 页表大小会变得极其巨大 (理论上 2^52 * 8B，不可行)。
解决方案:
1. 多级页表 (Multi-Level Page Tables):
  - 思想: 将巨大的线性页表变成树形结构。外层页表（页目录）的条目指向内层页表。只有被用到的内层页表才需要分配内存。
  - 二级页表示例: 虚拟地址分为 页目录偏移 | 页表偏移 | 页内偏移。CR3寄存器指向页目录基址 -> 查页目录得页表基址 -> 查页表得页框号 -> 拼接页内偏移得物理地址。
  - Core i7 示例 (四级页表): 48位虚拟地址，分为 9 | 9 | 9 | 9 | 12 位，对应四级页表的索引和页内偏移。
  - 优点: 节省空间，只有实际使用的页表部分才需载入内存。虽然理论上总页表项数量不变，但实际上大多数进程只使用地址空间的一小部分。
  - 空间节省示例:
    - 在32位系统中（4GB地址空间），使用4KB页面，线性页表需要1M个页表项（32位虚拟地址空间都需要对应的页表项）。
    - 假设一个进程只使用了4MB的连续内存（位于0x80000000-0x80400000），在二级页表中：
      - 需要1个完整的页目录（1024项，4KB）
      - 只需要1个二级页表（1024项，4KB，对应使用的4MB区域）
      - 其余1023个二级页表（对应未使用的地址空间）根本不需要创建
    - 总计只需8KB内存，而不是线性页表的4MB，节省了约99.8%的空间
  - 缺点: 每次地址翻译需要多次内存访问（可通过TLB缓解）。
2. 反转页表 (Inverted Page Table):
  - 思想: 不再为每个进程维护一个页表，而是为整个物理内存建立一个全局页表。页表项 i 对应物理页框 i。
  - 内容: 每个页表项记录 (进程ID, 虚拟页号)，表示哪个进程的哪个虚拟页映射到了这个物理页框。
  - 地址转换: 给定 (进程ID, 虚拟页号)，需要搜索整个反转页表找到匹配项，得到其索引（即物理页框号）。
  - 优化: 使用哈希表 (Hash Table) 加速查找。将 (进程ID, 虚拟页号) 哈希到一个索引，指向反转页表中的一个桶（可能需要链表解决冲突）。
  - 优点: 页表大小与物理内存大小成正比，与虚拟地址空间大小和进程数量无关。
  - 缺点: 查找可能较慢（即使有哈希），实现共享比较困难。
  - 应用: PowerPC, UltraSPARC, IA-64 等。

3.3 内存管理单元 (MMU)

定义: CPU中的硬件单元，负责将虚拟地址转换为物理地址。
过程: 接收CPU发出的虚拟地址，查询页表（优先查TLB），生成物理地址或触发缺页异常。

3.4 地址转换 (Address Translation)

硬件机制:
1. CPU发出虚拟地址。
2. MMU 从虚拟地址中提取 虚拟页号 (VPN) 和 页内偏移 (Offset)。
3. MMU 使用 VPN（可能结合多级页表结构）查找页表（先查TLB）。
4. 检查 PTE:
  - Case 1: PTE 有效 (Valid/Present bit = 1) 且权限允许:
    - 从 PTE 中获取 页框号 (PFN)。
    - 将 PFN 与页内偏移拼接，形成 物理地址。
    - 访问内存。
    - 硬件根据访问类型（读/写）可能设置 访问位 (A) 或 修改位 (D)。
  - Case 2: PTE 无效 (Valid/Present bit = 0) 或权限不足:
    - MMU 产生 页错误 (Page Fault) 异常，将控制权交给操作系统。
页错误处理 (OS): (详见 3.6)

3.5 快表 (Translation Look-aside Buffer - TLB)

问题: 多级页表导致每次地址翻译需要多次内存访问，显著降低性能。
原理: 利用 程序访问的局部性原理 (Locality of Reference)。最近访问过的页面很可能再次被访问。
什么是TLB:
- 一种高速的、容量小的 相联存储器 (Associative Memory)。
- 特点：按内容并行查找，速度极快。
- 存储内容：缓存近期使用过的 虚拟页号 (VPN) 到页框号 (PFN) 的映射 (即部分活跃的页表项)。
工作流程:
1. MMU 收到虚拟地址后，首先并行查找 TLB。
2. TLB Hit (命中): 如果在 TLB 中找到匹配的 VPN，直接获取 PFN，快速完成地址转换。跳过页表查找。
3. TLB Miss (未命中):
  - MMU 需要访问内存中的页表进行查找。
  - 找到 PFN 后，将 (VPN -> PFN) 的映射关系装入 TLB (可能需要替换掉 TLB 中的一个旧条目，使用LRU等策略)。
  - 完成地址转换。
TLB 刷新问题:
- 问题: 进程切换时，原进程的 TLB 条目对新进程无效，需要刷新 TLB，导致新进程初期 TLB Miss 增多，性能下降。
- 解决:
  - PCID (Process Context Identifier) / ASID (Address Space Identifier): 给 TLB 条目打上进程标识符。切换进程时，只需加载新进程的 PCID/ASID，TLB 中带有不同 ID 的条目不会被匹配，无需完全刷新。
关键参数: TLB 的大小、位置（通常集成在MMU或CPU核心内）、替换策略。

3.6 缺页异常 (Page Fault) 处理

触发: 地址转换过程中，MMU 发现所需页面的 PTE 无效 (P=0) 或访问权限不足。
本质: 一种硬件中断/异常，将控制权交给操作系统内核的 缺页异常处理程序 (Page Fault Handler)。
处理流程 (典型情况 - 页面不在内存):
1. 保存现场: 保存用户进程的状态（PC, 寄存器等）。
2. 确定原因: 操作系统分析是真缺页（P=0），还是保护性错误（权限不足）。如果是后者，可能终止进程。
3. 定位磁盘地址: 如果是真缺页，查找该虚拟页在磁盘（交换空间或文件）上的位置。
4. 查找空闲页框: 在物理内存中寻找一个空闲的页框。
5. 处理无空闲页框:
  - 若无空闲页框: 执行 页面置换算法，选择一个牺牲页框 (Victim Frame)。
  - 写回脏页: 如果牺牲页框中的页面是 "脏" 的 (D=1)，则需要将其内容 写回磁盘。
6. 调入页面: 启动磁盘 I/O 操作，将所需的页面从磁盘读入选定的（空闲或牺牲）页框。
7. 更新页表: 页面调入完成后，修改该虚拟页对应的 PTE (Page Table Entry，页表项)：设置 P=1，填入 PFN，清除 D 位，可能设置 A 位。
8. 恢复现场: 恢复用户进程的状态。
9. 重新执行指令: 重新执行导致缺页异常的指令。此时地址转换可以成功。

3.7 驻留集管理 (Resident Set Management)

驻留集 (Resident Set): 进程当前在物理内存中的页面集合。
驻留集大小管理: 决定给每个进程分配多少页框。
- 固定分配策略 (Fixed Allocation):
  - 在进程创建时确定分配的页框数量。
  - 分配依据可以是:
    - 进程类型（交互式、批处理、应用类型）。
    - 程序员指定的需求。
    - 系统管理员设置的策略。
  - 特点: 简单但缺乏灵活性，无法适应进程工作集大小的动态变化。
- 可变分配策略 (Variable Allocation):
  - 根据进程的 缺页率 动态评估其局部性表现。
  - 调整机制:
    - 缺页率高 → 增加页框数（扩大驻留集）。
    - 缺页率低 → 减少页框数（缩小驻留集）。
  - 优点: 能够适应程序局部性的变化，提高内存利用率。
  - 缺点: 实现复杂，需要监控缺页率，调整策略可能引入系统开销。
系统开销考量:
- 驻留集管理本身会消耗CPU时间和内存资源。
- 过于频繁的调整可能导致系统开销超过收益。
- 需要在响应性和开销之间找到平衡点。

4. 页面置换算法 (Page Replacement Algorithms)

4.1 置换问题

背景: 当发生缺页异常且没有空闲物理页框时，需要选择一个当前在内存中的页面换出，为新页面腾出空间。
目标: 选择一个 最近最不可能被访问 的页面进行置换，以最小化未来的缺页次数。
约束: 不能置换被 锁定 (Locked/Pinned) 的页框（如内核代码、I/O 缓冲区等）。
- 页框锁定: 通过 PTE 中的锁定位或特殊机制，防止 OS 将某些关键页面换出内存，避免 I/O 操作期间页面被换出导致错误，或保证实时任务的响应时间。

4.2 置换范围

局部置换策略 (Local Replacement): 仅在引发缺页的那个进程自己的 驻留集 (Resident Set) 中选择牺牲页。
- 优点: 进程间的隔离性好。
- 缺点: 可能无法利用系统中其他进程不活跃的页框。
全局置换策略 (Global Replacement): 可以在内存中所有未锁定的页框中选择牺牲页，无论它属于哪个进程。
- 优点: 更灵活，可能提高系统整体吞吐率。
- 缺点: 一个行为不良的进程可能挤占其他进程的页框；进程的缺页率受其他进程影响，难以控制。
与分配策略的关系:
- 固定分配通常配合局部置换。
- 可变分配可以配合局部或全局置换。

4.3 典型置换算法

最优置换算法 (Optimal - OPT / MIN):
- 思想: 置换 未来最长时间内不会被访问 的页面。
- 实现: 无法实现，因为需要预知未来。
- 作用: 作为性能比较的 基准 (Benchmark)。
先进先出算法 (First-In, First-Out - FIFO):
- 思想: 置换 在内存中驻留时间最长 的页面。
- 实现: 维护一个页面进入内存的队列，替换队首页面。
- 优点: 实现简单。
- 缺点: 性能较差，可能换出常用页面。存在 Belady 异常。
第二次机会算法 (Second Chance - SCR):
- 思想: FIFO 的改进。检查队首页面的 访问位 (A/R)。
- 流程:
  - 检查队首页面 PTE 的 A 位。
  - 如果 A=0，置换该页。
  - 如果 A=1，给它 "第二次机会"：将 A 位清零，并将该页移到队尾，然后检查下一个队首页面。
- 优点: 比 FIFO 好，避免了立即换出刚被访问过的页面。
时钟算法 (Clock):
- 思想: Second Chance Replacement (SCR，第二次机会算法) 的高效实现，避免了频繁移动页面。
- 实现: 将所有物理页框组织成一个 循环链表 (缓冲区)，用一个指针指向下一个要检查的候选页框。
- 流程:
  - 发生缺页时，从指针当前位置开始扫描。
  - 检查当前页框 PTE 的 A 位。
  - 如果 A=0，选择该页框进行置换，将新页面放入，指针前移。
  - 如果 A=1，将 A 位清零，指针前移，继续检查下一个页框。
- 优点: 实现相对简单，性能优于 FIFO，接近 LRU。
最近未使用算法 (Not Recently Used - NRU):
- 思想: 优先淘汰近期 既未被访问 (A=0) 也未被修改 (D=0) 的页面。
- 实现: 利用 PTE 中的 访问位 (A) 和 修改位 (D) 将页面分为四类：
  - 第 0 类: (A=0, D=0) - 未访问，未修改
  - 第 1 类: (A=0, D=1) - 未访问，已修改
  - 第 2 类: (A=1, D=0) - 已访问，未修改
  - 第 3 类: (A=1, D=1) - 已访问，已修改
- 流程: OS 定期将所有页面的 A 位清零。发生缺页时，随机从编号最小的非空类别中选择一个页面进行置换。
- 优点: 实现简单，性能尚可。
NRU 的时钟实现: (一种变体)
- 扫描 1: 找第一个 (A=0, D=0) 的页框，找到即置换。此过程不清 A 位。
- 扫描 2 (若扫描 1 失败): 重新扫描，找第一个 (A=0, D=1) 的页框。此过程中，跳过的页框 (A=1) 的 A 位被清零。找到即置换。
- 扫描 3 (若扫描 2 失败): 此时所有页框 A 位都为 0。重复扫描 1（必然能找到 A=0, D=0 或 A=0, D=1），然后如有必要重复扫描 2。
- 特点: 优先换出干净页 (D=0)，节省写回磁盘的时间。
最近最少使用算法 (Least Recently Used - LRU):
- 思想: 置换 过去最长时间未被访问 的页面。基于局部性原理，认为最久未用的页面，近期也最不可能被使用。
- 实现:
  - 时间戳法: 每个 PTE 记录上次访问时间，置换时间戳最小的。（硬件开销大）
  - 栈/链表法: 维护一个按访问时间排序的页面栈/链表，每次访问将页面移到栈顶/链表头，置换栈底/链表尾的页面。（软件开销大）
- 优点: 性能非常好，接近 OPT。
- 缺点: 实现开销大，纯硬件或纯软件实现都困难。
最不经常使用算法 (Not Frequently Used - NFU):
- 思想: 置换 过去访问次数最少 的页面。LRU 的一种软件近似。
- 实现: 每个 PTE 关联一个软件计数器，初值为 0。每次时钟中断，检查 A 位，若 A=1，则对应计数器加 1，并将 A 位清零。缺页时置换计数值最小的页面。
- 缺点: 不能很好地区分早期频繁访问但近期不用的页面和近期才开始访问的页面。
老化算法 (Aging):
- 思想: 模拟 LRU。改进 NFU，使计数器能反映访问的时间远近。
- 实现: 每个 PTE 关联一个多位计数器 (e.g., 8-bit)。每次时钟中断：
  1. 将每个计数器 右移 1 位 (模拟时间流逝，旧的访问权重降低)。
  2. 将当前 PTE 的 A 位 加到计数器的 最左边 (最高位)。
  3. 将 A 位清零。
- 缺页时，置换计数值最小的页面。计数值小的页面表示近期访问较少或很久未访问。
- 优点: 较好地模拟了 LRU，实现开销适中。
- 与LRU的区别:
  - 精确度: LRU 精确记录每次访问的时间顺序，而 Aging 只能近似反映访问频率和时间远近。
  - 实现开销: LRU 需要在每次内存访问时更新数据结构，开销大；Aging 只在时钟中断时更新计数器，开销小。
  - 历史长度: LRU 可以无限追溯历史访问记录；Aging 受计数器位数限制（如8位只能记录最近8个时间窗口的访问情况）。
  - 硬件支持: LRU 需要专门硬件支持才能高效实现；Aging 只需要访问位支持，更易于实现。

4.4 算法示例与现象

FIFO, LRU, OPT 缺页次数计算:
- 例子: 页面访问序列 2 3 2 1 5 2 4 5 3 2 5 2，分配 3 个页框。
- FIFO 算法过程: | 访问页面 | 2 | 3 | 2 | 1 | 5 | 2 | 4 | 5 | 3 | 2 | 5 | 2 | | -------- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | | 页框1 | 2 | 2 | 2 | 2 | 5 | 5 | 5 | 5 | 3 | 3 | 3 | 3 | | 页框2 | - | 3 | 3 | 3 | 3 | 2 | 2 | 2 | 2 | 2 | 5 | 5 | | 页框3 | - | - | - | 1 | 1 | 1 | 4 | 4 | 4 | 4 | 4 | 2 | | 缺页 | √ | √ | × | √ | √ | √ | √ | × | √ | × | √ | √ |
  
  总计9次缺页
- LRU 算法过程: | 访问页面 | 2 | 3 | 2 | 1 | 5 | 2 | 4 | 5 | 3 | 2 | 5 | 2 | | -------- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | | 页框1 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 3 | 3 | 3 | 3 | | 页框2 | - | 3 | 3 | 3 | 5 | 5 | 5 | 5 | 5 | 5 | 5 | 5 | | 页框3 | - | - | - | 1 | 1 | 1 | 4 | 4 | 4 | 2 | 2 | 2 | | 缺页 | √ | √ | × | √ | √ | × | √ | × | √ | √ | × | × |
  
  总计7次缺页
- OPT 算法过程: | 访问页面 | 2 | 3 | 2 | 1 | 5 | 2 | 4 | 5 | 3 | 2 | 5 | 2 | | -------- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | | 页框1 | 2 | 2 | 2 | 2 | 2 | 2 | 4 | 4 | 4 | 2 | 2 | 2 | | 页框2 | - | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | | 页框3 | - | - | - | 1 | 5 | 5 | 5 | 5 | 5 | 5 | 5 | 5 | | 缺页 | √ | √ | × | √ | √ | × | √ | × | × | √ | × | × |
  
  总计6次缺页, 可以发现重点是第五次访问要把 1 换出去, 因为我们知道未来信息 1 不再被用到了
Belady 异常 (Belady's Anomaly):
- 现象: 对于某些置换算法（如 FIFO），增加分配给进程的物理页框数，缺页次数 反而增加 的反常现象。
- 例子: 序列 1 2 3 4 1 2 5 1 2 3 4 5，FIFO算法。
  - m=3 时，缺页过程: | 访问页面 | 1 | 2 | 3 | 4 | 1 | 2 | 5 | 1 | 2 | 3 | 4 | 5 | | -------- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | | 页框1 | 1 | 1 | 1 | 4 | 4 | 4 | 5 | 5 | 5 | 5 | 5 | 5 | | 页框2 | - | 2 | 2 | 2 | 1 | 1 | 1 | 1 | 1 | 3 | 3 | 3 | | 页框3 | - | - | 3 | 3 | 3 | 2 | 2 | 2 | 2 | 2 | 4 | 4 | | 缺页 | √ | √ | √ | √ | √ | √ | √ | × | × | √ | √ | × |
    
    总计9次缺页
  - m=4 时，缺页过程: | 访问页面 | 1 | 2 | 3 | 4 | 1 | 2 | 5 | 1 | 2 | 3 | 4 | 5 | | -------- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | | 页框1 | 1 | 1 | 1 | 1 | 1 | 1 | 5 | 5 | 5 | 5 | 4 | 4 | | 页框2 | - | 2 | 2 | 2 | 2 | 2 | 2 | 1 | 1 | 1 | 1 | 5 | | 页框3 | - | - | 3 | 3 | 3 | 3 | 3 | 3 | 2 | 2 | 2 | 2 | | 页框4 | - | - | - | 4 | 4 | 4 | 4 | 4 | 4 | 3 | 3 | 3 | | 缺页 | √ | √ | √ | √ | × | × | √ | √ | √ | √ | √ | √ |
    
    总计10次缺页
- 原因: FIFO 只考虑进来的时间，不考虑进来之后的访问情况。增加页框可能导致一个"坏"的页面（未来会用到）驻留更久，从而在后面挤掉了更有用的页面。
- LRU 和 OPT 不存在 Belady 异常: 因为它们满足 栈属性 (Stack Property)：即 m 个页框时的内存内容总是 m+1 个页框时内存内容的子集。增加页框只会包含更多有用的页，不会导致缺页增加。

4.5 影响缺页次数的因素

页面置换算法: 好算法 ≈ 少缺页。
分配给进程的物理页框数: 太少会导致频繁缺页，过多则浪费内存。存在一个最佳范围。
页面尺寸问题:
- 确定页面大小对于分页的硬件设计非常重要，而对于操作系统是个可选的参数。
- 要考虑的因素:
  - 内部碎片: 页面越大，内部碎片越多；页面越小，内部碎片越少。
  - 页表长度: 页面越大，页表越小；页面越小，页表越大。
  - 辅存的物理特性: 磁盘传输特性影响最佳页面大小选择。
  - TLB 覆盖范围: 影响地址转换性能。
- 小页面优缺点:
  - 优点: 减少内部碎片，更适合程序局部性。
  - 缺点: 页表变大，TLB 效率可能降低，磁盘 I/O 效率低。
- 大页面优缺点:
  - 优点: 页表小，TLB 覆盖范围大，磁盘 I/O 效率高。
  - 缺点: 内部碎片增加，可能不适合小局部性。
- 最优页面大小: 理论上可以用公式 P = √(2se) 来计算，其中 $s$ 是页表项的大小（表示页表开销），$e$ 是平均程序段大小（表示内部碎片开销）。这个公式平衡了页表大小和内部碎片之间的权衡。
- 实际实现:
  - Intel 80x86/Pentium: 支持 4KB 或 4MB 页面大小。
  - 现代系统: 通常支持多种页面大小（如 4KB, 2MB, 1GB），为有效使用TLB带来灵活性，但给操作系统带来复杂性。
  - OS 和应用可根据需求灵活选择不同页面大小。
程序的编制方法: 访问模式影响局部性。
- 例子: 只分配了一个 4KB页框，访问按行存储的二维数组 A[1024][1024] (4KB页面)。
  - 按行访问 (方法2): for(i)... for(j)... A[i][j]。空间局部性好，每次访问都在同一页或下一页，缺页少（ 1024 次，每行开始时缺页）。
  - 按列访问 (方法1): for(j)... for(i)... A[i][j]。空间局部性差，每次访问 A[i][j] 和 A[i+1][j] 会跨越多个页面（1024*4 bytes ≈ 1 page），导致大量缺页（1024 * 1024 次）。
颠簸/抖动 (Thrashing):
- 定义: 当系统内存严重不足，分配给进程的页框远小于其活跃页面所需时，进程会不断地发生缺页，大部分时间都用于页面换入换出，而不是真正执行计算。导致系统效率急剧下降。
- 原因: 并发度过高，或进程所需工作集大于可用内存。
- 表现: CPU 利用率很低，但磁盘 I/O 非常繁忙。

5. 高级内存管理策略

5.1 工作集模型 (Working Set Model)

提出者: Denning (1968)
基本思想: 基于 程序访问的局部性原理。一个进程在任何时刻都倾向于访问一个相对较小的页面集合，称为 活跃页面 (Active Pages)。如果能将这些活跃页面都保留在内存中，就能显著减少缺页。
工作集 (Working Set) W(t, Δ): 在当前时间 t 之前的 时间窗口 Δ 内，进程实际访问过的 虚拟页面 的集合。
- Δ: 工作集窗口大小，是一个关键参数。
- 工作集大小 |W(t, Δ)| 随时间动态变化。
与驻留集的关系:
- 驻留集 (Resident Set): 当前时刻，进程实际驻留在物理内存中的页面集合。由 OS 分配策略和置换算法决定。
- 理想状态: 进程的驻留集应包含其当前的工作集 (Resident Set >= Working Set)。
工作集策略应用:
- 置换: 换出不在当前工作集中的页面。
- 加载控制: 只有当一个进程的工作集能够被完全调入内存时，才激活该进程运行，否则挂起。防止 Thrashing。

5.2 工作集算法 (实现工作集置换)

基本思路: 识别并换出不在当前工作集 (W(t, Δ)) 中的页面。
一种实现:
- PTE 增强: 每个 PTE 增加一个字段，记录该页面的 最后访问时间 (Last Use Time)。
- 参数: 设置一个时间阈值 T (近似 Δ)。
- 扫描过程 (类似时钟):
  1. 定期或缺页时扫描页框。
  2. 检查 PTE 的 A 位：
    - 若 A=1: 表示在当前时钟滴答内被访问。记录 当前虚拟时间 到 PTE 的 "最后访问时间" 字段，并将 A 位清零。
    - 若 A=0: 表示在当前滴答内未被访问。计算 页面年龄 (Age) = 当前虚拟时间 - 最后访问时间。
  3. 判断与置换:
    - 如果 Age > T (页面“老”，不在工作集内)：
      - 如果页面是干净的 (D=0)，则该页面是最佳牺牲页，直接置换。
      - 如果页面是脏的 (D=1)，先记录下来，继续扫描，希望能找到一个干净的老页面。如果找不到干净的老页面，最后回来置换这个脏的老页面（需要写回磁盘）。
    - 如果 Age ≤ T (页面“年轻”，在工作集内)：保留该页面，继续扫描。
讨论:
- 精确实现工作集算法开销较大（需要记录和比较时间）。
- 缺页率算法 (Page Fault Frequency - PFF): 一种近似方法。通过监控进程的缺页率来动态调整其驻留集大小。
  - 设置缺页率上限和下限。
  - 缺页率 > 上限: 增加进程的页框数。
  - 缺页率 < 下限: 减少进程的页框数。

5.3 清除策略 (Cleaning Policy)

问题: 当需要空闲页框时，如果选中的牺牲页是 "脏" 的，需要先写回磁盘，增加了缺页处理时间。
目标: 保持一定数量的 干净 (Clean) 空闲页框可用。
实现: 使用 分页守护进程 (Paging Daemon) (如 kswapd in Linux)。
- 该进程周期性（或在内存不足时）被唤醒。
- 检查内存状态，如果空闲页框低于某个阈值。
- 使用页面置换算法（如 Clock 或 LRU 近似）选择一些页面。
- 如果选中的页面是脏页，则启动 I/O 将其 提前写回 (Write Back) 磁盘，并将其标记为干净。
- 这样，未来需要空闲页框时，可以直接使用这些已变干净的页框，或者快速换出它们。
双指针时钟 (Two-Handed Clock):
- 前指针 (Cleaning Hand): 由分页守护进程控制。扫描页框，遇到脏页就启动写回，然后将其标记为干净；遇到干净页则跳过。前指针不断“清洁”页面。
- 后指针 (Eviction Hand): 由缺页处理程序控制。用于实际选择牺牲页。由于前指针的工作，后指针更有可能遇到干净页面，从而加速缺页处理。

5.4 页缓冲技术 (Page Buffering)

目的: 进一步提高性能，减少因页面换出又立即换回造成的开销。
思路:
- 被置换出的页面 不立即 丢弃或覆盖。
- 维护两个链表：
  - 空闲页链表 (Free Page List): 存放被置换出的干净页面。
  - 修改页链表 (Modified Page List): 存放被置换出的脏页面。
- 这些页面 暂时保留在内存中。
- 优点:
  - 快速回收 (Soft Fault): 如果进程很快又要访问刚被“置换”到这两个链表中的页面，可以直接将其重新链回进程的驻留集，无需磁盘 I/O。
  - 簇写回 (Cluster Write): 修改页链表中的脏页可以累积起来，成簇地 (in clusters) 写回磁盘，而不是一次只写一页，提高了磁盘 I/O 效率。
Page Cache (如 OSTEP 23章提及): 现代 OS 中广泛使用的技术，用于缓存文件数据和匿名页（包括上述缓冲的页面）。
- 基本概念: 操作系统在物理内存中维护的一个缓存区域，用于存储最近访问的文件数据和元数据。
- 工作原理:
  - 当进程读取文件时，数据首先从磁盘加载到 page cache，然后再传递给进程。
  - 当进程写入文件时，数据先写入 page cache，标记为"脏"，稍后由后台进程（如 pdflush/flush/kswapd）异步写回磁盘。
  - 后续对相同文件数据的访问可直接从 page cache 获取，避免磁盘 I/O。
- 管理策略:
  - 使用类似 LRU 的替换算法（如 Linux 的 2Q）决定哪些页面保留在缓存中。
  - 通过 readahead 机制预读文件数据，提高顺序访问性能。
  - 支持 write-back（延迟写）和 write-through（直接写）两种写入策略。
- 优势:
  - 减少磁盘 I/O: 大幅降低文件操作的延迟，提高系统整体性能。
  - 统一缓存: 在现代系统中，page cache 通常与 buffer cache 统一，形成统一缓存管理。
  - 内存利用: 未使用的物理内存自动用于缓存，提高内存利用率。
- 2Q 算法: 一种近似 LRU 的页面缓存替换算法，但开销更低且能应对 LRU 不擅长的场景。
  - 基本结构: 维护两个队列:
    - 非活跃队列 (A1): 存放首次访问的页面。
    - 活跃队列 (Am): 存放多次访问的页面。
  - 工作流程:
    - 当页面第一次被访问时，放入非活跃队列 A1 的头部。
    - 当页面在 A1 中再次被访问时，将其从 A1 移除并放入活跃队列 Am 的头部。
    - 当页面在 Am 中被访问时，将其移到 Am 的头部（类似 LRU）。
    - 需要置换页面时，总是从非活跃队列 A1 的尾部选择牺牲页。
    - 定期将活跃队列 Am 尾部的页面移回非活跃队列 A1，以保持整个缓存中约 2/3 的页面在活跃队列中。
  - 优势: 能有效应对扫描型工作负载（如顺序读取大文件）导致的频繁页面互换问题，这类场景下传统 LRU 表现不佳。

5.5 加载控制 (Load Control)

问题: 系统中并发运行的进程过多，总内存需求超过物理内存容量，导致 Thrashing。
目标: 控制系统的 并发度 (Multiprogramming Level)，即同时驻留在内存中（活跃）的进程数量。
解决方案:
- 进程挂起/交换 (Process Suspension/Swapping): 当系统负载过高（如通过高缺页率或低 CPU 利用率检测到 Thrashing）时，选择一个或多个进程，将其 所有页面 换出到磁盘（交换区），并将其置于挂起状态。
- 选择标准: 选择哪些进程挂起？通常选择低优先级进程、长时间阻塞的进程，或者导致最多缺页的进程。
- 效果: 释放大量内存，降低活跃进程的内存竞争，使剩余进程能够获得足够的工作集空间，恢复系统效率。

6. 内存映射文件 (Memory-Mapped Files)

6.1 基本思想

允许进程将一个文件或文件的一部分直接映射到其 虚拟地址空间 的一个区域。
映射后，进程可以像访问普通内存（如数组）一样 通过内存读写指令 来访问文件内容，而无需使用 read() / write() 等系统调用。

6.2 工作机制

系统调用: 如 POSIX 的 mmap()。
映射建立: mmap() 调用并不立即读取文件内容。它只是在进程的虚拟地址空间中建立一个区域 (vm_area_struct in Linux)，并设置相应的页表项指向文件作为后备存储 (Backing Store)。PTE 初始标记为无效。
按需调页: 当进程 首次访问 映射区域中的某个地址时，会触发 缺页异常。
缺页处理: OS 识别出这是一个映射文件的缺页，计算出该虚拟地址对应文件中的偏移量，然后从 磁盘文件 读取相应的 数据块 (页) 到一个物理页框，并更新 PTE 使其有效。
写回:
- 如果映射是 共享的 (MAP_SHARED)，对内存区域的修改 最终会写回 磁盘上的原始文件（通常在页面换出时、或调用 msync()、或解除映射 munmap() 时）。其他映射同一文件的进程也能看到修改。
- 如果映射是 私有的 (MAP_PRIVATE)，使用 写时复制 (Copy-on-Write)。首次写入时，会为该进程创建一个私有的页面副本，后续修改只影响此副本，不影响原始文件或其他进程。

一些问题:

内核空间共享: 在现代操作系统中，内核空间通常在所有进程间共享
- 实现方式: 每个进程的页表中，映射到内核空间的部分是相同的，指向同一组物理页框
- 优势:
  - 减少内存占用：避免为每个进程复制一份内核代码和数据
  - 提高效率：进程切换时无需切换内核部分的地址映射
  - 简化内核访问：系统调用时可以直接访问内核数据结构
- Linux实现: 通过将所有进程的高地址部分映射到相同的内核物理页面实现
减轻页表增长压力的方式:
- 稀疏地址空间处理:
  - 多级页表 (Multi-level Page Tables): 将页表分为多级，只为实际使用的地址区域分配页表项，避免为整个虚拟地址空间分配连续页表
  - 倒排页表 (Inverted Page Tables): 以物理页框为索引建立表项，每个表项记录映射到该物理页的虚拟页信息，页表大小与物理内存成正比而非虚拟地址空间
大页模式 (Huge Pages/Large Pages):
- 解决的问题:
  - 减少TLB缺失: 使用大页可以增加TLB覆盖范围，单个TLB表项可以映射更大内存区域(如2MB或1GB而非4KB)
  - 减少页表层级: 减少地址转换时的页表遍历层数，降低内存访问延迟
  - 减少页表大小: 相同大小的内存区域需要更少的页表项，节省页表空间
  - 提高内存密集型应用性能: 数据库、科学计算等应用可显著受益
- 代价:
  - 内部碎片增加: 如果应用只使用大页的一小部分，会造成内存浪费
  - 内存分配挑战: 需要连续的物理内存块，在系统运行一段时间后可能难以满足
  - 页面换出复杂化: 换出一个大页需要更多I/O操作，可能增加延迟
  - 细粒度保护受限: 无法为大页内的不同区域设置不同的访问权限
  - 内存管理复杂性增加: 系统需要同时管理标准页和大页，增加内存管理复杂度

6.3 `mmap()` 函数 (POSIX 示例)

void *mmap(void *start, size_t length, int prot, int flags, int fd, off_t offset);

start: 建议的映射起始虚拟地址 (通常设为 NULL，由内核选择)。
length: 映射的字节数。
prot: 内存保护标志 (指定映射区域的访问权限)。
- PROT_READ: 可读。
- PROT_WRITE: 可写。
- PROT_EXEC: 可执行。
- PROT_NONE: 不可访问。
flags: 映射类型和选项。
- MAP_SHARED: 共享映射，修改会写回文件。
- MAP_PRIVATE: 私有写时复制映射。
- MAP_ANONYMOUS (或 MAP_ANON): 匿名映射，不关联任何文件，用于分配内存（类似 malloc）。常与 MAP_PRIVATE 结合用于进程的堆、栈、BSS段。
fd: 要映射的文件描述符。对于匿名映射，此参数忽略（通常设为 -1）。
offset: 文件内的映射起始偏移量（必须是页面大小的倍数）。

6.4 `mmap` 与 `shm` (共享内存) 对比

mmap (基于文件):
- 通信方式: 通过映射 同一个磁盘文件 到不同进程的地址空间实现共享。
- 持久性: 共享内容与磁盘文件关联，可以是持久的。
- 使用场景: 共享大文件，IPC，加载动态库，程序加载器。
shm (System V Shared Memory):
- 通信方式: 使用 shmget() 创建一个内核管理的 纯内存 共享区域，然后用 shmat() 将其附加到进程地址空间。
- 持久性: 通常是临时的，与进程生命周期或显式删除 (shmctl with IPC_RMID) 相关，不直接关联磁盘文件。
- 性能: 可能比基于文件的 mmap 更快，因为它不涉及文件系统开销（除非发生交换）。
- 大小限制: 受可用物理内存/交换空间限制。

6.5 `mmap` 相关思考

mmap 比物理内存+Swap空间大，是否有问题?
- 解答: mmap 本身可以映射比物理内存+Swap 大得多的文件。mmap 只是建立了虚拟地址到文件内容的潜在映射。只有当进程 实际访问 映射区域的页面时，才需要将其调入物理内存。这里需要区分两种情况：
  - 文件映射: 对于映射到文件的页面，文件本身就是这些页面的"后备存储"。当内存不足时，如果这些页面没有被修改过(非脏页)，可以直接丢弃，需要时再从文件重新读取；如果被修改过(脏页)，则需要先写回文件再释放。
  - 匿名映射: 没有关联文件的映射区域(如堆)，必须使用Swap空间作为后备存储。Swap是专门用于存储从内存中换出的页面的磁盘区域。
  因此，文件映射可以超过物理内存+Swap的总大小，因为它使用原始文件作为后备存储。但如果工作集(实际访问的页面总数)超过了物理内存+Swap，系统会发生颠簸(Thrashing)，性能急剧下降，尽管映射本身是合法的。
使用 mmap 代替 read/write 进行文件读写的优势?
- 解答:
  1. 减少数据拷贝: read/write 通常涉及数据在内核缓冲区和用户缓冲区之间的拷贝。mmap 允许进程直接访问内核的页缓存（或直接从磁盘调页），避免了这次拷贝，提高效率，尤其对于大文件或频繁读写。
  2. 简化随机访问: 对于需要频繁在文件中随机定位读写的场景，mmap 将文件视为内存数组，可以通过指针运算直接访问任意位置，代码更简洁，无需管理文件指针和复杂的 lseek 调用。
  3. 内核优化: 内核可以更有效地管理 mmap 区域的页面缓存和预读。

6.6 内存映射文件应用示例

程序加载: 加载可执行文件和动态链接库 (DLLs/SOs) 时，代码段和只读数据段通常通过私有映射 (MAP_PRIVATE) 加载，数据段通过写时复制加载。
进程间通信 (IPC): 通过共享映射 (MAP_SHARED) 同一个文件（或匿名映射），实现高效的数据共享。
数据库: 像 LMDB (Lightning Memory-Mapped Database) 这样的内存映射数据库，将整个数据库文件映射到内存，利用 OS 的虚拟内存管理进行数据缓存和访问，简化了缓冲管理，提高了 I/O 性能。

7. 虚拟内存管理全貌 (结合进程结构)

进程控制块 (PCB / task_struct in Linux): 包含指向内存描述符 (mm_struct) 的指针。
内存描述符 (mm_struct): 描述进程的整个虚拟地址空间，包含指向页表的指针 (如 CR3 指向的页目录物理地址) 和指向虚拟内存区域链表/树 (vm_area_struct list/tree) 的指针。
虚拟内存区域 (vm_area_struct - VMA): 描述进程地址空间中一段连续的、具有 相同属性 (如权限、映射文件) 的虚拟内存区域。例如，代码段、数据段、堆、栈、每个内存映射文件、每个共享库都对应一个或多个 VMA。
- 关键字段: 起始地址 (vm_start), 结束地址 (vm_end), 访问权限 (vm_prot), 标志 (vm_flags, 如 VM_READ, VM_WRITE, VM_EXEC, VM_SHARED), 指向映射文件信息的指针 (vm_file) 等。
页表 (Page Tables): 将 VMA 内的虚拟页号映射到物理页框号或标记为不在内存。
物理内存 (Page Frames): 实际存储数据的内存块。
后备存储 (Backing Store): 磁盘上的文件（可执行文件、库、数据文件）或交换空间 (Swap Area)，用于存放不在物理内存中的页面。

交互过程: 访问虚拟地址 -> 查找 VMA -> 查找页表 (TLB first) -> 访问物理内存 / Page Fault -> (缺页处理) -> 访问后备存储。

8. 写时复制 (Copy-on-Write - COW)

目的: 优化资源（特别是内存）的复制过程，推迟实际的物理复制，直到真正需要时才进行。
应用场景:
- fork() 系统调用创建子进程。
- 私有内存映射 (MAP_PRIVATE)。
机制:
1. 共享初始副本: 当创建副本时（如 fork() 创建子进程），并不立即复制父进程的物理内存页面。而是让子进程的页表项指向与父进程相同的物理页框。
2. 标记为只读: 同时，将这些共享页框在 父子进程的页表项中都标记为只读 (Read-Only)，即使它们原本是可写的。
3. 写操作触发异常: 如果任何一个进程（父或子）尝试写入这些共享的页面，会触发一个 保护性页错误 (Protection Fault)。
4. 真正复制: 操作系统捕获此异常，识别出是 COW 机制。此时，内核会：
  - 分配一个新的物理页框。
  - 将原始页框的内容复制到新页框。
  - 修改 触发写入操作的那个进程 的页表项，使其指向 新复制的页框，并将该页表项的权限 恢复为可写 (Read-Write)。
5. 恢复执行: 进程继续执行写操作，现在写入的是它自己的私有副本。
优点:
- fork() 效率高: 如果子进程立刻调用 exec() 加载新程序，那么之前的大部分复制就白费了。COW 避免了这种不必要的开销。
- 节省内存: 只要页面不被修改，父子进程可以一直共享同一物理副本。

9. Windows 虚拟内存管理 (概述)

(注: 以下内容可能为对 Windows (可能较早版本如 NT/XP/7) 的描述) , 不重要

9.1 Intel x86 虚拟内存机制回顾

保护模式寻址: 使用 段选择符 (Segment Selector) + 偏移量 (Offset) 形成逻辑地址。段选择符指向 段描述符 (Segment Descriptor) (在 GDT/LDT 中)，包含段基址、限长、权限等。逻辑地址 -> 线性地址 (Linear Address)。
分页机制: 如果 CR0 寄存器的 PG 位开启，线性地址会被页式机制进一步转换为 物理地址 (Physical Address)。
绕过分段: 可以设置段描述符使段基址为 0，限长为 4GB，从而让线性地址等于逻辑地址的偏移量部分，达到“平坦内存模型”的效果。
页表结构: x86 支持多级页表 (早期 2 级，x86-64 支持 4 级)。CR3 寄存器指向最高级页表的物理基地址。PTE/PDE 结构包含 PFN, P, A, D, R/W, U/S, PCD, PWT 等位。

9.2 Windows 内存管理器 (Memory Manager)

位置: 位于内核执行体 (Ntoskrnl.exe) 中。
主要组成:
- 执行体系统服务: 提供 API (VirtualAlloc, MapViewOfFile, HeapAlloc 等) 用于虚存分配、回收和管理。
- 页面错误陷阱处理程序 (MmAccessFault): 处理 MMU 检测到的内存管理异常 (缺页、权限错误)。
- 后台线程 (关键组件):
  - 工作集管理器 (MmWorkingSetManager): 负责调整进程工作集大小（修整）、老化页面、启动脏页写出等。
  - 进程/栈交换器 (KeSwapProcessOrStack): 负责整个进程或内核线程栈的换入换出 (用于挂起/恢复进程)。
  - 修改页面写出器 (MiModifiedPageWriter): 将“脏”的匿名页面 (来自页文件) 写回到页文件。
  - 映射页面写出器 (MiMappedPageWriter): 将内存映射文件中的“脏”页写回磁盘文件。
  - 零页线程 (MmZeroPageThread): 将空闲页框清零，为按需零页 (Demand-Zero) 提供准备好的页面。

9.3 Windows 地址空间布局 (32-bit 示例)

总览: 4GB 虚拟地址空间。
用户空间 (通常 0x00000000 - 0x7FFFFFFF, 2GB):
- 应用程序代码 (EXE)
- 动态链接库 (DLL) 代码和数据
- 进程堆 (Heap)
- 线程栈 (Stack)
- 进程环境块 (PEB), 线程环境块 (TEB)
- 内存映射文件区域
系统空间 (通常 0x80000000 - 0xFFFFFFFF, 2GB):
- 内核代码 (Ntoskrnl.exe), HAL (hal.dll), 内核驱动
- 页表本身 (自映射区域)
- 系统缓存 (File Cache)
- 分页缓冲池 (Paged Pool): 可被换出的内核内存
- 非分页缓冲池 (Non-Paged Pool): 不能被换出的内核内存 (用于中断处理等)
- 超空间 (Hyperspace): 临时映射进程页表等
/3GB 启动选项: 可以修改用户/系统空间划分为 3GB/1GB，让用户进程获得更大地址空间。
自映射机制: Windows 将当前进程的 页目录 和 所有页表 映射到系统空间的一个固定虚拟地址范围 (如 0xC0000000 开始)，使得内核可以通过虚拟地址方便地访问任何进程的 PTE/PDE，而无需切换 CR3 寄存器。
- MiGetPdeAddress(va) 和 MiGetPteAddress(va) 宏利用此机制快速计算给定虚拟地址 va 对应的 PDE 和 PTE 的 虚拟地址。

9.4 Windows 缺页处理

流程:
1. CPU 访问无效 PTE 地址，触发 0xE 号中断 (Page Fault)。
2. CPU 将出错的虚拟地址存入 CR2 寄存器。
3. CPU 跳转到内核的缺页中断处理例程 KiTrap0E。
4. KiTrap0E 调用核心处理函数 MmAccessFault。
5. MmAccessFault 读取 CR2，找到对应的 PTE。
6. 分析 PTE 内容 (即使 P=0，其他位仍有 OS 定义的含义):
  - 页面从未被提交 (Committed): 可能是非法访问。
  - 访问违反权限 (Protection Violation): 如写入只读页。
  - 写时复制 (Copy-on-Write): 执行 COW 操作。
  - 栈扩展 (Stack Expansion): 自动分配并映射新的栈页面。
  - 页面在转换状态 (Transition): 页面正在被 I/O（读入/写出），需等待 I/O 完成。
  - 页面在页文件/映射文件中 (Paged Out): 需要从磁盘调入。
  - 请求零页面 (Demand Zero): 分配一个已清零的物理页框。
7. 执行相应操作: 分配页框、启动磁盘 I/O、修改 PTE、完成 COW 等。
8. 返回用户模式，重新执行指令。

9.5 Windows 工作集 (Working Set)

定义: 进程当前驻留在物理内存中的虚拟页面集合 (即驻留集)。
类型:
- 进程工作集: 每个进程私有的。
- 系统工作集: 内核自身代码和数据（可分页部分）所占用的。
管理:
- 动态调整: 工作集大小是动态变化的，有最小值和最大值限制。
- 工作集修整 (Trimming): 当系统物理内存紧张时，工作集管理器 会减少某些进程的工作集大小（通常使用 Clock 类似算法移除“最老”的页面），将移除的页面放入 Standby 或 Modified 链表。
- 自动增长: 进程发生缺页时，如果其工作集大小未达到最大值，且系统有空闲内存，则调入页面会使其工作集增长。

9.6 用户空间内存分配方式

以页为单位的虚拟内存分配 (VirtualAlloc, VirtualFree):
- 两阶段:
  - 保留 (Reserve): 在进程虚拟地址空间预留一段范围，不分配物理内存或页文件空间。只是标记地址范围不可用。
  - 提交 (Commit): 为保留的地址空间实际分配物理内存（或页文件支持）。页面首次访问时才会真正调入物理内存（Demand Zero 或从页文件加载）。
- 虚拟地址描述符 (VAD - Virtual Address Descriptor): 内核为每个进程维护一棵 自平衡二叉树 (VAD Tree)，每个节点描述一段连续的、属性相同的虚拟地址空间（已保留或已提交）。用于快速查找、分配、释放虚拟地址范围。EPROCESS 结构包含指向 VAD 树根的指针。
内存映射文件 (CreateFileMapping, MapViewOfFile):
- 使用 区域对象 (Section Object) (Win32 API 称之为 File Mapping Object) 实现。
- CreateFileMapping 创建一个区域对象，可以基于磁盘文件或页文件（用于匿名共享内存）。
- MapViewOfFile 将区域对象的一部分或全部映射到进程的虚拟地址空间，得到一个 视图 (View)。
- 通过映射同一区域对象，实现进程间共享内存或文件访问。
内存堆 (Heap) (HeapCreate, HeapAlloc, HeapFree):
- 用途: 管理 大量、小块 的内存分配。
- 机制: 进程首先用 VirtualAlloc (通常在进程启动时由系统自动完成，创建默认堆) 分配一大块虚拟内存作为堆区域。然后，堆管理器 (用户模式库或内核函数集) 在这个区域内进一步细分和管理小块内存的分配与释放。
- 类型: 每个进程有一个 默认进程堆 (GetProcessHeap)。也可以创建额外的 私有堆 (HeapCreate)。

9.7 Windows 物理内存管理

页框号数据库 (PFN Database): 一个 全局数组 (MmPfnDatabase)，数组的每个元素是一个 MMPFN 结构，对应一个物理内存页框。
MMPFN 结构: 包含该物理页框的所有状态信息，如：
- 状态 (State): Active, Standby, Modified, Transition, Free, Zeroed, Bad。
- 链接指针: 用于将处于相同状态的页框链接起来（形成链表）。
- 指向 PTE 的指针 (如果页面是 Active/Standby/Modified)。
- 引用计数。
- 等等。
页框状态与链表:
- Active/Valid: 页面在某个工作集中，PTE有效。
- Transition: 页面正在进行 I/O。
- Standby: 页面刚被从工作集移除，内容干净，PTE 无效但指向此 PFN。可被快速重用 (Soft Fault)。
- Modified: 页面刚被从工作集移除，内容脏，PTE 无效但指向此 PFN。重用前需写回磁盘。
- Free: 页框空闲，内容无效。
- Zeroed: 页框空闲，且已清零。可立即用于 Demand Zero 页。
- Bad: 页框硬件损坏，不可用。
- 链表: 内核维护 FreePageList, ZeroedPageList, StandbyPageList, ModifiedPageList 等链表，通过 MMPFN 中的指针将对应状态的页框链接起来，方便快速查找和管理。
状态转换图 (示意): 页面在不同链表和工作集之间根据缺页、写回、清零、置换等操作进行转换。

10. 重点小结

核心概念: 虚拟内存是对物理内存的抽象，提供更大、受保护的地址空间。通过页表和 MMU 实现虚拟到物理地址的转换。
关键机制:
- 分页 (Paging): 将地址空间划分为固定大小的页/页框。
- 页表 (Page Table): 存储 VPN 到 PFN 的映射及状态位 (P, A, D, Protection)。
- 多级页表/反转页表: 解决页表过大问题。
- TLB (快表): 加速地址转换。
- 缺页异常 (Page Fault): 处理页面不在内存的情况，实现按需调页。
重要策略:
- 置换策略 (Replacement): FIFO, LRU, Clock, Working Set 等，决定牺牲哪个页面。
- 驻留集管理: 控制进程占用多少物理内存 (Fixed vs. Variable, Working Set)。
- 清除策略 (Cleaning): 提前写回脏页，保持空闲页框干净。
- 加载控制: 防止 Thrashing。
高级特性:
- 内存映射文件 (mmap): 高效文件 I/O 和 IPC 机制。
- 写时复制 (COW): 优化 fork() 和私有映射。
Windows 特点: VAD 树管理虚拟地址空间，PFN 数据库管理物理页框，多种页面状态链表，工作集模型，多种内存分配 API。

[中文] Operating Systems Notes: 05 - 内存管理概述

Fri, 28 Mar 2025 16:14:00 GMT

import { Aside } from '@/components/user'

Model: gemini-2.5-pro-exp-03-25

This article uses LLM to improve efficiency, which can make mistakes. I have tried my best to check and proofread, but still cannot guarantee complete accuracy.

For personal use, may be nagging for you.

1. 重要概念

1.1 存储体系 (Memory Hierarchy)

计算机存储器按照速度、容量和成本排列成层次结构。

寄存器 (Registers): 最快，容量最小，成本最高，直接由 CPU 访问。
高速缓存 (Cache - L1, L2, L3): 速度快，容量较小，成本高，用于缓解 CPU 和主存之间的速度差异。
内存 (Main Memory / RAM): 速度、容量和成本居中，是程序运行时代码和数据的主要存储区域。
本地磁盘 (Local Disk / Secondary Storage): 速度慢，容量大，成本低，用于持久化存储，如硬盘 (HDD)、固态硬盘 (SSD)。
远程磁盘 (Remote Storage): 通过网络访问，速度最慢，容量可以很大。

内存管理主要关注的是主存（内存）的管理。

1.2 地址空间 (Address Space)

定义: 操作系统为每个进程分配的一个独立的逻辑地址范围。进程所能“看到”和访问的地址集合。
独立性: 每个进程拥有自己独立的地址空间，一个进程默认不能访问另一个进程的地址空间，这是实现存储保护的基础。
管理: 操作系统需要管理地址空间的分配（放置 placement）、回收、分割与合并。

1.3 逻辑地址 vs 物理地址

逻辑地址 (Logical Address):
- 也称为相对地址 (Relative Address) 或 虚拟地址 (Virtual Address)。
- 是用户程序（或 CPU 发出）使用的地址。
- 通常从 0 开始编址，地址是相对于进程自身的地址空间。
- 编译、汇编后生成的目标代码通常使用逻辑地址。
- 不能直接用于在物理内存中寻址。
物理地址 (Physical Address):
- 也称为绝对地址 (Absolute Address) 或 实地址 (Real Address)。
- 是内存存储单元的实际地址，硬件内存总线可以直接访问。

1.4 地址重定位 (Address Relocation)

定义: 将用户程序中的逻辑地址转换为运行时可由机器直接寻址的物理地址的过程。
别名: 也常被称为地址转换 (Address Translation)、地址变换 (Address Transformation) 或 地址映射 (Address Mapping)。这些术语基本同义，都指代从逻辑地址到物理地址的转换过程。
目的: 保证 CPU 执行指令时能够正确访问到物理内存单元。
为什么需要?
- 多道程序环境下，内存中有多个进程。
- 程序加载到内存的位置通常在运行时才能确定，无法在编译时预知其物理地址。
地址绑定时机 (Binding Time): 指令和数据绑定到内存地址的时间点：
- 编译时 (Compile Time): 如果编译时就知道程序将驻留在内存的哪个位置，编译器可以直接生成绝对代码。但如果加载位置改变，程序就必须重新编译。很少用。
- 加载时 (Load Time): 如果编译时不知道加载位置，编译器生成可重定位代码 (Relocatable Code)。加载器 (Loader) 在将程序加载到内存时，根据实际加载的起始地址，一次性地将所有逻辑地址转换为物理地址。这称为静态地址重定位。
- 运行时 (Run Time): 地址转换延迟到程序运行时才进行。CPU 每次访问内存（取指或访存）时，都会将逻辑地址转换为物理地址。这需要硬件支持（如 MMU），称为动态地址重定位。现代操作系统普遍采用此方式，因为它提供了最大的灵活性（如进程可以在内存中移动）。

静态地址重定位 (Static Relocation)

过程: 在程序被加载进内存时，由加载器一次性完成逻辑地址到物理地址的转换。
实现: 通常由软件（加载器）完成。

示例:

// 源代码         // 目标代码 (逻辑地址)        // 装载模块 (磁盘, 逻辑)   // 装载模块 (内存, 物理 @ 1000)
i = ...;        store 20;                 store 120;               store 1120;
f();            branch f;                 branch 100;              branch 1100; // 假设 f 在 100
...             ...                       ...                      ...
f: ...          f: ...                    f: ... (在 100)          f: ... (在 1100)

缺点: 程序加载后不能在内存中移动；不灵活。

动态地址重定位 (Dynamic Relocation)

过程: 在进程执行过程中，每次访问内存地址时进行转换。
实现: 需要硬件支持，通常是 内存管理单元 (MMU - Memory Management Unit)。
- MMU: 一个硬件设备，负责将 CPU 发出的逻辑地址实时转换为物理地址。
- 实现方式 (简单示例): 使用基址寄存器 (Base Register) 和重定位寄存器 (Relocation Register)。逻辑地址加上重定位寄存器的值得到物理地址。
优点: 进程可以在内存中移动（例如，为了内存紧凑）；支持更高级的内存管理技术（如虚拟内存）。

1.5 存储保护 (Memory Protection)

目的:
- 确保每个进程有自己独立的地址空间，防止一个进程访问或修改另一个进程的数据。
- 防止进程访问其不应访问的内存区域（如操作系统的核心代码）。
- 防止进程执行不适当的操作（如写入只读代码段）。
实现 (基于基址/界限寄存器):
- 基地址寄存器 (Base Register): 存放进程在物理内存中的起始地址。
- 界限寄存器 (Limit Register): 存放进程的逻辑地址空间的大小（或最大合法逻辑地址）。
- 检查过程: CPU 产生的每个逻辑地址 addr 必须满足 0 <= addr < Limit Register。转换后的物理地址 Base Register + addr 也必须在分配给该进程的物理内存范围内 (有时 limit check 可以直接在物理地址上做，Base <= Physical Address < Base + Limit)。
- 加载: 基址和界限寄存器的值由操作系统通过特权指令 (Privileged Instructions) 加载，用户程序无法修改。
其他机制: 页表/段表中的保护位（读/写/执行权限）。

1.6 存储共享 (Memory Sharing)

允许多个进程安全地共享同一段物理内存区域。例如，共享库（如 C 库）的代码段通常可以在多个进程间共享，只需在物理内存中保留一份副本，节省内存。实现通常依赖于分页或分段机制。

1.7 局部性原理 (Principle of Locality)

程序在执行过程中的一个普遍倾向：

时间局部性 (Temporal Locality): 如果一个内存位置被访问，那么它在不久的将来很可能再次被访问（如循环中的指令、变量）。
空间局部性 (Spatial Locality): 如果一个内存位置被访问，那么它附近的内存位置也很可能在不久的将来被访问（如顺序执行的代码、数组元素）。

意义: 存储体系（特别是 Cache）和虚拟内存管理（如页面置换算法）都依赖局部性原理来提高性能。

2. 内存管理的目标与功能

目标: 有效、安全地管理计算机主存资源，提升系统性能和易用性。主要追求：
- 透明性 (Transparency): 内存管理对用户程序应该是透明的，程序员不需要关心物理内存的细节。
- 效率 (Efficiency): 最小化内存访问时间，高效利用内存资源（减少浪费），降低管理开销。
- 保护 (Protection): 确保进程间地址空间隔离，保护操作系统自身。
基本功能:
- 内存分配与回收: 为进程按需分配内存空间，并在进程结束或不再需要时回收。管理空闲内存。
- 地址映射/转换: 实现逻辑地址到物理地址的转换。
- 内存保护: 提供机制防止非法内存访问。
- 内存共享: 支持多个进程共享部分内存区域。
- 内存扩充: 通过覆盖、交换、虚拟内存等技术，在有限的物理内存上运行更大的程序或更多的进程。

多道程序设计对内存管理提出的挑战:

多个进程同时在内存中，需要管理它们各自的空间。
需要支持地址重定位（程序加载位置不确定）。
需要支持地址保护（进程间隔离）。

3. 进程地址空间

3.1 地址空间布局 (典型 Linux 布局)

进程的逻辑地址空间通常划分为几个标准段：

    高地址 0xFFFFFFFF  +-----------------------+
                      | 内核地址空间 (Kernel)    | --> 供操作系统使用，用户模式不可访问
          0xC0000000  +-----------------------+
                      | 用户栈 (Stack)          | --> 函数调用、局部变量 (向下增长)         |
                      | ----------------------- |
                      |                         |
                      | 内存映射区域            | --> 共享库、内存映射文件                  |
                      | (Memory Mapped Region)  |
                      |                         |
                      | ----------------------- |
                      | 堆 (Heap)               | --> 动态内存分配 (malloc, new) (向上增长) |
                      | ----------------------- |
                      | BSS 段 (Uninit. Data)   | --> 未初始化全局/静态变量                 |
                      | ----------------------- |
                      | 数据段 (Data Segment)   | --> 已初始化全局/静态变量                 |
                      | 0x08048000              | -----------------------                   |
                      | 代码段 (Text Segment)   | --> 程序指令 (只读)                       |
    低地址  0x00000000 +-----------------------+

加载来源: 代码段、数据段、BSS 段通常从可执行文件中加载。栈和堆是在运行时动态创建和增长的。共享库在运行时动态链接和映射。
PC (Program Counter): 指向当前执行的指令（在代码段内）。
SP (Stack Pointer): 指向栈顶。

3.2 XV6 示例 (地址空间)

XV6 是一个教学用的简单操作系统，其地址空间布局相对简单：

地址从低到高依次为：
- 代码 (text): 程序指令。
- 数据 (data) & BSS: 初始化和未初始化的全局/静态变量。
- 栈 (stack): 函数调用栈。
- 堆 (heap): 动态分配区域。
高地址处有 Trampoline 和 Trapframe 区域，用于用户态和内核态之间的切换，并且在两种模式下都映射。(kernel/memlayout.h 中定义)。

3.3 相关概念解释 (常用于虚拟内存)

活跃页面 (Active Page): 指当前正在被进程频繁访问的页面。
工作集 (Working Set): 一个进程在最近一段时间 Δ 内所访问到的页面集合。这是衡量进程当前运行所需内存大小的一个动态指标，反映了程序的局部性。如果一个进程的工作集能完全驻留在内存中，那么它就能高效运行，很少发生缺页中断。
常驻集 (Resident Set): 指一个进程当前时刻实际驻留在物理内存中的页面集合。常驻集的大小受操作系统分配策略的影响。理想情况下，常驻集应该包含进程的工作集。

4. 物理内存管理 (空闲空间管理)

操作系统需要跟踪哪些物理内存是空闲的，哪些已被分配。

4.1 管理数据结构

位图 (Bitmap / Bit Vector):
- 将物理内存划分为固定大小的分配单元（通常大小等于页框或几倍页框大小）。
- 位图中的每一位对应一个分配单元。
- 位的值表示单元状态：0 表示空闲，1 表示已分配（或相反）。
- 优点: 简单，易于快速找到连续的空闲块。
- 缺点: 位图本身需要占用内存空间（空间开销与内存总量成正比）。查找指定大小的空闲块可能需要扫描整个位图。
空闲区表/链表 (Free List):
- 维护一个包含所有空闲内存块（区）信息的数据结构。
- 每个节点/表项记录一个空闲区的起始地址 (Start Address) 和 长度 (Length)。
- 可以组织成表 (Array) 或链表 (Linked List)。
- 链表类型:
  - 隐式空闲链表 (Implicit Free List): 空闲块和已分配块都存储在内存中，通过块头部信息（大小、是否空闲）来遍历。分配和回收时需要查找。
  - 显式空闲链表 (Explicit Free List): 只将空闲块链接起来。头部包含指向下一个（有时还有上一个）空闲块的指针。查找空闲块更快，但维护链表指针有开销。
  - 分离空闲链表 (Segregated Free List): 维护多个空闲链表，每个链表负责特定大小范围的空闲块。分配时，根据请求大小直接去对应链表查找。可以加快分配速度，减少碎片。伙伴系统和 SLAB 分配器属于此类。
- 优点: 空间开销只与空闲块数量有关，不一定与内存总量成正比（对于大块空闲区更有效）。
- 缺点: 分配和回收时可能需要遍历链表/表，查找合适空闲块。可能会产生外部碎片。

4.2 衡量指标

内存资源利用率: 目标是减少浪费。
- 内碎片 (Internal Fragmentation): 分配给进程的内存块大于进程实际请求的大小，块内部未被使用的部分。常见于固定分区、页式管理和固定大小分配策略（如伙伴系统分配的块可能大于请求）。
- 外碎片 (External Fragmentation): 内存中存在足够多的空闲空间总和来满足一个请求，但这些空间不连续，而是散布在已分配块之间的小块。导致无法分配较大的连续内存块。常见于可变分区、段式管理。
性能: 分配和回收内存操作的速度，以及这些操作占用的 CPU 时间。

4.3 内存分配算法 (针对空闲区表/链表)

当需要为进程分配长度为 s 的内存时，如何在空闲区列表中选择一个合适的空闲块？

首次适配 (First Fit): 从链表/表的开头开始查找，选择第一个找到的大小 >= s 的空闲块。
- 优点: 算法简单，速度较快。倾向于在低地址区域留下碎片。
- 缺点: 可能产生较多的小碎片，且每次查找都从头开始。
下次适配 (Next Fit): 从上次分配操作结束的位置开始查找，选择第一个找到的大小 >= s 的空闲块。
- 优点: 避免了每次都从头查找，空闲块的使用更均匀分布。
- 缺点: 可能导致大的空闲块很快被分割完。
最佳适配 (Best Fit): 遍历整个空闲链表/表，找到大小 >= s 且最小的那个空闲块（即差值 size - s 最小）。
- 优点: 试图留下最大的可用空闲块，减少大碎片的产生。
- 缺点: 速度最慢（需要全表扫描），容易产生大量非常小而难以利用的碎片。
最差适配 (Worst Fit): 遍历整个空闲链表/表，找到大小 >= s 且最大的那个空闲块。
- 优点: 试图将剩余部分保持为较大的可用块，避免产生过多小碎片。
- 缺点: 速度慢（需要全表扫描），可能导致大的空闲块很快被消耗掉，无法满足后续对大内存的需求。

分配过程: 选定一个空闲块后，如果其大小 Size 远大于请求大小 s，通常会将其分割为两部分：一部分（大小为 s）分配给进程，另一部分（大小为 Size - s）变回一个新的、更小的空闲块。

示例: 假设空闲区为 [15K, 23K], [48K, 20K], [80K, 30K]。进程 P5 请求 5K，进程 P6 请求 13K。

First Fit: P5 分配到 [15K, 5K]，剩余 [20K, 18K]。P6 分配到 [20K, 13K]，剩余 [33K, 5K]。空闲区变为 [33K, 5K], [48K, 20K], [80K, 30K]。
Best Fit: P5 分配到 [48K, 5K]，剩余 [53K, 15K]。P6 分配到 [53K, 13K]，剩余 [66K, 2K]。空闲区变为 [15K, 23K], [66K, 2K], [80K, 30K]。
Worst Fit: P5 分配到 [80K, 5K]，剩余 [85K, 25K]。P6 分配到 [85K, 13K]，剩余 [98K, 12K]。空闲区变为 [15K, 23K], [48K, 20K], [98K, 12K]。

4.4 内存回收 (针对空闲区表/链表)

当一个进程释放内存块时，需要将其归还给空闲列表。

合并 (Coalescing): 为了减少碎片，回收时需要检查该块是否与物理上相邻的空闲块接壤。
- 上相邻: 与前面的空闲块合并。
- 下相邻: 与后面的空闲块合并。
- 上下都相邻: 与前后两个空闲块合并成一个大空闲块。
- 上下都不相邻: 直接将回收块作为一个新的独立空闲块添加到链表/表中。
更新数据结构: 相应地修改空闲区表/链表。

4.5 特定分配策略

伙伴系统 (Buddy System)

思想: 一种特殊的“分离适配”算法，用于管理大小为 2 的幂次的内存块。Linux 内核底层内存管理曾采用（现在也部分采用）。
结构: 将整个可用内存（假设大小为 2U）看作一个块。维护 U+1 个空闲链表，分别管理大小为 20, 21, ..., 2U 的空闲块。
分配过程 (请求大小为 s):
1. 计算满足需求的最小 2 的幂次 k，使得 2k-1 < s ≤ 2k。
2. 查找大小为 2k 的空闲链表。
3. 如果找到，分配该块。
4. 如果没找到，则查找更大的块 (2k+1)。找到后，将其分裂 (Split) 成两个大小相等的伙伴 (Buddies) (均为 2k)。一个用于分配，另一个放入 2k 的空闲链表。
5. 如果 2k+1 也没有，继续向上查找并递归分裂，直到找到可分配的块。
回收过程 (释放大小为 2k 的块 B):
1. 查找块 B 的伙伴 B' (地址可以通过异或运算计算得到)。
2. 检查伙伴 B' 是否也空闲且大小相同 (2k)。
3. 如果是，则将 B 和 B' 合并 (Merge) 成一个更大的块 (2k+1)，并递归尝试与新块的伙伴合并。
4. 如果否，则将 B 加入 2k 的空闲链表。
优点: 分裂和合并相对高效（伙伴地址计算快），能较好地控制外部碎片（合并机制）。
缺点: 存在内碎片（分配的块大小必须是 2 的幂，可能大于实际需求）。

伙伴系统示例 (1MB 内存):

初始: Free list for 1M: [Block 1M]
A 申请 100K: 需要 128K (27)。分裂 1M -> 512K + 512K; 分裂 512K -> 256K + 256K; 分裂 256K -> 128K + 128K。分配一个 128K 给 A。
- Memory: [A=128K][Free 128K][Free 256K][Free 512K]
- Free lists: 128K:[1 block], 256K:[1 block], 512K:[1 block]
B 申请 240K: 需要 256K (28)。分配链表中的 256K 给 B。
- Memory: [A=128K][Free 128K][B=256K][Free 512K]
- Free lists: 128K:[1 block], 512K:[1 block]
C 申请 64K: 需要 64K (26)。分裂 128K -> 64K + 64K。分配一个 64K 给 C。
- Memory: [A=128K][C=64K][Free 64K][B=256K][Free 512K]
- Free lists: 64K:[1 block], 512K:[1 block]
D 申请 256K: 需要 256K (28)。分裂 512K -> 256K + 256K。分配一个 256K 给 D。
- Memory: [A=128K][C=64K][Free 64K][B=256K][D=256K][Free 256K]
- Free lists: 64K:[1 block], 256K:[1 block]
释放 B (256K): 它的伙伴 D=256K 未释放。将 B 加入 256K 链表。
- Memory: [A=128K][C=64K][Free 64K][Free 256K][D=256K][Free 256K]
- Free lists: 64K:[1 block], 256K:[2 blocks]
释放 A (128K): 它的伙伴 C=64K+Free 64K 中的 Free 64K 是否是伙伴？需要看具体地址。假设 A 的伙伴是 [C=64K][Free 64K] 中的 Free 64K 之前的那个 128K 块，则 A 不能立即合并。将 A 加入 128K 链表。（原始图示似乎假设 A 的伙伴是 Free 128K，那释放 A 时应该合并成 256K。我们按原始图示逻辑继续）
- 按图示：释放 A(128K) -> 与其伙伴(Free 128K)合并 -> 256K。
- Memory: [Free 256K][C=64K][Free 64K][B=256K][D=256K][Free 256K] (B 已经释放) -> [Free 256K][C=64K][Free 64K][Free 256K][D=256K][Free 256K]
- Free lists: 64K:[1 block], 256K:[3 blocks]
E 申请 75K: 需要 128K。从 Free 256K 中分裂 -> 128K+128K。分配一个 128K 给 E。
- Memory: [E=128K][Free 128K][C=64K][Free 64K][Free 256K][D=256K][Free 256K]
- Free lists: 64K:[1 block], 128K:[1 block], 256K:[2 blocks]
释放 C (64K): 伙伴是 Free 64K。合并 -> 128K。这个 128K 的伙伴是 E=128K (未释放)。将这个新 128K 加入链表。
- Memory: [E=128K][Free 128K][Free 128K][Free 256K][D=256K][Free 256K]
- Free lists: 128K:[2 blocks], 256K:[2 blocks]
释放 E (128K): 伙伴是 Free 128K (来自 C 的合并)。合并 -> 256K。这个 256K 的伙伴是另一个 Free 128K （原始 A 分裂剩下的）？地址决定。按图示，它与另一个 128K 合并成 256K，再与相邻的 Free 256K 合并成 512K。
- Memory: [Free 512K][Free 256K][D=256K][Free 256K]
- Free lists: 256K:[2 blocks], 512K:[1 block]
释放 D (256K): 伙伴是 Free 256K。合并 -> 512K。这个 512K 的伙伴是 Free 512K。合并 -> 1M。
- Memory: [Free 1M]
- Free lists: 1M:[1 block]

SLAB/SLUB/SLOB 分配器

目的: 高效管理内核中频繁分配和释放的小内存对象（如 inode、task_struct 等）。伙伴系统分配的最小块可能仍太大，导致内碎片。
基本思想:
- 将伙伴系统分配的大块内存（称为 "slab"）进一步细分成多个固定大小的小对象 (object)。
- 为每种类型的对象维护一个或多个 slab 缓存 (cache)。
- 分配对象时，从对应的 cache 中快速获取一个空闲对象。
- 释放对象时，将其放回原 cache，通常无需立即归还给伙伴系统。
优点:
- 减少内碎片（对象大小精确匹配）。
- 分配和释放速度快（对象通常已初始化，且无需查找）。
- 利用缓存局部性（对象在 L1/L2 cache 中可能仍然有效）。
SLAB 分配器 (原始, Jeff Bonwick, Solaris -> Linux):
- 为每种对象类型维护一个 kmem_cache。
- 每个 cache 包含多个 slab (通常是 1 或多个物理页)。
- Slab 内包含对象和元数据。
- Slab 分为：全满 (full)、部分空闲 (partial)、全空 (empty) 三种链表。分配优先从 partial slab 获取。
- 问题: 实现相对复杂，元数据管理开销较大，多核环境下锁竞争可能成为瓶颈。
SLUB 分配器 (改进, Pekka Enberg, Linux 2.6.22+):
- 目标: 简化设计，提高性能和可伸缩性。是当前 Linux 默认的分配器。
- 简化: 去除了复杂的 slab 链表管理，主要将 page（物理页）作为 slab 进行管理。元数据存储开销更小。
- 性能: 减少锁竞争，对 NUMA (Non-Uniform Memory Access) 架构和多核系统优化更好（利用 per-CPU 缓存）。
SLOB 分配器 (简单):
- 目标: 极简、紧凑，适用于代码大小和内存开销受限的嵌入式系统。
- 实现: 使用简单的首次适配算法在小的内存块（slab）内分配。不适合高性能、大内存系统。
查看 Slab 信息 (Linux):
```
cat /proc/slabinfo
# 或者使用 slabtop 工具
slabtop
```
(slabinfo 提供详细的 cache 列表，包括对象大小、活动对象数、总对象数、slab 数等信息。)

5. 基本内存管理方案

不同的策略将进程的逻辑地址空间映射到物理内存。

| 方案 | 加载单位 | 内存划分 | 碎片类型 | 地址转换 | 特点 | | ----------------------- | -------- | ------------------ | ------------------------- | -------------------------- | ---------------------------------------------- | | 单一连续区 | 进程 | 不划分 (除 OS 外) | 无 (低利用率) | 简单基址 (或固定地址) | 最简单，同一时间只有一个用户进程，内存利用率低 | | 固定分区 | 进程 | 预先固定大小的分区 | 内碎片 | 基址+界限寄存器 (每个分区) | 简单，允许多道程序，但分区大小固定不灵活 | | 可变分区 | 进程 | 动态按需划分 | 外碎片 | 基址+界限寄存器 (每个进程) | 按需分配，灵活，但产生外碎片，需要压缩技术 | | 页式 (Paging) | 页 | 固定大小的页框 | 内碎片 (最后一页) | 页表 (MMU硬件查表) | 消除外碎片，分配管理简单，不要求连续，常用 | | 段式 (Segmentation) | 段 | 动态按需划分的段 | 外碎片 | 段表 (MMU硬件查表) | 符合程序逻辑，易于共享和保护，但产生外碎片 | | 段页式 | 页 | 固定大小的页框 | 内碎片 (段内最后一页) | 段表 + 页表 (MMU硬件查表) | 结合二者优点，管理复杂，开销大 |

5.1 单一连续区 (Single Contiguous Allocation)

特点: 内存除操作系统区域外，全部由当前运行的一个用户程序独占。
实现: 程序总是加载到同一个内存地址（或通过一个简单的基址寄存器）。
优点: 非常简单。
缺点: 内存利用率极低，无法支持多道程序设计。适用于非常早期的或简单的嵌入式系统。

5.2 固定分区 (Fixed Partitioning)

特点: 内存被预先划分成若干个大小固定的分区。分区大小可以相同也可以不同。
分配: 每个分区装入一个进程。当进程需要内存时，操作系统寻找一个足够大且空闲的分区分配给它。
优点: 实现简单，支持了多道程序。
缺点:
- 内碎片: 分配给进程的分区可能大于进程实际需要的大小。
- 不灵活: 分区大小固定，大进程可能无处容身，小进程占用大分区造成浪费。

5.3 可变分区 (Variable Partitioning / Dynamic Partitioning)

特点: 内存不预先划分。根据进程的实际需求，从空闲内存（洞 Hole） 中动态地分割出一个分区分配给它。
分配: 使用 First Fit, Best Fit, Worst Fit 等算法在空闲区列表中查找并分配。
优点: 按需分配，没有内碎片，比固定分区灵活。
缺点:
- 外碎片: 随着进程的分配和回收，内存中会产生许多不连续的小空闲区，即使总空闲量足够，也可能无法满足新的较大内存请求。
- 管理复杂: 需要维护空闲区列表，分配和回收时涉及查找、分割和合并。
外碎片解决方案:
- 紧缩技术 (Compaction / Memory Compaction):
  - 思想: 通过移动内存中的进程，将所有小的空闲区合并成一个或几个大的连续空闲区。
  - 实现: 需要动态重定位支持（因为进程物理地址改变了）。
  - 问题:
    - 开销大: 移动内存内容非常耗时，期间系统性能会下降。
    - 移动时机: 何时进行紧缩？（例如，当分配失败且有足够总空闲空间时，或定时进行）。

5.4 页式管理 (Paging)

核心思想:
- 逻辑地址空间: 划分为固定大小的块，称为 页 (Page)。
- 物理内存空间: 划分为与页大小相同的块，称为 页框 (Page Frame) 或物理页面、内存块。
- 分配: 以页为单位进行。进程需要的页可以加载到任意空闲的页框中。逻辑上相邻的页在物理上不必相邻。
逻辑地址结构: 逻辑地址 = 页号 (Page Number) + 页内偏移 (Offset)
- 例如，32位地址，页面大小 4KB (212 B):
  - 高 20位 (31-12) 是页号。
  - 低 12位 (11-0) 是页内偏移。
数据结构:
- 页表 (Page Table): 每个进程都有一个页表。
  - 功能: 记录逻辑页号到物理页框号的映射关系。
  - 页表项 (Page Table Entry - PTE): 至少包含 页框号 (Frame Number)。通常还包含其他控制位：
    - 有效位/驻留位 (Valid/Present Bit): 标记该页是否在物理内存中。
    - 保护位 (Protection Bits): 控制读/写/执行权限。
    - 修改位 (Modified/Dirty Bit): 标记该页加载到内存后是否被修改过。
    - 访问位 (Accessed/Referenced Bit): 标记该页是否被访问过。
  - 存储: 页表本身也存储在内存中。操作系统通过页表基址寄存器 (Page Table Base Register - PTBR) (如 x86 的 CR3 寄存器) 指向当前进程的页表起始地址。
- 空闲页框列表: 操作系统需要维护一个数据结构（如位图或链表）来跟踪哪些物理页框是空闲的。
地址转换过程 (硬件 MMU):
1. CPU 发出逻辑地址。
2. MMU 将逻辑地址分解为页号 p 和页内偏移 d。
3. 使用页号 p 作为索引，访问当前进程的页表 (基址在 PTBR)。
4. 找到对应的页表项 (PTE)。
5. 检查 PTE 中的有效位和保护位。如果无效或权限不足，则产生缺页异常 (Page Fault) 或保护异常，陷入操作系统处理。
6. 如果有效且权限允许，从 PTE 中取出页框号 f。
7. 将页框号 f 与页内偏移 d 拼接（或 f * PageSize + d）得到最终的物理地址。
8. 访问物理内存。
优点:
- 无外碎片: 以固定大小的页框为单位分配，总能利用空闲页框。
- 内存利用率高: 物理内存不必连续。
- 易于实现共享: 让多个进程的页表项指向同一个物理页框即可共享页面（如共享库代码）。
- 支持虚拟内存的基础。
缺点:
- 内碎片: 进程的最后一页通常不会完全占满，导致该页框内产生少量内碎片。
- 页表开销: 页表本身需要占用内存空间。对于大地址空间和小编页面，页表可能非常大（需要多级页表等技术解决）。
- 地址转换开销: 每次访存理论上需要两次内存访问（一次查页表，一次访问数据）。实际使用 TLB (Translation Lookaside Buffer)，一种页表项的高速缓存，来加速转换。

5.5 段式管理 (Segmentation)

核心思想:
- 逻辑地址空间: 按照程序的逻辑结构划分为多个段 (Segment)，如代码段、数据段、栈段等。每个段有自己的名字（通常用段号代替）和长度。段的长度可以不同。
- 物理内存空间: 仍然是线性地址空间，但分配时按整个段分配。
- 分配: 以段为单位。每个段需要分配一块连续的物理内存空间，但不同段之间可以不相邻。
逻辑地址结构: 逻辑地址 = 段号 (Segment Number) + 段内偏移 (Offset within Segment)
数据结构:
- 段表 (Segment Table): 每个进程一个段表。
  - 功能: 记录逻辑段号到物理内存信息的映射。
  - 段表项 (Segment Table Entry - STE): 通常包含：
    - 段基址 (Segment Base): 该段在物理内存中的起始地址。
    - 段限长 (Segment Limit): 该段的长度。
    - 保护位 (Protection Bits): 如读/写/执行权限。
  - 存储: 段表本身也存储在内存中。操作系统通过段表基址寄存器 (Segment Table Base Register - STBR) 指向当前进程的段表。
- 物理内存管理: 类似于可变分区管理，需要维护空闲区列表，使用 First Fit 等算法分配连续空间。
地址转换过程 (硬件 MMU):
1. CPU 发出逻辑地址。
2. MMU 将逻辑地址分解为段号 s 和段内偏移 d。
3. 使用段号 s 作为索引，访问当前进程的段表 (基址在 STBR)。
4. 找到对应的段表项 (STE)。
5. 检查:
  - 段号 s 是否合法（在段表范围内）。
  - 段内偏移 d 是否小于段限长 Limit (0 <= d < Limit)。如果超出，则产生地址越界异常。
  - 访问权限是否允许。如果不允许，则产生保护异常。
6. 如果检查通过，取出段基址 Base。
7. 计算物理地址: 物理地址 = 段基址 Base + 段内偏移 d。
8. 访问物理内存。
优点:
- 符合程序逻辑: 分段是用户可见的，便于程序员组织代码和数据。
- 易于共享和保护: 可以方便地对整个逻辑段（如代码段）进行共享或设置保护属性。
缺点:
- 外碎片: 段的长度可变，分配和回收类似于可变分区，会产生外碎片。需要紧缩技术。
- 内存分配复杂: 需要找到足够大的连续空闲块。

5.6 段页式管理 (Segmented Paging)

核心思想: 结合段式和页式的优点。
- 用户视角 / 逻辑地址空间: 仍然按段划分 (用户可见)。
- 内存管理 / 物理内存: 按页框划分和分配 (系统底层)。
- 实现: 每个逻辑段内部再进一步划分为固定大小的页。
逻辑地址结构: 逻辑地址 = 段号 s + 段内页号 p + 页内偏移 d (或者看作 段号 s + 段内偏移 offset，其中 offset 再被解释为 页号 p + 页内偏移 d)
数据结构:
- 段表 (Segment Table): 每个进程一个。
  - 段表项: 不再直接指向物理基址，而是指向该段对应的页表的基址，并包含页表的长度（或段的页数）。
- 页表 (Page Table): 每个段拥有一个页表。
  - 页表项: 记录段内的逻辑页号到物理页框号的映射。
地址转换过程 (硬件 MMU):
1. CPU 发出逻辑地址 (s, offset)。
2. 用段号 s 查段表，找到对应段的页表基址和段限长。
3. 检查段内偏移 offset 是否小于段限长。如果超出，则地址越界。
4. 将段内偏移 offset 分解为段内页号 p 和页内偏移 d。
5. 使用段内页号 p 作为索引，访问该段的页表（基址来自段表项），找到对应的页表项 (PTE)。
6. 检查 PTE 的有效位和保护位。
7. 从 PTE 中取出页框号 f。
8. 计算物理地址: 物理地址 = 页框号 f * PageSize + 页内偏移 d。
9. 访问物理内存。
优点:
- 结合了段式的逻辑清晰、易于共享保护和页式的内存利用率高、无外碎片的优点。
缺点:
- 系统开销大: 需要维护段表和多个页表，增加了内存占用。
- 地址转换更复杂: 需要多次内存访问（查段表 -> 查页表 -> 访问数据）。同样需要 TLB 来加速。

6. 内存 "扩充" 技术

在物理内存不足时，让系统能运行更大程序或更多进程的技术。

6.1 覆盖技术 (Overlaying)

目的: 在物理内存小于程序总大小的情况下运行程序。
思想: 程序的不同模块（覆盖段）按照它们的调用关系在同一块内存区域中相互替换。只有当前需要的模块和常驻模块保留在内存中。
实现:
- 程序员负责: 需要程序员手动划分程序模块，并指定它们之间的覆盖结构 (Overlay Structure)。
- 操作系统提供加载覆盖模块的机制。
示例: 程序 A 调用 B 或 C；B 调用 D 或 E；C 调用 F。
- 常驻区: A (8K)
- 覆盖区 0: B (8K) 或 C (10K) -> 需要 10K
- 覆盖区 1: D (12K) 或 E (4K) (当B在内存时) 或 F (10K) (当C在内存时) -> 需要 12K
- 总需内存 = 常驻区 + Max(覆盖区0) + Max(覆盖区1) = 8K + 10K + 12K = 30K (远小于原始总和 54K)。
优点: 能够在小内存上运行大程序。
缺点:
- 对用户不透明: 增加了程序员的负担，编程复杂。
- 执行时间增加: 需要从外存动态加载覆盖模块，属于“时间换空间”。
应用: 主要用于早期内存极其有限的操作系统。

6.2 交换技术 (Swapping)

目的: 提高内存利用率和系统吞吐量，允许运行的进程总大小超过物理内存。
思想: 将暂时不运行的进程完整地从内存移动到外存（交换区 Swap Space），称为换出 (Swap Out / Roll Out)。当需要再次运行时，再从外存将其换回 (Swap In / Roll In) 到内存中。
实现:
- Swapper (交换程序): 操作系统中负责执行交换操作的模块。
- 交换区 (Swap Space): 通常是磁盘上一块连续或特殊管理的区域，用于快速读写整个进程映像。
关键问题与讨论:
- 交换内容: 进程的哪些部分需要交换？通常是进程的整个用户地址空间（代码、数据、堆、栈等运行时状态）。
- 交换位置: 被换出的进程保存在磁盘的交换区。
- 交换时机:
  - 内存空间不足时触发换出。
  - 进程长时间阻塞或优先级低时可能被换出。
  - 与调度器结合，选择合适的进程换入换出。
- 换出进程选择: 考虑进程状态（不应换出等待 I/O 的进程）、优先级、在内存驻留时间等因素。
- 换入位置: 换回内存时不一定回到原来的物理地址。需要动态地址重定位支持。
- 进程空间增长: 如果进程在内存中时其地址空间增长（如堆或栈扩展），分配可能需要更多内存。如果此时内存不足，可能需要换出其他进程。如果进程在交换区时需要增长，则处理更复杂，通常不允许或有预留机制。
优点: 提高了内存利用率，支持运行比物理内存更大的进程集合。
缺点:
- 开销大: 整个进程映像的磁盘 I/O 非常耗时。
- 可能导致抖动 (Thrashing): 如果内存严重不足，系统可能花费大量时间在换入换出进程上，而实际执行用户代码的时间很少。
应用: 曾用于分时系统，现代系统中的虚拟内存可以看作是更精细化的交换技术（以页为单位）。

6.3 虚拟内存技术 (Virtual Memory)

（本讲义中提及，但未详细展开，通常是后续章节内容）结合了请求调页 (Demand Paging) 或请求分段 (Demand Segmentation) 与交换技术的思想。允许程序只加载部分页面/段到内存即可运行，其余部分在需要时才从磁盘加载。这是现代操作系统普遍采用的核心内存管理技术。

7. 重点小结

基本概念: 存储体系、逻辑地址/物理地址、地址重定位（静态/动态）、地址保护、共享、局部性。
物理内存管理:
- 数据结构：位示图、空闲区表/链表（隐式/显式/分离）。
- 分配算法：首次/下次/最佳/最差适配。
- 回收与合并。
- 碎片问题：内碎片、外碎片。
- 特定策略：伙伴系统、SLAB/SLUB/SLOB 分配器。
内存管理方案:
- 单一连续区、固定分区、可变分区（+紧缩）、页式、段式、段页式。
- 每种方案的特点、优缺点、地址转换机制、相关数据结构（页表/段表）。
内存扩充技术: 覆盖技术、交换技术（虚拟内存是更高级形式）。

[中文] Operating Systems Notes: 04 - 进程线程调度

Fri, 28 Mar 2025 04:15:00 GMT

import { Aside } from '@/components/user'

Model: gemini-2.5-pro-exp-03-25

This article uses LLM to improve efficiency, which can make mistakes. I have tried my best to check and proofread, but still cannot guarantee complete accuracy.

For personal use, may be nagging for you.

1. 进程/线程调度问题分析

1.1 When and How (调度时机与原因)

调度这件事儿什么时候做？做的理由有哪些？

调度时机 (When):

操作系统需要在特定事件发生时决定哪个进程接下来应该占用CPU。这些时机主要包括：

进程创建 (Process Creation): 当一个新进程被创建时（例如，通过fork()系统调用），需要决定是运行父进程还是子进程，或者其他进程。
进程终止 (Process Termination): 当一个进程执行完毕或被终止时（例如，调用exit()），它占用的CPU必须分配给其他就绪的进程。
进程阻塞 (Process Blocking): 当一个进程因等待某个事件（如I/O操作完成、等待信号量、等待用户输入等）而无法继续执行时，它会进入阻塞状态，此时调度器需要选择另一个进程来运行。
I/O中断发生 (I/O Interrupt): 当一个I/O操作完成，产生中断时，原先等待该I/O的进程可能会从阻塞态变为就绪态。这时，调度器可能需要重新评估，决定是继续运行当前进程，还是切换到刚刚变为就绪的、可能优先级更高的进程。
时钟中断发生 (Clock Interrupt): 在分时系统中，为了防止某个进程长时间独占CPU，操作系统会设置一个定时器。当定时器中断发生时，当前运行进程的时间片（Time Slice/Quantum）可能已用完，调度器会介入，决定是继续运行该进程（如果时间片未用完或没有其他就绪进程），还是切换到另一个就绪进程（抢占式调度）。

调度的理由 (Why):

调度的根本目的是有效、公平地管理和分配有限的CPU资源给多个并发执行的进程。具体理由包括：

提高CPU利用率: 尽量让CPU保持忙碌状态，减少空闲时间。当一个进程等待I/O时，可以让其他就绪进程使用CPU。
提高系统吞吐量 (Throughput): 单位时间内完成的进程数量。好的调度算法可以在满足其他目标的同时，尽可能多地完成任务。
减少周转时间 (Turnaround Time): 指一个进程从提交到完成所花费的总时间（等待进入内存、在就绪队列等待、CPU执行、I/O执行的总和）。
减少等待时间 (Waiting Time): 指进程在就绪队列中等待CPU所花费的总时间。
减少响应时间 (Response Time): 对于交互式系统尤其重要，指从用户发出请求到系统首次产生响应（而非完成任务）所花费的时间。
确保公平性 (Fairness): 保证每个进程都能获得合理的CPU时间份额，防止某些进程被饿死（Starvation）。
满足实时性要求 (Real-time Constraints): 对于实时系统，调度必须保证关键任务在它们的截止时间（Deadline）之前完成。

如果没有可被调度的进程，系统做什么呢？

如果当前没有用户进程或系统核心任务进程处于就绪状态（Ready State），CPU不能完全停止。操作系统通常会执行一个特殊的空闲进程 (Idle Process) 或称为系统空闲任务 (System Idle Task)。

作用: 这个进程拥有最低的优先级。当没有其他任何事情可做时，调度器就会选择它来运行。
行为:
- 它通常执行一个无限循环。
- 在这个循环中，它可以执行一些低优先级的系统维护任务。
- 更重要的是，在许多架构上（如x86），它可以执行一个特殊的指令（如HLT - Halt），使CPU进入低功耗状态，直到下一个中断（如时钟中断、I/O中断）唤醒CPU。这有助于节能和降低温度。
目的: 确保CPU总是有事可做（即使是“等待”），并提供一个合法的状态供调度器切换，同时优化能源使用。

上下文切换的过程？有哪些开销？

上下文切换 (Context Switch) 是指操作系统保存当前正在运行进程的状态（上下文），并加载另一个进程的状态，以便让后者开始或继续运行的过程。这是实现多任务处理的基础。

过程:

中断/系统调用触发: 调度发生（如时间片用完、进程阻塞等）。
保存当前进程上下文:
- 保存程序计数器 (Program Counter, PC) 和其他CPU寄存器（通用寄存器、状态寄存器等）的值。这些值通常保存在该进程的进程控制块 (Process Control Block, PCB) 中。
- 保存当前进程的栈指针。
- 更新进程状态（例如，从 "Running" 变为 "Ready" 或 "Blocked"）。
- 可能需要保存内存管理相关信息（如页表基址寄存器）。
执行调度算法: 操作系统调度器代码运行，根据调度策略选择下一个要运行的进程。
加载新进程上下文:
- 从选定进程的PCB中恢复其状态。
- 加载新进程的程序计数器和CPU寄存器。
- 恢复新进程的栈指针。
- 更新新进程的状态（通常是从 "Ready" 变为 "Running"）。
- 恢复内存管理信息（可能需要刷新TLB - Translation Lookaside Buffer）。
跳转执行: CPU跳转到新进程被中断时的下一条指令地址（或其入口点，如果是首次运行）开始执行。

开销:

上下文切换本身并不执行任何有用的用户工作，它是一种纯粹的开销 (Overhead)。开销主要包括：

直接开销 (Direct Costs):
- 保存和加载寄存器: CPU需要时间来读写寄存器和PCB。
- 执行调度器代码: 选择下一个进程也需要CPU时间。
- 更新PCB和其他数据结构: 维护进程队列等操作需要时间。
- MMU操作: 可能需要加载新的页表基址，这可能导致TLB被刷新（TLB flush），增加后续内存访问的延迟。
间接开销 (Indirect Costs):
- 缓存污染 (Cache Pollution): 当新进程开始运行时，CPU缓存（L1, L2, L3 Cache）中很可能包含的是前一个进程的数据和指令。新进程运行时会发生大量的缓存未命中（Cache Miss），需要从内存中重新加载数据，这会显著降低执行速度，直到新进程的“工作集”（Working Set）被加载到缓存中。这是上下文切换最主要的性能影响之一。
- CPU流水线冲刷: 切换可能导致CPU的指令流水线被清空和重建。

最佳实践: 频繁的上下文切换会显著降低系统整体性能。因此，调度算法和系统设计（如时间片大小的选择）需要在响应时间和系统吞吐量/效率之间找到平衡。

关于调度算法，我们都关心什么？

我们在评估和选择调度算法时，主要关心以下几个性能指标 (Performance Metrics) 或目标 (Goals)：

CPU 利用率 (CPU Utilization): CPU处于忙碌状态的时间百分比。越高越好，但100%可能意味着没有冗余，响应性可能变差。
系统吞吐量 (Throughput): 单位时间内完成的进程（或作业）数量。越高越好。
周转时间 (Turnaround Time): 从进程提交到完成的总时间。越短越好（平均周转时间、最差周转时间）。
等待时间 (Waiting Time): 进程在就绪队列中等待CPU的总时间。越短越好（平均等待时间、最差等待时间）。
响应时间 (Response Time): 从提交请求到产生第一个响应的时间（交互式系统关键）。越短且越稳定越好。
公平性 (Fairness): 每个进程获得合理的CPU份额，防止饿死。
可预测性 (Predictability): 对于实时系统，执行时间的可预测性比平均性能更重要。
满足截止时间 (Meeting Deadlines): 对于实时系统，这是硬性或软性要求。
优先级处理 (Priority Handling): 系统能否有效处理不同优先级的进程。
资源平衡 (Resource Balance): 尽量保持所有资源（CPU, I/O设备）都处于忙碌状态。

不同类型的操作系统都适用同一种调度算法吗？

不适用。 不同类型的操作系统有着不同的设计目标和用户需求，因此需要采用不同的调度策略。

批处理系统 (Batch Systems):
- 目标：最大化吞吐量和CPU利用率，减少平均周转时间。用户通常不直接与系统交互。
- 适用算法：先来先服务 (FCFS)、最短作业优先 (SJF)、最高响应比优先 (HRRN)。公平性和响应时间相对不重要。
交互式系统 (Interactive Systems / Time-Sharing Systems):
- 目标：最小化响应时间，提供良好的用户体验，兼顾公平性。
- 适用算法：轮转法 (Round Robin, RR)、优先级调度、多级队列调度 (Multi-level Queue)、多级反馈队列调度 (Multi-level Feedback Queue, MLFQ)。
实时系统 (Real-Time Systems, RTOS):
- 目标：满足任务的截止时间要求，可预测性至关重要。分为硬实时（必须满足）和软实时（尽量满足）。
- 适用算法：速率单调调度 (Rate Monotonic Scheduling, RMS - 用于静态优先级)、最早截止时间优先 (Earliest Deadline First, EDF - 用于动态优先级)、优先级调度（配合精确的优先级分配）。

对于一个调度算法，应该追求什么样的目标？

一个调度算法应该追求的目标组合取决于具体的系统类型和应用场景。通常需要在多个（有时是相互冲突的）目标之间进行权衡 (Trade-off)。

通用目标 (All Systems):
- 公平性: 防止饿死。
- 策略强制: 确保系统设定的策略（如优先级）得到执行。
- 平衡: 保持系统的各个部分都处于活动状态（例如，CPU密集型和I/O密集型进程交替运行）。
批处理系统目标:
- 高吞吐量
- 低周转时间
- 高CPU利用率
交互式系统目标:
- 快速响应时间
- 低响应时间方差（稳定性）
- 满足用户期望（感觉流畅）
实时系统目标:
- 满足截止时间
- 高可预测性

最佳实践: 没有“万能”的调度算法。选择或设计算法时，必须明确系统的主要目标，并接受在其他方面可能存在的不足。例如，追求极低响应时间可能会牺牲一些吞吐量。

选进程时都考虑了哪些点？单一因素还是多因素？

选择下一个要运行的进程时，调度算法可能考虑单一因素或多个因素。

单一因素:
- FCFS: 只考虑进程到达就绪队列的时间。
- SJF (非抢占式): 只考虑预估的下一个CPU脉冲（burst）长度。
- 简单优先级调度: 只考虑静态分配的优先级。
多因素: 现代操作系统和更复杂的调度算法通常是多因素的。
- 优先级调度 (带老化): 考虑静态优先级，但也考虑进程等待时间（老化机制，aging），提高等待过久进程的优先级以防饿死。
- RR: 考虑到达时间和时间片轮转。
- MLFQ: 考虑优先级、进程行为（CPU密集型 vs I/O密集型）、等待时间等，动态调整进程在不同队列间的移动。
- HRRN: 考虑等待时间 (W) 和服务时间/脉冲长度 (S)，计算响应比 (W+S)/S。
- Linux CFS: 考虑进程的虚拟运行时间 (virtual runtime)，旨在给每个进程公平的CPU时间比例。它间接考虑了进程的等待时间和已运行时间。
- Windows调度: 考虑基础优先级、动态优先级提升（如完成I/O、处于前台窗口）、时间片消耗情况等。

结论: 简单算法可能只关注单一因素，但为了在复杂环境中平衡多个目标（如响应时间、公平性、吞吐量），现代通用操作系统广泛使用多因素调度算法。

1.2 How (调度算法详解)

适用批处理系统的调度算法有哪些？

主要目标是效率（吞吐量、CPU利用率）和整体完成时间（周转时间）。

先来先服务 (First-Come, First-Served, FCFS):
- 实现：按进程到达就绪队列的顺序进行调度。使用FIFO队列。
- 优点：简单，易于实现，公平（按到达顺序）。
- 缺点：平均等待时间可能很长，尤其当短进程排在长进程之后时（护航效应 Convoy Effect）。不适合交互式系统。是非抢占式的。
最短作业优先 (Shortest Job First, SJF):
- 实现：选择预计CPU执行时间（下一个CPU burst）最短的进程。可以是抢占式 (SRTF - Shortest Remaining Time First) 或非抢占式。
- 优点：理论上具有最优的平均等待时间和平均周转时间。
- 缺点：
  - 需要预测下一个CPU burst长度，这很难精确做到（通常基于历史数据估计）。
  - 可能导致长作业饿死 (Starvation)，即长时间得不到CPU。
  - 非抢占式SJF不适合交互系统。抢占式SRTF开销较大。
最高响应比优先 (Highest Response Ratio Next, HRRN):
- 实现：非抢占式。计算每个进程的响应比 R = (等待时间 W + 服务时间 S) / 服务时间 S，选择R最高的进程。
- 优点：结合了FCFS和SJF的优点。短作业容易被选中（S小，R大）。同时，等待时间长的进程其响应比也会增加，避免了饿死。
- 缺点：仍需要预测服务时间S。计算响应比有额外开销。

适用交互式系统的调度算法有哪些？

主要目标是提供快速响应和用户满意度。

轮转法 (Round Robin, RR):
- 实现：类似于FCFS，但增加了时间片和抢占。每个进程被分配一个固定的时间片（Quantum），运行时间超出时间片后会被强制切换（抢占），放回就绪队列尾部。
- 优点：公平，响应时间相对较短（特别是对于短请求），简单。
- 缺点：
  - 性能对时间片大小非常敏感。太小则上下文切换频繁，开销大；太大则退化为FCFS，响应时间变长。
  - 平均周转时间通常比SJF长。
  - 没有考虑优先级。
- 最佳实践: 时间片大小通常选择比平均交互响应所需时间稍长，但足够短以保证多个交互进程能快速轮换。
优先级调度 (Priority Scheduling):
- 实现：为每个进程分配一个优先级，调度器总是选择就绪队列中优先级最高的进程。可以是抢占式或非抢占式。
- 优点：可以明确区分重要任务和次要任务。
- 缺点：
  - 可能导致低优先级进程饿死。
  - 优先级的确定可能是个问题（静态 vs 动态）。
- 改进:
  - 老化 (Aging): 随时间增加等待进程的优先级。
  - 动态优先级: 根据进程行为（如I/O等待）调整优先级。
多级队列调度 (Multi-level Queue Scheduling):
- 实现：将就绪队列划分为多个独立的队列，每个队列有自己的优先级和调度算法（如：前台交互队列用RR，后台批处理队列用FCFS）。进程被永久分配到一个队列。
- 优点：可以为不同类型的进程应用不同的调度策略。开销较低。
- 缺点：缺乏灵活性，进程无法在队列间移动。低优先级队列可能饿死。
多级反馈队列调度 (Multi-level Feedback Queue, MLFQ):
- 实现：允许多个队列，并且进程可以在队列之间移动。这是目前通用操作系统中最常用的调度方法之一。
- 规则示例：
  - 新进程进入最高优先级队列。
  - 如果在时间片内完成，离开系统；如果用完时间片，则降级到下一个较低优先级队列。
  - 在较低优先级队列中等待时间过长的进程可以被提升到较高优先级队列（防止饿死，即老化）。
  - I/O密集型进程（经常阻塞放弃CPU）通常会停留在较高优先级队列，保证响应性。CPU密集型进程会逐渐下降到较低优先级队列。
- 优点：非常灵活，自适应。能同时照顾到交互式和批处理式需求，兼顾响应时间、周转时间和公平性。
- 缺点：设计和调优复杂（队列数量、各队列调度算法、时间片大小、升级降级策略）。

适用实时系统的调度算法有哪些？

主要目标是满足时间约束（截止时间）。

速率单调调度 (Rate Monotonic Scheduling, RMS):
- 类型：静态优先级，抢占式。
- 原理：周期性任务的优先级与其执行频率（速率）成正比。周期越短（频率越高），优先级越高。
- 优点：简单，易于实现，是最佳的静态优先级调度算法（如果任务集可调度，RMS就能找到调度方案）。可进行理论上的可调度性分析（例如，利用率测试）。
- 缺点：只适用于周期性任务；对任务特性有较强假设；CPU利用率上限不如动态优先级算法高。
最早截止时间优先 (Earliest Deadline First, EDF):
- 类型：动态优先级，抢占式。
- 原理：当前就绪任务中，绝对截止时间最早的任务拥有最高优先级。
- 优点：理论上是最优的动态优先级调度算法。只要任务集的总CPU利用率不超过100%，EDF就能找到调度方案（对于可抢占、独立任务等理想情况）。可以处理周期性和非周期性任务。
- 缺点：实现比RMS复杂；可能出现多米诺骨牌效应（一个任务错过截止时间可能导致后续任务也错过）；动态优先级变化导致上下文切换可能更频繁。
基于优先级的抢占式调度:
- 通用方法：给实时任务分配高优先级，使用标准优先级调度器。可以通过精心设置优先级来模拟RMS或EDF的行为。常用于软实时系统或硬实时系统中与其他任务共存的情况。
- 需要确保高优先级任务能抢占低优先级任务，并且优先级反转（Priority Inversion）问题得到处理（如使用优先级继承 Priority Inheritance 或优先级天花板 Priority Ceiling Protocol）。

怎样理解抢占式和非抢占式？

这是调度器决定何时进行调度的两种基本模式。

非抢占式调度 (Non-preemptive / Cooperative Scheduling):
- 定义: 一旦CPU分配给某个进程，该进程将一直运行，直到它主动放弃CPU（完成任务、阻塞等待I/O、或显式调用yield）。调度器不能在进程运行中途强制剥夺其CPU使用权。
- 优点: 实现简单；上下文切换只在进程自愿放弃CPU时发生，开销相对较小；不会有并发访问内核数据结构的竞争问题（在单处理器上）。
- 缺点: 一个长时间运行或行为不当的进程可以独占CPU，导致其他进程（特别是需要快速响应的交互式进程）长时间等待，响应性差；不适合分时和实时系统。
- 例子: 早期的Windows (如Windows 3.1), 早期的Mac OS, 某些简单的嵌入式系统。
抢占式调度 (Preemptive Scheduling):
- 定义: 操作系统可以强制暂停当前正在运行的进程（即使它并未主动放弃CPU），并将CPU分配给另一个进程。这种抢占通常发生在时钟中断（时间片用完）或更高优先级进程变为就绪时。
- 优点: 能够保证CPU在进程间公平分配；提供更好的响应时间；可以有效处理优先级，防止低优先级任务阻塞高优先级任务（前提是优先级设置合理）；是现代多任务操作系统的标准做法。
- 缺点: 实现更复杂；上下文切换更频繁，开销更大；需要处理内核数据结构的并发访问问题（需要锁或其他同步机制）。
- 例子: Unix/Linux, Windows NT及后续版本, macOS, 大多数现代RTOS。

从哪几方面对调度算法进行比较？

主要从前面提到的性能指标/目标来进行比较和评估：

CPU利用率: 哪个算法更能让CPU保持忙碌？
吞吐量: 哪个算法单位时间内能完成更多任务？
周转时间 (平均/最坏): 哪个算法下进程从提交到完成更快？
等待时间 (平均/最坏): 哪个算法下进程在就绪队列中等待的时间更短？
响应时间 (平均/方差): 哪个算法对交互式请求的响应更快、更稳定？
公平性: 哪个算法更能保证所有进程获得合理的CPU时间，避免饿死？
可预测性/满足截止时间: 对于实时系统，哪个算法更能保证任务按时完成？
算法开销: 算法本身的计算复杂度以及它导致的上下文切换频率和开销如何？
实现复杂度: 算法是否容易实现和调试？
对参数的敏感性: 算法性能是否严重依赖于某些参数（如时间片大小、优先级设置）？

比较方法:

确定性建模 (Deterministic Modeling): 给定一组特定的进程及其属性（到达时间、CPU burst），模拟运行不同算法，计算性能指标。简单但只反映特定场景。
排队论建模 (Queueing Models): 使用数学方法（基于概率分布描述进程到达和CPU burst）来分析平均性能。能提供理论洞察但模型可能简化现实。
模拟 (Simulation): 编写程序模拟操作系统调度行为，使用随机生成的进程或真实系统负载的轨迹（trace）作为输入。灵活且能反映动态行为，是常用的评估方法。
实际系统测量 (Implementation & Measurement): 在真实操作系统中实现算法，运行基准测试（Benchmark）或实际负载进行测量。最准确但成本最高。

机制和策略分离的原则在调度算法中的应用

机制与策略分离 (Separation of Mechanism and Policy) 是一个重要的操作系统设计原则，也适用于调度。

机制 (Mechanism): 提供如何做 (How) 的基础能力或工具。在调度中，机制包括：
- 上下文切换的代码（保存/加载寄存器、切换页表）。
- 维护进程状态（就绪、运行、阻塞）和PCB的数据结构。
- 管理就绪队列（如链表、优先级队列、红黑树）。
- 时钟中断处理程序。
- 提供设置和读取进程优先级的接口。
- 进程挂起和唤醒的原子操作。
策略 (Policy): 决定做什么 (What) 或何时做 (When)。在调度中，策略是指具体的调度算法逻辑：
- 如何选择下一个运行的进程（FCFS规则？SJF规则？RR规则？优先级规则？）。
- 时间片长度是多少？
- 优先级如何确定？是静态还是动态调整？如何调整？
- 何时进行抢占？
- 如何处理不同类型的进程（前台/后台，实时/普通）？

应用与好处:

灵活性与可扩展性: 将调度算法（策略）与底层的上下文切换等（机制）分开，使得修改或更换调度策略更加容易，而无需改变底层的核心机制代码。例如，Linux内核允许通过sched_setscheduler()系统调用为进程选择不同的调度策略（如SCHED_FIFO, SCHED_RR, SCHED_NORMAL/CFS），但它们都使用相同的底层上下文切换机制。
模块化: 代码结构更清晰，职责分明。调度策略模块可以独立开发、测试和更新。
可定制性: 用户或管理员可以更容易地根据特定需求调整调度策略参数，甚至在某些系统中插入自定义的调度模块。

例子: 调度器的主循环可能是一个通用的框架（机制），它调用一个函数（策略）来选择下一个进程。不同的调度算法可以通过实现这个选择函数来插入。上下文切换函数是另一个独立的机制。优先级队列的实现（如使用堆或链表）是机制，而如何利用这个队列（是按优先级取还是按FIFO取）是策略。

实例操作系统的调度算法都是什么？

现代通用操作系统通常采用复杂且混合的调度策略，以平衡各种需求。

Linux:
- 主要调度器 (针对普通进程): 完全公平调度器 (Completely Fair Scheduler, CFS)，自内核2.6.23起引入。
  - 目标：为所有运行中的任务提供尽可能公平的CPU时间份额。
  - 机制：不再基于固定时间片，而是维护每个任务的虚拟运行时间 (vruntime)。总是选择vruntime最小的任务来运行。任务运行会增加其vruntime。I/O等待的任务vruntime增长慢，因此返回时更容易被选中。
  - 实现：使用红黑树来高效地找到vruntime最小的任务。
- 实时调度策略:
  - SCHED_FIFO: 静态优先级的先来先服务（非时间片轮转）。相同优先级的任务按到达顺序执行，直到阻塞、退出或被更高优先级抢占。
  - SCHED_RR: 静态优先级的轮转法。同SCHED_FIFO，但增加了时间片，同一优先级任务轮流运行。
- 优先级：实时任务优先级高于普通任务。普通任务也有优先级（nice值），但CFS主要通过vruntime实现公平性，nice值影响vruntime增长的速度。
Windows (NT内核及以后):
- 采用基于优先级的抢占式调度算法，结合了多级反馈队列的思想。
- 优先级：分为32个优先级。0为系统空闲线程，1-15为可变优先级类（Variable Priority Classes），16-31为实时优先级类（Real-time Priority Classes）。内核线程可能使用更高的内部优先级。
- 动态调整：
  - 对于可变优先级类，系统会动态提升线程的优先级（Priority Boost），例如：
    - 当线程完成I/O操作时。
    - 当等待事件/信号量被满足时。
    - 前台窗口的线程优先级通常会被提升，以改善交互响应。
    - 短时间片用完后，优先级可能会暂时降低。
  - 长时间消耗CPU的线程其动态优先级会逐渐衰减回基础优先级。
- 时间片：不同优先级的线程可能有不同的时间片长度。前台进程的时间片通常比后台进程长且可变。
- Quantum：Windows中称为Quantum，不是固定的，可以根据系统设置和前后台状态调整。
macOS:
- 基于XNU内核（混合了Mach微内核和BSD Unix）。
- 调度也采用基于优先级的抢占式模型，具有多级反馈特性。
- 线程优先级分为几个主要波段 (bands)：内核模式、系统高优先级、用户交互（UI响应关键）、用户启动、后台任务等。
- 动态调整：系统会根据线程的行为（如CPU使用情况、是否阻塞等待I/O、是否与用户界面交互）动态调整其优先级，类似于Windows。
- 也使用了类似Mach的线程调度原语和概念，例如时间片捐赠（Time-sharing donation）等机制来优化性能。
- 近年来引入了服务质量 (Quality of Service, QoS) 类的概念，让开发者可以指定任务的意图（如用户交互、后台数据处理、维护任务），系统据此进行更智能的资源（包括CPU调度）管理。

总结: 现代主流操作系统都使用抢占式、基于优先级的调度框架，并结合动态优先级调整、多级队列/反馈机制，以及针对公平性（如Linux CFS）或服务质量（如macOS QoS）的特定优化，以适应通用计算环境中复杂多变的需求。

2. 处理器调度的基本概念

2.1 调度的三个层次

操作系统中的调度可以发生在不同层面，对应不同的资源管理和时间尺度：

长程调度 (Long-term Scheduling / 作业调度):
- 时机: 创建新进程时。
- 决策: 决定是否将新创建的进程纳入当前活跃进程集合（即是否允许进入内存和就绪队列）。
- 目标: 控制系统的并发度（道数）。
中程调度 (Medium-term Scheduling / 内存调度):
- 时机: 内存资源紧张或需要优化内存使用时。
- 决策: 决定哪些进程的部分或全部从内存换出到外存（挂起），以及何时将挂起的进程换回内存。
- 目标: 提高内存利用率和系统吞吐量，通过交换（Swapping）技术实现。
短程调度 (Short-term Scheduling / CPU调度 / 微观调度):
- 时机: 发生特定事件（如中断、系统调用、进程阻塞/唤醒、时间片用完等）后，需要选择下一个占用CPU的进程时。
- 决策: 从就绪队列中选择一个进程/线程，将CPU的使用权分配给它。
- 频率: 非常频繁，通常在毫秒级。
- 要求: 实现必须高效。

联系: 这三个层次的调度相互关联，共同管理进程从创建到完成的整个生命周期及其资源使用。

2.2 处理器调度的定义与场景

定义: 控制和协调多个进程对CPU资源的竞争。
场景: 系统中有 N 个进程处于就绪状态，等待在 M 个CPU (M ≥ 1) 上运行。
任务: 调度程序（内核函数）根据特定的调度算法，从就绪队列中选择一个进程，并将CPU使用权交给它。
Idle进程: 如果就绪队列为空（没有可运行的用户或系统进程），系统会调度一个特殊的空闲进程 (idle process) 来运行，它通常执行一些低优先级任务（如系统监控、节能）或简单地循环等待中断。

2.3 调度需要解决的核心问题

调度时机 (When): 何时进行处理器分配决策。
调度算法 (What): 依据何种原则挑选进程/线程。
调度过程 (How): 如何完成CPU的分配，即上下文切换。

2.4 CPU调度的时机

调度通常在以下事件发生后，内核处理完相应事件并准备返回用户态之前的最后时刻进行：

进程生命周期变化:
- 进程执行完毕并退出 (exit())。
- 进程因错误或异常而终止 (abort)。
- 创建新进程 (fork())。
进程状态转换:
- 运行进程因等待I/O或资源而进入阻塞态 (wait())。
- 阻塞进程被唤醒，回到就绪态 (I/O完成中断)。
- 运行进程用完分配的时间片，回到就绪态 (时钟中断)。
- 运行进程主动放弃 CPU (yield())。
中断:
- I/O 中断。
- 时钟中断 (用于时间片、计时器)。
- 系统调用返回前。
- 异常处理后。

流程: 事件发生 → 暂停当前进程 → 硬件响应 → 进入内核处理事件 → 事件处理结束（可能导致进程状态变化、就绪队列调整）→ 执行进程调度 → 选择新进程运行。

2.5 调度过程：上下文切换 (Context Switching)

定义: 将CPU的控制权从一个进程（或线程）转移给另一个进程（或线程）的过程。这涉及到保存当前进程的状态并加载新进程的状态。
上下文 (Context): 进程运行时，其执行状态（硬件上下文）保存在CPU的寄存器中（如程序计数器PC, 程序状态字PSW, 栈指针SP, 通用寄存器等）。进程不运行时，这些信息保存在其进程控制块 (PCB) 中。
主要工作:
1. 切换地址空间: 修改页目录寄存器（如CR3 on x86）以指向新进程的页表，加载新的虚拟地址空间。
2. 切换内核栈和硬件上下文:
  - 保存当前进程的寄存器值到其PCB或内核栈。
  - 从新进程的PCB或内核栈中恢复其寄存器值到CPU。
  - 内核栈 (Kernel Stack):
    - 每个进程都有自己的内核栈，用于在进程执行内核代码时存储函数调用、局部变量和上下文信息。
    - 当进程从用户态切换到内核态（如系统调用、中断）时，CPU会自动切换到该进程的内核栈。
    - 内核栈位于内核地址空间，对用户程序不可见，大小通常是固定的（如 Linux 中为 8KB 或 16KB）。
    - 内核栈的地址通常保存在进程的 PCB 中，在上下文切换时需要更新相关寄存器（如栈指针）指向新进程的内核栈。
具体步骤 (进程A切换到进程B):
1. 保存进程A的硬件上下文（寄存器值）。
2. 更新进程A的PCB（如状态改为就绪或阻塞，记录PC等）。
3. 将进程A移入相应的队列（就绪队列、等待队列）。
4. 选择进程B作为下一个运行进程。
5. 更新进程B的PCB（状态改为运行）。
6. 加载进程B的上下文（恢复寄存器值，切换地址空间）。
7. 开始执行进程B。
XV6 Context Switch Example (swtch.S): (此处展示汇编代码逻辑，具体代码略)
- swtch 函数接受两个参数：旧进程上下文指针 (old) 和新进程上下文指针 (new)。
- 它负责保存 old 进程的callee-saved寄存器到其上下文结构中。
- 然后，从 new 进程的上下文结构中恢复callee-saved寄存器。
- 最后，通过 ret 指令返回，此时CPU将跳转到 new 进程之前保存的PC地址， effectively switching execution flow. The key is switching the stack pointer.
上下文切换开销 (Cost):
- 直接开销: 内核执行切换操作所花费的CPU时间。
  - 保存和恢复寄存器。
  - 切换地址空间（TLB Flush相关指令通常较昂贵）。
  - 执行调度算法本身的代码。
- 间接开销: 切换导致缓存性能下降。
  - CPU Cache 失效: 新进程的代码和数据不在缓存中，需要从内存加载。
  - TLB (Translation Lookaside Buffer) 失效: 地址翻译缓存失效，需要重新查询页表。
  - 缓冲区缓存 (Buffer Cache) 可能失效: 文件系统相关的缓存可能对新进程无效。

3. 处理器调度算法的设计

3.1 不同操作系统类型的调度目标

调度算法的选择与操作系统的主要应用场景和目标密切相关：

批处理系统 (Batch Systems):
- 特点: 通常运行长任务，无需用户交互。
- 目标:
  - 高吞吐量 (Throughput): 单位时间内完成的作业数量最大化。
  - 短周转时间 (Turnaround Time): 作业从提交到完成的总时间最小化。
  - 高CPU利用率 (CPU Utilization): 让CPU尽可能处于忙碌状态。
交互式系统 (Interactive Systems):
- 特点: 需要频繁与用户交互，用户等待输入。
- 目标:
  - 快速响应时间 (Response Time): 从用户输入命令到系统首次给出反馈的时间要短（通常要求低于50-150ms）。
  - 均衡性 (Proportionality): 用户感觉系统性能稳定，符合预期。
实时系统 (Real-time Systems):
- 特点: 任务有严格的时间限制（截止时间, Deadline）。
- 目标:
  - 满足最后期限 (Meeting Deadlines): 关键任务必须在规定时间内完成（硬实时）或尽可能满足（软实时）。
  - 可预测性 (Predictability): 系统行为在时间上是确定的。

3.2 调度算法的设计考量

设计调度算法时，需在多个目标之间进行权衡（Trade-off）：

用户角度 (User-oriented):
- 周转时间 (Turnaround Time): T(completion) - T(arrival)。进程从进入系统到完成的总时间。目标：最小化平均周转时间。
- 响应时间 (Response Time): 从请求发出到第一次产生响应的时间。目标：最小化响应时间（对交互式系统尤为重要）。
- 最后期限 (Deadline): 实时任务必须在规定时间前完成。目标：确保满足所有（硬实时）或重要（软实时）的截止时间。
- 可预测性 (Predictability): 任务运行时间稳定，尤其对实时系统。
系统角度 (System-oriented):
- 吞吐量 (Throughput): 单位时间内完成的进程数量。目标：最大化吞吐量。
- CPU 利用率 (CPU Utilization): CPU忙于执行有效工作的时间百分比。目标：最大化CPU利用率。
- 公平性 (Fairness): 各进程获得合理的CPU时间份额，防止饥饿。
- 均衡性 (Balance): 系统资源（CPU, I/O设备等）应保持忙碌，充分利用。
- 强制优先级 (Enforcing Priorities): 确保高优先级进程优先获得服务。

3.3 调度算法的关键决策点

设计或选择调度算法时，需要考虑以下几个方面：

进程优先级 (Priority):
- 优先数: 用于表示优先级的数值（数值越大优先级越高或越低，取决于系统定义）。
- 静态优先级 (Static Priority): 进程创建时指定，运行期间不变。简单，但可能不适应进程行为变化。
- 动态优先级 (Dynamic Priority): 进程优先级在运行过程中可以调整。例如，可以提升长时间等待的进程的优先级（老化, Aging），或降低长时间占用CPU进程的优先级。更能适应系统变化。
- PCB记录: PCB中需要包含优先级信息。
就绪队列组织 (Ready Queue Organization):
- 单一队列: 所有就绪进程放在一个队列中，按某种顺序（如FCFS、优先级）排列。
- 多级队列 (Multiple Queues): 按进程属性（如优先级、类型）划分多个队列。不同队列可采用不同调度策略。
  - 按优先级排队: 每个优先级一个队列。调度器先服务高优先级队列。
  - 按类型排队: 如前台（交互）进程队列、后台（批处理）进程队列。
抢占 vs. 非抢占 (Preemptive vs. Non-preemptive):
- 非抢占式 (Non-preemptive / 不可剥夺): 一旦进程获得CPU，它将一直运行，直到它自愿放弃（完成、阻塞、yield）。适用于批处理，简单，但响应性差。
- 抢占式 (Preemptive / 可剥夺): 当前运行的进程可以被更高优先级的就绪进程或时钟中断强制中断，CPU被分配给新进程。适用于交互式和实时系统，响应性好，但有上下文切换开销。
I/O密集型 vs. CPU密集型进程 (I/O-bound vs. CPU-bound):
- I/O密集型: 进程大部分时间在等待I/O操作完成，CPU计算时间短。
- CPU密集型 (计算密集型): 进程大部分时间在进行CPU计算，很少I/O操作。
- 调度倾向: 现代系统通常倾向于优先调度I/O密集型进程，以保持I/O设备忙碌，提高系统整体吞吐量和响应性。让I/O进程尽快发出下一个I/O请求，然后在其等待时运行CPU密集型进程。
时间片 (Time Slice / Quantum):
- 定义: 在抢占式调度（特别是轮转RR）中，分配给进程一次连续运行的最大CPU时间。
- 选择: 时间片大小的选择是一个重要的权衡：
  - 太长: 接近非抢占，长任务会阻塞短任务，交互式响应变慢。退化为FCFS。
  - 太短: 频繁发生上下文切换，系统开销增大，有效工作比例下降。
  - 合适的大小: 通常需要在几十到几百毫秒之间，取决于系统负载、CPU速度、上下文切换开销和对响应时间的要求。应略大于典型的一次交互所需CPU时间。
- 固定 vs. 可变: 时间片可以是固定的，也可以根据进程优先级或行为动态调整。

4. 典型的处理器调度算法

4.1 批处理系统调度算法

主要目标：高吞吐量、低周转时间、高CPU利用率。

先来先服务 (FCFS - First Come First Serve):
- 策略: 按进程到达就绪队列的顺序进行调度。非抢占式。
- 优点: 公平（按到达顺序）、简单易实现。
- 缺点:
  - 平均周转时间和平均等待时间可能很长，特别是当短进程排在长进程之后时（护航效应, Convoy Effect）。
  - 不利于I/O密集型进程（长CPU进程运行时，I/O进程等待；I/O进程运行时，CPU空闲）。
  - 对交互式用户不友好。
- 例子: 进程P1(24s), P2(3s), P3(3s) 按 P1, P2, P3 顺序到达。
  - 执行顺序: P1 -> P2 -> P3
  - 完成时间: P1(24), P2(27), P3(30)
  - 周转时间: P1(24), P2(27), P3(30) -> 平均 27s
  - 若按 P2, P3, P1 顺序调度:
    - 执行顺序: P2 -> P3 -> P1
    - 完成时间: P2(3), P3(6), P1(30)
    - 周转时间: P2(3), P3(6), P1(30) -> 平均 13s (显著改善)
最短作业优先 (SJF - Shortest Job First):
- 策略: 选择预计运行时间最短的进程投入运行。
- 版本:
  - 非抢占式 SJF: 当前进程一直运行直到结束或阻塞。
  - 抢占式 SJF (最短剩余时间优先, SRTN - Shortest Remaining Time Next): 当一个新进程到达，其预计总运行时间比当前进程的剩余运行时间还短时，抢占当前进程。
- 优点: 理论上可证明，在所有进程同时到达时，SJF(非抢占)具有最低的平均周转时间。SRTN通常比非抢占SJF的平均周转时间更短。
- 缺点:
  - 需要预测未来: 如何准确知道进程的运行时间？通常基于历史数据进行估计，可能不准。
  - 饥饿 (Starvation): 长进程可能永远得不到CPU，如果总有短进程到来。
  - 不公平: 明显偏袒短进程。
- 例子 (SRTN): | 进程 | 到达时刻 | 运行时间 | | :--- | :------- | :------- | | P1 | 0 | 7 | | P2 | 2 | 4 | | P3 | 4 | 1 | | P4 | 5 | 4 |
  - 0: P1 运行 (剩余 7)
  - 2: P2 到达 (剩余 4) < P1 (剩余 5)，P2 抢占 P1。P2 运行 (剩余 4)
  - 4: P3 到达 (剩余 1) < P2 (剩余 2)，P3 抢占 P2。P3 运行 (剩余 1)
  - 5: P3 完成。P4 到达 (剩余 4)。比较 P1(剩余 5), P2(剩余 2), P4(剩余 4)。P2 剩余时间最短，P2 运行 (剩余 2)
  - 7: P2 完成。比较 P1(剩余 5), P4(剩余 4)。P4 剩余时间最短，P4 运行 (剩余 4)
  - 11: P4 完成。只剩 P1，P1 运行 (剩余 5)
  - 16: P1 完成。
  - 执行序列: P1(0-2) -> P2(2-4) -> P3(4-5) -> P2(5-7) -> P4(7-11) -> P1(11-16)
最高响应比优先 (HRRN - Highest Response Ratio Next):
- 策略: 综合考虑等待时间和运行时间，选择响应比最高的进程。非抢占式。
- 响应比 R = (等待时间 + 预计运行时间) / 预计运行时间 = 1 + (等待时间 / 预计运行时间)
- 优点:
  - 试图在SJF和FCFS之间取得平衡。
  - 短进程：预计运行时间小，响应比增长快，容易被选中（类似SJF）。
  - 长进程：等待时间足够长后，响应比会提高，最终能获得CPU，避免了饥饿。
- 缺点: 仍需预测运行时间。计算响应比有额外开销。
- 抢占式HRRN? 理论上可以，但每次事件（如新进程到达）都需要重新计算所有就绪进程的响应比并排序，开销较大。

4.2 交互式系统调度算法

主要目标：快速响应时间、均衡性、公平性。

时间片轮转 (RR - Round Robin):
- 策略: 将所有就绪进程按FCFS排成队列。调度器选择队首进程，分配一个时间片（quantum）。进程用完时间片后，若未完成或阻塞，则移到队尾。抢占式。
- 优点:
  - 公平：每个进程都能获得运行机会。
  - 响应时间快：短进程能较快完成或得到响应。非常适合分时系统。
- 缺点:
  - 上下文切换开销：时间片过短会导致开销过大。
  - 性能与时间片长度密切相关。
  - 对周转时间不一定最优。对于运行时间相近的进程，RR的平均周转时间可能比FCFS差。
- 例子 (时间片 q=20): P1(53), P2(8), P3(68), P4(24)
  - 执行序列: P1(0-20) -> P2(20-28) -> P3(28-48) -> P4(48-68) -> P1(68-88) -> P3(88-108) -> P4(108-112) -> P1(112-125) -> P3(125-145) -> P3(145-153)
  - 平均等待时间 = ( (68-20)+(112-88) + (20-0) + (28-0)+(88-48)+(125-108) + (48-0)+(108-68) ) / 4 = (72 + 20 + 85 + 88) / 4 = 66.25 ms (假设到达时间为0)
虚拟轮转 (Virtual RR - VRR):
- 动机: RR对I/O密集型进程可能不公平。I/O进程经常在时间片未用完时就阻塞，返回就绪队列时排在队尾，下次获得CPU可能要等很久。
- 策略: 维护一个辅助就绪队列（如AUX队列）。当一个进程因I/O阻塞完成而返回时，不放入主RR队列尾部，而是放入AUX队列头部。调度器优先检查AUX队列，若非空则调度AUX队首进程，给其一个较短的时间片（通常是其上次阻塞时剩余的时间片）；若AUX队列为空，则按标准RR调度主队列。从AUX队列运行完时间片的进程回到主RR队列尾部。
- 目标: 给I/O密集型进程更多机会运行，提高I/O设备利用率。
优先级调度 (Priority Scheduling):
- 策略: 选择就绪队列中优先级最高的进程运行。可以是抢占式或非抢占式。
- 优点: 实现简单，能满足不同进程的紧急程度需求（如系统进程>用户进程，前台>后台，I/O型>CPU型）。
- 缺点:
  - 饥饿: 低优先级进程可能永远无法运行。
  - 优先级反转 (Priority Inversion): 一个低优先级进程持有高优先级进程所需的资源（如锁），导致高优先级进程被迫等待低优先级进程。更糟的是，如果此时有一个中等优先级的CPU密集型进程就绪，它会抢占低优先级进程，使得高优先级进程的等待时间变得更长甚至不可预测。
- 优先级反转解决方案:
  - 优先级继承 (Priority Inheritance): 当高优先级进程等待低优先级进程持有的资源时，暂时将低优先级进程的优先级提升到与高优先级进程相同，使其能尽快运行并释放资源。
  - 优先级天花板协议 (Priority Ceiling Protocol): 给每个资源预设一个优先级上限（等于可能使用该资源的所有进程中的最高优先级）。当一个进程获得资源时，将其优先级提升到该资源的优先级上限。这能预防死锁并限制阻塞时间。
  - 中断禁止: 在临界区执行期间禁止中断（简单粗暴，在通用操作系统中通常不可取，但用于某些嵌入式或实时内核）。
多级队列调度 (Multilevel Queue Scheduling):
- 策略: 将就绪队列划分为多个独立的队列，每个队列有自己的调度算法和优先级。例如：
  - 系统进程队列 (最高优先级, RR 或 FCFS)
  - 交互式进程队列 (中优先级, RR)
  - 批处理进程队列 (最低优先级, FCFS)
- 调度器首先处理高优先级队列中的所有进程，然后才处理次高优先级队列，以此类推。队列之间通常是抢占式的（高优先级队列进程可抢占低优先级队列进程）。
- 优点: 灵活性高，可以为不同类型的进程定制调度策略。
- 缺点: 进程通常被固定分配到一个队列，缺乏灵活性；低优先级队列可能饥饿。
多级反馈队列调度 (Multilevel Feedback Queue Scheduling - MFQ):
- 策略: 结合了多级队列和动态优先级调整。进程可以在不同队列之间移动。
- 典型实现:
  1. 设置多个优先级队列 (Q0, Q1, ..., Qn)，优先级 Q0 > Q1 > ... > Qn。
  2. 不同队列分配不同的时间片长度，优先级越高的队列时间片越短（如 Q0=q, Q1=2q, Q2=4q...）。
  3. 新进程进入最高优先级队列 Q0。
  4. 调度器总是先运行最高非空队列中的进程，同队列内通常用RR。
  5. 如果进程在一个队列中用完了其时间片但未完成，它会被降级到下一个较低优先级队列。
  6. 如果进程在时间片未用完前因阻塞 (如等待I/O) 而放弃CPU，当它再次就绪时，通常会回到 原来的 队列（或有时提升一级），以优待I/O密集型进程。(讨论点： 回到原队列还是队首/队尾？提升吗？具体策略不同系统可能不同。)
  7. 最低优先级队列通常采用FCFS或很长的时间片RR。
  8. （可选）可以加入 老化 (Aging) 机制：在低优先级队列等待过久的进程可以被提升到较高优先级队列，防止饥饿。
- 优点: 非常灵活，能同时满足交互式（响应快）和批处理（吞吐量）的需求，能自动适应进程行为，是最常用的调度算法之一。
- 缺点: 设计和调优（队列数量、时间片大小、升级降级策略）比较复杂。
其他交互式算法 (简述):
- 公平共享调度 (Fair-share Scheduling): 不仅考虑单个进程，还考虑进程所属的用户或用户组，确保CPU时间在用户/组之间公平分配。
- 保证调度 (Guaranteed Scheduling): 向用户承诺每个进程将获得 CPU 时间的 1/n（如果有n个进程），并跟踪进程实际获得的CPU时间，优先运行获得时间最少的进程。
- 彩票调度 (Lottery Scheduling): 给每个进程分配一定数量的“彩票”，调度器随机抽取一张彩票，持有该彩票的进程获得CPU。进程持有的彩票越多，获得CPU的机会越大。优先级可以通过分配不同数量的彩票来体现。简单，易实现概率公平。

4.3 实时系统调度算法

主要目标：满足任务截止时间、可预测性。

可调度性分析: 对于周期性实时任务，需要判断系统是否能在所有任务的截止时间内完成它们。
- 若有 m 个周期任务，任务 i 的周期为 Pi，每次执行需 Ci 的CPU时间，则一个简单的（充分非必要）可调度条件是： Σ (Ci / Pi) ≤ 1 (CPU利用率不超过100%)
- 更精确的条件取决于具体算法（如RM, EDF）。
速率单调调度 (Rate-Monotonic Scheduling - RM):
- 类型: 静态优先级，抢占式。
- 策略: 任务的优先级根据其周期 (Rate) 设定：周期越短（频率越高），优先级越高。
- 适用: 周期性实时任务。
- 优点: 简单，理论成熟，可进行精确的可调度性分析 (Liu & Layland 条件：Σ(Ci/Pi) ≤ n(2^(1/n)-1))。
- 缺点: 仅适用于周期任务，对任务集利用率上限有要求 (不是100%)。
最早截止时间优先 (Earliest Deadline First - EDF):
- 类型: 动态优先级，抢占式。
- 策略: 调度器在每次调度时，选择就绪队列中 绝对截止时间 (Deadline) 最早的任务运行。
- 适用: 周期性和非周期性实时任务。
- 优点: 理论上是最优的动态优先级算法，只要系统总利用率 ≤ 1，EDF就能找到一个可行的调度（如果存在的话）。CPU利用率上限可达100%。
- 缺点: 实现比RM复杂（需要跟踪每个任务的截止时间），可能出现瞬时过载导致多米诺骨牌效应（一个任务错过deadline可能导致后续任务都错过）。

4.4 各种调度算法比较总结

| 调度算法 | 选择依据 | 决策模式 | 吞吐量 | 响应时间 | 开销 | 对进程影响 | 饥饿问题 | | :----------- | :------------- | :----------- | :-------- | :-------------------------- | :------- | :--------------------------------- | :------------ | | FCFS | max[w] | 非抢占 | 不强调 | 可能很差 (长作业阻塞短作业) | 最小 | 对短进程/IO密集型不利 | 无 | | RR | 固定时间片 | 抢占(时间片) | q过小则低 | 短进程好 | 较小 | 公平 | 无 | | SJF | min[s] | 非抢占 | 高 | 短进程好 | 可能较高 | 对长进程不利 | 可能 | | SRTN | min[s-e] | 抢占(到达时) | 高 | 好 | 可能较高 | 对长进程不利 | 可能 | | HRRN | max[(w+s)/s] | 非抢占 | 高 | 较好 | 可能较高 | 平衡 | 无 | | Feedback | 见算法思想 | 抢占(时间片) | 不强调 | 较好 (可调优) | 可能较高 | 可优待IO密集型，可能对某些进程不利 | 可能 (需老化) |

(表中 w: 等待时间, s: 总服务时间, e: 已执行时间)

5. 调度中的重要原则与实践

5.1 机制与策略分离 (Mechanism vs. Policy Separation)

原则: 将调度的具体实现（机制，如何进行上下文切换、如何管理队列等）与调度的决策逻辑（策略，选择哪个进程运行、优先级如何确定等）分离开。
为什么?
- 灵活性: 更容易修改或替换调度策略，而无需改变底层机制。
- 可扩展性: 方便添加新的调度策略。
- 模块化: 代码结构更清晰，易于理解和维护。
怎么做? 操作系统内核提供通用的调度框架（机制，如优先级队列、上下文切换函数），而具体的调度算法（策略）作为可配置或可插拔的模块实现。例如，Linux 的 sched_class 结构就体现了这种思想。

5.2 线程调度 (Thread Scheduling)

背景: 现代操作系统多数支持内核级线程。调度单元从进程变为线程。
用户级线程 vs. 内核级线程:
- 用户级线程: 调度由用户空间的线程库管理，内核只看到一个进程。切换快，但一个线程阻塞会导致整个进程阻塞。无法利用多核。
- 内核级线程: 调度由内核管理，每个线程有自己的上下文。切换开销比用户级线程大，但比进程切换小。一个线程阻塞不影响其他线程。可以并发运行在多核上。
调度对象: 内核调度器直接调度内核级线程。对于用户级线程，内核调度的是其所属的进程（或承载用户线程的内核线程LWP）。

6. 实例：操作系统调度算法

6.1 典型系统采用的算法概览

UNIX (早期): 动态优先级，基于nice值和CPU使用情况调整。
5.3BSD: 多级反馈队列算法。
Windows: 基于优先级的抢占式多任务调度（细节见下）。
Linux: 抢占式调度，主要使用CFS（普通进程）和实时调度策略（实时进程）（细节见下）。
Solaris: 综合调度算法，支持多种调度类（实时、分时、交互、系统等）。

6.2 Windows 线程调度

调度单位: 线程 (内核级线程)。
核心算法: 基于 动态优先级 的 抢占式 调度，结合 时间配额 (Quantum) 调整。
就绪队列: 维护多个优先级队列（0-31）。系统总是选择当前最高非空优先级队列中的线程运行。
同优先级调度: 同一优先级队列内部，线程按 时间片轮转 (RR) 方式调度。
**多处理器:**允许多个线程在不同处理器上并行运行。
调度触发条件:
- 线程创建、终止。
- 线程状态改变（运行->阻塞, 阻塞->就绪, 运行->就绪）。
- 线程优先级改变。
- 线程改变其处理器亲和性 (Affinity)。
- 时间片用完。
- 主动放弃 (yield)。
线程优先级:
- 共32个优先级级别 (0-31)。
- 实时优先级 (16-31): 优先级固定不变。用于需要紧急响应的任务。最高。
- 可变优先级 (1-15): 线程有一个基本优先级 (Base Priority)，其当前优先级 (Current Priority) 可以在此基础上动态调整（提升或降低）。用于普通用户和系统线程。
- 系统线程 (1-15中的一部分): 用于操作系统内部任务。
- 零页线程 (0): 特殊线程，优先级最低，用于在系统空闲时将物理内存页清零。
时间配额 (Quantum):
- 不是绝对时间值，而是以 配额单位 (quantum unit) 的整数表示。系统时钟中断时递减。
- Quantum 和 QuantumReset 记录在 KTHREAD 结构中。
- 当线程用完时间配额：
  - 如果没有其他同优先级或更高优先级的线程就绪，Windows会 重新分配 一个新的时间配额给该线程，让它继续运行（避免不必要的切换）。
  - 如果有其他同优先级线程就绪，该线程移到其优先级队列的末尾，调度器选择下一个线程。
  - 如果用完时间配额且优先级被降低，则会被抢占。
- 作用: 调整时间配额（而非仅优先级）可以影响进程获得CPU时间的比例，而不会完全饿死其他进程。例如，给前台游戏进程更大配额，使其运行更流畅，同时后台计算任务也能获得一些CPU时间。
调度数据结构:
- 每个进程有默认优先级、亲和性、时间配额。
- 每个线程有基本优先级、当前优先级、亲和性、时间配额。
- Dispatcher Ready List: 包含32个就绪线程队列的数组。
- KiDispatcherReadyListHead: 指向就绪队列的指针数组。
- Ready Summary (就绪位图): 一个32位掩码，每一位对应一个优先级队列，指示该队列是否为空。调度器通过查找第一个置位的位 (Find First Set bit, FFS) 快速找到最高优先级的非空队列。
- Idle Summary (空闲位图): (多处理器) 位图，指示哪些处理器当前处于空闲状态。
调度策略细节:
- 主动切换: 进程自愿放弃CPU（阻塞、Yield等）。
- 抢占:
  - 更高优先级的线程变为就绪。
  - 当前线程优先级降低，低于另一个就绪线程。
  - 被抢占线程放回其原优先级就绪队列的队首。
  - 实时优先级线程被抢占，下次运行时获得完整时间配额。
  - 可变优先级线程被抢占，下次运行时继续执行剩余时间配额。
- 时间配额用完:
  - 优先级不降低：若队列无其他线程则重置配额继续，否则移到队尾。
  - 优先级降低：移到新优先级的队列，可能被抢占。
线程优先级提升 (Priority Boost):
- 目的: 改善响应性、解决饥饿、提高吞吐量。仅针对可变优先级线程 (1-15)。
- 触发情况:
  1. I/O操作完成: 临时提升等待该I/O的线程优先级，幅度由设备驱动程序建议（与设备响应要求相关），使其能快速处理数据。提升后时间配额会减1（避免不公平利用I/O提升）。
  2. 等待事件或信号量结束: 线程优先级提升1级（不超过15），以补偿其等待时间。完成提升后的运行后，优先级会逐渐衰减回基本优先级。时间配额减1。
  3. 前台进程中的线程 完成等待操作。
  4. 因 窗口消息 (GUI活动) 而唤醒的线程。
  5. 反饥饿: 系统线程"平衡集管理器" (Balance Set Manager) 定期扫描，将等待过久（如 > 300时钟中断）的线程优先级提升到15，并给予4倍时间配额。用完后优先级立即恢复。
空闲线程 (Idle Thread):
- 每个处理器核都有一个对应的空闲线程。优先级为0。
- 当没有其他可运行线程时，调度器调度空闲线程。
- 功能: 循环检测是否有工作要做：处理挂起的中断(DPCs)、检查是否有新就绪线程、调用HAL执行电源管理（如让CPU进入低功耗状态）。

6.3 多处理器调度 (Multiprocessor Scheduling)

特点: 系统包含多个CPU（核），可共享负载。
对称多处理 (SMP - Symmetric Multiprocessing):
- 所有CPU地位平等，都可以运行内核代码和用户进程。
- 每个CPU通常有自己的调度器实例。
- 调度器访问共享数据结构（如就绪队列）需要同步（锁、原子操作）。
设计挑战:
- 进程/线程分配: 决定哪个任务在哪个CPU上运行。
- 负载均衡 (Load Balancing): 使各CPU负载大致均匀，避免某些CPU过载而其他CPU空闲。
- 处理器亲和性 (Processor Affinity): 尽量让一个进程/线程连续在同一个CPU上运行，以利用CPU缓存（L1/L2 cache）中已加载的数据和TLB条目，减少缓存失效带来的开销。
- 缓存一致性 (Cache Coherence): 硬件机制（如MESI协议）确保多个CPU缓存中共享数据的副本是一致的。
进程分配策略:
- 静态进程分配 (Static Assignment): 进程从创建到结束都绑定在某个特定CPU上。每个CPU有自己的私有就绪队列。调度开销小，易于维护亲和性，但可能导致负载不均。
- 动态进程分配 (Dynamic Assignment): 进程可以在不同CPU之间迁移。通常有一个全局共享就绪队列，或各CPU有私有队列但允许任务迁移。负载均衡好，但调度开销大（需要同步、迁移成本）。
多核处理器问题:
- 缓存一致性: 如上所述，硬件解决。
- 缓存亲和性: 调度器需要考虑。让任务倾向于留在上次运行的核上。
- 核间数据共享: 需要高效的同步机制。
- 负载均衡: 需要策略在CPU间迁移任务。
  - 缓存亲和性 vs. 负载均衡: 这是个权衡。过于强调亲和性可能导致负载失衡；过于频繁地迁移以追求负载均衡则会破坏缓存亲和性，增加开销。
  - 例子:
    - 并行计算/渲染: 任务与数据绑定到核心可利用缓存，但计算量不均时需迁移任务以平衡负载，导致缓存失效。
    - CDN: 内容按地理位置缓存（亲和性），但负载高时请求可能路由到其他节点（破坏亲和性）以均衡负载。
  - 工作窃取 (Work Stealing): 一种常见的负载均衡策略。每个CPU维护一个本地任务队列（通常是双端队列）。CPU优先执行自己队列的任务。当一个CPU空闲时，它会随机选择另一个CPU，并从其任务队列的尾部 “窃取” 一个任务来执行。（被窃取的CPU从头部获取任务）。
    - 优点: 实现了负载均衡，同时本地任务优先执行保证了一定的缓存亲和性，分布式决策减少了中心瓶颈。
    - 缺点: 仍有通信和同步开销。
    - 实例: Go语言的GMP调度器，Java的ForkJoinPool，Hadoop YARN。

6.4 实时调度 (Real-time Scheduling) (回顾)

目标: 满足时间约束（截止时间），高可靠性，确定性。
类型: 硬实时 (必须满足) vs. 软实时 (尽量满足)。周期性 vs. 偶发性 vs. 非周期性任务。
关键参数: 时间（周期、执行时间、截止时间）。
算法: RM (静态优先级, 周期短优先), EDF (动态优先级, 截止时间早优先)。

6.5 OpenEuler 多核调度技术 (简述)

基础: CPU调度是为保证并发性，通过调度程序(Scheduler)按调度策略(Policy)选择进程占用CPU。
算法: 结合使用 FIFO, RR, 优先级调度（用于实时进程）。
普通进程: 主要采用 CFS (Completely Fair Scheduler) 算法，追求公平性，基于虚拟运行时间 (vruntime) 按优先级比例分配CPU时间。
多核调度:
- 早期单队列问题: 所有CPU共享一个队列。
  - 策略一（简单RR）：进程在CPU间频繁迁移，破坏缓存亲和性。
  - 策略二（带亲和性）：尽量让进程留在一个CPU，但可能牺牲某些进程（如E）的公平性或导致负载失衡。
- 多队列调度: 每个CPU维护自己的就绪队列（如Q0 for CPU0, Q1 for CPU1）。
  - 优点: 提高缓存亲和性，减少锁竞争。
  - 问题: 可能导致负载失衡（如一个队列空了，另一个还很忙）。
- 迁移线程 (Migration Thread): OpenEuler 使用迁移线程解决负载不均衡。每个CPU有一个 migration/CPUID 内核线程。当检测到负载不均时（如CPU0空闲，CPU1忙），CPU0可以向CPU1的停机工作队列 (stop machine workqueue) 添加一个任务，唤醒CPU1的迁移线程。该线程优先级很高，会立即执行迁移任务（如将进程D从CPU1迁移到CPU0），从而实现负载均衡。

6.6 Linux 进程调度

调度单位: 线程（内核级线程，Linux中称为'进程'或'任务'）。
进程分类与调度策略:
- 实时进程 (Real-time Processes):
  - 要求：调度延迟最低，立即响应。
  - 策略：SCHED_FIFO (静态优先级，非抢占式，除非更高优先级到达或阻塞)、SCHED_RR (静态优先级，抢占式，带时间片轮转)。优先级范围 1-99。
- 普通进程 (Normal Processes):
  - 包括交互式进程（需要快速响应）和批处理进程（后台运行，容忍延迟）。
  - 策略：SCHED_NORMAL (也叫 SCHED_OTHER), SCHED_BATCH, SCHED_IDLE。主要由 CFS (Completely Fair Scheduler) 算法管理。优先级范围 100-139 (对应nice值 -20 到 +19)。
Linux调度算法演化:
- Linux 2.4: 简单 O(n) 调度器。基于优先级和时间片。遍历整个运行队列找最高优先级进程。所有进程时间片用完后统一重新计算。对交互式进程通过剩余时间片补偿来提升优先级。缺点: 扩展性差（高负载时慢），交互性优化不完善，非抢占内核。
- Linux 2.6 (早期): O(1) 调度器 (by Ingo Molnar):
  - 引入 active/expired 两个优先级数组队列。调度只需 O(1) 时间找到最高优先级非空队列。
  - 动态优先级基于静态优先级(nice值)和平均睡眠时间 bonus 计算，试图区分交互式/批处理。
  - 进程时间片用完后移入 expired 队列（除非是特殊情况）。active 队列空后，交换 active 和 expired 指针。
  - 缺点: 区分交互式的启发式规则复杂难懂且易失效，代码难维护。
- Linux 2.6 (中期): SD (Staircase Scheduler by Con Kolivas) / RSDL (Rotating Staircase Deadline Scheduler):
  - 追求公平，抛弃复杂动态优先级。
  - SD: 进程用完时间片后优先级降低一级（下楼梯），到底后回到较高层并获更多时间片。交互进程睡眠时停留在高层，唤醒后响应快。
  - RSDL: 引入 group quota (Tg) 和 expired 数组。高优先级组用完 Tg 后整体降级（minor rotation），保证低优先级任务的可预测等待时间。时间片用完进 expired 队列。active 队列空或到底后触发 major rotation (交换 active/expired)。
  - 影响: 启发了CFS的公平思想。
- Linux 2.6.23 至今: CFS (Completely Fair Scheduler by Ingo Molnar):
  - 核心思想: 完全公平。理想情况下，每个进程获得 1/n 的CPU时间。不再区分交互式/批处理，不再使用固定时间片。
  - 虚拟运行时间 (vruntime): vruntime 记录进程的加权运行时间。vruntime 增长速度与实际运行时间成正比，与进程权重（优先级）成反比。 vruntime ≈ 实际运行时间 * (NICE_0_LOAD / 进程权重) (NICE_0_LOAD 是 nice=0 进程的权重)。
  - 调度决策: 总是选择就绪队列中 vruntime 最小 的进程运行。
  - 数据结构: 使用 红黑树 (Red-Black Tree) 存储就绪进程，按 vruntime 排序。插入、删除、查找最小节点都是 O(log n) 时间。调度器取最左节点运行。
  - 公平性实现: 优先级高的进程权重高，vruntime 增长慢，更容易被选中；优先级低的进程权重低，vruntime 增长快。最终达到按权重比例分配CPU时间的效果。
- Linux 6.6+ (实验性/可选): EEVDF (Earliest Eligible Virtual Deadline First):
  - 对CFS的改进，旨在解决CFS在极短任务和延迟敏感任务上的一些问题，进一步改善延迟和公平性。它结合了虚拟时间和截止时间的概念。
CFS 调度器详解:
- task_struct: Linux 进程/任务描述符。
- sched_entity: 调度实体，嵌入 task_struct 中，包含CFS调度所需信息（如 load_weight 权重, rb_node 红黑树节点, vruntime 等）。一个 sched_entity 可以代表一个任务或一个任务组（用于组调度）。
- sched_class: 调度类结构体，定义了一套调度器操作函数接口（如 enqueue_task, dequeue_task, pick_next_task）。CFS, RT(FIFO/RR), Idle 都有自己的 sched_class 实现。内核按优先级顺序查询 sched_class 来决定使用哪个调度器。
- cfs_rq: CFS 运行队列，每个CPU有一个。包含红黑树 tasks_timeline 和 min_vruntime 等信息。min_vruntime 记录该队列中所有进程的最小 vruntime，作为新进程/唤醒进程 vruntime 计算的基准。
- 红黑树 (rb_node, rb_root tasks_timeline): 按 vruntime 组织就绪的 sched_entity。
- CFS 关键情景:
  - 新进程创建 (fork()):
    - vruntime 初始值通常设为当前 cfs_rq->min_vruntime（或略大），确保新进程不会立即获得过多优势。
    - 父子 vruntime 交换? 如果设置了sysctl_sched_child_runs_first，且父子在同CPU，父vruntime < 子vruntime，则交换，让子进程优先运行。
    - 插入红黑树。
    - 检查是否需要抢占当前进程。
  - 进程唤醒 (wake_up_process()):
    - 调整 vruntime：通常设为 max(waker->vruntime, cfs_rq->min_vruntime - delta)，其中 delta 是一个小的补偿值。确保进程不会因睡眠获得不公平优势，但也给予一定补偿使其尽快运行。
    - 插入红黑树。
    - 检查是否需要抢占当前进程（如果唤醒进程 vruntime 足够小）。
  - 时钟中断 (scheduler_tick()):
    - 更新当前运行进程的 vruntime（actual_runtime * NICE_0_LOAD / weight）。
    - 更新 cfs_rq->min_vruntime。
    - 检查当前进程是否已运行超过其“理想运行时间”（基于调度周期和权重计算得出）。如果是，则设置抢占标记 (TIF_NEED_RESCHED)，在中断返回前会调用 schedule()。
  - 主动调度 (schedule()):
    - 当前进程阻塞、yield 或被标记抢占时调用。
    - 更新当前进程 vruntime。
    - 如果当前进程仍是就绪态，将其重新插入红黑树。
    - 调用 pick_next_task() 选择下一个运行进程：
      - 按优先级查询 sched_class (RT -> CFS -> Idle)。
      - CFS 中，通常选择红黑树最左节点（vruntime 最小者）。
      - 特殊情况：考虑 cfs_rq->next (上次被抢占者) 和 cfs_rq->last (刚运行完者) 的缓存亲和性，可能优先选择它们。
    - 从红黑树中移除被选中进程的 sched_entity。
    - 执行上下文切换 (context_switch())。
- CFS 与进程状态转换图示:
```
graph TD
    New -- fork() --> Ready(Ready State: In Red-Black Tree);
    Ready -- schedule() selects --> Running(Running State);
    Running -- Block (I/O, wait) --> Blocked(Blocked State);
    Blocked -- Wakeup --> Ready;
    Running -- Timeslice Check in Tick / Preempted --> Ready;
    Running -- exit() --> Terminated(Terminated State);

    subgraph CFS Logic
        direction LR
        Ready -- select min vruntime --> Running;
        Running -- update vruntime & re-insert --> Ready;
    end
```

7. 重点小结

调度基本概念: 层次（长/中/短程）、时机、上下文切换（过程、开销）。
进程行为: I/O密集型 vs. CPU密集型。
设计目标: 吞吐量、周转时间、响应时间、公平性、实时性等，需权衡。
典型算法:
- 批处理: FCFS, SJF/SRTN, HRRN。
- 交互式: RR, Priority (含反转问题), 多级队列, 多级反馈队列。
- 实时: RM, EDF。
关键设计点: 优先级（静/动）、队列组织、抢占、时间片。
核心原则: 机制与策略分离。
实例分析: Windows 线程调度（优先级、时间配额、提升机制）、Linux 进程调度（演化、CFS核心思想、vruntime、红黑树）。
多处理器调度: SMP、负载均衡、缓存亲和性、工作窃取。

[中文] Operating Systems Notes: 03 - 进程线程模型

Thu, 27 Mar 2025 00:13:00 GMT

import { Aside } from '@/components/user'

Model: gemini-2.5-pro-exp-03-25

This article uses LLM to improve efficiency, which can make mistakes. I have tried my best to check and proofread, but still cannot guarantee complete accuracy.

For personal use, may be nagging for you.

1. 核心问题解答

怎样理解“进程是对CPU的抽象”这句话？
- 解答： 物理CPU只有一个（或有限个），但通过多道程序设计和操作系统的进程调度，可以让多个程序在宏观上“同时”运行。操作系统为每个运行的程序创建一个进程，并管理它们对CPU的使用（分时复用）。这使得每个进程都感觉自己仿佛独占了一个CPU（或一个虚拟CPU）来执行自己的指令序列。因此，进程机制将一个或多个物理CPU虚拟化成了多个虚拟CPU，供多个程序并发执行，这是对CPU计算能力的抽象。
何谓进程映像？进程有实体吗？在哪里？
- 解答： 进程映像 (Process Image) 是指进程在执行时的完整状态描述，是进程实体的静态体现。它包括：
  - 程序代码 (Code Segment): 进程要执行的指令。
  - 程序数据 (Data Segment): 程序使用的全局变量、静态变量等。
  - 程序堆栈 (Stack): 用于函数调用、局部变量存储。
  - 堆 (Heap): 动态分配内存的区域。
  - 进程控制块 (PCB): 包含进程的所有管理信息（状态、ID、寄存器值、资源列表等）。
- 进程是有实体的。它的实体就是进程映像所包含的内存区域（代码、数据、堆栈、堆）以及在操作系统内核中的数据结构（PCB）。这些实体主要存在于内存中（代码、数据、堆栈、堆）和 操作系统内核空间（PCB及其相关数据结构）。当进程被挂起时，部分映像可能被交换到 磁盘（交换空间） 上。
怎样描述进程？一个进程都有什么（组成要素）？
- 解答： 描述一个进程主要通过其 进程控制块 (PCB)。PCB是操作系统感知进程存在的唯一标志，包含了描述和控制进程运行所需的所有信息。
- 一个进程的组成要素（即进程映像）包括：
  - 程序代码
  - 数据集合 (全局变量、静态变量、动态分配的内存)
  - 执行上下文 (CPU寄存器值、程序计数器PC、程序状态字PSW、栈指针等)
  - 进程控制块 (PCB) (包含进程标识符、状态、优先级、资源列表等)
创建进程主要完成哪些工作？
- 解答： 创建一个进程（例如通过 fork() 或 CreateProcess）主要包括：
  - 分配进程标识符 (PID): 给新进程一个唯一的ID。
  - 创建和初始化进程控制块 (PCB): 分配PCB结构，并填入初始信息（如PID、父进程ID、初始状态设为New或Ready、优先级等）。
  - 分配地址空间: 为进程分配独立的虚拟内存空间（可能通过复制父进程空间或加载新程序）。
  - 加载程序和数据: 将可执行文件的代码和数据加载到进程的地址空间中（exec 的工作）。
  - 初始化执行上下文: 设置PC指向程序入口，初始化栈指针和寄存器。
  - 分配资源: 分配进程所需的其他资源（如文件描述符，继承自父进程或新创建）。
  - 状态设置与调度: 将进程状态设置为就绪态 (Ready)，并将其链入就绪队列，等待调度器分配CPU。
进程的生命周期内都会经历哪些变化？怎样表示这些变化？
- 解答： 进程在其生命周期中会经历状态的转换。基本的状态包括：
  - 创建态 (New): 进程正在被创建。
  - 就绪态 (Ready): 具备运行条件，等待CPU。
  - 运行态 (Running): 正在CPU上执行。
  - 等待态/阻塞态 (Waiting/Blocked): 等待某个事件（如I/O完成）而暂停执行。
  - 终止态 (Terminated): 进程执行完毕或被终止，等待系统回收资源。
- 这些变化通常用 进程状态转换图 来表示，图中的节点代表状态，有向边代表状态之间的转换及其触发条件（如调度、等待事件、事件完成等）。
进程有哪些状态？进程状态之间的转换（条件？操作？）
- 解答：
  - 基本状态： 运行态 (Running)、就绪态 (Ready)、等待态 (Waiting/Blocked)。
  - 其他状态： 创建态 (New)、终止态 (Terminated)。还可能引入挂起态 (Suspended Ready, Suspended Blocked)。
  - 常见转换及条件/操作：
    - New -> Ready: OS完成进程创建的必要工作，资源基本到位，允许参与调度。
    - Ready -> Running: 进程被调度器 (Scheduler) 选中，获得CPU使用权。操作： 上下文切换，恢复进程现场。
    - Running -> Ready: 时间片用完；或被更高优先级的进程抢占。操作： 上下文切换，保存进程现场。
    - Running -> Waiting: 进程请求I/O操作或等待某一资源/事件。操作： 进程主动调用阻塞原语 (e.g., wait())，保存现场，移入等待队列。
    - Waiting -> Ready: 进程等待的事件发生或资源可用（如I/O完成）。操作： 中断处理程序或相关内核线程执行唤醒原语 (e.g., wakeup())，将进程移入就绪队列。
    - Running -> Terminated: 进程正常执行完毕或出错退出。操作： 进程调用退出原语 (e.g., exit())，进入终止态。
    - Terminated -> Gone: OS回收进程所占资源（PCB、内存等）。
进程状态转换的发生，是否一定导致另一个转换发生？
- 解答： 是的，通常是这样。 操作系统是一个动态系统，进程状态转换往往是相互关联的。
  - 例如，一个进程从 Running -> Waiting，会释放CPU，这使得调度器可以选择另一个处于 Ready 状态的进程，使其发生 Ready -> Running 的转换。
  - 一个进程从 Waiting -> Ready (如I/O完成)，它进入就绪队列，可能在未来某个时刻引发 Ready -> Running 的转换（当它被调度时）。
  - 一个进程 Running -> Terminated，会释放它占有的资源，这可能使得另一个 Waiting (等待该资源) 的进程变为 Ready。
操作系统给进程提供内存空间，该空间的地址是虚拟地址还是物理地址？为什么？
- 解答： 操作系统提供给进程的地址空间是 虚拟地址空间 (Virtual Address Space)。
- 原因：
  - 隔离与保护: 每个进程拥有独立的虚拟地址空间，一个进程无法直接访问另一个进程的内存，提供了安全保护。
  - 地址空间扩展: 虚拟地址空间可以大于物理内存，借助内存管理单元(MMU)和磁盘交换空间，给进程提供更大的可用地址范围。
  - 内存管理简化: 操作系统可以更灵活地管理物理内存，例如将非连续的物理内存页映射到连续的虚拟地址空间，简化了内存分配和程序加载。
  - 程序加载和链接简化: 程序可以在编译链接时确定其在虚拟地址空间的布局，而无需关心实际加载到物理内存的哪个位置。
操作系统如何描述进程的地址空间？
- 解答： 操作系统内核通常使用特定的数据结构来描述进程的地址空间。例如：
  - 在 Linux 中，使用 mm_struct 结构来表示一个进程的整个地址空间。mm_struct 内部包含一个 vm_area_struct (VMA) 的链表或树，每个 VMA 描述了虚拟地址空间中的一个连续区域（段），包括其起止地址、访问权限（读/写/执行）、映射的文件（如果有）等信息。
  - 通过 页表 (Page Tables) 或 段表 (Segment Tables) 将虚拟地址映射到物理地址。这些表由硬件（MMU）使用，操作系统负责维护。
  - 可以通过 cat /proc/<PID>/maps 命令查看一个进程的虚拟地址空间布局和 VMA 信息。需要将 <PID> 替换为实际的进程 ID (可通过 ps 命令查找)，否则会提示文件或目录不存在。
为什么有了进程后又引入线程？
- 解答： 引入线程主要是为了解决进程的以下不足：
  - 并发应用需求: 许多应用内部包含多个并发执行的任务（如Web服务器处理多个请求，GUI程序响应用户输入同时后台处理）。用多进程实现这些任务，开销较大且通信复杂。
  - 开销问题: 创建进程、撤销进程、以及在进程间切换（上下文切换）都需要较大的时间和系统资源开销。线程作为“轻量级进程”，创建、销毁和切换的开销小得多。
  - 通信效率: 同一进程内的线程共享地址空间和大部分资源，它们之间的通信（通过共享内存）非常高效，无需内核介入。进程间通信 (IPC) 通常需要内核的协调，更复杂且效率较低。
  - 性能提升: 在多核处理器上，同一进程的多个线程可以真正并行执行在不同的核心上，提高应用程序的吞吐量。
怎样实现线程机制？为什么有各种支持线程的方式？
- 解答： 线程机制主要有三种实现方式：
  - 用户级线程 (User-Level Threads, ULT): 线程的管理（创建、调度、同步）完全在用户空间由一个线程库来完成。内核对线程无感知，只管理进程。
    - 优点: 切换快（不需内核模式），可自定义调度算法，可移植性好。
    - 缺点: 一个线程阻塞（如系统调用），整个进程会阻塞；无法利用多核并行。
  - 核心级线程 (Kernel-Level Threads, KLT): 线程的管理由操作系统内核完成。内核知道每个线程的存在，并进行调度。
    - 优点: 一个线程阻塞不影响其他线程；可以利用多核并行。
    - 缺点: 线程创建、销毁、切换需要进入内核，开销比ULT大。
  - 混合实现 (Hybrid Implementation): 结合了ULT和KLT。内核管理KLT，用户空间线程库将多个ULT映射到一个或多个KLT上。
    - 目标: 兼具两者的优点，但实现复杂。
- 存在多种方式的原因： 是在性能、并发能力、实现复杂度、系统资源消耗之间进行权衡的结果。
  - ULT优先考虑低开销和灵活性。
  - KLT优先考虑真正的并发和对阻塞系统调用的处理。
  - 混合模型试图找到一个平衡点。
线程包Pthreads中相关的函数的功能？
- 解答: Pthreads (POSIX Threads) 是一个线程API标准，提供了一系列函数来管理线程：
  - pthread_create(): 创建一个新的线程。
  - pthread_exit(): 终止调用该函数的线程。
  - pthread_join(): 等待指定的线程终止。
  - pthread_yield(): 主动让出CPU，让其他线程运行。
  - pthread_self(): 获取调用线程自身的线程ID。
  - pthread_mutex_init(), pthread_mutex_lock(), pthread_mutex_unlock(), pthread_mutex_destroy(): 互斥锁相关操作，用于保护临界区，实现线程互斥。
  - pthread_cond_init(), pthread_cond_wait(), pthread_cond_signal(), pthread_cond_broadcast(), pthread_cond_destroy(): 条件变量相关操作，用于线程间的同步（等待某个条件满足）。
中断/异常机制与进程线程模型的关联？
- 解答： 中断和异常是操作系统得以实现进程/线程调度和管理的关键机制。
  - 上下文切换触发: 时钟中断 (Timer Interrupt) 使得操作系统可以剥夺当前运行进程/线程的CPU使用权（时间片用完），进行调度，切换到其他就绪的进程/线程。这是实现分时复用的基础。
  - 状态转换: I/O完成中断会通知操作系统，操作系统可以将等待该I/O的进程/线程从等待态转换为就绪态。
  - 系统调用: 进程通过执行特定的指令（如 syscall 或 int 0x80）产生异常（陷阱 Trap），主动陷入内核态，请求操作系统服务（如创建进程、读写文件、阻塞等待）。内核处理完请求后，可能会进行调度。
  - 错误处理: 异常（如除零、缺页故障 Page Fault）也需要内核介入处理。缺页故障处理是虚拟内存管理的核心部分，可能导致进程阻塞（等待页面从磁盘调入）。
  - 保存与恢复现场: 发生中断/异常时，硬件和操作系统内核协作，必须保存当前进程/线程的执行上下文（寄存器、PC、状态等），处理事件后，再恢复某个进程/线程（可能是同一个，也可能是不同的）的上下文继续执行。
机制和策略分离的原则在进程线程模型中的体现？
- 有点像操作系统提供的 API 和调用这些 API 的策略之间的关系
- 解答： 机制与策略分离 (Separation of Mechanism and Policy) 是操作系统设计的重要原则，意指提供实现某种功能的基础能力（机制），与决定何时、如何使用这些能力的决策逻辑（策略）分开。
  - 进程/线程状态管理（机制） vs. 调度算法（策略）： 操作系统提供了进程/线程状态（就绪、运行、等待等）以及在它们之间转换的机制（如阻塞/唤醒原语、上下文切换）。但是，选择哪个就绪进程/线程投入运行，则是调度算法（策略）决定的（如FIFO、轮转、优先级调度等）。
  - 挂起/激活（机制） vs. 负载调节（策略）： 操作系统提供将进程换出到磁盘（挂起）和换回内存（激活）的机制。但是，决定何时挂起哪个进程（例如，为了降低内存压力或提高系统吞吐量），则是系统负载调节策略的一部分。
  - 线程实现（机制） vs. 应用并发模型（策略）： 用户级线程库提供创建和管理线程的机制。应用程序如何利用这些线程来构建并发逻辑（例如，线程池大小、任务分配方式）则是应用层面的策略。
协程是什么？为什么引入协程？协程怎么用？
- 解答：
  - 是什么： 协程 (Coroutine) 是一种比线程更轻量级的用户态并发（或协作式多任务）实现方式。它们是可以在特定点暂停执行，并在稍后从同一点恢复执行的计算过程。协程之间的切换由程序员（或协程库/语言运行时）显式控制，通常发生在用户态，不需要内核介入。
  - 为什么引入：
    - 极低的切换开销: 协程切换完全在用户态进行，避免了内核态和用户态之间的切换以及内核调度，开销远小于线程切换。
    - 高并发能力: 单个线程可以管理成千上万个协程，特别适合处理大量并发连接（如网络服务器）或I/O密集型任务，能有效减少线程数量和内存消耗。
    - 简化异步编程: 允许使用看似同步的代码风格来编写异步逻辑（例如，使用 async/await 关键字），从而避免 回调地狱 (Callback Hell)。回调地狱是指在传统异步编程中，当一个操作依赖于另一个异步操作的结果时，需要将后续操作放在前一个操作的回调函数中，如果存在多层依赖，就会形成层层嵌套的回调函数结构，导致代码难以阅读、理解和维护。
  - 怎么用： 通常通过编程语言或第三方库提供的支持来使用。
    - 语言原生支持: 如 Python (async/await), Go (goroutine), C++20 (co_await, co_yield, co_return), Rust (async/await)。
    - 库支持: 通过特定的协程库在不支持原生协程的语言中使用。
    - 用法: 开发者定义协程函数，在需要等待的操作（通常是I/O）前使用特定关键字 (如 await 或 yield) 暂停当前协程，让出执行权给其他协程或事件循环，当操作完成后，协程从暂停点恢复执行。

2. 进程模型 (Process Model)

2.1 基本概念

顺序程序与顺序环境 (Sequential Program & Environment)
- 程序 (Program): 指令或语句的序列，体现某种算法，是静态的。
- 顺序环境: 系统中只有一个程序在运行，独占所有资源，执行不受外界干扰。
- 特征:
  - 顺序性: 指令严格按程序规定顺序执行。
  - 封闭性: 程序运行时独占资源，不受外界干扰。
  - 可再现性: 只要输入相同，程序执行结果总是相同，与速度无关。
多道程序设计 (Multiprogramming)
- 允许多个程序同时进入内存并交替运行。
- 目的: 提高CPU利用率和系统整体效率。当一个程序等待I/O时，CPU可以切换去执行另一个程序。
并发环境与并发程序 (Concurrent Environment & Program)
- 并发环境: 一段时间间隔内，单处理器上有两个或以上程序同时处于开始运行但尚未结束的状态，并且执行次序不确定。宏观上并行，微观上串行（在单核CPU上）。
- 并发程序: 在并发环境中执行的程序。
- 特征:
  - 间断性: 程序执行走走停停 (执行 -> 停 -> 执行)。
  - 资源共享: 多个程序可能共享系统资源（CPU、内存、I/O设备）。
  - 不可再现性: 由于执行走停的时机和顺序不确定，以及共享资源可能被修改，程序执行结果可能与执行速度有关，变得不可再现。
  - 独立性与制约性: 程序各自独立运行，但也可能因共享资源或需要协作而相互制约。
  - 程序与计算不再一一对应: 一个程序可能对应多次执行（多个进程），一次执行也可能断续完成。
进程 (Process)
- 定义:
  - 程序的一次执行过程。
  - 正在运行程序的抽象。
  - 操作系统进行 资源分配 和调度的 独立单位。
  - 具有独立功能的程序在某个数据集合上的一次运行活动。
- 进程是对CPU的抽象: 如前所述，它将物理CPU虚拟化为多个逻辑CPU。
- 资源分配单位: 系统资源（如内存、文件句柄）以进程为单位进行分配。每个进程通常拥有独立的 地址空间。
- 调度单位: 操作系统将CPU时间片调度给进程（或进程中的线程）。
- 进程与程序的区别:
  - 动态 vs. 静态: 进程是动态的（有生命周期），程序是静态的（文件）。
  - 并发描述: 进程是描述并发的基本单位，程序不能。
  - 生命周期: 进程是暂时的（创建、运行、消亡），程序是相对长久的。
  - 对应关系: 一个程序可以对应多个进程实例。

2.2 进程模型详解

进程状态 (Process States)
- 三种基本状态:
  - 运行态 (Running): 进程占有CPU，并在CPU上运行。
  - 就绪态 (Ready): 进程已具备运行条件（资源到位），但因无空闲CPU而等待。
  - 等待态 (Waiting/Blocked): 进程因等待某一事件（如I/O完成、信号量）而暂时不能运行。
- 其他状态:
  - 创建态 (New): 进程正在被创建，OS已分配PCB，但尚未完成所有初始化或未被批准执行。
  - 终止态 (Terminated): 进程已停止执行，等待OS回收资源。
  - 挂起态 (Suspended): 进程映像被从内存移到外存（磁盘），用于调节系统负载或用户请求。可以有 挂起就绪 (Suspended Ready) 和 挂起阻塞 (Suspended Blocked) 两种状态。

进程状态转换模型 (State Transition Models)

三状态模型:

graph LR
    Ready(就绪) --> |调度|Running(运行)
    Running --> |时间片到/高优先级进程抢占|Ready
    Running --> |等待事件|Waiting(阻塞)
    Waiting --> |事件发生|Ready

五状态模型:

graph LR
    New(创建) --> |提交|Ready(就绪)
    Ready --> |调度|Running(运行)
    Running --> |时间片到/高优先级进程抢占|Ready
    Running --> |等待事件|Waiting(阻塞)
    Waiting --> |事件发生|Ready
    Running --> |完成|Terminated(终止)

七状态模型:

graph LR
    New(创建) --> |提交|Ready(就绪)
    Ready --> |调度|Running(运行)
    Running --> |时间片到/高优先级进程抢占|Ready
    Running --> |等待事件|Waiting(阻塞)
    Waiting --> |事件发生|Ready
    Running --> |完成|Terminated(终止)
    Ready --> |挂起Suspend|SReady(就绪挂起)
    SReady --> |激活Activate|Ready
    Waiting --> |挂起Suspend|SWaiting(阻塞挂起)
    SWaiting --> |事件发生|SReady
    SWaiting --> |激活Activate|Waiting
    New --> |提交|SReady
    Running --> |挂起Suspend|SReady

Linux 进程状态: 包括 R (TASK_RUNNING) (运行或就绪), S (TASK_INTERRUPTIBLE) (可中断睡眠), D (TASK_UNINTERRUPTIBLE) (不可中断睡眠), T (TASK_STOPPED) (停止), Z (TASK_DEAD - ZOMBIE) (僵尸) 等。其状态模型与理论模型有所差异，更贴近实现。
XV6 进程状态: UNUSED, USED, SLEEPING, RUNNABLE, RUNNING, ZOMBIE。这是一个简化的教学模型。
不同模型的意义: 体现了 机制和策略分离，基础状态转换是机制，增加挂起等状态是为了实现更复杂的内存管理和负载均衡策略。

进程控制块 (Process Control Block, PCB)
- 定义: 操作系统用于管理进程的核心数据结构，是进程存在的唯一标志。也称进程描述符。所有进程的PCB集合构成进程表。
- 作用: 保存进程状态、资源、上下文等信息，供OS进行调度和管理。
- 主要内容:
  - 进程描述信息: PID (唯一标识), 进程名, 用户ID (UID), 进程组关系。
  - 进程控制信息:
    - 当前状态 (State)。
    - 优先级 (Priority)。
    - CPU现场信息 (Context): 程序计数器 (PC), 各种CPU寄存器, 程序状态字 (PSW), 栈指针 (SP)。这是进程切换时需要保存和恢复的关键信息。
    - 调度相关信息 (如等待事件、时间片等)。
  - 所拥有的资源和使用情况:
    - 虚拟地址空间描述 (指向页表/段表的指针)。
    - 打开文件列表。
    - I/O设备信息。
  - 进程间通信与同步信息: 消息队列指针, 信号量等。
  - 记账信息: CPU使用时间, 内存使用量等。
- 具体实现: 不同OS有不同结构，如 Linux 的 task_struct, Windows 的 EPROCESS/KPROCESS/PEB, Solaris 的 proc_t。真实系统中的PCB结构非常庞大复杂。
进程地址空间 (Process Address Space)
- 概念: 操作系统为每个进程分配的、独立的 虚拟内存 范围。是对内存的抽象。
- 典型布局 (从低地址到高地址):
  - 代码段 (.text): 存放程序指令，通常只读。
  - 数据段 (.data, .bss): 存放已初始化的全局/静态变量 (.data) 和未初始化的全局/静态变量 (.bss)。
  - 堆 (Heap): 动态内存分配区域 (malloc, new)，向上增长。
  - (文件映射区/共享库): 加载动态链接库、内存映射文件等。
  - 栈 (Stack): 存放函数参数、局部变量、返回地址等，向下增长。
  - 内核空间: 每个进程地址空间的高地址部分映射到操作系统的内核空间，供系统调用和中断处理使用（用户态不可直接访问）。
- 独立性来源: 每个进程有自己的页表/段表，将相同的虚拟地址映射到不同的物理内存页（或相同的只读页，如共享库代码）。
- 写时复制 (Copy-on-Write, COW): fork() 创建子进程时，并不立即复制整个地址空间，而是让父子进程共享物理页面，并将页面标记为只读。当任何一方尝试写入时，触发异常，内核才真正复制该页面，使其私有化。这极大地优化了 fork() 的效率，特别是 fork() 后立即 exec() 的情况，因为exec()会替换整个地址空间，使得大部分共享页面在被写入前就已被丢弃，从而避免了不必要的复制开销。
  - COW异常的详细处理流程：
    1. 写操作触发页面故障： 当父进程或子进程尝试写入共享的只读页面时，CPU检测到违反内存保护，触发页面故障异常(page fault)。
    2. 进入内核态： CPU立即切换到内核态，保存当前上下文，并跳转到页面故障处理程序。
    3. 异常处理： 内核的页面故障处理程序检查故障原因，发现是COW页面的写操作。
    4. 页面复制： 内核为写操作进程分配一个新的物理页框，将原共享页面的内容完整复制到新页框中。
    5. 页表更新： 修改发起写操作的进程的页表，将相关虚拟地址映射到新分配的物理页框，并设置为可写权限。
    6. 恢复执行： 内核返回用户态，恢复被中断的进程执行，此时写操作可以正常进行，且不会影响另一进程的内存视图。
- 查看: cat /proc/<PID>/maps (Linux) 可以查看进程的虚拟内存区域布局。
进程队列 (Process Queues)
- 操作系统通常根据进程状态将PCB组织在不同的队列中。
- 就绪队列 (Ready Queue): 存放所有处于就绪态的进程PCB。调度器从中选择下一个要运行的进程。可能按优先级组织成多个队列。
- 等待队列 (Waiting Queues): 可能有多个，每个队列对应一个特定的等待事件（如等待磁盘I/O、等待键盘输入、等待某个信号量）。当进程等待某事件时，其PCB被移入相应的等待队列。
- 进程状态的改变伴随着其PCB在不同队列间的移动。

2.3 进程控制

进程控制原语

原语（Primitive）是完成某种特定功能的一段程序，具有不可分割性或不可中断性，即原语的执行必须是连续的，在执行过程中不允许被中断，也称为原子操作（Atomic）。

进程控制操作完成进程各状态之间的转换，由具有特定功能的原语完成：

进程创建原语
进程撤销原语
阻塞原语
唤醒原语
挂起原语
激活（解挂）原语
改变进程优先级原语
等等

进程的生命周期

进程创建的时机：

系统初始化时
操作系统提供的服务
交互用户登录系统
由现有的进程派生出一个新进程
提交一个程序执行（例如，命令行）

进程终止的时机：

正常退出（自愿的）
出错退出（自愿的）
严重错误（非自愿）
被其他进程杀死（非自愿）

进程终止的各种事件：

正常结束
给定时限到
缺少内存
存储器出界
保护性出错（写只读文件）
算术错误
超出时间（进程等待超过对某事件的最大值）
I/O 失败
无效指令（如试图执行数据）
特权指令
操作系统干预（如当死锁发生时）
父进程请求中止某一子进程
父进程中止（子进程也中止）

进程控制操作

进程的创建

进程创建的主要步骤：

给新进程分配一个唯一标识(pid)以及进程控制块(PCB)
为进程分配地址空间
初始化进程控制块
- 设置默认值（如：状态为 New，...）
- 设置相应的队列指针（如：把新进程加到就绪队列的链表中）
创建或扩充其他数据结构

不同操作系统的实现：

UNIX：fork/exec
WINDOWS：CreateProcess

进程的撤销

进程撤销的主要步骤：

结束子进程或线程
收回进程所占有的资源
- 关闭打开的文件
- 断开网络连接
- 回收分配的内存等
撤销该进程的PCB

不同操作系统的实现：

UNIX：exit
WINDOWS：ExitProcess

进程阻塞和进程唤醒

处于运行状态的进程，在其运行过程中期待某一事件发生（如等待键盘输入、等待磁盘数据传输完成、等待其它进程发送消息），当被等待的事件未发生时，由进程自己执行阻塞原语，使自己由运行态变为阻塞态。

不同操作系统的实现：

UNIX：wait
WINDOWS：WaitForSingleObject

UNIX系统设计的进程控制操作

UNIX系统提供了一系列系统调用来实现进程控制：

fork(): 通过复制调用进程来建立新的进程，是最基本的进程建立过程
exec(): 包括一系列系统调用，它们都是通过用一段新的代码覆盖原来的内存空间，实现进程执行代码的转换
wait(): 提供初级的进程同步措施，能使一个进程等待，直到另外一个进程结束为止
exit(): 用来终止一个进程的运行

这些系统调用之间的关联（shell、fork()、exec()、wait()）体现了UNIX进程管理的设计哲学，通过简单而正交的原语组合实现复杂功能。

UNIX的fork()实现及优化

UNIX的fork()实现步骤：

为子进程分配一个空闲的进程描述符（proc结构）
分配给子进程唯一标识pid
以一次一页的方式复制父进程地址空间
从父进程处继承共享资源，如打开的文件和当前工作目录等
将子进程的状态设为就绪，插入到就绪队列
对子进程返回标识符0
对父进程返回子进程的pid

优化方案： Linux的解决方案是利用存储管理模块中的"写时复制技术"COW（Copy-On-Write）对fork()进行了优化。

写时复制（Copy-on-Write, COW）技术

重新审视fork函数：

虚拟内存和内存映射解释了fork如何为每个进程提供私有地址空间
- fork()后跟exec()的常见情况的完美方法
为新进程创建虚拟地址空间的步骤：
- 创建新的进程mm_struct、vm_area_struct、页表的精确副本
- 将两个进程中的每个页面标记为只读
- 将两个进程中的每个vm_area_struct标记为私有COW
- 返回时，每个进程都有虚拟内存的精确副本
- 后续写入使用COW机制创建新页面

3. 线程模型 (Thread Model)

3.1 线程的引入

为什么引入线程？
- 应用的需要: 一个应用程序内部往往有多个并发执行流的需求。例如：
  - 字处理软件: 用户输入（前台线程）、后台自动保存（后台线程）、拼写检查（后台线程）。
  - Web服务器: 主线程监听连接，每个连接分配一个工作线程处理请求（读文件、网络发送）。
- 开销的考虑:
  - 进程创建、销毁、切换的开销（时间、空间）较大。
  - 线程是轻量级的，其创建、销毁、切换开销小得多。
- 性能的考虑:
  - 通信效率: 同一进程的线程共享地址空间和资源，通信（共享内存）非常高效，无需内核干预。
  - 并行计算: 在多核CPU上，同一进程的多个线程可以真正并行执行。

3.2 线程的基本概念

线程 (Thread)
- 进程内的一个 执行实体 (或执行流)。
- 是 CPU调度 的基本单位。
- 有时称为 轻量级进程 (Lightweight Process, LWP)。
- 进程现在被视为 资源分配 的基本单位。
线程的属性:
- 拥有独立的状态: (Running, Ready, Blocked等)，需要进行状态转换管理。
- 拥有独立的执行上下文: 程序计数器 (PC), 寄存器集合, 栈 (Stack) 和栈指针 (SP)。线程切换时保存/恢复的是这部分私有上下文。
- 共享所在进程的资源:
  - 地址空间（代码段、数据段、堆）。
  - 打开的文件。
  - 全局变量。
  - 信号处理器等。
- 可以创建、撤销、同步其他线程。
多线程进程模型: 一个进程包含一个PCB和多个线程控制块 (Thread Control Block, TCB)。所有TCB共享进程的地址空间和资源，但每个TCB有自己独立的PC、寄存器和栈。

3.3 线程的实现

用户级线程 (User-Level Threads, ULT)
- 实现: 在用户空间通过线程库实现，内核对线程无感知。线程调度由库函数完成。
- 优点:
  - 创建、销毁、切换非常快（不涉及内核模式切换）。
  - 调度算法可以由应用程序定制。
  - 可以运行在不支持线程的操作系统上（只需有线程库）。
- 缺点:
  - 阻塞问题: 如果一个用户级线程执行了阻塞式系统调用，整个进程都会被内核阻塞，即使其他线程是就绪的。
  - 多核利用问题: 内核只把CPU分配给进程，所以一个进程中的多个ULT不能在多核上并行执行。
- 阻塞处理:
  - 使用非阻塞系统调用。
  - 使用 "Jacketing" / "Wrapper" 技术：库函数在调用可能阻塞的系统调用前检查，如果会阻塞，则不调用，而是切换到另一个用户线程。
核心级线程 (Kernel-Level Threads, KLT)
- 实现: 线程的管理（创建、调度、同步）由操作系统内核完成。内核维护每个线程的TCB。
- 优点:
  - 一个线程阻塞不影响进程内其他线程的执行。
  - 内核可以直接调度线程，可以在多核CPU上实现真正的并行。
- 缺点:
  - 线程的创建、销毁、切换都需要进入内核态，开销比ULT大（但仍远小于进程切换）。
- 例子: Windows 线程, Linux 的 NPTL (Native POSIX Thread Library，实际上是KLT)。
混合模型 (Hybrid Implementation)
- 实现: 内核支持KLT，用户空间线程库将多个ULT映射到少量KLT上（M:N模型）。线程创建在用户态快，调度利用内核。
- 例子: 早期的 Solaris。
- 目标: 试图结合ULT的低开销和KLT的并发优势，但实现复杂，现在较少见，Linux和Windows都主要采用KLT模型。

4. 协程 (Coroutine)

为什么引入协程？
- 为了在单线程内实现更高效率的并发，尤其是针对 I/O 密集型任务和需要管理大量连接的场景。
- 解决线程在高并发场景下的资源消耗（内存、内核调度开销）问题。
- 用同步的方式编写异步代码，提高可读性。
协程是什么？
- 一种 用户态的、协作式 的多任务实现。
- 可以看作是比线程更轻量级的执行单元，由 程序员/运行时 在 用户态 控制切换。
- 协程可以在执行过程中的特定点 暂停 (yield)，然后在未来从同一点 恢复 (resume)。
协程怎么用？
- 依赖于 编程语言或库 的支持。
- 常见模式:
  - 定义协程函数（如 Python 的 async def）。
  - 在协程函数内部，遇到需要等待的操作（如异步I/O）时，使用特定关键字（如 await, yield) 主动让出控制权。
  - 一个事件循环 (Event Loop) 或调度器负责管理协程的暂停和恢复。
- 例子: Python asyncio, Go goroutine, C++20 coroutine, Rust async/await。
纤程 (Fiber)
- Windows 操作系统提供的一种类似协程的机制，也是用户态调度的轻量级执行单元，一个线程内可以包含多个纤程。

5. 重点小结

进程 (Process):
- 并发执行程序的实例，动态产生和消亡。
- OS 资源分配 的独立单位，拥有独立地址空间。
- 基本特征：并发性、动态性、独立性、制约性、异步性。
- 进程映像 = 代码 + 数据 + 栈 + 堆 + PCB。
线程 (Thread):
- 进程内的一个执行流，CPU调度 的基本单位。
- 拥有私有执行上下文（PC, Regs, Stack），共享进程资源（地址空间, 文件）。
- 引入原因：应用并发需求、低开销、高性能（通信、并行）。
- 实现方式：用户级 (ULT)、核心级 (KLT)、混合。各有优劣。
协程 (Coroutine):
- 用户态协作式多任务单元，比线程更轻量。
- 切换开销极低，适合高并发I/O密集型任务。
- 通过语言/库支持，用同步方式写异步代码。
可再入程序 (Reentrant Program):
- 可被多个进程同时调用的程序。
- 特点：纯代码（执行中不修改自身），不使用静态/全局变量存储可变状态（或通过参数传入/线程本地存储）。

[中文] Operating Systems Notes: 02 - 中断异常机制

Thu, 13 Mar 2025 04:20:00 GMT

import { Aside } from '@/components/user'

Model: claude-3-7-sonnet-20250219

This article uses LLM to improve efficiency, which can make mistakes. I have tried my best to check and proofread, but still cannot guarantee complete accuracy.

For personal use, may be nagging for you.

1. 核心问题解答

应用程序是如何与操作系统交互的？
- 应用程序通过系统调用与操作系统交互。系统调用提供了应用程序访问操作系统服务的接口，例如文件操作、进程管理和内存管理等。
怎样理解“操作系统是由中断/异常/事件驱动的“这句话？
- 这句话的意思是操作系统的运行依赖于中断、异常和事件的触发。中断和异常是硬件或软件产生的信号，通知操作系统需要处理的事件。操作系统通过响应这些信号来管理系统资源和执行任务。
中断/异常的来源有什么不同？处理方式是一样的吗？
- 中断通常由外部设备（如键盘、鼠标、网络接口等）产生，而异常通常由CPU在执行指令时检测到的错误（如除零错误、非法指令等）产生。处理方式有所不同，中断处理程序通常较为简单，主要负责响应外部设备的请求，而异常处理程序则需要更复杂的错误处理机制。
回顾一下：ICS对异常的描述及分类
- ICS（计算机系统结构）将异常分为四类：陷入（Trap）、故障（Fault）、终止（Abort）和中断（Interrupt）。陷入是由用户程序主动发起的系统调用，故障是可恢复的错误，终止是不可恢复的错误，中断是由外部设备发起的请求。
中断/异常处理流程中，哪些工作是硬件（体系结构）负责的？哪些工作是软件（操作系统）负责的？
- 硬件负责检测中断/异常、保存当前的处理器状态、查找中断向量表并跳转到相应的中断/异常处理程序。软件负责具体的中断/异常处理逻辑，包括错误处理、资源管理和恢复系统状态等。
从中断响应（硬件）到中断处理程序（软件）执行结束，计算机系统经过了哪些流程？
- 计算机系统首先由硬件检测到中断信号，保存当前处理器状态，查找中断向量表并跳转到中断处理程序。中断处理程序执行相应的处理逻辑，处理完成后恢复处理器状态，返回到中断前的执行点继续执行。
操作系统初始化与中断/异常有哪些关联？
- 操作系统初始化时会设置中断向量表、初始化中断控制器、注册中断/异常处理程序等。中断/异常机制是操作系统正常运行的重要保障。
什么是软件异常？它是如何工作的？
- 软件异常是由软件引发的异常情况，例如非法内存访问、除零错误等。软件异常通过硬件检测并触发相应的异常处理程序，操作系统负责处理这些异常并采取相应的措施，如终止进程、生成错误报告等。
X86有哪些控制和状态寄存器？所起的作用是什么？
- X86处理器有多个控制和状态寄存器，包括CR0-CR4（控制寄存器）、EFLAGS（状态寄存器）、GDTR/IDTR（全局/中断描述符表寄存器）等。控制寄存器用于控制处理器的操作模式，状态寄存器保存处理器的状态标志，描述符表寄存器用于存储全局和中断描述符表的地址。
X86在PentiumII 300之后提供了sysenter/sysexit指令，为什么？与int 0x80/iret有什么不同？X86-64提供的系统调用指令是什么？
- sysenter/sysexit指令提供了更高效的系统调用机制，减少了系统调用的开销。与int 0x80/iret相比，sysenter/sysexit指令不需要保存和恢复中断标志，减少了上下文切换的开销。X86-64提供的系统调用指令是syscall/sysret。
关于基于x86体系结构的Linux的系统调用实现：

系统调用入口程序system_call()与中断描述符表是什么关系？与系统调用表是什么关系？
- system_call()是系统调用的入口程序，通过中断描述符表（IDT）中的中断向量指向。系统调用表（sys_call_table）存储了所有系统调用的地址，system_call()根据系统调用号查找并调用相应的系统调用处理程序。
系统调用处理结束后，处理器转去执行哪个模块？
- 系统调用处理结束后，处理器会返回到用户态，继续执行被中断的用户程序。

系统调用与函数/过程调用的区别是什么？系统调用与C函数调用的区别？系统调用与API的关系？
- 系统调用是操作系统提供的接口，用于应用程序请求操作系统服务。函数/过程调用是程序内部的调用机制。系统调用与C函数调用的区别在于系统调用需要从用户态切换到内核态，而C函数调用在用户态内执行。API（应用程序编程接口）是应用程序与操作系统或库函数之间的接口，系统调用是API的一部分，提供底层操作系统服务。

关键核心：ECF——异常控制流

理解ECF（异常控制流）是深入理解计算机系统和操作系统交互的关键。

理解应用程序是如何与操作系统交互的：
- ECF描述了应用程序在运行过程中如何通过系统调用、中断和异常与操作系统进行交互。通过理解ECF，可以更好地理解操作系统如何管理硬件资源和提供服务。
编写有趣的新应用程序：
- 通过掌握ECF的原理，开发者可以编写更高效、更可靠的应用程序。理解系统调用和异常处理机制，可以帮助开发者优化程序性能，并处理各种异常情况。
理解并发：
- ECF在并发编程中起着重要作用。通过理解中断和异常的处理流程，可以更好地设计和实现多线程、多进程的并发程序，确保程序的正确性和高效性。
理解软件异常如何工作：
- 软件异常是ECF的重要组成部分。通过理解软件异常的触发和处理机制，可以更好地调试和维护程序，提升程序的稳定性和安全性。

2. 中央处理器(CPU)

2.1 关于寄存器

处理器由运算器、控制器、寄存器及高速缓存构成：

用户可见寄存器：

机器语言可以直接访问
数据寄存器(通用寄存器)
地址寄存器
条件码寄存器：保存CPU操作结果的标记位

控制和状态寄存器：

用于控制处理器操作，在特权级别下可访问
程序计数器(PC, Program Counter)
指令寄存器(IR, Instruction Register)
程序状态字(PSW, Program Status Word)：存储处理器当前运行状态的关键寄存器，包含多种重要信息：
- 条件码标志位：如零标志(Zero)、进位标志(Carry)、溢出标志(Overflow)等，反映算术和逻辑运算的结果
- 中断控制位：控制处理器对中断的响应方式，如中断使能/禁止标志
- 处理器模式位：指示当前CPU运行在什么特权级别(如用户态/内核态)
- 内存管理相关标志：如分页模式、虚拟内存使能等 PSW在进程上下文切换和中断处理过程中会被保存和恢复，是操作系统实现特权保护和进程隔离的核心机制。

2.2 操作系统的需求之一 —— 保护

从操作系统的特征考虑

操作系统需要处理并发和共享资源的问题，这就提出了对系统进行保护与控制的要求。为了实现这一点，操作系统依赖于硬件机制来隔离操作系统和用户程序。

硬件机制的支持

为了实现保护，硬件需要提供基本的运行机制：

处理器的不同运行模式：
- 处理器具有不同的运行模式，每种模式下运行的指令集合不同，这些模式被称为特权级别。
- 通过特权级别，处理器可以区分内核态和用户态，从而控制哪些指令可以在特定模式下执行。
特权级别：
- 特权级别决定了处理器可以执行哪些指令以及访问哪些资源。
- 在高特权级别（如内核态），处理器可以执行所有指令并访问所有资源。
- 在低特权级别（如用户态），处理器只能执行非特权指令，访问受限的资源。

通过这些硬件机制，操作系统能够有效地保护自身不被用户程序破坏，同时也能控制用户程序的行为，确保系统的稳定和安全。

2.3 处理器的状态(模式)

现代处理器通常将CPU状态划分为两种、三种或四种，在程序状态字寄存器PSW中设置位，根据运行程序对资源和指令的使用权限设置不同的CPU状态。

例如X86架构中的EFLAGS寄存器，RISC-V的三种特权模式：

机器模式(M模式)
用户模式(U模式)
监管模式(S模式)

2.4 特权指令和非特权指令

操作系统需要两种CPU状态：

内核态(Kernel Mode)：运行操作系统程序
用户态(User Mode)：运行用户程序

特权指令：只能由操作系统使用、用户程序不能使用的指令 非特权指令：用户程序可以使用的指令

X86支持4个处理器特权级别(特权环 Ring)：R0、R1、R2和R3

R0相当于内核态，特权能力最高
R3相当于用户态，特权能力最低
目前大多数基于x86处理器的操作系统只用了R0和R3两个特权级别

2.5 CPU状态之间的转换

用户态 → 内核态：唯一途径是通过中断/异常/陷入机制
内核态 → 用户态：通过设置程序状态字PSW

陷入指令(访管指令, supervisor call)：提供给用户程序的接口，用于调用操作系统功能例如：int, trap, syscall, sysenter/sysexit, ecall

3. 中断机制

中断对于操作系统的重要性就如同汽车发动机、飞机引擎的作用，操作系统是由"中断驱动"或"事件驱动"的。

主要作用：

及时处理设备发来的中断请求
捕获用户程序提出的服务请求
防止用户程序执行过程中的破坏性活动

3.1 中断/异常的概念

CPU对系统发生的某个事件作出的一种反应：

CPU暂停正在执行的程序
保留现场后自动转去执行相应事件的处理程序
处理完成后返回断点，继续执行被打断的程序

特点：

是随机发生的
是自动处理的
是可恢复的

中断/异常的来源及处理方式

中断的来源：

外部设备：如键盘、鼠标、网络接口卡等外设发出的中断信号
定时器：系统定时器发出的中断信号
其他硬件部件：如硬盘、打印机等

异常的来源：

程序错误：如除零错误、非法指令、页面错误等
系统调用：用户程序通过系统调用引发的陷入
其他内部事件：如调试事件、断点等

处理方式：

中断处理：中断处理程序通常是操作系统的一部分，负责响应外部设备的请求。处理过程包括保存当前CPU状态、执行中断处理程序、恢复CPU状态并返回被中断的程序。
异常处理：异常处理程序也由操作系统提供，负责处理程序运行过程中出现的错误或特殊事件。处理过程包括识别异常类型、执行相应的处理程序、根据异常类型决定是否返回被中断的程序或终止程序。

术语演化的历史背景

中断的引入：为了支持CPU和设备之间的并行操作
- 当CPU启动设备进行输入/输出后，设备便可以独立工作，CPU转去处理与此次输入/输出不相关的事情；当设备完成输入/输出后，通过向CPU发中断报告此次输入/输出的结果，让CPU决定如何处理以后的事情
异常的引入：表示CPU执行指令时本身出现的问题
- 如算术溢出、除零、取数时的奇偶错，访存地址时越界或执行了“陷入指令”等，这时硬件改变了CPU当前的执行流程，转到相应的错误处理程序或异常处理程序或执行系统调用

3.2 事件

事件可分为中断(外中断)和异常(内中断, 即下面三个表项)：

| 类别 | 原因 | 异步/同步 | 返回行为 | | --------------- | ------------------------- | --------- | -------------------- | | 中断(Interrupt) | 来自I/O设备、其他硬件部件 | 异步 | 总是返回到下一条指令 | | 陷入(Trap) | 有意识安排的 | 同步 | 返回到下一条指令 | | 故障(Fault) | 可恢复的错误 | 同步 | 返回到当前指令 | | 终止(Abort) | 不可恢复的错误 | 同步 | 不会返回 |

3.3 中断/异常机制工作原理

中断/异常机制是现代计算机系统的核心机制之一，通过硬件和软件相互配合，使计算机系统得以充分发挥能力：

硬件工作：中断/异常响应

捕获中断源发出的中断/异常请求
以一定方式响应
将处理器控制权交给特定的处理程序

软件工作：中断/异常处理程序

识别中断/异常类型
完成相应的处理

在每条指令执行周期的最后时刻扫描中断寄存器，查看是否有中断信号。若无中断信号，继续执行下一条指令。若有中断，中断硬件将该中断触发器内容按规定编码送入PSW的相应位，称为中断码，通过交换中断向量引出中断处理程序。

硬件——中断响应过程示意：

在每条指令执行周期的最后时刻，扫描中断寄存器。
检查是否有中断信号。
- 若无中断信号，继续执行下一条指令。
- 若有中断信号，中断硬件将中断触发器内容按规定编码送入PSW的相应位，称为中断码。
通过交换中断向量，引出中断处理程序。
硬件将处理器控制权交给特定的中断处理程序。
中断处理程序执行相应的中断处理任务。
中断处理完成后，恢复CPU状态并返回被中断的程序。

3.4 软硬协同——中断向量表

中断向量：一个内存单元，存放中断处理程序入口地址和程序运行所需的处理机状态字

硬件执行流程按中断号/异常类型的不同，通过中断向量表转移控制权给中断处理程序

Linux中的中断向量(X86)：

0～19：不可屏蔽中断和异常
- 0: 除法错误 #DE
- 1: 调试异常 #DB
- 2: NMI中断
- 3: 断点异常 #BP
- 4: 溢出异常 #OF
- 5: 边界检查异常 #BR
- 6: 无效操作码异常 #UD
- 7: 设备不可用异常 #NM
- 8: 双重故障异常 #DF
- 9: 协处理器段越界异常
- 10: 无效TSS异常 #TS
- 11: 段不存在异常 #NP
- 12: 栈段错误 #SS
- 13: 通用保护异常 #GP
- 14: 页错误异常 #PF (包含COW写时复制机制的页错误)
- 15: 保留
- 16: 浮点异常 #MF
- 17: 对齐检查异常 #AC
- 18: 机器检查异常 #MC
- 19: SIMD浮点异常 #XF
20～31：Intel保留
32～127：外部中断(IRQ)
128(0x80)：用于系统调用的可编程异常
129～238：外部中断
239：本地APIC时钟中断
240：本地APIC高温中断
241～250：Linux保留
251～253：处理器间中断
254：本地APIC错误中断
255：本地APIC伪中断

3.5 中断响应流程

设备发中断信号
硬件保存现场
根据中断码查表
把中断处理程序入口地址等推送到相应的寄存器
执行中断处理程序

3.6 上半部和下半部处理

在 Linux 系统中，中断处理程序应该尽量短且快，以减少对正常进程调度的影响。然而，中断处理程序可能会暂时关闭中断，如果执行时间过长，可能会丢失其他设备的中断请求。为了解决这个问题，Linux 将中断过程分为上半部和下半部。

上半部用于快速处理中断，通常会暂时关闭中断请求，主要负责处理与硬件紧密相关或时间敏感的任务。下半部用于延迟处理上半部未完成的工作，一般以内核线程的方式运行。

上半部（Top Half）：

上半部是中断处理程序的第一部分，直接由硬件中断触发。
其主要任务是快速响应中断，处理与硬件紧密相关或时间敏感的操作。
上半部运行在中断上下文中，通常会暂时关闭中断，不能被阻塞，也不能进行复杂的操作。
典型的上半部操作包括：读取硬件寄存器、清除中断源、调度下半部等。

下半部（Bottom Half）：

下半部是中断处理程序的第二部分，通常由上半部调度执行。
其主要任务是延迟处理上半部未完成的工作，完成较为复杂和耗时的处理。
下半部运行在进程上下文中，可以被阻塞，也可以进行复杂的操作。
典型的下半部操作包括：数据处理、更新数据结构、唤醒等待的进程等。

例如，当网卡收到网络包后，通过 DMA 将数据写入内存，并通过硬件中断通知内核有新数据到达。内核调用中断处理程序，分为上半部和下半部。上半部会先禁止网卡中断，避免频繁硬中断降低内核效率，然后触发软中断，将耗时且复杂的任务交给软中断处理程序（下半部）处理，如解析网络数据并将其传递给应用程序。

为什么引入上半部和下半部处理？

提高响应速度：上半部只执行最紧急的操作，尽量缩短中断处理时间，使系统能够快速响应其他中断。
减少中断禁用时间：上半部运行在中断上下文中，系统在处理上半部时会禁用中断。通过将复杂操作移到下半部，可以减少中断禁用时间，提高系统的并发性。
分离紧急和非紧急任务：将紧急任务放在上半部，非紧急任务放在下半部，有助于合理分配系统资源，提高系统的整体性能和稳定性。

所以，中断处理程序的上半部和下半部可以理解为：

上半部直接处理硬件请求，也就是硬中断，主要是负责耗时短的工作，特点是快速执行；
下半部是由内核触发，也就是软中断，主要是负责上半部未完成的工作，通常都是耗时比较长的事情，特点是延迟执行。

还有一个区别，硬中断（上半部）是会打断 CPU 正在执行的任务，然后立即执行中断处理程序，而软中断（下半部）是以内核线程的方式执行，并且每一个 CPU 都对应一个软中断内核线程，名字通常为「ksoftirqd/CPU 编号」，比如 0 号 CPU 对应的软中断内核线程的名字是 ksoftirqd/0。

Ref: 软中断

3.7 软件——中断处理程序

设计操作系统时，为每一类中断/异常事件编好相应的处理程序，并设置好中断向量表。系统运行时若响应中断，中断硬件部件将CPU控制权转给中断处理程序：

保存相关寄存器信息
分析中断/异常的具体原因
执行对应的处理功能
恢复现场，返回被事件打断的程序

3.8 中断/异常机制小结

以设备输入输出中断为例：

打印机给CPU发中断信号
CPU处理完当前指令后检测到中断，判断出中断来源并向相关设备发确认信号
CPU开始为软件处理中断做准备：
- 处理器状态被切换到内核态
- 在系统栈中保存被中断程序的重要上下文环境，主要是程序计数器PC、程序状态字PSW
CPU根据中断码查中断向量表，获得与该中断相关的处理程序的入口地址，并将PC设置成该地址，新的指令周期开始时，CPU控制转移到中断处理程序
中断处理程序开始工作
- 在系统栈中保存现场信息
- 检查I/O设备的状态信息，操纵I/O设备或者在设备和内存之间传送数据等等
中断处理结束时，CPU检测到中断返回指令，从系统栈中恢复被中断程序的上下文环境，CPU状态恢复成原来的状态，PSW和PC恢复成中断前的值，CPU开始一个新的指令周期

4. IA32 体系结构对中断的支持

4.1 基本概念——X86处理器

中断：由硬件信号引发的，分为可屏蔽和不可屏蔽中断

异常：由指令执行引发的，比如除零异常

80x86处理器发布了大约20种不同的异常
对于某些异常，CPU会在执行异常处理程序之前产生硬件出错码，并压入内核态堆栈

系统调用：异常的一种，用户态到系统态的唯一入口

4.2 IA32体系结构对中断的支持

中断控制器(PIC或APIC)：

负责将硬件的中断信号转换为中断向量，引发CPU中断

实模式：中断向量表(Interrupt Vector)

存放中断服务程序的入口地址
不支持CPU运行状态切换
中断处理与一般的过程调用相似

保护模式：中断描述符表(Interrupt Descriptor table)

采用门(gate)描述符数据结构描述中断向量
表项包含四种类型门描述符：
- 任务门(Task Gate)
- 中断门(Interrupt Gate)
- 陷阱门(Trap Gate)
- 调用门(Call Gate)

中断向量表/中断描述符表

表项包含四种类型门描述符：
- 任务门(Task Gate)
  - 中断发生时，必须取代当前进程的那个进程的TSS选择符存放在任务门中（Linux没有使用任务门）
- 中断门(Interrupt Gate)
  - 给出段选择符 (Segment Selector)、中断/异常程序的段内偏移量 (Offset)
  - 通过中断门后系统会自动禁止中断
- 陷阱门(Trap Gate)
  - 与中断门类似，但通过陷阱门后系统不会自动关中断
- 调用门(Call Gate)

中断/异常的硬件处理过程：

确定与中断或异常关联的向量i
通过IDTR寄存器找到IDT表，获得中断描述符 (表中的第i个表项)
从GDTR寄存器获得GDT的地址，结合中断描述符中的段选择符，在GDT表获取对应的段描述符
特权级检查
检查是否发生了特权级的变化，如需要则进行堆栈切换
硬件压栈，保存上下文环境
如果是中断，清IF位
通过中断描述符中的段内偏移量和段描述符中的基地址，找到中断/异常处理程序的入口地址，执行其第一条指令

5. 系统调用(System call)

系统调用是用户在编程时可以调用的操作系统功能：

系统调用是操作系统提供给编程人员的唯一接口
使CPU状态从用户态陷入内核态

每个操作系统都提供几百种系统调用，包括进程控制、进程通信、文件使用、目录操作、设备管理、信息维护等。

经典问题：系统调用与C函数调用的区别？

系统调用：
- 定义：系统调用是操作系统提供给用户程序的接口，用于执行特权操作，如文件操作、进程控制、内存管理等。
- 执行环境：系统调用会导致CPU从用户态切换到内核态，执行内核中的代码。
- 实现方式：通过特定的陷入指令（如int 0x80）触发中断或异常，进入内核态执行相应的系统调用服务例程。
- 开销：由于涉及用户态到内核态的切换，系统调用的开销较大。
C函数调用：
- 定义：C函数调用是程序内部的函数调用，用于实现特定的功能或算法。
- 执行环境：C函数调用在用户态执行，不涉及特权操作。
- 实现方式：通过函数调用指令（如call）在程序内部跳转到函数的入口地址执行。
- 开销：C函数调用的开销较小，因为不涉及用户态和内核态的切换。

例如，printf函数是一个C库函数，它最终会调用系统调用write来将数据输出到终端。printf函数本身在用户态执行，而write系统调用会切换到内核态执行实际的输出操作。

5.1 静态：系统调用机制的设计

机制与策略分离原则指导下的系统调用设计：

中断/异常机制：支持系统调用服务的实现
陷入指令：引发异常，完成用户态到内核态的切换
系统调用号和参数：每个系统调用都事先给定一个编号(功能号)
系统调用表：存放系统调用服务例程的入口地址

5.2 静态：参数传递过程问题

怎样实现用户程序的参数传递给内核？常用的3种实现方法：

由陷入指令自带参数：陷入指令的长度有限，只能自带有限的参数
通过通用寄存器传递参数：寄存器的个数会限制传递参数的数量
在内存中开辟专用堆栈区来传递参数

数据段部分：

section .data
output:
    ascii "Hello!\n"
output_end:
equ len, output_end - output

section .data：定义数据段，用于存放程序中的数据
output:：定义一个标签，表示数据的起始位置
ascii "Hello!\n"：定义一个ASCII字符串"Hello!"，后跟换行符
output_end:：定义另一个标签，表示数据的结束位置
equ len, output_end - output：定义一个常量len，其值为output_end和output之间的字节数，即字符串的长度

代码段部分：

section .text
globl _start
_start:
    movl $4, %eax     #eax存放系统调用号
    movl $1, %ebx
    movl $output, %ecx
    movl $len, %edx
    int $0x80         #引发一次系统调用
end:
    movl $1, %eax     #1这个系统调用的作用？
    movl $0, %ebx
    int $0x80

section .text：定义代码段，用于存放程序的指令
globl _start：声明_start标签为全局的，使链接器能够找到程序的入口点
_start:：程序的入口点
movl $4, %eax：将4放入eax寄存器，4是Linux系统调用表中write函数的调用号
movl $1, %ebx：将1放入ebx寄存器，1代表标准输出文件描述符
movl $output, %ecx：将output字符串的地址放入ecx寄存器，作为要输出的数据
movl $len, %edx：将len（字符串长度）放入edx寄存器
int $0x80：触发中断0x80，执行系统调用，这里执行的是write(1, "Hello!\n", 7)
movl $1, %eax：将1放入eax寄存器，1是Linux系统调用表中exit函数的调用号
movl $0, %ebx：将0放入ebx寄存器，作为exit()的参数，表示程序正常退出（返回值为0）
int $0x80：再次触发中断0x80，执行系统调用exit(0)，终止程序

5.3 动态：系统调用的执行过程

当CPU执行到特殊的陷入指令时：

中断/异常机制：硬件保护现场；通过查中断向量表把控制权转给系统调用总入口程序
系统调用总入口程序：保存现场；将参数保存在内核堆栈里；通过查系统调用表把控制权转给相应的系统调用处理例程或内核函数
执行系统调用例程
恢复现场，返回用户程序

6. Linux系统调用实现

基于x86体系结构的Linux系统调用实现：

陷入指令选择：int $0x80
门描述符：系统初始化时对IDT表中的第128号门初始化
门类型：15，陷阱门：陷阱门不会自动屏蔽中断，允许在处理系统调用时继续响应其他中断，提高系统的并发性和响应速度。
DPL：3，与用户级别相同，允许用户进程使用该门描述符

6.1 系统调用号示例

# define __NR_exit 1
# define __NR_fork 2
# define __NR_read 3
# define __NR_write 4
# define __NR_open 5
# define __NR_close 6
# define __NR_waitpid 7
# define __NR_creat 8
# define __NR_link 9
# define __NR_unlink 10
# define __NR_execve 11
# define __NR_chdir 12
# define __NR_time 13
...

6.2 系统执行 `int $0x80` 指令

特权级的改变：由于从用户态切换到内核态，CPU需要切换栈。
- 用户栈切换到内核栈：CPU从任务状态段（TSS）中装入新的栈指针（SS:ESP），指向内核栈。
保存用户态信息：用户栈的信息（SS:ESP）、EFLAGS、用户态CS、EIP寄存器的内容会被压栈，以便返回时使用。
- 将EFLAGS压栈后，复位TF（陷阱标志），IF（中断标志）位保持不变。
查找IDT：使用128在中断描述符表（IDT）中找到对应的门描述符，从中找出段选择符装入代码段寄存器CS。
- 代码段描述符中的基地址加上陷阱门描述符中的偏移量，定位到system_call的入口地址。
特权级检查：代码只能访问相同或较低特权级的数据。
- 确保系统调用在内核态执行，防止用户态代码直接访问内核数据。
系统调用号和参数传递：
- 系统调用号：通过EAX寄存器传递。
- 系统调用参数：通过EBX、ECX、EDX、ESI、EDI寄存器传递。
执行系统调用：根据系统调用号，查找系统调用表，找到对应的系统调用处理例程并执行。
- 处理完成后，将结果放入EAX寄存器，并通过ret_from_sys_call例程返回用户态程序。

6.3 Linux系统调用执行流程

应用程序 → 封装例程 → 陷入处理 → 内核函数

用户态下调用C库的库函数，比如write()
封装后的write()先做好参数传递工作，然后使用int 0x80指令产生一次异常
CPU通过0x80号在IDT中找到对应的服务例程system_call()，并调用之
system_call()将参数保存在内核栈；根据系统调用号索引系统调用表，找到系统调用程序入口，比如sys_write()
sys_write()执行完后，经过ret_from_sys_call()例程返回用户程序

6.4 示例：系统调用的参数传递

系统调用使用寄存器传递参数，要传递的参数包括：

系统调用号
系统调用所需的参数

用于传递参数的寄存器有：

eax用于保存系统调用号和系统调用返回值
系统调用参数保存在ebx, ecx, edx, esi和edi中，参数个数不超过6个

进入内核态后，system_call再将这些参数保存在内核堆栈中。

假如C库中封装的系统调用号3的函数原型如下：

movl 0x8(%esp), %ecx  # 将用户态堆栈中的para2放入ecx
movl 0x4(%esp), %ebx  # 将用户态堆栈中的para1放入ebx
movl $0x3, %eax       # 系统调用号保存在eax中
int $0x80             # 引发系统调用
movl %eax, errno      # 将结果存入全局变量errno中
movl $-1, %eax        # eax置为-1，表示出错

则调用时，参数传递如下：

eax = 3
ebx = para1
ecx = para2

7. 系统调用小结

系统调用：用户在程序中调用操作系统提供的一些子功能
一种特殊的过程调用，由特殊的机器指令实现（每种机器的指令集都支持—访管指令）
系统调用是操作系统提供给编程人员的唯一接口
CPU状态从目态转入管态
利用系统调用，可以动态请求和释放系统资源，完成与硬件相关的工作以及控制程序的执行等
每个操作系统都提供几百种系统调用（POSIX标准）
系统调用与C函数调用的区别？
完成系统调用机制的运行需要什么条件（准备工作）？
- 静态和动态
- 封装内核函数 - 库函数（API）；访管指令与陷入机制；编译器；操作系统（初始化、系统调用编号及参数；系统调用表）
- 陷入内核，总入口程序，保存现场（压栈），查表分派，执行返回

[中文] Operating Systems Notes: 01 - 操作系统概述

Tue, 11 Mar 2025 22:14:00 GMT

import { Aside } from '@/components/user'

Model: claude-3-7-sonnet-20250219

This article uses LLM to improve efficiency, which can make mistakes. I have tried my best to check and proofread, but still cannot guarantee complete accuracy.

For personal use, may be nagging for you.

1. 操作系统是什么？

1.1 操作系统的定义

操作系统是计算机系统中的一个系统软件，是一些程序模块的集合：

资源的管理者：能以尽量有效、合理的方式组织和管理计算机的软硬件资源
服务的提供者：合理地组织计算机的工作流程，控制程序的执行并向用户提供各种服务功能
机器能力的扩展：使得用户能够灵活、方便地使用计算机，使整个计算机系统能高效地运行

1.2 操作系统的作用

虚拟机：将物理资源(处理器、内存、磁盘)转换成更通用、更强大、更易用的虚拟形式
APIs：提供可供用户调用的接口，提供应用程序的标准库
资源管理器：允许多程序运行(共享CPU)，允许多程序并发访问内存，允许多程序访问设备

1.3 设计与实现目标

抽象
- 模块化
- 使用高级语言(C)而非汇编
性能(最小化开销)
- 最小化额外的时间(指令)
- 最小化额外的空间(内存/磁盘)
保护：应用之间、操作系统与应用之间的隔离
可靠性
节能
安全性：防止恶意应用的入侵
移动性：能够运行在越来越小的设备上

2. 从不同角度认知操作系统

2.1 资源管理的观点

自底向上 操作系统是资源的管理者
硬件资源：CPU，内存，设备(I/O设备、磁盘、时钟、网络接口等)
软件资源：磁盘上的文件、信息
资源管理目的：实现资源共享、提高资源利用率
复用方式：时间及空间

怎样管理资源？

数据结构与算法
- 跟踪记录资源使用状况
- 分配和回收资源(资源分配策略与算法)
  - 静态分配策略
  - 动态分配策略 ✓
资源管理目标
- 提高资源利用率
- 资源使用时的保护
- 协调多个进程对资源请求的冲突

2.2 进程的观点

从操作系统运行的角度动态观察操作系统：

操作系统是由一些可同时、独立运行的进程和一个对这些进程进行协调的核心组成
进程：完成某一特定功能的程序，是程序的一次执行过程，动态的、有生命的，有诞生/消亡

2.3 虚机器观点

从操作系统内部结构来看：

把操作系统分成若干层
每一层完成其特定功能，构成一个虚机器，并对上一层提供支持
通过逐层功能扩充，最终完成整个操作系统虚机器
操作系统虚机器向用户提供各种功能，完成用户请求

3. 操作系统的特征

3.1 并发(concurrency)

处理多个同时性活动的能力
计算机系统中同时运行多个程序
宏观上：这些程序同时在执行
微观上：单CPU情况下，任何时刻只有一个程序在执行，即这些程序在CPU上轮流执行
由并发引起的问题：活动切换、保护、相互依赖的活动间的同步
**并行(parallel)**与"并发"的区别

3.2 共享(sharing)

操作系统与多个用户程序共同使用计算机系统中的资源

共享有限的系统资源
操作系统要对系统资源进行合理分配和使用
资源在一个时间段内交替被多个进程所用
- 互斥共享(如打印机)
- 同时共享(访问)(如可重入代码，磁盘文件)
由于共享引发的问题：资源分配难以达到最优化，资源使用时需要保护

3.3 虚拟(Virtual)

一个物理实体映射为若干个对应的逻辑实体(分时或分空间)
虚拟技术是操作系统管理系统资源的重要手段，可提高资源利用率
- CPU：每个用户(进程)的"虚处理器"
- 存储器：每个进程都占有的地址空间(代码＋数据＋堆、栈)
- 显示设备：多窗口或虚拟终端

3.4 随机性(不确定性)

操作系统必须随时对以不可预测的次序发生的事件进行响应
进程的运行速度不可预知：多个进程并发执行，"走走停停"，无法预知每个进程的运行推进快慢
难以重现系统在某个时刻的状态(包括重现运行中的错误)

4. 操作系统发展历史

技术变化与概念重用

技术变化导致某些思想过时并迅速消失，但技术的另一种变化还可能使它们复活。例如：

磁盘上文件分配—连续文件(CD-ROM文件系统)
硬件保护
动态链接(MULTICS首先提出)
计算服务(MULTICS，以大量的、附有相对简单用户机器的、集中式Internet服务器形式回归) → 云计算

4.1 操作系统发展阶段

第1阶段(1948-1970)：硬件昂贵，人工便宜

控制台：一次一个用户(独占资源)
批处理：装入程序 → 运行 → 打印输出结果(无保护)
多道程序设计：多个程序同时运行，多个用户共享系统(需要存储保护)
SPOOLing技术：批处理作业处理流程

第2阶段(1970-1985)：硬件便宜，人工昂贵

交互、分时：多个用户同时与系统交互
用户可以在线工作：开发、调试、编辑等
问题：增加用户时 → 系统性能降低(响应时间、抖动)

第一个分时操作系统CTSS：

1959年在MIT提出分时系统思想
每个用户有一个联机终端
计算机能够为许多用户提供交互式、快速服务，同时在CPU空闲时还能在后台运行大作业

重要历史事件：

OS/360：IBM发布时带着已知的1000个错误
Multics：1963年开始，1969年才发布
UNIX：一群计算机迷在贝尔实验室开发，初衷是在DEC PDP-7小型计算机上玩星际探险游戏

第3阶段(1981-)：硬件非常便宜，人工非常昂贵

个人计算时代
开始PC硬件资源有限，一次运行一个程序，OS是一个例程库，回归简单
逐渐PC资源丰富，OS又成为一个庞然大物(大型OS)，存储保护、多道程序设计再次出现

第4阶段(1981-)：分布式

网络：允许不同机器很容易地相互共享资源(打印机、文件服务器、Web服务器)
解决问题：共享，安全

第5阶段(1995-)：移动计算时代

各种移动终端的出现(笔记本、平板、手机、机顶盒、可穿戴设备等)
特点：小型、移动、便宜，但能力有限

第6阶段(2006-)：云计算时代

提供可无限扩展的、可随时获取的、按需使用、按使用付费的资源
云计算操作系统：云计算后台数据中心的整体管理运营系统
作用：
- 管理和驱动海量服务器、存储等基础硬件
- 为云应用软件提供统一、标准的接口
- 管理海量的计算任务以及资源调配

第7阶段(200?-)：泛在计算/普适计算/物联网

许多联网设备为许多人提供个性化的服务

5. 操作系统分类

5.1 传统分类

1. 批处理操作系统

批：供一次加载的磁带或磁盘，通常由若干个作业组装成
工作方式：
1. 用户将作业交给系统操作员
2. 系统操作员将许多用户的作业组成一批作业，输入到计算机系统中
3. 系统操作员启动操作系统
4. 系统自动、依次执行每个作业
5. 由系统操作员将作业结果交给用户
典型的作业结构：由一张张卡片组成，卡片上是命令和程序
分类：
- 单道批处理系统(simple batch processing, uni-programming)
- 多道批处理系统(multiprogramming system)

SPOOLing系统(技术)

1961年，英国曼彻斯特大学，Atalas机
Simultaneous Peripheral Operation On-Line(同时的外围设备联机操作)--假脱机技术
思想：利用磁盘作缓冲，将输入、计算、输出分别组织成独立的任务流，使I/O和计算真正并行
工作原理
- 作业进入到磁盘上的输入井
- 按某种调度策略选择几种搭配得当的作业，并调入内存
- 作业运行的结果输出到磁盘上的输出井
- 结果从磁盘上的输出井送到打印机
主要特点：
- 提高I/O速度
- 将独占设备改造为共享设备
- 实现虚拟设备功能

2. 分时操作系统(time-sharing system)

时间片(time slice)：操作系统将CPU的时间划分成若干个片段
操作系统以时间片为单位，轮流为每个终端用户服务, 每次服务一个时间片 (其特点是利用人的错觉，使人感觉不到)
追求目标：及时响应(依据是响应时间)
响应时间：从终端发出命令到系统给予回答所经历的时间

3. 实时操作系统

使计算机能及时响应外部事件的请求，在规定的严格时间内完成对该事件的处理
分类：
- 实时过程控制：工业控制，军事控制
- 实时通信(信息)处理：电讯(自动交换)，银行，飞机订票，股市行情
追求目标：对外部请求在严格时间范围内作出反应，高可靠性
特征：关键参数是时间
类型：
- 硬实时系统：某个动作绝对必须在规定的时刻或时间范围完成
- 软实时系统：接受偶尔违反最终时限

4. 个人计算机操作系统

计算机在某一时间内为单用户服务
追求目标：界面友好，使用方便，丰富的应用软件

5. 网络操作系统

基于计算机网络，在各种计算机操作系统上按网络体系结构协议标准开发的软件
功能：网络管理，通信，安全，资源共享和各种网络应用
追求目标：相互通信，资源共享

6. 分布式操作系统

分布式系统：处理和控制的分散(相对于集中式系统)
以计算机网络为基础，基本特征是处理的分布(功能和任务的分布)
所有系统任务可在系统中任何处理机上运行，自动实现全系统范围内的任务分配
特征：
1. 是一个统一的操作系统
2. 资源进一步共享
3. 透明性: 资源共享，分布对用户来讲是不知道的
4. 自治性: 处于分布式系统的多个主机处于平等地位，无主从关系
5. 处理能力增强、速度更快、可靠性增强

7. 嵌入式操作系统

嵌入式系统：在各种设备、装置或系统中，完成特定功能的软硬件系统
嵌入式操作系统：运行在嵌入式系统环境中，对整个嵌入式系统及其所操作、控制的各种部件装置等资源进行统一协调、调度、指挥和控制的系统软件

5.2 Tanenbaum分类

大型机操作系统
服务器操作系统
多处理机操作系统
个人计算机操作系统
掌上计算机操作系统(移动计算机操作系统)
嵌入式操作系统
传感器节点操作系统
实时操作系统
智能卡操作系统

智能卡操作系统

智能卡：一种包含有一块CPU芯片的信用卡
特点：
- 非常严格的运行能耗和存储空间的限制
- 有些智能卡只有单项功能，如电子支付
专用的操作系统：
- 有些智能卡是面向Java的，ROM中有Java虚拟机解释器
- Java小程序被下载到卡中并由JVM解释器解释
- 有些卡可以同时处理多个Java小程序，需要多道程序调度
- 资源管理和保护由卡上的操作系统处理
通信方式：
- 在读写器与智能卡之间通过"命令-响应对"方式进行通信和控制
- 读写器发出操作命令，智能卡接收命令
- 操作系统对命令解释，完成命令的解密与校验
- 操作系统调用相应程序进行数据处理，产生应答信息，加密后送给读写器

6. 重点小结

6.1 典型的国产操作系统

麒麟、鸿蒙、Openeuler、统信等

6.2 核心概念

操作系统的概念
理解操作系统的不同角度
操作系统的主要特征
典型的、历史上/当前有重要意义的操作系统
重要的操作系统技术及相关技术
- 多道程序设计
- 中断
- 通道
- SPOOLing技术
操作系统的分类

6.3 重要历史操作系统

OS/360
MULTICS

6.4 操作系统特征

并发
共享
虚拟
随机性

7. 常见问题解答

7.1 Buffer Cache的作用和工作原理

在UNIX操作系统中，文件子系统与块设备之间的Buffer Cache：

作用：
- 减少对物理设备的访问次数，提高I/O性能
- 协调CPU与I/O设备之间的速度差异
- 支持数据的读写缓冲，实现数据共享
工作原理：
- 当进程请求读取数据时，系统首先检查Buffer Cache中是否有所需数据
- 如果有（命中），直接从Buffer Cache返回数据
- 如果没有（未命中），从物理设备读取数据到Buffer Cache，再返回给进程
- 写操作时，数据先写入Buffer Cache，再由系统决定何时写回物理设备

7.2 UNIX的名字来历（猜测）

UNIX名字可能来源于MULTICS（Multiplexed Information and Computing Service）的简化和双关语：

MULTICS是一个复杂的分时系统
UNIX（Uniplexed Information and Computing Service）表示简化版的MULTICS
也有说法是"UNIX"是"eUNuchs"（阉割版的MULTICS）的变体

7.3 批处理操作系统的区别

单道批处理：一次只能执行一个作业，作业按顺序依次执行，前一个作业完成后才能执行下一个
多道批处理：内存中同时存放多个作业，CPU在这些作业之间切换执行，提高了CPU利用率和系统吞吐量

7.4 SPOOLing技术的现状

SPOOLing技术并未过时，在现代计算机系统中仍有广泛应用：

打印系统：现代操作系统的打印队列管理
邮件系统：电子邮件的发送和接收过程
后台作业处理：批处理任务的调度和执行
数据库系统：事务处理和日志管理

7.5 传统分时系统在今天的意义

传统分时系统在今天仍有重要意义：

多用户支持：现代操作系统继承了分时系统的多用户并发访问能力
资源共享：分时思想是云计算、虚拟化等现代技术的基础
交互式计算：分时系统建立的交互式计算模式仍是现代系统的核心特性
公平调度：分时系统的时间片轮转调度思想仍被广泛应用

7.6 操作系统的主要作用和典型特征

操作系统的主要作用：

管理计算机硬件和软件资源
为应用程序提供统一的服务接口
实现人机交互，提供用户界面
提高系统资源利用率
保护系统安全和数据完整性

操作系统的典型特征（与其他软件相比）：

并发性：能够同时运行多个程序
共享性：多个用户/程序共享系统资源
虚拟性：将物理资源抽象为逻辑资源
异步性：程序执行的结果与时间有关
持久性：操作系统常驻内存
特权性：拥有对硬件的直接控制权
复杂性：结构复杂，功能丰富

[中文] 如何在家里做一个闪闪发光的漂亮晶体

Tue, 28 Jan 2025 15:07:00 GMT

import { Aside } from '@/components/user'

本文为博主 2022 年秋季学期的魅力化学课程论文, 感觉很有纪念意义故发布.

一、前言

苏霍姆林斯基说："在人的心灵深处，都有一种根深蒂固的需要，就是希望自己是一个发现者，研究者和探究者。" 每个人都有对新奇事物的求知欲，而作为一门历史悠久的学科，化学以其百变的现象、剔透的晶体、丰富的物质等一系列独特而又直观的魅力吸引着一代又一代的学生。

作为一门典型的实验学科，中学生们却只能在习题中做实验，进入实验室的机会可以说是少之又少，而在对实验的兴趣和沉没题海的枯燥之间的矛盾便是中学家庭实验党产生的最好土壤。

幸运又不幸，我曾是一名家庭实验党。在自己动手实现一些实验时，我满足了对化学的好奇心。例如亚甲基蓝和葡萄糖在空气作用下的还原氧化循环（蓝瓶子实验）或制作纯净物的晶体（本文主要介绍内容），这些实践让我对化学产生了更深的理解。

而遗憾的是，首先实验区与生活区不能完全分离、废物处理不当、在缺乏适当安全防护的情况下进行危险实验（比如大剂量铝热实验、没有通风橱的情况下制取氯气），这些都存在潜在危险。同时也常常疏于记录实验过程，这也不是一个好习惯。更重要的是，关于家庭实验的意义，在现在对化学实验有了更深认识的当下，我或许会产生一些不同的看法。

那段时间我主要进行纯净物晶体的制备，从最基础的五水合硫酸铜、十二水合硫酸铝钾，到硫酸铬钾、氯化钠、氯化钾、硫酸亚铁，再到铁氰化钾、硫酸镍铵、硫酸锰。随着经验的积累，我对溶液的析出结晶细节愈发熟悉，能够获得更为规则、晶莹剔透的晶体。

十二水合硫酸铝钾包裹的硫酸铬钾

最后由于时间久远，本文中的图片没有完全使用我自己拍摄的图片，使用了一些网络图片作为补充（将标明）。

二、一般的制作流程

制作晶体的方法多种多样，大体上分为两种，分别是液相结晶和熔融凝固结晶法。

在家中进行晶体制作的条件比较简陋，因此一般采取水液相结晶的方法。

熔融凝固结晶法一般用来制作金属晶体，比如铋和镓的晶体，需要较高的温度，并且某些物质还会受热分解，因此难度较高。

其它溶剂液相结晶法可以用来制作在水中溶解度低的物质的晶体，比如使用四氯化碳制作硫晶体、无水乙醇制作碘晶体，但是由于有机溶剂一般具有较大的毒性且挥发性较强，往往不采用这个方法制作。

（一）晶体类型选择

第一次制备晶体时的最佳选择是五水合硫酸铜（胆矾）。硫酸铜晶体析出的稳定性极强，制备难度极低。硫酸铜溶解度高，溶液稍有杂质或者过饱和也能长出明显的平行四边形晶体，颜色亮蓝色鲜艳好看，且毒性低。同时它的晶体容易悬吊，适合使用悬吊法制做出极大的单晶。

其次就是十二水合硫酸铝钾（明矾）和十二水合硫酸铬钾（铬矾），因为它们是类质同晶的，也就是可以做它们的不同配比的混晶，做出来的晶体为正六面体或者正八面体，形状规则好看。

体积较大的分层明矾铬钾

稍有难度的是氯化钠的晶体，虽然常用的食盐中绝大部分都是它，但是想要做一个大且透明的单晶是难上加难，制作的时候一定不要使用食盐，因为杂质与添加剂太多，不会形成单晶。氯化钠晶体的制作难度首先是它的溶解度较低，想要冷却热饱和溶液制备晶种几乎不可能，其次是容易产生碎晶，也很难做出晶莹剔透的晶体。

一般在制备的时候都会添加一些甘氨酸[^1] （8g/L）作为添加剂以提高氯化钠晶体的透明度，如果想要进一步提高晶体的透明度可以加入少量的硝酸铅[^2]（0.1g/L）。

氯化钠单晶

（二）配置母液

首先应该配置饱和溶液。一般采用母液法，虽然理论上可以通过查询溶解度表，再计算溶质与结晶水的质量来使溶液恰好饱和，但是考虑到晶体制作的流水线连续性、溶液复用性、室温的波动以及溶解度表的不准确性，使用一个烧杯存放母液作为缓冲往往可以得到更好的效果。

首先需要准备一个容量较大的烧杯作为母液烧杯，根据溶解度加入大致质量的溶质并等待一段时间，如果烧杯底部仍有未溶解的溶质（因为溶解结晶是动态平衡，因此多余的试剂往往会变成晶体"大饼"），就说明这杯溶液饱和了，我们将其作为母液，此时母液的上层清液便是饱和溶液。

烧杯底部的晶体"大饼"[^2]

（三）析晶方法

现在我们有了饱和溶液，那么具体如何操作才能使晶体从水中析出呢？一般有两种方法，分别是冷却热饱和溶液法和常温蒸发结晶法。

冷却热饱和溶液法适用于溶解度对温度变化敏感的溶质，比如硫酸铜。具体操作是对每 100 克水加入比当前温度溶解度多 20 克左右的溶质（加多了容易析出大饼），搅拌加热至完全溶解，将溶液立刻倒入结晶皿中并等待结晶，此时要注意在结晶皿上盖一张滤纸以防止灰尘落入结晶皿，灰尘可能会造成溶液迅速析出大量碎晶；待温度下降溶液结晶后用镊子夹出品相较好的小晶体作为晶核/晶种，注意一旦镊子进入溶液也会造成溶液迅速析出大量碎晶。在拿出心仪的小晶种之后，将剩余液体与碎晶倒回母液烧杯。

冷却热饱和溶液法由于溶解度下降的速率较快，往往用来制作大量小晶种，也就是以量取胜，难以制作单个的形状规则的大晶体。

冷却热硫酸铜溶液析晶[^3]

常温蒸发结晶法适用于任何种类的溶质，只要取母液的上层清液，倒入结晶皿，放入小晶核（不放其实也可以），静置析晶即可。

常温蒸发结晶法除了可以将晶种放在结晶皿底部，也可以用透明细鱼线（或许头发也可以）将晶种悬挂在饱和溶液中，这个方法的好处在于晶体底部不会被结晶皿底部限制而产生不自然的凹面，但是坏处是鱼线会留在晶体内部。

栓绳的胆矾晶体与悬吊法生长的明矾

最后在从溶液中拿出晶体后，一定要注意立刻将晶体表面的溶液擦干，因为表面的溶液由于于空气接触面积极大，会迅速风干，在晶体表面留下许多细小的杂晶，导致一段时间过后晶体表面变得粗糙。

（四）保存方法

在得到了这些漂亮的晶体之后我们显然不会把它们又放回母液中溶掉，而是想把它们保存下来，那么现在就要考虑如何保存晶体才能让保存时间长久还能好好地把玩晶体。

另外如果晶体因为保存不慎表面被风化了一些，可以通过将晶体放回饱和溶液几秒钟，直到表面的脱水白色部分变回到正常含结晶水的颜色。

拍照保存

拍照保存实在是保存时间最久的方法，下图中的硫酸亚铁早已因为保存不当而丢失结晶水风化为白色粉末了，但是它的遗照仍然存放在我的电脑中。

硫酸亚铁（N 年之前）

使用矿物标本盒

顾名思义，这个方法往往用来展示固体标本而不是长时间存放，如果是易风化（含有结晶水的任何物质）、光解（三草酸合铁酸钾）的晶体不要使用这样的方法展示。

矿标盒里的铝钾铬钾混晶[^4]

使用密封袋

好处在于价格亲民，保存非常方便，对于普通的晶体如氯化钠，可以做到长期的保存。但如果稍微有一点难度，如会风化（硫酸铜）、吸湿（氢氧化钠）、光解（三草酸合铁酸钾）、热分解（高锰酸钾）、氧化（硫酸亚铁），只用密封袋保存的话，它们会迅速变质，因此往往将晶体用清漆包裹一层再放入密封袋。

西林瓶+液体石蜡（石蜡油）

能够较为长久地保存晶体，但是坏处在于石蜡油极其难以清除，如果需要使用晶体或者用其他方法保存晶体，表面的石蜡油就很难清理干净了。

环氧树脂

这个方法可以非常长久的保存晶体（除了光解、热分解的晶体），方便把玩，不怕摔碎，实在是保存晶体的上佳方式。但是不建议与还原性物质一起使用，可能会造成晶体的氧化变质，比如硫酸亚铁可能会氧化发黑[^5]。

环氧树脂里的铁氰化钾[^6]

三、实验安全

（一）选材安全

应当遵守法律法规，遵守《危险化学品安全管理条例》、《中华人民共和国治安管理处罚法》、《中华人民共和国消防法》，不使用有毒有机溶剂结晶、不使用有毒性、致癌的药品，如重铬酸钾。

（二）过程安全

生活区与实验区必须完全分离，生活区禁止存放化学试剂，特别是禁止在冰箱中同时存放食物和化学试剂；试验区不得进食或使用厨具。
戴手套，尤其是使用重金属盐时，不戴手套最常见的问题是镍离子导致皮肤过敏、重金属盐（如银离子）导致手掌蛋白质变色。
不使用不规范、有风险的操作，如：直接加热烧杯、重复使用过滤纸，纱布及一切滤纸代用品，并且应逐步取消明火加热。

四、环保要求

尤其需要注意的是废水排放需要遵循《污水综合排放标准》，排入下水道应遵循《污水排入城市下水道水质标准》[^7]，以铜为例，排入下水道的废液中总铜含量应小于 2mg/L。

以硫酸铜为例给出晶体废液的可能处理方式：

储存或放回母液中
用于制备其他试剂，如斐林试剂
蒸干回收硫酸铜
硫化钠沉淀铜离子
碱沉淀铜离子
活泼金属置换铜

五、总结

家庭制作纯净物晶体的出发点是为了满足对化学实验的好奇、满足对美丽的化学晶体的喜爱。仍然记得我做出来的第一个晶体是硫酸铜，当我把热饱和溶液倒入结晶皿的时候内心非常激动，甚至盖好了滤纸（防止灰尘进入）还是忍不住每隔一小会就揭开看一眼，最后当我看到了清澈的蓝色溶液中出现了小小的，但是清晰可见的平行四边形晶体的时候，内心的激动真的是无以言表。

回到最开始提出的问题，家庭实验是否是有意义的，如果是在化学领域深耕多年的相关从业者，他可能会说家庭实验毫无意义，与学习相比是舍本逐末；而如果是刚开始学习的小白（比如当年的我）可能会说这是兴趣与知识的桥梁。

如果要由现在的我来评价，在对化学实验有了更理性的认识，收起所有仪器之后，我会说家庭实验可能并不是最理想的学习方式。如果我反思当时的经历，会发现实际上自己完全没有实验规划，只是看到了有趣的实验现象，就会想去尝试复现，完成后又想尝试下一个，因此实验的重点在于观察现象而不是实验前后的思考，这就使实验失去了其教育意义。

有观点认为，几百年前的化学家通过随机实验发现了许多有意义的反应。然而，这种说法并不准确。事实上，化学家们是基于已有反应构建模型，通过模型预测其他反应的结果，再进行实验验证。这种假说演绎法具有科学思维的意义，与单纯追求实验效果的做法有本质区别。

本文所述晶体均为亲身制备经历。限于篇幅，未能详述其他晶体的制备过程，如淡粉色的硫酸锰、淡黄色的亚铁氰化钾。正是这些晶体的美感促使我研究单晶的制备技术。时至今日，每一个制备的晶体仍历历在目，这或许正是化学的魅力所在。

谨以此文总结我在中学阶段与化学的故事和对化学的热爱。

[^1]: 翁贤芬. 大颗粒氯化钠的制备研究[J]. 盐业与化工, 2009.

[^2]: 双色大饼，你值得拥有[EB/OL]. 百度贴吧. https://tieba.baidu.com/p/7821134717

[^3]: 从零开始的晶体教程（3）[EB/OL]. 科创网. https://www.kechuang.org/t/88078

[^4]: 百度贴吧[EB/OL]. https://tieba.baidu.com/p/7714718573

[^5]: 从零开始的晶体教程（3.5）[EB/OL]. 科创网. https://www.kechuang.org/t/88081

[^6]: 百度贴吧[EB/OL]. https://tieba.baidu.com/p/7714718573

[^7]: GB/T 31962-2015, 污水排入城镇下水道水质标准[S]. http://www.wxbh.gov.cn/doc/2022/09/01/3743836.shtml

[中文] Compiler Principles Lab Notes

Sun, 12 Jan 2025 02:15:00 GMT

import { Aside } from '@/components/user'

Lv 0

Prepare Environment

首先安装并运行 Docker .

拉取镜像:

docker pull maxxing/compiler-dev

使用镜像创建容器:

docker run -it --name compiler -v <compiler_lab_path>:/root/compiler maxxing/compiler-dev bash

其中参数的含义:

-it 表示以交互模式运行容器.
--name compiler 表示将容器重命名为 compiler.
-v <compiler_lab_path>:/root/compiler 表示将宿主机的编译 Lab 项目文件夹挂载到容器中.
maxxing/compiler-dev 表示使用 maxxing 提供的 compiler-dev 镜像.
bash 表示以 bash 为启动命令.

博主的编译项目结构类似这样, 其中 ~/Documents/xxx/Lv7 就是你的宿主机编译 Lab 项目文件夹:

Mac OS 1926-08-17 12:00:00
emptyblue ~/Documents/xxx/Lv7
❯ tree 

.
├── CMakeLists.txt
└── src
    ├── include
    │   ├── koopa.h
    │   ├── koopa.hpp
    │   ├── koopa_util.hpp
    │   ├── riscv.hpp
    │   └── riscv_util.hpp
    ├── koopa.cpp
    ├── koopa_util.cpp
    ├── main.cpp
    ├── riscv.cpp
    ├── riscv_util.cpp
    ├── sysy.l
    └── sysy.y

3 directories, 13 files

如果非 MacOS, 可以加入 --cap-add=SYS_PTRACE --security-opt seccomp=unconfined 表示添加 SYS_PTRACE 权限, 取消 seccomp 限制, 以方便使用 LLDB 在 Docker 中调试.

但是我没有找到方法在 MacOS 上的 Docker 中运行 LLDB, 如果你找到了可以解决这个问题的办法, 可以在下面写一个评论!

2024-12-23 Update:

似乎助教的实验文档提及了如何调试: 调试 risc-v 程序

每次需要进入容器时, 先启动容器, 再进入:

docker start compiler
docker exec -it compiler bash

退出容器 (Control + D):

exit

查看所有容器:

docker ps -a

停止所有容器:

docker stop $(docker ps -aq)

删除 compiler 容器:

docker rm -f compiler

删除所有容器:

docker rm $(docker ps -aq)

Compile and Test

请仔细阅读实验环境使用说明 .

使用 cmake 生成 Makefile 文件, 指定编译类型为 Debug:

cmake -DCMAKE_BUILD_TYPE=Debug -B build

使用 cmake 生成 Makefile 文件, 不指定编译类型:

cmake -B build

使用 cmake 编译:

cmake --build build

运行编译器, 把 debug/hello.c 编译为 debug/hello.koopa:

./build/compiler -koopa debug/hello.c -o debug/hello.koopa

运行编译器, 把 debug/hello.c 编译为 debug/hello.S:

./build/compiler -riscv debug/hello.c -o debug/hello.S

本地自动评测 koopa:

autotest -koopa -s lv<lv_number> /root/compiler

本地自动评测 riscv:

autotest -riscv -s lv<lv_number> /root/compiler

如果本地测试不通过, 可以把 /opt/bin/testcases 中的测试用例复制到当前路径进行查看调试.

cp -r /opt/bin/testcases .

如果想测试自己的测试用例, 可以将自己的测试用例所在的目录传给 autotest 命令, 比如:

autotest -t <test_case_dir> /root/compiler

注意每一个 Test Case 包含两个名称相同的 .c 和 .out 文件, 其中 .c 是输入给编译器的代码, .out 是你的编译器应该返回的结果.

Lv 1

Lab 的第一个 checkpoint 要求大家完成编译器的基础逻辑结构搭建, 包括:

词法分析器的逻辑
语法分析器的逻辑
简单的中间代码 Koopa 生成器

我使用的是 CMake 作为构建系统, 采用了基于 CMake 的 SysY 编译器项目模板的结构.

可以先把实验文档中 Lv 1 中给出的代码复制下来作为 codebase .

Lexer

我们只需要在 src/sysy.l 中写一段代码说明如何定义 Token 类型, 如何把读到的字符串转化为整数或者浮点数, 然后就可以使用 flex 读入 src/sysy.l 来生成词法分析器, 所以实际上不用自己写一个词法分析器.

flex 的输入文件的语法规则可以参考实验文档对应章节 .

示例:

"int"           { return INT; }
"return"        { return RETURN; }
{Identifier}    { yylval.str_val = new string(yytext); return IDENT; }
{Decimal}       { yylval.int_val = strtol(yytext, nullptr, 0); return INT_CONST; }

其中 INT, RETURN, IDENT 等返回值, 其实是 Bison 生成的固定枚举类型值, 就是一个整数.

所以这段代码代表的含义为:

"int" 和 "return" 是正则表达式, 这就是告诉当匹配到这些字符串时, 返回给语法分析器 INT 和 RETURN 类型, 告诉语法分析器这是一个保留字.
{Identifier} 是上面定义好的正则表达式, 当这个表达式匹配到某个字符串时, 将这个字符串赋值给语法分析器定义的 yylval.str_val 变量, 然后返回给语法分析器 IDENT 类型, 告诉语法分析器这是一个标识符, 比如函数名, 语法分析器知道现在读取到了一个标识符, 就从 yylval.str_val 中取出这个字符串.
{Decimal} 是上面定义好的正则表达式, 当这个表达式匹配到某个字符串时, 将这个字符串赋值给语法分析器定义的 yylval.int_val 变量, 然后返回给语法分析器 INT_CONST 类型, 告诉语法分析器这是一个整数常量, 语法分析器知道现在读取到了一个整数常量, 就从 yylval.int_val 中取出这个整数.

Parser

我们只需要在 src/sysy.y 中写一段代码说明如何定义语法规则, 比如一个函数是如何由函数类型, 函数名, 变量声明列表和函数体组成的, 然后就可以使用 bison 读入 src/sysy.y 来生成语法分析器.

规约示例:

FuncDef
  : FuncType IDENT '(' ')' Block {
    auto ast = new FuncDefAST();
    ast->func_type = unique_ptr<BaseAST>($1);
    ast->ident = *unique_ptr<string>($2);
    ast->block = unique_ptr<BaseAST>($5);
    $$ = ast;
  }

其中 FuncDefAST 等类是 include/ast.hpp 中由你定义好的, 其中包括了每个语法规则包含的语法单元, 比如 FuncDef 语法规则包含 FuncType, IDENT, Block 等语法单元, 语法分析器现在使用这些类来构造抽象语法树.
$1 是代表子语法单元的变量, 比如 FuncDef 语法规则的第一个子语法单元是 FuncType, 那么 $1 就代表 FuncType, 语法分析器递归地从 FuncType 继续规约, 注意这里的变量标号是从 1 开始的.
$$ = ast; 是告诉语法分析器, FuncDef 语法规则规约的结果是一个 FuncDefAST 类, 语法分析器现在知道 FuncDef 语法规则规约的结果 FuncDefAST 类中都是什么数据了.

`Koopa IR` Generation

当语法分析器规约出抽象语法树后, 我们就可以遍历抽象语法树, 遇到叶子节点就 print , 遍历结束就生成了中间代码 Koopa.

在 main.cpp 中定义编译器本身的 main 函数, 读入需要编译的源文件, 调用词法分析器和语法分析器, 得到放好数据的抽象语法树, 然后调用语法树类中定义好的 print 函数生成中间代码 Koopa.

我的具体结构安排是:

在 main.cpp 中定义编译器本身的 main 函数, 读入需要编译的源文件, 调用词法分析器和语法分析器, 得到放好数据的抽象语法树, 然后调用语法树类中定义好的 print 函数生成中间代码 Koopa.
在 include/ast.hpp 中定义抽象语法树的节点类, 每个节点类中定义一个 print 函数, 用于生成中间代码 Koopa 或 Debug 信息.
在 ast.cpp 中定义抽象语法树的各个节点类, 并实现 print 函数.

Incomplete Parts of the Codebase

在 handout 给出的 codebase 中, 词法分析器和语法分析器大部分已经写好了, 但是还有一些需要修改的地方:

在 src/sysy.y 中, 需要加入 include/ast.hpp 的引用, 否则语法分析器会找不到你定义的抽象语法树的节点类, 就不能把数据写到你定义的抽象语法树中.
在 include/ast.hpp 中, 需要定义示例代码中没有给出的抽象语法树的节点类, 并定义 print 函数.
在 ast.cpp 中, 需要实现示例代码中没有实现的抽象语法树的各个节点类, 并实现 print 函数.

确保在 src/sysy.l 中定义正确的 BlockComment 的正则表达式, 否则有一些测试点不通过.

好的, 现在已经完成了编译器的基础逻辑结构搭建!

Compile and Test

以下均默认你已经进入容器, 并且当前目录为编译 Lab 的一级目录.

使用 cmake 生成 Makefile 文件:

cmake -DCMAKE_BUILD_TYPE=Debug -B build

使用 cmake 编译:

cmake --build build

运行编译器, 把 debug/hello.c 编译为 debug/hello.koopa:

./build/compiler -koopa debug/hello.c -o debug/hello.koopa

本地自动评测:

autotest -koopa -s lv1 /root/compiler

如果本地测试不通过, 可以把 /opt/bin/testcases 中的测试用例复制到当前路径进行查看调试.

cp -r /opt/bin/testcases .

Lv 2

首先回顾一下编译器的三层结构:

前端: 通过词法分析和语法分析, 将源代码解析成抽象语法树 (abstract syntax tree, AST). 通过语义分析, 扫描抽象语法树, 检查其是否存在语义错误.
中端: 将抽象语法树转换为中间表示 (intermediate representation, IR), 并在此基础上完成一些机器无关优化.
后端: 将中间表示转换为目标平台的汇编代码, 并在此基础上完成一些机器相关优化.

在 Lv 1 中已经完成了前端和中端, 现在来完成后端.

虽说是完成后端, 但是实际上助教团队已经帮助实现好了能够处理 Koopa IR 的库, 我们只需要调用他们提供的库 (即调用 koopa.h 中定义的函数) 就可以完成后端的大部分实现了, 我们只需要自己实现 RISC-V 汇编代码的输出就可以了.

具体如何调用, 参阅实验文档把代码复制下来即可.

最后的后端代码入口应该类似:

#include "include/backend.hpp"

int backend(const char *koopa_str)
{
    // 解析字符串 str, 得到 Koopa IR 程序
    koopa_program_t program;
    koopa_error_code_t ret = koopa_parse_from_string(koopa_str, &program);
    assert(ret == KOOPA_EC_SUCCESS); // 确保解析时没有出错
    // 创建一个 raw program builder, 用来构建 raw program
    koopa_raw_program_builder_t builder = koopa_new_raw_program_builder();
    // 将 Koopa IR 程序转换为 raw program
    koopa_raw_program_t raw = koopa_build_raw_program(builder, program);
    // 释放 Koopa IR 程序占用的内存
    koopa_delete_program(program);

    // 处理 raw program
    visit(raw);

    // 处理完成, 释放 raw program builder 占用的内存
    // 注意, raw program 中所有的指针指向的内存均为 raw program builder 的内存
    // 所以不要在 raw program 处理完毕之前释放 builder
    koopa_delete_raw_program_builder(builder);

    return 0;
}

void visit(const koopa_raw_slice_t &slice)
{
  // ...
}

void visit(const koopa_raw_program_t &program)
{
  // ...
}

// ...

Traverse the Abstract Syntax Tree

调用库之后我们就得到了以抽象语法树形式表示的 RISC-V 汇编代码, 现在需要 DFS 遍历这棵抽象语法树, 将其转换为字符串并输出, 我们选择使用函数递归的方式来遍历这棵抽象语法树, 具体如何遍历可以参考实验文档, 这里不再赘述, 但是有一些 high level 的 idea 可以帮助你理解这颗树上的各种助教定义的 type.

这颗语法树的节点大致是 program, function, basic_block, value, 这些节点很多都包含同类型的东西, 比如一个程序有很多的函数, 一个函数有很多的基本块, 一个基本块有很多指令, 那么比如 program 这个节点的这一堆函数就会存在一个 koopa_raw_slice_t 类型中, 所以对于一个 program 节点中的所有函数, 只需要对包含这些函数的这一个 koopa_raw_slice_t 调用一次 visit 函数即可, 如下所示, visit 函数会把这一堆东西逐个帮你访问.

void visit(const koopa_raw_slice_t &slice)
{
    for (size_t i = 0; i < slice.len; ++i)
    {
        auto ptr = slice.buffer[i];
        // 根据 slice 的 kind 决定将 ptr 视作何种元素
        switch (slice.kind)
        {
        case KOOPA_RSIK_FUNCTION:
            // 访问函数
            visit(reinterpret_cast<koopa_raw_function_t>(ptr));
            break;
        case KOOPA_RSIK_BASIC_BLOCK:
            // 访问基本块
            visit(reinterpret_cast<koopa_raw_basic_block_t>(ptr));
            break;
        case KOOPA_RSIK_VALUE:
            // 访问指令
            visit(reinterpret_cast<koopa_raw_value_t>(ptr));
            break;
        default:
            // 我们暂时不会遇到其他内容, 于是不对其做任何处理
            assert(false);
        }
    }
}

访问 koopa_raw_value_t 类型的函数大致如下所示, koopa_raw_value_t 类型是一个指针, 这个指针可以指向 RISC-V 汇编代码的一个值 (一条指令的结果可以代表这个指令, 所以一条指令也算一个值) .

如果碰上代表一个指令, 就可能重复调用 visit koopa_raw_value_t 两次, 因为指令中包含值, 比如调用 visit koopa_raw_value_t 时发现这是一个返回指令, 就调用 visit koopa_raw_return_t , 返回值就会需要再调用一次 visit koopa_raw_value_t.

void visit(const koopa_raw_value_t &value)
{
    // 根据指令类型判断后续需要如何访问
    const auto &kind = value->kind;
    switch (kind.tag)
    {
    case KOOPA_RVT_RETURN:
        // 访问 return 指令
        visit(kind.data.ret);
        break;
    case KOOPA_RVT_INTEGER:
        // 访问 integer 指令
        visit(kind.data.integer, value);
        break;
    // ...
    default:
        // 其他类型暂时遇不到
        throw std::runtime_error("visit: invalid instruction");
    }
}

Link Middleend and Backend

与此同时, 你还需要将你在 Lv 1 中输出的 Koopa IR 输入给后端, 在这里我推荐使用 std::stringstream 类型来存储 Koopa IR, 然后交给后端即可, 实现代码可以类似:

std::ostringstream koopa_ir; // 用于存储 Koopa IR 的 stringstream
// ...
ast->print(&koopa_ir);
  // ...
  // inside print(): 你的中端代码将 Koopa IR 输出到 koopa_ir 中
  // ...
freopen(output, "w", stdout); // 将 stdout 重定向到 output 文件, output 是你的输出文件路径
backend(koopa_ir.str().c_str()); // 将 stringstream 转换为 C style string 后交给后端
  // ...
  // inside backend(): 后端代码将 RISC-V 汇编代码输出到 stdout 中
  // ...
fclose(stdout);

这样写的优点包括:

实现简洁明了.
无需进行硬盘交互 (把 Koopa IR 输出到文件系统再从硬盘读取, 再交给后端), 这样实现之后 Koopa IR 的数据保存在内存中, 后端直接从内存中读取即可.

Compile and Test

运行编译器, 把 debug/hello.c 编译为 debug/hello.S:

./build/compiler -riscv debug/hello.c -o debug/hello.S

本地自动评测:

autotest -riscv -s lv1 /root/compiler

Lv 3

本章将在上一章的基础上, 实现一个能够处理表达式 (一元/二元) 的编译器.

需要完成对抽象语法树和 RISC-V 汇编代码输出这两部分的修改.

你的编译器将可以处理如下的 SysY 程序:

int main() 
{
  return 1 + 2 * -3;
}

需要完成对抽象语法树和 RISC-V 汇编代码输出这两部分的修改.

Lexer

修改 src/sysy.l 文件, 添加对运算符的识别, 比如 ! 和 - 运算符.

/* 运算符 */
ExclusiveUnaryOp       "!"
MulOp         [\*/%]
AddOp         [\+\-]
RelOp         ("<"|">"|"<="|">=")
EqOp          ("=="|"!=")
AndOp         "&&"
OrOp          "||"

这里我的逻辑是对每一种运算都定义一个正则表达式, 用来表达这个运算会使用的所有字符, 这样就不用在语法分析器中对每一个运算符都写一个规约规则了.

但是有一个问题是单元运算符和二元加减运算符有两个符号是重叠的, 所以我选择使用 ExclusiveUnaryOp 来表示只有单元运算符使用的符号, AddOp 就代表着单元运算和二元加减运算共同使用的符号了.

另外还要加入识别 token 之后如何返回给语法分析器, 类似 Identifier 和 Decimal 那样, 使用 yylval 来返回字符串给语法分析器.

{ExclusiveUnaryOp}      { yylval.str_val = new string(yytext); return EXCLUSIVE_UNARY_OP; }

Parser

修改 src/sysy.y 文件和 include/ast.hpp 文件, 添加对新的语法规则的规约.

举例说明:

UnaryExp
  : PrimaryExp {
    auto ast = new UnaryExpAST();
    ast->primary_exp = unique_ptr<BaseAST>($1);
    $$ = ast;
  }
  | EXCLUSIVE_UNARY_OP UnaryExp {
    auto ast = new UnaryExpAST();
    ast->op = *unique_ptr<string>($1);
    ast->unary_exp = unique_ptr<BaseAST>($2);
    $$ = ast;
  }
  | ADD_OP UnaryExp {
    auto ast = new UnaryExpAST();
    ast->op = *unique_ptr<string>($1);
    ast->unary_exp = unique_ptr<BaseAST>($2);
    $$ = ast;
  }
  ;

对应如下的抽象语法树类:

/**
 * @brief 一元表达式抽象语法树类. 
 */
class UnaryExpAST : public BaseAST
{
public:
    std::optional<std::unique_ptr<BaseAST>> primary_exp; // 可选的基本表达式
    std::optional<std::string> op;                       // 可选的操作符 ("+", "-", "!")
    std::optional<std::unique_ptr<BaseAST>> unary_exp;   // 可选的一元表达式

    /**
     * @brief 打印抽象语法树. 
     * @param[in] output_stream 输出流. 
     * @return 打印操作的结果
     */
    Result print(std::stringstream &output_stream) const override; // 打印抽象语法树, 稍后解释这个返回类型的用处
};

其中有两个实现细节:

std::optional
1. 是 C++17 引入的类型, 你可能需要修改 VSCode 的编译器版本, 否则无法正常高亮显示.
2. 它用于表示一个可能存在也可能不存在的值, 如果值存在, 则可以使用 value() 方法获取该值, 如果值不存在, 则可以使用 has_value() 方法判断是否存在, 或者使用 operator* 获取该值, 用来判断在多个规约规则中具体选了那个规约规则.
3. 比如下面的规约规则有两个选择, 分别是 PrimaryExp 和 UnaryOp UnaryExp, 如果选择了 PrimaryExp 那么 primary_exp 就会存在, op 和 unary_exp 就不存在, 反之亦然.
print 函数返回一个 Result 类型的变量, 稍后解释这个返回类型的用处.

以上的代码代表着如下的规约规则:

UnaryExp    ::= PrimaryExp | UnaryOp UnaryExp;
UnaryOp     ::= "+" | "-" | "!";

其中使用了我们在对词法分析器作修改的时候定义的新 token 种类 EXCLUSIVE_UNARY_OP 和 ADD_OP.

当然别忘了要在 src/sysy.y 文件中定义新的终结符和非终结符的类型.

// lexer 返回的所有 token 种类的声明, 终结符的类型为 str_val 和 int_val
%token INT RETURN
%token <str_val> IDENT
%token <int_val> INT_CONST
%token <str_val> EXCLUSIVE_UNARY_OP MUL_OP ADD_OP REL_OP EQ_OP AND_OP OR_OP // Operators

// 非终结符的类型定义
%type <ast_val> FuncDef FuncType Block Stmt Exp UnaryExp PrimaryExp MulExp AddExp LOrExp LAndExp RelExp EqExp
%type <int_val> Number

`Koopa IR` Generation

修改 ast.cpp 文件, 添加对新的语法规则的 print 函数.

在实现之前我们先来思考一个例子:

int main() 
{
  return 6;
}

这是之前的编译器可以处理的代码, 我们在调用 RetAST 的 print 函数时, 先输出 ret 然后调用 NumberExpAST 的 print 函数, 输出 6, 最后回到 RetAST 的 print 函数输出 \n, 就可以得到如下的 Koopa IR 代码:

fun @main(): i32 {
%entry:
  ret 6
}

现在我们考虑这个例子:

int main() 
{
  return -6;
}

如果还是按照之前的逻辑, 先输出 ret 然后调用 ExpAST 的 print 函数, 就会出现问题, 因为我们还需要一个 sub 指令才能计算出 -6, 但是此时 Koopa IR 已经输出到文件中了, 我们无法在 ret 指令后面继续输出 sub 指令了.

这是我们期望得到的 Koopa IR 代码:

fun @main(): i32 {
%entry:
  %0 = sub 0, 6
  ret %0
}

所以我们在进入任何一个 print 函数时, 不能先入为主地输出任何 Koopa IR 指令, 需要先调用这个抽象语法树的所有子变量的 print 函数, 等到它们把类似上文的 sub 指令输出完成之后再输出当前的 Koopa IR 指令.

但是如果子变量的所有 print 函数都没有返回任何信息, 那么我们怎么知道这些子变量把计算结果储存到哪里了呢?

比如 RetAST 的 print 函数, 当它调用完成 ExpAST 的 print 函数之后, 它怎么知道 ExpAST 的计算结果是储存在 %0 这个寄存器中了而不是 %1 或者其他寄存器中呢?

我们不希望使用全局变量解决任何问题, 这样非常 dirty, 所以我们需要每一个 print 函数返回一个 Result 类型的变量, 告诉父变量这个子变量的计算结果储存在哪里, 以便父变量决定如何输出当前的 Koopa IR 指令.

/**
 * @brief 用于存储计算结果的类, 可以是符号或立即数. 
 * @note 如果当前函数会产生一个计算结果, 那么这个计算结果会存储在返回的 `Result` 类型的变量中
 * @note 比如 `PrimaryExpAST` 的 `print` 函数, 当它是从数字规约而来时, 它的 `Result` 变量会被初始化为立即数, 返回 `Result(Result::Type::IMM, *number)` 这样一个变量
 * @note 如果当前函数不会产生计算结果, 那么返回的 `Result` 变量会被初始化为立即数 0
 * @date 2024-11-27
 */
class Result
{
public:
    /**
     * @brief 当前计算值, 存储在 `%current_value_symbol_index` 符号中. 
     * @date 2024-11-27
     */
    static int current_symbol_index;

    enum class Type
    {
        IMM, // 立即数
        REG  // 寄存器
    };
    Type type; // 结果的类型
    int val;   // 结果的值

    // 默认构造函数, 初始化为立即数 0, 没有用到它的地方
    Result() : type(Type::IMM), val(0) {}

    // 带有指定类型的构造函数, 主要用来初始化寄存器
    Result(Type type) : type(type), val(0)
    {
        if (type == Type::REG)
        {
            val = ++current_symbol_index;
        }
    }

    // 带有指定类型和值的构造函数, 主要用来初始化立即数
    Result(Type type, int val) : type(type), val(val)
    {
        if (type == Type::REG)
        {
            val = ++current_symbol_index;
        }
    }

    // 重载 <<
    friend std::ostream &operator<<(std::ostream &os, const Result &result)
    {
        os << (result.type == Result::Type::REG ? "%" : "") << result.val;
        return os;
    }
};

Result 类中有一个静态变量 current_symbol_index, 这个变量用于给每一个计算结果分配一个唯一的寄存器. 当 Result 类被初始化为立即数时, 这个变量不会被用到, 而当 Result 类被初始化为寄存器时, 这个变量会被用来给计算结果分配一个唯一的寄存器, 然后这个 current_symbol_index 的值会加一.

同时为了方便输出寄存器和立即数, 我们重载了 << 操作符.

Result UnaryExpAST::print(std::stringstream &output_stream) const
{
    if (primary_exp && !op && !unary_exp)
    {
        return (*primary_exp)->print(output_stream);
    }
    else if (!primary_exp && op && unary_exp)
    {
        Result unary_result = (*unary_exp)->print(output_stream);
        Result result = Result(Result::Type::REG);
        if (*op == "+")
        {
            output_stream << "\t" << result << " = add 0, " << unary_result << "\n";
        }
        else if (*op == "-")
        {
            output_stream << "\t" << result << " = sub 0, " << unary_result << "\n";
        }
        else if (*op == "!")
        {
            output_stream << "\t" << result << " = eq 0, " << unary_result << "\n";
        }
        else
        {
            throw std::runtime_error("UnaryExpAST::print: invalid unary operator");
        }
        return result;
    }
    else
    {
        throw std::runtime_error("UnaryExpAST::print: invalid unary expression");
    }
}

这样看起来就很清晰了.

当 UnaryExpAST 的 print 函数被调用时, 如果它选择了 UnaryExp ::= PrimaryExp 这条规约规则, 那么它就会调用 PrimaryExpAST 的 print 函数
此时 UnaryExpAST 并没有做任何计算, 所以直接返回 PrimaryExpAST 的计算结果即可.
如果它选择了 UnaryExp ::= UnaryOp UnaryExp 这条规约规则, 就需要根据 UnaryOp 的值输出相应的 Koopa IR 指令, 运算的结果需要使用一个新的寄存器来储存, 所以构造一个新的 Result(Result::Type::REG) 变量, 并返回这个变量.
最后如果出现任何例外情况, 直接抛出异常, 这样是很好的防御型编程操作实践.

`RISC-V` Assembly Code Generation

在这一部分你需要修改 include/backend.hpp 和 src/backend.cpp 文件, 完成新的语法规则的 print 函数来输出 RISC-V 汇编代码.

这部分的难点在于如何分配寄存器, 储存在内存中的 RISC-V 汇编代码是没有进行寄存器分配的.

比如一个加法运算, 你只知道左操作数和右操作数是两个表达式, 但是你并不知道这两个表达式的结果分别在哪个寄存器当中, 内存中的汇编代码也不提供具体的寄存器编号, 所以你需要在输出的同时为每一行运算都分配一个寄存器来保存运算的结果, 并且不能覆盖之前刚计算完还没用过的寄存器.

寄存器分配问题是一个 NPC 问题, 但是很好的一点是 Lv3 的测试样例中不会出现需要寄存器复用的情况, 所以我们可以使用贪心算法来解决这个问题.

首先仔细观察一个例子:

int main() 
{
  return 1 + 2 * -3;
}

可以得到如下 RISC-V 汇编代码:

	.text
	.globl main
main:
  li  t0, 2
  li  t1, 3
  mul t1, t0, t1
  li  t2, 1
  add t2, t1, t2
  mv a0, t2
  ret

可以发现当前每一行汇编代码的计算结果都只会被使用一次, 如果把这个汇编代码修改为:

	.text
	.globl main
main:
  li  t0, 2
  li  t1, 3
  mul t0, t0, t1
  li  t1, 1
  add t0, t0, t1
  mv a0, t0
  ret

不会有任何问题.

`RISC-V` Register Manager

为了方便管理寄存器, 我设计了一个 RegisterManager 类, 这个类可以设置一个寄存器为可以覆盖, 判断一个值是否占用了一个寄存器, 给一个值分配一个寄存器, 输出某个值对应的寄存器名称.

所有计算结果, 包括一个表达式, 一个立即数, 都是跟一个 koopa_raw_value_t 类型的指针一一对应的, 所以我们可以使用 koopa_raw_value_t 类型的指针来作为寄存器管理器中的键值, 这样就可以方便地找到一个值对应的寄存器名称.

/**
 * @brief 寄存器管理器, 可以设置一个寄存器为可以覆盖, 判断一个值是否占用了一个寄存器, 给一个值分配一个寄存器, 输出某个值对应的寄存器名称
 */
class RegisterManager
{
private:
    // 值到寄存器名称的映射
    std::unordered_map<koopa_raw_value_t, std::string> _value_to_reg_string;
    // 存储当前所有寄存器是否可能会再次被利用, 比如将立即数转移给 a0 寄存器, 我们现在就认为 a0 寄存器被占用了, 但是如果 a0 寄存器之后被调用了, 这个立即数被使用过了, 那么 a0 寄存器就会被标记为不被占用, 因为到目前为止我们认为每一个结果只被使用一次
    std::unordered_map<std::string, bool> _reg_is_used;
    /**
     * @brief 设置一个值对应哪个寄存器, 内部函数不被外部调用
     * @param[in] value 值
     * @param[in] reg_string 寄存器名称
     */
    void _set_value_to_reg_string(const koopa_raw_value_t &value, const std::string &reg_string);

public:
    /**
     * @brief 构造函数, 初始化所有寄存器为未占用
     */
    RegisterManager()
    {
        // 初始化所有寄存器为未占用
        for (int i = 0; i <= 6; ++i)
        {
            _reg_is_used["t" + std::to_string(i)] = false;
        }
        for (int i = 0; i <= 7; ++i)
        {
            _reg_is_used["a" + std::to_string(i)] = false;
        }
    }

    /**
     * @brief 设置一个值对应的寄存器为未占用, 当一个值被使用过之后, 我们将它占用的寄存器设置为未占用, 因为我们认为每一个结果只被使用一次
     * @param[in] value 值
     */
    void set_reg_free(const koopa_raw_value_t &value);

    /**
     * @brief 判断一个值是否已经分配了寄存器
     * @param[in] value 值
     * @return 是否已经分配了寄存器
     */
    bool exist(const koopa_raw_value_t &value);

    /**
     * @brief 给一个值分配一个寄存器, 自动选择一个未被占用的寄存器
     * @note x0 是一个特殊的寄存器, 它的值恒为 0, 且向它写入的任何数据都会被丢弃, t0 到 t6 寄存器, 以及 a0 到 a7 寄存器可以用来存放临时值
     * @param[in] value 值
     * @param[in] is_zero 如果是立即数, 那么是否是立即数 0
     */
    void allocate_reg(const koopa_raw_value_t &value, bool is_zero = false);

    /**
     * @brief 找出这个值占用哪个寄存器, 用于输出 RISC-V 汇编代码
     * @param[in] value 值
     * @return 寄存器名称
     */
    std::string value_to_reg_string(const koopa_raw_value_t &value);
};

`RISC-V` Assembly Code Output

为了方便维护 RegisterManager 类, 我选择将 koopa_raw_value_t 类型的指针也传给 koopa_raw_integer_t 和 koopa_raw_binary_t 的 visit 函数, 这样在这两个函数中就可以调用 RegisterManager 类的方法来管理寄存器了.

// 访问 koopa_raw_value_t
void visit(const koopa_raw_value_t &value)
{
    const auto &kind = value->kind;
    switch (kind.tag)
    {
    case KOOPA_RVT_RETURN:
        visit(kind.data.ret);
        break;
    case KOOPA_RVT_INTEGER:
        visit(kind.data.integer, value);
        break;
    case KOOPA_RVT_BINARY:
        visit(kind.data.binary, value);
        break;
    default:
        throw std::runtime_error("visit: invalid instruction");
    }
}

// 访问 return 指令
void visit(const koopa_raw_return_t &ret)
{
    // 根据 ret 的 value 类型判断后续需要如何访问
    if (ret.value)
    {
        // 特判如果是立即数, 则直接赋值给 a0 寄存器, 跳过访问 value 的过程
        if (ret.value->kind.tag == KOOPA_RVT_INTEGER)
        {
            std::cout << "\tli a0, " << ret.value->kind.data.integer.value << std::endl;
        }
        // 否则, 访问这个值, 然后把这个值存储在的寄存器名称移动给 a0 寄存器, 注意不是 li
        else
        {
            bool is_allocated = register_manager.exist(ret.value);
            if (!is_allocated)
            {
                visit(ret.value);
            }
            std::cout << "\tmv a0, " << register_manager.value_to_reg_string(ret.value) << std::endl;
        }
    }
    // 如果 ret 的 value 为空, 则直接赋值 0 给 a0 寄存器, 然后返回
    else
    {
        std::cout << "\tli a0, 0" << std::endl;
    }
    std::cout << "\tret" << std::endl;
}

// 访问 integer
void visit(const koopa_raw_integer_t &integer, const koopa_raw_value_t &value)
{
    if (integer.value == 0)
    {
        register_manager.allocate_reg(value, true);
    }
    else
    {
        register_manager.allocate_reg(value);
        std::cout << "\tli " << register_manager.value_to_reg_string(value) << ", " << integer.value << std::endl;
    }
}

// 访问 binary 指令
void visit(const koopa_raw_binary_t &binary, const koopa_raw_value_t &value)
{
    // lhs 和 rhs 是否已经分配过寄存器, 如果没分配过, 则需要先访问 lhs 和 rhs, 访问过程中会分配寄存器, 注意 ricsv 不能直接操作立即数, 必须先加载到寄存器中!
    bool lhs_is_allocated = register_manager.exist(binary.lhs);
    if (!lhs_is_allocated)
    {
        visit(binary.lhs);
    }
    bool rhs_is_allocated = register_manager.exist(binary.rhs);
    if (!rhs_is_allocated)
    {
        visit(binary.rhs);
    }
    // 我们认为每个结果仅使用一次, 所以可以设置两个子结果的寄存器可以被覆盖了.
    // 比如将立即数转移给 a0 寄存器, 我们现在就认为 a0 寄存器被占用了, 但是如果 a0 寄存器之后被调用了, 这个立即数被使用过了, 那么 a0 寄存器就会被标记为不被占用, 因为到目前为止我们认为每一个结果只被使用一次
    register_manager.set_reg_free(binary.lhs);
    register_manager.set_reg_free(binary.rhs);
    register_manager.allocate_reg(value);

    // 获取当前结果, lhs 和 rhs 对应的寄存器名称
    std::string cur = register_manager.value_to_reg_string(value);
    std::string lhs = register_manager.value_to_reg_string(binary.lhs);
    std::string rhs = register_manager.value_to_reg_string(binary.rhs);

    // 根据二元运算符的类型进行处理
    switch (binary.op)
    {
    case KOOPA_RBO_EQ:
        std::cout << "\txor " << cur << ", " << lhs << ", " << rhs << std::endl;
        std::cout << "\tseqz " << cur << ", " << cur << std::endl;
        break;
    case KOOPA_RBO_NOT_EQ:
        std::cout << "\txor " << cur << ", " << lhs << ", " << rhs << std::endl;
        std::cout << "\tsnez " << cur << ", " << cur << std::endl;
        break;
    // ...
    default:
        throw std::runtime_error("visit: invalid binary operator");
    }
}

如果无法通过全部 Lv3 的测试样例, 可以检查如下几个问题:

把数据从寄存器移动到寄存器时, 使用的是 mv 指令, 而不是 li 指令.
访问 return 指令时, 在访问 ret.value 之前有没有检查它是否已经分配了寄存器, 否则可能造成同一个运算被输出多次.
还有一个测试样例, 可以检查你的寄存器是否会溢出:

int main() 
{
  return 0 * 0 + 0 * 0 + 0 * 0 + 0 * 0 + 0 * 0 + 0 * 0 + 0 * 0 + 0 * 0 + 0 * 0 + 0 * 0 + 0 * 0 + 0 * 0 + 0 * 0 + 0 * 0 + 0 * 0 + 0 * 0 + 0 * 0;
}

Compile and Test

运行编译器, 把 debug/hello.c 编译为 debug/hello.koopa:

./build/compiler -koopa debug/hello.c -o debug/hello.koopa

运行编译器, 把 debug/hello.c 编译为 debug/hello.S:

./build/compiler -riscv debug/hello.c -o debug/hello.S

本地自动评测 koopa:

autotest -koopa -s lv3 /root/compiler

本地自动评测 riscv:

autotest -riscv -s lv3 /root/compiler

Lv 4

本节需要让你的编译器可以处理变量的声明和定义, 用例如下:

int main() {
  const int x = 233 * 4;
  int y = 10;
  y = y + x / 2;
  return y;
}

整体来讲, 有如下几个重点:

koopa 部分需要增加符号表来管理变量.
koopa 部分需要完成 const 变量的编译期求值.
riscv 部分在处理不同条 koopa 指令间, 只需要维护栈帧.
riscv 部分在处理同一条 koopa 指令时, 需要维护寄存器.

`Koopa` Symbol Table

如果是常量定义, 比如 int x = 233;, 它不需要 koopa 指令来完成.

你只需要在符号表中记录 @x 这个变量和 233 这个立即数, 当其他命令调用变量 x 时, 比如 y = x;, 从符号表中找到 @x 这个变量对应的数值, 然后直接使用 store 233, @y 指令把 @x 这个变量的值加载到寄存器中给这个指令用.

如果是变量定义, 比如 int y = x + 1;, 它需要若干 koopa 指令来完成 (假设 x 不是常量, 需要从内存中加载):

%0 = load @x
add %0, 1
@y = alloc i32
store %0, @y

你需要在符号表中记录 @y 这个变量, 当其他命令调用变量 y 时, 检查符号表中是否有 @y 这个变量, 如果有, 则使用 %0 = load @y 指令把 @y 这个变量的值加载到寄存器中给这个指令用.

综上所述:

符号表的 key 就是 @ 开头的内存名, value 是 i32 类型的立即数 (常量定义) 或什么都没有 (变量定义, 但是如果你想保持一致性也可以把 % 开头的寄存器名存下来, 在上面这个例子中是 %0 ; 不过在多层嵌套的块中, 我们可以把这个变量处在的定义域的层级用 value 来传递, 具体可以参考 Lv5 的实现).

符号和符号表

/**
 * @brief 符号
 * @date 2024-12-22
 */
class Symbol
{
public:
    enum class Type
    {
        VAR,
        VAL
    };
    Type type;
    int val;
    Symbol() : type(Type::VAL), val(0) {}
    Symbol(Type type, int val) : type(type), val(val) {}
};

/**
 * @brief 符号表
 * @date 2024-12-22
 */
class SymbolTable
{
private:
    std::unordered_map<std::string, Symbol> symbol_table;
    bool is_returned = false;

public:
    void create(const std::string &name, Symbol symbol);
    bool exist(const std::string &name);
};

在常量的定义中维护符号表:

Result ConstDefAST::print(std::stringstream &output_stream) const
{
    if (symbol_table.exist(const_symbol)) // 如果符号表中已经存在这个符号, 则抛出错误
    {
        throw std::runtime_error("ConstDefAST::print: const identifier already exists");
    }
    Result value_result = const_init_val->print(output_stream); // 计算常量表达式的值
    symbol_table.create(const_symbol, Symbol(Symbol::Type::VAL, value_result.val)); // 将常量表达式的值存入符号表
    return Result(); // 返回空结果, 为什么不返回调用 print 的返回值? 因为我们的先验知识 (语义规范) 告诉我们, 声明和定义语句不会返回任何值
}

`Koopa` Const Variable Compile-time Computation

int main() {
  const int x = 1 + 1;
  return x;
}

这样一个返回常量的代码, 我们直接返回 2 即可:

fun @main(): i32 {
%entry:
  ret 2
}

可以看到 1 + 1 在编译期就被求值为 2 了, 那么如何完成 const 变量的编译期求值呢?

我们只需要在访问每一个计算节点, 比如 AddExpAST::print 的时候判断它的左右操作数是不是都是立即数, 如果是立即数就返回计算完的立即数, 如果不是立即数才需要 %1 = add %0, 1 这样的计算指令.

Result AddExpAST::print(std::stringstream &output_stream) const
{
    if (!add_exp && !op && mul_exp)
    {
        return (*mul_exp)->print(output_stream);
    }
    else if (add_exp && op && mul_exp)
    {
        Result result_left = (*add_exp)->print(output_stream);
        Result result_right = (*mul_exp)->print(output_stream);
        if (result_left.type == Result::Type::IMM && result_right.type == Result::Type::IMM)
        {
            if (*op == "+")
            {
                return Result(Result::Type::IMM, result_left.val + result_right.val);
            }
            else if (*op == "-")
            {
                return Result(Result::Type::IMM, result_left.val - result_right.val);
            }
            else
            {
                throw std::runtime_error("AddExpAST::print: invalid add operator when both operands are immediate");
            }
        }
        else
        {
            Result result = Result(Result::Type::REG);
            if (*op == "+")
            {
                output_stream << "\t" << result << " = add " << result_left << ", " << result_right << "\n";
            }
            else if (*op == "-")
            {
                output_stream << "\t" << result << " = sub " << result_left << ", " << result_right << "\n";
            }
            else
            {
                throw std::runtime_error("AddExpAST::print: invalid add operator when one of the operands is not immediate");
            }
            return result;
        }
    }
    else
    {
        throw std::runtime_error("AddExpAST::print: invalid add expression");
    }
}

可以看出, 如果 AddExpAST::print 的左右操作数都是立即数, 那么 AddExpAST::print 的返回值就是立即数, 否则就是寄存器.

这样我们避免了已经知道左右操作数的真实数值的情况下依然生成 add 指令, 从而实现了编译期求值, 同时这是一个递归的过程, 所以仅需要修改很少的代码就可以实现.

`RISC-V` Stack Frame

在处理不同条 koopa 指令间只需要维护栈帧而不需要维护寄存器, 具体来讲, 在使用到 @x 或 %1 等所有 koopa 变量和内存时维护栈帧.

@x 存在栈帧上是没有问题的, 毕竟 koopa 就是这么做的.

但是 %1 这样的 koopa 寄存器应该存在哪里呢? 我们为了简化寄存器分配, 因此将 koopa 的所有寄存器计算出来之后, 也存在 riscv 的栈帧上, 如果这个 %1 之后被使用了, 就从栈帧中找到 %1 对应的内存即可.

可以看下面的例子, %2 = load @y 计算出来了 %2 的值, 我们的操作是把它存在了 sp + 12 这个位置, 然后 ret %2 的时候从 sp + 12 这个位置取出 %2 的值, 从而在不同 koopa 指令间通过栈帧传递信息, 完全不使用寄存器.

	.text
	.globl main
main:
	addi sp, sp, -16

  # store 10, @y
	li t0, 10
	sw t0, 0(sp)

  # %0 = load @y
	lw t0, 0(sp)
	sw t0, 4(sp) 

  # %1 = add %0, 466
	lw t0, 4(sp)
	li t1, 466
	add t0, t0, t1
	sw t0, 8(sp)

  # store %1, @y
	lw t0, 8(sp)
	sw t0, 0(sp)

  # %2 = load @y
	lw t0, 0(sp)
	sw t0, 12(sp)

  # ret %2
	lw a0, 12(sp)
	addi sp, sp, 16
    ret

我使用了 ContextManager 来管理栈帧和寄存器, 这是从 Lv3 的 RegisterManager 加入了栈帧的管理器得到的.

所有代码共用一个 ContextManager, 每一个函数在进入的时候单开一个 StackManager.

具体来讲:

/**
 * @brief 寄存器和所有函数的栈管理器, 是全局共用的, 可以维护值和寄存器的关系, 可以维护一个值和这个值对应的函数的栈信息
 * @author Yutong Liang
 * @date 2024-11-28
 */
class ContextManager
{
private:
    // 值到寄存器名称的映射
    std::unordered_map<koopa_raw_value_t, std::string> _value_to_reg_string;

    // 存储当前所有寄存器是否有不能被覆盖的值
    std::unordered_map<std::string, bool> _reg_is_used;

    /**
     * @brief 设置一个值对应哪个寄存器, 内部函数不被外部调用
     * @param[in] value 值
     * @param[in] reg_string 寄存器名称
     * @author Yutong Liang
     * @date 2024-11-28
     */
    void _set_value_to_reg_string(const koopa_raw_value_t &value, const std::string &reg_string);

    // 函数名到这个函数的 StackManager 的映射
    std::unordered_map<std::string, StackManager> _function_name_to_stack_manager;

    // 当前正在处理的函数的函数名
    std::string current_function_name;
};

/**
 * @brief 单个函数的栈管理器, 是一个函数使用的, 可以维护值 (比如 `@x`, `%1`) 和栈地址的关系
 * @author Yutong Liang
 * @date 2024-12-22
 */
class StackManager
{
private:
    // 栈帧大小, 初始化的时候确定的, 单位是字节
    int stack_size;

    // 栈帧当前使用情况, 初始化时0, 直到增长为 stack_size 为止, 单位是字节
    int stack_used_byte;

    // 值到栈地址的映射, 栈地址的表示方法是 "sp + offset" 中的 int offset
    std::unordered_map<koopa_raw_value_t, int> value_to_stack_offset;
};

`RISC-V` Register Allocation

不同 koopa 代码之间共享栈帧但是寄存器不互相影响, 同一行 koopa 代码之间才可能产生寄存器的影响, 每一条 koopa 指令使用自己的寄存器然后释放自己的寄存器.

这是因为每一行 koopa 代码只会使用 @x, %1, 1 这样的值, 而这些值在 RISC-V 中要么在内存中, 要么就是立即数, 所以任意两个 koopa 指令之间是不会产生寄存器复用的.

有了这个原则, 我们在实现的时候就可以安心地使用寄存器了.

在访问 koopa_raw_value_t 的时候, 只访问对应 koopa 指令的抽象语法树, 不对应的不访问, 比如立即数就不要访问, 因为这样安排逻辑清晰, 保证了寄存器使用的解耦, 两个 visit 函数之间没有寄存器依赖关系, 同时 switch 中每一个 visit 函数都会使用后释放自己的寄存器.

// 访问指令
void visit(const koopa_raw_value_t &value)
{
    const auto &kind = value->kind;
    switch (kind.tag)
    {
    case KOOPA_RVT_RETURN:
        // 访问 return 指令
        visit(kind.data.ret);
        break;
    case KOOPA_RVT_BINARY:
        // 访问 binary 计算指令
        visit(kind.data.binary, value);
        break;
    case KOOPA_RVT_ALLOC:
        // 访问 alloc 指令, 分配内存是实际存在的指令, 但是汇编语言的内存分配是直接用栈指针管理的, 所以不需要显式的内存分配, 可以忽略 koopa 的 alloc 指令
        // 比如 @x = alloc i32 这样一个指令, 如果只有这个指令本身, 并不需要做任何操作也能保证 RISC-V 的正确性
        // 只有在使用了 @x 的时候, 比如 store 10, @x 这样的指令, 才需要设定 @x 的栈地址, 所以 alloc 指令可以忽略
        break;
    case KOOPA_RVT_LOAD:
        // 访问 load 指令
        visit(kind.data.load, value);
        break;
    case KOOPA_RVT_STORE:
        // 访问 store 指令
        visit(kind.data.store, value);
        break;
    default:
        // 其他类型暂时遇不到
        throw std::runtime_error("visit: invalid instruction");
    }
}

比如 %1 = add %0, 1 这样的指令, 只访问 add 指令, 在访问 add 的时候不调用 visit( 立即数 1 ) , 参考如下 7-17 行代码, 而是直接将 1 加载到寄存器中, 因为立即数不是 koopa 指令, 如果访问了就违反了我们最开始的原则了.

// 访问 binary 指令
void visit(const koopa_raw_binary_t &binary, const koopa_raw_value_t &value)
{
    // 判断 lhs 是立即数还是内存, 如果是立即数就 li, 否则就 lw
    context_manager.allocate_reg(binary.lhs);
    std::string lhs = context_manager.value_to_reg_string(binary.lhs);
    if (binary.lhs->kind.tag == KOOPA_RVT_INTEGER) // 这里不要调用 visit( 立即数 1 ), 因为这不是一个 koopa 指令
    {
        riscv_printer.li(lhs, binary.lhs->kind.data.integer.value);
    }
    else
    {
        // 当前函数的 StackManager
        StackManager &stack_manager = context_manager.get_current_function_stack_manager();
        // 从栈中加载数据到寄存器
        riscv_printer.lw(lhs, "sp", stack_manager.get_value_stack_offset(binary.lhs), context_manager);
    }
    // 判断 rhs 是立即数还是内存, 如果是立即数就 li, 否则就 lw
    context_manager.allocate_reg(binary.rhs);
    std::string rhs = context_manager.value_to_reg_string(binary.rhs);
    if (binary.rhs->kind.tag == KOOPA_RVT_INTEGER)
    {
        riscv_printer.li(rhs, binary.rhs->kind.data.integer.value);
    }
    else
    {
        // 当前函数的 StackManager
        StackManager &stack_manager = context_manager.get_current_function_stack_manager();
        // 从栈中加载数据到寄存器
        riscv_printer.lw(rhs, "sp", stack_manager.get_value_stack_offset(binary.rhs), context_manager);
    }

    // 给结果分配一个寄存器, 分配之前可以先释放掉 lhs 和 rhs 对应的寄存器, 因为他们相当于已经加载进来了, 一会使用的时候可以覆盖, 比如 add t0, t0, t1
    context_manager.set_reg_free(binary.lhs);
    context_manager.set_reg_free(binary.rhs);
    context_manager.allocate_reg(value);
    std::string cur = context_manager.value_to_reg_string(value);

    // 根据二元运算符的类型进行处理
    switch (binary.op)
    {
    case KOOPA_RBO_EQ:
        riscv_printer.xor_(cur, lhs, rhs);
        riscv_printer.seqz(cur, cur);
        break;
    // ...
    default:
        throw std::runtime_error("visit: invalid binary operator");
    }
    // 当前函数的 StackManager
    StackManager &stack_manager = context_manager.get_current_function_stack_manager();
    // 把结果存回栈中
    stack_manager.save_value_to_stack(value);
    riscv_printer.sw(cur, "sp", stack_manager.get_value_stack_offset(value), context_manager);
    // 当前结果所在的寄存器已经被使用过了, 释放
    context_manager.set_reg_free(value);
}

Compile and Test

运行编译器, 把 debug/hello.c 编译为 debug/hello.koopa:

./build/compiler -koopa debug/hello.c -o debug/hello.koopa

运行编译器, 把 debug/hello.c 编译为 debug/hello.S:

./build/compiler -riscv debug/hello.c -o debug/hello.S

本地自动评测 koopa:

autotest -koopa -s lv4 /root/compiler

本地自动评测 riscv:

autotest -riscv -s lv4 /root/compiler

Lv5

这是一个非常简单的 Level 呀, 只需要在 Lv4 的基础上将一个 SymbolTable 变为多个就可以了.

Multiple Symbol Table

Lv4 中的 SymbolTable :

class SymbolTable
{
private:
    std::unordered_map<std::string, Symbol> symbol_table;
    bool is_returned = false;

public:
    // CRUD ...
};

Lv5 中的 SymbolTable :

class SymbolTable
{
private:
    std::vector<std::unordered_map<std::string, Symbol>> symbol_table; // 每进入一个块, 就创建一个新的符号表, 块包括函数的大括号和语句块的大括号
    bool is_returned = false;

public:
    // 每进入一个块, 就创建一个新的符号表, 块包括函数的大括号和语句块的大括号
    void new_symbol_table_hierarchy();
    // 每离开一个块, 就删除一个符号表
    void delete_symbol_table_hierarchy();
    // CRUD ...
};

区别在于我们把 SymbolTable 从单个变为多个, 构建为一个栈, 每进入一个块, 就创建一个新的符号表, 每离开一个块, 就删除一个符号表.

同时我们需要修改内存的存储位置, 因为不同层的定义域可能使用同一个变量名 (例子如下), 此时应该从内向外找到最近的变量名然后使用这一层的内存地址.

fun @main(): i32 {
%entry:
  @a_1 = alloc i32
  store 1, @a_1
  store 2, @a_1
  @a_2 = alloc i32
  store 3, @a_2
  %0 = load @a_1
  ret %0
}

Naming Same Symbol From Different Scope

那么具体应该如何命名呢? 我们恰巧可以使用这个变量处于的 vector 的 index 来命名, 比如第一个 @a 处于 symbol_table[0] 中, 那么我们就把访问第一层中的 @a 的内存地址表示为 @a_1, 第二个 @a 处于 symbol_table[1] 中, 那么我们就把访问第二层中的 @a 的内存地址表示为 @a_2.

具体实现可以参考:

class Symbol
{
public:
    enum class Type
    {
        VAR,
        VAL
    };
    Type type;
    int val; // 如果 type 是 VAL, 那么 val 是立即数的数值; 如果 type 是 VAR, 那么 val 是变量的层级, 比如 `a = 2;` 如果在符号表中在层级 1 找到这个符号, 那么就会返回 1, 得到 @a_1
    Symbol() : type(Type::VAL), val(0) {}
    Symbol(Type type, int val) : type(type), val(val) {}
};

Symbol SymbolTable::read(const std::string &name)
{
    for (int i = symbol_table.size() - 1; i >= 0; --i)
    {
        if (symbol_table[i].find(name) != symbol_table[i].end())
        {
            Symbol symbol = symbol_table[i].at(name);
            if (symbol.type == Symbol::Type::VAL)
            {
                return symbol; // 如果是常量, 直接返回常量的值
            }
            else if (symbol.type == Symbol::Type::VAR)
            {
                return Symbol(Symbol::Type::VAR, i + 1); // 如果是变量, 返回变量所在的 SymbolTable 的 index
            }
            else
            {
                throw std::runtime_error("SymbolTable::read: invalid symbol type");
            }
        }
    }
    throw std::runtime_error("SymbolTable::read: identifier does not exist");
}

如果是 Symbol::Type::VAR , 我们可以正好使用 Symbol::val 来表示它处于的 symbol_table 的 index , 毕竟这个 Symbol 初始化的时候 Symbol::val 就是没用的, 可以参考如下的初始化代码和它的 Context:

Result VarDefAST::print(std::stringstream &output_stream) const
{
    if (var_init_val)
    {
        Result value_result = (*var_init_val)->print(output_stream);
        symbol_table.insert_symbol(var_symbol, Symbol(Symbol::Type::VAR, value_result.val));
        std::string symbol_name = var_symbol;
        std::string suffix = std::to_string(symbol_table.read(symbol_name).val);
        std::string symbol_name_with_suffix = symbol_name + "_" + suffix;
        output_stream << "\t@" << symbol_name_with_suffix << " = alloc i32\n";
        output_stream << "\tstore " << value_result << ", @" << symbol_name_with_suffix << "\n";
    }
    else
    {
        symbol_table.insert_symbol(var_symbol, Symbol(Symbol::Type::VAR, 0));
        std::string symbol_name = var_symbol;
        std::string suffix = std::to_string(symbol_table.read(symbol_name).val);
        std::string symbol_name_with_suffix = symbol_name + "_" + suffix;
        output_stream << "\t@" << symbol_name_with_suffix << " = alloc i32\n";
    }
    return Result();
}

其中第六行中用 value_result.val 初始化了这个 Symbol , 但是实际上这个值是 koopa 寄存器的名称, 我们并不需要保存这个某个内存和它用了某个寄存器来初始化的关系, 所以我们可以用 symbol_table 的 index 来覆盖这个值, 没有影响.

最后 RISC-V 部分不需要修改, 因为 koopa 代码的可用指令没有修改.

Compile and Test

运行编译器, 把 debug/hello.c 编译为 debug/hello.koopa:

./build/compiler -koopa debug/hello.c -o debug/hello.koopa

运行编译器, 把 debug/hello.c 编译为 debug/hello.S:

./build/compiler -riscv debug/hello.c -o debug/hello.S

本地自动评测 koopa:

autotest -koopa -s lv5 /root/compiler

本地自动评测 riscv:

autotest -riscv -s lv5 /root/compiler

Lv6

这部分我们需要完成 if 语句的编译, 示例如下:

int main() 
{
  int a = 1;
  if (a == 2 || a == 3) 
  {
    return 0;
  } 
  else 
  {
    return a + 1;
  }
}

有如下几个重点:

生成 Koopa 中间代码时解决分支语句在语法分析的时候产生的移入/归约冲突.
生成 Koopa 中间代码时多 if 的编号问题.
生成 Koopa 中间代码时解决控制流提前结束的问题.
生成 Koopa 中间代码时解决同一层级多次分配相同名称的内存的问题.
生成 Koopa 中间代码时逻辑运算短路求值的特性.
生成 RISC-V 汇编代码时添加两条 RISC-V 指令.
生成 RISC-V 汇编代码时容易出现的 bug 和解决方法, 主要是 12 位立即数溢出的问题.

Shift/Reduce Conflict

If 相关的语法规则如下:

Stmt ::= "if" "(" Exp ")" Stmt ["else" Stmt]

对于移入/归约冲突的原因分析可以参考 Lv6 的 Lab 文档, 这里不再赘述.

为了避免这样的问题, SysY 的语义规定了 else 必须和最近的 if 进行匹配, 助教在这里提示拆分可以解决问题, 那么具体怎么做呢?

一个重要的观察是, 如果一个 if ... 语句在语法分析后跟随了一个 else ... 语句, 那么这个 if ... 语句内部中所有可能出现的 if ... 语句都必须是跟随 else ... 语句的, 否则就和 SysY 的语义规定冲突了.

因此我们可以将原有的语法规则修改为:

Stmt ::= "if" "(" Exp ")" Stmt
       | "if" "(" Exp ")" StmtWithElse "else" Stmt

StmtWithElse ::= "if" "(" Exp ")" StmtWithElse "else" StmtWithElse

这样就可以解决移入/归约冲突的问题了.

在 Parser 中的参考实现:

/* ast.hpp */

class StmtAST : public BaseAST
{
public:
    enum class StmtType
    {
        Assign,
        Expression,
        Block,
        Return,
        If
    };
    StmtType stmt_type;
    std::optional<std::unique_ptr<BaseAST>> lval;             // 语句中的左值
    std::optional<std::unique_ptr<BaseAST>> exp;              // 语句中的表达式
    std::optional<std::unique_ptr<BaseAST>> block;            // 语句中的基本块, 其实是另一个用大括号包裹的语句块
    std::optional<std::unique_ptr<BaseAST>> inside_if_stmt;   // if ... 中的语句块
    std::optional<std::unique_ptr<BaseAST>> inside_else_stmt; // else ... 中的语句块

    Result print(std::stringstream &output_stream) const override;
};

/* sysy.y */

Stmt
  // Assign, Expression, Block, Return ...
  | IF '(' Exp ')' Stmt {
    // ...
  }
  | IF '(' Exp ')' StmtWithElse ELSE Stmt {
    // ...
  }
  ;

StmtWithElse
  // Assign, Expression, Block, Return ...
  | IF '(' Exp ')' StmtWithElse ELSE StmtWithElse {
    // ...
  }
  ;

为什么我把 StmtWithElse 和 Stmt 的语法规则分开写, 重复写了一遍 Stmt 中的其它内容呢?

因为对于 Stmt 来说, 无法在规约的时候传递一个参数说明这个 Stmt 是有 else ... 语句的, 还是没有 else ... 语句的, 所以需要新开一个语法规则. 同时我又不想大幅修改 Stmt 原始的语法规则, 想要保持前后的一致性, 所以只能复制一遍 Stmt 中的其它语法规则到 StmtWithElse 中了.

Multiple If Statement

不同的 if 语句都有自己的 %then, %else 和 %end 标签, 所以需要一个计数器来区分不同的 if 语句, 这个标签只要遇见一次 if ... 语句就加一, 这样就可以区分不同的 if 语句了.

具体的输出代码可以参考:

/* koopa.cpp */

koopa_context_manager.total_if_else_statement_count++; // 每遇见一次 if ... 语句, 就加一
std::string then_label = "%then_" + std::to_string(koopa_context_manager.total_if_else_statement_count);
std::string else_label = "%else_" + std::to_string(koopa_context_manager.total_if_else_statement_count);
std::string end_label = "%end_" + std::to_string(koopa_context_manager.total_if_else_statement_count);

Result exp_result = (*exp)->print(output_stream);

output_stream << "\tbr " << exp_result << ", " << then_label << ", " << (inside_else_stmt ? else_label : end_label) << std::endl;

Handle Control Flow Early End

先来看一个例子:

int main() 
{
  if (0) 
  {
    return 1;
  } 
  else 
  {
    return 2;
  }
}

如果我们 naive 地实现 if 语句的 koopa 输出, 比如这样:

/* koopa.cpp */

Result StmtAST::print(std::stringstream &output_stream) const
{
    if (stmt_type == StmtType::Assign)
    {
        // ...
    }
    else if (stmt_type == StmtType::Return)
    {
        // ...
    }
    else if (stmt_type == StmtType::Expression)
    {
        // ...
    }
    else if (stmt_type == StmtType::Block)
    {
        // ...
    }
    else if (stmt_type == StmtType::If)
    {
        koopa_context_manager.total_if_else_statement_count++;
        std::string then_label = "%then_" + std::to_string(koopa_context_manager.total_if_else_statement_count);
        std::string else_label = "%else_" + std::to_string(koopa_context_manager.total_if_else_statement_count);
        std::string end_label = "%end_" + std::to_string(koopa_context_manager.total_if_else_statement_count);

        // 计算表达式, 根据表达式结果跳转到不同的分支
        Result exp_result = (*exp)->print(output_stream);
        output_stream << "\tbr " << exp_result << ", " << then_label << ", " << (inside_else_stmt ? else_label : end_label) << std::endl;

        // 进入 if 语句块
        output_stream << then_label << ":" << std::endl;
        Result result_if = (*inside_if_stmt)->print(output_stream);
        output_stream << "\tjump " << end_label << std::endl;

        // else 语句块
        Result result_else = Result();
        if (inside_else_stmt)
        {
            output_stream << else_label << ":" << std::endl;
            result_else = (*inside_else_stmt)->print(output_stream);
            output_stream << "\tjump " << end_label << std::endl;
        }

        Result result = Result();
        return result;
    }
    else
    {
        throw std::runtime_error("StmtAST::print: invalid statement");
    }
}

首先回忆基本块的定义:

基本块 (basic block) 是编译领域的一个很常见的概念, 它指的是一系列指令的集合, 基本块满足:

只有一个入口点: 所有基本块中的指令如果要执行跳转, 只能跳到某个基本块的开头, 而不能跳到中间.

只有一个出口点: 基本块中, 只有最后一条指令能进行控制流的转移, 也就是跳到其他基本块, 或者从函数中返回 (执行 return 操作). 基本块的存在可以简化很多编译过程中需要进行的分析, 所以 Koopa IR 要求函数中的指令必须预先按照基本块分类. 同时, Koopa IR 约定, 函数的第一个基本块为函数的入口基本块, 也就是执行函数时, 首先会执行第一个基本块中的指令.

那么我们可能会得到这样的 koopa 代码, 注意其中的 %then_1 和 %else_1 在返回后存在跳转到 %end_1 的指令, 这和基本块的定义 (只有最后一条指令能进行控制流的转移) 冲突了, 从而会造成编译器后端的错误.

fun @main(): i32 {
%entry:
    br 0, %then_1, %else_1
%then_1:
    ret 1
    jump %end_1
%else_1:
    ret 2
    jump %end_1
%end_1:
ret 0
}

所以我们需要在输出 if 内部的 jump 前判断改控制流是否提前被 ret 打断了, 如果被打断了就不输出 jump 了.

一个非常直观的想法是在每一个 print 函数的输出 Result 中加入一个 bool 变量, 表示这个语句以及其嵌套的语句内是否被 ret 语句显式地返回了, 然后根据这个变量来决定是否输出 jump 指令, 同时还可以提前停止输出, 提高代码运行效率.

/* koopa.cpp */

Result StmtAST::print(std::stringstream &output_stream) const
{
    if (stmt_type == StmtType::Assign)
    {
        // ...
    }
    else if (stmt_type == StmtType::Return)
    {
        if (!lval && exp && !block)
        {
            Result result = (*exp)->print(output_stream);
            output_stream << "\tret " << result << "\n";
            result.control_flow_returned = true; // 如果语句返回了, 就设置该控制流返回
            return result;
        }
        else if (!lval && !exp && !block)
        {
            output_stream << "\tret\n";
            Result result = Result();
            result.control_flow_returned = true; // 如果语句返回了, 就设置该控制流返回
            return result;
        }
        else
        {
            throw std::runtime_error("StmtAST::print: invalid return statement");
        }
    }
    else if (stmt_type == StmtType::Expression)
    {
        // ...
    }
    else if (stmt_type == StmtType::Block)
    {
        if (!lval && !exp && block)
        {
            Result result = (*block)->print(output_stream);
            return result;
        }
        else
        {
            throw std::runtime_error("StmtAST::print: invalid block statement");
        }
    }
    else if (stmt_type == StmtType::If)
    {
        koopa_context_manager.total_if_else_statement_count++;
        std::string then_label = "%then_" + std::to_string(koopa_context_manager.total_if_else_statement_count);
        std::string else_label = "%else_" + std::to_string(koopa_context_manager.total_if_else_statement_count);
        std::string end_label = "%end_" + std::to_string(koopa_context_manager.total_if_else_statement_count);

        Result exp_result = (*exp)->print(output_stream);
        if (!inside_if_stmt && !inside_else_stmt)
        {
            throw std::runtime_error("StmtAST::print: invalid if statement, there's no if");
        }

        output_stream << "\tbr " << exp_result << ", " << then_label << ", " << (inside_else_stmt ? else_label : end_label) << std::endl;

        // if 语句块
        output_stream << then_label << ":" << std::endl;
        Result result_if = (*inside_if_stmt)->print(output_stream);

        // 如果 if 语句块显式的返回了, 就不要跳转了, 否则输出这样的 koopa 代码是错误的:
        // fun @main(): i32 {
        // %entry:
        //     br 0, %then_1, %else_1
        // %then_1:
        //     ret 1
        //     jump %end_1
        // %else_1:
        //     ret 2
        //     jump %end_1
        // %end_1:
        // }
        if (!result_if.control_flow_returned)
        {
            output_stream << "\tjump " << end_label << std::endl;
        }

        // else 语句块
        Result result_else = Result();
        if (inside_else_stmt)
        {
            output_stream << else_label << ":" << std::endl;

            result_else = (*inside_else_stmt)->print(output_stream);

            // 如果 else 语句块显式的返回了, 就不要跳转了
            if (!result_else.control_flow_returned)
            {
                output_stream << "\tjump " << end_label << std::endl;
            }
        }

        // 如果 if 语句块和 else 语句块都返回了, 则注明整个 if ... else ... 语句块返回了
        // 但是为了避免这样的空 %end , 如果已经结束了就不输出 %end 了
        // fun @main(): i32 {
        // %entry:
        // 	   br 0, %then_1, %else_1
        // %then_1:
        //     ret 1
        // %else_1:
        //     ret 2
        // %end_1:
        // }
        Result result = Result();
        if (!result_if.control_flow_returned || !result_else.control_flow_returned)
        {
            output_stream << end_label << ":" << std::endl;
        }
        else
        {
            result.control_flow_returned = true; // 如果是 if ... else ... 语句, 则 if ... 和 else ... 语句块都返回了才设置整体函数返回
        }
        return result;
    }
    else
    {
        throw std::runtime_error("StmtAST::print: invalid statement");
    }
}

最后给 FuncDefAST 的 print 函数加上控制流返回的判断, 如果 block 没有显式的 ret 指令, 则补上一个 ret 0.

/* koopa.cpp */

Result FuncDefAST::print(std::stringstream &output_stream) const
{
    output_stream << "fun @" << ident << "(): ";
    func_type->print(output_stream);
    output_stream << " {" << std::endl;
    output_stream << "%entry:" << std::endl;
    Result result = block->print(output_stream);
    // 如果 block 没有显式的 ret 指令, 则补上一个 ret 0
    if (!result.control_flow_returned)
    {
        output_stream << "\tret 0" << std::endl;
    }
    output_stream << "}" << std::endl;
    return result;
}

Handle Same Variable Name in Same Level

一个例子:

int main()
{
    {
        int a = 2;
    }
    {
        int a = 3;
    }
    return 0;
}

如果按照我们之前的处理方式, 会得出这样的 koopa 代码:

fun @main(): i32 {
%entry:
    @a_2 = alloc i32
    store 2, @a_2
    @a_2 = alloc i32
    sstore 3, @a_2
    ret 0
}

这下就出问题了, 因为 @a_2 被分配了两次. 但是这件事情很好处理, 只要维护一个 std::map<std::pair<std::string, int>, int> 来记录每个变量名在每个层级中是否已经分配了, 然后每次分配变量的时候, 先检查这个变量名是否已经存在, 如果存在就使用这个变量的地址, 否则就分配一个新的地址.

/* koopa_util.hpp */

class KoopaContextManager
{
private:
    // ...
    // 用于判断当前符号是否在当前下标被分配, 比如 @a_1 在 symbol_tables[0] 中被分配, 那么 is_symbol_allocated_in_this_level[std::make_pair("a", 1)] == true
    std::map<std::pair<std::string, int>, bool> _is_symbol_allocated_in_this_level;

public:
    // ...
};

/* koopa.cpp */

Result VarDefAST::print(std::stringstream &output_stream) const
{
    if (var_init_val)
    {
        Result value_result = (*var_init_val)->print(output_stream);
        koopa_context_manager.insert_symbol(var_symbol, Symbol(Symbol::Type::VAR, value_result.val));
        std::string symbol_name = var_symbol;
        std::string suffix = std::to_string(koopa_context_manager.name_to_symbol(symbol_name).val);
        std::string symbol_name_with_suffix = symbol_name + "_" + suffix;
        // 如果这个变量名在当前层级中没有被分配过, 则分配一个新的地址
        if (!koopa_context_manager.is_symbol_allocated_in_this_level(symbol_name))
        {
            output_stream << "\t@" << symbol_name_with_suffix << " = alloc i32\n";
        }
        koopa_context_manager.set_symbol_allocated_in_this_level(symbol_name);
        output_stream << "\tstore " << value_result << ", @" << symbol_name_with_suffix << "\n";
    }
    else
    {
        koopa_context_manager.insert_symbol(var_symbol, Symbol(Symbol::Type::VAR, 0));
        std::string symbol_name = var_symbol;
        std::string suffix = std::to_string(koopa_context_manager.name_to_symbol(symbol_name).val);
        std::string symbol_name_with_suffix = symbol_name + "_" + suffix;
        // 如果这个变量名在当前层级中没有被分配过, 则分配一个新的地址
        if (!koopa_context_manager.is_symbol_allocated_in_this_level(symbol_name))
        {
            output_stream << "\t@" << symbol_name_with_suffix << " = alloc i32\n";
        }
        koopa_context_manager.set_symbol_allocated_in_this_level(symbol_name);
    }
    return Result();
}

Short-circuit Evaluation of Logical Expressions

编译器对逻辑运算, 比如 || 实际上是做了如下操作:

int result = 1;

if (lhs == 0) 
{
  result = rhs != 0;
}

这样当 lhs == 1 时, 编译器会直接返回 result, 而不会计算 rhs 的值.

在具体实现的时候你可以对 lhs 的返回值进行判断, 如果是立即数就不要使用跳转指令, 这样可能会造成常量表达式的求值失败.

如果编译期无法确定是否可以短路求值, 我们需要使用内存来保存逻辑表达式的结果. 假设第一个操作数存在了 %1 这个寄存器中, 编译期我们不知道第二个操作数 %2 是否存在, 所以无法返回 or 表达式整体的答案存在哪里了, 所以需要结果存在内存中以保证可以修改.

一个短路求值示例如下:

int main() 
{
    int x = 1;
    int y = 0;
    return x || y;
}

对应的 koopa 代码如下:

fun @main(): i32 {
%entry:
	@x_1 = alloc i32
	store 1, @x_1
	@y_1 = alloc i32
	store 0, @y_1
	%0 = load @x_1
	%1 = ne %0, 0
	@or_result_in_memory_1 = alloc i32
	store %1, @or_result_in_memory_1
	br %1, %or_end_1, %or_second_operator_1
%or_second_operator_1:
	%2 = load @y_1
	%3 = ne %2, 0
	%4 = or %1, %3
	store %4, @or_result_in_memory_1
	jump %or_end_1
%or_end_1:
	%5 = load @or_result_in_memory_1
	ret %5
}

其中我们可以看到最后返回的 %5 是 @or_result_in_memory_1 这个内存地址中的值, 这个内存地址中保存的值有可能来源于 %1 这个寄存器, 对应 lhs 的值, 也有可能来源于 %4 这个寄存器, 对应 rhs 的值. 为了避免不知道返回 %1 还是 %4 的情况, 我们使用内存来保存结果, 最后从内存中读取结果到 %5 中即可.

一个可能的实现方式如下:

/* koopa.cpp */

Result LOrExpAST::print(std::stringstream &output_stream) const
{
    if (!left_or_exp && !op && left_and_exp)
    {
        return (*left_and_exp)->print(output_stream);
    }
    else if (left_or_exp && op && left_and_exp)
    {
        Result result_left = (*left_or_exp)->print(output_stream);

        if (result_left.type == Result::Type::IMM && result_left.val != 0) // 立即数非 0
        {
            return Result(Result::Type::IMM, 1);
        }
        else if (result_left.type == Result::Type::IMM && result_left.val == 0) // 立即数 0
        {
            Result result_right = (*left_and_exp)->print(output_stream);
            if (result_right.type == Result::Type::IMM)
            {
                return Result(Result::Type::IMM, 0 || result_right.val);
            }
            else
            {
                Result temp = Result(Result::Type::REG);
                output_stream << "\t" << temp << " = ne " << result_right << ", 0\n";
                return temp;
            }
        }
        else if (result_left.type == Result::Type::REG) // 如果是寄存器, 不能在编译期完成短路求值, 就需要跳转来完成短路求值, 如果判断寄存器是 0 直接跳转到 or_end_label
        {
            // 每进入一个需要用分支跳转语句达成短路求值的 || 语句, 就设置一个跳转标签
            koopa_context_manager.total_or_statement_count++;

            // 设置跳转标签
            std::string or_second_operator_label = "%or_second_operator_" + std::to_string(koopa_context_manager.total_or_statement_count);
            std::string or_end_label = "%or_end_" + std::to_string(koopa_context_manager.total_or_statement_count);

            // 假设第一个操作数存在了 %1 这个寄存器中, 编译期不知道第二个操作数 %2 是否存在, 所以无法返回 or 表达式整体的答案存在哪里了, 所以需要结果存在内存中以保证可以修改
            std::string or_result_in_memory = "@or_result_in_memory_" + std::to_string(koopa_context_manager.total_or_statement_count);

            // 如果第一个操作数是 0, 则跳转到 or_second_operator_label 看看第二个操作数是否是 0, 否则跳转到 or_end_label
            Result temp_1 = Result(Result::Type::REG);
            output_stream << "\t" << temp_1 << " = ne " << result_left << ", 0\n";
            output_stream << "\t" << or_result_in_memory << " = alloc i32\n";
            output_stream << "\tstore " << temp_1 << ", " << or_result_in_memory << "\n";
            output_stream << "\tbr " << temp_1 << ", " << or_end_label << ", " << or_second_operator_label << "\n";

            // 输出没有短路求值的控制流 label
            output_stream << or_second_operator_label << ":" << std::endl;

            // 计算第二个操作数
            Result result_right = (*left_and_exp)->print(output_stream);
            Result temp_2 = Result(Result::Type::REG);
            Result temp_3 = Result(Result::Type::REG);
            output_stream << "\t" << temp_2 << " = ne " << result_right << ", 0\n";
            output_stream << "\t" << temp_3 << " = or " << temp_1 << ", " << temp_2 << "\n";
            output_stream << "\tstore " << temp_3 << ", " << or_result_in_memory << "\n";
            output_stream << "\tjump " << or_end_label << "\n";

            // 输出短路求值之后的控制流合并 label
            output_stream << or_end_label << ":" << std::endl;

            // 把结果从内存中读取到寄存器中
            Result result = Result(Result::Type::REG);
            output_stream << "\t" << result << " = load " << or_result_in_memory << "\n";
            return result;
        }
        else
        {
            throw std::runtime_error("LOrExpAST::print: invalid first operand of logical OR expression");
        }
    }
    else
    {
        throw std::runtime_error("LOrExpAST::print: invalid logical OR expression");
    }
}

Generate RISC-V Branch Code

在完成了 koopa 的生成后, 我们就可以开始生成 RISC-V 的汇编代码了.

具体来讲只需要实现 bnez 和 j 这两个 RISC-V 指令的生成以满足 br 和 jump 这两个 koopa 指令的生成即可, 难度不大.

/* riscv.cpp */

// 访问 branch 指令, 这个指令的输入是立即数或内存, 所以需要判断 branch.cond->kind.tag
void visit(const koopa_raw_branch_t &branch, const koopa_raw_value_t &value)
{
    // 当前函数的 StackManager
    StackManager &stack_manager = riscv_context_manager.get_current_function_stack_manager();
    // 给中间结果分配一个寄存器
    riscv_context_manager.allocate_reg(value);
    std::string temp_reg_name = riscv_context_manager.value_to_reg_string(value);
    // 使用立即数或从栈中加载数据到寄存器
    if (branch.cond->kind.tag == KOOPA_RVT_INTEGER)
    {
        riscv_printer.li(temp_reg_name, branch.cond->kind.data.integer.value);
    }
    else
    {
        riscv_printer.lw(temp_reg_name, "sp", stack_manager.get_value_stack_offset(branch.cond), riscv_context_manager);
    }
    // 访问 branch 指令
    riscv_printer.bnez(temp_reg_name, branch.true_bb->name + 1);
    riscv_printer.jump(branch.false_bb->name + 1);
    // 当前操作数所在的寄存器已经被使用过了, 释放
    riscv_context_manager.set_reg_free(value);
}

// 访问 jump 指令
void visit(const koopa_raw_jump_t &jump)
{
    // 访问 jump 指令
    riscv_printer.jump(jump.target->name + 1);
}

Handle Immediate Number Overflow

但是在这里, Lv6 的 RISC-V 的所有测试点中有一个叫做 logical1 的测试点比较特殊, 它测试了 lw, sw 和 addi 这三个指令中立即数的范围.

非常奇怪的是这个立即数溢出的问题在 Lv4.2. 变量和赋值中第一次提到, 但是到了 Lv6 的 RISC-V 生成部分才第一次被测试, 并且这个测试点的名字非常具有误导性, 让人以为是逻辑运算的测试点, 实际上错误出在 RISC-V 的立即数范围上...

回忆 RISC-V 的指令格式, 立即数范围为十二位整数, 即 -2048 到 2047, 所以这三个指令一旦遇到立即数超过这个范围的指令就需要进行额外的处理, 以 lw 为例:

void RISCVPrinter::lw(const std::string &rd, const std::string &base, const int &bias, RISCVContextManager &context_manager)
{
    // 检查偏移量是否在 12 位立即数范围内
    if (bias >= -2048 && bias < 2048)
    {
        std::cout << "\tlw " << rd << ", " << bias << "(" << base << ")" << std::endl;
    }
    else
    {
        std::string reg = context_manager.new_temp_reg();
        li(reg, bias);
        add(reg, reg, base);
        std::cout << "\tlw " << rd << ", " << "(" << reg << ")" << std::endl;
    }
}

并且注意指令格式是 lw rd, bias(base), 其中 bias 是立即数不是寄存器, 所以 %0 = load @x 指令 (其中 @x 在栈偏移量为 2048 的地方) 应该写成:

li t1, 2048
add t1, t1, sp
lw t0, (t1)

而不是:

li t1, 2048
lw t0, t1(sp)

Compile and Test

运行编译器, 把 debug/hello.c 编译为 debug/hello.koopa:

./build/compiler -koopa debug/hello.c -o debug/hello.koopa

运行编译器, 把 debug/hello.c 编译为 debug/hello.S:

./build/compiler -riscv debug/hello.c -o debug/hello.S

本地自动评测 koopa:

autotest -koopa -s lv6 /root/compiler

本地自动评测 riscv:

autotest -riscv -s lv6 /root/compiler

Lv7

这个 Level 需要实现 while 和它配套的 break 和 continue 语句.

这个 Level 的测试点中我有两个 WA 的测试点, 分别是 12_break1 和 14_summary1 . 如果您有关于 Lv7 的任何 corner case 的测试点, 欢迎和我交流!

Update 2025-01-06: 问题出在控制流分析出错. 我之前认为如果在 while 语句块中有 return 语句, 那么 while 语句也告诉上一层控制流返回了, 但是实际上这个 while 语句可能根本不会进去, 是否进入 while 语句块取决于运行时条件, 所以无论 while 语句块中是否存在 return 语句, 都应该告诉上一层控制流还没有返回.

`While` Statement

while 语句的语法如下:

Stmt ::= "while" "(" Exp ")" Stmt;

和 if 语句类似, 不再赘述.

`Break` and `Continue` Statement

break 和 continue 语句的语法如下:

Stmt ::= "break;";
       | "continue;";

主要的难点在于如何正确获取跳转的目标, 因为跳转的目标标签是在访问 while 语句时定义的, 当你访问 break 或 continue 语句时, 需要获取 while 语句的跳转目标标签.

我们采用栈的方式获取跳转的目标标签, 当进入 while 语句时, 把当前的 while 语句的序号压入栈中, 当访问 break 或 continue 语句时, 从栈中读取当前的栈顶序号, 然后生成跳转指令.

else if (stmt_type == StmtType::Break)
{
    if (koopa_context_manager.while_statement_stack.empty())
    {
        throw std::runtime_error("StmtAST::print: invalid break statement, not in a while statement");
    }
    int current_while_statement_count = koopa_context_manager.while_statement_stack.top();
    std::string while_end_label = "%while_end_" + std::to_string(current_while_statement_count);
    output_stream << "\tjump " << while_end_label << "\n";
    Result result = Result();
    result.control_flow_while_interrupted = true;
    return result;
}

Compile and Test

运行编译器, 把 debug/hello.c 编译为 debug/hello.koopa:

./build/compiler -koopa debug/hello.c -o debug/hello.koopa

运行编译器, 把 debug/hello.c 编译为 debug/hello.S:

./build/compiler -riscv debug/hello.c -o debug/hello.S

本地自动评测 koopa:

autotest -koopa -s lv7 /root/compiler

本地自动评测 riscv:

autotest -riscv -s lv7 /root/compiler

Lv8

这一章节需要实现一个能够处理函数 (包括 SysY 库函数) 和全局变量的编译器.

示例函数如下:


int var;

int func(int x) 
{
  var = var + x;
  return var;
}

int main() 
{
  // putint 和 putch 都是 SysY 库函数
  // SysY 要求库函数不声明就可以使用
  putint(func(1));
  var = var * 10;
  putint(func(2));
  putch(10);
  return var;
}

Some Simple Advice

中间代码生成部分只需要注意重新 load 函数参数, 这样可以为目标代码的生成省一些事, 具体来讲, 如果这样做了之后只有 load 指令可能收到 KOOPA_RVT_GLOBAL_ALLOC 这个代表函数参数的 tag, 其他函数不用修改.
在进入一个新函数后, 要在顶部保存 ra 寄存器, 在退出函数后恢复 ra 寄存器, 所以栈大小要多加一, 多分配一条 store 指令来存储 ra 寄存器, ra 是调用者保存寄存器, 调用者把它的 ra 存在每个栈帧的最上面, 调用函数之前修改这个寄存器为 call 的下一条指令, 然后进入下一个函数, 代表调用者的下一条指令.
在栈上存变量的时候, 要注意把栈顶的留给函数参数的位置空出来, 不要存储局部变量, 否则可能造成函数参数对局部变量的覆盖.
在调用完函数后, 需要检测 value->ty->tag == KOOPA_RTT_UNIT 这个条件, 如果为真, 则函数没有返回值, 不需要生成 return 指令, 否则需要.

Compile and Test

运行编译器, 把 debug/hello.c 编译为 debug/hello.koopa:

./build/compiler -koopa debug/hello.c -o debug/hello.koopa

运行编译器, 把 debug/hello.c 编译为 debug/hello.S:

./build/compiler -riscv debug/hello.c -o debug/hello.S

本地自动评测 koopa:

autotest -koopa -s lv8 /root/compiler

本地自动评测 riscv:

autotest -riscv -s lv8 /root/compiler

Lv9

终于知道为什么说编译原理比 ICS 的任务量多了...

建议在没有绩点压力的大四选这门课就可以不用写 Lv9 了, 因为 Lv9 非常浪费时间并且占所有 Lab 的 27% 的分数, 也就是总评的 8 分, 如果在绩点压力下完成所有 Lab 会浪费很多时间.

引流到 Arthals 的编译原理相关博客 , 里面有更多关于编译原理课程和 Lab 的笔记, 相信他会把 Lv9 的 Lab 讲的更清楚.

Compile and Test

运行编译器, 把 debug/hello.c 编译为 debug/hello.koopa:

./build/compiler -koopa debug/hello.c -o debug/hello.koopa

运行编译器, 把 debug/hello.c 编译为 debug/hello.S:

./build/compiler -riscv debug/hello.c -o debug/hello.S

本地自动评测 koopa:

autotest -koopa -s lv9 /root/compiler

本地自动评测 riscv:

autotest -riscv -s lv9 /root/compiler

Summary

这门课的 Lab 任务量很大, 但是思维难度实际上不大, 助教哥哥的文档写的还是比较清楚的, 只建议大四同学选这门课, 否则完成 Lab 的压力会很大.

谢谢大家!

Yutong Liang

2025-01-12

[中文] La La Land 2024

Sun, 01 Sep 2024 20:00:01 GMT

记录一下 La La Land 2024 的比赛经历

上次比赛是五年前的天津赛, 这次正好在斯坦福做暑研, 也想去洛杉矶玩, 顺路比赛

出发

早上十点半就前往比赛场馆, 准备签到 (还得是希尔顿, 报名费 $70 也太贵了)

签到处

然后我们在休息区等待 WCA Delegate 讲解比赛事项和如何当裁判

准备开始比赛!

甚至还有人在卖自己烤的有魔方图案的饼干, 坐在我旁边的大哥 Preston Hoing (2019HOIN01) 买了两个送了我一个, 保存下来留作纪念

你是哪块儿小饼干

比赛过程

这是一次 24 小时比赛, 也就是说 24 小时比赛不间断, 如果参加的比赛比较多 (比如我), 那就需要通宵, 事实上我也确实通宵了

对这边的空调温度表示尊敬, 下次再也不穿短裤了...

半夜冻的全身发抖, 每一把结束都需要去卫生间用热水洗手保持良好的状态

时间表

这次比赛总共参加了九个项目, 选两个有趣的项目讲讲

3x3

入魔 7 年, 前 3 年进步 5 秒, 后 4 年进步 5 秒...

这次比赛刷新了单次和平均的个人记录, 单次还进了 10s, 平时练习的时候可能 20 把能有一把 sub10, 有点小激动

SUB 10

下次比赛一定要做到平均 SUB 10 !

Pyraminx

不知道为什么我用的普通四棱往往会取得较高的名次, 这次在第二轮手感比较好, 刷新了单次和平均的个人纪录, 同时还进入了决赛

Pyraminx Final

可能是因为通宵太累了, 决赛发挥不好, 但是还是很开心能进决赛

Pyraminx Grades

Interesting Things

Clock WR

第一次见证世界纪录的诞生, Brendyn Dunagan (2021DUNA01) 以 1.973s 刷新了 Clock 的单次世界纪录

Clock WR

还跟他合影留念了, 祝贺他 Nice Record!

国内外比赛区别

最开始我以为国外比赛和中国比赛流程是一样的, 但是实际上还是有比较多区别的

中国比赛: Judge 负责拿走你的魔方, 在打乱区让打乱员打乱, 然后拿回到刚才的比赛台上, 每个人的五把结束之前是不会离开座位的

国外比赛: 先提交魔方, 打乱完成后 Runner 把你的魔方放到一个有裁判的闲置比赛台上, 叫你的名字, 去这个比赛台完成复原, Judge 记录成绩, 结束之后你需要离开比赛台回到备赛区, Runner 把魔方送回打乱区, 等待下一次在另一个比赛台叫你的名字, 所以你需要在五个比赛台上完成五把

提交魔方

国外这样效率比较高, 因为不存在闲置的比赛台, 选手等待打乱的时候不会占用比赛台

另外国内外裁判员和打乱员不同, 国外的裁判员都是选手, 每个人在一个比赛组的同时也会被分配到一个裁判组, 此时你需要找到一个空闲的裁判位置去当裁判

我在当裁判

当然裁判员的数量是过饱和的, 因为一个项目你只需要比 5 把, 但是需要裁判所有来到这个比赛桌的人, 大概 50 把, 所以也可以选择在轮到你的时候摆烂不去当裁判

但是如果有很多人都摆烂, 不去当裁判, 就会造成缺少裁判的情况, WCA Delegate 就会在麦克风大叫, 找人来当裁判, 尤其是半夜的时候很多小朋友都去睡觉了, 甚至只有一个人来当裁判

裁判的码表⏱️

然而中国的裁判都是问卷报名制, 比赛之前从各种群发问卷招募裁判, 这样就能保证裁判是充足的, 但是坏处就是需要花精力去招募

People & Friends

Preston Hoing (2019HOIN01) 是我到了比赛场地第一个遇见的人, 他有点话唠, 跟我很热情地聊天, 还讲到了他上次魔表遇到的一个很好的打乱.

他是这次比赛全项目的选手, 24小时的全项目对他来说真的累, 但是他还是坚持到了最后, 完成了他的第一次五盲, 还进了三盲决赛, 佩服. 不过忘了和他合影了, 有点遗憾.

然后我坐到了一个小朋友和他爸爸旁边, 从巴西来的很可爱的小朋友: Benjamin Dias Reino (2024REIN02)

With Benjamin and His Dad

然后来了另两个小朋友, 是 Benjamin 在上一场比赛认识的, 两兄弟中的弟弟参加比赛 Ren Davis Semien (2024SEMI01)

后来这个桌子上又来了一个洛杉矶本地高中生 Kierran Leavitt (2022LEAV02), 他自述在学习开飞机, 包括滑翔机和有动力飞机, 还挺好玩

在三阶第一轮最后一把遇见了一个中国裁判员, Tianshuo Shao (2023SHAO01) 如果不是他我可能需要说一天英语了, 脑子要烧了

后来在比赛间隙他开车带我在洛杉矶游览, 晚上还去了 Santa Monica 海滩和码头, 好多大麻味

Santa Monica Beach

忘了合照, 过两天补上

Update on Oct 28, 2024: 才想起来补合影

和 Tianshuo 在 SacCubing XVIII 2024 @ Sacremento

Epilogue

随便放一些图片

比赛之前

在阳台练习的人

酒店大阳台的景色, 对面停车场花了我和 Tianshuo $30

开进死胡同

又开进死胡同

半夜大家在庆祝 12 点

希尔顿酒店的泳池

With Benjamin

Santa Monica 码头

在 Santa Monica 码头上钓鱼的人

[English] La La Land 2024

Sun, 01 Sep 2024 20:00:00 GMT

The competition experience of La La Land 2024

The last competition was the Tianjin competition five years ago.

Set out

Heading to the competition venue at 10:30 in the morning to sign in (So Hilton, the registration fee of $70 is too expensive).

Sign-in desk

Then we waited in the rest area for the WCA Delegate to explain the competition matters and how to be a judge.

Get ready to start the competition!

Some people were even selling cookies they baked with Rubik's Cube patterns. The guy sitting next to me, Preston Hoing (2019HOIN01), bought two and gave me one as a souvenir.

Little Biscuit

Comp process

This is a 24-hour race, which means the race is continuous for 24 hours. If you participate in many events (like me), you will need to stay up all night. In fact, I did stay up all night.

Respect the air conditioning temperature here, I will never wear shorts in a 24h comp again...

Shivering all over in the mid-night, I need to go to the bathroom to wash my hands with hot water to maintain a good condition.

Timetable

A total of nine events participated in this competition, choose two interesting events to talk about.

3x3

Cubing for 7 years, improved by 5 seconds in the first 3 years, improved by 5 seconds in the last 4 years...

This competition broke the single and average personal records, with a single time Sub10. During regular practice, there might be one sub-10 out of 20 attempts, so I'm a bit excited.

SUB 10

Next time, make a resolution to average SUB 10!

Pyraminx

I don't know why I often achieve higher rankings with the regular 4-sided, this time I felt good in the second round, broke my personal records for single and average, and also made it to the finals.

Pyraminx Final

It might be because I was too tired from staying up all night, I didn't perform well in the finals, but I'm still very happy to have made it to the finals.

Pyraminx Grades

Interesting Things

Clock WR

Witnessing the birth of a world record for the first time, Brendyn Dunagan (2021DUNA01) set a new single world record for Clock with a time of 1.973 seconds.

Clock WR: 1.973s

Took a photo with him, congratulated him Nice Record!

Differences between China and US competitions

At first, I thought that the process of foreign competitions was the same as that of Chinese competitions, but actually, there are quite a few differences.

In Chinese competitions, the Judge is responsible for taking your cube, having it scrambled by the scrambler in the scrambling area, and then bringing it back to the competition table. Each person will not leave their seat until all five attempts are finished.

In US competitions, you first submit your cube. After scrambling is completed, a Runner will place your cube on an idle competition table and call your name. You go to this competition table to complete the solve. The Judge records your result. After finishing one solve, you need to leave the competition table and return to the waiting area. The Runner will take your cube back to the scrambling area to wait for the next time your name is called at another competition table. So, you need to complete five solves on five different competition tables.

Submit Rubik's Cube

It seems that the efficiency is higher abroad because there are no idle competition tables, and the tables are not occupied during shuffling.

In addition, judges and scramblers are different. US judges are all players. When each person is assigned to a competition group, they are also assigned to another judge group. During the competition of this group, you need to find a free judge position to act as a judge.

I'm a Judge

Of course, the number of judges is oversaturated, because for one event you only need to judge 5 matches, but you need to judge all the people who come to this competition table, which may require judging about 50 matches, so you can also choose to slack off and not go when it's your turn to judge.

However, many people are unwilling to be a judge, which often results in a lack of referees. The WCA Delegate has to shout into the microphone to find people to be judges, especially late at night when many kids have gone to bed, and sometimes there's only one person acting as a judge.

The judge's stopwatch ⏱️

However, judges in China are recruited through a questionnaire registration system. Before the competition, referees are recruited by sending out questionnaires in various groups. This ensures that there are enough referees, but the downside is that it requires effort to recruit them.

People & Friends

Preston Hoing (2019HOIN01) was the first person I met at the competition venue. He is a bit of a chatterbox and chatted with me very enthusiastically, even mentioning a good scramble he encountered last time with the magic clock.

He is a participant in all events of this competition. The 24-hour all-event challenge was really exhausting for him, but he still persevered until the end, completed his first five-blind, and even made it to the three-blind finals. Impressive. However, I forgot to take a photo with him, which is a bit regrettable.

Then I sat next to a little boy and his father, a very cute little boy from Brazil: Benjamin Dias Reino (2024REIN02)

With Benjamin and His Dad

Then two other kids came, whom Benjamin met in the last competition. The younger brother of the two brothers participated in the competition Ren Davis Semien (2024SEMI01)

Later, a local high school student from Los Angeles Kierran Leavitt (2022LEAV02) joined the table. He mentioned that he is learning to fly planes, including gliders and powered aircraft, which is quite fun.

In the last match of the first round of the third stage, I met a Chinese judge, Tianshuo Shao (2023SHAO01). If it weren't for him, I might have had to speak English all day, my brain would have burned out.

Later, during the break in the game, he drove me around Los Angeles. In the evening, we went to Santa Monica Beach and Pier, and there was a strong smell of marijuana.

Santa Monica Beach

Forgot to take a group photo, will make up for it in a couple of days.

Update on Oct 28, 2024: Just remembered to put the photo here

With Tianshuo at SacCubing XVIII 2024 @ Sacremento

Epilogue

Put some pictures

Before the match

The person practicing on the balcony

The view from the hotel's large balcony, the parking lot across the street cost Tianshuo and me $30

Drive into a dead end

Drove into a dead end again

Everyone was celebrating at midnight

The pool at the Hilton Hotel

With Benjamin

Santa Monica Pier

People fishing on the Santa Monica Pier

[中文] 和DW的十年

Fri, 23 Aug 2024 20:00:01 GMT

Start of the Journey

依然清晰的记得 2014 年夏天的那天晚上, 贴吧的置顶帖里我看到了从来没见过的一集 Doctor Who, 一个从未见过的眉毛特别浓密的老头和 Clara 从 TARDIS 里出来, 我还以为是 Jenna Coleman 出演的另一部电视剧 (当时还没看到博士之日里面的眉毛或者博士之时里面的重生), 后来发现那是刚刚首播的 S08E01.

最初了解到 Doctor Who 是因为这是老师上课放的众多科幻剧集中的一个 (BTW 我现在和他依然有联系, 他说现在上课放神秘小镇了, DW 有的时候比较恐怖), 后来在他的帮助下我找到了贴吧上面的资源追剧, 那一天我注册了贴吧账号, 第八季也恰巧在那一天开播, 如果点进我的贴吧主页会发现我恰好是十年吧龄.

Back to the Beginning

S08E01 首播十年的晚上重温了这一集, 每一句台词都是那么的熟悉, 好像一位老朋友再次和我娓娓道来我们刚认识时候他讲过的故事, 我知道他的会说的每一句话, 每一个梗和脸上的每一个表情, 甚至有的时候会突然有一种既视感, 让我感觉好像想起来了十年之前的情感. 比如 Clara 在餐厅地下被博士 '抛弃' 的时候, 一种陌生和绝望的感觉突然涌上心头, 似乎和曾经的我共享了同一个感情... 虽然是一样的剧集, 但是切身体会到 所以兴怀，其致一也 的感觉是真的非常奇妙.

P.S. 这一集中 Vastra 夫人说的 "Well then, here we go again." 是 Brigadier 曾经在第三任博士重生为第四任博士的时候说过的话, 拥有这样长时间尺度的回忆和致敬也是我喜欢 DW 的一个非常重要的原因, 因为我同样是一个不喜欢结束的人, 就好像撕掉书的最后一页.

这一集真的很好地刻画了博士重生之后的迷茫和脆弱, 他是一个充满活力的人, 但也感到害怕和孤独. 12 在翻译恐龙的咆哮声的时候或许真的是在表达自己的恐惧, 在这样的借物喻人之下, 博士对恐龙的安全保证是那么的脆弱, 让他那么的愧疚, 这和小 10 在庞贝火山爆发的时候有一些相似性, 但是不同却在于 12 最终没有救下恐龙但是 10 却救下了庞贝商人.

You will be home again!

Clara 对刚刚重生的 12 比较疏离却又非常担心他, 她还没有准备好接受博士突然变成了一个看起来完全陌生的形象, 以至于用一种非常有攻击性的语气和 Vastra 夫人对线, 但是最终还是在小 11 的最后电话之后慢慢接受了 12, 但是 12 对自己身份的追寻依然刚刚开始.

How dare you!

How does it feel?

最开始我非常向往 Doctor 的旅行, 作为 Doctor 或者 Companion 是宇宙中最酷的工作了, 我想几乎每一个 Whovian 都曾经幻想过和 Doctor 一起旅行会是什么样的, 也正是这样的好奇心驱使着我们对 DW 的热爱.

后来渐渐长大, 我逐渐理解了剧集中人物的感情和 Doctor 的价值观, 那样的好奇心和责任, Never cruel, never cowardly; never give up, never give in, 我一直非常喜欢这句话, 希望每一个人都能够坚持自己的信念.

当然, 作为一个设定上寿命极长的角色, 唯一的 Time Lord, 拥有这样强大的能力和智慧, 如何约束自己的行为, 我想这个命题在 Clara 离去的三集中做出了充分的探讨.

Face the Raven, Heaven Sent 和 Hell Bent 这三集作为季末的整体, 讲述当 Doctor 失去了至亲之人后会做出怎样的选择, 甚至会为了复仇而放弃自己的原则, 选择修改时间, 但是最后依然不能阻止事情的发生, 或许对于每一个人也是一样的, 当一个人面对极端的情况, 往往会下意识地否认, 试图扭转状况, 只不过这里的 Doctor 可以操纵时间, 但是依然无法让 Clara 逃避自己的命运.

听说这个画的背面也有写字 "I'm in 12", 但是 Doctor 不忍心把它转过来...

如果说学校的教育是知识的传授, 那么我相信 DW 一定在我的价值观中占有一席之地, 好奇心和冒险精神, 如何面对困难, 以及对于人性的探讨, 在这些普世价值和命题上的探讨导致 Doctor Who 对我的影响真的很大, 也让我想去亲自 see the world, 并且很多时候问一下自己: What would The Doctor do? 或许就能得到一个很好的答案.

Words

DW 里面真的有很多我很喜欢的台词, 有一些非常有名, 这里列举一些我比较喜欢的:

One day, I shall come back. Yes, I shall come back. Until then, there must be no regrets, no tears, no anxieties. Just go forward in all your beliefs, and prove to me that I am not mistaken in mine.
I burned up a sun just to say goodbye.
Never cruel, never cowardly; never give up, never give in.
Goodness is not goodness that seeks advantage. Good is good in the final hour, in the deepest pit without hope, without witness, without reward. Virtue is only virtue in extremis.
It all just disappears doesn't it? Everything you are, gone in a moment like breath on a mirror. Any moment now, he’s a coming, (Clara: Who's coming?) The Doctor. (Clara: But you are, you are the doctor.) And I always will be. But times change and so must I. We all change, when you think about it. We are all different people all through our lives and that's okay, that's good, you've got to keep moving so long as you remember all the people that you used to be. I will not forget one line of this, not one day, I swear. I will always remember when The Doctor was me.

推荐几个粉丝混剪:

B站 - Are You The One
- 这首歌绝了, 完美契合 Doctor 的形象, 我通过这个混剪爱上了这首歌, 剪辑也非常到位.
YouTube - The First Question - 50th Anniversary Trailer
- 50 周年的混剪, 12 年之前的视频了, 但是到现在也不过时, 尤其是台词的选取和配合, 以及音乐的选择都非常到位.
YouTube - The First Question - 60th Anniversary Edition
- 60 周年的混剪, 上一个视频的十年后重制版, 也是非常的精彩.
- 这个视频 B 站还没有搬运, 因此我联系上作者取得了转载授权.
- B 站搬运: B站 - The First Question - 60th Anniversary Edition

Epilogue

用这篇文章简单聊了聊和 DW 的故事, 但是有更多的 delicate 的情感很难用文字表达出来, 很多剧集真的是百看不厌, 最喜欢的一集还是 Heaven Sent.

但是我真的很希望下一季的 DW 能够在剧情上多下下功夫, S14/新新版S1 的最后一集有点难绷... 相关吐槽欢迎前往 [DW] 幽默RTD, 幽默S14E08 观看.

每个博士重生都不只是博士追寻新身份的过程，也是观众接受新博士的过程, 12 的首集通过女伴的感情变化来慢慢表达了这个过程. 其实观众接纳新博士本身也是接纳新自己的过程, 在现实中同样代表了我们愿不愿意勇敢地开始一个新的人生阶段, 愿不愿意在这个过程中舍弃原先拥有东西, 即便这个东西是好的, 我们珍爱的.

就像这句话一样: So long as you remember all the people that you used to be 在人生前进的路上只要我们记得曾经的那些美好, 就没有浪费那些时光. 十年之前的我又怎能想象到现在的我是什么样的呢, 但是只要记住这十年来 DW 带来的感动 (或者 CC 的垃圾剧情) 就足够了.

The Doctors

我和 DW 的下个十年会怎么样呢? Nobody knows, 但是我会一直期待下一集 Doctor Who 的!

如果你也是 Whovian, 欢迎在评论区分享你和 DW 的故事或者你最喜欢的台词 / 剧集.

After all, that's how the all started!

Credits

[English] Decade with DW

Fri, 23 Aug 2024 20:00:00 GMT

Start of the Journey

I still clearly remember that night in the summer of 2014, in the pinned post, I saw an episode of Doctor Who that I had never seen before. An old man with particularly thick eyebrows and Clara came out of the TARDIS. I thought it was another TV series starring Jenna Coleman (at that time, I hadn't seen the eyebrows in "The Day of the Doctor" or the regeneration in "The Time of the Doctor"). Later, I realized it was the just-premiered S08E01.

The first time I learned about Doctor Who was because it was one of the many sci-fi series that the teacher played in class. Later, with his help, I found resources to follow the series.

Back to the Beginning

Rewatched this S08E01 episode on the night of its ten-year premiere, every line of dialogue is so familiar, like an old friend recounting the stories he told me when we first met. I know every word he will say, every joke, and every expression on his face.

Sometimes, I even get a sense of déjà vu, making me feel like I remember the emotions from ten years ago. For example, when Clara was 'abandoned' by the Doctor in the restaurant basement, a feeling of unfamiliarity and despair suddenly surged in my heart, as if I shared the same emotion with my past self... Although it's the same episode, the personal experience of "so the feelings are the same" is truly very wonderful.

P.S. In this episode, what Mrs. Vastra said, "Well then, here we go again," was something Brigadier once said when the Third Doctor regenerated into the Fourth Doctor. Having such long-term memories and tributes is one of the very important reasons why I like DW, because I am also someone who doesn't like endings, just like tearing out the last page of a book.

This episode really well portrays the Doctor's confusion and vulnerability after his regeneration. He is a person full of energy, but also feels fear and loneliness. When translating the dinosaur's roar, he might really be expressing his own fear. Under such a metaphor, the Doctor's assurance of the dinosaur's safety is so fragile, making him feel so guilty. This is somewhat similar to the situation with the Tenth Doctor during the eruption of Mount Vesuvius, but the difference is that the Twelfth Doctor ultimately did not save the dinosaur, whereas the Tenth Doctor saved the Pompeii merchant.

You will be home again!

Clara is somewhat distant from the newly regenerated 12 but is very worried about him. She is not yet ready to accept that the Doctor has suddenly turned into a completely unfamiliar appearance, to the point of using a very aggressive tone with Madam Vastra. However, she eventually starts to accept 12 after the final call from 11, but 12's quest for his own identity has just begun.

How dare you!

How does it feel?

At first, I was very eager for the Doctor's travels. Being a Doctor or a Companion is the coolest job in the universe. I think almost every Whovian has fantasized about what it would be like to travel with the Doctor, and it is this curiosity that drives our love for DW.

As I grew up, I gradually understood the emotions of the characters in the series and the values of the Doctor, such curiosity and responsibility, "Never cruel, never cowardly; never give up, never give in." I have always liked this phrase very much and hope that everyone can stick to their beliefs.

Of course, as a character with an extremely long lifespan, the only Time Lord, possessing such powerful abilities and wisdom, how to restrain one's behavior, I think this proposition was fully explored in the three episodes where Clara left.

Face the Raven, Heaven Sent, and Hell Bent as a whole for the season finale, tell the story of what choices the Doctor will make after losing a loved one, even to the point of abandoning his principles for revenge and choosing to alter time. However, in the end, he still cannot prevent things from happening. Perhaps it is the same for everyone; when faced with extreme situations, people often subconsciously deny and try to reverse the situation. But here, even though the Doctor can manipulate time, he still cannot let Clara escape her fate.

I heard that there is also writing on the back of this painting saying "I'm in 12", but the Doctor couldn't bear to turn it over...

If the education at school is the transmission of knowledge, then I believe DW definitely holds a place in my values. Curiosity and adventurous spirit, how to face difficulties, and the exploration of human nature. The discussion on these values and propositions has led Doctor Who to have a significant impact on me, making me want to personally see the world, and often ask myself: What would The Doctor do? Perhaps I can get a very good answer.

Words

There are really many lines in DW that I like, some of which are very famous. Here are some that I particularly like:

One day, I shall come back. Yes, I shall come back. Until then, there must be no regrets, no tears, no anxieties. Just go forward in all your beliefs, and prove to me that I am not mistaken in mine.
I burned up a sun just to say goodbye.
Never cruel, never cowardly; never give up, never give in.
Goodness is not goodness that seeks advantage. Good is good in the final hour, in the deepest pit without hope, without witness, without reward. Virtue is only virtue in extremis.
It all just disappears doesn't it? Everything you are, gone in a moment like breath on a mirror. Any moment now, he’s a coming, (Clara: Who's coming?) The Doctor. (Clara: But you are, you are the doctor.) And I always will be. But times change and so must I. We all change, when you think about it. We are all different people all through our lives and that's okay, that's good, you've got to keep moving so long as you remember all the people that you used to be. I will not forget one line of this, not one day, I swear. I will always remember when The Doctor was me.

Recommend some videos:

Bilibili - Are You The One
- This song is amazing, perfectly fitting the image of the Doctor. I fell in love with this song through this mashup, and the editing is also very well done.
YouTube - The First Question - 50th Anniversary Trailer
- The 50th anniversary mashup, a video from 12 years ago, but still not outdated, especially the selection and coordination of lines, as well as the choice of music, are all very well done.
YouTube - The First Question - 60th Anniversary Edition
- A 60th-anniversary mashup, a remastered version of the previous video from ten years ago, is also very exciting.
- This video has not been uploaded to Bilibili yet, so I contacted the author and obtained permission to repost it.
- Bilibili repost: Bilibili - The First Question - 60th Anniversary Edition

Epilogue

This article briefly talks about the story with DW, but there are more delicate emotions that are hard to express in words. Many episodes are really worth watching repeatedly, and my favorite episode is still Heaven Sent.

However, I really hope that the next season of DW can put more effort into the plot. The last episode of S14/New Version S1 is a bit hard to endure... Related discussions are welcome to visit [DW] 幽默RTD, 幽默S14E08 to watch.

Every Doctor's regeneration is not just a process of the Doctor seeking a new identity, but also a process for the audience to accept the new Doctor. The first episode of 12 slowly expresses this process through the emotional changes of the companion. In fact, the audience's acceptance of the new Doctor is also a process of accepting a new self, which in reality represents whether we are willing to bravely start a new stage of life, and whether we are willing to give up things we previously had, even if those things are good and cherished by us.

Just like this sentence: So long as you remember all the people that you used to be As long as we remember those beautiful moments on the road of life, we haven't wasted that time. How could I have imagined what I would be like ten years ago, but as long as I remember the emotions brought by DW (or the bad plot from CC) over the past ten years, it's enough.

The Doctors

What will the next decade be like for me and DW? Nobody knows, but I will always look forward to the next episode of Doctor Who!

If you are also a Whovian, feel free to share your stories with DW or your favorite lines/episodes in the comments.

After all, that's how the all started!

Credits

[中文] SQ-1: 初级拉尔斯法

Tue, 06 Aug 2024 00:23:21 GMT

魔方介绍

Square-1 (以前称为Cube 21和Back to Square One) 是一个两极类可变形魔方. 它的解法非常独特, 因为上下两层的块是可以通过上下层的转换变换顺序的, 所以不存在角块和棱块之说, 上层可以有10个块, 而底层只有6个块.

该魔方由 Karel Hršel 和 Vojtech Kopský 于1990年发明.

它是WCA官方项目，最快解法由来自美国的 Ryan Pilat 保持 (3.41秒).

记号表示

顶（底）层在图片的左（右）侧, 所有图均为俯视图.

拿 SQ1 让赤道（中层）的前面的左侧为短边. 不要整体旋转 SQ1, 左手始终握住赤道的短边.

| 记号 | 含义 | | ------------------ | ----------------------------------------------------- | | $\pm x \pm y$ | 转 U 层 $(\pm 30x)^\circ$ 并转 D 层 $(\pm 30y)^\circ$ | | $n, \underline{n}$ | $n0, 0n$ | | $U, D$ | $3, \underline{3}$ | | $M2$ | 1/-1-1/01 |

复原步骤

复原形状

所有复形的最后都是要转化成风筝-风筝, 可以做 4 个连角后化成扇贝-风筝；也可以先做 3 个连角并放在 DL，再做 3 个并放在 DR 后化为 8-星形或 71-星形.

复原形状

推荐初学者采用后一种方式, 先把所有 60 度角块放在底层组成一个星星, 就可以套用公式啦. 当你理解了公式的原理后, 你可以尝试脱离公式, 用自己的思考解决, 类似 F2L.

六角星公式

角块色相

这一步比较简单, 逻辑上类似四阶魔方的中心块复原.

角块色相

棱块色相

单棱交换就是背公式了, 但是双棱交换可以试试这个公式然后理解这个转换机的工作流程.

棱块色相

角块顺序

两个比较简单可以理解的公式.

角块顺序

其他情况: 顶层和底层肯定有颜色在同一个面上相同的角块, 把这个面放在左或右侧后做 /U'/UD/D'/ , 变成上图中第一种情况.

棱块顺序

这里的相邻棱交换也是需要背公式, 但是对棱交换也可以试试这个公式然后理解这个转换机的工作流程.

棱块顺序

奇偶校验

最逆天的公式...

奇偶校验

赤道翻转

如果最后出现中层位置错误的情况, 可以用这个公式解决.

赤道翻转

Credit

[English] SQ-1: Beginner Lars Method

Tue, 06 Aug 2024 00:23:20 GMT

Intoduction to SQ-1

The Square-1 (previously called as Cube 21 and Back to Square One) is a shape-shifting three-layered twisty puzzle. Its solution is very unique because the kite-shaped corners and the triangular edges are indistinguishable to the puzzle's inner mechanism, meaning that corners can be swapped with edges and therefore it's possible to have 10 pieces in the upper layer while only 6 in the bottom.

The puzzle was invented in 1990 by Karel Hršel and Vojtech Kopský.

It's an official WCA competition event, the fastest solution being held by Ryan Pilat from USA (3.41 seconds).

Notation

The top (bottom) layer is on the left (right) side of the image, all images are top views.

Take SQ1 and let the left side of the front of the equator (middle layer) be the short edge. Do not rotate SQ1 as a whole, always hold the short edge of the equator with your left hand.

| Notation | Meaning | | ------------------ | ------------------------------------------------------------------------------ | | $\pm x \pm y$ | Rotate U layer for $(\pm 30x)^\circ$ AND rotate D layer for $(\pm 30y)^\circ$ | | $n, \underline{n}$ | $n0, 0n$ | | $U, D$ | $3, \underline{3}$ | | $M2$ | 1/-1-1/01 |

Steps

Cubeshape

The end of any cubeshape is to transform into Kite-Kite. One can make 4 paired corners then transform to Scallop-Kite. Or make and place 3 paired corners in DL, then 3 more in DR, and then transform into 8-Star or 71-Star.

Cubeshape

It is recommended for beginners to use the latter method. First, place all the 60-degree angle pieces on the bottom layer to form a star, then you can apply the formula. Once you understand the principle of the formula, you can try to solve it without the formula, using your own thinking, similar to F2L.

Hexagram formula

Corner Orientation

This step is relatively simple, logically similar to the restoration of the center piece of a 4x4 Rubik's Cube.

Corner Orientation

Edge Orientation

Single edge exchange is about memorizing the formula, but for double edge exchange, you can try this formula and understand the workflow of this commutator.

Edge Orientation

Corner Permutation

Two relatively simple and understandable formulas.

Corner Permutation

Other situations: There are definitely corner pieces with the same color on the same face for the top and bottom layer. After placing this face on the left or right side, perform /U'/UD/D'/ to turn it into the first situation in the above diagram.

Edge Permutation

The adjacent edge swap here also requires memorizing the formula, but for opposite edge swaps, you can also try this formula and understand the workflow of this commutator.

Edge Permutation

Parity

The most complicated formula...

Parity

Equator Flip

If there is an error in the equator (middle layer) position at the end, you can use this formula to solve it.

Equator Flip

Credit

[English] San Francisco Trip

Mon, 22 Jul 2024 17:44:14 GMT

First Caltrain Journey

I was quite curious before boarding the Caltrain for my first experience with public transportation in the US. Purchasing a ticket or acquiring a Clipper card turned out to be straightforward - you can buy a ticket at any station or download a digital card via the Clipper App.

Upon arriving at the Caltrain station, I immediately noticed the contrast with Chinese high-speed railway stations. Caltrain stations are considerably more open; you don't have to swipe your Clipper card or show your train ticket to access the platform. Although it's possible to board the train without paying, conductors periodically check for valid tickets.

Caltrain features double-decker trains equipped with one or two bike cars. The first level is dedicated to cyclists, making it extremely bike-friendly. As for seating, the second level offers two configurations: a single-seat arrangement with an open view to the lower level, and standard seats accompanied by tables.

I took the Caltrain from California Ave Station to SF Station and back, departing at 7:48AM and returning at 8:57PM on Saturday.

I generally love its convenience, but it's a bit slow, taking more than 1 hour for a 60km trip.

Berkeley

I took an Uber to Berkeley and enjoyed a brief hour-long tour, wandering around.

San Francisco

Lunch

In-N-Out Burger!

Exploring and Vintage Shops

Be cautious of coyotes!

Enjoy exploring the beautiful mountainous terrain and have fun.

{/* In a perfume shop we met a active puppy.

Also, purchased chocolates worth $130.

A book from 1911

Dinner

Very good location and scene! It's called Crab House at Pier 39.

There were people celebrating a birthday there, and we encountered two birthday parties!

{/* */}

Golden Gate Bridge

I took some fantastic photos!

It was extremely windy and cold, so please dress more warmly!

Home

It was very cold at the SF Caltrain Station before I boarded the train at 9 PM.

After arriving at California Ave Station at 10PM, I found it convenient that I had parked my bike next to the platform that morning.

[中文] Rubik's Clock: 7simul flip 法

Tue, 25 Jun 2024 08:15:04 GMT

基础介绍和还原

这个视频说得又短又清楚: 魔表基础还原教程 .

7simul flip

其实本来是想写 Tommy's 7simul Method 的, 但是正当我要写的时候发现了同一个 UP 刚刚发布了更好的新方法.

观察记录

如果是 Tommy's 7simul Method , 可以将每一个表盘看作一个数字, 每一个箭头看作两个数字之间的向量, 这样更加直观.

以如下打乱为例:

UR3- DR4- DL1- UL2- U1+ R4+ D2- L3- ALL1+ y2 U3- R1- D4- L4+ ALL1+ DR DL UL

假设面对着你的那一面用大写字母, 背面用小写字母, 读码的时候翻面都使用 x2 上下翻面, 而不是打乱时候的左右翻面, 数字字母编码可以用自己喜好的方式.

这个例子使用打乱的时候朝上的那一面作为正面

| 步骤 | 描述 | 数值大小 | 编码 | | ---- | ------------------------------------ | -------- | ---- | | 1 | $(R\rightarrow D)+(l\rightarrow ul)$ | 6 | 6 | | 2 | $u\rightarrow c$ | -3 | C | | 3 | $l\rightarrow u$ | -5 | E | | 4 | $(r\rightarrow d)+(L\rightarrow UL)$ | -3 | C | | 5 | $U\rightarrow C$ | 5 | 5 | | 6 | $L\rightarrow U$ | 4 | 4 |

操作

假设面向你的四根立柱分别是 UL, UR, DR, DL , 以下说明的都是哪些立柱突出.

| 步骤 | 立柱突出 | UL 轮拧多少 | UR 轮拧多少 | | ---- | ---------------- | --------------------------------------- | ------------------------- | | 1 | UL, DR, DL | 步骤 1 的编码 | 步骤 2 的编码 | | 2 | UL, DL | 对齐 D 和 R 表盘 | 步骤 3 的编码 | | 3 | UL | 对齐 C 和 D&R 表盘 | 对齐 DR 和 D&R 表盘 | | 4 | x2 翻面 | x2 翻面 | x2 翻面 | | 5 | UL, DR, DL | 步骤 4 的编码 | 步骤 5 的编码 | | 6 | UL, DL | 对齐 D 和 R 表盘 | 步骤 6 的编码 | | 7 | UL | 对齐左上的四个表盘和 D&R 表盘 | 对齐 DR 和 D&R 表盘 | | 8 | UL, DR | 除了 DL, UR , 让其余表盘对齐十二点 | DL, UR 表盘对齐十二点 |

Credits

[English] Rubik's Clock: 7simul flip Method

Tue, 25 Jun 2024 08:15:03 GMT

7simul flip

Observation

For example, with the following shuffle:

UR3- DR4- DL1- UL2- U1+ R4+ D2- L3- ALL1+ y2 U3- R1- D4- L4+ ALL1+ DR DL UL

Assume the side facing you uses uppercase letters, the back side uses lowercase letters, and when reading the code, flip it using x2 (flip up and down), not the left-right flip used during scrambling. You can use your preferred method for number and letter encoding.

This example uses the side facing up during scrambling as the front.

| Steps | Description | Numerical value | Encoding | | ----- | ------------------------------------ | --------------- | -------- | | 1 | $(R\rightarrow D)+(l\rightarrow ul)$ | 6 | 6 | | 2 | $u\rightarrow c$ | -3 | C | | 3 | $l\rightarrow u$ | -5 | E | | 4 | $(r\rightarrow d)+(L\rightarrow UL)$ | -3 | C | | 5 | $U\rightarrow C$ | 5 | 5 | | 6 | $L\rightarrow U$ | 4 | 4 |

Operation

Assuming the four pillars facing you are UL, UR, DR, DL, the following descriptions indicate which pillars are protruding.

| Steps | Protruding column | How many steps UL turns | How many steps UR turns | | ----- | ----------------- | ---------------------------------------------------------------------- | ----------------------------------------- | | 1 | UL, DR, DL | Encoding of Step 1 | Encoding of step 2 | | 2 | UL, DL | Align D and R dials | Encoding of Step 3 | | 3 | UL | Align C and D&R dials | Align DR and D&R dials | | 4 | x2 Flip over | x2 Flip over | x2 Flip over | | 5 | UL, DR, DL | Encoding of step 4 | Encoding of step 5 | | 6 | UL, DL | Align D and R dials | Encoding of step 6 | | 7 | UL | Align the top-left four dials and the D&R dial. | Align DR and D&R dials | | 8 | UL, DR | Except for DL and UR, align the remaining dials to twelve o'clock. | DL, UR dial aligned to twelve o'clock |

Credits

[中文] Skewb: 控心法

Sun, 23 Jun 2024 08:20:21 GMT

斜转复原方法整体概览

普通SH叠加法 (LBL Method)

这部分的详细教程可以参考 Gan's Skewb tutorial

控心法 (Optimized LBL Method)

顶面控心: 在普通SH叠加法的基础上, 完成顶角的同时把顶面中心归位.

多向控心: 在顶面空心的基础上, 避免出现四心换, 或者跳过三心换. 其实多向控心并不一定要控顶面中心, 当你可以两个对位侧面中心归位时, 剩下的顶多也就是一个包含顶面的三心换.

二步法 (L2L Method)

二步法是更高级的方法, 但是有些case的解法不如叠加, 比如 zbll 中有的小鱼情况的 zbll 还不如直接做OP.

叠加二步法 (L2L, Last Two Layers): 完成底面后, 至多需要五个S或H即可还原斜转魔方, 记住每种情况所对应的SH叠加和其中的转体, 一气呵成还原魔方. 总共 134 个公式, 可以参考 Skewb L2L Method

NS法: 对叠加二步法的补充, 叠加二步法中, 当出现需要四个或者五个SH叠加才能完成的情况时, 继续使用叠加二步法步骤太多, 耗时太长, 于是产生NS法对叠加二步法中繁琐的情况发明了新的公式进行补充.

KK法: 和NS法一样, 不过不好用, 渐渐被淘汰了.

全预判

推演出还原一面后出现的情况, 然后通过二步法还原斜转魔方, 中间不需要任何停顿和思考.

记号说明

Basic notations

转动方式和三阶相同, 看向哪个面的时候对那个面做顺时针旋转就是那个角的记号 (没有撇) .

H&S notations

S (Sledge) 和 H (Hedge) 的名字最开始起源于三阶的术语, 但是在三阶中逐渐淘汰却被发现在 Skewb 上很合适, 于是被发扬光大

控心法教程

FL (First Layer)

这一步需要复原底层角块和底层中心.

总的来说跟三阶的底层十字一样, 需要多多练习, 在你更熟悉Skewb是如何旋转后, 这一步将轻易完成.

不过在最初几次复原中, 对于最后一个角你或许会碰上麻烦. 很有可能的是你为了做这个角却破坏了一个已经好了的, 这时有两种情况可用公式处理

LL (Last Layer)

这一步需要同时复原顶层角块和顶层中心.

总计十种小情况, 公式如下.

Side Centers

这一步需要复原侧面的中心块, 和初级方法相同.

Credits

[English] Skewb: Optimized LBL Method

Sun, 23 Jun 2024 08:20:20 GMT

Overview

LBL Method

The detailed tutorial for this part can be referred to Gan's Skewb tutorial

Optimized LBL Method

Optimized LBL Method: Based on the LBL Method, complete the top corners while returning the top face center to its position.

Multi-directional LBL Method: Based on Optimized LBL Method, avoid four-central-block swaps or skip three-central-block swaps. In fact, Multi-directional LBL Method does not necessarily require controlling the top surface center. When you can align two side centers, the remaining will at most be a three-central-block swap involving the top surface.

L2L Method

The two-step method is a more advanced method, but in some cases, the solution is not as good as LBL Method. For example, in some OLL cases in ZBLL, it is better to directly do OLL itself.

L2L, Last Two Layers: After completing the bottom face, at most five S or H moves are needed to restore the skewb. Remember the SH combinations and the rotations corresponding to each situation, and restore the cube in one go. A total of 134 formulas can be referenced. Skewb L2L Method

NS Method: A supplement to the L2L Method. In the L2L Method, when it requires four or five SH superpositions to complete, continuing to use the L2L Method involves too many steps and takes too long. Therefore, the NS Method was created to supplement the cumbersome situations in the L2L Method with new formulas.

KK method: Same as the NS method, but not very useful, gradually phased out.

Full prediction

Deduce the situation after restoring one side, then restore the skewb cube using the two-step method without any pauses or thinking in between.

Symbol Description

Basic notations

The rotation method is the same as the third order, when looking at a face, a clockwise rotation on that face is the notation for that corner (without an apostrophe).

H&S notations

The names S (Sledge) and H (Hedge) originally came from the terminology of the 3x3 cube, but as they were gradually phased out in the 3x3, they were found to be very suitable for the Skewb, and thus were popularized.

Optimized LBL Method

FL (First Layer)

This step requires restoring the bottom corner pieces and the bottom center.

Overall, it is similar to the bottom cross of a 3x3 cube, requiring a lot of practice. Once you become more familiar with how the Skewb rotates, this step will be easily completed.

However, during the first few solves, you might encounter trouble with the last corner. It is very likely that while trying to solve this corner, you might disrupt an already solved one. At this point, there are two situations that can be handled with algorithms.

LL (Last Layer)

This step requires simultaneously restoring the top layer corner pieces and the top layer center.

There are a total of ten small cases, the formulas are as follows.

Side Centers

This step requires restoring the center pieces on the sides, similar to the beginner's method.

Credits

[中文] 幽默RTD, 幽默S14E08

Sat, 22 Jun 2024 20:16:05 GMT

幽默 RTD 写的依托, 太唯心主义了, 感觉像被喂了依托新鲜的💩

看了看讨论贴基本上贬大于褒, 参考一些讨论总结一下

优点

这一季 Kate 的存在感足够多, 很帅很😍.
还有 Sarah Jane 的一个反派 Trickster出现, 有点唤起了六年之前的暑假的回忆.

缺点

像遛狗一样就遛死 Sutekh 了??? 有点草率了感觉.
Ruby 是一个 human 也不是不行, 试图跳出俗套也挺好的, 那凭什么就下雪了❄️还有圣诞颂歌, 毫无逻辑, 真就是因为 “We invest things with significance.” 呗.
为什么 Goblin 会管 Ruby 叫 “The Beast” , 难绷.
之前Ruby寻亲的时候没找到亲生父母还可以勉强解释成他父母的基因都没入寻亲机构的基因库. 但是既然在2046年战争首相就强制采集DNA了, 那在遥远的未来, 救护机为什么检测不到Ruby亲生父母的信息呢.
那个勺子桥段也太离谱了, 不懂意义在哪里, 摸不着头脑, 如果是为了搞笑为啥那么严肃... 看看之前的勺子都是怎么做的, 比如 12 的 Robin hood 那一集还挺好玩的.

73 yard 明明是 Moffat 在桥边为了让人恰好看不清脸随便找的一个距离, 怎么就恰巧跟T娘的设定一样了.

Wait and see

尚未揭晓的伏笔还很多

Mrs.Flood是谁? 能打破次元壁与观众互动、知道T娘、知道Ruby会是博士的同伴、知道苏泰克, 或许还有其他神、衣着模仿克拉拉&Romana I, 还会说“clever boy”, 所以Mrs. Flood到底是谁? 从本集她谈论造物主和结尾的那段话, 感觉不太像是克拉拉、Susan和Romana (她们仨应该不会用讲故事的语气和表情说15的结局会很惨吧) ... 会是Missy吗? 还是Rani?

在翻贴吧的时候发现 Romana II 美美美

gravity变成mavity, 60周年特辑的这个伏笔到现在也没有任何揭晓的迹象. 考虑到“ma-”这个字头和"magic", "marvel"相似，而且牛顿在物理学的奠基地位, 这个伏笔似乎是在说世界由科学转向魔法. 这是个最基础的伏笔,至少要到第三季结尾,才会真正扭转过来, 考虑到 RTD 确实喜欢埋多季的伏笔, 这样也不是不行.
撒盐对世界的影响，这和第一条是类似的, 都加重了这个世界的魔法性.
Ruby的超能力: 下雪, Maestro说这个能力来源于她内心深处隐藏的一首歌, 而Maestro无法将其吸出, 所以Ruby的谜题并未全部揭晓.

魔法特将于2024年圣诞特辑《普世欢腾》(Joy to the World）回归:

“我不能拒绝, 我喜欢写圣诞特辑, 我想过 ‘写过《Boom》了, 不需要再写了’ 然后RTD给我发邮件 ‘你想要写圣诞特辑吗?’ 我回他‘好的, 必须写’ 每写一个故事都可能是我最后一个故事, 我总是想发掘一些东西, 有时圣诞特辑似乎比其它常规集更以博士为核心. 我真的不能多说, 圣诞礼物要留在圣诞节拆开.”

Credits

Doctor Who's Steven Moffat addresses surprise early Varada Sethu appearance

How The New Doctor Would Interact With Other Modern Doctors Revealed By Past Doctor Who Showrunner

Steven Moffat Explains What Makes "Boom" A Defining Doctor Who Episode For Ncuti Gatwa's Doctor

‘Doctor Who’: Steven Moffat Talks Introducing Spoiler & What Wasn’t in First Draft of ‘Boom’ Script

[中文] Doctor Who S14 24hrs to go!

Thu, 02 May 2024 20:15:26 GMT

Ready to rock through time!

说明

本季是自1963年老版开播至今的第40季，是2005年新版复播软重启至今的第14季，也是BBC和Disney+在2023年四部特辑再度软重启全新开启的第1季。日常怎么称呼都可以（比如把1季称呼为14季），只需了解BBC官方定义和运作人RTD专访上《神秘博士》电视剧历史阶段划分为三个时代。综合BBC官方、运作人RTD、外网胡粉、国内胡粉对三个时代的称谓，总结如下（为了避免大家问名单里譬如“怎么没有战争博士和逃犯博士”这种问题，我在其他博士写明他们，只出现在官方杂志、或运作人采访譬如月亮博士、以及老版的养蜂人，因未在银幕中证明身份的，只是运作人嘴上说说，却没在剧里呈现的，我就不加入里面了）

一、经典系列老版（BBC）

1963年至1996年（1963年至1989年共26季和1996年电影）

主演: 1任至8任博士其他博士: 莫比乌斯博士（1任之前）、Valeyard（无法重生后博士具象化黑暗面）、梅林（未来博士）

二、复活系列05新版（BBC）

2005年至2022年（共13季）

主演: 9任至13任博士其他博士: 战争博士（8任和9任之间时间大战时期）、馆长/策展人(博士退休后可自由更改过去最爱面孔的老年形态)、逃犯博士（1任之前）

三、复活系列23新版（BBC & Disney+）

2023年至今

主演: 14任（结局为博士退休）/15任博士至今其他博士: 老年5任博士（双重生存活至今），老年6任博士（双重生存活至今），老年7任博士（双重生存活至今）

Credits

https://tieba.baidu.com/p/9010746968

[English] Hello World!

Wed, 01 May 2024 09:13:43 GMT

Hi there!

Hello dear someone in the world, hello from the beginning of the story!

My blogs

My first website was created on May 1, 2024, followed the style of Shiro, and was stopped at July 28, 2024.
The second website was created on July 28, 2024, and is still in use. Much prettier than the first one, isn't it?

Yutong's Site

[中文] Operating Systems Notes: 07 - 文件系统

0. 引言与基本问题

0.1 核心问题

0.2 本章要求掌握的概念

0.3 本章内容大纲

1. 文件系统基础概念

1.1 文件 (File)

1.2 文件系统 (File System)

1.3 文件分类 (按UNIX)

1.4 文件属性与文件控制块 (FCB)

2. 文件结构与访问

2.1 文件的逻辑结构

2.2 文件的访问方式

3. 存储介质与文件物理结构

3.1 存储介质与物理块

3.2 文件的物理结构 (磁盘空间分配方式)

3.2.1 连续结构 (顺序分配 / Contiguous Allocation)

3.2.2 链接结构 (链式分配 / Linked Allocation)

3.2.3 索引结构 (索引分配 / Indexed Allocation)

4. 文件目录

4.1 目录、目录项与目录文件

4.2 目录结构

4.3 目录文件的组织方式

4.4 文件目录检索

4.5 目录文件的改进 (加速目录检索)

5. 文件系统的实现

5.1 概述

5.2 相关术语

5.3 磁盘上的内容布局

5.3.1 UNIX 文件系统布局示例

5.3.2 FAT 文件系统布局示例

5.3.3 NTFS 文件系统布局示例

5.4 内存中的数据结构 (以UNIX为例)

5.5 磁盘空间管理

5.5.1 位图法 (Bitmap / Bit Vector)

5.5.2 空闲块链表 (Free Block Linked List)

5.5.3 成组链接法 (Grouping / Counting - UNIX V6 采用)

6. 文件操作的实现

6.1 文件访问模式

6.2 创建文件 (Create)

6.3 打开文件 (Open)

6.4 关闭文件 (Close)

6.5 读文件 (Read)

6.6 写文件 (Write)

6.7 指针定位 (Seek)

6.8 其他操作讨论

7. 文件共享

7.1 硬链接 (Hard Link)

7.2 软链接 / 符号链接 (Soft Link / Symbolic Link)

8. 文件系统挂载 (Mount) 与卸载 (Unmount)

9. 文件系统实例

9.1 UNIX 文件系统 (以传统 System V 或 BSD 风格为例)

9.2 FAT 文件系统 (FAT12/FAT16/FAT32)

9.3 NTFS (New Technology File System)

9.4 其他文件系统 (简述)

10. 练习与工具

10.1 练习题

10.2 mkfs 工具

11. 重点小结

[中文] Course Review for PKU Students

春秋学期均开设的课程

编译原理

射箭

秋季学期课程

信息安全引论

强化学习

智能机器人概论

计算机网络

博弈论

魅力化学

计算机系统导论

数据结构与算法 (A)

中级微观经济学 (Legacy)

春季学期课程

操作系统

计算机视觉导论

计算机组织与体系结构

数据库概论

经济学原理 (Ⅱ)

6.3 `mmap()` 函数 (POSIX 示例)

6.4 `mmap` 与 `shm` (共享内存) 对比

6.5 `mmap` 相关思考