从零写OS（十四）：ATA 驱动，让内核能读磁盘

Wed, 06 May 2026 14:00:00 +0000

前面的文件系统都是存在内存里的——重启数据就没了。要读真实磁盘，得先搞清楚操作系统怎么和磁盘"说话"。这一章做 ATA 磁盘驱动。

磁盘和内核怎么通信

硬盘插在主板上，操作系统通过 ATA 协议和它通信。ATA 协议规定了一组固定的 x86 I/O 端口，内核用 in/out 指令直接操作这些端口，就能控制磁盘。

这叫 PIO 模式（Programmed I/O）——CPU 亲自一个字搬一个字地读数据。慢，但实现只需要几十行代码，是学习的最佳起点。

真实生产内核用 DMA（磁盘直接写内存，CPU 不搬数据），那是后话。

磁盘的最小单位：扇区

磁盘被切成 512 字节的扇区，每个扇区有一个编号，叫 LBA（Logical Block Address），从 0 开始数。

LBA=0 → 前 512 字节（Boot Sector）
LBA=1 → 512~1023 字节
LBA=2 → 1024~1535 字节（ext2 Superblock 就在这里）
...

要读文件系统里偏移 1024 字节的内容，就是读 LBA = 1024 / 512 = 2。

ATA 端口

ATA 协议设计于 1980 年代，把控制磁盘的所有操作映射到一组固定的 I/O 端口号上——这是当时 PC 硬件的惯例，如今这些端口号已经写死在无数设备里，成了不能改的"历史遗产"。

Primary ATA 控制器的端口：

端口	用途
`0x1F0`	数据（读写 16-bit）
`0x1F2`	要读几个扇区
`0x1F3`	LBA[7:0]
`0x1F4`	LBA[15:8]
`0x1F5`	LBA[23:16]
`0x1F6`	选盘 + LBA[27:24]
`0x1F7`	命令（写）/ 状态（读）

状态寄存器的两个关键位：

从零写OS（十一）：文件系统，从磁盘到文件名

Wed, 06 May 2026 11:00:00 +0000

到目前为止，内核能跑进程、能做系统调用，但所有数据都在内存里——进程一死，什么都没了。

这一章做文件系统：把数据写到"磁盘"（我们用内存模拟），下次还能读回来。

先把概念搞清楚

动手之前，先理解五件事。

为什么需要文件系统

磁盘本质上就是一个大字节数组。没有文件系统，你只能说"读第 1234 字节"，没法说"读 /etc/passwd"。

文件系统做的事就是在这个字节数组上建立一套命名和组织规则，让你可以用路径找到数据，而不是手动记偏移量。

inode：文件名和内容分离

Unix 最重要的设计之一：inode 描述文件内容，目录存文件名，两者分开。

inode 记录的是"这个文件是什么"——大小、权限、数据在磁盘哪几块——但不存文件名。文件名只是一个指向 inode 的标签，存在目录里。

这意味着同一个 inode 可以被多个名字指向，这就是硬链接。重命名文件也不需要移动任何数据，只改目录项。

超级块：文件系统的自我描述

挂载一块磁盘时，内核第一件事是读超级块。超级块告诉内核这个文件系统的结构：inode 区从哪里开始、数据块从哪里开始、总共多少块、还有多少空闲。

超级块损坏 = 整个文件系统不可读。所以 ext4 会在磁盘多个位置备份超级块。

目录是普通文件

目录没有什么神奇的内部结构，它就是一个普通文件，内容是一张表：文件名 → inode 号。

ls 的本质是读这张表然后打印。路径解析 /a/b/c 就是：读根目录找 a 的 inode → 把 a 当目录读，找 b 的 inode → 把 b 当目录读，找 c 的 inode。

空闲管理：位图

磁盘上哪些块被占用、哪些空闲，用位图记录——1 个 bit 对应 1 个块，0 表示空闲，1 表示已用。分配空间就是找第一个 0 位翻成 1。

这五个概念搞清楚，下面的代码就是它们的直接翻译。

文件系统解决什么问题

内存是易失的，文件系统负责两件事：

磁盘 on 大飞的博客