<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>磁盘 on 大飞的博客</title>
    <link>https://www.dafei.me/tags/%E7%A3%81%E7%9B%98/</link>
    <description>Recent content in 磁盘 on 大飞的博客</description>
    <generator>Hugo</generator>
    <language>zh-cn</language>
    <lastBuildDate>Wed, 06 May 2026 14:00:00 +0000</lastBuildDate>
    <atom:link href="https://www.dafei.me/tags/%E7%A3%81%E7%9B%98/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>从零写OS（十四）：ATA 驱动，让内核能读磁盘</title>
      <link>https://www.dafei.me/posts/os-14-ata/</link>
      <pubDate>Wed, 06 May 2026 14:00:00 +0000</pubDate>
      <guid>https://www.dafei.me/posts/os-14-ata/</guid>
      <description>&lt;p&gt;前面的文件系统都是存在内存里的——重启数据就没了。要读真实磁盘，得先搞清楚操作系统怎么和磁盘&amp;quot;说话&amp;quot;。这一章做 ATA 磁盘驱动。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id=&#34;磁盘和内核怎么通信&#34;&gt;磁盘和内核怎么通信&lt;/h2&gt;
&lt;p&gt;硬盘插在主板上，操作系统通过 &lt;strong&gt;ATA 协议&lt;/strong&gt;和它通信。ATA 协议规定了一组固定的 x86 I/O 端口，内核用 &lt;code&gt;in&lt;/code&gt;/&lt;code&gt;out&lt;/code&gt; 指令直接操作这些端口，就能控制磁盘。&lt;/p&gt;
&lt;p&gt;这叫 &lt;strong&gt;PIO 模式&lt;/strong&gt;（Programmed I/O）——CPU 亲自一个字搬一个字地读数据。慢，但实现只需要几十行代码，是学习的最佳起点。&lt;/p&gt;
&lt;p&gt;真实生产内核用 DMA（磁盘直接写内存，CPU 不搬数据），那是后话。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id=&#34;磁盘的最小单位扇区&#34;&gt;磁盘的最小单位：扇区&lt;/h2&gt;
&lt;p&gt;磁盘被切成 512 字节的&lt;strong&gt;扇区&lt;/strong&gt;，每个扇区有一个编号，叫 &lt;strong&gt;LBA&lt;/strong&gt;（Logical Block Address），从 0 开始数。&lt;/p&gt;
&lt;pre tabindex=&#34;0&#34;&gt;&lt;code&gt;LBA=0 → 前 512 字节（Boot Sector）
LBA=1 → 512~1023 字节
LBA=2 → 1024~1535 字节（ext2 Superblock 就在这里）
...
&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;要读文件系统里偏移 1024 字节的内容，就是读 &lt;code&gt;LBA = 1024 / 512 = 2&lt;/code&gt;。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id=&#34;ata-端口&#34;&gt;ATA 端口&lt;/h2&gt;
&lt;p&gt;ATA 协议设计于 1980 年代，把控制磁盘的所有操作映射到一组固定的 I/O 端口号上——这是当时 PC 硬件的惯例，如今这些端口号已经写死在无数设备里，成了不能改的&amp;quot;历史遗产&amp;quot;。&lt;/p&gt;
&lt;p&gt;Primary ATA 控制器的端口：&lt;/p&gt;
&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;端口&lt;/th&gt;
          &lt;th&gt;用途&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;&lt;code&gt;0x1F0&lt;/code&gt;&lt;/td&gt;
          &lt;td&gt;数据（读写 16-bit）&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;&lt;code&gt;0x1F2&lt;/code&gt;&lt;/td&gt;
          &lt;td&gt;要读几个扇区&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;&lt;code&gt;0x1F3&lt;/code&gt;&lt;/td&gt;
          &lt;td&gt;LBA[7:0]&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;&lt;code&gt;0x1F4&lt;/code&gt;&lt;/td&gt;
          &lt;td&gt;LBA[15:8]&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;&lt;code&gt;0x1F5&lt;/code&gt;&lt;/td&gt;
          &lt;td&gt;LBA[23:16]&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;&lt;code&gt;0x1F6&lt;/code&gt;&lt;/td&gt;
          &lt;td&gt;选盘 + LBA[27:24]&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;&lt;code&gt;0x1F7&lt;/code&gt;&lt;/td&gt;
          &lt;td&gt;命令（写）/ 状态（读）&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;状态寄存器的两个关键位：&lt;/p&gt;</description>
    </item>
    <item>
      <title>从零写OS（十一）：文件系统，从磁盘到文件名</title>
      <link>https://www.dafei.me/posts/os-11-filesystem/</link>
      <pubDate>Wed, 06 May 2026 11:00:00 +0000</pubDate>
      <guid>https://www.dafei.me/posts/os-11-filesystem/</guid>
      <description>&lt;p&gt;到目前为止，内核能跑进程、能做系统调用，但所有数据都在内存里——进程一死，什么都没了。&lt;/p&gt;
&lt;p&gt;这一章做文件系统：把数据写到&amp;quot;磁盘&amp;quot;（我们用内存模拟），下次还能读回来。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id=&#34;先把概念搞清楚&#34;&gt;先把概念搞清楚&lt;/h2&gt;
&lt;p&gt;动手之前，先理解五件事。&lt;/p&gt;
&lt;h3 id=&#34;为什么需要文件系统&#34;&gt;为什么需要文件系统&lt;/h3&gt;
&lt;p&gt;磁盘本质上就是一个大字节数组。没有文件系统，你只能说&amp;quot;读第 1234 字节&amp;quot;，没法说&amp;quot;读 /etc/passwd&amp;quot;。&lt;/p&gt;
&lt;p&gt;文件系统做的事就是在这个字节数组上建立一套&lt;strong&gt;命名和组织规则&lt;/strong&gt;，让你可以用路径找到数据，而不是手动记偏移量。&lt;/p&gt;
&lt;h3 id=&#34;inode文件名和内容分离&#34;&gt;inode：文件名和内容分离&lt;/h3&gt;
&lt;p&gt;Unix 最重要的设计之一：&lt;strong&gt;inode 描述文件内容，目录存文件名&lt;/strong&gt;，两者分开。&lt;/p&gt;
&lt;p&gt;inode 记录的是&amp;quot;这个文件是什么&amp;quot;——大小、权限、数据在磁盘哪几块——但不存文件名。文件名只是一个指向 inode 的标签，存在目录里。&lt;/p&gt;
&lt;p&gt;这意味着同一个 inode 可以被多个名字指向，这就是&lt;strong&gt;硬链接&lt;/strong&gt;。重命名文件也不需要移动任何数据，只改目录项。&lt;/p&gt;
&lt;h3 id=&#34;超级块文件系统的自我描述&#34;&gt;超级块：文件系统的自我描述&lt;/h3&gt;
&lt;p&gt;挂载一块磁盘时，内核第一件事是读&lt;strong&gt;超级块&lt;/strong&gt;。超级块告诉内核这个文件系统的结构：inode 区从哪里开始、数据块从哪里开始、总共多少块、还有多少空闲。&lt;/p&gt;
&lt;p&gt;超级块损坏 = 整个文件系统不可读。所以 ext4 会在磁盘多个位置备份超级块。&lt;/p&gt;
&lt;h3 id=&#34;目录是普通文件&#34;&gt;目录是普通文件&lt;/h3&gt;
&lt;p&gt;目录没有什么神奇的内部结构，它就是一个普通文件，内容是一张表：&lt;strong&gt;文件名 → inode 号&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;ls&lt;/code&gt; 的本质是读这张表然后打印。路径解析 &lt;code&gt;/a/b/c&lt;/code&gt; 就是：读根目录找 &lt;code&gt;a&lt;/code&gt; 的 inode → 把 &lt;code&gt;a&lt;/code&gt; 当目录读，找 &lt;code&gt;b&lt;/code&gt; 的 inode → 把 &lt;code&gt;b&lt;/code&gt; 当目录读，找 &lt;code&gt;c&lt;/code&gt; 的 inode。&lt;/p&gt;
&lt;h3 id=&#34;空闲管理位图&#34;&gt;空闲管理：位图&lt;/h3&gt;
&lt;p&gt;磁盘上哪些块被占用、哪些空闲，用&lt;strong&gt;位图&lt;/strong&gt;记录——1 个 bit 对应 1 个块，0 表示空闲，1 表示已用。分配空间就是找第一个 0 位翻成 1。&lt;/p&gt;
&lt;p&gt;这五个概念搞清楚，下面的代码就是它们的直接翻译。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id=&#34;文件系统解决什么问题&#34;&gt;文件系统解决什么问题&lt;/h2&gt;
&lt;p&gt;内存是易失的，文件系统负责两件事：&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
