<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>文件系统 on 大飞的博客</title>
    <link>https://www.dafei.me/tags/%E6%96%87%E4%BB%B6%E7%B3%BB%E7%BB%9F/</link>
    <description>Recent content in 文件系统 on 大飞的博客</description>
    <generator>Hugo</generator>
    <language>zh-cn</language>
    <lastBuildDate>Fri, 22 May 2026 07:00:00 +0000</lastBuildDate>
    <atom:link href="https://www.dafei.me/tags/%E6%96%87%E4%BB%B6%E7%B3%BB%E7%BB%9F/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>从零写OS（三十六）：ext2 写操作 —— 文件创建、引用计数与 tty 字符设备</title>
      <link>https://www.dafei.me/posts/os-36-ext2-write/</link>
      <pubDate>Fri, 22 May 2026 07:00:00 +0000</pubDate>
      <guid>https://www.dafei.me/posts/os-36-ext2-write/</guid>
      <description>&lt;p&gt;前几章文件系统都是只读的。这一章实现 ext2 的写路径，让 &lt;code&gt;echo hello &amp;gt; /tmp/a.txt &amp;amp;&amp;amp; cat /tmp/a.txt&lt;/code&gt; 能正常工作，且重启后文件仍然存在。过程中还修了 fd 引用计数和 tty 字符设备两个问题。&lt;/p&gt;
&lt;h2 id=&#34;ext2-磁盘结构回顾&#34;&gt;ext2 磁盘结构回顾&lt;/h2&gt;
&lt;pre tabindex=&#34;0&#34;&gt;&lt;code&gt;块组 0:
  [超级块][组描述符][block bitmap][inode bitmap][inode table][数据块...]
&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;关键字段：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;code&gt;sb-&amp;gt;s_free_inodes_count&lt;/code&gt; / &lt;code&gt;gd-&amp;gt;bg_free_inodes_count&lt;/code&gt;：空闲 inode 计数&lt;/li&gt;
&lt;li&gt;&lt;code&gt;sb-&amp;gt;s_free_blocks_count&lt;/code&gt; / &lt;code&gt;gd-&amp;gt;bg_free_blocks_count&lt;/code&gt;：空闲 block 计数&lt;/li&gt;
&lt;li&gt;&lt;code&gt;gd-&amp;gt;bg_inode_bitmap&lt;/code&gt;：inode bitmap 所在块号&lt;/li&gt;
&lt;li&gt;&lt;code&gt;gd-&amp;gt;bg_block_bitmap&lt;/code&gt;：block bitmap 所在块号&lt;/li&gt;
&lt;li&gt;&lt;code&gt;gd-&amp;gt;bg_inode_table&lt;/code&gt;：inode table 起始块号&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;inode 号从 1 开始；前 10 个是系统保留的（root=2，lost+found=11）。&lt;/p&gt;
&lt;h2 id=&#34;alloc_inode--alloc_block&#34;&gt;alloc_inode / alloc_block&lt;/h2&gt;
&lt;h3 id=&#34;alloc_inode&#34;&gt;alloc_inode&lt;/h3&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;&#34;&gt;&lt;code class=&#34;language-c&#34; data-lang=&#34;c&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#66d9ef&#34;&gt;uint32_t&lt;/span&gt; &lt;span style=&#34;color:#a6e22e&#34;&gt;alloc_inode&lt;/span&gt;(&lt;span style=&#34;color:#66d9ef&#34;&gt;void&lt;/span&gt;) {
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;    &lt;span style=&#34;color:#75715e&#34;&gt;// 1. 读 inode bitmap 块
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;    &lt;span style=&#34;color:#75715e&#34;&gt;// 2. 找第一个为 0 的位（bit i → inode i+1）
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;    &lt;span style=&#34;color:#75715e&#34;&gt;// 3. 置位，写回 bitmap
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;    &lt;span style=&#34;color:#75715e&#34;&gt;// 4. 更新超级块和组描述符的 free_inodes_count
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;    &lt;span style=&#34;color:#75715e&#34;&gt;// 5. 返回 inode 号（从 1 开始）
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;}
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;h3 id=&#34;alloc_block&#34;&gt;alloc_block&lt;/h3&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;&#34;&gt;&lt;code class=&#34;language-c&#34; data-lang=&#34;c&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#66d9ef&#34;&gt;uint32_t&lt;/span&gt; &lt;span style=&#34;color:#a6e22e&#34;&gt;alloc_block&lt;/span&gt;(&lt;span style=&#34;color:#66d9ef&#34;&gt;void&lt;/span&gt;) {
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;    &lt;span style=&#34;color:#75715e&#34;&gt;// 1. 读 block bitmap 块
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;    &lt;span style=&#34;color:#75715e&#34;&gt;// 2. 找第一个为 0 的位，跳过 block 0（保留）
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;    &lt;span style=&#34;color:#75715e&#34;&gt;// 3. 置位，写回 bitmap
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;    &lt;span style=&#34;color:#75715e&#34;&gt;// 4. 更新超级块和组描述符的 free_blocks_count
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;    &lt;span style=&#34;color:#75715e&#34;&gt;// 5. 清零新分配的块（避免垃圾数据）
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;    &lt;span style=&#34;color:#75715e&#34;&gt;// 6. 返回块号
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;}
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;注意：block bitmap 的 bit 0 对应 block 0，必须跳过（block 0 不存在）。实际第一个可分配的块由文件系统布局决定（本项目中是 610）。&lt;/p&gt;</description>
    </item>
    <item>
      <title>从零写OS（十五）：挂载 ext2，读真实文件系统</title>
      <link>https://www.dafei.me/posts/os-15-ext2/</link>
      <pubDate>Wed, 06 May 2026 15:00:00 +0000</pubDate>
      <guid>https://www.dafei.me/posts/os-15-ext2/</guid>
      <description>&lt;p&gt;前几章的文件系统是存在内存里的——重启数据就没了，文件名也是硬编码的。这一章做真实的：挂载一个 ext2 磁盘镜像，让 Shell 能读取里面的文件。&lt;/p&gt;
&lt;p&gt;上一章已经有了 ATA 驱动，能按扇区号读磁盘。现在的问题是：磁盘上的数据是怎么组织的？&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id=&#34;ext2-的结构&#34;&gt;ext2 的结构&lt;/h2&gt;
&lt;p&gt;ext2 是 Linux 最经典的文件系统，ext3/ext4 都是在它基础上演化来的。理解 ext2，基本上就理解了现代文件系统的核心思路。&lt;/p&gt;
&lt;p&gt;磁盘从偏移 1024 字节开始是 &lt;strong&gt;Superblock&lt;/strong&gt;，存整个文件系统的基本参数：block 大小是多少、有多少 inode、magic number 是 &lt;code&gt;0xEF53&lt;/code&gt;（用来确认这确实是 ext2）。&lt;/p&gt;
&lt;p&gt;接下来是 &lt;strong&gt;Group Descriptor&lt;/strong&gt;，告诉你 inode table 在哪个 block。&lt;/p&gt;
&lt;p&gt;然后才是真正的数据区：inode table 和数据块。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;Inode&lt;/strong&gt; 是文件的&amp;quot;身份证&amp;quot;。每个文件有一个唯一的 inode 号，inode 里存着文件大小、权限，以及最重要的——&lt;code&gt;i_block[0..11]&lt;/code&gt;，12 个直接指向数据块的指针。想读文件内容，就顺着这些指针去读对应的数据块。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;目录&lt;/strong&gt;也是文件，它的数据块里存的是一条条 &lt;code&gt;ext2_dir_entry&lt;/code&gt;：每条记录包含 inode 号、文件名长度、文件名。&lt;code&gt;ls&lt;/code&gt; 就是读根目录的数据块，遍历这些记录。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id=&#34;读文件的完整路径&#34;&gt;读文件的完整路径&lt;/h2&gt;
&lt;pre tabindex=&#34;0&#34;&gt;&lt;code&gt;Superblock  → 拿到 block_size、inodes_per_group
GroupDesc   → 拿到 inode table 的起始 block 号
Inode[ino]  → 拿到文件大小和 i_block[]
DataBlock   → 真正的文件内容
&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;读目录（ls）就在最后一步多做一件事：把数据块里的 &lt;code&gt;ext2_dir_entry&lt;/code&gt; 链遍历一遍。&lt;/p&gt;
&lt;p&gt;每一步都需要从磁盘读若干个扇区——这正是上一章 ATA 驱动的用武之地。&lt;/p&gt;</description>
    </item>
    <item>
      <title>从零写OS（十二）：VFS，让系统调用不认识具体文件系统</title>
      <link>https://www.dafei.me/posts/os-12-vfs/</link>
      <pubDate>Wed, 06 May 2026 12:00:00 +0000</pubDate>
      <guid>https://www.dafei.me/posts/os-12-vfs/</guid>
      <description>&lt;p&gt;上一章我们写了一个 SimpleFS，可以创建文件、读写内容。但现在有个问题：&lt;code&gt;open()&lt;/code&gt; 系统调用直接调的是 &lt;code&gt;fs_create&lt;/code&gt;、&lt;code&gt;fs_read&lt;/code&gt; 这些 SimpleFS 专属函数。&lt;/p&gt;
&lt;p&gt;如果哪天要支持 FAT32，就得去改系统调用的代码。这显然不对。&lt;/p&gt;
&lt;p&gt;这一章加一层 &lt;strong&gt;VFS（Virtual File System，虚拟文件系统）&lt;/strong&gt;，把系统调用和具体文件系统隔开。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id=&#34;先把概念搞清楚&#34;&gt;先把概念搞清楚&lt;/h2&gt;
&lt;h3 id=&#34;间接层解耦&#34;&gt;间接层解耦&lt;/h3&gt;
&lt;p&gt;软件里有句老话：&lt;strong&gt;任何问题都可以通过加一层间接层解决&lt;/strong&gt;。VFS 就是这层间接层。&lt;/p&gt;
&lt;pre tabindex=&#34;0&#34;&gt;&lt;code&gt;用户进程
   ↓  open / read / write
  VFS（统一接口）
   ↓              ↓
SimpleFS         FAT32
&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;系统调用只跟 VFS 说话，VFS 再转发给具体 FS。新增一种文件系统，只需要实现 VFS 要求的那几个函数，不动系统调用层。&lt;/p&gt;
&lt;h3 id=&#34;file_operationsc-语言的多态&#34;&gt;file_operations：C 语言的多态&lt;/h3&gt;
&lt;p&gt;VFS 要求每种文件系统提供一张&lt;strong&gt;函数指针表&lt;/strong&gt;：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;&#34;&gt;&lt;code class=&#34;language-c&#34; data-lang=&#34;c&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#66d9ef&#34;&gt;typedef&lt;/span&gt; &lt;span style=&#34;color:#66d9ef&#34;&gt;struct&lt;/span&gt; {
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;    &lt;span style=&#34;color:#66d9ef&#34;&gt;int&lt;/span&gt; (&lt;span style=&#34;color:#f92672&#34;&gt;*&lt;/span&gt;read) (...);
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;    &lt;span style=&#34;color:#66d9ef&#34;&gt;int&lt;/span&gt; (&lt;span style=&#34;color:#f92672&#34;&gt;*&lt;/span&gt;write)(...);
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;    &lt;span style=&#34;color:#66d9ef&#34;&gt;uint32_t&lt;/span&gt; (&lt;span style=&#34;color:#f92672&#34;&gt;*&lt;/span&gt;lookup)(...);
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;    &lt;span style=&#34;color:#66d9ef&#34;&gt;uint32_t&lt;/span&gt; (&lt;span style=&#34;color:#f92672&#34;&gt;*&lt;/span&gt;create)(...);
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;} FileOps;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;VFS 调 &lt;code&gt;fops-&amp;gt;read(...)&lt;/code&gt; 时，实际执行的是哪个函数，取决于挂载时注册的是哪张表。这是 C 语言实现&amp;quot;多态&amp;quot;的标准手法，Linux 内核里到处都是这个模式。&lt;/p&gt;
&lt;h3 id=&#34;vnodevfs-的通用-inode&#34;&gt;vnode：VFS 的通用 inode&lt;/h3&gt;
&lt;p&gt;具体 FS 有自己的 inode，VFS 层包一层 &lt;code&gt;vnode&lt;/code&gt;，里面放着具体 FS 的 inode 号和对应的函数指针表。对上层完全屏蔽了底层差异。&lt;/p&gt;</description>
    </item>
    <item>
      <title>从零写OS（十一）：文件系统，从磁盘到文件名</title>
      <link>https://www.dafei.me/posts/os-11-filesystem/</link>
      <pubDate>Wed, 06 May 2026 11:00:00 +0000</pubDate>
      <guid>https://www.dafei.me/posts/os-11-filesystem/</guid>
      <description>&lt;p&gt;到目前为止，内核能跑进程、能做系统调用，但所有数据都在内存里——进程一死，什么都没了。&lt;/p&gt;
&lt;p&gt;这一章做文件系统：把数据写到&amp;quot;磁盘&amp;quot;（我们用内存模拟），下次还能读回来。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id=&#34;先把概念搞清楚&#34;&gt;先把概念搞清楚&lt;/h2&gt;
&lt;p&gt;动手之前，先理解五件事。&lt;/p&gt;
&lt;h3 id=&#34;为什么需要文件系统&#34;&gt;为什么需要文件系统&lt;/h3&gt;
&lt;p&gt;磁盘本质上就是一个大字节数组。没有文件系统，你只能说&amp;quot;读第 1234 字节&amp;quot;，没法说&amp;quot;读 /etc/passwd&amp;quot;。&lt;/p&gt;
&lt;p&gt;文件系统做的事就是在这个字节数组上建立一套&lt;strong&gt;命名和组织规则&lt;/strong&gt;，让你可以用路径找到数据，而不是手动记偏移量。&lt;/p&gt;
&lt;h3 id=&#34;inode文件名和内容分离&#34;&gt;inode：文件名和内容分离&lt;/h3&gt;
&lt;p&gt;Unix 最重要的设计之一：&lt;strong&gt;inode 描述文件内容，目录存文件名&lt;/strong&gt;，两者分开。&lt;/p&gt;
&lt;p&gt;inode 记录的是&amp;quot;这个文件是什么&amp;quot;——大小、权限、数据在磁盘哪几块——但不存文件名。文件名只是一个指向 inode 的标签，存在目录里。&lt;/p&gt;
&lt;p&gt;这意味着同一个 inode 可以被多个名字指向，这就是&lt;strong&gt;硬链接&lt;/strong&gt;。重命名文件也不需要移动任何数据，只改目录项。&lt;/p&gt;
&lt;h3 id=&#34;超级块文件系统的自我描述&#34;&gt;超级块：文件系统的自我描述&lt;/h3&gt;
&lt;p&gt;挂载一块磁盘时，内核第一件事是读&lt;strong&gt;超级块&lt;/strong&gt;。超级块告诉内核这个文件系统的结构：inode 区从哪里开始、数据块从哪里开始、总共多少块、还有多少空闲。&lt;/p&gt;
&lt;p&gt;超级块损坏 = 整个文件系统不可读。所以 ext4 会在磁盘多个位置备份超级块。&lt;/p&gt;
&lt;h3 id=&#34;目录是普通文件&#34;&gt;目录是普通文件&lt;/h3&gt;
&lt;p&gt;目录没有什么神奇的内部结构，它就是一个普通文件，内容是一张表：&lt;strong&gt;文件名 → inode 号&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;ls&lt;/code&gt; 的本质是读这张表然后打印。路径解析 &lt;code&gt;/a/b/c&lt;/code&gt; 就是：读根目录找 &lt;code&gt;a&lt;/code&gt; 的 inode → 把 &lt;code&gt;a&lt;/code&gt; 当目录读，找 &lt;code&gt;b&lt;/code&gt; 的 inode → 把 &lt;code&gt;b&lt;/code&gt; 当目录读，找 &lt;code&gt;c&lt;/code&gt; 的 inode。&lt;/p&gt;
&lt;h3 id=&#34;空闲管理位图&#34;&gt;空闲管理：位图&lt;/h3&gt;
&lt;p&gt;磁盘上哪些块被占用、哪些空闲，用&lt;strong&gt;位图&lt;/strong&gt;记录——1 个 bit 对应 1 个块，0 表示空闲，1 表示已用。分配空间就是找第一个 0 位翻成 1。&lt;/p&gt;
&lt;p&gt;这五个概念搞清楚，下面的代码就是它们的直接翻译。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id=&#34;文件系统解决什么问题&#34;&gt;文件系统解决什么问题&lt;/h2&gt;
&lt;p&gt;内存是易失的，文件系统负责两件事：&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
