<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>内核态 on 大飞的博客</title>
    <link>https://www.dafei.me/tags/%E5%86%85%E6%A0%B8%E6%80%81/</link>
    <description>Recent content in 内核态 on 大飞的博客</description>
    <generator>Hugo</generator>
    <language>zh-cn</language>
    <lastBuildDate>Fri, 22 May 2026 05:00:00 +0000</lastBuildDate>
    <atom:link href="https://www.dafei.me/tags/%E5%86%85%E6%A0%B8%E6%80%81/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>从零写OS（三十四）：阻塞式管道与调度器的两个 Bug</title>
      <link>https://www.dafei.me/posts/os-34-blocking-pipe/</link>
      <pubDate>Fri, 22 May 2026 05:00:00 +0000</pubDate>
      <guid>https://www.dafei.me/posts/os-34-blocking-pipe/</guid>
      <description>&lt;p&gt;上一章实现了阻塞式 TTY，这一章在同样的思路上让 pipe 的 read 也变成阻塞式，同时修复了调度器里隐藏的两个 Bug，让 fork + exec + wait4 的完整流程跑通。&lt;/p&gt;
&lt;h2 id=&#34;问题非阻塞-pipe-read-的后果&#34;&gt;问题：非阻塞 pipe read 的后果&lt;/h2&gt;
&lt;p&gt;ch33 之前，&lt;code&gt;vfs_read&lt;/code&gt; 对 pipe 的实现是：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;&#34;&gt;&lt;code class=&#34;language-c&#34; data-lang=&#34;c&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#66d9ef&#34;&gt;if&lt;/span&gt; (&lt;span style=&#34;color:#a6e22e&#34;&gt;pipe_buf_empty&lt;/span&gt;(p)) &lt;span style=&#34;color:#66d9ef&#34;&gt;return&lt;/span&gt; &lt;span style=&#34;color:#ae81ff&#34;&gt;0&lt;/span&gt;;   &lt;span style=&#34;color:#75715e&#34;&gt;// 管道空 → 直接返回 0
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;对于 shell 管道命令，busybox sh 会：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;fork 出子进程执行左侧命令，写 pipe&lt;/li&gt;
&lt;li&gt;父进程（或另一子进程）读 pipe，处理右侧命令&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;如果读端在写端还没写入时就读到 0，shell 认为 EOF，管道提前关闭，命令输出丢失。&lt;/p&gt;
&lt;h2 id=&#34;解决方案stihlt-等待&#34;&gt;解决方案：sti/hlt 等待&lt;/h2&gt;
&lt;p&gt;与 ch33 阻塞式 TTY read 相同的思路：在内核态用 &lt;code&gt;sti; hlt&lt;/code&gt; 轮询等待。&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;&#34;&gt;&lt;code class=&#34;language-c&#34; data-lang=&#34;c&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#75715e&#34;&gt;// pipe read：等待数据或写端关闭
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#66d9ef&#34;&gt;while&lt;/span&gt; (&lt;span style=&#34;color:#a6e22e&#34;&gt;pipe_buf_empty&lt;/span&gt;(p) &lt;span style=&#34;color:#f92672&#34;&gt;&amp;amp;&amp;amp;&lt;/span&gt; &lt;span style=&#34;color:#a6e22e&#34;&gt;pipe_has_writer&lt;/span&gt;(p)) {
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;    __asm__ &lt;span style=&#34;color:#66d9ef&#34;&gt;volatile&lt;/span&gt;(&lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;sti&amp;#34;&lt;/span&gt; &lt;span style=&#34;color:#f92672&#34;&gt;:::&lt;/span&gt; &lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;memory&amp;#34;&lt;/span&gt;);
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;    __asm__ &lt;span style=&#34;color:#a6e22e&#34;&gt;volatile&lt;/span&gt;(&lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;hlt&amp;#34;&lt;/span&gt; &lt;span style=&#34;color:#f92672&#34;&gt;:::&lt;/span&gt; &lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;memory&amp;#34;&lt;/span&gt;);
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;    __asm__ &lt;span style=&#34;color:#a6e22e&#34;&gt;volatile&lt;/span&gt;(&lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;cli&amp;#34;&lt;/span&gt; &lt;span style=&#34;color:#f92672&#34;&gt;:::&lt;/span&gt; &lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;memory&amp;#34;&lt;/span&gt;);
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;}
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#66d9ef&#34;&gt;if&lt;/span&gt; (&lt;span style=&#34;color:#a6e22e&#34;&gt;pipe_buf_empty&lt;/span&gt;(p)) &lt;span style=&#34;color:#66d9ef&#34;&gt;return&lt;/span&gt; &lt;span style=&#34;color:#ae81ff&#34;&gt;0&lt;/span&gt;;   &lt;span style=&#34;color:#75715e&#34;&gt;// 写端已关闭且无数据 → EOF
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;关键点：&lt;/p&gt;</description>
    </item>
    <item>
      <title>从零写OS（十）：系统调用，用户和内核的边界</title>
      <link>https://www.dafei.me/posts/os-10-syscall/</link>
      <pubDate>Wed, 06 May 2026 10:00:00 +0000</pubDate>
      <guid>https://www.dafei.me/posts/os-10-syscall/</guid>
      <description>&lt;p&gt;前几章的&amp;quot;进程&amp;quot;其实是假的——它们直接跑在内核态，和内核同等权限，可以随意读写任何内存、操作任何硬件。&lt;/p&gt;
&lt;p&gt;真实的操作系统里，用户程序跑在&lt;strong&gt;用户态&lt;/strong&gt;（Ring 3），权限受限，不能直接操作硬件。需要内核帮忙时，必须通过&lt;strong&gt;系统调用&lt;/strong&gt;这扇受控的门进入内核，做完事再回去。&lt;/p&gt;
&lt;p&gt;这一章实现 &lt;code&gt;syscall&lt;/code&gt; / &lt;code&gt;sysret&lt;/code&gt;：用户态和内核态之间最快速的切换机制。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id=&#34;两种特权级&#34;&gt;两种特权级&lt;/h2&gt;
&lt;p&gt;x86-64 有 4 个特权级（Ring 0～3），操作系统只用两个：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;Ring 0（内核态）&lt;/strong&gt;：可以执行任何指令，访问任何地址，操作 CR3、MSR 等特权寄存器&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Ring 3（用户态）&lt;/strong&gt;：不能执行特权指令，访问不属于自己的内存会触发 #GP 或 Page Fault&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;CS 段寄存器的低 2 位（&lt;strong&gt;CPL&lt;/strong&gt;，Current Privilege Level）表示当前特权级。&lt;code&gt;syscall&lt;/code&gt; 指令把 CPL 从 3 切到 0，&lt;code&gt;sysret&lt;/code&gt; 把 CPL 从 0 切回 3。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id=&#34;为什么用-syscall-而不是中断&#34;&gt;为什么用 syscall 而不是中断&lt;/h2&gt;
&lt;p&gt;早期 Linux 用 &lt;code&gt;int 0x80&lt;/code&gt; 触发系统调用——软件中断，要保存完整的中断栈帧，走 IDT 查表，开销大。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;syscall&lt;/code&gt; / &lt;code&gt;sysret&lt;/code&gt; 是专门为系统调用设计的快速路径：不走 IDT，入口地址直接写在 MSR 里，省去了大量压栈操作。现代 x86-64 系统全部用这对指令。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id=&#34;配置-msr&#34;&gt;配置 MSR&lt;/h2&gt;
&lt;p&gt;&lt;strong&gt;MSR&lt;/strong&gt;（Model Specific Register，型号特定寄存器，CPU 内部的一组控制寄存器，用 &lt;code&gt;rdmsr&lt;/code&gt; / &lt;code&gt;wrmsr&lt;/code&gt; 访问）控制 &lt;code&gt;syscall&lt;/code&gt; 的行为。需要配置 4 个：&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
