<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>用户态 on 大飞的博客</title>
    <link>https://www.dafei.me/tags/%E7%94%A8%E6%88%B7%E6%80%81/</link>
    <description>Recent content in 用户态 on 大飞的博客</description>
    <generator>Hugo</generator>
    <language>zh-cn</language>
    <lastBuildDate>Sat, 09 May 2026 00:00:00 +0000</lastBuildDate>
    <atom:link href="https://www.dafei.me/tags/%E7%94%A8%E6%88%B7%E6%80%81/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>从零写OS（十九）：exec 与用户程序</title>
      <link>https://www.dafei.me/posts/os-19-exec/</link>
      <pubDate>Sat, 09 May 2026 00:00:00 +0000</pubDate>
      <guid>https://www.dafei.me/posts/os-19-exec/</guid>
      <description>&lt;p&gt;之前所有代码都跑在内核态（ring0）。这一章第一次让用户程序在 ring3 里运行——加载 ELF 文件，跳到用户态执行，用户程序通过 syscall 和内核通信。&lt;/p&gt;
&lt;p&gt;这是操作系统最核心的一个边界：内核和用户程序之间的隔离。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id=&#34;exec-做什么&#34;&gt;exec 做什么&lt;/h2&gt;
&lt;p&gt;&lt;code&gt;exec&lt;/code&gt; 的语义是&amp;quot;用一个新程序替换当前进程&amp;quot;：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;从文件系统读 ELF 文件&lt;/li&gt;
&lt;li&gt;解析 ELF header，找到各个段的加载地址&lt;/li&gt;
&lt;li&gt;创建新的用户页表，把各段加载进去&lt;/li&gt;
&lt;li&gt;分配用户栈&lt;/li&gt;
&lt;li&gt;设置进程的 rip = 入口地址，rsp = 栈顶，cs/ss = 用户段，放入就绪队列&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;调度器下次选中这个进程，就会跳到用户态开始执行。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id=&#34;进入用户态iretq&#34;&gt;进入用户态：iretq&lt;/h2&gt;
&lt;p&gt;第一次进入用户态不能用 &lt;code&gt;sysret&lt;/code&gt;——没有对应的 &lt;code&gt;syscall&lt;/code&gt;。用 &lt;code&gt;iretq&lt;/code&gt;：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;&#34;&gt;&lt;code class=&#34;language-c&#34; data-lang=&#34;c&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#66d9ef&#34;&gt;static&lt;/span&gt; &lt;span style=&#34;color:#66d9ef&#34;&gt;void&lt;/span&gt; &lt;span style=&#34;color:#a6e22e&#34;&gt;enter_usermode&lt;/span&gt;(&lt;span style=&#34;color:#66d9ef&#34;&gt;uint64_t&lt;/span&gt; rip, &lt;span style=&#34;color:#66d9ef&#34;&gt;uint64_t&lt;/span&gt; cs,
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;                            &lt;span style=&#34;color:#66d9ef&#34;&gt;uint64_t&lt;/span&gt; rflags, &lt;span style=&#34;color:#66d9ef&#34;&gt;uint64_t&lt;/span&gt; rsp, &lt;span style=&#34;color:#66d9ef&#34;&gt;uint64_t&lt;/span&gt; ss) {
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;    __asm__ &lt;span style=&#34;color:#66d9ef&#34;&gt;volatile&lt;/span&gt;(
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;        &lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;push %4&lt;/span&gt;&lt;span style=&#34;color:#ae81ff&#34;&gt;\n&lt;/span&gt;&lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;&lt;/span&gt;   &lt;span style=&#34;color:#75715e&#34;&gt;// ss
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;        &lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;push %3&lt;/span&gt;&lt;span style=&#34;color:#ae81ff&#34;&gt;\n&lt;/span&gt;&lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;&lt;/span&gt;   &lt;span style=&#34;color:#75715e&#34;&gt;// rsp
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;        &lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;push %2&lt;/span&gt;&lt;span style=&#34;color:#ae81ff&#34;&gt;\n&lt;/span&gt;&lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;&lt;/span&gt;   &lt;span style=&#34;color:#75715e&#34;&gt;// rflags（IF=1，开中断）
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;        &lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;push %1&lt;/span&gt;&lt;span style=&#34;color:#ae81ff&#34;&gt;\n&lt;/span&gt;&lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;&lt;/span&gt;   &lt;span style=&#34;color:#75715e&#34;&gt;// cs（0x23，ring3 代码段）
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;        &lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;push %0&lt;/span&gt;&lt;span style=&#34;color:#ae81ff&#34;&gt;\n&lt;/span&gt;&lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;&lt;/span&gt;   &lt;span style=&#34;color:#75715e&#34;&gt;// rip（entry point）
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;        &lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;iretq&amp;#34;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;        &lt;span style=&#34;color:#f92672&#34;&gt;::&lt;/span&gt; &lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;r&amp;#34;&lt;/span&gt;(rip), &lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;r&amp;#34;&lt;/span&gt;(cs), &lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;r&amp;#34;&lt;/span&gt;(rflags), &lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;r&amp;#34;&lt;/span&gt;(rsp), &lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;r&amp;#34;&lt;/span&gt;(ss)
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;    );
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;}
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;&lt;code&gt;iretq&lt;/code&gt; 弹出这 5 个字段，CPU 检查 cs 的 RPL 发现是 ring3，自动完成特权级切换。&lt;/p&gt;</description>
    </item>
    <item>
      <title>从零写OS（十）：系统调用，用户和内核的边界</title>
      <link>https://www.dafei.me/posts/os-10-syscall/</link>
      <pubDate>Wed, 06 May 2026 10:00:00 +0000</pubDate>
      <guid>https://www.dafei.me/posts/os-10-syscall/</guid>
      <description>&lt;p&gt;前几章的&amp;quot;进程&amp;quot;其实是假的——它们直接跑在内核态，和内核同等权限，可以随意读写任何内存、操作任何硬件。&lt;/p&gt;
&lt;p&gt;真实的操作系统里，用户程序跑在&lt;strong&gt;用户态&lt;/strong&gt;（Ring 3），权限受限，不能直接操作硬件。需要内核帮忙时，必须通过&lt;strong&gt;系统调用&lt;/strong&gt;这扇受控的门进入内核，做完事再回去。&lt;/p&gt;
&lt;p&gt;这一章实现 &lt;code&gt;syscall&lt;/code&gt; / &lt;code&gt;sysret&lt;/code&gt;：用户态和内核态之间最快速的切换机制。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id=&#34;两种特权级&#34;&gt;两种特权级&lt;/h2&gt;
&lt;p&gt;x86-64 有 4 个特权级（Ring 0～3），操作系统只用两个：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;Ring 0（内核态）&lt;/strong&gt;：可以执行任何指令，访问任何地址，操作 CR3、MSR 等特权寄存器&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Ring 3（用户态）&lt;/strong&gt;：不能执行特权指令，访问不属于自己的内存会触发 #GP 或 Page Fault&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;CS 段寄存器的低 2 位（&lt;strong&gt;CPL&lt;/strong&gt;，Current Privilege Level）表示当前特权级。&lt;code&gt;syscall&lt;/code&gt; 指令把 CPL 从 3 切到 0，&lt;code&gt;sysret&lt;/code&gt; 把 CPL 从 0 切回 3。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id=&#34;为什么用-syscall-而不是中断&#34;&gt;为什么用 syscall 而不是中断&lt;/h2&gt;
&lt;p&gt;早期 Linux 用 &lt;code&gt;int 0x80&lt;/code&gt; 触发系统调用——软件中断，要保存完整的中断栈帧，走 IDT 查表，开销大。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;syscall&lt;/code&gt; / &lt;code&gt;sysret&lt;/code&gt; 是专门为系统调用设计的快速路径：不走 IDT，入口地址直接写在 MSR 里，省去了大量压栈操作。现代 x86-64 系统全部用这对指令。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id=&#34;配置-msr&#34;&gt;配置 MSR&lt;/h2&gt;
&lt;p&gt;&lt;strong&gt;MSR&lt;/strong&gt;（Model Specific Register，型号特定寄存器，CPU 内部的一组控制寄存器，用 &lt;code&gt;rdmsr&lt;/code&gt; / &lt;code&gt;wrmsr&lt;/code&gt; 访问）控制 &lt;code&gt;syscall&lt;/code&gt; 的行为。需要配置 4 个：&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
