<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>OmniVoice on 大飞的博客</title>
    <link>https://www.dafei.me/tags/omnivoice/</link>
    <description>Recent content in OmniVoice on 大飞的博客</description>
    <generator>Hugo</generator>
    <language>zh-cn</language>
    <lastBuildDate>Mon, 25 May 2026 00:00:00 +0000</lastBuildDate>
    <atom:link href="https://www.dafei.me/tags/omnivoice/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>语音克隆（一）：用 OmniVoice 克隆任意声音</title>
      <link>https://www.dafei.me/posts/voice-01-omnivoice/</link>
      <pubDate>Mon, 25 May 2026 00:00:00 +0000</pubDate>
      <guid>https://www.dafei.me/posts/voice-01-omnivoice/</guid>
      <description>&lt;p&gt;想让 AI 用你的声音说话？只需要一段 3 到 10 秒的录音，OmniVoice 就能克隆你的声音，说出任意文字。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id=&#34;omnivoice-是什么&#34;&gt;OmniVoice 是什么&lt;/h2&gt;
&lt;p&gt;OmniVoice 是小米 / k2-fsa 团队开发的开源零样本 TTS 模型，支持 600+ 种语言，基于&lt;strong&gt;扩散语言模型&lt;/strong&gt;架构，推理速度极快（RTF 最低 0.025，比实时快 40 倍）。&lt;/p&gt;
&lt;p&gt;支持三种模式：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;语音克隆&lt;/strong&gt;：提供参考音频，克隆声音说出任意文字&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;语音设计&lt;/strong&gt;：用文字描述声音（性别、年龄、音调、口音等）&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;自动语音&lt;/strong&gt;：模型自动选择声音&lt;/li&gt;
&lt;/ul&gt;
&lt;hr&gt;
&lt;h2 id=&#34;环境准备&#34;&gt;环境准备&lt;/h2&gt;
&lt;h3 id=&#34;安装-conda-环境&#34;&gt;安装 conda 环境&lt;/h3&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;conda create -n omnivoice python&lt;span style=&#34;color:#f92672&#34;&gt;=&lt;/span&gt;3.11 -y
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;conda activate omnivoice
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;h3 id=&#34;安装-pytorch&#34;&gt;安装 PyTorch&lt;/h3&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#75715e&#34;&gt;# Apple Silicon&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;pip install torch&lt;span style=&#34;color:#f92672&#34;&gt;==&lt;/span&gt;2.8.0 torchaudio&lt;span style=&#34;color:#f92672&#34;&gt;==&lt;/span&gt;2.8.0
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#75715e&#34;&gt;# NVIDIA GPU（以 CUDA 12.8 为例）&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;pip install torch&lt;span style=&#34;color:#f92672&#34;&gt;==&lt;/span&gt;2.8.0+cu128 torchaudio&lt;span style=&#34;color:#f92672&#34;&gt;==&lt;/span&gt;2.8.0+cu128 --extra-index-url https://download.pytorch.org/whl/cu128
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;h3 id=&#34;安装-omnivoice&#34;&gt;安装 OmniVoice&lt;/h3&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;git clone https://github.com/k2-fsa/OmniVoice.git
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;cd OmniVoice
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;pip install -e .
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;hr&gt;
&lt;h2 id=&#34;下载模型&#34;&gt;下载模型&lt;/h2&gt;
&lt;p&gt;第一次运行会自动下载。如果在国内连不上 HuggingFace，设置镜像：&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
