<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>多模态 on 大飞的博客</title>
    <link>https://www.dafei.me/tags/%E5%A4%9A%E6%A8%A1%E6%80%81/</link>
    <description>Recent content in 多模态 on 大飞的博客</description>
    <generator>Hugo</generator>
    <language>zh-cn</language>
    <lastBuildDate>Tue, 02 Jun 2026 05:00:00 +0000</lastBuildDate>
    <atom:link href="https://www.dafei.me/tags/%E5%A4%9A%E6%A8%A1%E6%80%81/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>tclaw（五）：接入飞书、语音、图片</title>
      <link>https://www.dafei.me/posts/tclaw-05-im-multimodal/</link>
      <pubDate>Tue, 02 Jun 2026 05:00:00 +0000</pubDate>
      <guid>https://www.dafei.me/posts/tclaw-05-im-multimodal/</guid>
      <description>&lt;h2 id=&#34;让-ai-融入日常&#34;&gt;让 AI 融入日常&lt;/h2&gt;
&lt;p&gt;桌面应用之外，tclaw 还支持通过飞书和微信直接和 agent 对话。&lt;/p&gt;
&lt;h2 id=&#34;飞书&#34;&gt;飞书&lt;/h2&gt;
&lt;p&gt;飞书有开放平台，可以创建自己的机器人。tclaw 接入之后，在飞书里和 tclaw 对话，就相当于在桌面应用里聊天，但可以用手机。&lt;/p&gt;
&lt;p&gt;支持的能力：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;发文字消息，agent 回复&lt;/li&gt;
&lt;li&gt;发图片给 agent，agent 可以分析图片内容&lt;/li&gt;
&lt;li&gt;agent 可以把生成的图片发回飞书&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&#34;微信&#34;&gt;微信&lt;/h2&gt;
&lt;p&gt;微信这边不需要额外配置，在设置里开启微信，直接扫页面上的二维码登录，之后就可以在微信里和 agent 对话了。&lt;/p&gt;
&lt;p&gt;&lt;img alt=&#34;微信设置&#34; loading=&#34;lazy&#34; src=&#34;https://github.com/tongpengfei/tclaw-releases/raw/main/docs/screenshots/tclaw10_setting_wx.png&#34;&gt;&lt;/p&gt;
&lt;h2 id=&#34;图片输入与截图&#34;&gt;图片输入与截图&lt;/h2&gt;
&lt;p&gt;桌面端也补全了多模态能力：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;聊天框可以直接粘贴或拖入图片发给 agent&lt;/li&gt;
&lt;li&gt;内置截图工具，可以截当前屏幕，裁剪、标注之后直接发给 agent&lt;/li&gt;
&lt;li&gt;agent 可以调用图片生成工具，生成的图片直接显示在对话里&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&#34;图片生成&#34;&gt;图片生成&lt;/h2&gt;
&lt;p&gt;接了两个图片生成后端：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;Ollama&lt;/strong&gt;：本地跑，不花钱，速度慢一点&lt;/li&gt;
&lt;li&gt;外部 API：质量更好，按量计费&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;agent 可以在任务里直接调用图片生成，比如写完一篇文章顺手配一张封面图。&lt;/p&gt;
&lt;hr&gt;
&lt;blockquote&gt;
&lt;p&gt;tclaw 提供 Mac、Linux、Windows 版下载，Mac 版支持最好，感兴趣可以去 &lt;a href=&#34;https://github.com/tongpengfei/tclaw-releases&#34;&gt;tclaw-releases&lt;/a&gt; 体验。&lt;/p&gt;
&lt;p&gt;也可以先玩玩 tclaw 用 AI 做的几个小游戏：&lt;a href=&#34;https://www.dafei.me/games/&#34;&gt;→ 点这里玩&lt;/a&gt;&lt;/p&gt;
&lt;/blockquote&gt;</description>
    </item>
  </channel>
</rss>
