截下你的屏幕,
把截图直接送到你的 AI 代理面前
截图发给代理在 AI 代理输入框里放了一个截图按钮,还给你一个可自定义的快捷键,让你从任何地方抓取屏幕区域。按下快捷键或点一下按钮,框选你想要的部分,截图就附加到你的下一条消息上。截图落在提示词旁边,直接送到你的 AI 编码代理那里。
无需外部截图工具,无需把 PNG 存到桌面,无需翻找文件再拖进窗口。你跳过了整套截图、保存、定位、拖放的折腾,每一次都省下几秒钟,而这正是关键所在:让你和代理之间的沟通更紧凑、更精准。
截图发给代理实战:按下快捷键,框选屏幕区域,截图就自动附加到你的 AI 代理消息上。
这就是截图发给代理要终结的流程。你正在和 AI 代理一起做 vibe coding,屏幕上有些地方不对劲:一张卡片错位、一个颜色不对、控制台报错、某个宽度下布局崩了。为了让代理看到,你打开一个单独的截图工具,框选一块区域,把 PNG 存到某处,找到那个文件,再拖进输入框。五个步骤,一次上下文切换,而这整个过程里和代理的对话一直被搁置。
截图发给代理把这一切压缩成一个动作。你按下快捷键,操作系统自带的区域选择器出现,你框一个范围,截图就被抓取并自动附加到代理输入框。没有外部应用要打开,没有文件要保存,没有文件要定位,没有拖放。截图就在你的提示词旁边,随时可以发送。
同一件事,两个入口。手已经放在鼠标上时,用输入框里的截图按钮;想从任何地方抓取屏幕、又不想先点来点去时,用可自定义的全局快捷键。无论哪种方式,结果都一样:一张截图附在你的消息上,几秒钟内就在去往你 AI 编码代理的路上。
发送截图的两种方式
手在鼠标上时用按钮,手在键盘上时用快捷键。结果一样。
输入框里的截图按钮
每个代理输入框都有一个截图按钮。点一下,操作系统的区域选择器就打开,让你框选屏幕的任意部分。截图被保存并以缩略图形式附加到那个代理的输入框,随时可发。当你已经在输入框里、手正伸向鼠标时,这是最自然的路径。
可自定义的快捷键
一个全局快捷键,macOS 上默认 Cmd+Shift+2(Windows 和 Linux 上为 Ctrl+Shift+2),从任何地方都能触发同样的区域捕捉,哪怕 AgentsRoom 不是当前焦点窗口。截图会自动路由到你当前活跃代理的输入框。快捷键完全可自定义:在设置里把它改成你喜欢的任意组合,或者关掉它。

用快捷键或输入框按钮框选一块屏幕区域,截图就作为缩略图自动附加到你的 AI 代理消息上,随提示词一起发送。
截图发给代理为什么该出现在你的代理工作流里
速度。捕捉一块屏幕区域并送到代理面前,过去要在两个应用之间走五个步骤。现在只要一个快捷键加一次框选。每张截图都省下几秒钟,而当你一天截图给代理几十次时,这些秒数累加起来就是实实在在的顺畅。
精准。一张截图把你所见原样展示给代理,一个像素都不差,而不是用一段文字努力去描述。错误的内边距、错位的对齐、角落里的报错,代理拿到的是真实画面,而不是你尽力叙述出来的版本。
无需外部工具。你不用打开单独的截图应用,不用让桌面堆满 PNG 文件,不用在 Finder 里翻找刚截的那一张。捕捉和附加在 AgentsRoom 内一个动作里完成。
顺畅。快捷键从任何地方都能用,截图会回到提示词旁边的输入框里。你从不离开终端,从不打断和代理的对话,你的截图和文字指令一起装进同一条消息。
截图发给代理如何运作,从头到尾
从一个快捷键,到一张附在代理消息上的截图。
触发捕捉
从任何地方按下快捷键(默认 Cmd+Shift+2),或点击代理输入框里的截图按钮。两者启动的是完全相同的区域捕捉。
框选区域
操作系统自带的区域选择器接手:macOS 上通过 screencapture 的十字光标,Windows 上的截图覆盖层,Linux 上的 grim、spectacle 或 gnome-screenshot。框选你想要的那部分屏幕。这就是你早已熟悉的捕捉界面。
截图自动附加
捕捉到的区域被保存为 PNG,并以缩略图形式直接落进当前焦点代理的输入框,就像你拖进去的文件一样。无需存到桌面,无需定位文件,无需拖放。它已经在那里了。
围绕它写你的提示词
像往常一样输入你的消息。愿意的话可以在文字里引用这张截图,或者干脆让附上的截图自己说明问题。截图在输入框里显示为带编号的文件,所以你可以明确地让代理去看它。
发送给代理
点发送。PNG 通过和其他附件完全相同的通道随消息发出。你的截图和文字指令一起、在同一轮里到达代理。
代理读懂你的屏幕
你的 AI 编码代理把截图当作一张附加图片接收。只要它的模型支持图片输入,它就能看到你屏幕上原样的内容并据此行动,而不是去解析一段试图描述视觉问题的文字。
截图发给代理究竟是什么
截图发给代理是一套区域捕捉流程,直接接进 AgentsRoom 桌面应用。它不是外挂在旁边的截图查看器。它接入你操作系统原生的区域选择器:macOS 上同样的 screencapture 十字光标,Windows 上同样的截图覆盖层,Linux 上同样的 grim、spectacle、gnome-screenshot、maim、scrot 或 flameshot 工具,所以捕捉体验就是你早已在用的那一套,没有任何新东西要学。
两个触发方式,输入框按钮和全局快捷键,跑的是同一套捕捉,结尾也一样:截图被附加到当前焦点代理的输入框。快捷键是全局的,所以哪怕 AgentsRoom 在后台它也会触发,而且完全可配置。你可以在输入框设置里重新绑定或禁用它,那里有一个快捷键录制器,让你按下你想要的确切组合。
捕捉之后,PNG 会保存在本地,并作为缩略图加入输入框的文件托盘,像任何拖进来的文件一样拿到一个引用编号。从这里开始它走的是常规路径:随你的提示词一起发出,作为图片发给代理。截图发给代理没有发明新的发送机制,它接进了那条早已把文件送往你代理的通道。
一切都留在你的机器上。截图保存在你主目录下的本地文件夹里,不在你的项目仓库内,也不在任何第三方服务上,而且会自动清理,所以永远不会堆积。截图发给代理是本地的、私密的、与提供商无关的:它附加的是一张普通 PNG,所以任何模型支持图片的代理都能读它,这意味着 Claude Code 和 Codex 配置都能用上同样的捕捉到代理流程。这是一个桌面功能,在 macOS、Windows 和 Linux 上都可用。
人们都把什么截图发给代理
三个时刻,截图胜过一段描述。
展示视觉或界面 bug
捕捉坏掉的界面、错位的元素、错误的间距、控制台报错,然后发送。代理看到的是真实的 bug,而不是去解码你对它的描述。这是向 AI 编码代理报告界面回归问题最快的方式。
指向屏幕上的内容
一张图表、一段终端输出、一个 diff、一个第三方仪表盘,任何屏幕上可见的东西。捕捉那块区域,把它作为上下文交给代理,而不是把内容重新打一遍。截图带上了你文字会丢掉的细节。
传递一个视觉参考
你想要对齐的一个设计、你喜欢的一个布局、另一个应用里的一个组件。把参考截下来,作为目标交给代理,让它朝着你截下的样子去构建。
去描述它,还是直接截图
同一块屏幕,同一个代理。一条路是五步苦差,另一条只是一个快捷键。
没有截图发给代理
- : 你打开一个单独的截图工具,框选一块区域,把 PNG 存到某处。
- : 你翻找那个文件,再把它拖进输入框。
- : 或者你干脆放弃,试着用文字描述视觉问题。
- : 上下文切换打断了你的节奏,也让和代理的对话暂停。
- : 每张截图都让你付出同样的几秒钟,一整天都是如此。
有了截图发给代理
- : 你按下快捷键或点击按钮,框选一个范围。一个动作。
- : 截图自动附加到输入框。
- : 没有外部应用,没有保存的文件,没有定位,没有拖放。
- : 你从不离开 AgentsRoom,从不打断与代理的对话。
- : 截图和你的提示词一起、在同一轮里到达代理。
截图发给代理,是你屏幕上的内容与一个看得见它的 AI 代理之间最短的路径。
FAQ
AgentsRoom 里的截图发给代理是什么?
截图发给代理是一种内置的方式,让你捕捉一块屏幕区域并直接发给你的 AI 编码代理。你通过代理输入框里的截图按钮或一个可自定义的全局快捷键触发它,用操作系统的区域选择器框一个范围,截图就自动附加到你的下一条消息上。无需外部截图工具,无需搬动文件。
我要怎么把截图发给 AI 代理?
按下快捷键(默认 Cmd+Shift+2,Windows 和 Linux 上为 Ctrl+Shift+2),或点击输入框里的截图按钮,然后框选你想要的那部分屏幕。截图被捕捉并以缩略图形式附加到代理输入框。写下你的提示词并发送:截图会和你的文字一起送到代理那里。
默认快捷键是什么,我能改吗?
默认在 macOS 上是 Cmd+Shift+2,在 Windows 和 Linux 上是 Ctrl+Shift+2。它是一个全局快捷键,所以哪怕 AgentsRoom 不是焦点窗口它也会触发。你可以在输入框设置里把它重新绑定成任意组合,或者彻底关掉它,那里有一个快捷键录制器,让你按下你想要的确切按键。
AgentsRoom 在后台时它也能用吗?
可以。键盘快捷键是全局注册的,所以你能从任何应用里捕捉一块屏幕区域,截图会被路由到你当前活跃的 AgentsRoom 代理的输入框。你不必先把窗口切到前台。
我需要一个外部截图工具吗?
不需要,这正是关键所在。截图发给代理用的是你操作系统自带的区域选择器(macOS 上的 screencapture、Windows 上的截图覆盖层、Linux 上的 grim、spectacle 或 gnome-screenshot),并帮你把结果附上。你不用打开单独的截图应用,不用把 PNG 存到桌面,也不用把文件拖进窗口。
我的截图保存在哪里?它们私密吗?
截图保存在你自己机器主目录下的本地文件夹里。它们不会提交到你的项目仓库,也不会上传到任何第三方服务。它们在设计上就是临时的,会被自动清理,所以不会随时间堆积。
哪些代理和提供商能配合截图发给代理使用?
它附加的是一张标准 PNG 图片,所以与提供商无关。任何模型支持图片输入的代理都能用:Claude Code、Codex,以及 AgentsRoom 支持的其他 CLI。没有针对特定提供商的配置要做。
我可以只截屏幕的一部分吗?
可以。区域选择器让你正好框选你想要的那部分屏幕,所以你发送的只是相关区域,而不是整屏截图。你在捕捉时就裁剪好了,用的是你早已熟悉的原生选区界面。
发送前我能给截图加标注吗?
截图发给代理附加的是原始捕捉。如果你想在上面圈出一个 bug、画一个箭头或高亮一块区域,就在 Sketch 里打开这张截图,那是输入框里的绘图画布,标注完成后,带标记的版本就会发给代理。用截图发给代理捕捉,用 Sketch 标注。
为什么要把问题截图,而不是描述它?
因为描述是猜测,截图不是。当你写下「右上角的按钮错位了」,代理得在脑子里重建你的屏幕。当你发送真实的截图,就没有什么要重建的了。一张截图带上了真实的视觉细节,所以代理是根据你所见行动,而不是根据你尽力叙述的版本。
搭配使用更佳
别再存 PNG 了。直接截图。
下载 AgentsRoom,用上截图发给代理:一个截图按钮加一个可自定义的快捷键,框选一块屏幕区域并直接发给你的 AI 编码代理,无需外部截图工具,无需搬动文件。
配套应用:随时随地监控你的 Agent
使用 Claude、Codex、Gemini CLI 或其他 AI 提供商。
把 Bug 和需求直接发送到您的公开待办清单。
AgentsRoom 实际运行一瞥。