画面をキャプチャして、
スクリーンショットをそのままAIエージェントへ
Screenshot to Agentは、AIエージェントのコンポーザーにスクリーンショットボタンを直接配置し、どこからでも画面の領域をつかめる設定可能なキーボードショートカットを提供します。ショートカットを押すかボタンをクリックし、必要な部分を枠で囲むだけで、画面キャプチャが次のメッセージに自動で添付されます。スクリーンショットはプロンプトの横に置かれ、そのままAIコーディングエージェントに届きます。
外部のスクリーンショットツールも、PNGをデスクトップに保存することも、ウィンドウにドラッグするためにファイルを探し回ることも不要。キャプチャ、保存、検索、配置という一連の手間を丸ごとスキップして、毎回数秒を節約できます。それこそが狙いです: あなたとエージェントの間の、より緊密で精度の高いコミュニケーション。
Screenshot to Agentの動作: キーボードショートカットを押し、画面の領域を枠で囲むと、キャプチャがAIエージェントのメッセージに自動添付されます。
Screenshot to Agentがなくす作業はこうです。AIエージェントとバイブコーディングをしていて、画面上の何かがおかしい。位置のずれたカード、間違った色、コンソールエラー、特定の幅で崩れるレイアウト。それをエージェントに見せるには、別のスクリーンショットツールを起動し、領域をドラッグし、PNGをどこかに保存し、そのファイルを探し、コンポーザーにドラッグします。5つの手順、コンテキストの切り替え、その間ずっとエージェントとの会話は止まったままです。
Screenshot to Agentは、そのすべてを1つの動作にまとめます。キーボードショートカットを押すとOS自身の領域選択ツールが現れ、枠をドラッグすると、スクリーンショットがキャプチャされてエージェントのコンポーザーに自動で添付されます。起動する外部アプリも、保存するファイルも、探すファイルも、ドラッグ&ドロップも不要。画面キャプチャはプロンプトの横に置かれ、送信準備が整っています。
同じことに対する2つの入口です。マウスにすでに手があるときのためのコンポーザー内のスクリーンショットボタンと、まずあちこちクリックすることなくどこからでも画面をつかみたいときのためのカスタマイズ可能なグローバルショートカット。どちらでも結果は同じ: スクリーンショットがメッセージに添付され、数秒でAIコーディングエージェントに向かいます。
スクリーンショットを送る2つの方法
手がマウスにあるときはボタン、キーボードにあるときはショートカット。結果は同じ。
コンポーザー内のスクリーンショットボタン
すべてのエージェントコンポーザーにはスクリーンショットボタンがあります。クリックするとOSの領域選択ツールが開き、画面の任意の部分を枠で囲めます。キャプチャは保存され、そのエージェントのコンポーザーにサムネイルとして添付され、送信準備が整います。すでにコンポーザーにいてマウスに手を伸ばすときの、自然な経路です。
設定可能なキーボードショートカット
グローバルキーボードショートカット(macOSではデフォルトでCmd+Shift+2、WindowsとLinuxではCtrl+Shift+2)は、AgentsRoomがフォーカスされたウィンドウでないときでも、どこからでも同じ領域キャプチャを起動します。スクリーンショットはアクティブなエージェントのコンポーザーに自動でルーティングされます。ショートカットは完全にカスタマイズ可能: 設定で好きな組み合わせに割り当て直したり、オフにしたりできます。

ショートカットまたはコンポーザーのボタンで画面の領域をキャプチャすると、スクリーンショットがAIエージェントのメッセージにサムネイルとして自動添付され、プロンプトと一緒に送信できます。
Screenshot to Agentがエージェントのワークフローに欠かせない理由
スピード。画面の領域をキャプチャしてエージェントの前に出すのは、かつては2つのアプリにまたがる5つの手順でした。今ではショートカット1つとドラッグだけです。スクリーンショットごとに数秒を節約でき、1日に何十回もエージェントにスクリーンショットを送ると、その秒数が積もって本物のフローになります。
精度。スクリーンショットは、段落で説明しようとする代わりに、あなたが見ているものをそのまま、ピクセル単位でエージェントに見せます。間違ったパディング、崩れた整列、隅にあるエラー。エージェントはあなたの説明の最善の試みではなく、本物の絵を受け取ります。
外部ツール不要。別のスクリーンショットアプリを開くことも、デスクトップをPNGファイルで散らかすことも、たった今撮った1枚をFinderで探し回ることもありません。キャプチャと添付は、AgentsRoomの内部で1つの動作として行われます。
フロー。ショートカットはどこからでも使え、スクリーンショットはプロンプトの横のコンポーザーに戻ってきます。ターミナルを離れることも、エージェントとの会話を中断することもなく、画面キャプチャと書いた指示が同じメッセージで一緒に届きます。
Screenshot to Agentの仕組み、最初から最後まで
キーボードショートカットから、エージェントのメッセージに添付されたスクリーンショットまで。
キャプチャを起動
どこからでもキーボードショートカット(デフォルトはCmd+Shift+2)を押すか、エージェントのコンポーザー内のスクリーンショットボタンをクリックします。どちらもまったく同じ領域キャプチャを開始します。
領域を枠で囲む
OS自身の領域選択ツールが引き継ぎます: macOSではscreencaptureによる十字カーソル、WindowsではSnipオーバーレイ、Linuxではgrim、spectacle、gnome-screenshot。画面の必要な部分を枠で囲みます。あなたがすでに知っているキャプチャUIです。
スクリーンショットが自動で添付される
キャプチャした領域はPNGとして保存され、ドラッグして入れたファイルとまったく同じように、フォーカス中のエージェントのコンポーザーにサムネイルとして直接配置されます。デスクトップへの保存も、ファイルの検索も、ドラッグ&ドロップも不要。すでにそこにあります。
それを取り囲むようにプロンプトを書く
いつものようにメッセージを入力します。必要なら言葉でキャプチャに言及してもいいし、添付したスクリーンショットに語らせてもかまいません。スクリーンショットは番号付きのファイルとしてコンポーザーに表示されるので、エージェントに明示的に指し示せます。
エージェントに送信
送信を押します。PNGは他の添付ファイルと同じパイプラインを通って、メッセージとともに送られます。画面キャプチャと書いた指示が、1つのターンでエージェントに一緒に届きます。
エージェントが画面を読む
AIコーディングエージェントはスクリーンショットを添付画像として受け取ります。モデルが画像入力に対応している限り、エージェントは画面に映っていたものをそのまま見て対応します。視覚的な問題を説明しようとする段落を解釈するのではなく。
Screenshot to Agentの実体
Screenshot to AgentはAgentsRoomデスクトップアプリに直接組み込まれた領域キャプチャのフローです。横付けされたスクリーンショットビューアではありません。OSのネイティブな領域選択ツール、つまりmacOSの同じscreencapture十字カーソル、Windowsの同じSnipオーバーレイ、Linuxの同じgrim、spectacle、gnome-screenshot、maim、scrot、flameshotにフックするので、キャプチャの体験はあなたがすでに使っているものそのままで、新しく学ぶことは何もありません。
2つのトリガー、コンポーザーのボタンとグローバルキーボードショートカットは、どちらも同じキャプチャを実行し、どちらも同じように終わります: スクリーンショットがフォーカス中のエージェントのコンポーザーに添付されます。ショートカットはグローバルなので、AgentsRoomがバックグラウンドにあるときでも発火し、完全に設定可能です。コンポーザーの設定から割り当て直したり無効にしたりでき、そこではショートカットレコーダーで望みどおりの組み合わせを正確に押せます。
キャプチャされると、PNGはローカルに保存され、コンポーザーのファイルトレイにサムネイルとして追加され、ドロップした任意のファイルと同じように参照番号が付きます。そこからは通常の経路をたどります: プロンプトとともに送られ、画像としてエージェントに送信されます。Screenshot to Agentは新しい送信メカニズムを発明するのではなく、すでにファイルをエージェントに届けているものに接続します。
すべてはあなたのマシン上にとどまります。キャプチャはホームディレクトリ内のローカルフォルダに保存され、プロジェクトのリポジトリ内にも、いかなるサードパーティのサービス上にも保存されず、自動的にクリーンアップされるので溜まることはありません。Screenshot to Agentはローカルで、プライベートで、プロバイダー非依存です: ただのPNGを添付するので、モデルが画像を受け付けるエージェントなら何でも読めます。つまりClaude CodeとCodexの構成は同じキャプチャからエージェントへのフローを得られます。これはデスクトップ機能で、macOS、Windows、Linuxで利用できます。
人々がエージェントにスクリーンショットを送る場面
スクリーンショットが説明の段落に勝る3つの瞬間。
視覚的またはUIのバグを見せる
崩れたインターフェース、ずれた要素、間違った余白、コンソールエラーをキャプチャして送ります。エージェントはあなたの説明を解読する代わりに、実際のバグを見ます。UIのリグレッションをAIコーディングエージェントに報告する最速の方法です。
画面上のものを指し示す
チャート、ターミナルの出力、差分、サードパーティのダッシュボードなど、画面に見えるものなら何でも。領域をキャプチャして、書かれていることを打ち直す代わりに、コンテキストとしてエージェントに渡します。スクリーンショットは、あなたの言葉が取りこぼす細部を運びます。
視覚的なリファレンスを渡す
合わせたいデザイン、気に入ったレイアウト、別のアプリのコンポーネント。リファレンスのスクリーンショットを撮って、ターゲットとしてエージェントに渡し、キャプチャしたものに向けて構築させます。
説明するか、ただスクリーンショットを撮るか
同じ画面、同じエージェント。一方は5つの手順の雑用、もう一方はショートカット1つ。
Screenshot to Agentなしの場合
- : 別のスクリーンショットツールを開き、領域をドラッグし、PNGをどこかに保存します。
- : そのファイルを探し、コンポーザーにドラッグ&ドロップします。
- : あるいは諦めて、視覚的な問題を言葉で説明しようとします。
- : コンテキストの切り替えがフローを断ち切り、エージェントとの会話を止めます。
- : スクリーンショットごとに、一日中ずっと同じ数秒のコストがかかります。
Screenshot to Agentありの場合
- : ショートカットを押すかボタンをクリックして枠をドラッグするだけ。1つの動作です。
- : スクリーンショットが自動でコンポーザーに添付されます。
- : 外部アプリも、保存ファイルも、検索も、ドラッグ&ドロップも不要。
- : AgentsRoomを離れることも、エージェントとのスレッドを断ち切ることもありません。
- : キャプチャとプロンプトが1つのターンでエージェントに一緒に届きます。
Screenshot to Agentは、画面に映っているものと、それを見られるAIエージェントとの間の最短経路です。
FAQ
AgentsRoomのScreenshot to Agentとは何ですか?
Screenshot to Agentは、画面の領域をキャプチャしてそのままAIコーディングエージェントに送信できる組み込み機能です。エージェントのコンポーザー内のスクリーンショットボタン、または設定可能なグローバルキーボードショートカットから起動し、OSの領域選択ツールで枠をドラッグすると、画面キャプチャが次のメッセージに自動添付されます。外部のスクリーンショットツールも、ファイルの移動も不要です。
AIエージェントにスクリーンショットを送るにはどうすればいいですか?
キーボードショートカット(デフォルトはCmd+Shift+2、WindowsとLinuxではCtrl+Shift+2)を押すか、コンポーザーのスクリーンショットボタンをクリックし、画面の必要な部分を枠で囲みます。スクリーンショットがキャプチャされ、エージェントのコンポーザーにサムネイルとして添付されます。プロンプトを書いて送信すれば、キャプチャがテキストと一緒にエージェントに届きます。
デフォルトのキーボードショートカットは何ですか。変更できますか?
デフォルトはmacOSでCmd+Shift+2、WindowsとLinuxでCtrl+Shift+2です。グローバルショートカットなので、AgentsRoomがフォーカスされたウィンドウでないときでも発火します。コンポーザーの設定で好きな組み合わせに割り当て直したり、完全にオフにしたりでき、そこではショートカットレコーダーで望みどおりのキーを正確に押せます。
AgentsRoomがバックグラウンドにあるときでも動作しますか?
はい。キーボードショートカットはグローバルに登録されているので、どのアプリからでも画面の領域をキャプチャでき、スクリーンショットはアクティブなAgentsRoomエージェントのコンポーザーにルーティングされます。先にウィンドウを前面に出す必要はありません。
外部のスクリーンショットツールは必要ですか?
いいえ、それこそが狙いです。Screenshot to AgentはOS自身の領域選択ツール(macOSのscreencapture、WindowsのSnipオーバーレイ、Linuxのgrim、spectacle、gnome-screenshot)を使い、結果を自動で添付します。別のスクリーンショットアプリを開くことも、PNGをデスクトップに保存することも、ファイルをウィンドウにドラッグすることもありません。
スクリーンショットはどこに保存されますか。プライベートですか?
キャプチャはあなた自身のマシンのホームディレクトリ内のローカルフォルダに保存されます。プロジェクトのリポジトリにコミットされることも、いかなるサードパーティのサービスにアップロードされることもありません。設計上一時的なもので、自動的にクリーンアップされるため、時間が経っても溜まることはありません。
Screenshot to Agentはどのエージェントやプロバイダーで動作しますか?
標準的なPNG画像を添付するので、プロバイダー非依存です。モデルが画像入力を受け付けるエージェントなら何でも動作します: Claude Code、Codex、そしてAgentsRoomが対応する他のCLI。プロバイダー固有の設定は不要です。
画面の一部だけをキャプチャできますか?
はい。領域選択ツールで画面の必要な部分だけを正確に枠で囲めるので、全画面キャプチャではなく関連する範囲だけを送れます。あなたがすでに知っているネイティブの選択UIで、キャプチャ時にトリミングできます。
送信前にスクリーンショットに注釈を加えられますか?
Screenshot to Agentは生のキャプチャを添付します。バグを丸で囲んだり、矢印を描いたり、領域をハイライトしたい場合は、コンポーザーの描画キャンバスであるSketchでキャプチャを開いて注釈を加えれば、マークアップ済みのバージョンがエージェントに届きます。Screenshot to Agentでキャプチャし、Sketchでマークアップ。
問題を説明する代わりにスクリーンショットを撮るのはなぜですか?
説明は推測ですが、スクリーンショットはそうではないからです。「右上のボタンの位置がずれている」と書くと、エージェントは頭の中であなたの画面を再構築しなければなりません。実際のキャプチャを送れば、再構築するものは何もありません。スクリーンショットは本物の視覚的な細部を運ぶので、エージェントはあなたが説明しようとする最善の試みではなく、あなたが見ているものに基づいて対応します。
相性のよい機能
Sketch
コンポーザー内の描画キャンバス。Screenshot to Agentで画面をキャプチャし、Sketchで開いて、送信前にバグを丸で囲んだり、矢印を描いたり、領域をハイライトできます。
音声ディクテーション
プロンプトを入力する代わりに口述します。話した指示と、たった今キャプチャしたスクリーンショットを組み合わせると、エージェントは両方を同時に受け取ります。
プロンプトライブラリ
最高のプロンプトを保存して再利用。保存したプロンプトを新しい画面キャプチャの横で発火させ、入力を丸ごとスキップできます。
スクラッチパッド
AgentsRoom内のプロンプトとメモ用のノートパッド。言葉を下書きし、スクリーンショットを添付して、コンテキスト全体をエージェントのコンポーザーに送ります。
PNGの保存をやめよう。ただスクリーンショットを撮るだけ。
AgentsRoomをダウンロードしてScreenshot to Agentを使いましょう: 画面の領域をキャプチャしてそのままAIコーディングエージェントに送るスクリーンショットボタンと設定可能なキーボードショートカット。外部のスクリーンショットツールも、ファイルの移動も不要です。
コンパニオンアプリ:外出先でもエージェントを確認
Claude、Codex、Gemini CLI、またはその他の AI プロバイダーを使用します。
バグや要望を公開バックログに直接送信できます。
実際の AgentsRoom の様子。