Screenshot to Agent: einen Bildschirmausschnitt erfassen und an Ihren KI-Agenten senden

Erfassen Sie Ihren Bildschirm,
senden Sie den Screenshot direkt an Ihren KI-Agenten

Screenshot to Agent platziert einen Screenshot-Button direkt im KI-Agent-Composer und gibt Ihnen ein konfigurierbares Tastenkuerzel, um von ueberall aus einen Bildschirmausschnitt zu erfassen. Druecken Sie das Kuerzel oder klicken Sie den Button, ziehen Sie ein Rechteck um das gewuenschte Element, und die Bildschirmaufnahme haengt sich an Ihre naechste Nachricht an. Der Screenshot landet direkt neben Ihrem Prompt und geht ohne Umweg an Ihren KI-Coding-Agenten.

Kein externes Screenshot-Tool, kein Speichern eines PNG auf dem Desktop, keine Suche nach der Datei, um sie ins Fenster zu ziehen. Sie ueberspringen den gesamten Tanz aus Erfassen, Speichern, Suchen und Ablegen und sparen jedes Mal ein paar Sekunden. Genau darum geht es: praezisere, hochwertigere Kommunikation zwischen Ihnen und Ihrem Agenten.

Screenshot to Agent in Aktion: das Tastenkuerzel druecken, ein Rechteck um den Bildschirmausschnitt ziehen, und die Aufnahme haengt sich automatisch an die Nachricht an Ihren KI-Agenten an.

Genau diesen Ablauf macht Screenshot to Agent ueberfluessig. Sie programmieren mit einem KI-Agenten und etwas auf dem Bildschirm stimmt nicht: eine verrutschte Karte, eine falsche Farbe, ein Konsolenfehler, ein Layout, das bei einer bestimmten Breite zerbricht. Um es dem Agenten zu zeigen, greifen Sie zu einem separaten Screenshot-Tool, ziehen einen Ausschnitt, speichern irgendwo ein PNG, suchen die Datei und ziehen sie dann in den Composer. Fuenf Schritte, ein Kontextwechsel, und die Unterhaltung mit Ihrem Agenten liegt die ganze Zeit auf Eis.

Screenshot to Agent fasst all das in einer einzigen Bewegung zusammen. Sie druecken ein Tastenkuerzel, das Auswahltool Ihres Betriebssystems erscheint, Sie ziehen ein Rechteck, und der Screenshot wird erfasst und automatisch an den Agent-Composer angehaengt. Keine externe App zum Oeffnen, keine Datei zum Speichern, keine Datei zum Suchen, kein Drag-and-drop. Die Bildschirmaufnahme liegt bereits neben Ihrem Prompt und ist bereit zum Senden.

Es sind zwei Wege zum selben Ziel. Ein Screenshot-Button im Composer, wenn Ihre Hand ohnehin schon an der Maus ist, und ein anpassbares globales Kuerzel, wenn Sie den Bildschirm von ueberall aus erfassen wollen, ohne erst herumzuklicken. So oder so ist das Ergebnis identisch: ein Screenshot, an Ihre Nachricht angehaengt, in Sekunden auf dem Weg zu Ihrem KI-Coding-Agenten.

Zwei Wege, einen Screenshot zu senden

Ein Button, wenn Ihre Hand an der Maus ist, ein Kuerzel, wenn sie an der Tastatur ist. Gleiches Ergebnis.

Der Screenshot-Button im Composer

Jeder Agent-Composer hat einen Screenshot-Button. Klicken Sie ihn an, und das Auswahltool Ihres Betriebssystems oeffnet sich, sodass Sie ein Rechteck um einen beliebigen Teil Ihres Bildschirms ziehen koennen. Die Aufnahme wird gespeichert und als Vorschaubild an den Composer dieses Agenten angehaengt, bereit zum Senden. Das ist der naheliegende Weg, wenn Sie ohnehin schon im Composer sind und zur Maus greifen.

Das konfigurierbare Tastenkuerzel

Ein globales Tastenkuerzel, standardmaessig Cmd+Shift+2 unter macOS (Ctrl+Shift+2 unter Windows und Linux), loest dieselbe Ausschnitt-Erfassung von ueberall aus, selbst wenn AgentsRoom nicht das aktive Fenster ist. Der Screenshot wird automatisch an den Composer Ihres aktiven Agenten weitergeleitet. Das Kuerzel ist vollstaendig anpassbar: Belegen Sie es in den Einstellungen mit einer beliebigen Kombination, oder schalten Sie es aus.

AgentsRoom Screenshot to Agent: ein Bildschirmausschnitt wird mit einem Auswahlrahmen und dem Kuerzel Cmd+Shift+2 erfasst und dann automatisch als Vorschaubild im KI-Agent-Composer neben dem Prompt angehaengt

Erfassen Sie einen Bildschirmausschnitt mit dem Kuerzel oder dem Composer-Button, und der Screenshot wird automatisch als Vorschaubild an die Nachricht an Ihren KI-Agenten angehaengt, bereit zum Senden mit Ihrem Prompt.

Warum Screenshot to Agent in Ihren Agent-Workflow gehoert

Tempo. Einen Bildschirmausschnitt zu erfassen und vor Ihren Agenten zu bringen, waren frueher fuenf Schritte ueber zwei Apps hinweg. Jetzt ist es ein Kuerzel und ein Ziehen. Sie sparen bei jedem Screenshot ein paar Sekunden, und wenn Sie dem Agenten dutzende Male am Tag etwas zeigen, summieren sich diese Sekunden zu echtem Flow.

Praezision. Ein Screenshot zeigt dem Agenten genau das, was Sie sehen, Pixel fuer Pixel, statt eines Absatzes, der es zu beschreiben versucht. Das falsche Padding, die kaputte Ausrichtung, der Fehler in der Ecke: Der Agent bekommt das echte Bild, nicht Ihren besten Versuch, es in Worte zu fassen.

Kein externes Tool. Sie oeffnen keine separate Screenshot-App, Sie uebersaeen Ihren Desktop nicht mit PNG-Dateien, Sie wuehlen sich nicht durch den Finder, um die gerade erstellte Aufnahme zu finden. Erfassen und Anhaengen passieren in einer einzigen Aktion, direkt in AgentsRoom.

Flow. Das Kuerzel funktioniert von ueberall, und der Screenshot kommt direkt neben Ihrem Prompt in den Composer zurueck. Sie verlassen das Terminal nie, Sie unterbrechen die Unterhaltung mit dem Agenten nie, und Ihre Bildschirmaufnahme und Ihre schriftlichen Anweisungen reisen gemeinsam in derselben Nachricht.

So funktioniert Screenshot to Agent, von Anfang bis Ende

Von einem Tastenkuerzel bis zu einem Screenshot, der an die Nachricht an Ihren Agenten angehaengt ist.

01

Die Erfassung ausloesen

Druecken Sie das Tastenkuerzel (standardmaessig Cmd+Shift+2) von ueberall aus, oder klicken Sie den Screenshot-Button im Agent-Composer. Beide starten exakt dieselbe Ausschnitt-Erfassung.

02

Ein Rechteck um den Ausschnitt ziehen

Das Auswahltool Ihres eigenen Betriebssystems uebernimmt: ein Fadenkreuz unter macOS via screencapture, das Snip-Overlay unter Windows, grim, spectacle oder gnome-screenshot unter Linux. Ziehen Sie ein Rechteck um den gewuenschten Teil des Bildschirms. Es ist die Erfassungsoberflaeche, die Sie ohnehin schon kennen.

03

Der Screenshot haengt sich selbst an

Der erfasste Ausschnitt wird als PNG gespeichert und direkt als Vorschaubild in den Composer des aktiven Agenten abgelegt, genau wie eine Datei, die Sie hineingezogen haben. Kein Speichern auf dem Desktop, kein Suchen der Datei, kein Drag-and-drop. Er ist bereits da.

04

Ihren Prompt darum herum schreiben

Tippen Sie Ihre Nachricht wie gewohnt. Verweisen Sie in Ihren Worten auf die Aufnahme, wenn Sie moechten, oder lassen Sie einfach den angehaengten Screenshot fuer sich sprechen. Der Screenshot erscheint als nummerierte Datei im Composer, sodass Sie den Agenten gezielt darauf hinweisen koennen.

05

An den Agenten senden

Druecken Sie auf Senden. Das PNG geht mit Ihrer Nachricht ueber dieselbe Pipeline wie jeder andere Anhang hinaus. Ihre Bildschirmaufnahme und Ihre schriftlichen Anweisungen erreichen den Agenten gemeinsam, in einem einzigen Zug.

06

Der Agent liest Ihren Bildschirm

Ihr KI-Coding-Agent erhaelt den Screenshot als angehaengtes Bild. Solange sein Modell Bildeingaben akzeptiert, sieht er genau das, was auf Ihrem Bildschirm war, und handelt danach, statt einen Absatz zu zerlegen, der ein visuelles Problem zu beschreiben versucht.

Was Screenshot to Agent wirklich ist

Screenshot to Agent ist ein Ausschnitt-Erfassungsablauf, der direkt in die AgentsRoom Desktop-App verdrahtet ist. Es ist kein Screenshot-Viewer, der nebenbei angeschraubt wurde. Es klinkt sich in das native Auswahltool Ihres Betriebssystems ein, dasselbe screencapture-Fadenkreuz unter macOS, dasselbe Snip-Overlay unter Windows, dieselben grim-, spectacle-, gnome-screenshot-, maim-, scrot- oder flameshot-Tools unter Linux, sodass die Erfassung genauso ablaeuft, wie Sie es ohnehin gewohnt sind, ohne etwas Neues zu lernen.

Die beiden Ausloeser, der Composer-Button und das globale Tastenkuerzel, fuehren beide dieselbe Erfassung aus und enden beide gleich: Der Screenshot wird an den Composer des aktiven Agenten angehaengt. Das Kuerzel ist global, sodass es selbst dann ausloest, wenn AgentsRoom im Hintergrund laeuft, und es ist vollstaendig konfigurierbar. Sie belegen es neu oder deaktivieren es in den Composer-Einstellungen, wo ein Kuerzel-Recorder Sie genau die gewuenschte Kombination druecken laesst.

Einmal erfasst, wird das PNG lokal gespeichert und als Vorschaubild zur Dateileiste des Composers hinzugefuegt, wo es wie jede abgelegte Datei eine Referenznummer erhaelt. Von dort folgt es dem normalen Weg: Es geht mit Ihrem Prompt hinaus und wird als Bild an den Agenten gesendet. Screenshot to Agent erfindet keinen neuen Sendemechanismus, es klinkt sich in den ein, der ohnehin schon Dateien an Ihren Agenten uebertraegt.

Alles bleibt auf Ihrem Rechner. Aufnahmen werden in einem lokalen Ordner in Ihrem Home-Verzeichnis gespeichert, nicht in Ihrem Projekt-Repo und nicht auf einem Drittanbieterdienst, und sie werden automatisch aufgeraeumt, damit sie sich nie ansammeln. Screenshot to Agent ist lokal, privat und provider-agnostisch: Es haengt ein einfaches PNG an, sodass jeder Agent, dessen Modell ein Bild akzeptiert, es lesen kann. Das bedeutet, dass Claude Code- und Codex-Setups denselben Ablauf von der Erfassung bis zum Agenten erhalten. Es ist ein Desktop-Feature, verfuegbar unter macOS, Windows und Linux.

Was Nutzer ihrem Agenten als Screenshot schicken

Drei Momente, in denen ein Screenshot besser ist als ein Absatz Beschreibung.

Einen visuellen oder UI-Bug zeigen

Erfassen Sie die kaputte Oberflaeche, das verrutschte Element, den falschen Abstand, den Konsolenfehler, und senden Sie es. Der Agent sieht den tatsaechlichen Bug, statt Ihre Beschreibung davon zu entschluesseln. Der schnellste Weg, einer KI-Coding-Agenten eine UI-Regression zu melden.

Auf das zeigen, was auf dem Bildschirm ist

Ein Diagramm, eine Terminalausgabe, ein Diff, ein Drittanbieter-Dashboard, alles, was auf Ihrem Bildschirm sichtbar ist. Erfassen Sie den Ausschnitt und reichen Sie ihn dem Agenten als Kontext, statt erneut abzutippen, was dort steht. Der Screenshot traegt das Detail, das Ihre Worte verlieren wuerden.

Eine visuelle Referenz uebergeben

Ein Design, an dem Sie sich orientieren, ein Layout, das Ihnen gefaellt, eine Komponente aus einer anderen App. Erstellen Sie einen Screenshot der Referenz und geben Sie ihn dem Agenten als Vorlage, dann lassen Sie ihn darauf hinarbeiten, was Sie erfasst haben.

Beschreiben Sie es, oder machen Sie einfach einen Screenshot

Gleicher Bildschirm, gleicher Agent. Der eine Weg ist eine Arbeit in fuenf Schritten, der andere ist ein Tastenkuerzel.

Ohne Screenshot to Agent

  • : Sie oeffnen ein separates Screenshot-Tool, ziehen einen Ausschnitt und speichern irgendwo ein PNG.
  • : Sie suchen diese Datei, dann ziehen Sie sie per Drag-and-drop in den Composer.
  • : Oder Sie geben auf und versuchen, das visuelle Problem in Worten zu beschreiben.
  • : Der Kontextwechsel zerstoert Ihren Flow und legt die Unterhaltung mit dem Agenten auf Eis.
  • : Jeder Screenshot kostet Sie dieselben paar Sekunden, den ganzen Tag lang.

Mit Screenshot to Agent

  • : Sie druecken das Kuerzel oder klicken den Button und ziehen ein Rechteck. Eine Bewegung.
  • : Der Screenshot haengt sich automatisch an den Composer an.
  • : Keine externe App, keine gespeicherte Datei, kein Suchen, kein Drag-and-drop.
  • : Sie verlassen AgentsRoom nie und unterbrechen den Faden mit dem Agenten nie.
  • : Die Aufnahme und Ihr Prompt erreichen den Agenten gemeinsam, in einem Zug.

Screenshot to Agent ist der kuerzeste Weg zwischen dem, was auf Ihrem Bildschirm ist, und einem KI-Agenten, der es sehen kann.

Lokal und privat
Ihre Screenshots werden auf Ihrem eigenen Rechner in Ihrem Home-Ordner gespeichert, nie in Ihr Repo committet und nie an einen Drittanbieter-Screenshot-Dienst gesendet. Alte Aufnahmen werden automatisch aufgeraeumt.
Funktioniert mit jedem Provider
Screenshot to Agent haengt ein einfaches PNG an. Jeder KI-Agent, dessen Modell Bildeingaben akzeptiert, kann es lesen: Claude Code, Codex und darueber hinaus. Es gibt keine provider-spezifische Einrichtung.
Kein Kontextwechsel
Die Erfassung wird ueber einen Button oder ein globales Kuerzel ausgeloest, und der Screenshot kommt in den Composer zurueck. Sie bleiben im Terminal, und die Unterhaltung mit dem Agenten reisst nie ab.

FAQ

Was ist Screenshot to Agent in AgentsRoom?

Screenshot to Agent ist eine eingebaute Moeglichkeit, einen Ausschnitt Ihres Bildschirms zu erfassen und direkt an Ihren KI-Coding-Agenten zu senden. Sie loesen es ueber einen Screenshot-Button im Agent-Composer oder ueber ein konfigurierbares globales Tastenkuerzel aus, ziehen mit dem Auswahltool Ihres Betriebssystems ein Rechteck, und die Bildschirmaufnahme wird automatisch an Ihre naechste Nachricht angehaengt. Kein externes Screenshot-Tool und kein Verschieben von Dateien.

Wie sende ich einen Screenshot an einen KI-Agenten?

Druecken Sie das Tastenkuerzel (standardmaessig Cmd+Shift+2, Ctrl+Shift+2 unter Windows und Linux) oder klicken Sie den Screenshot-Button im Composer, dann ziehen Sie ein Rechteck um den gewuenschten Teil Ihres Bildschirms. Der Screenshot wird erfasst und als Vorschaubild an den Agent-Composer angehaengt. Schreiben Sie Ihren Prompt und senden Sie ihn: Die Aufnahme geht gemeinsam mit Ihrem Text an den Agenten.

Was ist das Standard-Tastenkuerzel, und kann ich es aendern?

Der Standard ist Cmd+Shift+2 unter macOS und Ctrl+Shift+2 unter Windows und Linux. Es ist ein globales Kuerzel, sodass es selbst dann ausloest, wenn AgentsRoom nicht das aktive Fenster ist. Sie koennen es in den Composer-Einstellungen mit einer beliebigen Kombination neu belegen oder ganz abschalten, wo ein Kuerzel-Recorder Sie genau die gewuenschten Tasten druecken laesst.

Funktioniert es, wenn AgentsRoom im Hintergrund laeuft?

Ja. Das Tastenkuerzel ist global registriert, sodass Sie aus jeder App heraus einen Bildschirmausschnitt erfassen koennen und der Screenshot an den Composer Ihres aktiven AgentsRoom-Agenten weitergeleitet wird. Sie muessen das Fenster nicht erst in den Vordergrund holen.

Brauche ich ein externes Screenshot-Tool?

Nein, genau darum geht es. Screenshot to Agent nutzt das eigene Auswahltool Ihres Betriebssystems (screencapture unter macOS, das Snip-Overlay unter Windows, grim, spectacle oder gnome-screenshot unter Linux) und haengt das Ergebnis fuer Sie an. Sie oeffnen keine separate Screenshot-App, Sie speichern kein PNG auf dem Desktop, und Sie ziehen keine Datei ins Fenster.

Wo werden meine Screenshots gespeichert? Sind sie privat?

Aufnahmen werden in einem lokalen Ordner in Ihrem Home-Verzeichnis auf Ihrem eigenen Rechner gespeichert. Sie werden nicht in Ihr Projekt-Repo committet und nicht auf einen Drittanbieterdienst hochgeladen. Sie sind von Natur aus fluechtig und werden automatisch aufgeraeumt, sodass sie sich mit der Zeit nicht ansammeln.

Welche Agenten und Provider funktionieren mit Screenshot to Agent?

Es haengt ein standardmaessiges PNG-Bild an, ist also provider-agnostisch. Jeder Agent, dessen Modell Bildeingaben akzeptiert, funktioniert: Claude Code, Codex und die anderen CLIs, die AgentsRoom unterstuetzt. Es gibt keine provider-spezifische Konfiguration.

Kann ich nur einen Teil des Bildschirms erfassen?

Ja. Mit dem Auswahltool ziehen Sie ein Rechteck um genau den Teil des Bildschirms, den Sie moechten, sodass Sie nur den relevanten Bereich senden statt einer Vollbildaufnahme. Sie schneiden bereits beim Erfassen zu, mit der nativen Auswahloberflaeche, die Sie ohnehin kennen.

Kann ich den Screenshot vor dem Senden annotieren?

Screenshot to Agent haengt die rohe Aufnahme an. Wenn Sie einen Bug einkreisen, einen Pfeil zeichnen oder einen Bereich hervorheben moechten, oeffnen Sie die Aufnahme in Sketch, der Zeichenflaeche im Composer, annotieren sie, und die markierte Version geht an den Agenten. Erfassen mit Screenshot to Agent, markieren mit Sketch.

Warum das Problem als Screenshot schicken, statt es zu beschreiben?

Weil eine Beschreibung eine Vermutung ist und ein Screenshot nicht. Wenn Sie schreiben 'der Button oben rechts ist verrutscht', muss der Agent Ihren Bildschirm im Kopf rekonstruieren. Wenn Sie die tatsaechliche Aufnahme senden, gibt es nichts zu rekonstruieren. Ein Screenshot traegt das echte visuelle Detail, sodass der Agent nach dem handelt, was Sie sehen, statt nach Ihrem besten Versuch, es zu beschreiben.

Passt gut zu

Schluss mit dem Speichern von PNGs. Machen Sie einfach einen Screenshot.

Laden Sie AgentsRoom herunter und nutzen Sie Screenshot to Agent: ein Screenshot-Button und ein konfigurierbares Tastenkuerzel, die einen Bildschirmausschnitt erfassen und direkt an Ihren KI-Coding-Agenten senden, ohne externes Screenshot-Tool und ohne Verschieben von Dateien.

KostenlosAgentsRoom herunterladen

Companion-App: Agenten auch unterwegs im Blick behalten

Nutzen Sie Claude, Codex, Gemini CLI oder einen anderen AI-Anbieter.

Erweiterung installieren
Chrome Web Store

Bugs und Wünsche direkt in dein öffentliches Backlog schicken.

Ein Blick auf AgentsRoom in Aktion.

Multi-Projekte
Multi-Provider
Multi-Agenten
Live-Status
Diff & Commit
Mobile App
Live-Vorschau
Agent-Teams
Browser-Tests
Backlog-getriebene Entwicklung
Prompt-Bibliothek
Skills-Bibliothek
Alle Funktionen ansehen