Mit KI-Coding-Agenten kommunizieren: Claude, Codex, Gemini, Grok Build
Code ist nicht mehr der Flaschenhals, Kommunikation ist es. Wie du mit deinen KI-Agenten Claude, Codex, Gemini und Grok Build redest, um schneller und präziser zu liefern und Tokens zu sparen.
Ehrliche Frage: Bei deinem letzten Feature, wie viel Zeit hast du damit verbracht, Code zu schreiben, und wie viel damit, einem Agenten zu erklären, was du willst? Wenn du mit Claude Code, Codex, Gemini CLI oder Grok Build arbeitest, hat sich das Verhältnis umgekehrt. Du tippst kaum noch. Du beschreibst, korrigierst, genehmigst.
Das ist der eigentliche Wandel im Job. Der Flaschenhals ist nicht mehr die Tippgeschwindigkeit oder das Framework-Know-how. Der Flaschenhals ist die Qualität der Kommunikation zwischen dir und deinen Agenten.
Code ist nicht mehr der Flaschenhals, Kommunikation ist es
Zwanzig Jahre lang war ein guter Entwickler jemand, der sauberen Code schnell lieferte. Heute liefert der Agent den Code. Was dich unterscheidet, ist deine Fähigkeit, beim ersten Versuch das richtige Ergebnis zu bekommen, zum niedrigsten Preis.
Gestern Heute
┌────────────────┐ ┌────────────────┐
│ Write the code │ ~80% of time │ Describe the │ ~80% of time
│ │ │ intent │
└───────┬────────┘ └───────┬────────┘
│ │
┌───────▼────────┐ ┌───────▼────────┐
│ Describe the │ ~20% of time │ Agent writes │ ~20% of time
│ intent │ │ the code │
└────────────────┘ └────────────────┘
Bottleneck: typing Bottleneck: communication
Konkret: Der gute Entwickler von heute ist nicht derjenige, der die meisten Zeilen schreibt. Es ist derjenige, der liefert:
- Schneller: weniger Runden, bis das erwartete Ergebnis da ist.
- Präziser: der Agent macht genau das, was verlangt wurde, nicht seine eigene Interpretation davon.
- Token-sparsamer: jede unnötige Runde, jedes schlecht gerahmte Kontext-Reload kostet Tokens, also Geld und Latenz.
- Mit weniger Regressionen: eine klare Absicht produziert ein sauberes Diff, kein wildes Rewrite, das drei andere Dinge kaputt macht.
Ein vager Prompt und ein präziser Prompt kosten nicht dasselbe:
Vague prompt Precise prompt
"fix the cart bug" "In cart.ts, computeTotal()
applies the discount before VAT.
Flip the order: VAT first,
then discount on the net total."
│ │
▼ ▼
3 round trips 1 pass
~45k tokens ~12k tokens
2 regressions 0 regression
Darum geht es bei AgentsRoom: eine Absicht in eine umsetzbare Anweisung umwandeln, so schnell wie möglich, im richtigen Format, ohne den Kontext zu wiederholen. Hier sind die Bausteine, die genau dafür gemacht wurden.
1. Persistenter Kontext: CLAUDE.md und AGENTS.md
Bevor deine Agenten die erste Nachricht erhalten, müssen sie wissen, wo sie stehen: Konventionen, Architektur, Fallstricke des Projekts. Alles, was du nicht jede Session neu erklären willst. Das ist die Aufgabe von Kontext-Dateien (CLAUDE.md, AGENTS.md), die beim Start von jedem großen Provider automatisch eingelesen werden.
Without context With CLAUDE.md / AGENTS.md
┌─────────────────────────┐ ┌─────────────────────────┐
│ You re-explain the │ │ The agent already knows: │
│ stack, the style, the │ │ - the stack │
│ folders... on EVERY │ │ - the conventions │
│ new prompt │ │ - the files to avoid │
│ │ │ │
│ = wasted tokens │ │ = you go straight to │
│ every session │ │ the point │
└─────────────────────────┘ └─────────────────────────┘
Das ist die Kommunikationsinvestition mit dem höchsten Return: einmal geschrieben, zahlt sich bei jedem Prompt aus. Unser CLAUDE.md-Leitfaden erklärt, was hineingehört und was nicht.
2. Die Prompt-Bibliothek: denselben Prompt nie zweimal schreiben
Du hast sicher Anweisungen, die du im Dauerbetrieb eintippst: "Security-Review des Diffs durchführen", "Tests für dieses Modul nach unserer Konvention schreiben", "Conventional-Commits-Nachricht formulieren". Die Prompt-Bibliothek speichert, organisiert und injiziert diese mit zwei Klicks in jeden Agenten.
Verkettung ist ebenfalls entscheidend. Mit verknüpften Prompts teilst du eine schwere Aufgabe in aufeinanderfolgende Schritte auf, die der Reihe nach ausgeführt werden, statt einer monolithischen Wand, die der Agent nur halb abarbeitet.
One giant prompt Linked prompts (chained)
┌──────────────────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐
│ "Do A, then B, │ │ 1. A │──▶│ 2. B │──▶│ 3. C │
│ then C, and don't │ │ scoped │ │ scoped │ │ scoped │
│ forget D..." │ └─────────┘ └─────────┘ └─────────┘
│ │
│ the agent forgets │ each step verified
│ half of it │ before the next
└──────────────────────┘
3. Die Skills-Bibliothek: ein Verfahren kodieren, keine Beschreibung
Ein Prompt sagt was zu tun ist. Ein Skill sagt wie es hier gemacht wird, Schritt für Schritt, nach deinen Regeln. Die Skills-Bibliothek speichert diese wiederverwendbaren Verfahren (SEO-Audit, Komponenten-Migration, Release-Checkliste) und hängt sie zum richtigen Zeitpunkt an den Agenten. Das ist verdichtete Kommunikation: statt einen zehnzeiligen Prozess neu zu erklären, hängst du den Skill an und der Agent folgt dem Protokoll.
4. Das Scratchpad: erst entwerfen, dann senden
Ein guter Prompt wird ausgearbeitet, nicht im Eifer des Gefechts improvisiert. Das Scratchpad ist ein Entwurfsbereich, der immer griffbereit ist: Stack Trace einfügen, ein Stück Spec, eine Idee, alles bereinigen, strukturieren und an den Agenten schicken, wenn es fertig ist. Weniger "oh warte, ich meinte..." und damit weniger Runden.
5. Die Absicht diktieren: Spracheingabe und Voice Mode
Sprechen ist drei- bis viermal schneller als Tippen und oft natürlicher, um eine Absicht zu beschreiben. AgentsRoom bietet zwei Modi:
- Spracheingabe transkribiert deine Stimme direkt in den Composer. Du sprichst, liest nochmals durch, sendest.
- Voice Mode öffnet ein echtes bidirektionales Gespräch: du sprichst, der Agent antwortet laut, freihändig.
Keyboard ████████████████████████ ~40 words/min
Voice ████████████████████████████████████████████████████████████ ~150 words/min
Ideal, um erwartetes Verhalten zu beschreiben, laut über eine Architektur nachzudenken oder einen Agenten zu steuern, während die Hände woanders sind.
6. Zeigen statt beschreiben: Sketch und Screenshot to Agent
Manche Dinge lassen sich einfach nicht sauber in Worte fassen. "Der Button ist zu weit links, der obere Abstand wirkt seltsam, und das Modal soll hier aufgehen": ein Bild sagt mehr als tausend Tokens.
- Mit Sketch nimmst du den Bildschirm auf, kommentierst ihn (Pfeile, Boxen, Notizen) und schickst diese visuelle Rückmeldung an den Agenten.
- Mit Screenshot to Agent erfasst ein Tastenkürzel einen Bereich und hängt ihn direkt an den Prompt.
"Nudge that thing a bit [annotated capture]
to the right, I think, ┌───────────────┐
you know what I mean..." │ ┌──┐ ←── here│
│ │ │ │
vague, interpreted │ └──┘ too low │
└───────────────┘
precise, no ambiguity
7. Die Feedback-Schleife: deine Agenten antworten dir
Kommunizieren bedeutet nicht nur Senden. Es bedeutet auch Zuhören, wenn der Agent eine Entscheidung braucht. AgentsRoom markiert Agenten mit einer neuen Nachricht als ungelesen, nach Art einer Messaging-App, und benachrichtigt dich auf Desktop und Mobile, wenn ein Agent auf dich wartet. Du schaust nicht mehr auf ein rollierendes Terminal: der Agent pingt dich an.
YOU AGENT
│ 1. Context (CLAUDE.md / AGENTS.md) │
│ ────────────────────────────────────────▶ │
│ 2. Intent (text / voice / sketch) │
│ ────────────────────────────────────────▶ │ executes
│ 3. Status + question (unread badge) │
│ ◀──────────────────────────────────────── │
│ 4. Decision / correction │
│ ────────────────────────────────────────▶ │
▼ ▼
fewer tokens fewer regressions faster
Details in Benachrichtigungen und ungelesene Nachrichten.
8. Die Unterhaltung messen: Token-Verbrauch
Man optimiert nur, was man misst. Das Token-Verbrauch-Tracking zeigt pro Session und pro Agent, was jeder Austausch kostet. Du siehst sofort, welche Art von Prompt die Rechnung explodieren lässt und welche schlank bleibt. Kommunikation wird zu einer messbaren Größe, kein Bauchgefühl mehr.
9. Über Provider hinweg kommunizieren, ohne den Faden zu verlieren
Claude für die Architektur, Codex für das Backend, Gemini oder Grok Build für ein schnell voranschreitendes Feature: den Provider zu wechseln sollte nicht heißen, alles neu erklären zu müssen. Der Multi-Provider-Support wechselt einen laufenden Agenten von einem Provider zum anderen und erstellt eine Übergabezusammenfassung (berührte Dateien, Session-Aktivität, Fortschritt), damit der neue CLI dort weitermacht, wo der vorherige aufgehört hat.
Claude ──▶ [handoff summary] ──▶ Codex ──▶ [summary] ──▶ Grok Build
(arch) context kept (backend) (feature)
10. Lass deine Agenten miteinander reden
Die profitabelste Kommunikation ist manchmal die, die du selbst gar nicht führen musst. Drei Bausteine regeln das:
- Teams: Ein Dev-Agent übergibt an einen QA-Agenten, der seine Rückmeldung zurückschickt, in einer Schleife, ohne dass du bei jedem Austausch in der Mitte stehst.
- Agent-Delegation: Ein teurer Agent delegiert mechanische Aufgaben (Tests ausführen, im Browser prüfen) an einen Agenten auf einem günstigeren Modell. Weniger Tokens für Arbeit, die das nicht braucht.
- Der AgentsRoom MCP-Server: Deine Agenten lesen und schreiben im Cockpit (Backlog, Prompts, Terminals, Browser), kommunizieren also mit deiner Umgebung und nicht nur mit dir.
11. Von überall kommunizieren
Eine gute Idee wartet nicht darauf, dass du am Mac sitzt. Mobile-Desktop-Sync und Remote-Steuerung lassen dich einen Agenten starten, eine Frage beantworten oder ein Diff genehmigen, direkt vom Telefon aus. Die Kommunikationsschleife reißt nicht ab, wenn du den Schreibtisch verlässt.
Übersicht: Welcher Kanal wofür
| Du möchtest... | AgentsRoom-Kanal | Hauptvorteil |
|---|---|---|
| Das Projekt nicht immer neu erklären | CLAUDE.md / AGENTS.md | Tokens gespart jede Session |
| Eine häufige Anweisung wiederverwenden | Prompt-Bibliothek | Geschwindigkeit, Konsistenz |
| Eine große Aufgabe aufteilen | Verknüpfte Prompts | Weniger Regressionen |
| Ein Verfahren kodieren | Skills-Bibliothek | Wiederholbare Präzision |
| Schnell und natürlich beschreiben | Spracheingabe / Voice Mode | Eingabegeschwindigkeit |
| Ein visuelles Problem zeigen | Sketch / Screenshot to Agent | Null Mehrdeutigkeit |
| Wissen, wann der Agent wartet | Benachrichtigungen / Ungelesen | Weniger Babysitting |
| Die Kosten kontrollieren | Token-Verbrauch-Tracking | Messbare Einsparungen |
| Provider wechseln ohne neu zu starten | Multi-Provider | Kontext erhalten |
| Steuerungsarbeit auslagern | Teams / Delegation / MCP | Weniger Runden |
| Unterwegs steuern | Mobile / Remote-Sync | Kontinuität |
Fazit: Kommunikation ist das neue Kernkompetenz
Der Job hat sich umgekehrt. Code schreiben hilft noch, aber dort wird das Spiel nicht mehr gewonnen. Was einen schnellen, sparsamen Entwickler von jemandem unterscheidet, der Tokens in Runden verbrennt, ist die Qualität seiner Kommunikation mit den Agenten: ein gut gesetzter Kontext, eine klare Absicht, der richtige Kanal für die richtige Nachricht und eine Feedback-Schleife, die keine Minute kostet.
AgentsRoom ist um diese Idee herum gebaut. Nicht noch ein Chat-Client, sondern ein Cockpit, in dem jeder Baustein dazu existiert, besser, schneller und günstiger mit Claude, Codex, Gemini und Grok Build zu kommunizieren, alles nebeneinander.
Lust es auszuprobieren? AgentsRoom herunterladen, Provider verbinden und zusehen, wie die Kosten jedes Features sinken, während die Kommunikation schärfer wird. Für einen tieferen Einstieg ins Thema Prompts, siehe unsere Seite Prompt Engineering für Code, oder entdecke alle Features.
AgentsRoom herunterladen
Führe deine Claude-Agenten auf all deinen Projekten aus, von einem einzigen Fenster.
Companion-App: Agenten auch unterwegs im Blick behalten
Nutzen Sie Claude, Codex, Gemini CLI oder einen anderen AI-Anbieter.
Bugs und Wünsche direkt in dein öffentliches Backlog schicken.
Ein Blick auf AgentsRoom in Aktion.