Kontext-Drift-Erkennung

Erwische deinen KI-Agenten
bevor er anfängt zu halluzinieren

Eine lange Sitzung mit einem KI-Coding-Agenten bricht selten auf einen Schlag zusammen. Er überspringt leise eine Anweisung, und ein, zwei Runden später erfindet er eine Datei, eine API oder eine Entscheidung, die es nie gab. Der AgentsRoom-Canary erkennt diesen Moment der Kontext-Drift früh, damit du handelst, bevor die Halluzinationen deinen Code erreichen.

Er stützt sich auf ein Signal, das deine Agenten ohnehin erzeugen: nichts einzurichten, nichts zu merken. Claude Code, Codex, Gemini CLI und jeder von AgentsRoom gesteuerte Provider sind abgedeckt.

AgentsRoom Context Canary-Warnung: ein KI-Coding-Agent hat seit fünf Runden in Folge keinen Status mehr gemeldet, ein Zeichen für Context Rot und nachlassende Qualität, mit einem Neustart-Button per Klick und einem Tipp, /compact einzutippen, um die Konversation zusammenzufassen

Wenn der Canary verstummt, zeigt AgentsRoom diese Warnung über dem Agenten-Terminal: auf sauberem Kontext neu starten oder die Konversation verdichten.

Context Rot ist der stille Killer langer Agenten-Sitzungen. In jeder Runde liest das Modell die ganze Konversation neu und baut sein Verständnis von Grund auf wieder auf. Wenn sich das Kontextfenster füllt, ist das Befolgen von Anweisungen das Erste, was nachlässt. Das Modell klingt noch selbstsicher, aber es hat begonnen, die Vorgaben fallenzulassen, die es für am wenigsten wichtig hält, um Schritt zu halten.

Das ist die zentrale Idee hinter dem Canary. Der Verfall beginnt nicht mit einer Halluzination. Er beginnt damit, dass das Modell stillschweigend eine kleine Anweisung ignoriert. Pflanze eine Anweisung ein, deren einzige Aufgabe es ist, bemerkt zu werden, wenn sie verschwindet, und du bekommst einen Stolperdraht, der auslöst, bevor der echte Schaden entsteht.

AgentsRoom gibt jedem Agenten diese Anweisung bereits. Jeder Agent schreibt am Ende jeder Runde einen einzeiligen Status, die kurze Zusammenfassung, die du in der Sidebar und auf deinem Handy siehst. Dieses Schreiben pro Runde ist der Canary. Solange es aktualisiert wird, liest und befolgt der Agent seine Anweisungen noch. Die ersten Runden, in denen es ausbleibt, sind deine Frühwarnung.

Warum ein Canary besser ist als die Ausgabe zu beobachten

Bei einem einzelnen Agenten kannst du jede Antwort lesen und spüren, wann er driftet. Über eine Flotte parallel arbeitender Agenten hinweg liest niemand jede Antwort in Echtzeit erneut. Ein Canary gibt dir ein passives Signal, das du nicht übersehen kannst.

Context Rot und der Lost-in-the-Middle-Effekt sind gut dokumentiert: je länger der Kontext, desto weniger zuverlässig befolgt ein Modell eine einzelne darin vergrabene Anweisung. Der Canary verwandelt diese Fragilität in einen sichtbaren Alarm.

Der Canary ist den Halluzinationen voraus. Der Status hört eine oder zwei Runden auf, sich zu aktualisieren, bevor der Agent anfängt, Dinge zu erfinden, genau das Zeitfenster, in dem du reagieren willst.

Kein Test zu starten, kein Befehl zu tippen. Die Erkennung läuft von selbst, während du an einem anderen Agenten oder einem anderen Projekt arbeitest.

So funktioniert der Canary

Eine eingebaute Frühwarnschleife, aufgesetzt auf den Status, den jeder Agent ohnehin meldet.

01

Jeder Agent bekommt den Canary, automatisch

Wenn du einen Agenten über AgentsRoom startest, wird die Sitzungsanweisung in seinen Prompt eingespeist: am Ende jeder Runde einen einzeiligen Status in seine Sitzungsdatei schreiben. Du fügst nichts hinzu. Der Canary ist derselbe Status, der die Sidebar und die mobile Push-Nachricht speist.

02

AgentsRoom hält den Status zu Beginn jeder Runde fest

Sobald ein Agent zu denken beginnt, erfasst AgentsRoom den aktuellen Status. Das ist die Referenz, mit der es nach Ende der Runde vergleicht.

03

Es prüft erneut, wenn sich die Runde gesetzt hat

Mit einer kurzen Karenzzeit nach Ende der Runde liest AgentsRoom die Sitzungsdatei des Agenten erneut. Genug Zeit, damit der Agent schreibt und der Status-Poller es aufnimmt, sodass ein langsames Schreiben nie mit einem toten Canary verwechselt wird.

04

Eine ausgebliebene Aktualisierung erhöht den Zähler

Hat sich der Status nicht geändert, steigt der Zähler verpasster Runden. Hat der Agent einen frischen Status geschrieben, springt der Zähler auf null und jede Warnung verschwindet. Eine stille Runde reicht nicht für einen Alarm, denn eine kurze, legitime Runde kann den Status unverändert lassen.

05

Zwei stille Runden hintereinander lösen die Warnung aus

Wenn der Agent seinen Status zwei Runden hintereinander überspringt, ist das das klare Signal eines Aussetzers, kein Rauschen. Ein Warnbanner erscheint über dem Terminal dieses Agenten: der Canary ist tot, der Agent driftet vermutlich.

06

Sauber neu starten, oder verdichten, dann weitermachen

Das Banner bietet einen Neustart per Klick, der den Agenten beendet und auf frischem Kontext neu startet, plus eine Erinnerung, die Konversation zu verdichten. Sobald der Agent wieder seinen Status meldet, verschwindet die Warnung von selbst.

Der Canary im Bergwerk, für deine KI-Sitzung

Bergleute nahmen einen Canary (Kanarienvogel) mit unter Tage, weil er lange vor ihnen auf giftige Gase reagierte. Gleiche Idee hier.

Ein Prompt-Canary ist eine triviale Anweisung, die der Agent in jeder Runde befolgen soll. Solange er das tut, weißt du, dass das Modell deine Anweisungen noch von vorne bis hinten liest. Die erste Antwort, die sie vergisst, ist dein Stolperdraht.

AgentsRoom schraubt keinen separaten Trick an deine Agenten. Es nutzt den Status wieder, den jeder Agent ohnehin für die Sidebar und die Handy-Benachrichtigung schreibt, sodass der Canary nichts kostet und unmöglich vergessen einzurichten ist.

Es ging nie um den Statustext. Es geht um das Timing. Ein sauberes Kontextfenster mit einem knappen Briefing schlägt ein überladenes jedes Mal. Wenn der Canary stirbt, verlierst du keinen Fortschritt, du lässt das tote Gewicht fallen, das das Modell nach unten zog.

Erst Status-Tracking, dann Drift-Erkennung

Die meisten Cockpits sagen dir, dass ein Agent arbeitet oder fertig ist. Der Canary sagt dir, dass er anfängt nachzulassen.

Ohne Canary

  • : Du merkst erst, dass der Agent daneben liegt, wenn du einen halluzinierten Dateipfad oder eine falsche API liest.
  • : Dann sind die letzten paar Antworten schon verdächtig, und du debuggst den Agenten, nicht deinen Code.
  • : Bei mehreren Agenten gleichzeitig versteckt sich der driftende in aller Öffentlichkeit.
  • : Du startest zu spät neu, nachdem schlechte Ausgabe schon gelandet ist.

Mit dem AgentsRoom-Canary

  • : Eine Warnung erscheint über dem Terminal, sobald ein Agent aufhört, seinen Status zu melden.
  • : Du erwischst die Drift ein, zwei Runden, bevor die Halluzinationen beginnen.
  • : Du setzt nur den Agenten zurück, der nachgelassen hat, nicht das ganze Projekt.
  • : Du startest auf sauberem, kurzem Kontext neu, und der Agent wird wieder schärfer und schneller.

Frühwarnung statt Obduktion. Das ist der ganze Sinn des Canary.

Warum ein frischer Kontext einen besseren Agenten macht

Je mehr Informationen du in einen Agenten stapelst, desto mehr neigt er dazu zu driften, zu halluzinieren und langsamer zu werden. Ein Kontextfenster, das überwiegend aus veralteter Erkundung, Sackgassen und gelösten Fragen besteht, arbeitet in jeder Runde gegen das Modell.

Wenn der Canary stirbt, ist die Lösung selten, auf demselben Faden härter nachzulegen. Vertraue den letzten paar Antworten nicht mehr, verdichte dann die Konversation oder starte eine frische Sitzung und speise nur das Wesentliche wieder ein: die Datei, die du bearbeitest, das Ziel und die bereits getroffenen Entscheidungen.

Verdichten fasst die Konversation zusammen, sodass der Agent den Kern ohne den Ballast behält. Ein Neustart gibt ihm ein leeres Blatt. Beides bringt dich zurück zu einem knappen Briefing, wo Coding-Agenten am besten arbeiten. Der AgentsRoom-Canary sagt dir, welcher Moment der richtige ist.

Das ist von Grund auf provider-agnostisch. Claude Code, Codex, Gemini CLI und andere Agenten teilen alle dieselben Kontextgrenzen und melden alle einen Status über AgentsRoom, sodass derselbe Canary jeden von ihnen schützt. Die Drift-Erkennung lebt in AgentsRoom, nicht in einem einzelnen CLI.

Lies das komplette Canary-Playbook

Wir haben einen ausführlichen Beitrag zum Canary-Trick geschrieben: warum Agenten aus dem Ruder laufen, wie du von Hand einen Canary in deine CLAUDE.md oder AGENTS.md pflanzt und was du im Moment seines Todes tust. AgentsRoom automatisiert das Beobachten über deine ganze Flotte hinweg.

Den Canary-Artikel lesen

FAQ

Was ist der Canary in AgentsRoom?

Es ist ein Frühwarnsignal für Kontext-Drift. Jeder Agent schreibt am Ende jeder Runde einen einzeiligen Status. Wenn ein Agent diesen Status zwei Runden hintereinander nicht mehr aktualisiert, behandelt AgentsRoom den Canary als tot und warnt dich, dass der Agent wahrscheinlich den Kontext verliert, meist bevor er anfängt zu halluzinieren.

Muss ich etwas einrichten?

Nein. Der Canary nutzt den Status pro Runde wieder, den jeder AgentsRoom-Agent ohnehin für die Sidebar und die mobile Benachrichtigung schreibt. Starte einen Agenten und die Erkennung läuft. Es gibt nichts zu konfigurieren und nichts zu merken.

Was ist Context Rot?

Wenn eine Konversation wächst, liest das Modell in jeder Runde alles neu, und das Befolgen von Anweisungen verschlechtert sich. Es lässt leise kleine Vorgaben fallen und halluziniert dann: erfundene Dateien, falsche APIs, Entscheidungen, die du ausgeschlossen hattest. Der verwandte Lost-in-the-Middle-Effekt bedeutet, dass in einem langen Kontext vergrabene Anweisungen weniger zuverlässig befolgt werden.

Warum auf zwei verpasste Runden warten statt auf eine?

Eine einzelne kurze Runde kann den Status legitim unverändert lassen, etwa wenn der Agent nur eine Datei liest und knapp antwortet. Zwei stille Runden hintereinander sind das klare Signal, dass der Agent tatsächlich aufgehört hat, seine Anweisungen zu befolgen, was Fehlalarme niedrig hält.

Was tue ich, wenn die Warnung erscheint?

Zwei Wege. Starte den Agenten per Klick neu, um einen frischen, sauberen Kontext zu bekommen, oder tippe /compact, um die Konversation zusammenzufassen und den Kern ohne den Ballast zu behalten. Beides bringt den Agenten zurück zu einem knappen Briefing, wo er am besten arbeitet.

Funktioniert es mit Codex und anderen Providern, nicht nur mit Claude?

Ja. Der Canary stützt sich nur auf das Sitzungs-Status-Protokoll, dem jeder AgentsRoom-Agent folgt, unabhängig vom zugrunde liegenden CLI. Claude Code, Codex, Gemini CLI und andere sind alle abgedeckt. Die Erkennung lebt in AgentsRoom, nicht in einem einzelnen Provider.

Verschwindet die Warnung von selbst?

Ja. Sobald der Agent wieder einen frischen Status schreibt, springt der Zähler verpasster Runden zurück und das Banner verschwindet von selbst. Du kannst es für diese Sitzung auch manuell schließen.

Ist das nützlich, wenn ich nur einen Agenten laufen lasse?

Es hilft, aber es glänzt mit mehreren Agenten gleichzeitig. Bei einem einzelnen Agenten kannst du jede Antwort lesen. Über eine parallele Flotte hinweg liest niemand jede Antwort in Echtzeit erneut, also ist ein passiver Drift-Alarm das, was einen still verfallenden Agenten daran hindert, durchzurutschen.

Verlangsamt der Canary meinen Agenten?

Nein. Er setzt auf den einzeiligen Status auf, den der Agent ohnehin in jeder Runde schreibt. Kein zusätzlicher Prompt, kein zusätzlicher Modellaufruf, keine zusätzliche Latenz.

Warum macht ein sauberer Kontext den Agenten besser?

Je mehr veralteten Kontext ein Agent mitschleppt, desto mehr driftet er, halluziniert und wird langsamer. Neustart oder Verdichten lässt das tote Gewicht fallen und bringt den Agenten zurück zu einem kurzen, fokussierten Briefing, wo Coding-Agenten am zuverlässigsten und schnellsten sind.

Das könnte dir auch gefallen

Erwische Kontext-Drift, bevor sie dich kostet

Steuere deine KI-Coding-Agenten in einem Cockpit, das dich warnt, wenn einer den Faden verliert. Lade AgentsRoom für macOS herunter.

KostenlosAgentsRoom herunterladen

Companion-App: Agenten auch unterwegs im Blick behalten

Nutzen Sie Claude, Codex, Gemini CLI oder einen anderen AI-Anbieter.

Erweiterung installieren
Chrome Web Store

Bugs und Wünsche direkt in dein öffentliches Backlog schicken.

Ein Blick auf AgentsRoom in Aktion.

Multi-Projekte
Multi-Provider
Multi-Agenten
Live-Status
Diff & Commit
Mobile App
Live-Vorschau
Agent-Teams
Browser-Tests
Backlog-getriebene Entwicklung
Prompt-Bibliothek
Skills-Bibliothek
Alle Funktionen ansehen