Sztuczka z kanarkiem: złap Claude (lub dowolnego agenta AI), zanim zacznie halucynować

Jednolinijkowa sztuczka, by wiedzieć, kiedy twój agent AI do kodu zaczyna się psuć: niech zaczyna każdą odpowiedź od imienia. Gdy imię znika, kanarek nie żyje i czas na nową sesję. Działa z Claude, Codex, Antigravity CLI, Mistral Vibe i każdym LLM.

18 czerwca 2026

Długa sesja z agentem AI do kodu rzadko psuje się za jednym zamachem. Claude nie przeskakuje od bystrości do bzdur w jednej turze. Najpierw po cichu pomija małą instrukcję. Turę czy dwie później zaczyna zmyślać: plik, którego nie ma, API, którego nigdy nie było, decyzję, którą wyraźnie odrzuciłeś. Zanim wyłapiesz zmyśloną ścieżkę, już straciłeś zaufanie do ostatnich odpowiedzi i debugujesz agenta zamiast swojego kodu.

Istnieje darmowy, niemal zawstydzająco prosty sposób na wczesne ostrzeżenie. Nazywa się kanarkiem i ustawia się go w jednej linijce.

Dlaczego agenci wykolejają się: gnicie kontekstu (context rot)

W każdej turze agent czyta od nowa całą rozmowę, od pierwszej wiadomości do ostatniej, i odbudowuje swoje rozumienie od zera. W miarę zapełniania się okna kontekstu jako pierwsze puszcza trzymanie się instrukcji. Model wciąż brzmi pewnie, ale zaczął odrzucać najmniej ważne ograniczenia, żeby nadążyć. Badacze nazywają to «context rot», wraz z powiązanym efektem «lost in the middle»: im dłuższy kontekst, tym mniej niezawodnie model przestrzega pojedynczej instrukcji zagrzebanej w środku.

To jest sedno. Degradacja nie zaczyna się od halucynacji. Zaczyna się od tego, że model po cichu ignoruje małą instrukcję. Więc jeśli zasiejesz drobną instrukcję, której jedynym zadaniem jest zostać zauważoną, gdy zniknie, dostajesz linkę alarmową odpalającą się przed prawdziwą szkodą.

Na czym polega sztuczka z kanarkiem

Górnicy dawniej schodzili pod ziemię z kanarkiem. Ptak był wrażliwszy na trujące gazy niż ludzie: gdy przestawał śpiewać, górnicy wiedzieli, że trzeba wychodzić, na długo zanim sami cokolwiek poczuli.

Kanarek w promptcie to ten sam pomysł. Dodajesz trywialną instrukcję do pliku, który twój agent czyta w każdej turze: zaczynaj każdą odpowiedź od wybranego imienia. To imię jest twoim kanarkiem. Dopóki pojawia się na początku każdej odpowiedzi, model wciąż czyta i przestrzega twoich instrukcji. Pierwsza odpowiedź, która zapomina imienia, to twój sygnał, że sesja się psuje, zwykle turę czy dwie przed pojawieniem się prawdziwych halucynacji. Technikę spopularyzowali w społeczności kodowania agentowego deweloperzy tacy jak Peter Steinberger, twórca OpenClaw, którzy polegają na małych sygnałach-kanarkach, by wcześnie wyłapać psującą się sesję.

Krzywa pokazująca, jak niezawodność trzymania się instrukcji przez agenta AI spada w trakcie długiej sesji: instrukcja-kanarek znika, zanim zaczynają się halucynacje, zostawiając okno wczesnego ostrzeżenia.

Kanarek znika, zanim zaczynają się halucynacje. Ta luka to twoje okno na reakcję.

Ustawienie w jednej linijce

Umieść instrukcję w pliku, który twój agent ładuje w każdej turze:

Claude Code czyta CLAUDE.md.
Codex, Antigravity CLI, Mistral Vibe i większość innych CLI czyta AGENTS.md.

## Kanarek
Zaczynaj każdą odpowiedź od imienia "Felix".

Wybierz krótkie, charakterystyczne imię: twój kot, kolor, cokolwiek, co od razu rzuci ci się w oczy na początku odpowiedzi. Trzymaj to maksymalnie prosto. Złożona instrukcja przeczy celowi, bo chcesz czegoś, co modelowi najłatwiej porzucić. Jeśli odpadnie nawet to, wszystko subtelniejsze w twoim kontekście jest już zagrożone.

Co robić, gdy kanarek pada

Imię nigdy nie było sednem. Liczy się moment. Gdy kanarek znika, nie napieraj na bieżący wątek:

Przestań ufać ostatnim dwóm-trzem odpowiedziom i przeczytaj je z podejrzliwością.
Uruchom /clear lub zacznij nową sesję.
Wstrzyknij ponownie tylko ten kontekst, który się liczy: edytowany plik, cel oraz już podjęte decyzje.

Czyste okno ze zwięzłym briefem za każdym razem bije rozdęte. Nie tracisz postępu, zrzucasz balast, który ciągnął model w dół.

Pętla decyzyjna: przeczytaj odpowiedź agenta, sprawdź, czy zaczyna się od imienia. Jeśli tak, kanarek żyje, pracuj dalej. Jeśli nie, kanarek nie żyje, więc wyczyść kontekst lub zacznij nową sesję i wstrzyknij ponownie kluczowy kontekst.

Cały nawyk mieści się w jednej pętli: rzut oka na pierwsze słowo, decyzja, kontynuacja albo reset.

Działa na każdym modelu, nie tylko na Claude

Ta sztuczka jest z założenia niezależna od dostawcy. Claude, Codex, Antigravity CLI, Mistral Vibe, Grok i Aider dzielą te same ograniczenia kontekstu, wszystkie czytają plik kontekstu i wszystkie mogą nieść kanarka. Skupiamy się najpierw na Claude, bo to dziś najczęściej używany agent do kodu, ale nic tu nie jest specyficzne dla Claude. Każdy LLM, który zapełnia swój kontekst, zacznie od porzucenia twojej najmniejszej instrukcji, więc ten sam kanarek chroni każdy z nich. Jeśli prowadzisz plik kontekstu AGENTS.md, kanarek to po prostu jeszcze jedna linijka w nim.

Pilnowanie kanarka na całej flocie

Czytanie każdej odpowiedzi w poszukiwaniu brakującego imienia jest łatwe przy jednym agencie. Nie skaluje się, gdy uruchamiasz kilku naraz, a właśnie tam dzieje się dziś poważna praca.

To jest ta część, którą AgentsRoom ułatwia. To kokpit wieloagentowy: każdy agent ma rolę, żywą kropkę statusu i własny kolor, a ty nadzorujesz całą flotę z jednego okna. Wstaw kanarka raz do współdzielonego CLAUDE.md lub AGENTS.md, a odziedziczy go każdy agent. Gdy jakiś agent zaczyna gubić imię, łapiesz to jednym spojrzeniem i resetujesz tylko ten wątek, a nie cały projekt. Opcjonalna izolacja przez git worktree nie pozwala równoległym agentom wchodzić sobie w drogę, gdy to robisz.

AgentsRoom ma wręcz tę sztuczkę wbudowaną, więc nie musisz nawet sam pilnować odpowiedzi. Każdy agent, którego uruchamia, już zapisuje jednolinijkowy status na końcu każdej tury, a AgentsRoom traktuje to jak canary: gdy agent przestaje go aktualizować przez dwie tury z rzędu, nad terminalem tego agenta pojawia się ostrzeżenie, z restartem jednym kliknięciem na czystym kontekście i przypomnieniem o skompaktowaniu. Wczesne ostrzeżenie dostajesz automatycznie, na każdym agencie, na całej flocie. Przeczytaj, jak to działa, na stronie wykrywanie dryfu kontekstu.

Siedmiu dostawców, jeden kokpit i kanarek czuwający nad każdym z nich. Pobierz AgentsRoom, sprawdź macierz kompatybilności dostawców, by zobaczyć, co wspiera każdy agent, i przeczytaj więcej o obsłudze wielu dostawców oraz o tym, jak przełączanie w trakcie rozmowy zachowuje twój kontekst nienaruszony.

Czytaj dalej

Pobierz AgentsRoom

Uruchamiaj swoich agentów AI (Claude, Codex, Antigravity CLI, OpenCode, Aider, Grok Build, Mistral Vibe, Kimi Code) na wszystkich projektach z jednego okna.

Za darmoPobierz AgentsRoom

Aplikacja towarzyszaca: monitoruj agentów w podrozy

Użyj Claude, Codex, Antigravity CLI lub innego dostawcy AI.

Zainstaluj rozszerzenie

Chrome Web Store

Wysyłaj bugi i prośby bezpośrednio do swojego publicznego backlogu.