Sztuczka z kanarkiem: złap Claude (lub dowolnego agenta AI), zanim zacznie halucynować
Jednolinijkowa sztuczka, by wiedzieć, kiedy twój agent AI do kodu zaczyna się psuć: niech zaczyna każdą odpowiedź od imienia. Gdy imię znika, kanarek nie żyje i czas na nową sesję. Działa z Claude, Codex, Gemini CLI, Mistral Vibe i każdym LLM.
Długa sesja z agentem AI do kodu rzadko psuje się za jednym zamachem. Claude nie przeskakuje od bystrości do bzdur w jednej turze. Najpierw po cichu pomija małą instrukcję. Turę czy dwie później zaczyna zmyślać: plik, którego nie ma, API, którego nigdy nie było, decyzję, którą wyraźnie odrzuciłeś. Zanim wyłapiesz zmyśloną ścieżkę, już straciłeś zaufanie do ostatnich odpowiedzi i debugujesz agenta zamiast swojego kodu.
Istnieje darmowy, niemal zawstydzająco prosty sposób na wczesne ostrzeżenie. Nazywa się kanarkiem i ustawia się go w jednej linijce.
Dlaczego agenci wykolejają się: gnicie kontekstu (context rot)
W każdej turze agent czyta od nowa całą rozmowę, od pierwszej wiadomości do ostatniej, i odbudowuje swoje rozumienie od zera. W miarę zapełniania się okna kontekstu jako pierwsze puszcza trzymanie się instrukcji. Model wciąż brzmi pewnie, ale zaczął odrzucać najmniej ważne ograniczenia, żeby nadążyć. Badacze nazywają to «context rot», wraz z powiązanym efektem «lost in the middle»: im dłuższy kontekst, tym mniej niezawodnie model przestrzega pojedynczej instrukcji zagrzebanej w środku.
To jest sedno. Degradacja nie zaczyna się od halucynacji. Zaczyna się od tego, że model po cichu ignoruje małą instrukcję. Więc jeśli zasiejesz drobną instrukcję, której jedynym zadaniem jest zostać zauważoną, gdy zniknie, dostajesz linkę alarmową odpalającą się przed prawdziwą szkodą.
Na czym polega sztuczka z kanarkiem
Górnicy dawniej schodzili pod ziemię z kanarkiem. Ptak był wrażliwszy na trujące gazy niż ludzie: gdy przestawał śpiewać, górnicy wiedzieli, że trzeba wychodzić, na długo zanim sami cokolwiek poczuli.
Kanarek w promptcie to ten sam pomysł. Dodajesz trywialną instrukcję do pliku, który twój agent czyta w każdej turze: zaczynaj każdą odpowiedź od wybranego imienia. To imię jest twoim kanarkiem. Dopóki pojawia się na początku każdej odpowiedzi, model wciąż czyta i przestrzega twoich instrukcji. Pierwsza odpowiedź, która zapomina imienia, to twój sygnał, że sesja się psuje, zwykle turę czy dwie przed pojawieniem się prawdziwych halucynacji. Technikę spopularyzowali w społeczności kodowania agentowego deweloperzy tacy jak Peter Steinberger, twórca OpenClaw, którzy polegają na małych sygnałach-kanarkach, by wcześnie wyłapać psującą się sesję.
Kanarek znika, zanim zaczynają się halucynacje. Ta luka to twoje okno na reakcję.
Ustawienie w jednej linijce
Umieść instrukcję w pliku, który twój agent ładuje w każdej turze:
- Claude Code czyta
CLAUDE.md. - Codex, Gemini CLI, Mistral Vibe i większość innych CLI czyta
AGENTS.md.
## Kanarek
Zaczynaj każdą odpowiedź od imienia "Felix".
Wybierz krótkie, charakterystyczne imię: twój kot, kolor, cokolwiek, co od razu rzuci ci się w oczy na początku odpowiedzi. Trzymaj to maksymalnie prosto. Złożona instrukcja przeczy celowi, bo chcesz czegoś, co modelowi najłatwiej porzucić. Jeśli odpadnie nawet to, wszystko subtelniejsze w twoim kontekście jest już zagrożone.
Co robić, gdy kanarek pada
Imię nigdy nie było sednem. Liczy się moment. Gdy kanarek znika, nie napieraj na bieżący wątek:
- Przestań ufać ostatnim dwóm-trzem odpowiedziom i przeczytaj je z podejrzliwością.
- Uruchom
/clearlub zacznij nową sesję. - Wstrzyknij ponownie tylko ten kontekst, który się liczy: edytowany plik, cel oraz już podjęte decyzje.
Czyste okno ze zwięzłym briefem za każdym razem bije rozdęte. Nie tracisz postępu, zrzucasz balast, który ciągnął model w dół.
Cały nawyk mieści się w jednej pętli: rzut oka na pierwsze słowo, decyzja, kontynuacja albo reset.
Działa na każdym modelu, nie tylko na Claude
Ta sztuczka jest z założenia niezależna od dostawcy. Claude, Codex, Gemini CLI, Mistral Vibe, Grok i Aider dzielą te same ograniczenia kontekstu, wszystkie czytają plik kontekstu i wszystkie mogą nieść kanarka. Skupiamy się najpierw na Claude, bo to dziś najczęściej używany agent do kodu, ale nic tu nie jest specyficzne dla Claude. Każdy LLM, który zapełnia swój kontekst, zacznie od porzucenia twojej najmniejszej instrukcji, więc ten sam kanarek chroni każdy z nich. Jeśli prowadzisz plik kontekstu AGENTS.md, kanarek to po prostu jeszcze jedna linijka w nim.
Pilnowanie kanarka na całej flocie
Czytanie każdej odpowiedzi w poszukiwaniu brakującego imienia jest łatwe przy jednym agencie. Nie skaluje się, gdy uruchamiasz kilku naraz, a właśnie tam dzieje się dziś poważna praca.
To jest ta część, którą AgentsRoom ułatwia. To kokpit wieloagentowy: każdy agent ma rolę, żywą kropkę statusu i własny kolor, a ty nadzorujesz całą flotę z jednego okna. Wstaw kanarka raz do współdzielonego CLAUDE.md lub AGENTS.md, a odziedziczy go każdy agent. Gdy jakiś agent zaczyna gubić imię, łapiesz to jednym spojrzeniem i resetujesz tylko ten wątek, a nie cały projekt. Opcjonalna izolacja przez git worktree nie pozwala równoległym agentom wchodzić sobie w drogę, gdy to robisz.
Siedmiu dostawców, jeden kokpit i kanarek czuwający nad każdym z nich. Pobierz AgentsRoom, sprawdź macierz kompatybilności dostawców, by zobaczyć, co wspiera każdy agent, i przeczytaj więcej o obsłudze wielu dostawców oraz o tym, jak przełączanie w trakcie rozmowy zachowuje twój kontekst nienaruszony.
Pobierz AgentsRoom
Uruchamiaj swoich agentów Claude na wszystkich projektach z jednego okna.
Aplikacja towarzyszaca: monitoruj agentów w podrozy
Użyj Claude, Codex, Gemini CLI lub innego dostawcy AI.
Wysyłaj bugi i prośby bezpośrednio do swojego publicznego backlogu.
Spojrzenie na AgentsRoom w akcji.