Wykrywanie dryfu kontekstu

Złap swojego agenta AI
zanim zacznie halucynować

Długa sesja z agentem kodującym AI rzadko psuje się od razu. Po cichu pomija jedną instrukcję, a turę czy dwie później wymyśla plik, API albo decyzję, które nigdy nie istniały. Canary AgentsRoom wcześnie wychwytuje ten moment dryfu, żebyś zareagował, zanim halucynacje dotrą do twojego kodu.

Opiera się na sygnale, który twoi agenci i tak już generują: nic do skonfigurowania, nic do zapamiętania. Claude Code, Codex, Gemini CLI i każdy dostawca pilotowany przez AgentsRoom są objęci.

Ostrzeżenie canary kontekstu AgentsRoom: agent kodujący AI od pięciu tur z rzędu nie zgłasza swojego statusu, oznaka context rot i spadku jakości, z przyciskiem do ponownego uruchomienia agenta i wskazówką, by wpisać /compact w celu podsumowania rozmowy

Gdy canary milknie, AgentsRoom wyświetla to ostrzeżenie nad terminalem agenta: zrestartuj na czystym kontekście albo skompaktuj rozmowę.

Context rot to cichy zabójca długich sesji. W każdej turze model czyta od nowa całą rozmowę i odbudowuje swoje rozumienie od zera. Gdy okno kontekstu się wypełnia, trzymanie się instrukcji puszcza jako pierwsze. Model nadal brzmi pewnie, ale zaczął porzucać ograniczenia, które uznaje za najmniej istotne, żeby nadążyć.

To kluczowa myśl stojąca za canary. Degradacja nie zaczyna się od halucynacji. Zaczyna się od tego, że model po cichu ignoruje małą instrukcję. Zasadź instrukcję, której jedynym zadaniem jest dać się zauważyć, gdy zniknie, a dostaniesz drut pułapkowy, który zadziała przed prawdziwą szkodą.

AgentsRoom już daje każdemu agentowi taką instrukcję. Każdy agent zapisuje jednolinijkowy status na końcu każdej tury, to krótkie podsumowanie, które widzisz na pasku bocznym i w telefonie. Ten zapis co turę to właśnie canary. Dopóki się aktualizuje, agent wciąż czyta i przestrzega swoich instrukcji. Pierwsze tury, w których znika, są twoim wczesnym ostrzeżeniem.

Dlaczego canary bije czytanie wyniku

Przy jednym agencie możesz przeczytać każdą odpowiedź i wyczuć, kiedy dryfuje. Na całej flocie agentów pracujących równolegle nikt nie czyta na nowo każdej odpowiedzi w czasie rzeczywistym. Canary daje ci pasywny sygnał, którego nie sposób przegapić.

Context rot i efekt lost-in-the-middle są dobrze udokumentowane: im dłuższy kontekst, tym mniej niezawodnie model przestrzega pojedynczej instrukcji zakopanej w środku. Canary zamienia tę kruchość w widoczny alarm.

Canary wyprzedza halucynacje. Status przestaje się aktualizować turę czy dwie, zanim agent zacznie zmyślać, a to dokładnie to okno, w którym chcesz zareagować.

Żadnego testu do odpalenia, żadnej komendy do wpisania. Wykrywanie dzieje się samo, gdy ty pracujesz nad innym agentem albo innym projektem.

Jak działa canary

Wbudowana pętla wczesnego ostrzegania, nałożona na status, który każdy agent i tak już zgłasza.

01

Każdy agent dostaje canary, automatycznie

Gdy uruchamiasz agenta przez AgentsRoom, do jego promptu wstrzykiwana jest instrukcja sesji: zapisuj jednolinijkowy status do swojego pliku sesji na końcu każdej tury. Ty nic nie dodajesz. Canary to ten sam status, który zasila pasek boczny i powiadomienie push w telefonie.

02

AgentsRoom robi zdjęcie statusu na początku każdej tury

W chwili, gdy agent zaczyna myśleć, AgentsRoom zapisuje bieżący status. To punkt odniesienia, z którym porówna po zakończeniu tury.

03

Sprawdza ponownie, gdy tura się ustabilizuje

Po krótkiej karencji od zakończenia tury AgentsRoom czyta na nowo plik sesji agenta. Tyle czasu, by agent zdążył zapisać, a sonda statusu to wychwyciła, więc wolny zapis nigdy nie zostaje wzięty za martwe canary.

04

Pominięta aktualizacja podbija licznik

Jeśli status się nie zmienił, licznik pominiętych tur rośnie. Jeśli agent zapisał świeży status, licznik wraca do zera i każde ostrzeżenie znika. Jedna cicha tura nie wystarczy, by zaalarmować, bo krótka, uzasadniona tura może zostawić status bez zmian.

05

Dwie ciche tury z rzędu podnoszą ostrzeżenie

Gdy agent pomija swój status dwie tury z rzędu, to czysty sygnał zapomnienia, a nie szum. Nad terminalem tego agenta pojawia się baner ostrzeżenia: canary nie żyje, agent prawdopodobnie dryfuje.

06

Zrestartuj na czysto albo skompaktuj i jedź dalej

Baner oferuje przycisk, który ubija i odpala agenta na świeżym kontekście, plus przypomnienie o skompaktowaniu rozmowy. Gdy agent znów zaczyna zgłaszać status, ostrzeżenie znika samo.

Canary w kopalni, dla twojej sesji AI

Górnicy schodzili pod ziemię z canary (kanarkiem), bo ten ptak reagował na trujące gazy dużo wcześniej niż oni. Ta sama idea tutaj.

Canary promptu to banalna instrukcja, której agent ma przestrzegać w każdej turze. Dopóki to robi, wiesz, że model nadal czyta twoje instrukcje od początku do końca. Pierwsza odpowiedź, która o niej zapomina, to twój drut pułapkowy.

AgentsRoom nie dokleja osobnego gadżetu do twoich agentów. Wykorzystuje ponownie status, który każdy agent i tak już zapisuje na potrzeby paska bocznego i powiadomienia w telefonie, więc canary nic nie kosztuje i nie da się zapomnieć o jego skonfigurowaniu.

Nigdy nie chodziło o treść statusu. Chodzi o czas. Czyste okno kontekstu z ciasnym briefem za każdym razem bije przeładowane. Gdy canary umiera, nie tracisz postępu, zrzucasz martwy ciężar, który ciągnął model w dół.

Najpierw śledzenie statusu, potem wykrywanie dryfu

Większość kokpitów mówi ci, że agent pracuje albo skończył. Canary mówi, że zaczyna się obsuwać.

Bez canary

  • : Zauważasz, że agent zboczył, dopiero gdy czytasz zmyśloną ścieżkę pliku albo błędne API.
  • : Wtedy ostatnie kilka odpowiedzi już jest podejrzanych, a ty debugujesz agenta, a nie swój kod.
  • : Przy kilku agentach naraz ten dryfujący chowa się na widoku.
  • : Restartujesz za późno, gdy zły wynik już wylądował.

Z canary AgentsRoom

  • : Ostrzeżenie pojawia się nad terminalem w chwili, gdy agent przestaje zgłaszać status.
  • : Łapiesz dryf turę czy dwie przed początkiem halucynacji.
  • : Resetujesz tylko tego agenta, który się obsunął, a nie cały projekt.
  • : Restartujesz na czystym, krótkim kontekście, a agent znów jest ostrzejszy i szybszy.

Wczesne ostrzeżenie zamiast sekcji zwłok. O to chodzi w całym canary.

Dlaczego świeży kontekst daje lepszego agenta

Im więcej informacji upchasz w agencie, tym bardziej skłania się on do dryfu, halucynacji i spowolnienia. Okno kontekstu złożone głównie z nieaktualnych eksploracji, ślepych zaułków i rozstrzygniętych już pytań działa przeciwko modelowi w każdej turze.

Gdy canary umiera, rozwiązaniem rzadko jest napieranie mocniej na ten sam wątek. Przestań ufać ostatnim kilku odpowiedziom, potem skompaktuj rozmowę albo zacznij świeżą sesję i wstrzyknij na nowo tylko to, co istotne: plik, który edytujesz, cel oraz już podjęte decyzje.

Kompaktowanie podsumowuje rozmowę, by agent zachował sedno bez objętości. Restart daje mu czystą kartę. Oba sprowadzają cię z powrotem do ciasnego briefu, w którym agenci kodujący radzą sobie najlepiej. Canary AgentsRoom mówi ci, który moment jest właściwy.

To z założenia niezależne od dostawcy. Claude Code, Codex, Gemini CLI i inni agenci dzielą te same limity kontekstu i wszyscy zgłaszają status przez AgentsRoom, więc to samo canary chroni każdego z nich. Wykrywanie dryfu żyje w AgentsRoom, a nie w pojedynczym CLI.

Przeczytaj pełny poradnik o canary

Napisaliśmy pogłębiony tekst o sztuczce z canary: dlaczego agenci wykolejają się, jak ręcznie zasadzić canary w swoim CLAUDE.md albo AGENTS.md i co zrobić w chwili, gdy umiera. AgentsRoom automatyzuje samo czuwanie na całej twojej flocie.

Przeczytaj artykuł o canary

FAQ

Czym jest canary w AgentsRoom?

To sygnał wczesnego ostrzegania o dryfie kontekstu. Każdy agent zapisuje jednolinijkowy status na końcu każdej tury. Gdy agent przestaje aktualizować ten status przez dwie tury z rzędu, AgentsRoom uznaje canary za martwe i ostrzega cię, że agent prawdopodobnie traci kontekst, zwykle zanim zacznie halucynować.

Czy muszę cokolwiek konfigurować?

Nie. Canary wykorzystuje ponownie status co turę, który każdy agent AgentsRoom i tak już zapisuje na potrzeby paska bocznego i powiadomienia mobilnego. Uruchamiasz agenta i wykrywanie działa. Nie ma nic do skonfigurowania ani nic do zapamiętania.

Czym jest context rot?

W miarę jak rozmowa rośnie, model czyta wszystko od nowa w każdej turze, a trzymanie się instrukcji degraduje się. Zaczyna po cichu porzucać małe ograniczenia, a potem halucynuje: zmyślone pliki, błędne API, decyzje, które odrzuciłeś. Powiązany efekt lost-in-the-middle sprawia, że instrukcje zakopane w długim kontekście są przestrzegane mniej niezawodnie.

Dlaczego czekać na dwie pominięte tury, a nie na jedną?

Pojedyncza krótka tura może w pełni zasadnie zostawić status bez zmian, na przykład gdy agent tylko czyta plik i odpowiada zwięźle. Dwie ciche tury z rzędu to czysty sygnał, że agent naprawdę przestał trzymać się instrukcji, co utrzymuje niski poziom fałszywych alarmów.

Co robię, gdy pojawia się ostrzeżenie?

Dwie drogi. Zrestartuj agenta jednym kliknięciem, by ruszyć na świeżym, czystym kontekście, albo wpisz /compact, by podsumować rozmowę i zachować sedno bez objętości. Oba sprowadzają agenta z powrotem do ciasnego briefu, w którym radzi sobie najlepiej.

Czy działa z Codex i innymi dostawcami, nie tylko z Claude?

Tak. Canary opiera się wyłącznie na protokole statusu sesji, którego trzyma się każdy agent AgentsRoom, bez względu na CLI pod spodem. Claude Code, Codex, Gemini CLI i inni są objęci. Wykrywanie żyje w AgentsRoom, a nie u pojedynczego dostawcy.

Czy ostrzeżenie zniknie samo?

Tak. W chwili, gdy agent znów zapisze świeży status, licznik pominiętych tur się resetuje, a baner znika sam. Możesz też zamknąć go ręcznie dla tej sesji.

Czy to przydatne, gdy uruchamiam tylko jednego agenta?

Pomaga, ale błyszczy przy kilku agentach naraz. Przy jednym agencie możesz przeczytać każdą odpowiedź. Na flocie równoległej nikt nie czyta na nowo każdej odpowiedzi w czasie rzeczywistym, więc pasywny alarm dryfu to to, co nie pozwala po cichu degradującemu się agentowi prześliznąć się niezauważonym.

Czy canary spowalnia mojego agenta?

Nie. Podpina się pod jednolinijkowy status, który agent i tak już zapisuje w każdej turze. Żadnego dodatkowego promptu, żadnego dodatkowego wywołania modelu, żadnej dodanej latencji.

Dlaczego czysty kontekst czyni agenta lepszym?

Im więcej nieaktualnego kontekstu agent ze sobą wlecze, tym bardziej dryfuje, halucynuje i zwalnia. Restart albo kompaktowanie zrzuca martwy ciężar i sprowadza agenta z powrotem do krótkiego, skupionego briefu, w którym agenci kodujący są najbardziej niezawodni i najszybsi.

Może ci się też spodobać

Złap dryf kontekstu, zanim cię kosztuje

Pilotuj swoich agentów kodujących AI w kokpicie, który ostrzega cię, gdy któryś zaczyna gubić wątek. Pobierz AgentsRoom na macOS.

Za darmoPobierz AgentsRoom

Aplikacja towarzyszaca: monitoruj agentów w podrozy

Użyj Claude, Codex, Gemini CLI lub innego dostawcy AI.

Zainstaluj rozszerzenie
Chrome Web Store

Wysyłaj bugi i prośby bezpośrednio do swojego publicznego backlogu.

Spojrzenie na AgentsRoom w akcji.

Wiele projektów
Multi-provider
Wielu agentów
Status na żywo
Diff i commit
Aplikacja mobilna
Podgląd na żywo
Zespoły agentów
Testy w przeglądarce
Dev oparta na backlogu
Biblioteka promptów
Biblioteka umiejętności
Zobacz wszystkie funkcje