Il trucco del canarino: scopri quando Claude (o qualsiasi agente IA) inizia ad allucinare
Un trucco di una riga per capire quando il tuo agente di coding IA si sta degradando: fagli iniziare ogni risposta con un nome. Quando il nome sparisce, il canarino è morto ed è ora di una sessione nuova. Funziona con Claude, Codex, Gemini CLI, Mistral Vibe e ogni LLM.
Una sessione lunga con un agente di coding IA raramente si rompe tutta in una volta. Claude non passa da lucido a senza senso in un solo turno. Prima salta in silenzio una piccola istruzione. Un turno o due dopo, comincia a inventare: un file che non esiste, un'API che non c'è mai stata, una decisione che avevi esplicitamente scartato. Quando individui un percorso allucinato, hai già perso fiducia nelle ultime risposte e stai facendo il debug dell'agente invece che del tuo codice.
Esiste un modo gratuito, di una semplicità quasi imbarazzante, per ottenere un avviso anticipato. Si chiama canarino e si imposta in una riga.
Perché gli agenti deragliano: il context rot
A ogni turno, l'agente rilegge l'intera conversazione, dal primo messaggio all'ultimo, e ricostruisce la propria comprensione da zero. Man mano che la finestra di contesto si riempie, la prima cosa a cedere è il rispetto delle istruzioni. Il modello sembra ancora sicuro di sé, ma ha iniziato a mollare i vincoli meno importanti per tenere il passo. I ricercatori lo chiamano «context rot», insieme all'effetto correlato «lost in the middle»: più lungo è il contesto, meno affidabilmente il modello rispetta una singola istruzione sepolta al suo interno.
È questa l'intuizione chiave. Il degrado non inizia con le allucinazioni. Inizia con il modello che ignora in silenzio una piccola istruzione. Quindi se pianti un'istruzione minuscola il cui unico compito è farsi notare quando sparisce, ottieni un filo d'inciampo che scatta prima del danno vero.
In cosa consiste il trucco del canarino
I minatori un tempo scendevano con un canarino. L'uccello era più sensibile ai gas tossici degli esseri umani: quando smetteva di cantare, i minatori sapevano di dover uscire molto prima di sentire qualcosa loro stessi.
Un canarino da prompt è la stessa idea. Aggiungi un'istruzione banale al file che il tuo agente legge a ogni turno: iniziare ogni risposta con un nome scelto. Quel nome è il tuo canarino. Finché compare all'inizio di ogni risposta, il modello legge e rispetta ancora le tue istruzioni. La prima risposta che dimentica il nome è il tuo segnale che la sessione si sta degradando, di solito un turno o due prima che compaiano le vere allucinazioni. La tecnica è stata resa popolare nella comunità del coding agentico da sviluppatori come Peter Steinberger, creatore di OpenClaw, che si affidano a piccoli segnali canarino per cogliere presto una sessione che va male.
Il canarino sparisce prima che inizino le allucinazioni. Quel divario è la tua finestra per reagire.
Come impostarlo in una riga
Metti l'istruzione nel file che il tuo agente carica a ogni turno:
- Claude Code legge
CLAUDE.md. - Codex, Gemini CLI, Mistral Vibe e la maggior parte degli altri CLI leggono
AGENTS.md.
## Canarino
Inizia ogni risposta con il nome "Felix".
Scegli un nome corto e riconoscibile: il tuo gatto, un colore, qualsiasi cosa che noti all'istante all'inizio di una risposta. Tienilo assolutamente semplice. Un'istruzione complessa va contro lo scopo, perché vuoi la cosa più facile possibile da mollare per il modello. Se cade persino questa, tutto ciò che è più sottile nel tuo contesto è già a rischio.
Cosa fare quando il canarino muore
Il nome non è mai stato il punto. Conta il tempismo. Quando il canarino sparisce, non insistere sul thread corrente:
- Smetti di fidarti delle ultime due o tre risposte e rileggile con sospetto.
- Esegui
/clearo avvia una sessione nuova. - Reinietta solo il contesto che conta: il file che stai modificando, l'obiettivo e le decisioni già prese.
Una finestra pulita con un brief stringato batte sempre una sovraccarica. Non perdi i progressi, scarichi il peso morto che stava trascinando giù il modello.
Tutta l'abitudine sta in un ciclo: un'occhiata alla prima parola, decidi, continui o resetti.
Funziona su ogni modello, non solo su Claude
Questo trucco è agnostico rispetto al provider per progettazione. Claude, Codex, Gemini CLI, Mistral Vibe, Grok e Aider condividono gli stessi limiti di contesto, leggono tutti un file di contesto e possono tutti portare un canarino. Ci concentriamo prima su Claude perché è l'agente di coding più usato oggi, ma niente qui è specifico di Claude. Qualsiasi LLM che riempie il proprio contesto inizierà mollando la tua istruzione più piccola, quindi lo stesso canarino li protegge tutti. Se mantieni un file di contesto AGENTS.md, il canarino è solo una riga in più al suo interno.
Sorvegliare il canarino su un'intera flotta
Leggere ogni risposta a caccia di un nome mancante è facile con un solo agente. Non scala quando ne hai diversi in esecuzione insieme, ed è esattamente lì che si concentra oggi il lavoro serio.
È la parte che AgentsRoom rende facile. È una cabina di pilotaggio multiagente: ogni agente ha un ruolo, un punto di stato dal vivo e il proprio colore, e sorvegli l'intera flotta da una sola finestra. Metti il canarino una volta nel tuo CLAUDE.md o AGENTS.md condiviso, e ogni agente lo eredita. Quando un agente inizia a dimenticare il nome, lo cogli a colpo d'occhio e resetti solo quel thread invece dell'intero progetto. L'isolamento opzionale tramite worktree git evita che gli agenti in parallelo si pestino i piedi mentre lo fai.
Sette provider, una sola cabina e un canarino che veglia su ciascuno di loro. Scarica AgentsRoom, consulta la matrice di compatibilità dei provider per vedere cosa supporta ogni agente e scopri di più sul supporto multi-provider e su come il cambio a metà conversazione mantiene intatto il tuo contesto.
Scarica AgentsRoom
Eseguire i vostri agenti AI (Claude, Codex, OpenCode, Gemini CLI, Aider) su tutti i vostri progetti, da una singola finestra.
App companion: monitora i tuoi agenti in movimento
Usa Claude, Codex, Gemini CLI o un altro provider IA.
Invia bug e richieste direttamente nel tuo backlog pubblico.
Uno sguardo ad AgentsRoom in azione.