Il trucco del canarino: scopri quando Claude (o qualsiasi agente IA) inizia ad allucinare

Un trucco di una riga per capire quando il tuo agente di coding IA si sta degradando: fagli iniziare ogni risposta con un nome. Quando il nome sparisce, il canarino è morto ed è ora di una sessione nuova. Funziona con Claude, Codex, Antigravity CLI, Mistral Vibe e ogni LLM.

18 giugno 2026

Una sessione lunga con un agente di coding IA raramente si rompe tutta in una volta. Claude non passa da lucido a senza senso in un solo turno. Prima salta in silenzio una piccola istruzione. Un turno o due dopo, comincia a inventare: un file che non esiste, un'API che non c'è mai stata, una decisione che avevi esplicitamente scartato. Quando individui un percorso allucinato, hai già perso fiducia nelle ultime risposte e stai facendo il debug dell'agente invece che del tuo codice.

Esiste un modo gratuito, di una semplicità quasi imbarazzante, per ottenere un avviso anticipato. Si chiama canarino e si imposta in una riga.

Perché gli agenti deragliano: il context rot

A ogni turno, l'agente rilegge l'intera conversazione, dal primo messaggio all'ultimo, e ricostruisce la propria comprensione da zero. Man mano che la finestra di contesto si riempie, la prima cosa a cedere è il rispetto delle istruzioni. Il modello sembra ancora sicuro di sé, ma ha iniziato a mollare i vincoli meno importanti per tenere il passo. I ricercatori lo chiamano «context rot», insieme all'effetto correlato «lost in the middle»: più lungo è il contesto, meno affidabilmente il modello rispetta una singola istruzione sepolta al suo interno.

È questa l'intuizione chiave. Il degrado non inizia con le allucinazioni. Inizia con il modello che ignora in silenzio una piccola istruzione. Quindi se pianti un'istruzione minuscola il cui unico compito è farsi notare quando sparisce, ottieni un filo d'inciampo che scatta prima del danno vero.

In cosa consiste il trucco del canarino

I minatori un tempo scendevano con un canarino. L'uccello era più sensibile ai gas tossici degli esseri umani: quando smetteva di cantare, i minatori sapevano di dover uscire molto prima di sentire qualcosa loro stessi.

Un canarino da prompt è la stessa idea. Aggiungi un'istruzione banale al file che il tuo agente legge a ogni turno: iniziare ogni risposta con un nome scelto. Quel nome è il tuo canarino. Finché compare all'inizio di ogni risposta, il modello legge e rispetta ancora le tue istruzioni. La prima risposta che dimentica il nome è il tuo segnale che la sessione si sta degradando, di solito un turno o due prima che compaiano le vere allucinazioni. La tecnica è stata resa popolare nella comunità del coding agentico da sviluppatori come Peter Steinberger, creatore di OpenClaw, che si affidano a piccoli segnali canarino per cogliere presto una sessione che va male.

Curva che mostra come l'affidabilità nel rispetto delle istruzioni di un agente IA cali nel corso di una sessione lunga: l'istruzione canarino sparisce prima che inizino le allucinazioni, lasciando una finestra di allerta anticipata.

Il canarino sparisce prima che inizino le allucinazioni. Quel divario è la tua finestra per reagire.

Come impostarlo in una riga

Metti l'istruzione nel file che il tuo agente carica a ogni turno:

Claude Code legge CLAUDE.md.
Codex, Antigravity CLI, Mistral Vibe e la maggior parte degli altri CLI leggono AGENTS.md.

## Canarino
Inizia ogni risposta con il nome "Felix".

Scegli un nome corto e riconoscibile: il tuo gatto, un colore, qualsiasi cosa che noti all'istante all'inizio di una risposta. Tienilo assolutamente semplice. Un'istruzione complessa va contro lo scopo, perché vuoi la cosa più facile possibile da mollare per il modello. Se cade persino questa, tutto ciò che è più sottile nel tuo contesto è già a rischio.

Cosa fare quando il canarino muore

Il nome non è mai stato il punto. Conta il tempismo. Quando il canarino sparisce, non insistere sul thread corrente:

Smetti di fidarti delle ultime due o tre risposte e rileggile con sospetto.
Esegui /clear o avvia una sessione nuova.
Reinietta solo il contesto che conta: il file che stai modificando, l'obiettivo e le decisioni già prese.

Una finestra pulita con un brief stringato batte sempre una sovraccarica. Non perdi i progressi, scarichi il peso morto che stava trascinando giù il modello.

Ciclo decisionale: leggi la risposta dell'agente, controlla se inizia con il nome. Se sì, il canarino è vivo, continua a lavorare. Se no, il canarino è morto, quindi svuota il contesto o avvia una sessione nuova e reinietta il contesto chiave.

Tutta l'abitudine sta in un ciclo: un'occhiata alla prima parola, decidi, continui o resetti.

Funziona su ogni modello, non solo su Claude

Questo trucco è agnostico rispetto al provider per progettazione. Claude, Codex, Antigravity CLI, Mistral Vibe, Grok e Aider condividono gli stessi limiti di contesto, leggono tutti un file di contesto e possono tutti portare un canarino. Ci concentriamo prima su Claude perché è l'agente di coding più usato oggi, ma niente qui è specifico di Claude. Qualsiasi LLM che riempie il proprio contesto inizierà mollando la tua istruzione più piccola, quindi lo stesso canarino li protegge tutti. Se mantieni un file di contesto AGENTS.md, il canarino è solo una riga in più al suo interno.

Sorvegliare il canarino su un'intera flotta

Leggere ogni risposta a caccia di un nome mancante è facile con un solo agente. Non scala quando ne hai diversi in esecuzione insieme, ed è esattamente lì che si concentra oggi il lavoro serio.

È la parte che AgentsRoom rende facile. È una cabina di pilotaggio multiagente: ogni agente ha un ruolo, un punto di stato dal vivo e il proprio colore, e sorvegli l'intera flotta da una sola finestra. Metti il canarino una volta nel tuo CLAUDE.md o AGENTS.md condiviso, e ogni agente lo eredita. Quando un agente inizia a dimenticare il nome, lo cogli a colpo d'occhio e resetti solo quel thread invece dell'intero progetto. L'isolamento opzionale tramite worktree git evita che gli agenti in parallelo si pestino i piedi mentre lo fai.

AgentsRoom integra direttamente questo trucco, così non devi nemmeno guardare tu stesso le risposte. Ogni agente che lancia scrive già uno stato di una riga alla fine di ogni turno, e AgentsRoom lo tratta come il canary: quando un agente smette di aggiornarlo per due turni di fila, appare un avviso sopra il terminale di quell'agente, con un rilancio in un clic su un contesto pulito e un promemoria per compattare. Ricevi l'allarme precoce in automatico, su ogni agente, su tutta la flotta. Leggi come funziona nella pagina rilevamento della deriva di contesto.

Sette provider, una sola cabina e un canarino che veglia su ciascuno di loro. Scarica AgentsRoom, consulta la matrice di compatibilità dei provider per vedere cosa supporta ogni agente e scopri di più sul supporto multi-provider e su come il cambio a metà conversazione mantiene intatto il tuo contesto.

Continua a leggere

Scarica AgentsRoom

Eseguire i vostri agenti AI (Claude, Codex, Antigravity CLI, OpenCode, Aider, Grok Build, Mistral Vibe, Kimi Code) su tutti i vostri progetti, da una singola finestra.

GratisScarica AgentsRoom

App companion: monitora i tuoi agenti in movimento

Usa Claude, Codex, Antigravity CLI o un altro provider IA.

Installa l'estensione

Chrome Web Store

Invia bug e richieste direttamente nel tuo backlog pubblico.