Repère ton agent IA
avant qu'il ne se mette à halluciner
Une session longue avec un agent de code IA ne casse jamais d'un coup. Il saute discrètement une instruction, puis un ou deux tours plus tard il invente un fichier, une API ou une décision qui n'ont jamais existé. Le canary AgentsRoom repère tôt ce moment de dérive, pour que tu réagisses avant que les hallucinations n'atteignent ton code.
Il s'appuie sur un signal que tes agents produisent déjà : rien à configurer, rien à retenir. Claude Code, Codex, Gemini CLI et tous les providers pilotés par AgentsRoom sont couverts.

Quand le canary se tait, AgentsRoom affiche cet avertissement au-dessus du terminal de l'agent : relance sur un contexte propre, ou compacte la conversation.
Le context rot est le tueur silencieux des sessions longues. À chaque tour, le modèle relit toute la conversation et reconstruit sa compréhension de zéro. Quand la fenêtre de contexte se remplit, le suivi des instructions est la première chose à lâcher. Le modèle a toujours l'air sûr de lui, mais il a commencé à abandonner les contraintes qu'il juge les moins importantes pour tenir le rythme.
C'est l'idée clé du canary. La dégradation ne commence pas par une hallucination. Elle commence par l'oubli silencieux d'une petite instruction. Plante une instruction dont le seul rôle est de se faire remarquer quand elle disparaît, et tu obtiens un fil-piège qui se déclenche avant les vrais dégâts.
AgentsRoom donne déjà cette instruction à chaque agent. Chaque agent écrit un statut une ligne à la fin de chaque tour, ce résumé court que tu vois dans la sidebar et sur ton téléphone. Cette écriture par tour, c'est le canary. Tant qu'elle se met à jour, l'agent lit et respecte encore ses instructions. Les premiers tours où elle disparaît sont ton alerte précoce.
Pourquoi un canary vaut mieux que relire la sortie
Sur un seul agent, tu peux lire chaque réponse et sentir quand il dérive. Sur une flotte d'agents en parallèle, personne ne relit chaque réponse en temps réel. Un canary te donne un signal passif que tu ne peux pas rater.
Le context rot et l'effet lost-in-the-middle sont bien documentés : plus le contexte est long, moins le modèle respecte fidèlement chaque instruction enfouie dedans. Le canary transforme cette fragilité en alarme visible.
Le canary précède les hallucinations. Le statut arrête de se mettre à jour un ou deux tours avant que l'agent ne commence à inventer, c'est exactement la fenêtre où tu veux réagir.
Aucun test à lancer, aucune commande à taper. La détection se fait toute seule pendant que tu travailles sur un autre agent ou un autre projet.
Comment fonctionne le canary
Une boucle d'alerte précoce intégrée, posée sur le statut que chaque agent rapporte déjà.
Chaque agent reçoit le canary, automatiquement
Quand tu lances un agent via AgentsRoom, la consigne de session est injectée dans son prompt : écrire un statut une ligne dans son fichier de session à la fin de chaque tour. Tu n'ajoutes rien. Le canary, c'est le même statut qui alimente la sidebar et la push mobile.
AgentsRoom photographie le statut au début du tour
Dès qu'un agent se met à réfléchir, AgentsRoom enregistre le statut courant. C'est la référence qu'il comparera une fois le tour terminé.
Il revérifie une fois le tour stabilisé
Un court délai après la fin du tour, AgentsRoom relit le fichier de session de l'agent. Assez de temps pour que l'agent écrive et que le poller de statut le récupère, donc une écriture lente n'est jamais prise pour un canary mort.
Une mise à jour manquée incrémente le compteur
Si le statut n'a pas changé, le compteur de tours manqués monte. Si l'agent a écrit un nouveau statut, le compteur revient à zéro et l'avertissement disparaît. Un tour silencieux ne suffit pas à alerter, car un tour court et légitime peut laisser le statut inchangé.
Deux tours silencieux d'affilée déclenchent l'alerte
Quand l'agent saute son statut deux tours de suite, c'est le signal net d'un oubli, pas du bruit. Un bandeau d'avertissement apparaît au-dessus du terminal de cet agent : le canary est mort, l'agent dérive probablement.
Relance proprement, ou compacte, puis continue
Le bandeau propose un bouton qui tue et redémarre l'agent sur un contexte frais, plus un rappel pour compacter la conversation. Quand l'agent recommence à rapporter son statut, l'avertissement s'efface tout seul.
Le canary dans la mine, pour ta session IA
Les mineurs descendaient avec un canary (canari) parce qu'il réagissait aux gaz toxiques bien avant eux. Même idée ici.
Un canary de prompt est une instruction triviale que l'agent est censé respecter à chaque tour. Tant qu'il le fait, tu sais que le modèle lit encore tes instructions de bout en bout. La première réponse qui l'oublie est ton fil-piège.
AgentsRoom ne colle pas un gadget séparé sur tes agents. Il réutilise le statut que chaque agent écrit déjà pour la sidebar et la notification sur le téléphone, donc le canary ne coûte rien et il est impossible d'oublier de le mettre en place.
Le but n'a jamais été le texte du statut. C'est le timing. Une fenêtre de contexte propre avec un brief serré bat une fenêtre surchargée à tous les coups. Quand le canary meurt, tu ne perds pas ta progression, tu lâches le poids mort qui tirait le modèle vers le bas.
Suivi de statut, puis détection de dérive
La plupart des cockpits te disent qu'un agent travaille ou a fini. Le canary te dit qu'il commence à décrocher.
Sans canary
- : Tu ne remarques que l'agent déraille qu'en lisant un chemin de fichier halluciné ou une API fausse.
- : À ce moment-là, les dernières réponses sont déjà suspectes et tu debugues l'agent, pas ton code.
- : Sur plusieurs agents à la fois, celui qui dérive se cache à la vue de tous.
- : Tu relances trop tard, une fois la mauvaise sortie déjà arrivée.
Avec le canary AgentsRoom
- : Un avertissement apparaît au-dessus du terminal dès qu'un agent arrête de rapporter son statut.
- : Tu attrapes la dérive un ou deux tours avant les hallucinations.
- : Tu réinitialises seulement l'agent qui a décroché, pas tout le projet.
- : Tu relances sur un contexte propre et court, et l'agent redevient plus net et plus rapide.
Une alerte précoce plutôt qu'une autopsie. C'est tout l'intérêt du canary.
Pourquoi un contexte frais fait un meilleur agent
Plus tu empiles d'informations dans un agent, plus il a tendance à dériver, halluciner et ralentir. Une fenêtre de contexte faite surtout d'explorations périmées, d'impasses et de questions déjà tranchées travaille contre le modèle à chaque tour.
Quand le canary meurt, la solution est rarement de pousser plus fort sur le même fil. Arrête de faire confiance aux deux dernières réponses, puis compacte la conversation ou démarre une nouvelle session et réinjecte seulement l'essentiel : le fichier que tu édites, l'objectif, et les décisions déjà prises.
Compacter résume la conversation pour que l'agent garde l'essentiel sans le volume. Relancer lui donne une page blanche. Les deux te ramènent à un brief serré, là où les agents de code sont les meilleurs. Le canary AgentsRoom te dit quel est le bon moment.
C'est provider-agnostic par conception. Claude Code, Codex, Gemini CLI et d'autres agents partagent les mêmes limites de contexte et rapportent tous un statut via AgentsRoom, donc le même canary les protège tous. La détection de dérive vit dans AgentsRoom, pas dans un CLI particulier.
Lis le guide complet du canary
On a écrit un dossier sur l'astuce du canary : pourquoi les agents déraillent, comment planter un canary à la main dans ton CLAUDE.md ou ton AGENTS.md, et quoi faire au moment où il meurt. AgentsRoom automatise la surveillance sur toute ta flotte.
Lire l'article sur le canaryFAQ
C'est quoi le canary dans AgentsRoom ?
C'est un signal d'alerte précoce de dérive de contexte. Chaque agent écrit un statut une ligne à la fin de chaque tour. Quand un agent arrête de mettre à jour ce statut deux tours consécutifs, AgentsRoom considère le canary mort et t'avertit que l'agent perd probablement le fil, en général avant qu'il ne se mette à halluciner.
Faut-il configurer quelque chose ?
Non. Le canary réutilise le statut par tour que chaque agent AgentsRoom écrit déjà pour la sidebar et la notification mobile. Tu lances un agent et la détection est active. Rien à configurer, rien à retenir.
C'est quoi le context rot ?
Quand une conversation grandit, le modèle relit tout à chaque tour et le suivi des instructions se dégrade. Il abandonne discrètement de petites contraintes, puis hallucine : fichiers inventés, API fausses, décisions que tu avais écartées. L'effet lost-in-the-middle associé fait que les instructions enfouies dans un long contexte sont respectées de manière moins fiable.
Pourquoi attendre deux tours manqués au lieu d'un ?
Un seul tour court peut légitimement laisser le statut inchangé, par exemple quand l'agent lit juste un fichier et répond brièvement. Deux tours silencieux d'affilée, c'est le signal net que l'agent a vraiment arrêté de suivre ses instructions, ce qui limite les faux positifs.
Je fais quoi quand l'avertissement apparaît ?
Deux options. Relancer l'agent en un clic pour repartir sur un contexte propre, ou taper /compact pour résumer la conversation et garder l'essentiel sans le volume. Les deux ramènent l'agent à un brief serré, là où il est le meilleur.
Ça marche avec Codex et d'autres providers, pas seulement Claude ?
Oui. Le canary s'appuie uniquement sur le protocole de statut de session que chaque agent AgentsRoom suit, quel que soit le CLI sous-jacent. Claude Code, Codex, Gemini CLI et d'autres sont tous couverts. La détection vit dans AgentsRoom, pas dans un provider particulier.
L'avertissement disparaît-il tout seul ?
Oui. Dès que l'agent réécrit un statut frais, le compteur de tours manqués se réinitialise et le bandeau s'efface tout seul. Tu peux aussi le fermer manuellement pour cette session.
C'est utile si je ne lance qu'un seul agent ?
Ça aide, mais ça brille avec plusieurs agents à la fois. Sur un seul agent, tu peux lire chaque réponse. Sur une flotte en parallèle, personne ne relit chaque réponse en temps réel, donc une alarme passive de dérive est ce qui empêche un agent qui se dégrade en silence de passer entre les mailles.
Le canary ralentit-il mon agent ?
Non. Il se greffe sur le statut une ligne que l'agent écrit déjà à chaque tour. Pas de prompt en plus, pas d'appel modèle en plus, pas de latence ajoutée.
Pourquoi un contexte propre rend l'agent meilleur ?
Plus un agent traîne de contexte périmé, plus il dérive, hallucine et ralentit. Relancer ou compacter lâche le poids mort et ramène l'agent à un brief court et ciblé, là où les agents de code sont les plus fiables et les plus rapides.
Tu pourrais aussi aimer
Suivi du statut des agents
Des indicateurs colorés en direct montrant quels agents réfléchissent, ont fini ou attendent une instruction.
Dynamic Island
Un indicateur de statut flottant, toujours au premier plan, visible au-dessus de toutes les apps.
Notifications d'agents
Des badges non lus et des push quand un agent termine ou a besoin de toi.
Consommation de tokens
Vois la consommation de tokens et le coût par session en direct, et où optimiser.
Statistiques de projet
Temps, prompts, tokens et coût par projet et par agent dans un seul tableau de bord.
Multi-provider
Lance Claude Code, Codex et Gemini CLI côte à côte et change sans perdre le contexte.
Attrape la dérive de contexte avant qu'elle ne coûte cher
Pilote tes agents de code IA dans un cockpit qui t'alerte quand l'un d'eux commence à perdre le fil. Télécharge AgentsRoom pour macOS.
App companion : suivez vos agents en déplacement
Utilisez Claude, Codex, Gemini CLI ou un autre fournisseur IA.
Remontez bugs et demandes directement dans votre backlog public.
Aperçu d'AgentsRoom en action.