O truque do canário: descubra quando o Claude (ou qualquer agente de IA) começa a alucinar

Um truque de uma linha para saber quando o seu agente de programação com IA está se degradando: faça-o começar cada resposta com um nome. Quando o nome some, o canário morreu e é hora de iniciar uma sessão nova. Funciona com Claude, Codex, Gemini CLI, Mistral Vibe e todos os LLMs.

Uma sessão longa com um agente de programação de IA raramente quebra de uma vez. O Claude não passa de afiado a sem sentido em um único turno. Primeiro ele pula em silêncio uma pequena instrução. Um ou dois turnos depois, começa a inventar: um arquivo que não existe, uma API que nunca esteve ali, uma decisão que você tinha descartado explicitamente. Quando você percebe um caminho alucinado, já perdeu a confiança nas últimas respostas e está depurando o agente em vez do seu código.

Existe um jeito gratuito, de uma simplicidade quase constrangedora, de obter um aviso antecipado. Chama-se canário e se monta em uma linha.

Por que os agentes saem dos trilhos: o context rot

A cada turno, o agente relê toda a conversa, da primeira mensagem até a última, e reconstrói seu entendimento do zero. À medida que a janela de contexto enche, a primeira coisa que falha é o cumprimento das instruções. O modelo continua soando confiante, mas começou a largar as restrições menos importantes para acompanhar. Os pesquisadores chamam isso de «context rot», junto com o efeito associado «lost in the middle»: quanto mais longo o contexto, com menos confiabilidade o modelo honra qualquer instrução enterrada lá dentro.

Essa é a ideia central. A degradação não começa com alucinações. Começa com o modelo ignorando em silêncio uma pequena instrução. Então, se você planta uma instrução minúscula cujo único trabalho é ser notada quando some, ganha um fio de armadilha que dispara antes do estrago de verdade.

Em que consiste o truque do canário

Os mineiros antigamente desciam com um canário. O pássaro era mais sensível a gases tóxicos do que as pessoas: quando parava de cantar, os mineiros sabiam que precisavam sair muito antes de sentirem qualquer coisa.

Um canário de prompt é a mesma ideia. Você adiciona uma instrução trivial ao arquivo que o seu agente lê a cada turno: começar cada resposta com um nome escolhido. Esse nome é o seu canário. Enquanto ele aparecer no começo de cada resposta, o modelo ainda está lendo e honrando as suas instruções. A primeira resposta que esquece o nome é o seu sinal de que a sessão está se degradando, em geral um ou dois turnos antes de surgirem as alucinações de verdade. A técnica foi popularizada na comunidade de código agêntico por desenvolvedores como Peter Steinberger, criador do OpenClaw, que se apoiam em pequenos sinais de canário para flagrar cedo uma sessão indo mal.

Curva mostrando a confiabilidade do cumprimento de instruções de um agente de IA caindo ao longo de uma sessão longa: a instrução canário some antes de as alucinações começarem, deixando uma janela de aviso antecipado.

O canário some antes de as alucinações começarem. Essa lacuna é a sua janela para reagir.

Como montar em uma linha

Coloque a instrução no arquivo que o seu agente carrega a cada turno:

  • O Claude Code lê CLAUDE.md.
  • Codex, Gemini CLI, Mistral Vibe e a maioria dos outros CLIs leem AGENTS.md.
## Canário
Comece cada resposta com o nome "Felix".

Escolha um nome curto e distinto: o seu gato, uma cor, qualquer coisa que você note na hora no começo de uma resposta. Mantenha tudo absolutamente simples. Uma instrução complexa vai contra o objetivo, porque você quer a coisa mais fácil possível de o modelo largar. Se até isso cair, tudo o que é mais sutil no seu contexto já está em risco.

O que fazer quando o canário morre

O nome nunca foi o ponto. O que importa é o momento. Quando o canário some, não force o fio atual:

  1. Pare de confiar nas duas ou três últimas respostas e releia-as com desconfiança.
  2. Rode /clear ou inicie uma sessão nova.
  3. Reinjete apenas o contexto que importa: o arquivo que você está editando, o objetivo e as decisões já tomadas.

Uma janela limpa com um briefing enxuto sempre vence uma sobrecarregada. Você não perde o progresso, larga o peso morto que estava puxando o modelo para baixo.

Laço de decisão: leia a resposta do agente, verifique se ela começa com o nome. Se sim, o canário está vivo, siga trabalhando. Se não, o canário morreu, então limpe o contexto ou inicie uma sessão nova e reinjete o contexto principal.

Todo o hábito cabe em um laço: uma olhada na primeira palavra, você decide, continua ou reinicia.

Funciona em todos os modelos, não só no Claude

Esse truque é agnóstico de fornecedor por design. Claude, Codex, Gemini CLI, Mistral Vibe, Grok e Aider compartilham os mesmos limites de contexto, todos leem um arquivo de contexto e todos podem carregar um canário. Focamos primeiro no Claude porque é o agente de programação mais usado hoje, mas nada aqui é específico do Claude. Qualquer LLM que enche o contexto vai começar largando a sua menor instrução, então o mesmo canário protege cada um deles. Se você mantém um arquivo de contexto AGENTS.md, o canário é só mais uma linha nele.

Vigiar o canário em toda uma frota

Ler cada resposta para caçar um nome faltando é fácil com um único agente. Não escala quando você tem vários rodando ao mesmo tempo, que é exatamente onde se concentra o trabalho sério hoje.

Essa é a parte que o AgentsRoom torna fácil. É um cockpit multiagente: cada agente tem um papel, um ponto de status ao vivo e sua própria cor, e você supervisiona a frota inteira de uma só janela. Coloque o canário uma vez no seu CLAUDE.md ou AGENTS.md compartilhado, e cada agente o herda. Quando um agente começa a esquecer o nome, você pega de relance e reinicia só aquele fio em vez do projeto todo. O isolamento opcional por worktree do git evita que agentes em paralelo se atrapalhem enquanto você faz isso.

Sete fornecedores, um cockpit e um canário vigiando cada um deles. Baixe o AgentsRoom, confira a matriz de compatibilidade de fornecedores para ver o que cada agente suporta e leia mais sobre o suporte multifornecedor e como a troca no meio da conversa mantém o seu contexto intacto.

Baixar AgentsRoom

Rode seus agentes Claude em todos os seus projetos, de uma única janela.

GratisBaixar AgentsRoom

App complementar: acompanhe seus agentes em qualquer lugar

Use Claude, Codex, Gemini CLI ou outro provedor de IA.

Instalar a extensão
Chrome Web Store

Envie bugs e pedidos direto para o seu backlog público.

Uma visão do AgentsRoom em ação.

Multi-projetos
Multi-provedor
Multi-agentes
Status ao vivo
Diff e commit
App mobile
Preview ao vivo
Equipes de agentes
Testes no navegador
Dev guiada por backlog
Biblioteca de prompts
Biblioteca de skills
Ver todas as funcionalidades