El truco del canario: detecta cuándo Claude (o cualquier agente de IA) empieza a alucinar

Un truco de una línea para saber cuándo tu agente de programación con IA se está degradando: haz que empiece cada respuesta con un nombre. Cuando el nombre desaparece, el canario ha muerto y toca empezar una sesión nueva. Funciona con Claude, Codex, Gemini CLI, Mistral Vibe y todos los LLM.

Una sesión larga con un agente de programación de IA rara vez se rompe de golpe. Claude no pasa de afilado a disparatado en un solo turno. Primero se salta en silencio una pequeña instrucción. Uno o dos turnos después, empieza a inventar: un archivo que no existe, una API que nunca estuvo ahí, una decisión que habías descartado explícitamente. Para cuando detectas una ruta alucinada, ya has perdido la confianza en las últimas respuestas y estás depurando al agente en vez de tu código.

Existe una forma gratuita, de una sencillez casi vergonzosa, de obtener un aviso temprano. Se llama canario y se monta en una línea.

Por qué los agentes se descarrilan: el context rot

En cada turno, el agente vuelve a leer toda la conversación, desde el primer mensaje hasta el último, y reconstruye su comprensión desde cero. A medida que la ventana de contexto se llena, lo primero que falla es el cumplimiento de las instrucciones. El modelo sigue sonando seguro, pero ha empezado a soltar las restricciones menos importantes para no quedarse atrás. Los investigadores lo llaman «context rot», junto con el efecto «lost in the middle» asociado: cuanto más largo es el contexto, con menos fiabilidad respeta el modelo cualquier instrucción enterrada dentro.

Esa es la idea clave. La degradación no empieza con las alucinaciones. Empieza con el modelo ignorando en silencio una pequeña instrucción. Así que si plantas una instrucción minúscula cuyo único trabajo es notarse cuando desaparece, obtienes un hilo trampa que salta antes del daño real.

En qué consiste el truco del canario

Los mineros bajaban antaño con un canario. El pájaro era más sensible a los gases tóxicos que las personas: cuando dejaba de cantar, los mineros sabían que tenían que salir mucho antes de notar nada ellos mismos.

Un canario de prompt es la misma idea. Añades una instrucción trivial al archivo que tu agente lee en cada turno: empezar cada respuesta con un nombre elegido. Ese nombre es tu canario. Mientras aparezca al principio de cada respuesta, el modelo sigue leyendo y respetando tus instrucciones. La primera respuesta que olvida el nombre es tu señal de que la sesión se está degradando, normalmente uno o dos turnos antes de que aparezcan las alucinaciones de verdad. La técnica la ha popularizado en la comunidad del código agéntico gente como Peter Steinberger, creador de OpenClaw, que se apoya en pequeñas señales canario para detectar pronto una sesión que va mal.

Curva que muestra cómo cae la fiabilidad del cumplimiento de instrucciones de un agente de IA a lo largo de una sesión larga: la instrucción canario desaparece antes de que empiecen las alucinaciones, dejando una ventana de aviso temprano.

El canario desaparece antes de que empiecen las alucinaciones. Ese hueco es tu ventana para reaccionar.

Cómo montarlo en una línea

Pon la instrucción en el archivo que tu agente carga en cada turno:

  • Claude Code lee CLAUDE.md.
  • Codex, Gemini CLI, Mistral Vibe y la mayoría de los demás CLI leen AGENTS.md.
## Canario
Empieza cada respuesta con el nombre "Felix".

Elige un nombre corto y distintivo: tu gato, un color, cualquier cosa que detectes al instante al principio de una respuesta. Mantenlo absolutamente simple. Una instrucción compleja va en contra del propósito, porque quieres la cosa más fácil posible de soltar para el modelo. Si hasta esto se cae, todo lo más matizado de tu contexto ya está en peligro.

Qué hacer cuando el canario muere

El nombre nunca fue lo importante. Lo que importa es el momento. Cuando el canario desaparece, no insistas con el hilo actual:

  1. Deja de confiar en las dos o tres últimas respuestas y reléelas con recelo.
  2. Ejecuta /clear o empieza una sesión nueva.
  3. Reinyecta solo el contexto que importa: el archivo que estás editando, el objetivo y las decisiones ya tomadas.

Una ventana limpia con un brief ajustado siempre gana a una saturada. No pierdes el avance, sueltas el peso muerto que arrastraba al modelo hacia abajo.

Bucle de decisión: lee la respuesta del agente, comprueba si empieza con el nombre. Si sí, el canario está vivo, sigue trabajando. Si no, el canario ha muerto, así que limpia el contexto o empieza una sesión nueva y reinyecta el contexto clave.

Todo el hábito cabe en un bucle: una mirada a la primera palabra, decides, continúas o reinicias.

Funciona en todos los modelos, no solo en Claude

Este truco es agnóstico del proveedor por diseño. Claude, Codex, Gemini CLI, Mistral Vibe, Grok y Aider comparten los mismos límites de contexto, todos leen un archivo de contexto y todos pueden llevar un canario. Nos centramos primero en Claude porque es el agente de programación más usado hoy, pero nada de esto es específico de Claude. Cualquier LLM que llene su contexto empezará por soltar tu instrucción más pequeña, así que el mismo canario protege a todos. Si mantienes un archivo de contexto AGENTS.md, el canario es solo una línea más en él.

Vigilar el canario en toda una flota

Leer cada respuesta para cazar un nombre que falta es fácil con un solo agente. No escala cuando tienes varios funcionando a la vez, que es justo donde se concentra hoy el trabajo serio.

Esa es la parte que AgentsRoom pone fácil. Es una cabina multiagente: cada agente tiene un rol, un punto de estado en vivo y su propio color, y supervisas toda la flota desde una sola ventana. Pon el canario una vez en tu CLAUDE.md o AGENTS.md compartido y cada agente lo hereda. Cuando un agente empieza a olvidar el nombre, lo cazas de un vistazo y reinicias solo ese hilo en lugar de todo el proyecto. El aislamiento opcional por worktree de git evita que los agentes en paralelo se pisen mientras lo haces.

Siete proveedores, una sola cabina y un canario vigilando cada uno de ellos. Descarga AgentsRoom, consulta la matriz de compatibilidad de proveedores para ver qué soporta cada agente y lee más sobre el soporte multiproveedor y cómo el cambio a mitad de conversación mantiene intacto tu contexto.

Descargar AgentsRoom

Ejecuta tus agentes Claude en todos tus proyectos, desde una sola ventana.

GratisDescargar AgentsRoom

App complementaria: supervisa tus agentes en movimiento

Usa Claude, Codex, Gemini CLI u otro proveedor de IA.

Instalar la extensión
Chrome Web Store

Envía bugs y peticiones directamente a tu backlog público.

Un vistazo a AgentsRoom en acción.

Multi-proyectos
Multi-proveedor
Multi-agentes
Estado en vivo
Diff y commit
App móvil
Vista previa
Equipos de agentes
Pruebas en navegador
Dev guiada por backlog
Biblioteca de prompts
Biblioteca de skills
Ver todas las funcionalidades