Claude Code token usage,
rastreado por sesion, en tiempo real
AgentsRoom vigila tu Claude Code token usage en cada terminal de agente. Un pequeno contador de tokens vive en el composer y se actualiza en vivo. Cuando tu consumo de tokens se vuelve pesado en una sola sesion de Claude, el badge se pone rojo y te avisa antes de que agotes la ventana de contexto.
Haz clic en el badge y se abre el monitor de sesion : input tokens, output tokens, cache reads, cache writes, cache hit rate, conteo de mensajes, modelos enrutados, duracion de la sesion y usos de herramientas. Un panel, una sesion de Claude, todos los numeros que mueven tu Claude Code token usage.
Demo en vivo del badge de Claude Code token usage en AgentsRoom : vive en cada composer de agente, se pone rojo en consumo pesado de tokens y abre un monitor completo de sesion con input tokens, output tokens, cache reads y cache writes.
Claude Code token usage es el costo variable numero uno de hacer correr agentes IA de codigo. Cada prompt, cada llamada a herramienta, cada reinyeccion de CLAUDE.md come tokens. Sin visibilidad, descubres que agotaste tu presupuesto cuando la API te limita o llega la factura. AgentsRoom pone un medidor en vivo de Claude Code token usage en cada sesion de agente para que veas el consumo mientras pasa, no despues.
El contador de tokens vive en el composer del terminal, justo al lado del boton de enviar. Se actualiza unos segundos despues de cada turno de Claude. Los tokens se acumulan en toda la sesion : input tokens, output tokens, cache writes y cache reads, todos sumados y con codigo de color para que los leas de un vistazo. Cuando el Claude Code token usage por sesion cruza un umbral de consumo pesado, el badge se pone rojo con un icono de aviso, igual que el indicador de combustible te avisa antes de que el tanque se vacie.
Haz clic y se abre el monitor de sesion. Obtienes una foto en vivo de la sesion activa de Claude : duracion desde el primer mensaje, numero de prompts del usuario versus turnos del asistente, usos de herramientas, modelos que manejaron la conversacion, el id de sesion de Claude (copiable para --resume), y el desglose completo de tokens. El cache hit rate se calcula al vuelo, con codigo de color verde / ambar / rojo, con un recordatorio de una linea : los cache reads cuestan aproximadamente diez veces menos que el input fresco. Ese unico panel convierte el Claude Code token usage de una caja negra en un medidor en tiempo real.
Por que importa el Claude Code token usage por sesion
La mayoria de wrappers de Claude reportan el consumo de tokens a nivel de cuenta, una vez al dia, en un dashboard que tienes que acordarte de abrir. Para entonces el dano ya esta hecho. AgentsRoom empuja el Claude Code token usage a la superficie, en cada terminal de agente, para que no puedas ignorarlo. El contador de tokens esta a dos centimetros del boton de enviar. Lo miras como miras el badge de no leidos en tu telefono.
Por sesion es la granularidad correcta. Un equipo de agentes corriendo en paralelo no te dice quien esta quemando tokens. Un agente puede estar en bucle sobre un prompt atascado mientras otros cuatro estan tranquilos. Con un medidor de Claude Code token usage por sesion, el agente ruidoso destaca al instante : su badge esta rojo, su cache hit rate es bajo, su conteo de mensajes sube rapido. Saltas, arreglas el prompt, salvas el presupuesto.
Toda la feature es local. AgentsRoom lee tu Claude Code token usage directamente desde los transcripts JSONL que Claude escribe en ~/.claude/projects/. Nada sale de tu maquina. Sin tracker de uso de terceros. Sin proxy delante de la API. El contador de tokens en AgentsRoom es solo una lectura mas rapida y mas visible de los datos que Anthropic ya guarda en tu disco.

El panel de Claude Code token usage en AgentsRoom. Haz clic en el badge de tokens por sesion en cualquier composer de agente, obten cada numero que importa, mas consejos para reducir tu consumo de tokens.
Que muestra el panel de Claude Code token usage
Un clic en el badge de tokens abre un monitor de sesion en vivo. Aqui esta cada numero que obtienes sobre la sesion activa de Claude.
Duracion de la sesion
Tiempo transcurrido entre el primer y el ultimo mensaje de la sesion activa de Claude, refrescado en vivo. Util para detectar agentes que llevan horas masticando contexto.
Estado del agente en vivo
Inactivo, trabajando, terminado o esperando respuesta. El estado se empareja con el contador de tokens para que veas de un vistazo que sesion de Claude esta consumiendo y cual solo esta ahi sentada.
Mensajes y turnos del asistente
Conteo de prompts del usuario versus turnos del asistente en la sesion activa de Claude. Un ratio desbalanceado es una senal fuerte de que un agente esta en bucle o que tu prompt es demasiado vago.
Usos de herramientas
Numero total de llamadas a Read, Edit, Bash, Grep, Glob y otras herramientas ejecutadas por Claude en la sesion. Las llamadas a herramientas mueven una gran parte de los input tokens, asi que este numero rastrea de cerca el Claude Code token usage.
Modelos usados
Cada modelo de Claude que manejo un turno en la sesion : Sonnet, Opus, Haiku, variantes con fecha. AgentsRoom deduplica y acorta los nombres para que veas inmediatamente si tu sesion fue auto-enrutada entre modelos.
Id de sesion de Claude
El identificador interno de sesion de Claude, copiable en un clic. Usalo para hacer claude --resume de la misma conversacion desde la CLI sin perder contexto.
Input tokens
Input tokens frescos enviados a Claude durante la sesion, antes de cualquier reuso de cache. Este es el cubo mas caro de tu Claude Code token usage.
Output tokens
Tokens generados por Claude en la sesion. Los output tokens se facturan a una tarifa mas alta que el input, asi que valores altos sin progreso significan que un agente esta girando en falso.
Cache writes
Tokens que Claude escribe al cache de prompts durante la sesion. Los cache writes se cobran con un pequeno premium pero desbloquean cache reads baratos en los siguientes turnos.
Cache reads
Tokens servidos desde el cache de prompts en vez de ser re-tarificados como input fresco. Los cache reads cuestan aproximadamente 10 veces menos que los input tokens, por lo que el cache hit rate es la metrica lider de tu Claude Code token usage.
Cache hit rate
Porcentaje de tokens del lado input servidos desde cache, con codigo de color verde por encima del 70 por ciento, ambar entre 30 y 70, rojo por debajo de 30. Mas alto es mas barato. La unica mejor palanca sobre el Claude Code token usage.
Tokens totales
Suma acumulada de input, output, cache writes y cache reads para la sesion activa. Util como un solo numero titular cuando comparas el consumo de tokens entre agentes.
Por que el medidor de tokens se pone rojo
AgentsRoom revisa tu Claude Code token usage por sesion en cada poll. Cuando el total acumulado cruza un umbral de consumo pesado, el badge se pone rojo con un icono de aviso. Esa es la senal para abrir el monitor de sesion y decidir que hacer : compactar, forkear un nuevo agente, cambiar de modelo o simplemente terminar la tarea y cerrar.
Rojo no es un limite duro. AgentsRoom no estrangula tu agente ni interrumpe la corrida. Es un empujon visual, sobre un solo agente, para que un bucle descontrolado no drene silenciosamente tu presupuesto de Anthropic mientras te concentras en otra ventana. Las sesiones largas con cache hit rates saludables estan perfectamente bien y se quedan en verde.
Como AgentsRoom rastrea el Claude Code token usage
Tres capas : un poller de uso, un parser JSONL y una UI en vivo.
El poller lee los totales de tokens cada 15 segundos
Una tarea en segundo plano lee el consumo de tokens por sesion desde tu estado local de Claude y lo empuja al store del renderer. Sin proxy en la API, sin llamada de red extra. Solo una lectura mas rapida y visible de los numeros que Claude ya escribe al disco.
El parser JSONL refresca cada 10 segundos mientras la modal esta abierta
El monitor de sesion agrega una llamada IPC de un disparo que recorre el transcript JSONL de la sesion activa de Claude para calcular conteos de mensajes, turnos del asistente, usos de herramientas, modelos enrutados y timestamps primero/ultimo. El refresh corre cada 10 segundos mientras el panel esta en pantalla, asi los numeros se mantienen vivos sin quemar el parser en cada poll del renderer.
UI en vivo : badge mas monitor de sesion
El badge en el composer del terminal lee los totales de tokens y decide verde o rojo. Haz clic y se abre el monitor de sesion, en un portal para que cubra toda la ventana. Los numeros se formatean con separadores de miles, el cache hit rate se colorea, y una seccion de consejos te empuja a consumir menos.
Consejos para reducir tu Claude Code token usage
El monitor de sesion expone estos consejos contextualmente, basado en tu cache hit rate en vivo. Envia cualquiera de ellos directamente al terminal del agente en un clic.
Cache hit rate bajo : estabiliza el prefijo del prompt
Por debajo del 30 por ciento, Claude esta pagando precio completo de input cada turno. Editar CLAUDE.md a mitad de sesion, cambiar de modelo o reorganizar mensajes de sistema tempranos rompe el cache. Bloquea la parte superior del prompt y mira como sube el cache hit rate.
Usa /compact en vez de /clear
Slash clear borra la conversacion y fuerza el precio completo de input en el siguiente turno. Slash compact mantiene la tarea y reduce el historial a un resumen, asi el prefijo de cache sobrevive. Misma sensacion fresca, Claude Code token usage mucho mas bajo.
Lee parcial, no entero
En archivos mayores a 100 lineas, pidele al agente que use Read con offset y limit, o que primero haga grep del simbolo. Cargar un archivo de 4000 lineas cada turno es el sumidero silencioso numero uno del Claude Code token usage.
Edit en vez de Write
La herramienta Edit solo envia el diff de vuelta a Claude. Write retransmite el archivo entero. En un componente de 600 lineas, eso duplica los output tokens e infla el input del siguiente turno.
Lanza sub-agentes para busquedas amplias
Glob y Grep sobre cientos de archivos vuelcan mucho ruido en tu contexto principal. La herramienta Agent corre en su propia ventana de contexto y solo devuelve un resumen, manteniendo el prompt padre pequeno.
Reduce tu CLAUDE.md
CLAUDE.md se antepone a cada turno. Cada parrafo inutil ahi cuesta input tokens cacheados por cada mensaje. Mueve el contexto largo a context/ y referencialo cuando lo necesites.
Medidor de tokens de AgentsRoom vs Claude Code vainilla
Claude Code vainilla muestra los totales de tokens al final de una sesion, en una pequena linea de pie de pagina que tienes que scrollear hacia arriba para encontrar. No hay medidor en vivo. No hay desglose por sesion. No hay cache hit rate de un vistazo. No hay aviso cuando el consumo se dispara. Descubres el sobreconsumo despues, cuando la API te limita o la factura mensual es demasiado alta.
AgentsRoom convierte el Claude Code token usage en una senal de primera clase. Cada agente tiene su propio contador de tokens. Rojo en sobreconsumo. Clic para el desglose completo. Cache hit rate calculado en tiempo real. Consejos que leen tus numeros en vivo y proponen prompts listos para arreglar la fuga. La misma sesion de Claude, los mismos transcripts JSONL, pero con la visibilidad que una flota de agentes paralelos realmente necesita.
Cuando el medidor de Claude Code token usage te salva
Tres situaciones reales donde el rastreador de tokens por sesion se paga solo.
Un agente esta atascado en un bucle
Un agente sigue releyendo el mismo archivo y reintentando el mismo arreglo. Su badge de tokens se pone rojo en minutos, su cache hit rate cae en picado, su ratio de mensajes esta desbalanceado. Lo detectas en el dashboard, saltas, reescribes el prompt, salvas el presupuesto.
Una tarea larga va genial
Tres horas en un refactor, te preguntas si el agente sigue en el camino correcto. Abre el monitor de sesion : 700 mensajes, 180 usos de herramientas, 78 por ciento de cache hit rate, todo verde. El consumo de tokens es alto en absoluto, normal en eficiencia. Dejalo cocinar.
Corrida nocturna en una flota
Cinco agentes muelen un backlog mientras duermes. En la manana, el consumo de tokens por sesion te dice cual fue eficiente, cual entro en bucle, cual se quedo sin contexto. Triage en dos minutos en vez de leer cada transcript.
El medidor de Claude Code token usage es una pieza de una superficie de monitor mas grande. El estado de agente en vivo, los badges del dock y las notificaciones push moviles completan la imagen.
Ver como AgentsRoom monitorea agentes IAFAQ
Es preciso el rastreador de Claude Code token usage ?
Si. AgentsRoom lee los mismos transcripts JSONL que Claude mismo escribe en ~/.claude/projects/. Input tokens, output tokens, cache writes y cache reads se sacan directamente del payload de uso por mensaje que emite Anthropic. No hay estimacion, ni proxy, ni redondeo. Los numeros en el monitor de sesion coinciden con lo que factura Anthropic.
El contador de tokens ralentiza mi agente ?
No. El poller lee archivos locales cada 15 segundos. El parseo JSONL solo corre cuando el monitor de sesion esta abierto, cada 10 segundos. No hay llamada de red extra a Anthropic, ni instrumentacion inyectada en Claude, ni overhead en las llamadas a herramientas. Tu agente corre a velocidad completa.
Cuando se pone rojo el badge ?
Cuando el Claude Code token usage acumulado por sesion cruza un umbral de consumo pesado afinado para sesiones normales de codigo de larga duracion. El umbral es lo bastante conservador para que una sesion inactiva nunca lo dispare, y lo bastante ajustado para que un bucle descontrolado se ponga rojo en pocos turnos. Rojo es un aviso, no un estrangulamiento.
Por que es tan importante el cache hit rate ?
Los cache reads cuestan aproximadamente 10 veces menos que los input tokens frescos. Una sesion al 80 por ciento de cache hit rate es aproximadamente cinco veces mas barata que la misma sesion al 0 por ciento. El cache hit rate es la unica mejor palanca sobre tu Claude Code token usage. AgentsRoom lo muestra en vivo para que puedas corregir el rumbo a mitad de sesion en vez de enterarte al final.
Soporta tambien Codex, Gemini, OpenCode y Aider ?
El monitor de sesion en su forma actual es especifico de Claude porque lee los transcripts JSONL de Claude y el desglose del cache de prompts es una funcion de facturacion exclusiva de Claude. El estado, el rol y las notificaciones funcionan para todos los proveedores. Estamos rastreando un consumo agnostico de proveedor en el roadmap.
AgentsRoom envia mi Claude Code token usage a un servidor ?
No. El contador de tokens, el monitor de sesion y el cache hit rate se calculan enteramente en tu Mac, desde archivos locales. Nada sale de tu maquina. Si activas la sincronizacion cifrada opcional con la app companera, solo se envian los datos que eliges explicitamente reflejar, y estan cifrados de extremo a extremo via el relay de AgentsRoom.
Puedo guardar los consejos como prompts reutilizables ?
Si. Cada consejo en el monitor de sesion tiene un boton Fix this que abre un prompt editable y listo para usar. Envialo directamente al terminal del agente, copialo al portapapeles o guardalo en tu biblioteca global de prompts para que el mismo arreglo este a un clic en cada proyecto.
Deja de adivinar tu Claude Code token usage
Descarga AgentsRoom y obten un medidor de tokens por sesion en vivo en cada agente de Claude. Rojo en sobreconsumo, cache hit rate de un vistazo, consejos para consumir menos. Todo local, todo tuyo.
App complementaria: supervisa tus agentes en movimiento
Compatible con Claude, Codex, OpenCode, Gemini CLI y Aider
Envía bugs y peticiones directamente a tu backlog público.