Uso de tokens: por sesión: en vivo

Uso de tokens de Claude Code,
rastreado por sesión, en tiempo real

AgentsRoom supervisa tu uso de tokens de Claude Code en cada terminal de agente. Un pequeño contador de tokens se encuentra en el compositor y se actualiza en vivo. Cuando tu consumo de tokens se vuelve alto en una sola sesión de Claude, la insignia se vuelve roja y te advierte antes de que sobrepases la ventana de contexto.

Haz clic en la insignia y se abre el monitor de sesión: tokens de entrada, tokens de salida, lecturas de caché, escrituras de caché, tasa de aciertos de caché, conteo de mensajes, modelos enrutados, duración de la sesión y usos de herramientas. Un panel, una sesión de Claude, todos los números que impulsan tu uso de tokens de Claude Code.

Descargar AgentsRoom Ver cómo funciona el medidor de tokens

Gratis · macOS · 100 % local, sin proxy

Demostración en vivo de la insignia de uso de tokens de Claude Code en AgentsRoom: se encuentra en cada compositor de agente, se vuelve roja en caso de alto consumo de tokens y abre un monitor de sesión completo con tokens de entrada, tokens de salida, lecturas de caché y escrituras de caché.

El uso de tokens de Claude Code es el costo variable número uno de ejecutar agentes de codificación AI. Cada aviso, cada llamada a la herramienta, cada reinyección de CLAUDE.md consume tokens. Sin visibilidad, te das cuenta de que has sobrepasado tu presupuesto cuando la API limita o llega la factura. AgentsRoom coloca un medidor de uso de tokens de Claude Code en vivo en cada sesión de agente para que veas el consumo a medida que ocurre, no después.

El contador de tokens vive en el compositor de la terminal, justo al lado del botón de enviar. Se actualiza unos segundos después de cada turno de Claude. Los tokens se acumulan a lo largo de toda la sesión: tokens de entrada, tokens de salida, escrituras de caché y lecturas de caché, todos sumados y codificados por colores para que puedas leerlos de un vistazo. Cuando el uso de tokens de Claude Code por sesión cruza un umbral de alto consumo, la insignia se vuelve roja con un ícono de advertencia, de la misma manera que un medidor de combustible te avisa antes de que el tanque se quede vacío.

Haz clic en él y se abre el monitor de sesión. Obtienes una instantánea en vivo de la sesión activa de Claude: duración desde el primer mensaje, número de avisos de usuario frente a turnos de asistente, usos de herramientas, modelos que manejaron la conversación, el id de sesión de Claude (copiable para --resume) y el desglose completo de tokens. La tasa de aciertos de caché se calcula sobre la marcha, codificada por colores en verde / ámbar / rojo, con un recordatorio de una línea de que las lecturas de caché cuestan aproximadamente diez veces menos que la entrada fresca. Ese único panel convierte el uso de tokens de Claude Code de una caja negra en un medidor en tiempo real.

Primer plano del compositor de agente de AgentsRoom con la insignia de uso de tokens de Claude Code en rojo, advirtiendo de un consumo elevado con 58 millones de tokens

La insignia de tokens vive junto al botón de enviar y se pone roja cuando el consumo de una sesión se dispara.

Por qué importa el uso de tokens de Claude Code por sesión

La mayoría de los envoltorios de Claude informan el uso de tokens a nivel de cuenta, una vez al día, en un panel que tienes que recordar abrir. Para entonces, el daño ya está hecho. AgentsRoom lleva el uso de tokens de Claude Code a la superficie, en cada terminal de agente, para que no puedas ignorarlo. El contador de tokens está a dos centímetros del botón de enviar. Lo miras como miras la insignia de no leídos en tu teléfono.

Por sesión es la granularidad correcta. Un equipo de agentes que funcionan en paralelo no te dice quién está quemando tokens. Un agente podría estar atrapado en un aviso atascado mientras otros cuatro están en silencio. Con un medidor de uso de tokens de Claude Code por sesión, el agente ruidoso destaca instantáneamente: su insignia es roja, su tasa de aciertos de caché es baja, su conteo de mensajes está aumentando rápidamente. Intervienes, corriges el aviso, ahorras el presupuesto.

Toda la función es local. AgentsRoom lee tu uso de tokens de Claude Code directamente de las transcripciones JSONL que Claude escribe en ~/.claude/projects/. Nada sale de tu máquina. Ningún rastreador de uso de terceros. Ningún proxy frente a la API. El contador de tokens en AgentsRoom es solo una lectura más rápida y visible de los datos que Anthropic ya guarda en tu disco.

Modal de uso de tokens de Claude Code en AgentsRoom: duración, estado, conteo de mensajes, usos de herramientas, modelos, id de sesión, más desglose de tokens con entrada, salida, escrituras de caché, lecturas de caché y tasa de aciertos de caché

El panel de uso de tokens de Claude Code en AgentsRoom. Haz clic en la insignia de tokens por sesión en cualquier compositor de agente, obtén cada número que importa, más consejos para reducir tu consumo de tokens.

Lo que muestra el panel de uso de tokens de Claude Code

Un clic en la insignia de tokens abre un monitor de sesión en vivo. Aquí está cada número que obtienes en la sesión activa de Claude.

Duración de la sesión

Tiempo transcurrido entre el primer y el último mensaje de la sesión activa de Claude, actualizado en vivo. Útil para detectar agentes que han estado consumiendo contexto durante horas.

Estado del agente en vivo

Inactivo, trabajando, terminado o necesita entrada. El estado se empareja con el contador de tokens para que veas de un vistazo qué sesión de Claude está consumiendo y cuál simplemente está ahí.

Mensajes y turnos del asistente

Conteo de avisos de usuario frente a turnos de asistente en la sesión activa de Claude. Una proporción desbalanceada es una señal fuerte de que un agente está atrapado en un bucle o que tu aviso es demasiado vago.

Usos de herramientas

Número total de llamadas a herramientas Read, Edit, Bash, Grep, Glob y otras ejecutadas por Claude en la sesión. Las llamadas a herramientas impulsan una gran parte de los tokens de entrada, por lo que este número rastrea de cerca el uso de tokens de Claude Code.

Modelos utilizados

Cada modelo de Claude que manejó un turno en la sesión: Sonnet, Opus, Haiku, variantes datadas. AgentsRoom elimina duplicados y acorta nombres para que veas de inmediato si tu sesión fue enrutada automáticamente entre modelos.

ID de sesión de Claude

El identificador interno de sesión de Claude, copiable con un clic. Úsalo para claude --resume la misma conversación desde la CLI sin perder contexto.

Tokens de entrada

Tokens de entrada frescos enviados a Claude durante la sesión, antes de cualquier reutilización de caché. Este es el cubo más costoso de tu uso de tokens de Claude Code.

Tokens de salida

Tokens generados por Claude en la sesión. Los tokens de salida se facturan a una tasa más alta que los de entrada, por lo que valores altos sin progreso significan que un agente está girando.

Escrituras de caché

Tokens que Claude escribe en la caché de avisos durante la sesión. Las escrituras de caché se cobran a una pequeña prima, pero desbloquean lecturas de caché baratas en los siguientes turnos.

Lecturas de caché

Tokens servidos desde la caché de avisos en lugar de ser re-preciados como entrada fresca. Las lecturas de caché cuestan aproximadamente 10 veces menos que los tokens de entrada, por lo que la tasa de aciertos de caché es la métrica principal de tu uso de tokens de Claude Code.

Tasa de aciertos de caché

Porcentaje de tokens del lado de entrada servidos desde la caché, codificado por colores en verde por encima del 70 por ciento, ámbar entre 30 y 70, rojo por debajo del 30. Más alto es más barato. La mejor palanca única sobre el uso de tokens de Claude Code.

Total de tokens

Suma acumulativa de tokens de entrada, salida, escrituras de caché y lecturas de caché para la sesión activa. Útil como un solo número principal cuando comparas el consumo de tokens entre agentes.

Por qué el medidor de tokens se vuelve rojo

AgentsRoom verifica tu uso de tokens de Claude Code por sesión en cada sondeo. Cuando el total acumulado cruza un umbral de alto consumo, la insignia se vuelve roja con un ícono de advertencia. Esa es la señal para abrir el monitor de sesión y decidir qué hacer: compactar, bifurcar un nuevo agente, cambiar de modelo o simplemente terminar la tarea y concluir.

El rojo no es un límite estricto. AgentsRoom no limita tu agente ni interrumpe la ejecución. Es un empujón visual, en un solo agente, para que un bucle descontrolado no drene silenciosamente tu presupuesto de Anthropic mientras te concentras en otra ventana. Las sesiones largas con tasas de aciertos de caché saludables están perfectamente bien y permanecen en verde.

Cómo AgentsRoom rastrea el uso de tokens de Claude Code

Tres capas: un sondeador de uso, un analizador JSONL y una interfaz de usuario en vivo.

El sondeador lee los totales de tokens cada 15 segundos

Una tarea en segundo plano lee el uso de tokens por sesión desde tu estado local de Claude y lo envía a la tienda del renderizador. Sin proxy en la API, sin llamada de red adicional. Solo una lectura más rápida y visible de los números que Claude ya escribe en el disco.

El analizador JSONL se actualiza cada 10 segundos mientras el modal está abierto

El monitor de sesión agrega una llamada IPC de una sola vez que recorre la transcripción JSONL de la sesión activa de Claude para calcular conteos de mensajes, turnos de asistente, usos de herramientas, modelos enrutados y marcas de tiempo de primero/último. La actualización se ejecuta cada 10 segundos mientras el panel está en pantalla, por lo que los números permanecen en vivo sin quemar el analizador en cada sondeo del renderizador.

Interfaz de usuario en vivo: insignia más monitor de sesión

La insignia en el compositor de la terminal lee los totales de tokens y decide verde o rojo. Haz clic en ella y se abre el monitor de sesión, en un portal que se superpone a toda la ventana. Los números están formateados con separadores de miles, la tasa de aciertos de caché está coloreada y una sección de consejos te empuja a consumir menos.

Consejos para reducir tu uso de tokens de Claude Code

El monitor de sesión presenta estos consejos contextualizados, basados en tu tasa de aciertos de caché en vivo. Envía cualquiera de ellos directamente a la terminal del agente con un clic.

Baja tasa de aciertos de caché: estabiliza el prefijo del aviso

Por debajo del 30 por ciento, Claude está pagando el precio completo de entrada en cada turno. Editar CLAUDE.md a mitad de sesión, cambiar de modelo o reorganizar mensajes del sistema tempranos rompe la caché. Bloquea la parte superior del aviso y observa cómo la tasa de aciertos de caché aumenta.

Usa /compact en lugar de /clear

Slash clear borra la conversación y obliga a un precio completo de entrada en el siguiente turno. Slash compact mantiene la tarea y reduce la historia a un resumen, por lo que el prefijo de caché sobrevive. La misma sensación fresca, mucho menor uso de tokens de Claude Code.

Leer parcial, no todo

En archivos más grandes de 100 líneas, pide al agente que use Read con desplazamiento y límite, o grep para el símbolo primero. Cargar un archivo de 4000 líneas en cada turno es el número uno silencioso que consume tokens de Claude Code.

Edita en lugar de Escribir

La herramienta Edit solo envía la diferencia de vuelta a Claude. Write retransmite todo el archivo. En un componente de 600 líneas, eso duplica los tokens de salida e inflaciona la entrada del siguiente turno.

Genera subagentes para búsquedas amplias

Glob y Grep a través de cientos de archivos arrojan mucho ruido en tu contexto principal. La herramienta Agente se ejecuta en su propia ventana de contexto y solo devuelve un resumen, manteniendo pequeño el aviso padre.

Reduce tu CLAUDE.md

CLAUDE.md se antepone a cada turno. Cada párrafo inútil allí cuesta tokens de entrada en caché por cada mensaje. Mueve el contexto largo a context/ y refiérelo bajo demanda.

Monitor de sesión de AgentsRoom con estadísticas de uso de herramientas, archivos leídos y consejos contextuales para reducir el uso de tokens de Claude Code, cada uno con un botón Fix this de un clic

El monitor de sesión lee tu tasa de aciertos de caché en vivo y muestra correcciones listas para enviar. Un clic en Fix this envía el aviso directamente al agente.

Medidor de tokens de AgentsRoom vs Claude Code vanilla

Claude Code vanilla muestra los totales de tokens al final de una sesión, en una pequeña línea de pie que tienes que desplazar hacia arriba para encontrar. No hay medidor en vivo. No hay desglose por sesión. No hay tasa de aciertos de caché de un vistazo. No hay advertencia cuando el consumo se dispara. Descubres el sobreuso después de que ocurre, cuando la API limita la tasa o la factura mensual es demasiado alta.

AgentsRoom convierte el uso de tokens de Claude Code en una señal de primera clase. Cada agente obtiene su propio contador de tokens. Rojo por sobreuso. Haz clic para el desglose completo. Tasa de aciertos de caché calculada en tiempo real. Consejos que leen tus números en vivo y proponen avisos listos para arreglar la fuga. La misma sesión de Claude, las mismas transcripciones JSONL, pero con la visibilidad que una flota de agentes paralelos realmente necesita.

Cuando el medidor de uso de tokens de Claude Code te ahorra

Tres situaciones reales donde el rastreador de tokens por sesión se paga por sí mismo.

Un agente está atrapado en un bucle

Un agente sigue releyendo el mismo archivo y volviendo a intentar la misma solución. Su insignia de tokens se vuelve roja en minutos, su tasa de aciertos de caché se desploma, su proporción de mensajes está desbalanceada. Lo detectas en el panel, intervienes, reescribes el aviso, ahorras el presupuesto.

Una tarea larga va muy bien

Tres horas en una refactorización, te preguntas si el agente sigue en camino. Abre el monitor de sesión: 700 mensajes, 180 usos de herramientas, 78 por ciento de tasa de aciertos de caché, todo en verde. El consumo de tokens es alto en absoluto, normal en eficiencia. Déjalo cocinar.

Ejecución nocturna en una flota

Cinco agentes procesan un backlog mientras duermes. Por la mañana, el uso de tokens por sesión te dice cuál fue eficiente, cuál se quedó atrapado en un bucle, cuál se quedó sin contexto. Triage en dos minutos en lugar de leer cada transcripción.

El medidor de uso de tokens de Claude Code es una parte de una superficie de monitorización más grande. El estado en vivo del agente, las insignias de muelle y las notificaciones push móviles completan la imagen.

Ver cómo AgentsRoom monitorea agentes de IA

Estadísticas de proyecto: tiempo y tokens por proyectoDelegación de agentes: deriva el trabajo a modelos más baratos

Ver el número es el primer paso. Nuestra guía completa desglosa exactamente a dónde van los tokens de Claude Code y cómo reducir la factura sin ralentizar: contexto más ajustado, el modelo correcto, delegación y más.

Leer: reduce tus costos de tokens de Claude Code

FAQ

¿Es preciso el rastreador de uso de tokens de Claude Code?

Sí. AgentsRoom lee las mismas transcripciones JSONL que Claude escribe en ~/.claude/projects/. Los tokens de entrada, los tokens de salida, las escrituras de caché y las lecturas de caché se extraen directamente de la carga útil de uso por mensaje que emite Anthropic. No hay estimación, no hay proxy, no hay redondeo. Los números en el monitor de sesión coinciden con lo que Anthropic factura.

¿El contador de tokens ralentiza mi agente?

No. El sondeador lee archivos locales cada 15 segundos. El análisis JSONL solo se ejecuta cuando el monitor de sesión está abierto, cada 10 segundos. No hay llamada de red adicional a Anthropic, no hay instrumentación inyectada en Claude, no hay sobrecarga en las llamadas a herramientas. Tu agente funciona a toda velocidad.

¿Cuándo se vuelve roja la insignia?

Cuando el uso acumulativo de tokens de Claude Code por sesión cruza un umbral de alto consumo ajustado para sesiones de codificación largas normales. El umbral es lo suficientemente conservador como para que una sesión inactiva nunca lo active, y lo suficientemente ajustado como para que un bucle descontrolado se vuelva rojo en unos pocos turnos. El rojo es una advertencia, no un límite.

¿Por qué es tan importante la tasa de aciertos de caché?

Las lecturas de caché cuestan aproximadamente 10 veces menos que los tokens de entrada frescos. Una sesión con una tasa de aciertos de caché del 80 por ciento es aproximadamente cinco veces más barata que la misma sesión con un 0 por ciento. La tasa de aciertos de caché es la mejor palanca única sobre tu uso de tokens de Claude Code. AgentsRoom la muestra en vivo para que puedas corregir el rumbo a mitad de sesión en lugar de descubrirlo al final.

¿También admite Codex, Antigravity, OpenCode, Aider, Grok Build, Mistral Vibe y Kimi Code?

El monitor de sesión en su forma actual es específico de Claude porque lee las transcripciones JSONL de Claude y el desglose de caché de avisos es una característica de facturación exclusiva de Claude. El estado, el rol y las notificaciones funcionan para cada proveedor. Estamos rastreando el uso independiente del proveedor en la hoja de ruta.

¿AgentsRoom envía mi uso de tokens de Claude Code a un servidor?

No. El contador de tokens, el monitor de sesión y la tasa de aciertos de caché se calculan completamente en tu Mac, a partir de archivos locales. Nada sale de tu máquina. Si habilitas la sincronización encriptada opcional con el compañero móvil, solo se envía la información que eliges explícitamente reflejar, y está encriptada de extremo a extremo a través del relay de AgentsRoom.

¿Puedo guardar los consejos como avisos reutilizables?

Sí. Cada consejo en el monitor de sesión tiene un botón Arreglar esto que abre un aviso editable y listo para usar. Envíalo directamente a la terminal del agente, cópialo al portapapeles o guárdalo en tu biblioteca de avisos global para que la misma solución esté a un clic de distancia en cada proyecto.

Deja de adivinar tu uso de tokens de Claude Code

Descarga AgentsRoom y obtén un medidor de tokens por sesión en vivo en cada agente de Claude. Rojo por sobreuso, tasa de aciertos de caché de un vistazo, consejos para consumir menos. Todo local, todo tuyo.

GratisDescargar AgentsRoom

App complementaria: supervisa tus agentes en movimiento

Usa Claude, Codex, Antigravity CLI u otro proveedor de IA.

Instalar la extensión

Chrome Web Store

Envía bugs y peticiones directamente a tu backlog público.

Un vistazo a AgentsRoom en acción.

Multi-proyectos

Multi-proveedor

Multi-agentes

Estado en vivo

Diff y commit

App móvil

Vista previa

Equipos de agentes

Pruebas en navegador

Dev guiada por backlog

Biblioteca de prompts

Biblioteca de skills

Ver todas las funcionalidades

Uso de tokens de Claude Code,rastreado por sesión, en tiempo real