Claude Code token usage,
rastreado por sessao, em tempo real
O AgentsRoom observa o seu Claude Code token usage em cada terminal de agente. Um pequeno contador de tokens fica no compositor e atualiza ao vivo. Quando o consumo de tokens fica alto numa unica sessao Claude, o badge fica vermelho e avisa antes que voce estoure a janela de contexto.
Clique no badge e o monitor de sessao abre : input tokens, output tokens, cache reads, cache writes, cache hit rate, contagem de mensagens, modelos roteados, duracao da sessao e usos de ferramentas. Um painel, uma sessao Claude, todos os numeros que determinam o seu Claude Code token usage.
Demo ao vivo do badge de Claude Code token usage no AgentsRoom : ele fica em cada compositor de agente, fica vermelho em consumo alto, e abre um monitor completo de sessao com input tokens, output tokens, cache reads e cache writes.
Claude Code token usage e o principal custo variavel de rodar agentes de codigo IA. Cada prompt, cada chamada de ferramenta, cada reinjeção de CLAUDE.md consome tokens. Sem visibilidade, voce so descobre que estourou o orcamento quando a API limita ou quando a fatura chega. O AgentsRoom coloca um medidor de Claude Code token usage ao vivo em cada sessao de agente, para que voce veja o consumo no momento, nao depois.
O contador de tokens vive no compositor do terminal, ao lado do botao de enviar. Ele atualiza poucos segundos depois de cada turno do Claude. Os tokens se acumulam ao longo da sessao : input tokens, output tokens, cache writes e cache reads, todos somados e com codigo de cores para que voce leia de relance. Quando o Claude Code token usage por sessao ultrapassa um limite de consumo alto, o badge fica vermelho com um icone de aviso, do mesmo jeito que o ponteiro de combustivel avisa antes do tanque secar.
Clique e o monitor de sessao abre. Voce recebe um snapshot ao vivo da sessao Claude ativa : duracao desde a primeira mensagem, numero de prompts do usuario versus turnos do assistente, usos de ferramentas, modelos que cuidaram da conversa, o id da sessao Claude (copiavel para --resume) e o detalhamento completo de tokens. O cache hit rate e calculado em tempo real, com codigo de cores verde / ambar / vermelho, com um lembrete de uma linha de que cache reads custam cerca de dez vezes menos do que input fresco. Esse unico painel transforma o Claude Code token usage de caixa-preta em medidor em tempo real.
Por que o Claude Code token usage por sessao importa
A maioria dos wrappers do Claude reporta o consumo de tokens no nivel da conta, uma vez por dia, num dashboard que voce precisa lembrar de abrir. Quando voce olha, o estrago ja foi feito. O AgentsRoom traz o Claude Code token usage para a superficie, em cada terminal de agente, para que voce nao consiga ignorar. O contador de tokens fica a dois centimetros do botao de enviar. Voce olha de relance, como olha o badge de mensagens nao lidas no celular.
Por sessao e a granularidade certa. Uma equipe de agentes rodando em paralelo nao te diz quem esta queimando tokens. Um agente pode estar em loop num prompt travado enquanto quatro outros estao quietos. Com um medidor de Claude Code token usage por sessao, o agente barulhento se destaca na hora : seu badge fica vermelho, o cache hit rate cai, a contagem de mensagens sobe rapido. Voce entra, corrige o prompt, salva o orcamento.
Toda a feature e local. O AgentsRoom le o seu Claude Code token usage diretamente dos transcritos JSONL que o Claude grava em ~/.claude/projects/. Nada sai da sua maquina. Sem rastreador externo. Sem proxy na frente da API. O contador de tokens no AgentsRoom e apenas uma leitura mais rapida e mais visivel dos dados que a Anthropic ja salva no seu disco.

O painel de Claude Code token usage no AgentsRoom. Clique no badge de tokens por sessao em qualquer compositor de agente, obtenha cada numero que importa, mais dicas para reduzir o consumo de tokens.
O que o painel de Claude Code token usage mostra
Um clique no badge de tokens abre um monitor ao vivo de sessao. Aqui esta cada numero que voce recebe sobre a sessao Claude ativa.
Duracao da sessao
Tempo decorrido entre a primeira e a ultima mensagem da sessao Claude ativa, atualizado ao vivo. Util para identificar agentes que vem mastigando contexto ha horas.
Status do agente ao vivo
Inativo, trabalhando, concluido, ou aguardando resposta. O status anda lado a lado com o contador de tokens, para que voce veja de relance qual sessao Claude esta consumindo e qual esta apenas parada.
Mensagens e turnos do assistente
Contagem de prompts do usuario versus turnos do assistente na sessao Claude ativa. Uma proporcao desigual e um forte sinal de que um agente esta em loop ou que o seu prompt esta vago demais.
Usos de ferramentas
Numero total de chamadas de Read, Edit, Bash, Grep, Glob e outras ferramentas executadas pelo Claude na sessao. As chamadas de ferramentas geram boa parte dos input tokens, entao esse numero acompanha de perto o Claude Code token usage.
Modelos usados
Cada modelo Claude que tratou um turno na sessao : Sonnet, Opus, Haiku, variantes datadas. O AgentsRoom remove duplicatas e encurta nomes para que voce veja imediatamente se a sessao foi auto-roteada entre modelos.
Id da sessao Claude
O identificador interno da sessao Claude, copiavel num clique. Use para fazer claude --resume da mesma conversa pela CLI sem perder contexto.
Input tokens
Input tokens frescos enviados ao Claude durante a sessao, antes de qualquer reuso de cache. Este e o balde mais caro do seu Claude Code token usage.
Output tokens
Tokens gerados pelo Claude na sessao. Output tokens sao cobrados a uma taxa maior do que input, entao valores altos sem progresso significam que um agente esta girando em falso.
Cache writes
Tokens que o Claude escreve no cache de prompt durante a sessao. Cache writes tem um pequeno premio na cobranca, mas desbloqueiam cache reads baratos nos turnos seguintes.
Cache reads
Tokens servidos do cache de prompt em vez de serem recobrados como input fresco. Cache reads custam cerca de 10x menos do que input tokens, e por isso o cache hit rate e a metrica principal do seu Claude Code token usage.
Cache hit rate
Porcentagem de tokens do lado de input servidos a partir do cache, com codigo de cores verde acima de 70 por cento, ambar entre 30 e 70, vermelho abaixo de 30. Quanto mais alto, mais barato. A melhor alavanca isolada sobre o Claude Code token usage.
Total de tokens
Soma cumulativa entre input, output, cache writes e cache reads para a sessao ativa. Util como numero unico de destaque ao comparar consumo de tokens entre agentes.
Por que o medidor de tokens fica vermelho
O AgentsRoom verifica o seu Claude Code token usage por sessao em cada poll. Quando o total acumulado ultrapassa um limite de consumo alto, o badge fica vermelho com um icone de aviso. Esse e o sinal para abrir o monitor de sessao e decidir o que fazer : compactar, criar um novo agente, trocar o modelo ou simplesmente terminar a tarefa e encerrar.
Vermelho nao e um limite rigido. O AgentsRoom nao limita o seu agente nem interrompe a execucao. E um empurrao visual, sobre um unico agente, para que um loop descontrolado nao drene em silencio o seu orcamento Anthropic enquanto voce foca em outra janela. Sessoes longas com cache hit rates saudaveis estao perfeitamente bem e continuam verdes.
Como o AgentsRoom acompanha o Claude Code token usage
Tres camadas : um poller de uso, um parser JSONL e uma UI ao vivo.
O poller le os totais de tokens a cada 15 segundos
Uma tarefa em segundo plano le o consumo de tokens por sessao do seu estado Claude local e empurra para o store do renderer. Sem proxy na API, sem chamada de rede extra. Apenas uma leitura mais rapida e visivel dos numeros que o Claude ja escreve em disco.
O parser JSONL atualiza a cada 10 segundos com o modal aberto
O monitor de sessao adiciona uma chamada IPC pontual que percorre o transcrito JSONL da sessao Claude ativa para calcular contagem de mensagens, turnos do assistente, usos de ferramentas, modelos roteados e timestamps de inicio/fim. O refresh roda a cada 10 segundos enquanto o painel esta na tela, para que os numeros fiquem ao vivo sem queimar o parser em cada poll do renderer.
UI ao vivo : badge mais monitor de sessao
O badge no compositor do terminal le os totais de tokens e decide entre verde ou vermelho. Clique e o monitor de sessao abre, num portal que cobre toda a janela. Os numeros sao formatados com separadores de milhar, o cache hit rate e colorido, e uma secao de dicas te incentiva a consumir menos.
Dicas para reduzir o seu Claude Code token usage
O monitor de sessao mostra essas dicas de forma contextual, com base no seu cache hit rate ao vivo. Envie qualquer uma delas direto para o terminal do agente num clique.
Cache hit rate baixo : estabilize o prefixo do prompt
Abaixo de 30 por cento, o Claude esta pagando o preco cheio de input a cada turno. Editar CLAUDE.md no meio da sessao, trocar de modelo ou reorganizar mensagens iniciais do sistema invalida o cache. Trave o topo do prompt e veja o cache hit rate subir.
Use /compact em vez de /clear
Slash clear apaga a conversa e forca o preco cheio de input no proximo turno. Slash compact mantem a tarefa e encolhe o historico num resumo, entao o prefixo do cache sobrevive. Mesma sensacao de novo, com Claude Code token usage muito menor.
Read parcial, nao inteiro
Em arquivos com mais de 100 linhas, peca ao agente para usar Read com offset e limit, ou faca grep do simbolo primeiro. Carregar um arquivo de 4000 linhas a cada turno e o ralo silencioso numero um do Claude Code token usage.
Edit em vez de Write
A ferramenta Edit so envia o diff de volta para o Claude. Write retransmite o arquivo inteiro. Num componente de 600 linhas, isso dobra os output tokens e infla o input do proximo turno.
Crie sub-agentes para buscas amplas
Glob e Grep em centenas de arquivos jogam muito ruido no contexto principal. A ferramenta Agent roda em sua propria janela de contexto e devolve apenas um resumo, mantendo o prompt pai pequeno.
Encolha o seu CLAUDE.md
CLAUDE.md e prefixado em cada turno. Cada paragrafo inutil ali custa input tokens em cache vezes cada mensagem. Mova contexto longo para context/ e referencie sob demanda.
Medidor de tokens do AgentsRoom vs Claude Code puro
O Claude Code puro mostra os totais de tokens no fim de uma sessao, numa pequena linha de rodape que voce precisa rolar para encontrar. Nao ha medidor ao vivo. Nem detalhamento por sessao. Nem cache hit rate de relance. Nem aviso quando o consumo dispara. Voce descobre o excesso depois do fato, quando a API aplica rate limit ou a fatura mensal vem alta demais.
O AgentsRoom transforma o Claude Code token usage num sinal de primeira classe. Cada agente tem seu proprio contador de tokens. Vermelho em excesso. Clique para o detalhamento completo. Cache hit rate calculado em tempo real. Dicas que leem seus numeros ao vivo e propoem prompts prontos para corrigir o vazamento. Mesma sessao Claude, mesmos transcritos JSONL, mas com a visibilidade que uma frota de agentes paralelos realmente precisa.
Quando o medidor de Claude Code token usage te salva
Tres situacoes reais em que o monitor de tokens por sessao se paga.
Um agente preso em loop
Um agente fica relendo o mesmo arquivo e tentando o mesmo conserto. Seu badge de tokens fica vermelho em minutos, seu cache hit rate desaba, a proporcao de mensagens fica desigual. Voce identifica no painel, entra, reescreve o prompt, salva o orcamento.
Uma tarefa longa indo bem
Tres horas dentro de um refactor, voce se pergunta se o agente ainda esta no caminho. Abra o monitor de sessao : 700 mensagens, 180 usos de ferramentas, 78 por cento de cache hit rate, tudo verde. O consumo de tokens e alto em absoluto, normal em eficiencia. Deixe rodar.
Execucao noturna de uma frota
Cinco agentes processam um backlog enquanto voce dorme. De manha, o consumo de tokens por sessao te diz qual foi eficiente, qual entrou em loop, qual ficou sem contexto. Triagem em dois minutos em vez de ler cada transcrito.
O medidor de Claude Code token usage e uma peca de uma superficie de monitoramento maior. Status do agente ao vivo, badges no dock e notificacoes push no mobile completam o quadro.
Veja como o AgentsRoom monitora agentes IAFAQ
O monitor de Claude Code token usage e preciso ?
Sim. O AgentsRoom le os mesmos transcritos JSONL que o proprio Claude grava em ~/.claude/projects/. Input tokens, output tokens, cache writes e cache reads sao puxados diretamente do payload de uso por mensagem que a Anthropic emite. Sem estimativa, sem proxy, sem arredondamento. Os numeros no monitor de sessao batem com o que a Anthropic cobra.
O contador de tokens deixa o meu agente mais lento ?
Nao. O poller le arquivos locais a cada 15 segundos. O parse de JSONL so roda quando o monitor de sessao esta aberto, a cada 10 segundos. Sem chamada de rede extra para a Anthropic, sem instrumentacao injetada no Claude, sem overhead nas chamadas de ferramentas. O seu agente roda em velocidade total.
Quando o badge fica vermelho ?
Quando o Claude Code token usage por sessao acumulado ultrapassa um limite de consumo alto ajustado para sessoes longas normais de codigo. O limite e conservador o suficiente para que uma sessao inativa nunca o dispare, e apertado o suficiente para que um loop descontrolado fique vermelho em poucos turnos. Vermelho e um aviso, nao um bloqueio.
Por que o cache hit rate e tao importante ?
Cache reads custam cerca de 10x menos do que input tokens frescos. Uma sessao a 80 por cento de cache hit rate e cerca de cinco vezes mais barata do que a mesma sessao a 0 por cento. O cache hit rate e a melhor alavanca isolada sobre o seu Claude Code token usage. O AgentsRoom mostra ao vivo para que voce corrija o rumo no meio da sessao em vez de descobrir no fim.
Tambem suporta Codex, Gemini, OpenCode e Aider ?
O monitor de sessao na sua forma atual e especifico do Claude porque le os transcritos JSONL do Claude e o detalhamento de cache de prompt e uma feature de cobranca exclusiva do Claude. Status, papel e notificacoes funcionam para qualquer provedor. Estamos acompanhando uso agnostico de provedor no roadmap.
O AgentsRoom envia o meu Claude Code token usage para um servidor ?
Nao. O contador de tokens, o monitor de sessao e o cache hit rate sao calculados inteiramente no seu Mac, a partir de arquivos locais. Nada sai da sua maquina. Se voce ativar a sincronizacao criptografada opcional com o app mobile companheiro, apenas os dados que voce escolher explicitamente espelhar sao enviados, e sao end-to-end criptografados via o relay do AgentsRoom.
Posso salvar as dicas como prompts reutilizaveis ?
Sim. Cada dica no monitor de sessao tem um botao Fix this que abre um prompt pronto e editavel. Envie direto para o terminal do agente, copie para a area de transferencia, ou salve na sua biblioteca global de prompts para que o mesmo conserto fique a um clique em todo projeto.
Pare de adivinhar o seu Claude Code token usage
Baixe o AgentsRoom e tenha um medidor de tokens ao vivo por sessao em cada agente Claude. Vermelho em excesso, cache hit rate de relance, dicas para consumir menos. Tudo local, tudo seu.
App complementar: acompanhe seus agentes em qualquer lugar
Compatível com Claude, Codex, OpenCode, Gemini CLI e Aider
Envie bugs e pedidos direto para o seu backlog público.