Uso de tokens: por sessão: ao vivo

Uso de tokens do Claude Code,
rastreado por sessão, em tempo real

O AgentsRoom monitora seu uso de tokens do Claude Code em cada terminal de agente. Um pequeno contador de tokens fica no compositor e é atualizado ao vivo. Quando seu consumo de tokens aumenta em uma única sessão do Claude, o distintivo fica vermelho e avisa você antes que você ultrapasse a janela de contexto.

Clique no distintivo e o monitor de sessão se abre: tokens de entrada, tokens de saída, leituras de cache, gravações de cache, taxa de acerto de cache, contagem de mensagens, modelos roteados, duração da sessão e usos de ferramentas. Um painel, uma sessão do Claude, todos os números que impulsionam seu uso de tokens do Claude Code.

Baixar AgentsRoom Veja como funciona o medidor de tokens

Grátis · macOS · 100% local, sem proxy

Demonstração ao vivo do distintivo de uso de tokens do Claude Code no AgentsRoom: ele fica em cada compositor de agente, fica vermelho em caso de consumo excessivo de tokens e abre um monitor de sessão completo com tokens de entrada, tokens de saída, leituras de cache e gravações de cache.

O uso de tokens do Claude Code é o principal custo variável de execução de agentes de codificação de IA. Cada prompt, cada chamada de ferramenta, cada re-injeção de CLAUDE.md consome tokens. Sem visibilidade, você descobre que ultrapassou seu orçamento quando a API limita ou a conta chega. O AgentsRoom coloca um medidor de uso de tokens do Claude Code ao vivo em cada sessão de agente para que você veja o consumo à medida que acontece, e não depois.

O contador de tokens fica no compositor do terminal, bem ao lado do botão de enviar. Ele é atualizado alguns segundos após cada turno do Claude. Os tokens se acumulam ao longo de toda a sessão: tokens de entrada, tokens de saída, gravações de cache e leituras de cache, todos somados e codificados por cores para que você possa lê-los rapidamente. Quando o uso de tokens do Claude Code por sessão ultrapassa um limite de consumo elevado, o distintivo muda para vermelho com um ícone de aviso, da mesma forma que um medidor de combustível avisa você antes que o tanque fique vazio.

Clique e o monitor de sessão se abre. Você obtém uma visão instantânea da sessão ativa do Claude: duração desde a primeira mensagem, número de prompts de usuário versus turnos de assistente, usos de ferramentas, modelos que lidaram com a conversa, o id da sessão do Claude (copiável para --resume) e o detalhamento completo dos tokens. A taxa de acerto de cache é calculada em tempo real, codificada por cores em verde / âmbar / vermelho, com um lembrete de uma linha de que as leituras de cache custam aproximadamente dez vezes menos do que a entrada fresca. Esse único painel transforma o uso de tokens do Claude Code de uma caixa preta em um medidor em tempo real.

Close do compositor de agente do AgentsRoom com o distintivo de uso de tokens do Claude Code em vermelho, alertando sobre consumo pesado com 58 milhões de tokens

O distintivo de tokens vive ao lado do botão de enviar e fica vermelho quando o consumo de uma sessão começa a pesar.

Por que o uso de tokens do Claude Code por sessão é importante

A maioria das interfaces do Claude relata o uso de tokens no nível da conta, uma vez por dia, em um painel que você precisa lembrar de abrir. Até lá, o dano já foi feito. O AgentsRoom traz o uso de tokens do Claude Code à superfície, em cada terminal de agente, para que você não possa ignorá-lo. O contador de tokens está a dois centímetros do botão de enviar. Você dá uma olhada nele como dá uma olhada no distintivo de não lido no seu telefone.

Por sessão é a granularidade certa. Uma equipe de agentes operando em paralelo não diz quem está queimando tokens. Um agente pode estar preso em um prompt enquanto quatro outros estão quietos. Com um medidor de uso de tokens do Claude Code por sessão, o agente barulhento se destaca instantaneamente: seu distintivo é vermelho, sua taxa de acerto de cache é baixa, sua contagem de mensagens está subindo rapidamente. Você intervém, corrige o prompt, economiza o orçamento.

Todo o recurso é local. O AgentsRoom lê seu uso de tokens do Claude Code diretamente dos transcritos JSONL que o Claude escreve em ~/.claude/projects/. Nada sai da sua máquina. Nenhum rastreador de uso de terceiros. Nenhum proxy na frente da API. O contador de tokens no AgentsRoom é apenas uma leitura mais rápida e visível dos dados que a Anthropic já salva no seu disco.

Modal de uso de tokens do Claude Code no AgentsRoom: duração, status, contagem de mensagens, usos de ferramentas, modelos, id da sessão, além do detalhamento de tokens com entrada, saída, gravações de cache, leituras de cache e taxa de acerto de cache

O painel de uso de tokens do Claude Code no AgentsRoom. Clique no distintivo de tokens por sessão em qualquer compositor de agente, obtenha todos os números que importam, além de dicas para reduzir seu consumo de tokens.

O que o painel de uso de tokens do Claude Code mostra

Um clique no distintivo de tokens abre um monitor de sessão ao vivo. Aqui está cada número que você obtém na sessão ativa do Claude.

Duração da sessão

Tempo decorrido entre a primeira e a última mensagem da sessão ativa do Claude, atualizado ao vivo. Útil para identificar agentes que estão consumindo contexto por horas.

Status do agente ao vivo

Ocioso, trabalhando, concluído ou precisa de entrada. O status se emparelha com o contador de tokens para que você veja rapidamente qual sessão do Claude está consumindo e qual está apenas parada.

Mensagens e turnos do assistente

Contagem de prompts de usuário versus turnos de assistente na sessão ativa do Claude. Uma proporção desequilibrada é um forte sinal de que um agente está preso em um loop ou que seu prompt é muito vago.

Usos de ferramentas

Número total de chamadas de ferramentas Read, Edit, Bash, Grep, Glob e outras executadas pelo Claude na sessão. Chamadas de ferramentas impulsionam uma grande parte dos tokens de entrada, então esse número rastreia de perto o uso de tokens do Claude Code.

Modelos utilizados

Cada modelo do Claude que lidou com um turno na sessão: Sonnet, Opus, Haiku, variantes datadas. O AgentsRoom remove duplicatas e encurta nomes para que você veja imediatamente se sua sessão foi roteada automaticamente entre modelos.

ID da sessão do Claude

O identificador interno da sessão do Claude, copiável em um clique. Use-o para claude --resume a mesma conversa exata a partir do CLI sem perder o contexto.

Tokens de entrada

Tokens de entrada frescos enviados ao Claude durante a sessão, antes de qualquer reutilização de cache. Este é o bucket mais caro do seu uso de tokens do Claude Code.

Tokens de saída

Tokens gerados pelo Claude na sessão. Tokens de saída são cobrados a uma taxa mais alta do que os de entrada, então valores altos sem progresso significam que um agente está girando.

Gravações de cache

Tokens que o Claude escreve no cache de prompts durante a sessão. Gravações de cache são cobradas a um pequeno prêmio, mas desbloqueiam leituras de cache baratas nos próximos turnos.

Leituras de cache

Tokens servidos do cache de prompts em vez de serem reprecificados como entrada fresca. Leituras de cache custam aproximadamente 10 vezes menos do que tokens de entrada, razão pela qual a taxa de acerto de cache é a principal métrica do seu uso de tokens do Claude Code.

Taxa de acerto de cache

Porcentagem de tokens do lado de entrada servidos do cache, codificada por cores em verde acima de 70 por cento, âmbar entre 30 e 70, vermelho abaixo de 30. Quanto maior, mais barato. A melhor alavanca única sobre o uso de tokens do Claude Code.

Total de tokens

Soma cumulativa de tokens de entrada, saída, gravações de cache e leituras de cache para a sessão ativa. Útil como um único número de destaque ao comparar o consumo de tokens entre agentes.

Por que o medidor de tokens fica vermelho

O AgentsRoom verifica seu uso de tokens do Claude Code por sessão em cada pesquisa. Quando o total acumulado ultrapassa um limite de consumo elevado, o distintivo muda para vermelho com um ícone de aviso. Esse é o sinal para abrir o monitor de sessão e decidir o que fazer: compactar, criar um novo agente, trocar de modelo ou simplesmente concluir a tarefa e encerrar.

Vermelho não é um limite rígido. O AgentsRoom não limita seu agente nem interrompe a execução. É um empurrão visual, em um único agente, para que um loop descontrolado não drene silenciosamente seu orçamento da Anthropic enquanto você se concentra em outra janela. Longas sessões com taxas de acerto de cache saudáveis são perfeitamente aceitáveis e permanecem verdes.

Como o AgentsRoom rastreia o uso de tokens do Claude Code

Três camadas: um coletor de uso, um analisador JSONL e uma interface ao vivo.

Coletor lê totais de tokens a cada 15 segundos

Uma tarefa em segundo plano lê o uso de tokens por sessão do seu estado local do Claude e o envia para a loja do renderizador. Sem proxy na API, sem chamada de rede extra. Apenas uma leitura mais rápida e visível dos números que o Claude já escreve no disco.

Analisador JSONL atualiza a cada 10 segundos enquanto o modal está aberto

O monitor de sessão adiciona uma chamada IPC única que percorre a transcrição JSONL da sessão ativa do Claude para calcular contagens de mensagens, turnos de assistente, usos de ferramentas, modelos roteados e timestamps de primeiro/último. A atualização ocorre a cada 10 segundos enquanto o painel está na tela, para que os números permaneçam ao vivo sem sobrecarregar o analisador em cada pesquisa do renderizador.

Interface ao vivo: distintivo mais monitor de sessão

O distintivo no compositor do terminal lê os totais de tokens e decide entre verde ou vermelho. Clique e o monitor de sessão se abre, em um portal que sobrepõe toda a janela. Os números são formatados com separadores de milhar, a taxa de acerto de cache é colorida e uma seção de dicas o incentiva a consumir menos.

Dicas para reduzir seu uso de tokens do Claude Code

O monitor de sessão apresenta essas dicas contextualmente, com base na sua taxa de acerto de cache ao vivo. Envie qualquer uma delas diretamente para o terminal do agente em um clique.

Taxa de acerto de cache baixa: estabilize o prefixo do prompt

Abaixo de 30 por cento, o Claude está pagando o preço total de entrada a cada turno. Editar o CLAUDE.md durante a sessão, trocar de modelo ou reorganizar mensagens de sistema iniciais quebra o cache. Tranque o topo do prompt e observe a taxa de acerto de cache subir.

Use /compact em vez de /clear

Slash clear apaga a conversa e força o preço total de entrada no próximo turno. Slash compact mantém a tarefa e reduz o histórico a um resumo, para que o prefixo do cache sobreviva. Mesma sensação fresca, uso de tokens do Claude Code muito menor.

Leia parcial, não todo

Em arquivos maiores que 100 linhas, peça ao agente para usar Read com offset e limit, ou grep pelo símbolo primeiro. Carregar um arquivo de 4000 linhas a cada turno é a principal fonte silenciosa de consumo de tokens do Claude Code.

Edite em vez de escrever

A ferramenta Edit apenas envia a diferença de volta ao Claude. Write retransmite o arquivo inteiro. Em um componente de 600 linhas, isso dobra os tokens de saída e inflaciona a entrada do próximo turno.

Crie sub-agentes para buscas amplas

Glob e Grep em centenas de arquivos despejam muito ruído no seu contexto principal. A ferramenta Agent opera em sua própria janela de contexto e retorna apenas um resumo, mantendo o prompt pai pequeno.

Reduza seu CLAUDE.md

CLAUDE.md é prependido a cada turno. Cada parágrafo inútil lá custa tokens de entrada em cache vezes cada mensagem. Mova contextos longos para context/ e faça referência sob demanda.

Monitor de sessão do AgentsRoom com estatísticas de uso de ferramentas, arquivos lidos e dicas contextuais para reduzir o uso de tokens do Claude Code, cada uma com um botão Fix this de um clique

O monitor de sessão lê sua taxa de acerto de cache ao vivo e apresenta correções prontas para enviar. Um clique em Fix this envia o prompt direto para o agente.

Medidor de tokens do AgentsRoom vs Claude Code padrão

O Claude Code padrão mostra os totais de tokens no final de uma sessão, em uma pequena linha de rodapé que você precisa rolar para cima para encontrar. Não há medidor ao vivo. Nenhum detalhamento por sessão. Nenhuma taxa de acerto de cache à vista. Nenhum aviso quando o consumo aumenta. Você descobre o uso excessivo depois do fato, quando a API limita a taxa ou a fatura mensal é muito alta.

O AgentsRoom transforma o uso de tokens do Claude Code em um sinal de primeira classe. Cada agente tem seu próprio contador de tokens. Vermelho em caso de uso excessivo. Clique para o detalhamento completo. Taxa de acerto de cache calculada em tempo real. Dicas que leem seus números ao vivo e propõem prompts prontos para corrigir a falha. A mesma sessão do Claude, as mesmas transcrições JSONL, mas com a visibilidade que uma frota de agentes paralelos realmente precisa.

Quando o medidor de uso de tokens do Claude Code salva você

Três situações reais onde o rastreador de tokens por sessão se paga.

Um agente está preso em um loop

Um agente continua relendo o mesmo arquivo e tentando a mesma correção. Seu distintivo de tokens fica vermelho em minutos, sua taxa de acerto de cache despenca, sua proporção de mensagens está desequilibrada. Você o identifica no painel, intervém, reescreve o prompt, economiza o orçamento.

Uma tarefa longa está indo muito bem

Três horas em uma refatoração, você se pergunta se o agente ainda está no caminho certo. Abra o monitor de sessão: 700 mensagens, 180 usos de ferramentas, 78 por cento de taxa de acerto de cache, tudo verde. O consumo de tokens é alto em absoluto, normal em eficiência. Deixe-o trabalhar.

Execução noturna em uma frota

Cinco agentes processam um backlog enquanto você dorme. De manhã, o uso de tokens por sessão informa qual foi eficiente, qual ficou preso em um loop, qual ficou sem contexto. Triagem em dois minutos em vez de ler cada transcrição.

O medidor de uso de tokens do Claude Code é uma parte de uma superfície de monitoramento maior. Status de agente ao vivo, distintivos de dock e notificações push móveis completam o quadro.

Veja como o AgentsRoom monitora agentes de IA

Estatísticas de projeto: tempo e tokens por projetoDelegação de agentes: direcione o trabalho para modelos mais baratos

Ver o número é o primeiro passo. Nosso guia completo detalha exatamente para onde vão os tokens do Claude Code e como cortar a conta sem desacelerar: contexto mais apertado, o modelo certo, delegação e mais.

Leia: corte seus custos de tokens do Claude Code

FAQ

O rastreador de uso de tokens do Claude Code é preciso?

Sim. O AgentsRoom lê as mesmas transcrições JSONL que o Claude escreve em ~/.claude/projects/. Tokens de entrada, tokens de saída, gravações de cache e leituras de cache são extraídos diretamente da carga útil de uso por mensagem que a Anthropic emite. Não há estimativa, não há proxy, não há arredondamento. Os números no monitor de sessão correspondem ao que a Anthropic cobra.

O contador de tokens desacelera meu agente?

Não. O coletor lê arquivos locais a cada 15 segundos. A análise JSONL só é executada quando o monitor de sessão está aberto, a cada 10 segundos. Não há chamada de rede extra para a Anthropic, nenhuma instrumentação injetada no Claude, nenhuma sobrecarga nas chamadas de ferramentas. Seu agente opera em plena velocidade.

Quando o distintivo fica vermelho?

Quando o uso acumulado de tokens do Claude Code por sessão ultrapassa um limite de consumo elevado ajustado para sessões normais de codificação de longo prazo. O limite é conservador o suficiente para que uma sessão ociosa nunca o atinja, e apertado o suficiente para que um loop descontrolado fique vermelho em poucos turnos. Vermelho é um aviso, não um limite.

Por que a taxa de acerto de cache é tão importante?

Leituras de cache custam aproximadamente 10 vezes menos do que tokens de entrada frescos. Uma sessão com 80 por cento de taxa de acerto de cache é aproximadamente cinco vezes mais barata do que a mesma sessão com 0 por cento. A taxa de acerto de cache é a melhor alavanca única sobre seu uso de tokens do Claude Code. O AgentsRoom a mostra ao vivo para que você possa corrigir o curso durante a sessão em vez de descobrir no final.

Ele suporta Codex, Antigravity, OpenCode, Aider, Grok Build, Mistral Vibe e Kimi Code também?

O monitor de sessão em sua forma atual é específico do Claude porque lê as transcrições JSONL do Claude e o detalhamento do cache de prompts é um recurso de cobrança exclusivo do Claude. Status, função e notificações funcionam para todos os provedores. Estamos rastreando o uso independente de provedores no roteiro.

O AgentsRoom envia meu uso de tokens do Claude Code para um servidor?

Não. O contador de tokens, o monitor de sessão e a taxa de acerto de cache são calculados inteiramente no seu Mac, a partir de arquivos locais. Nada sai da sua máquina. Se você ativar a sincronização criptografada opcional para o aplicativo móvel, apenas os dados que você escolher espelhar explicitamente são enviados, e eles são criptografados de ponta a ponta via o relay do AgentsRoom.

Posso salvar as dicas como prompts reutilizáveis?

Sim. Cada dica no monitor de sessão tem um botão Corrigir isso que abre um prompt editável e pronto para uso. Envie-o diretamente para o terminal do agente, copie-o para a área de transferência ou salve-o na sua biblioteca de prompts global para que a mesma correção esteja a um clique de distância em cada projeto.

Pare de adivinhar seu uso de tokens do Claude Code

Baixe o AgentsRoom e obtenha um medidor de tokens por sessão ao vivo em cada agente do Claude. Vermelho em caso de uso excessivo, taxa de acerto de cache à vista, dicas para consumir menos. Tudo local, tudo seu.

GratisBaixar AgentsRoom

App complementar: acompanhe seus agentes em qualquer lugar

Use Claude, Codex, Antigravity CLI ou outro provedor de IA.

Instalar a extensão

Chrome Web Store

Envie bugs e pedidos direto para o seu backlog público.

Uma visão do AgentsRoom em ação.

Multi-projetos

Multi-provedor

Multi-agentes

Status ao vivo

Diff e commit

App mobile

Preview ao vivo

Equipes de agentes

Testes no navegador

Dev guiada por backlog

Biblioteca de prompts

Biblioteca de skills

Ver todas as funcionalidades

Uso de tokens do Claude Code,rastreado por sessão, em tempo real