Token usage : per sessione : in tempo reale

Claude Code token usage,
tracciato per sessione, in tempo reale

AgentsRoom sorveglia il tuo Claude Code token usage in ogni terminale agente. Un piccolo contatore di token sta nel composer e si aggiorna live. Quando il consumo di token si fa pesante su una singola sessione Claude, il badge diventa rosso e ti avvisa prima che tu sfondi la finestra di contesto.

Clicca il badge e si apre il monitor di sessione : input tokens, output tokens, cache reads, cache writes, cache hit rate, conteggio messaggi, modelli instradati, durata della sessione e tool uses. Un pannello, una sessione Claude, tutti i numeri che governano il tuo Claude Code token usage.

Demo live del badge Claude Code token usage in AgentsRoom : sta in ogni composer agente, diventa rosso in caso di consumo pesante e apre un monitor di sessione completo con input tokens, output tokens, cache reads e cache writes.

Il Claude Code token usage e il costo variabile numero uno per chi fa girare agenti AI di coding. Ogni prompt, ogni tool call, ogni reiniezione di CLAUDE.md mangia token. Senza visibilita, scopri di aver sfondato il budget quando l'API ti throttla o quando arriva la fattura. AgentsRoom mette un contatore Claude Code token usage live su ogni sessione agente, cosi vedi il consumo mentre accade, non dopo.

Il contatore di token vive nel composer del terminale, proprio accanto al pulsante di invio. Si aggiorna pochi secondi dopo ogni turno Claude. I token si accumulano sull'intera sessione : input tokens, output tokens, cache writes e cache reads, tutti sommati e con codice colore cosi li leggi a colpo d'occhio. Quando il Claude Code token usage per sessione supera una soglia di consumo pesante, il badge passa a rosso con un'icona di avviso, allo stesso modo in cui un indicatore di carburante ti tormenta prima che il serbatoio sia vuoto.

Cliccalo e si apre il monitor di sessione. Ottieni uno snapshot live della sessione Claude attiva : durata dal primo messaggio, numero di prompt utente vs turni assistant, tool uses, modelli che hanno gestito la conversazione, l'id sessione Claude (copiabile per --resume) e il breakdown completo dei token. Il cache hit rate viene calcolato al volo, con codice colore verde / ambra / rosso, con un promemoria di una riga che ricorda che le cache reads costano grosso modo dieci volte meno dell'input fresco. Quel singolo pannello trasforma il Claude Code token usage da scatola nera a indicatore in tempo reale.

Perche il Claude Code token usage per sessione conta

La maggior parte dei wrapper Claude riporta il consumo di token a livello di account, una volta al giorno, in una dashboard che ti devi ricordare di aprire. Quando lo fai, il danno e gia fatto. AgentsRoom porta il Claude Code token usage in superficie, su ogni singolo terminale agente, cosi non puoi ignorarlo. Il contatore di token e a due centimetri dal pulsante di invio. Lo guardi come guardi il badge dei messaggi non letti sul telefono.

Per sessione e la giusta granularita. Una squadra di agenti che gira in parallelo non ti dice chi sta bruciando token. Un agente potrebbe essere in loop su un prompt bloccato mentre quattro altri sono tranquilli. Con un contatore Claude Code token usage per sessione, l'agente rumoroso spicca all'istante : il suo badge e rosso, il suo cache hit rate e basso, il suo conteggio messaggi sale veloce. Salti dentro, sistemi il prompt, salvi il budget.

L'intera feature e locale. AgentsRoom legge il tuo Claude Code token usage direttamente dai transcript JSONL che Claude scrive in ~/.claude/projects/. Niente lascia la tua macchina. Nessun usage tracker di terze parti. Nessun proxy davanti all'API. Il contatore di token in AgentsRoom e solo una lettura piu rapida e piu visibile dei dati che Anthropic gia salva sul tuo disco.

Modale Claude Code token usage in AgentsRoom : durata, stato, conteggio messaggi, tool uses, modelli, id sessione, piu breakdown dei token con input, output, cache writes, cache reads e cache hit rate

Il pannello Claude Code token usage in AgentsRoom. Clicca il badge token per sessione in qualsiasi composer agente, ottieni ogni numero che conta, piu suggerimenti per abbassare il tuo consumo di token.

Cosa mostra il pannello Claude Code token usage

Un click sul badge token apre un monitor di sessione live. Ecco ogni numero che ottieni sulla sessione Claude attiva.

Durata della sessione

Tempo trascorso tra il primo e l'ultimo messaggio della sessione Claude attiva, aggiornato live. Utile per individuare gli agenti che stanno masticando contesto da ore.

Stato agente live

Idle, working, done o needs input. Lo stato si abbina al contatore di token cosi vedi a colpo d'occhio quale sessione Claude sta consumando e quale invece sta solo li ferma.

Messaggi e turni assistant

Conteggio dei prompt utente vs i turni assistant nella sessione Claude attiva. Un rapporto sbilanciato e un segnale forte che un agente e in loop o che il tuo prompt e troppo vago.

Tool uses

Numero totale di chiamate Read, Edit, Bash, Grep, Glob e altri tool eseguite da Claude nella sessione. Le chiamate ai tool guidano una grossa fetta degli input tokens, quindi questo numero traccia da vicino il Claude Code token usage.

Modelli usati

Ogni modello Claude che ha gestito un turno nella sessione : Sonnet, Opus, Haiku, varianti datate. AgentsRoom deduplica e accorcia i nomi cosi vedi subito se la tua sessione e stata auto-instradata su piu modelli.

Id sessione Claude

L'identificatore interno della sessione Claude, copiabile in un click. Usalo per fare claude --resume sulla stessa identica conversazione dalla CLI senza perdere contesto.

Input tokens

Input tokens freschi inviati a Claude durante la sessione, prima di qualsiasi riuso della cache. Questo e il bucket piu costoso del tuo Claude Code token usage.

Output tokens

Token generati da Claude nella sessione. Gli output tokens sono fatturati a una tariffa piu alta dell'input, quindi valori alti senza progressi significano che un agente sta girando a vuoto.

Cache writes

Token che Claude scrive nella prompt cache durante la sessione. Le cache writes sono fatturate con un piccolo sovrapprezzo ma sbloccano cache reads economiche nei turni successivi.

Cache reads

Token serviti dalla prompt cache invece di essere riprezzati come input fresco. Le cache reads costano grosso modo 10 volte meno degli input tokens, ed e per questo che il cache hit rate e la metrica leader del tuo Claude Code token usage.

Cache hit rate

Percentuale di token lato input serviti dalla cache, con codice colore verde sopra il 70 percento, ambra tra 30 e 70, rosso sotto 30. Piu alto e piu economico. La singola leva migliore sul Claude Code token usage.

Token totali

Somma cumulativa di input, output, cache writes e cache reads per la sessione attiva. Utile come singolo numero di intestazione quando confronti il consumo di token tra agenti.

Perche il contatore di token diventa rosso

AgentsRoom controlla il tuo Claude Code token usage per sessione a ogni poll. Quando il totale corrente supera una soglia di consumo pesante, il badge passa a rosso con un'icona di avviso. Quello e il segnale per aprire il monitor di sessione e decidere cosa fare : compatta, forka un nuovo agente, cambia modello o semplicemente finisci il task e chiudi.

Rosso non e un limite rigido. AgentsRoom non throttla il tuo agente ne interrompe il run. E un sollecito visivo, su un singolo agente, cosi un loop fuori controllo non drena silenziosamente il tuo budget Anthropic mentre sei concentrato su un'altra finestra. Sessioni lunghe con cache hit rate sani vanno benissimo e restano verdi.

Come AgentsRoom traccia il Claude Code token usage

Tre layer : un poller di usage, un parser JSONL e una UI live.

01

Il poller legge i totali token ogni 15 secondi

Un task in background legge il consumo di token per sessione dal tuo stato Claude locale e lo spinge nello store del renderer. Niente proxy sull'API, nessuna chiamata di rete extra. Solo una lettura piu rapida e visibile dei numeri che Claude gia scrive su disco.

02

Il parser JSONL rinfresca ogni 10 secondi mentre la modale e aperta

Il monitor di sessione aggiunge una chiamata IPC one-shot che attraversa il transcript JSONL della sessione Claude attiva per calcolare conteggi messaggi, turni assistant, tool uses, modelli instradati e timestamp di inizio/fine. Il refresh gira ogni 10 secondi mentre il pannello e a schermo, cosi i numeri restano live senza bruciare il parser a ogni poll del renderer.

03

UI live : badge piu monitor di sessione

Il badge nel composer del terminale legge i totali token e decide verde o rosso. Cliccalo e si apre il monitor di sessione, in un portal cosi sovrappone l'intera finestra. I numeri sono formattati con separatori delle migliaia, il cache hit rate e colorato e una sezione di suggerimenti ti spinge a consumare meno.

Suggerimenti per abbassare il tuo Claude Code token usage

Il monitor di sessione fa emergere questi suggerimenti contestualmente, in base al tuo cache hit rate live. Manda uno qualsiasi di essi direttamente al terminale dell'agente in un click.

Cache hit rate basso : stabilizza il prefisso del prompt

Sotto il 30 percento, Claude paga il prezzo input pieno a ogni turno. Modificare CLAUDE.md a meta sessione, cambiare modello o riarrangiare i system message iniziali rompe la cache. Blocca la testa del prompt e guarda il cache hit rate salire.

Usa /compact invece di /clear

Slash clear cancella la conversazione e forza il pricing input pieno al turno successivo. Slash compact mantiene il task e comprime la cronologia in un riassunto, cosi il prefisso della cache sopravvive. Stessa sensazione di freschezza, Claude Code token usage molto piu basso.

Read parziale, non intero

Sui file piu grandi di 100 righe, chiedi all'agente di usare Read con offset e limit, o di fare prima grep sul simbolo. Caricare un file da 4000 righe a ogni turno e il sink numero uno silenzioso del Claude Code token usage.

Edit invece di Write

Il tool Edit manda solo il diff a Claude. Write ritrasmette l'intero file. Su un componente da 600 righe, questo raddoppia gli output tokens e gonfia l'input del turno successivo.

Spawna sub-agent per ricerche estese

Glob e Grep su centinaia di file scaricano molto rumore nel tuo contesto principale. Il tool Agent gira nella sua finestra di contesto e restituisce solo un riassunto, mantenendo piccolo il prompt parent.

Snellisci il tuo CLAUDE.md

CLAUDE.md viene anteposto a ogni turno. Ogni paragrafo inutile li dentro costa input tokens cached moltiplicati per ogni messaggio. Sposta il contesto lungo in context/ e referenzialo a richiesta.

Contatore token AgentsRoom vs Claude Code vanilla

Claude Code vanilla mostra i totali token alla fine di una sessione, in una piccola riga di footer che devi scrollare in alto per trovare. Niente contatore live. Nessun breakdown per sessione. Nessun cache hit rate a colpo d'occhio. Nessun avviso quando il consumo schizza. Scopri il sovraconsumo a posteriori, quando l'API rate-limita o la fattura mensile e troppo alta.

AgentsRoom trasforma il Claude Code token usage in un segnale di prima classe. Ogni agente ha il suo contatore di token. Rosso in caso di sovraconsumo. Click per il breakdown completo. Cache hit rate calcolato in tempo reale. Suggerimenti che leggono i tuoi numeri live e propongono prompt pronti all'uso per riparare la perdita. La stessa sessione Claude, gli stessi transcript JSONL, ma con la visibilita che una flotta di agenti paralleli ha realmente bisogno.

Quando il contatore Claude Code token usage ti salva

Tre situazioni reali in cui il tracker token per sessione si ripaga da solo.

Un agente e bloccato in un loop

Un agente continua a rileggere lo stesso file e a riprovare lo stesso fix. Il suo badge token diventa rosso in pochi minuti, il suo cache hit rate crolla, il rapporto messaggi e sbilanciato. Lo individui sulla dashboard, salti dentro, riscrivi il prompt, salvi il budget.

Un task lungo sta andando alla grande

Tre ore dentro un refactor, ti chiedi se l'agente e ancora sulla buona strada. Apri il monitor di sessione : 700 messaggi, 180 tool uses, 78 percento di cache hit rate, tutto verde. Il consumo di token e alto in assoluto, normale in efficienza. Lascialo cuocere.

Run notturno su una flotta

Cinque agenti macinano un backlog mentre dormi. Al mattino, il consumo di token per sessione ti dice quale e stato efficiente, quale e andato in loop, quale ha esaurito il contesto. Triage in due minuti invece di leggere ogni transcript.

Il contatore Claude Code token usage e un pezzo di una superficie di monitor piu ampia. Stato agente live, badge dock e notifiche push mobile completano il quadro.

Vedi come AgentsRoom monitora gli agenti AI

FAQ

Il tracker Claude Code token usage e accurato ?

Si. AgentsRoom legge gli stessi transcript JSONL che Claude stesso scrive in ~/.claude/projects/. Input tokens, output tokens, cache writes e cache reads sono tirati direttamente dal payload usage per messaggio che Anthropic emette. Nessuna stima, nessun proxy, nessun arrotondamento. I numeri nel monitor di sessione coincidono con quelli che Anthropic fattura.

Il contatore di token rallenta il mio agente ?

No. Il poller legge file locali ogni 15 secondi. Il parse JSONL gira solo quando il monitor di sessione e aperto, ogni 10 secondi. Nessuna chiamata di rete extra ad Anthropic, nessuna strumentazione iniettata in Claude, nessun overhead sulle tool calls. Il tuo agente gira a piena velocita.

Quando diventa rosso il badge ?

Quando il Claude Code token usage cumulativo per sessione supera una soglia di consumo pesante calibrata su normali sessioni di coding lungo. La soglia e abbastanza conservativa da non far scattare mai una sessione idle, e abbastanza stretta da far diventare rosso in pochi turni un loop fuori controllo. Rosso e un avviso, non un throttle.

Perche il cache hit rate e cosi importante ?

Le cache reads costano grosso modo 10 volte meno degli input tokens freschi. Una sessione all'80 percento di cache hit rate e grosso modo cinque volte piu economica della stessa sessione allo 0 percento. Il cache hit rate e la singola leva migliore sul tuo Claude Code token usage. AgentsRoom lo mostra live cosi puoi correggere la rotta a meta sessione invece di scoprirlo alla fine.

Supporta anche Codex, Gemini, OpenCode e Aider ?

Il monitor di sessione nella sua forma attuale e specifico per Claude perche legge i transcript JSONL di Claude e il breakdown della prompt cache e una feature di billing solo Claude. Stato, ruolo e notifiche funzionano per ogni provider. Stiamo tracciando un usage agnostico al provider nella roadmap.

AgentsRoom manda il mio Claude Code token usage a un server ?

No. Il contatore di token, il monitor di sessione e il cache hit rate sono calcolati interamente sul tuo Mac, da file locali. Niente lascia la tua macchina. Se attivi la sincronizzazione crittografata opzionale verso il companion mobile, viene inviato solo il dato che scegli esplicitamente di mirrorare, ed e end-to-end crittografato tramite il relay AgentsRoom.

Posso salvare i suggerimenti come prompt riutilizzabili ?

Si. Ogni suggerimento nel monitor di sessione ha un pulsante Fix this che apre un prompt editabile e pronto all'uso. Mandalo direttamente al terminale dell'agente, copialo negli appunti o salvalo nella tua libreria globale di prompt cosi lo stesso fix e a un click di distanza su ogni progetto.

Smetti di tirare a indovinare il tuo Claude Code token usage

Scarica AgentsRoom e ottieni un contatore di token live per sessione su ogni agente Claude. Rosso in caso di sovraconsumo, cache hit rate a colpo d'occhio, suggerimenti per consumare meno. Tutto locale, tutto tuo.

GratisScarica AgentsRoom

App companion: monitora i tuoi agenti in movimento

Funziona con Claude, Codex, OpenCode, Gemini CLI e Aider

Installa l'estensione
Chrome Web Store

Invia bug e richieste direttamente nel tuo backlog pubblico.

Multi-progetto
Multi-provider
Multi-agente
Stato in tempo reale
Diff e commit
App mobile
Anteprima live
Team di agenti
Test browser
Dev guidata da backlog