Utilizzo dei token: per sessione: live

Utilizzo dei token di Claude Code,
monitorato per sessione, in tempo reale

AgentsRoom monitora il tuo utilizzo dei token di Claude Code in ogni terminale dell'agente. Un piccolo contatore di token si trova nel compositore e si aggiorna in tempo reale. Quando il tuo consumo di token diventa elevato in una singola sessione di Claude, il badge diventa rosso e ti avverte prima che tu superi la finestra di contesto.

Clicca sul badge e si apre il monitor di sessione: token di input, token di output, letture della cache, scritture della cache, tasso di hit della cache, conteggio dei messaggi, modelli instradati, durata della sessione e utilizzi degli strumenti. Un pannello, una sessione di Claude, tutti i numeri che guidano il tuo utilizzo dei token di Claude Code.

Scarica AgentsRoom Scopri come funziona il misuratore di token

Gratis · macOS · 100% locale, senza proxy

Demo live del badge di utilizzo dei token di Claude Code in AgentsRoom: si trova in ogni compositore dell'agente, diventa rosso in caso di elevato consumo di token e apre un monitor di sessione completo con token di input, token di output, letture della cache e scritture della cache.

L'utilizzo dei token di Claude Code è il costo variabile numero uno per l'esecuzione di agenti di codifica AI. Ogni prompt, ogni chiamata a uno strumento, ogni reiniezione di CLAUDE.md consuma token. Senza visibilità, scopri di aver superato il tuo budget quando l'API limita o quando arriva la fattura. AgentsRoom mette un misuratore di utilizzo dei token di Claude Code live in ogni sessione dell'agente, così puoi vedere il consumo mentre accade, non dopo.

Il contatore di token si trova nel compositore del terminale, proprio accanto al pulsante di invio. Si aggiorna pochi secondi dopo ogni turno di Claude. I token si accumulano durante l'intera sessione: token di input, token di output, scritture della cache e letture della cache, tutti sommati e codificati a colori in modo da poterli leggere a colpo d'occhio. Quando l'utilizzo dei token di Claude Code per sessione supera una soglia di consumo elevato, il badge diventa rosso con un'icona di avviso, proprio come un indicatore di carburante ti avverte prima che il serbatoio si svuoti.

Cliccalo e si apre il monitor di sessione. Ottieni un'istantanea live della sessione attiva di Claude: durata dal primo messaggio, numero di prompt dell'utente rispetto ai turni dell'assistente, utilizzi degli strumenti, modelli che hanno gestito la conversazione, l'id della sessione di Claude (copiare per --resume) e l'analisi completa dei token. Il tasso di hit della cache viene calcolato al volo, codificato a colori verde / ambra / rosso, con un promemoria in una riga che ricorda che le letture della cache costano circa dieci volte meno rispetto all'input fresco. Quel singolo pannello trasforma l'utilizzo dei token di Claude Code da una scatola nera a un misuratore in tempo reale.

Primo piano del compositore dell'agente di AgentsRoom con il badge di utilizzo dei token di Claude Code diventato rosso, che avvisa di un consumo elevato a 58 milioni di token

Il badge dei token vive accanto al pulsante di invio e diventa rosso quando il consumo di una sessione si fa pesante.

Perché l'utilizzo dei token di Claude Code per sessione è importante

La maggior parte delle interfacce di Claude riporta l'utilizzo dei token a livello di account, una volta al giorno, in un cruscotto che devi ricordarti di aprire. A quel punto il danno è fatto. AgentsRoom porta l'utilizzo dei token di Claude Code in superficie, in ogni singolo terminale dell'agente, così non puoi ignorarlo. Il contatore di token è a due centimetri dal pulsante di invio. Lo guardi come guardi il badge dei messaggi non letti sul tuo telefono.

Per sessione è la giusta granularità. Un team di agenti che lavora in parallelo non ti dice chi sta bruciando token. Un agente potrebbe essere bloccato su un prompt mentre altri quattro sono silenziosi. Con un misuratore di utilizzo dei token di Claude Code per sessione, l'agente rumoroso si distingue immediatamente: il suo badge è rosso, il suo tasso di hit della cache è basso, il suo conteggio dei messaggi sta salendo rapidamente. Intervieni, correggi il prompt, risparmia il budget.

L'intera funzionalità è locale. AgentsRoom legge il tuo utilizzo dei token di Claude Code direttamente dai trascritti JSONL che Claude scrive in ~/.claude/projects/. Niente lascia la tua macchina. Nessun tracker di utilizzo di terze parti. Nessun proxy davanti all'API. Il contatore di token in AgentsRoom è solo una lettura più veloce e visibile dei dati che Anthropic già salva sul tuo disco.

Modulo di utilizzo dei token di Claude Code in AgentsRoom: durata, stato, conteggio dei messaggi, utilizzi degli strumenti, modelli, id della sessione, oltre all'analisi dei token con input, output, scritture della cache, letture della cache e tasso di hit della cache

Il pannello di utilizzo dei token di Claude Code in AgentsRoom. Clicca sul badge di token per sessione in qualsiasi compositore dell'agente, ottieni ogni numero che conta, oltre a suggerimenti per ridurre il tuo consumo di token.

Cosa mostra il pannello di utilizzo dei token di Claude Code

Un clic sul badge dei token apre un monitor di sessione live. Ecco ogni numero che ottieni sulla sessione attiva di Claude.

Durata della sessione

Tempo trascorso tra il primo e l'ultimo messaggio della sessione attiva di Claude, aggiornato in tempo reale. Utile per individuare agenti che hanno masticato contesto per ore.

Stato live dell'agente

Inattivo, in lavorazione, completato o necessita di input. Lo stato si abbina al contatore di token in modo da vedere a colpo d'occhio quale sessione di Claude sta consumando e quale è semplicemente ferma.

Messaggi e turni dell'assistente

Conteggio dei prompt dell'utente rispetto ai turni dell'assistente nella sessione attiva di Claude. Un rapporto sbilanciato è un forte segnale che un agente è bloccato o che il tuo prompt è troppo vago.

Utilizzi degli strumenti

Numero totale di chiamate a Read, Edit, Bash, Grep, Glob e altri strumenti eseguiti da Claude nella sessione. Le chiamate agli strumenti guidano una grande parte dei token di input, quindi questo numero tiene traccia dell'utilizzo dei token di Claude Code da vicino.

Modelli utilizzati

Ogni modello di Claude che ha gestito un turno nella sessione: Sonnet, Opus, Haiku, varianti datate. AgentsRoom elimina i duplicati e accorcia i nomi in modo da vedere immediatamente se la tua sessione è stata instradata automaticamente tra i modelli.

ID della sessione di Claude

L'identificatore interno della sessione di Claude, copiabile con un clic. Usalo per claude --resume la stessa conversazione esatta dalla CLI senza perdere il contesto.

Token di input

Token di input freschi inviati a Claude durante la sessione, prima di qualsiasi riutilizzo della cache. Questo è il bucket più costoso del tuo utilizzo dei token di Claude Code.

Token di output

Token generati da Claude nella sessione. I token di output sono fatturati a una tariffa più alta rispetto agli input, quindi valori elevati senza progressi significano che un agente sta girando a vuoto.

Scritture della cache

Token che Claude scrive nella cache dei prompt durante la sessione. Le scritture della cache sono addebitate a un piccolo premio ma sbloccano letture della cache economiche nei turni successivi.

Letture della cache

Token serviti dalla cache dei prompt invece di essere riprezzati come input freschi. Le letture della cache costano circa 10 volte meno dei token di input, motivo per cui il tasso di hit della cache è la metrica principale del tuo utilizzo dei token di Claude Code.

Tasso di hit della cache

Percentuale di token lato input serviti dalla cache, codificata a colori in verde sopra il 70 percento, ambra tra il 30 e il 70, rosso sotto il 30. Maggiore è più economico. Il miglior leva singola sull'utilizzo dei token di Claude Code.

Token totali

Somma cumulativa tra input, output, scritture della cache e letture della cache per la sessione attiva. Utile come numero principale unico quando confronti il consumo di token tra agenti.

Perché il misuratore di token diventa rosso

AgentsRoom controlla il tuo utilizzo dei token di Claude Code per sessione ad ogni polling. Quando il totale cumulativo supera una soglia di consumo elevato, il badge diventa rosso con un'icona di avviso. Questo è il segnale per aprire il monitor di sessione e decidere cosa fare: compattare, forkare un nuovo agente, cambiare modello, o semplicemente completare il compito e chiudere.

Il rosso non è un limite rigido. AgentsRoom non limita il tuo agente o interrompe l'esecuzione. È un suggerimento visivo, su un singolo agente, così un ciclo incontrollato non drena silenziosamente il tuo budget Anthropic mentre ti concentri su un'altra finestra. Sessioni lunghe con tassi di hit della cache sani sono perfettamente accettabili e rimangono verdi.

Come AgentsRoom traccia l'utilizzo dei token di Claude Code

Tre livelli: un poller di utilizzo, un parser JSONL e un'interfaccia utente live.

Il poller legge i totali dei token ogni 15 secondi

Un'attività in background legge l'utilizzo dei token per sessione dal tuo stato locale di Claude e lo invia nello store del renderer. Nessun proxy sull'API, nessuna chiamata di rete extra. Solo una lettura più veloce e visibile dei numeri che Claude già scrive su disco.

Il parser JSONL si aggiorna ogni 10 secondi mentre il modulo è aperto

Il monitor di sessione aggiunge una chiamata IPC one-shot che percorre la trascrizione JSONL della sessione attiva di Claude per calcolare i conteggi dei messaggi, i turni dell'assistente, gli utilizzi degli strumenti, i modelli instradati e i timestamp di inizio/fine. Gli aggiornamenti avvengono ogni 10 secondi mentre il pannello è sullo schermo, così i numeri rimangono live senza sovraccaricare il parser ad ogni polling del renderer.

Interfaccia utente live: badge più monitor di sessione

Il badge nel compositore del terminale legge i totali dei token e decide se essere verde o rosso. Cliccalo e si apre il monitor di sessione, in un portale che sovrappone l'intera finestra. I numeri sono formattati con separatori di migliaia, il tasso di hit della cache è colorato e una sezione di suggerimenti ti incoraggia a consumare meno.

Suggerimenti per ridurre il tuo utilizzo dei token di Claude Code

Il monitor di sessione presenta questi suggerimenti contestualmente, in base al tuo tasso di hit della cache live. Invia uno di essi direttamente al terminale dell'agente con un clic.

Basso tasso di hit della cache: stabilizza il prefisso del prompt

Sotto il 30 percento, Claude sta pagando il prezzo pieno per l'input ad ogni turno. Modificare CLAUDE.md a metà sessione, cambiare modello o riordinare i messaggi di sistema iniziali rompe la cache. Blocca la parte superiore del prompt e guarda il tasso di hit della cache salire.

Usa /compact invece di /clear

Slash clear cancella la conversazione e costringe il prezzo pieno per l'input al turno successivo. Slash compact mantiene il compito e riduce la cronologia in un riepilogo, così il prefisso della cache sopravvive. Stessa sensazione fresca, utilizzo dei token di Claude Code molto inferiore.

Leggi parziale, non tutto

Su file più grandi di 100 righe, chiedi all'agente di usare Read con offset e limit, o grep per il simbolo prima. Caricare un file di 4000 righe ad ogni turno è il numero silenzioso uno per il consumo di token di Claude Code.

Modifica invece di Scrivere

Lo strumento Edit invia solo il diff a Claude. Write ritrasmette l'intero file. Su un componente di 600 righe, questo raddoppia i token di output e gonfia l'input del turno successivo.

Genera sub-agenti per ricerche ampie

Glob e Grep su centinaia di file riversano molto rumore nel tuo contesto principale. Lo strumento Agent funziona nella sua finestra di contesto e restituisce solo un riepilogo, mantenendo il prompt genitore piccolo.

Riduci il tuo CLAUDE.md

CLAUDE.md viene preceduto ad ogni turno. Ogni paragrafo inutile lì costa token di input memorizzati per ogni messaggio. Sposta il lungo contesto in context/ e riferisciti ad esso su richiesta.

Monitor di sessione di AgentsRoom con statistiche sull'uso degli strumenti, file letti e suggerimenti contestuali per ridurre l'utilizzo dei token di Claude Code, ognuno con un pulsante Fix this a un clic

Il monitor di sessione legge in tempo reale il tuo tasso di hit della cache e propone correzioni pronte da inviare. Un clic su Fix this invia il prompt direttamente all'agente.

Misuratore di token di AgentsRoom vs Claude Code vanilla

Claude Code vanilla mostra i totali dei token alla fine di una sessione, in una piccola riga di piè di pagina che devi scorrere per trovare. Non c'è un misuratore live. Nessuna suddivisione per sessione. Nessun tasso di hit della cache a colpo d'occhio. Nessun avviso quando il consumo aumenta. Scopri l'uso eccessivo dopo il fatto, quando l'API limita il tasso o la fattura mensile è troppo alta.

AgentsRoom trasforma l'utilizzo dei token di Claude Code in un segnale di prima classe. Ogni agente ha il proprio contatore di token. Rosso in caso di uso eccessivo. Clicca per l'analisi completa. Tasso di hit della cache calcolato in tempo reale. Suggerimenti che leggono i tuoi numeri live e propongono prompt pronti per correggere la perdita. La stessa sessione di Claude, le stesse trascrizioni JSONL, ma con la visibilità di cui una flotta di agenti paralleli ha effettivamente bisogno.

Quando il misuratore di utilizzo dei token di Claude Code ti salva

Tre situazioni reali in cui il tracker di token per sessione si ripaga da solo.

Un agente è bloccato in un ciclo

Un agente continua a rileggere lo stesso file e a riprovare la stessa correzione. Il suo badge di token diventa rosso in pochi minuti, il suo tasso di hit della cache crolla, il suo rapporto di messaggi è sbilanciato. Lo individui nel cruscotto, intervieni, riscrivi il prompt, risparmia il budget.

Un compito lungo sta andando alla grande

Tre ore in un refactoring, ti chiedi se l'agente sia ancora sulla buona strada. Apri il monitor di sessione: 700 messaggi, 180 utilizzi degli strumenti, 78 percento di tasso di hit della cache, tutto verde. Il consumo di token è alto in valore assoluto, normale in efficienza. Lascialo lavorare.

Esecuzione notturna su una flotta

Cinque agenti lavorano su un backlog mentre dormi. Al mattino, l'utilizzo dei token per sessione ti dice quale era efficiente, quale ha loopato, quale è rimasto senza contesto. Triaggio in due minuti invece di leggere ogni trascrizione.

Il misuratore di utilizzo dei token di Claude Code è un pezzo di una superficie di monitoraggio più grande. Lo stato live degli agenti, i badge dock e le notifiche push mobili completano il quadro.

Scopri come AgentsRoom monitora gli agenti AI

Statistiche di progetto: tempo e token per progettoDelega agli agenti: instrada il lavoro verso modelli più economici

Vedere il numero è il primo passo. La nostra guida completa analizza esattamente dove vanno i token di Claude Code e come ridurre la fattura senza rallentare: contesto più stretto, il modello giusto, delega e altro.

Leggi: riduci i tuoi costi per i token di Claude Code

FAQ

Il tracker di utilizzo dei token di Claude Code è accurato?

Sì. AgentsRoom legge le stesse trascrizioni JSONL che Claude stesso scrive in ~/.claude/projects/. I token di input, i token di output, le scritture della cache e le letture della cache vengono estratti direttamente dal payload di utilizzo per messaggio che Anthropic emette. Non ci sono stime, nessun proxy, nessun arrotondamento. I numeri nel monitor di sessione corrispondono a ciò che Anthropic fattura.

Il contatore di token rallenta il mio agente?

No. Il poller legge i file locali ogni 15 secondi. Il parser JSONL viene eseguito solo quando il monitor di sessione è aperto, ogni 10 secondi. Non ci sono chiamate di rete extra ad Anthropic, nessuna strumentazione iniettata in Claude, nessun sovraccarico sulle chiamate agli strumenti. Il tuo agente funziona a piena velocità.

Quando il badge diventa rosso?

Quando l'utilizzo cumulativo dei token di Claude Code per sessione supera una soglia di consumo elevato sintonizzata per sessioni di codifica normali e lunghe. La soglia è sufficientemente conservativa da non attivarla mai in una sessione inattiva, e sufficientemente stretta da far diventare rosso un ciclo incontrollato in pochi turni. Il rosso è un avviso, non un limite.

Perché il tasso di hit della cache è così importante?

Le letture della cache costano circa 10 volte meno dei token di input freschi. Una sessione con un tasso di hit della cache dell'80 percento è circa cinque volte più economica rispetto alla stessa sessione con 0 percento. Il tasso di hit della cache è la migliore leva singola sul tuo utilizzo dei token di Claude Code. AgentsRoom lo mostra in tempo reale così puoi correggere il corso a metà sessione invece di scoprirlo alla fine.

Supporta anche Codex, Antigravity, OpenCode, Aider, Grok Build, Mistral Vibe e Kimi Code?

Il monitor di sessione nella sua forma attuale è specifico per Claude perché legge le trascrizioni JSONL di Claude e la suddivisione della cache dei prompt è una funzionalità di fatturazione esclusiva di Claude. Stato, ruolo e notifiche funzionano per ogni fornitore. Stiamo monitorando l'utilizzo indipendente dal fornitore nella roadmap.

AgentsRoom invia il mio utilizzo dei token di Claude Code a un server?

No. Il contatore di token, il monitor di sessione e il tasso di hit della cache vengono calcolati interamente sul tuo Mac, da file locali. Niente lascia la tua macchina. Se abiliti la sincronizzazione crittografata opzionale con il compagno mobile, solo i dati che scegli esplicitamente di specchiare vengono inviati, ed è crittografato end-to-end tramite il relay di AgentsRoom.

Posso salvare i suggerimenti come prompt riutilizzabili?

Sì. Ogni suggerimento nel monitor di sessione ha un pulsante Correggi questo che apre un prompt pronto per l'editing. Inviarlo direttamente al terminale dell'agente, copiarlo negli appunti o salvarlo nella tua libreria di prompt globale in modo che la stessa correzione sia a un clic di distanza in ogni progetto.

Smetti di indovinare il tuo utilizzo dei token di Claude Code

Scarica AgentsRoom e ottieni un misuratore di token per sessione live su ogni agente di Claude. Rosso in caso di uso eccessivo, tasso di hit della cache a colpo d'occhio, suggerimenti per consumare meno. Tutto locale, tutto tuo.

GratisScarica AgentsRoom

App companion: monitora i tuoi agenti in movimento

Usa Claude, Codex, Antigravity CLI o un altro provider IA.

Installa l'estensione

Chrome Web Store

Invia bug e richieste direttamente nel tuo backlog pubblico.

Uno sguardo ad AgentsRoom in azione.

Multi-progetto

Multi-provider

Multi-agente

Stato in tempo reale

Diff e commit

App mobile

Anteprima live

Team di agenti

Test browser

Dev guidata da backlog

Libreria di prompt

Libreria di skill

Vedi tutte le funzionalità

Utilizzo dei token di Claude Code,monitorato per sessione, in tempo reale