Token usage : par session : en direct

Claude Code token usage,
suivi par session, en temps réel

AgentsRoom surveille votre Claude Code token usage dans chaque terminal d'agent. Un petit compteur de tokens vit dans le composer et se met à jour en direct. Quand votre consommation de tokens devient lourde sur une seule session Claude, le badge passe au rouge et vous alerte avant que vous ne grilliez la fenêtre de contexte.

Cliquez sur le badge et le moniteur de session s'ouvre : input tokens, output tokens, cache reads, cache writes, taux de cache hit, nombre de messages, modèles routés, durée de session et appels d'outils. Un seul panneau, une seule session Claude, tous les chiffres qui pilotent votre Claude Code token usage.

Télécharger AgentsRoom Voir comment fonctionne le compteur de tokens

Démo en direct du badge Claude Code token usage dans AgentsRoom : il vit dans chaque composer d'agent, passe au rouge en cas de consommation de tokens lourde, et ouvre un moniteur de session complet avec input tokens, output tokens, cache reads et cache writes.

Le Claude Code token usage est le coût variable numéro un quand on fait tourner des agents IA de code. Chaque prompt, chaque appel d'outil, chaque réinjection de CLAUDE.md mange des tokens. Sans visibilité, vous découvrez que vous avez explosé votre budget quand l'API se met à throttle ou quand la facture arrive. AgentsRoom met un compteur Claude Code token usage en direct sur chaque session d'agent, pour que vous voyiez la consommation au fil de l'eau, pas après coup.

Le compteur de tokens vit dans le composer du terminal, juste à côté du bouton envoyer. Il se met à jour quelques secondes après chaque tour Claude. Les tokens s'additionnent sur toute la session : input tokens, output tokens, cache writes et cache reads, tous sommés et codés couleur pour se lire d'un coup d'œil. Quand le Claude Code token usage par session passe un seuil de consommation lourde, le badge bascule au rouge avec une icône d'alerte, comme une jauge d'essence qui vous tire la sonnette d'alarme avant que le réservoir ne soit vide.

Cliquez dessus et le moniteur de session s'ouvre. Vous obtenez un instantané en direct de la session Claude active : durée depuis le premier message, nombre de prompts utilisateur contre tours de l'assistant, appels d'outils, modèles ayant traité la conversation, l'identifiant de session Claude (copiable pour --resume), et la décomposition complète des tokens. Le taux de cache hit est calculé au vol, codé couleur vert / orange / rouge, avec un rappel d'une ligne : les cache reads coûtent environ dix fois moins cher que de l'input frais. Ce panneau seul transforme le Claude Code token usage de boîte noire en jauge en temps réel.

Pourquoi un Claude Code token usage par session change tout

La plupart des wrappers Claude reportent l'usage de tokens au niveau du compte, une fois par jour, dans un dashboard que vous devez penser à ouvrir. À ce moment-là, le mal est fait. AgentsRoom remonte le Claude Code token usage à la surface, sur chaque terminal d'agent, pour que vous ne puissiez pas l'ignorer. Le compteur de tokens est à deux centimètres du bouton envoyer. Vous y jetez un œil comme vous jetez un œil au badge non lu de votre téléphone.

Le par-session est la bonne granularité. Une équipe d'agents qui tournent en parallèle ne vous dit pas qui crame des tokens. Un agent peut boucler sur un prompt coincé pendant que quatre autres sont calmes. Avec un compteur Claude Code token usage par session, l'agent bruyant ressort tout de suite : son badge est rouge, son taux de cache hit est bas, son nombre de messages grimpe vite. Vous intervenez, vous corrigez le prompt, vous sauvez le budget.

Toute la fonctionnalité est locale. AgentsRoom lit votre Claude Code token usage directement dans les transcripts JSONL que Claude écrit sur ~/.claude/projects/. Rien ne quitte votre machine. Pas de tracker d'usage tiers. Pas de proxy devant l'API. Le compteur de tokens dans AgentsRoom n'est qu'une lecture plus rapide et plus visible des données qu'Anthropic sauvegarde déjà sur votre disque.

Modale Claude Code token usage dans AgentsRoom : durée, statut, nombre de messages, appels d'outils, modèles, identifiant de session, plus la décomposition des tokens avec input, output, cache writes, cache reads et taux de cache hit

Le panneau Claude Code token usage dans AgentsRoom. Cliquez sur le badge de tokens par session dans n'importe quel composer d'agent, obtenez chaque chiffre qui compte, plus des conseils pour baisser votre consommation de tokens.

Ce que montre le panneau Claude Code token usage

Un clic sur le badge de tokens ouvre un moniteur de session en direct. Voici chaque chiffre que vous obtenez sur la session Claude active.

Durée de session

Temps écoulé entre le premier et le dernier message de la session Claude active, rafraîchi en direct. Utile pour repérer les agents qui mâchonnent du contexte depuis des heures.

Statut d'agent en direct

Idle, en travail, terminé, ou attend une réponse. Le statut s'associe au compteur de tokens pour que vous voyiez d'un coup d'œil quelle session Claude consomme et laquelle ne fait que stationner.

Messages et tours d'assistant

Nombre de prompts utilisateur contre tours de l'assistant dans la session Claude active. Un ratio bancal est un signal fort qu'un agent boucle ou que votre prompt est trop vague.

Appels d'outils

Nombre total d'appels Read, Edit, Bash, Grep, Glob et autres outils exécutés par Claude dans la session. Les appels d'outils pèsent une grosse part des input tokens, donc ce chiffre suit de près le Claude Code token usage.

Modèles utilisés

Chaque modèle Claude qui a traité un tour dans la session : Sonnet, Opus, Haiku, variantes datées. AgentsRoom dédoublonne et raccourcit les noms pour que vous voyiez tout de suite si votre session a été auto-routée entre modèles.

Identifiant de session Claude

L'identifiant interne de la session Claude, copiable en un clic. Utilisez-le pour faire claude --resume sur exactement la même conversation depuis le CLI sans perdre de contexte.

Input tokens

Tokens d'entrée frais envoyés à Claude pendant la session, avant toute réutilisation du cache. C'est le poste le plus cher de votre Claude Code token usage.

Output tokens

Tokens générés par Claude dans la session. Les output tokens sont facturés à un tarif plus élevé que l'input, donc des valeurs hautes sans progression veulent dire qu'un agent tourne en rond.

Cache writes

Tokens que Claude écrit dans le cache de prompt pendant la session. Les cache writes sont chargés à un petit premium mais ils débloquent des cache reads pas chers sur les tours suivants.

Cache reads

Tokens servis depuis le cache de prompt au lieu d'être retarifés en input frais. Les cache reads coûtent environ 10x moins cher que les input tokens, ce qui fait du taux de cache hit la métrique reine de votre Claude Code token usage.

Taux de cache hit

Pourcentage de tokens côté input servis depuis le cache, codé vert au-dessus de 70 pour cent, orange entre 30 et 70, rouge en dessous de 30. Plus c'est haut, moins c'est cher. Le meilleur levier sur le Claude Code token usage.

Total de tokens

Somme cumulée sur input, output, cache writes et cache reads pour la session active. Utile comme chiffre titre unique quand vous comparez la consommation de tokens entre agents.

Pourquoi le compteur de tokens passe au rouge

AgentsRoom vérifie votre Claude Code token usage par session à chaque poll. Quand le total courant dépasse un seuil de consommation lourde, le badge bascule au rouge avec une icône d'alerte. C'est le signal pour ouvrir le moniteur de session et décider quoi faire : compacter, forker un nouvel agent, changer de modèle, ou simplement finir la tâche et clore.

Le rouge n'est pas une limite dure. AgentsRoom ne throttle pas votre agent et ne coupe pas le run. C'est une alerte visuelle, sur un seul agent, pour qu'une boucle infinie ne vide pas silencieusement votre budget Anthropic pendant que vous êtes concentré sur une autre fenêtre. Les longues sessions avec un bon taux de cache hit sont parfaitement saines et restent vertes.

Comment AgentsRoom suit le Claude Code token usage

Trois couches : un poller d'usage, un parseur JSONL et une UI en direct.

Le poller lit les totaux de tokens toutes les 15 secondes

Une tâche en arrière-plan lit l'usage de tokens par session depuis votre état Claude local et le pousse dans le store du renderer. Pas de proxy sur l'API, pas d'appel réseau supplémentaire. Juste une lecture plus rapide et plus visible des chiffres que Claude écrit déjà sur disque.

Le parseur JSONL rafraîchit toutes les 10 secondes quand la modale est ouverte

Le moniteur de session ajoute un appel IPC ponctuel qui parcourt le transcript JSONL de la session Claude active pour calculer le nombre de messages, les tours d'assistant, les appels d'outils, les modèles routés et les premier/dernier timestamps. Le rafraîchissement tourne toutes les 10 secondes tant que le panneau est à l'écran, pour que les chiffres restent vivants sans cramer le parseur à chaque poll du renderer.

UI en direct : badge plus moniteur de session

Le badge dans le composer du terminal lit les totaux de tokens et décide vert ou rouge. Cliquez dessus et le moniteur de session s'ouvre, dans un portail pour qu'il recouvre toute la fenêtre. Les chiffres sont formatés avec des séparateurs de milliers, le taux de cache hit est colorisé, et une section conseils vous pousse à consommer moins.

Conseils pour baisser votre Claude Code token usage

Le moniteur de session fait remonter ces conseils contextuellement, en fonction de votre taux de cache hit en direct. Envoyez n'importe lequel directement au terminal d'agent en un clic.

Taux de cache hit bas : stabilisez le préfixe du prompt

En dessous de 30 pour cent, Claude paye le plein tarif input à chaque tour. Modifier CLAUDE.md en cours de session, changer de modèle, ou réordonner les premiers messages système casse le cache. Verrouillez le haut du prompt et regardez le taux de cache hit grimper.

Utilisez /compact au lieu de /clear

Slash clear efface la conversation et force le plein tarif input au tour suivant. Slash compact garde la tâche et compresse l'historique en un résumé, donc le préfixe du cache survit. Même sensation de fraîcheur, Claude Code token usage bien plus bas.

Read partiel, pas entier

Sur les fichiers de plus de 100 lignes, demandez à l'agent d'utiliser Read avec offset et limit, ou de grep le symbole d'abord. Charger un fichier de 4000 lignes à chaque tour est le tueur silencieux numéro un du Claude Code token usage.

Edit plutôt que Write

L'outil Edit ne renvoie que le diff à Claude. Write retransmet le fichier entier. Sur un composant de 600 lignes, ça double les output tokens et gonfle l'input du tour suivant.

Spawnez des sous-agents pour les recherches larges

Glob et Grep sur des centaines de fichiers déversent beaucoup de bruit dans votre contexte principal. L'outil Agent tourne dans sa propre fenêtre de contexte et ne renvoie qu'un résumé, ce qui garde le prompt parent petit.

Réduisez votre CLAUDE.md

CLAUDE.md est préfixé à chaque tour. Chaque paragraphe inutile coûte des tokens d'input cachés multipliés par chaque message. Déplacez le contexte long dans context/ et référencez-le à la demande.

Le compteur de tokens AgentsRoom vs Claude Code brut

Claude Code brut affiche les totaux de tokens à la fin d'une session, dans une petite ligne de footer qu'il faut scroller pour trouver. Pas de compteur en direct. Pas de breakdown par session. Pas de taux de cache hit visible d'un coup d'œil. Pas d'alerte quand la consommation pique. Vous découvrez la surconsommation après coup, quand l'API rate-limite ou que la facture mensuelle est trop salée.

AgentsRoom transforme le Claude Code token usage en signal de premier ordre. Chaque agent a son propre compteur de tokens. Rouge en cas de surconsommation. Clic pour le breakdown complet. Taux de cache hit calculé en temps réel. Conseils qui lisent vos chiffres en direct et proposent des prompts prêts à envoyer pour colmater la fuite. La même session Claude, les mêmes transcripts JSONL, mais avec la visibilité dont une flotte d'agents parallèles a vraiment besoin.

Quand le compteur Claude Code token usage vous sauve

Trois situations réelles où le tracker de tokens par session s'amortit tout seul.

Un agent est coincé dans une boucle

Un agent relit le même fichier en boucle et retente le même fix. Son badge de tokens passe au rouge en quelques minutes, son taux de cache hit s'effondre, son ratio de messages est bancal. Vous le repérez sur le dashboard, vous intervenez, vous réécrivez le prompt, vous sauvez le budget.

Une longue tâche se passe bien

Trois heures dans un refactor, vous vous demandez si l'agent est toujours sur les rails. Ouvrez le moniteur de session : 700 messages, 180 appels d'outils, 78 pour cent de cache hit, tout est vert. La consommation de tokens est haute en absolu, normale en efficacité. Laissez mijoter.

Run de nuit sur une flotte

Cinq agents broient un backlog pendant que vous dormez. Au matin, le token usage par session vous dit lequel a été efficace, lequel a bouclé, lequel s'est retrouvé hors contexte. Triage en deux minutes au lieu de relire chaque transcript.

Le compteur Claude Code token usage est un morceau d'une surface de monitoring plus large. Statut d'agent en direct, badges sur le dock et notifications push mobile complètent le tableau.

Voir comment AgentsRoom monitore les agents IA

FAQ

Le tracker de Claude Code token usage est-il précis ?

Oui. AgentsRoom lit les mêmes transcripts JSONL que Claude écrit lui-même sur ~/.claude/projects/. Les input tokens, output tokens, cache writes et cache reads sont tirés directement du payload usage par message qu'Anthropic émet. Pas d'estimation, pas de proxy, pas d'arrondi. Les chiffres dans le moniteur de session correspondent à ce qu'Anthropic facture.

Le compteur de tokens ralentit-il mon agent ?

Non. Le poller lit des fichiers locaux toutes les 15 secondes. Le parse JSONL ne tourne que quand le moniteur de session est ouvert, toutes les 10 secondes. Pas d'appel réseau supplémentaire vers Anthropic, pas d'instrumentation injectée dans Claude, pas de surcharge sur les appels d'outils. Votre agent tourne à pleine vitesse.

Quand est-ce que le badge passe au rouge ?

Quand le Claude Code token usage cumulé par session dépasse un seuil de consommation lourde calibré pour des sessions de code longues normales. Le seuil est assez conservateur pour qu'une session inactive ne le déclenche jamais, et assez serré pour qu'une boucle infinie passe au rouge en quelques tours. Le rouge est une alerte, pas un throttle.

Pourquoi le taux de cache hit est-il si important ?

Les cache reads coûtent environ 10x moins cher que les input tokens frais. Une session à 80 pour cent de cache hit revient à environ cinq fois moins cher que la même session à 0 pour cent. Le taux de cache hit est le meilleur levier unique sur votre Claude Code token usage. AgentsRoom l'affiche en direct pour que vous puissiez corriger le tir en cours de session au lieu de le découvrir à la fin.

Est-ce que ça marche avec Codex, Gemini, OpenCode et Aider aussi ?

Le moniteur de session dans sa forme actuelle est spécifique à Claude parce qu'il lit les transcripts JSONL de Claude et que la décomposition prompt-cache est une feature de facturation propre à Claude. Le statut, le rôle et les notifications fonctionnent pour chaque fournisseur. Un usage agnostique du fournisseur est sur la roadmap.

AgentsRoom envoie-t-il mon Claude Code token usage à un serveur ?

Non. Le compteur de tokens, le moniteur de session et le taux de cache hit sont calculés entièrement sur votre Mac, à partir de fichiers locaux. Rien ne quitte votre machine. Si vous activez la sync chiffrée optionnelle vers le compagnon mobile, seules les données que vous choisissez explicitement de mirror sont envoyées, et c'est chiffré de bout en bout via le relais AgentsRoom.

Puis-je sauver les conseils comme prompts réutilisables ?

Oui. Chaque conseil dans le moniteur de session a un bouton Fix this qui ouvre un prompt éditable, prêt à l'emploi. Envoyez-le directement au terminal d'agent, copiez-le dans le presse-papier, ou sauvez-le dans votre bibliothèque de prompts globale pour que le même fix soit à un clic sur chaque projet.

Arrêtez de deviner votre Claude Code token usage

Téléchargez AgentsRoom et obtenez un compteur de tokens par session en direct sur chaque agent Claude. Rouge en cas de surconsommation, taux de cache hit visible, conseils pour consommer moins. Tout est local, tout est à vous.

GratuitTélécharger AgentsRoom

App companion : suivez vos agents en déplacement

Utilisez Claude, Codex, Gemini CLI ou un autre fournisseur IA.

Installer l'extension

Chrome Web Store

Remontez bugs et demandes directement dans votre backlog public.

Aperçu d'AgentsRoom en action.

Multi-projets

Multi-provider

Multi-agents

Statut en direct

Diff & commit

App mobile

Aperçu live

Équipes d'agents

Tests navigateur

Dev pilotée par backlog

Bibliothèque de prompts

Bibliothèque de skills

Voir toutes les fonctionnalités

Claude Code token usage,suivi par session, en temps réel