Token-Verbrauch : pro Sitzung : live

Claude Code token usage,
pro Sitzung verfolgt, in Echtzeit

AgentsRoom beobachtet deine Claude Code token usage in jedem Agenten-Terminal. Ein kleiner Token-Zaehler sitzt im Composer und aktualisiert sich live. Wenn dein Token-Verbrauch in einer einzelnen Claude-Sitzung hoch wird, wechselt das Badge auf rot und warnt dich, bevor du das Kontextfenster sprengst.

Klicke auf das Badge und der Sitzungsmonitor oeffnet sich : input tokens, output tokens, cache reads, cache writes, cache hit rate, Nachrichtenanzahl, geroutete Modelle, Sitzungsdauer und Tool-Nutzungen. Ein Panel, eine Claude-Sitzung, alle Zahlen, die deine Claude Code token usage bestimmen.

Live-Demo des Claude Code token usage Badges in AgentsRoom : es sitzt in jedem Agenten-Composer, wird rot bei hohem Token-Verbrauch und oeffnet einen vollstaendigen Sitzungsmonitor mit input tokens, output tokens, cache reads und cache writes.

Claude Code token usage ist der wichtigste variable Kostenpunkt beim Betrieb von KI-Coding-Agenten. Jeder Prompt, jeder Tool-Aufruf, jede CLAUDE.md-Wiedereinspielung verbraucht Tokens. Ohne Sichtbarkeit merkst du erst, dass du dein Budget gesprengt hast, wenn die API drosselt oder die Rechnung kommt. AgentsRoom platziert eine Live-Anzeige fuer Claude Code token usage auf jeder Agentensitzung, damit du den Verbrauch siehst, waehrend er passiert, nicht danach.

Der Token-Zaehler lebt im Terminal-Composer, direkt neben dem Senden-Button. Er aktualisiert sich wenige Sekunden nach jedem Claude-Turn. Tokens summieren sich ueber die ganze Sitzung : input tokens, output tokens, cache writes und cache reads, alle aufaddiert und farblich kodiert, damit du sie auf einen Blick lesen kannst. Wenn die Claude Code token usage pro Sitzung eine Schwelle fuer hohen Verbrauch ueberschreitet, wechselt das Badge auf rot mit einem Warnsymbol, so wie eine Tankanzeige dich nervt, bevor der Tank leer ist.

Klicke darauf und der Sitzungsmonitor oeffnet sich. Du bekommst eine Live-Momentaufnahme der aktiven Claude-Sitzung : Dauer seit der ersten Nachricht, Anzahl der Nutzer-Prompts gegenueber Assistenten-Turns, Tool-Nutzungen, Modelle, die das Gespraech gehandhabt haben, die Claude-Sitzungs-ID (kopierbar fuer --resume) und die vollstaendige Token-Aufschluesselung. Die cache hit rate wird live berechnet, farblich gruen / gelb / rot kodiert, mit einer einzeiligen Erinnerung, dass cache reads etwa zehnmal weniger kosten als frischer Input. Dieses eine Panel macht aus Claude Code token usage statt einer Black Box eine Echtzeitanzeige.

Warum Claude Code token usage pro Sitzung wichtig ist

Die meisten Claude-Wrapper melden den Token-Verbrauch auf Konto-Ebene, einmal am Tag, in einem Dashboard, das du dich erinnern musst zu oeffnen. Bis dahin ist der Schaden geschehen. AgentsRoom holt Claude Code token usage an die Oberflaeche, auf jedem einzelnen Agenten-Terminal, damit du es nicht ignorieren kannst. Der Token-Zaehler ist zwei Zentimeter vom Senden-Button entfernt. Du blickst darauf, wie du auf das Ungelesen-Badge auf deinem Telefon blickst.

Pro Sitzung ist die richtige Granularitaet. Ein Team von Agenten, das parallel laeuft, sagt dir nicht, wer Tokens verbrennt. Ein Agent koennte in einem festgefahrenen Prompt schleifen, waehrend vier andere ruhig sind. Mit einer Claude Code token usage Anzeige pro Sitzung sticht der laute Agent sofort hervor : sein Badge ist rot, seine cache hit rate ist niedrig, seine Nachrichtenanzahl steigt schnell. Du springst rein, korrigierst den Prompt, rettest das Budget.

Das ganze Feature ist lokal. AgentsRoom liest deine Claude Code token usage direkt aus den JSONL-Transkripten, die Claude in ~/.claude/projects/ schreibt. Nichts verlaesst deinen Rechner. Kein Drittanbieter-Tracker. Kein Proxy vor der API. Der Token-Zaehler in AgentsRoom ist nur eine schnellere, sichtbarere Lesart der Daten, die Anthropic ohnehin schon auf deine Festplatte speichert.

Claude Code token usage Modal in AgentsRoom : Dauer, Status, Nachrichtenanzahl, Tool-Nutzungen, Modelle, Sitzungs-ID plus Token-Aufschluesselung mit input, output, cache writes, cache reads und cache hit rate

Das Claude Code token usage Panel in AgentsRoom. Klicke auf das Token-Badge pro Sitzung in einem beliebigen Agenten-Composer und erhalte jede Zahl, die zaehlt, plus Tipps zur Senkung deines Token-Verbrauchs.

Was das Claude Code token usage Panel zeigt

Ein Klick auf das Token-Badge oeffnet einen Live-Sitzungsmonitor. Hier ist jede Zahl, die du zur aktiven Claude-Sitzung bekommst.

Sitzungsdauer

Verstrichene Zeit zwischen der ersten und der letzten Nachricht der aktiven Claude-Sitzung, live aktualisiert. Nuetzlich, um Agenten zu erkennen, die seit Stunden Kontext kauen.

Live-Agentenstatus

Inaktiv, arbeitend, fertig oder benoetigt Eingabe. Der Status passt zum Token-Zaehler, damit du auf einen Blick siehst, welche Claude-Sitzung verbraucht und welche nur dasitzt.

Nachrichten und Assistenten-Turns

Anzahl der Nutzer-Prompts gegenueber Assistenten-Turns in der aktiven Claude-Sitzung. Ein einseitiges Verhaeltnis ist ein starkes Signal, dass ein Agent schleift oder dein Prompt zu vage ist.

Tool-Nutzungen

Gesamtanzahl der Read, Edit, Bash, Grep, Glob und anderen Tool-Aufrufe, die Claude in der Sitzung ausgefuehrt hat. Tool-Aufrufe verursachen einen grossen Anteil der input tokens, daher folgt diese Zahl der Claude Code token usage eng.

Verwendete Modelle

Jedes Claude-Modell, das einen Turn in der Sitzung gehandhabt hat : Sonnet, Opus, Haiku, datierte Varianten. AgentsRoom dedupliziert und kuerzt Namen, damit du sofort siehst, ob deine Sitzung automatisch ueber Modelle verteilt wurde.

Claude-Sitzungs-ID

Der interne Claude-Sitzungs-Identifier, kopierbar mit einem Klick. Verwende ihn, um per claude --resume genau dasselbe Gespraech aus der CLI fortzusetzen, ohne den Kontext zu verlieren.

Input tokens

Frische input tokens, die waehrend der Sitzung an Claude gesendet wurden, vor jeglicher Cache-Wiederverwendung. Das ist der teuerste Bereich deiner Claude Code token usage.

Output tokens

Tokens, die Claude in der Sitzung generiert hat. Output tokens werden zu einem hoeheren Tarif abgerechnet als Input, daher bedeuten hohe Werte ohne Fortschritt, dass ein Agent leerlaeuft.

Cache writes

Tokens, die Claude waehrend der Sitzung in den Prompt-Cache schreibt. Cache writes werden mit einem kleinen Aufschlag berechnet, schalten aber guenstige cache reads bei den naechsten Turns frei.

Cache reads

Tokens, die aus dem Prompt-Cache geliefert werden, statt erneut als frischer Input bepreist zu werden. Cache reads kosten etwa 10x weniger als input tokens, weshalb die cache hit rate die fuehrende Kennzahl deiner Claude Code token usage ist.

Cache hit rate

Prozentsatz der Input-Tokens, die aus dem Cache geliefert werden, farblich gruen ueber 70 Prozent, gelb zwischen 30 und 70, rot unter 30. Hoeher ist guenstiger. Der einzige beste Hebel fuer Claude Code token usage.

Tokens insgesamt

Kumulierte Summe ueber input, output, cache writes und cache reads fuer die aktive Sitzung. Nuetzlich als einzige Schlagzahl, wenn du den Token-Verbrauch ueber Agenten hinweg vergleichst.

Warum die Token-Anzeige rot wird

AgentsRoom prueft deine Claude Code token usage pro Sitzung bei jedem Poll. Wenn die laufende Summe eine Schwelle fuer hohen Verbrauch ueberschreitet, wechselt das Badge auf rot mit einem Warnsymbol. Das ist das Signal, den Sitzungsmonitor zu oeffnen und zu entscheiden, was zu tun ist : kompaktieren, einen neuen Agenten forken, Modell wechseln oder einfach die Aufgabe abschliessen.

Rot ist kein hartes Limit. AgentsRoom drosselt deinen Agenten nicht und unterbricht den Lauf nicht. Es ist ein visueller Hinweis, auf einem einzelnen Agenten, damit eine entlaufene Schleife nicht stillschweigend dein Anthropic-Budget leert, waehrend du dich auf ein anderes Fenster konzentrierst. Lange Sitzungen mit gesunden cache hit rates sind voellig in Ordnung und bleiben gruen.

Wie AgentsRoom Claude Code token usage verfolgt

Drei Schichten : ein Usage-Poller, ein JSONL-Parser und eine Live-UI.

01

Poller liest Token-Summen alle 15 Sekunden

Eine Hintergrundaufgabe liest den Token-Verbrauch pro Sitzung aus deinem lokalen Claude-State und schiebt ihn in den Renderer-Store. Kein Proxy auf der API, kein zusaetzlicher Netzwerkaufruf. Nur eine schnellere, sichtbare Lesart der Zahlen, die Claude bereits auf die Festplatte schreibt.

02

JSONL-Parser aktualisiert alle 10 Sekunden, waehrend das Modal offen ist

Der Sitzungsmonitor fuegt einen einmaligen IPC-Aufruf hinzu, der das JSONL-Transkript der aktiven Claude-Sitzung durchlaeuft, um Nachrichtenzahlen, Assistenten-Turns, Tool-Nutzungen, geroutete Modelle und erste/letzte Zeitstempel zu berechnen. Die Aktualisierung laeuft alle 10 Sekunden, waehrend das Panel auf dem Bildschirm ist, damit die Zahlen live bleiben, ohne den Parser bei jedem Renderer-Poll zu verbrennen.

03

Live-UI : Badge plus Sitzungsmonitor

Das Badge im Terminal-Composer liest die Token-Summen und entscheidet gruen oder rot. Klicke darauf und der Sitzungsmonitor oeffnet sich, in einem Portal, das das gesamte Fenster ueberlagert. Zahlen werden mit Tausendertrennzeichen formatiert, die cache hit rate ist farbig, und ein Tipps-Bereich gibt dir Hinweise, wie du weniger verbrauchst.

Tipps zur Senkung deiner Claude Code token usage

Der Sitzungsmonitor zeigt diese Tipps kontextabhaengig auf Basis deiner Live cache hit rate. Schicke jeden davon mit einem Klick direkt an das Agenten-Terminal.

Niedrige cache hit rate : Prompt-Praefix stabilisieren

Unter 30 Prozent zahlt Claude jeden Turn den vollen Input-Preis. Das Bearbeiten von CLAUDE.md mitten in der Sitzung, ein Modellwechsel oder das Umordnen fruehzeitiger System-Nachrichten zerstoert den Cache. Fixiere den Anfang des Prompts und beobachte, wie die cache hit rate steigt.

Verwende /compact statt /clear

Slash clear loescht das Gespraech und erzwingt im naechsten Turn die volle Input-Preisgestaltung. Slash compact behaelt die Aufgabe und schrumpft den Verlauf zu einer Zusammenfassung, sodass das Cache-Praefix erhalten bleibt. Gleicher frischer Eindruck, viel niedrigere Claude Code token usage.

Read partial, nicht ganz

Bei Dateien mit mehr als 100 Zeilen bitte den Agenten, Read mit offset und limit zu verwenden, oder zuerst nach dem Symbol zu greppen. Eine 4000-Zeilen-Datei in jedem Turn zu laden ist die heimliche Nummer eins als Claude Code token usage Senke.

Edit statt Write

Das Edit-Tool sendet nur das Diff zurueck an Claude. Write sendet die ganze Datei erneut. Bei einer 600-Zeilen-Komponente verdoppelt das die output tokens und blaeht den Input des naechsten Turns auf.

Sub-Agenten fuer breite Suchen spawnen

Glob und Grep ueber Hunderte von Dateien werfen viel Rauschen in deinen Hauptkontext. Das Agent-Tool laeuft in seinem eigenen Kontextfenster und liefert nur eine Zusammenfassung zurueck, sodass der Eltern-Prompt klein bleibt.

Schrumpf deine CLAUDE.md

CLAUDE.md wird jedem Turn vorangestellt. Jeder unnoetige Absatz dort kostet gecachte input tokens mal jede Nachricht. Verschiebe langen Kontext nach context/ und referenziere ihn bei Bedarf.

AgentsRoom Token-Anzeige vs vanilla Claude Code

Vanilla Claude Code zeigt Token-Summen am Ende einer Sitzung, in einer kleinen Fusszeile, zu der du nach oben scrollen musst. Es gibt keine Live-Anzeige. Keine Aufschluesselung pro Sitzung. Keine cache hit rate auf einen Blick. Keine Warnung, wenn der Verbrauch in die Hoehe schiesst. Du entdeckst Ueberverbrauch im Nachhinein, wenn die API drosselt oder die Monatsrechnung zu hoch ist.

AgentsRoom macht aus Claude Code token usage ein erstklassiges Signal. Jeder Agent bekommt seinen eigenen Token-Zaehler. Rot bei Ueberverbrauch. Klick fuer die volle Aufschluesselung. Cache hit rate live berechnet. Tipps, die deine Live-Zahlen lesen und vorgefertigte Prompts vorschlagen, um das Leck zu schliessen. Dieselbe Claude-Sitzung, dieselben JSONL-Transkripte, aber mit der Sichtbarkeit, die eine Flotte paralleler Agenten tatsaechlich braucht.

Wann die Claude Code token usage Anzeige dich rettet

Drei reale Situationen, in denen sich der Token-Tracker pro Sitzung lohnt.

Ein Agent steckt in einer Schleife fest

Ein Agent liest dieselbe Datei immer wieder und probiert immer wieder denselben Fix. Sein Token-Badge wird innerhalb von Minuten rot, seine cache hit rate stuerzt ab, sein Nachrichten-Verhaeltnis ist einseitig. Du erkennst es im Dashboard, springst rein, schreibst den Prompt um, rettest das Budget.

Eine lange Aufgabe laeuft super

Drei Stunden in einem Refactor fragst du dich, ob der Agent noch auf Kurs ist. Oeffne den Sitzungsmonitor : 700 Nachrichten, 180 Tool-Nutzungen, 78 Prozent cache hit rate, alles gruen. Token-Verbrauch ist absolut gesehen hoch, in der Effizienz normal. Lass ihn weiterlaufen.

Naechtlicher Lauf auf einer Flotte

Fuenf Agenten arbeiten einen Backlog ab, waehrend du schlaefst. Am Morgen sagt dir der Token-Verbrauch pro Sitzung, welcher effizient war, welcher in einer Schleife steckte, welcher den Kontext aufgebraucht hat. Triage in zwei Minuten statt jedes Transkript zu lesen.

Die Claude Code token usage Anzeige ist ein Teil einer groesseren Monitor-Oberflaeche. Live-Agentenstatus, Dock-Badges und mobile Push-Benachrichtigungen vervollstaendigen das Bild.

Wie AgentsRoom KI-Agenten ueberwacht

FAQ

Ist der Claude Code token usage Tracker genau ?

Ja. AgentsRoom liest dieselben JSONL-Transkripte, die Claude selbst in ~/.claude/projects/ schreibt. Input tokens, output tokens, cache writes und cache reads werden direkt aus dem Per-Message-Usage-Payload gezogen, das Anthropic ausgibt. Es gibt keine Schaetzung, keinen Proxy, keine Rundung. Die Zahlen im Sitzungsmonitor entsprechen dem, was Anthropic abrechnet.

Verlangsamt der Token-Zaehler meinen Agenten ?

Nein. Der Poller liest lokale Dateien alle 15 Sekunden. Das JSONL-Parsing laeuft nur, wenn der Sitzungsmonitor offen ist, alle 10 Sekunden. Es gibt keinen zusaetzlichen Netzwerkaufruf zu Anthropic, keine in Claude eingespritzte Instrumentierung, keinen Overhead bei Tool-Aufrufen. Dein Agent laeuft auf voller Geschwindigkeit.

Wann wird das Badge rot ?

Wenn die kumulierte Claude Code token usage pro Sitzung eine Schwelle fuer hohen Verbrauch ueberschreitet, die fuer normale lange Coding-Sitzungen abgestimmt ist. Die Schwelle ist konservativ genug, dass eine inaktive Sitzung sie nie ausloest, und eng genug, dass eine entlaufene Schleife innerhalb weniger Turns rot wird. Rot ist eine Warnung, keine Drosselung.

Warum ist die cache hit rate so wichtig ?

Cache reads kosten etwa 10x weniger als frische input tokens. Eine Sitzung mit 80 Prozent cache hit rate ist etwa fuenfmal guenstiger als dieselbe Sitzung mit 0 Prozent. Cache hit rate ist der einzige beste Hebel fuer deine Claude Code token usage. AgentsRoom zeigt sie live, damit du mitten in der Sitzung gegensteuern kannst, statt es am Ende zu erfahren.

Unterstuetzt es auch Codex, Gemini, OpenCode und Aider ?

Der Sitzungsmonitor in seiner aktuellen Form ist Claude-spezifisch, weil er Claudes JSONL-Transkripte liest und die Prompt-Cache-Aufschluesselung ein reines Claude-Abrechnungsfeature ist. Status, Rolle und Benachrichtigungen funktionieren fuer jeden Anbieter. Wir verfolgen anbieterunabhaengige Nutzung in der Roadmap.

Sendet AgentsRoom meine Claude Code token usage an einen Server ?

Nein. Der Token-Zaehler, der Sitzungsmonitor und die cache hit rate werden vollstaendig auf deinem Mac aus lokalen Dateien berechnet. Nichts verlaesst deinen Rechner. Wenn du die optionale verschluesselte Synchronisation mit dem mobilen Begleiter aktivierst, werden nur die Daten gesendet, die du explizit spiegeln willst, und sie sind ueber das AgentsRoom-Relay Ende-zu-Ende verschluesselt.

Kann ich die Tipps als wiederverwendbare Prompts speichern ?

Ja. Jeder Tipp im Sitzungsmonitor hat einen Fix this Button, der einen bearbeitbaren, vorgefertigten Prompt oeffnet. Schicke ihn direkt an das Agenten-Terminal, kopiere ihn in die Zwischenablage oder speichere ihn in deiner globalen Prompt-Bibliothek, damit derselbe Fix in jedem Projekt einen Klick entfernt ist.

Hoere auf, deine Claude Code token usage zu raten

Lade AgentsRoom herunter und erhalte eine Live-Token-Anzeige pro Sitzung auf jedem Claude-Agenten. Rot bei Ueberverbrauch, cache hit rate auf einen Blick, Tipps, um weniger zu verbrauchen. Alles lokal, alles deins.

KostenlosAgentsRoom herunterladen

Companion-App: Agenten auch unterwegs im Blick behalten

Funktioniert mit Claude, Codex, OpenCode, Gemini CLI und Aider

Erweiterung installieren
Chrome Web Store

Bugs und Wünsche direkt in dein öffentliches Backlog schicken.

Multi-Projekte
Multi-Provider
Multi-Agenten
Live-Status
Diff & Commit
Mobile App
Live-Vorschau
Agent-Teams
Browser-Tests
Backlog-getriebene Entwicklung