Token usage : セッションごと : ライブ

Claude Code token usageを
セッションごとにリアルタイムで追跡

AgentsRoomはすべてのエージェントターミナルでClaude Code token usageを監視します。コンポーザーに小さなトークンカウンターが配置され、ライブで更新されます。単一のClaudeセッションでトークン消費量が増えると、バッジが赤くなり、コンテキストウィンドウを使い切る前に警告します。

バッジをクリックするとセッションモニターが開きます : input tokens、output tokens、cache reads、cache writes、cache hit rate、メッセージ数、ルーティングされたモデル、セッション継続時間、ツール使用回数。1つのパネル、1つのClaudeセッション、Claude Code token usageを左右するすべての数値が見えます。

AgentsRoomのClaude Code token usageバッジのライブデモ : すべてのエージェントコンポーザーに配置され、トークン消費量が多いと赤くなり、input tokens、output tokens、cache reads、cache writesを含む完全なセッションモニターを開きます。

Claude Code token usageは、AIコーディングエージェントを動かす上で最大の変動コストです。すべてのプロンプト、すべてのツール呼び出し、すべてのCLAUDE.mdの再注入がトークンを消費します。可視性がないと、APIがスロットルされたり請求書が届いてから、予算を使い切ったことに気づきます。AgentsRoomはすべてのエージェントセッションにライブのClaude Code token usageメーターを設置し、消費を後追いではなくその場で確認できます。

トークンカウンターはターミナルコンポーザー内、送信ボタンのすぐ隣に配置されます。各Claudeターンの数秒後に更新されます。トークンはセッション全体で累積されます : input tokens、output tokens、cache writes、cache reads、すべて合計され色分けされて一目で読み取れます。セッションごとのClaude Code token usageが過剰消費の閾値を越えると、バッジが警告アイコン付きで赤くなります。タンクが空になる前に燃料計が知らせるのと同じ感覚です。

クリックするとセッションモニターが開きます。アクティブなClaudeセッションのライブスナップショットが得られます : 最初のメッセージからの経過時間、ユーザープロンプト数とアシスタントターン数、ツール使用回数、会話を処理したモデル、Claudeセッションid(--resume用にコピー可能)、トークンの完全な内訳。Cache hit rateはオンザフライで計算され、緑 / 黄 / 赤に色分けされ、cache readsが新規inputの約10分の1のコストであることを思い出させる1行が添えられます。このパネル1つで、Claude Code token usageがブラックボックスからリアルタイムのゲージに変わります。

セッションごとのClaude Code token usageが重要な理由

ほとんどのClaudeラッパーはトークン使用量をアカウントレベルで、1日1回、自分で開かなければならないダッシュボードに表示します。気づいた時には手遅れです。AgentsRoomはClaude Code token usageを表面に押し出し、すべてのエージェントターミナルに表示するので、無視できません。トークンカウンターは送信ボタンから2センチの位置にあります。スマートフォンの未読バッジを見るような感覚で目を向けます。

セッションごとが正しい粒度です。並行して動くエージェントチームでは、誰がトークンを消費しているのか分かりません。1つのエージェントが詰まったプロンプトでループしている一方で、他の4つは静かにしているかもしれません。セッションごとのClaude Code token usageメーターがあれば、騒がしいエージェントが瞬時に目立ちます : バッジが赤く、cache hit rateが低く、メッセージ数が急速に伸びています。即座に介入し、プロンプトを修正し、予算を守れます。

この機能はすべてローカルです。AgentsRoomはClaudeが~/.claude/projects/に書き出すJSONLトランスクリプトから、Claude Code token usageを直接読み取ります。何もマシンの外には出ません。サードパーティの使用量トラッカーもありません。APIの前にプロキシもありません。AgentsRoomのトークンカウンターは、Anthropicが既にディスクに保存しているデータを、より速く、より見やすく読み出しているだけです。

AgentsRoomのClaude Code token usageモーダル : 継続時間、ステータス、メッセージ数、ツール使用回数、モデル、セッションid、さらにinput、output、cache writes、cache reads、cache hit rateを含むトークン内訳

AgentsRoomのClaude Code token usageパネル。任意のエージェントコンポーザーでセッションごとのトークンバッジをクリックすると、重要なすべての数値と、トークン消費量を下げるためのヒントが表示されます。

Claude Code token usageパネルが表示するもの

トークンバッジを1クリックすると、ライブセッションモニターが開きます。アクティブなClaudeセッションについて取得できるすべての数値はこちらです。

セッション継続時間

アクティブなClaudeセッションの最初のメッセージと最後のメッセージの経過時間、ライブで更新されます。何時間もコンテキストを噛み続けているエージェントを見つけるのに便利です。

ライブエージェントステータス

アイドル、作業中、完了、入力待ち。ステータスとトークンカウンターが連動するので、どのClaudeセッションが消費中で、どれがただ待機しているのかが一目で分かります。

メッセージとアシスタントターン

アクティブなClaudeセッションにおけるユーザープロンプトとアシスタントターンの数。比率が偏っている場合、エージェントがループしている、またはプロンプトが曖昧すぎることを示す強いサインです。

ツール使用回数

セッション中にClaudeが実行したRead、Edit、Bash、Grep、Globなどのツール呼び出し総数。ツール呼び出しはinput tokensの大部分を占めるため、この数値はClaude Code token usageと密接に連動します。

使用モデル

セッション内でターンを処理したすべてのClaudeモデル : Sonnet、Opus、Haiku、日付付きバリアント。AgentsRoomは重複を排除し名前を短縮するので、セッションがモデル間で自動ルーティングされたかどうかが瞬時に分かります。

Claudeセッションid

Claude内部のセッション識別子、ワンクリックでコピー可能。CLIからコンテキストを失わずに同じ会話をclaude --resumeするために使用できます。

Input tokens

セッション中にClaudeに送信された新規input tokens、キャッシュ再利用前。Claude Code token usageの中で最もコストの高いバケットです。

Output tokens

セッション中にClaudeが生成したトークン。Output tokensはinputより高い料金で課金されるため、進捗のない高い値はエージェントが空回りしていることを意味します。

Cache writes

セッション中にClaudeがプロンプトキャッシュに書き込むトークン。Cache writesは少しプレミアムが課されますが、次のターンで安価なcache readsを可能にします。

Cache reads

新規inputとして再課金される代わりに、プロンプトキャッシュから提供されるトークン。Cache readsはinput tokensの約10分の1のコストなので、cache hit rateがClaude Code token usageの主要指標となります。

Cache hit rate

input側トークンのうちキャッシュから提供された割合、70パーセント以上で緑、30から70で黄、30未満で赤に色分け。高いほど安価です。Claude Code token usageに対する最も強力な単一のレバーです。

Total tokens

アクティブセッションのinput、output、cache writes、cache readsの累積合計。エージェント間でトークン消費量を比較する際の単一の見出し数値として便利です。

なぜトークンメーターが赤くなるのか

AgentsRoomはポーリングごとにセッションごとのClaude Code token usageをチェックします。累計が過剰消費の閾値を越えると、バッジが警告アイコン付きで赤くなります。これがセッションモニターを開いて、何をするか決める合図です : compactする、新しいエージェントをフォークする、モデルを切り替える、あるいは単にタスクを終わらせて切り上げる。

赤はハードリミットではありません。AgentsRoomはエージェントをスロットルしたり実行を中断したりしません。視覚的なナッジで、単一のエージェント上で表示されるので、別のウィンドウに集中している間に暴走ループがAnthropic予算を静かに使い切ることを防げます。健全なcache hit rateを持つ長いセッションは全く問題なく、緑のままです。

AgentsRoomがClaude Code token usageを追跡する仕組み

3つのレイヤー : 使用量ポーラー、JSONLパーサー、ライブUI。

01

ポーラーが15秒ごとにトークン合計を読み取る

バックグラウンドタスクがローカルのClaudeステートからセッションごとのトークン使用量を読み取り、レンダラーストアにプッシュします。APIへのプロキシも、追加のネットワーク呼び出しもありません。Claudeが既にディスクに書いている数値を、より速く可視化して読み出すだけです。

02

モーダルが開いている間、JSONLパーサーが10秒ごとに更新

セッションモニターは、アクティブなClaudeセッションのJSONLトランスクリプトを辿ってメッセージ数、アシスタントターン、ツール使用回数、ルーティングされたモデル、最初/最後のタイムスタンプを計算するワンショットIPC呼び出しを追加します。パネルが画面上にある間、10秒ごとに更新が実行されるので、レンダラーポーリングごとにパーサーを酷使することなく数値がライブのままです。

03

ライブUI : バッジとセッションモニター

ターミナルコンポーザーのバッジがトークン合計を読み取り、緑か赤かを決定します。クリックするとセッションモニターがportalで開き、ウィンドウ全体にオーバーレイします。数値は3桁区切りでフォーマットされ、cache hit rateは色分けされ、ヒントセクションが消費を抑えるよう促します。

Claude Code token usageを下げるためのヒント

セッションモニターは、ライブのcache hit rateに基づいてこれらのヒントを文脈的に表示します。どれもワンクリックでエージェントターミナルに直接送信できます。

Cache hit rateが低い : プロンプトのプレフィックスを安定させる

30パーセント未満では、Claudeは毎ターン全額のinput料金を払っています。セッション中にCLAUDE.mdを編集する、モデルを切り替える、初期のシステムメッセージを並び替えるとキャッシュが壊れます。プロンプトの先頭をロックして、cache hit rateが上がるのを見守りましょう。

/clearではなく/compactを使う

Slash clearは会話を消去し、次のターンで全額のinput料金を強制します。Slash compactはタスクを保ったまま履歴をサマリーに圧縮するので、キャッシュプレフィックスが生き残ります。同じ新鮮な感覚で、Claude Code token usageは大幅に低下します。

全体ではなく部分的にRead

100行を超えるファイルでは、エージェントにoffsetとlimit付きでReadを使うか、まずシンボルをgrepするよう依頼しましょう。4000行のファイルを毎ターン読み込むのは、Claude Code token usageの最大の隠れた浪費源です。

WriteではなくEdit

EditツールはdiffだけをClaudeに返します。Writeはファイル全体を再送信します。600行のコンポーネントでは、output tokensが倍になり、次のターンのinputが膨張します。

広範な検索にはサブエージェントを生成

数百のファイルにわたるGlobとGrepはメインコンテキストに大量のノイズを投入します。Agentツールは独自のコンテキストウィンドウで動作し、サマリーのみを返すので、親プロンプトを小さく保てます。

CLAUDE.mdを縮小する

CLAUDE.mdは毎ターン先頭に追加されます。そこにある無駄な段落1つにつき、キャッシュされたinput tokens × メッセージ数のコストがかかります。長いコンテキストはcontext/に移動し、必要に応じて参照しましょう。

AgentsRoomのトークンメーター vs 素のClaude Code

素のClaude Codeはセッション終了時、スクロールアップしないと見つからない小さなフッター行にトークン合計を表示します。ライブメーターはありません。セッションごとの内訳もありません。一目で分かるcache hit rateもありません。消費が急増しても警告がありません。APIがレート制限に達するか月末請求が高すぎることで、後から過剰消費に気づきます。

AgentsRoomはClaude Code token usageを一級のシグナルに変えます。すべてのエージェントが独自のトークンカウンターを持ちます。過剰消費で赤。クリックで完全な内訳。Cache hit rateはリアルタイムで計算。ライブの数値を読み取り、漏れを修正するための既製プロンプトを提案するヒント。同じClaudeセッション、同じJSONLトランスクリプトですが、並列エージェント群が実際に必要とする可視性が備わっています。

Claude Code token usageメーターが救ってくれる場面

セッションごとのトークントラッカーが元を取る、3つの実際の状況。

エージェントがループに陥っている

1つのエージェントが同じファイルを再読み込みし、同じ修正を再試行し続けます。トークンバッジが数分以内に赤くなり、cache hit rateが急落し、メッセージ比率が偏ります。ダッシュボードで発見し、即座に介入し、プロンプトを書き直し、予算を守ります。

長いタスクが順調に進んでいる

リファクタリングを始めて3時間、エージェントがまだ軌道に乗っているか気になります。セッションモニターを開きます : 700メッセージ、180ツール使用、78パーセントのcache hit rate、すべて緑。トークン消費量は絶対値では高いですが、効率は正常です。そのまま走らせましょう。

夜通しのフリート実行

あなたが眠っている間、5つのエージェントがバックログを片付けます。朝、セッションごとのトークン使用量から、どれが効率的だったか、どれがループしたか、どれがコンテキスト切れになったかが分かります。すべてのトランスクリプトを読む代わりに、2分でトリアージできます。

Claude Code token usageメーターは、より大きなモニターサーフェスの1ピース。ライブエージェントステータス、Dockバッジ、モバイルプッシュ通知が全体像を完成させます。

AgentsRoomがAIエージェントをモニタリングする方法を見る

FAQ

Claude Code token usageトラッカーは正確ですか?

はい。AgentsRoomはClaude自身が~/.claude/projects/に書き出すのと同じJSONLトランスクリプトを読み取ります。Input tokens、output tokens、cache writes、cache readsはAnthropicが発行するメッセージごとの使用量ペイロードから直接取得されます。推定も、プロキシも、丸めもありません。セッションモニターの数値はAnthropicの請求と一致します。

トークンカウンターはエージェントを遅くしますか?

いいえ。ポーラーは15秒ごとにローカルファイルを読み取ります。JSONLパースはセッションモニターが開いている間だけ、10秒ごとに実行されます。Anthropicへの追加のネットワーク呼び出しも、Claudeに注入される計装も、ツール呼び出しのオーバーヘッドもありません。エージェントはフルスピードで動作します。

バッジはいつ赤くなりますか?

セッションごとの累積Claude Code token usageが、通常の長時間コーディングセッション向けに調整された過剰消費の閾値を越えた時です。閾値はアイドルセッションが決して引っかからない程度に保守的で、暴走ループが数ターン以内に赤くなる程度に厳しく設定されています。赤は警告であり、スロットルではありません。

なぜcache hit rateがそれほど重要なのですか?

Cache readsは新規input tokensの約10分の1のコストです。Cache hit rate 80パーセントのセッションは、同じセッションの0パーセント時と比べておよそ5倍安くなります。Cache hit rateはClaude Code token usageに対する最強の単一レバーです。AgentsRoomはこれをライブで表示するので、最後に気づくのではなく、セッション中に軌道修正できます。

Codex、Gemini、OpenCode、Aiderにも対応していますか?

現在のセッションモニターはClaudeのJSONLトランスクリプトを読み取り、プロンプトキャッシュの内訳がClaude固有の課金機能であるため、Claude専用です。ステータス、ロール、通知はすべてのプロバイダーで動作します。プロバイダー非依存の使用量追跡はロードマップに含まれています。

AgentsRoomはClaude Code token usageをサーバーに送信しますか?

いいえ。トークンカウンター、セッションモニター、cache hit rateはすべてMac上で、ローカルファイルから計算されます。何もマシンの外には出ません。モバイルコンパニオンへのオプションの暗号化同期を有効にした場合でも、明示的にミラーリングを選択したデータのみが送信され、AgentsRoomリレーを介してエンドツーエンドで暗号化されます。

ヒントを再利用可能なプロンプトとして保存できますか?

はい。セッションモニターの各ヒントには、編集可能な既製プロンプトを開くFix thisボタンがあります。エージェントターミナルに直接送信、クリップボードにコピー、またはグローバルプロンプトライブラリに保存して、すべてのプロジェクトで同じ修正をワンクリックで実行できます。

Claude Code token usageの推測をやめる

AgentsRoomをダウンロードして、すべてのClaudeエージェントにライブのセッションごとトークンメーターを手に入れましょう。過剰消費で赤、cache hit rateが一目で分かり、消費を抑えるためのヒント付き。すべてローカル、すべてあなたのもの。

無料AgentsRoomをダウンロード

コンパニオンアプリ:外出先でもエージェントを確認

Claude、Codex、OpenCode、Gemini CLI、Aiderに対応

拡張機能を入手
Chrome Web Store

バグや要望を公開バックログに直接送信できます。

マルチプロジェクト
マルチプロバイダー
マルチエージェント
ライブステータス
ファイル差分
モバイルアプリ
ライブプレビュー
エージェントチーム
ブラウザテスト
バックログ駆動開発