Расход токенов : по сессии : в реальном времени

Claude Code token usage,
по каждой сессии, в реальном времени

AgentsRoom следит за твоим Claude Code token usage в каждом терминале агента. Маленький счетчик токенов сидит в композере и обновляется на лету. Когда расход на одной Claude session становится тяжелым, бейдж краснеет и предупреждает тебя до того, как ты пробьешь окно контекста.

Кликни по бейджу, и откроется монитор сессии : input tokens, output tokens, cache reads, cache writes, cache hit rate, количество сообщений, маршрутизация моделей, длительность сессии и использования инструментов. Одна панель, одна Claude session, все цифры, которые определяют твой Claude Code token usage.

Живое демо бейджа Claude Code token usage в AgentsRoom : он сидит в композере каждого агента, краснеет при тяжелом расходе и открывает полный монитор сессии с input tokens, output tokens, cache reads и cache writes.

Claude Code token usage : это переменная затрата номер один при запуске ИИ-агентов для кода. Каждый промпт, каждый вызов инструмента, каждая повторная инъекция CLAUDE.md ест токены. Без видимости ты узнаешь, что пробил бюджет, только когда API начнет троттлить или придет счет. AgentsRoom ставит живой счетчик Claude Code token usage на каждую сессию агента, чтобы ты видел расход в моменте, а не постфактум.

Счетчик токенов живет в композере терминала, прямо рядом с кнопкой отправки. Он обновляется через несколько секунд после каждого хода Claude. Токены складываются по всей сессии : input tokens, output tokens, cache writes и cache reads, все суммируются и подсвечиваются цветом, чтобы ты считывал их с одного взгляда. Когда Claude Code token usage по сессии пересекает порог тяжелого расхода, бейдж краснеет с иконкой предупреждения, как датчик топлива пилит тебя до того, как бак опустеет.

Кликни по нему, и откроется монитор сессии. Ты получишь живой снимок активной Claude session : длительность с первого сообщения, число пользовательских промптов против ходов ассистента, использования инструментов, модели, обработавшие диалог, идентификатор Claude session (копируется для --resume) и полная разбивка по токенам. Cache hit rate считается на лету, подсвечивается зеленым / янтарным / красным, с однострочным напоминанием, что cache reads стоят примерно в десять раз меньше, чем свежий input. Эта одна панель превращает Claude Code token usage из черного ящика в живой датчик.

Почему Claude Code token usage по сессии важен

Большинство оберток Claude отчитываются о токенах на уровне аккаунта, раз в день, в дашборде, который надо не забыть открыть. К этому моменту урон уже нанесен. AgentsRoom выносит Claude Code token usage на поверхность, на каждый терминал агента, так что игнорировать его невозможно. Счетчик токенов в двух сантиметрах от кнопки отправки. Ты смотришь на него так же, как смотришь на бейдж непрочитанных на телефоне.

По сессии : это правильная гранулярность. Команда агентов, бегущих параллельно, не подскажет тебе, кто жжет токены. Один агент может зациклиться на застрявшем промпте, пока четверо других молчат. С счетчиком Claude Code token usage по сессии шумный агент мгновенно выделяется : его бейдж красный, его cache hit rate низкий, его счетчик сообщений быстро растет. Ты вмешиваешься, правишь промпт, спасаешь бюджет.

Вся фича локальная. AgentsRoom читает твой Claude Code token usage прямо из JSONL-транскриптов, которые Claude пишет в ~/.claude/projects/. Ничего не покидает твою машину. Никаких сторонних трекеров. Никакого прокси перед API. Счетчик токенов в AgentsRoom : это просто более быстрый и более заметный показ данных, которые Anthropic уже сохраняет на твоем диске.

Модальное окно Claude Code token usage в AgentsRoom : длительность, статус, количество сообщений, использования инструментов, модели, идентификатор сессии, плюс разбивка токенов с input, output, cache writes, cache reads и cache hit rate

Панель Claude Code token usage в AgentsRoom. Кликни по бейджу токенов в композере любого агента, получи каждую важную цифру и советы, как снизить расход токенов.

Что показывает панель Claude Code token usage

Один клик по бейджу токенов открывает живой монитор сессии. Вот каждая цифра, которую ты получаешь по активной Claude session.

Длительность сессии

Время между первым и последним сообщением активной Claude session, обновляется в реальном времени. Помогает заметить агентов, которые часами жуют контекст.

Живой статус агента

Простаивает, работает, готов или ждет ввода. Статус идет в паре со счетчиком токенов, чтобы ты сразу видел, какая Claude session расходует, а какая просто стоит.

Сообщения и ходы ассистента

Количество пользовательских промптов против ходов ассистента в активной Claude session. Перекошенное соотношение : сильный сигнал, что агент зациклился или твой промпт слишком расплывчатый.

Использования инструментов

Общее число вызовов Read, Edit, Bash, Grep, Glob и других инструментов, выполненных Claude в сессии. Вызовы инструментов формируют большую долю input tokens, так что эта цифра тесно отслеживает Claude Code token usage.

Использованные модели

Каждая модель Claude, обработавшая ход в сессии : Sonnet, Opus, Haiku, датированные варианты. AgentsRoom убирает дубли и сокращает имена, чтобы ты сразу видел, была ли твоя сессия автоматически перенаправлена между моделями.

Идентификатор Claude session

Внутренний идентификатор Claude session, копируется в один клик. Используй его, чтобы через claude --resume продолжить ту же беседу из CLI без потери контекста.

Input tokens

Свежие input tokens, отправленные Claude за сессию, до любого переиспользования кеша. Это самая дорогая корзина твоего Claude Code token usage.

Output tokens

Токены, сгенерированные Claude в сессии. Output tokens тарифицируются дороже input, так что высокие значения без прогресса означают, что агент крутится вхолостую.

Cache writes

Токены, которые Claude пишет в prompt cache во время сессии. Cache writes тарифицируются с небольшой надбавкой, но они открывают дешевые cache reads на следующих ходах.

Cache reads

Токены, отданные из prompt cache, вместо того чтобы быть переоцененными как свежий input. Cache reads стоят примерно в 10 раз меньше, чем input tokens, поэтому cache hit rate : ведущая метрика твоего Claude Code token usage.

Cache hit rate

Процент токенов на стороне input, отданных из кеша, подсвечивается зеленым выше 70 процентов, янтарным между 30 и 70, красным ниже 30. Чем выше, тем дешевле. Лучший единственный рычаг на Claude Code token usage.

Всего токенов

Накопленная сумма по input, output, cache writes и cache reads для активной сессии. Удобна как одна заглавная цифра, когда ты сравниваешь расход токенов между агентами.

Почему счетчик токенов краснеет

AgentsRoom проверяет твой Claude Code token usage по сессии при каждом опросе. Когда суммарный расход пересекает порог тяжелого потребления, бейдж краснеет с иконкой предупреждения. Это сигнал открыть монитор сессии и решить, что делать : сжать, форкнуть нового агента, переключить модель или просто закончить задачу и подвести итог.

Красный : это не жесткий лимит. AgentsRoom не троттлит твоего агента и не прерывает запуск. Это визуальный пинок по одному агенту, чтобы зацикленный цикл тихо не сливал твой бюджет Anthropic, пока ты сосредоточен на другом окне. Длинные сессии со здоровым cache hit rate совершенно нормальны и остаются зелеными.

Как AgentsRoom отслеживает Claude Code token usage

Три слоя : опросчик расхода, парсер JSONL и живой UI.

01

Опросчик читает суммы токенов каждые 15 секунд

Фоновая задача читает расход токенов по сессии из твоего локального состояния Claude и пушит его в стор рендерера. Никакого прокси на API, никаких лишних сетевых вызовов. Просто более быстрый и заметный показ цифр, которые Claude уже пишет на диск.

02

Парсер JSONL обновляется каждые 10 секунд, пока модальное окно открыто

Монитор сессии добавляет одноразовый IPC-вызов, который проходит по JSONL-транскрипту активной Claude session, чтобы посчитать количество сообщений, ходы ассистента, использования инструментов, маршрутизированные модели и первую/последнюю отметки времени. Обновление идет каждые 10 секунд, пока панель на экране, чтобы цифры оставались живыми, не сжигая парсер на каждом опросе рендерера.

03

Живой UI : бейдж плюс монитор сессии

Бейдж в композере терминала читает суммы токенов и решает, зеленый или красный. Кликни по нему, и откроется монитор сессии в портале, чтобы перекрыть все окно. Цифры форматируются с разделителями тысяч, cache hit rate подсвечивается, а секция советов подталкивает тебя расходовать меньше.

Советы, как снизить твой Claude Code token usage

Монитор сессии показывает эти советы контекстно, опираясь на твой живой cache hit rate. Отправь любой из них прямо в терминал агента в один клик.

Низкий cache hit rate : стабилизируй префикс промпта

Ниже 30 процентов Claude каждый ход платит полную цену input. Правки CLAUDE.md в середине сессии, переключение модели или перестановка ранних системных сообщений ломают кеш. Зафиксируй верх промпта и наблюдай, как cache hit rate растет.

Используй /compact вместо /clear

Slash clear стирает диалог и заставляет платить полный input на следующем ходу. Slash compact сохраняет задачу и сжимает историю в саммари, так что префикс кеша выживает. То же ощущение свежести, гораздо меньший Claude Code token usage.

Read частично, а не целиком

Для файлов больше 100 строк проси агента использовать Read с offset и limit или сначала grep по символу. Загружать 4000-строчный файл на каждом ходу : тихая дыра номер один в Claude Code token usage.

Edit вместо Write

Инструмент Edit отправляет Claude обратно только diff. Write пересылает весь файл. На 600-строчном компоненте это удваивает output tokens и раздувает input следующего хода.

Запускай суб-агентов для широких поисков

Glob и Grep по сотням файлов сваливают много шума в твой основной контекст. Инструмент Agent работает в собственном окне контекста и возвращает только саммари, сохраняя промпт родителя маленьким.

Сожми свой CLAUDE.md

CLAUDE.md приклеивается к каждому ходу. Каждый бесполезный абзац там стоит кешированных input tokens, умноженных на каждое сообщение. Перенеси длинный контекст в context/ и ссылайся на него по запросу.

Счетчик токенов AgentsRoom против ванильного Claude Code

Ванильный Claude Code показывает суммы токенов в конце сессии, в маленькой строке футера, до которой надо проскроллить. Никакого живого счетчика. Никакой разбивки по сессиям. Никакого cache hit rate с одного взгляда. Никакого предупреждения, когда расход скачет. Ты узнаешь о перерасходе постфактум, когда API режет лимит или ежемесячный счет слишком высок.

AgentsRoom превращает Claude Code token usage в сигнал первого класса. У каждого агента свой счетчик токенов. Красный при перерасходе. Клик для полной разбивки. Cache hit rate в реальном времени. Советы, которые читают твои живые цифры и предлагают готовые промпты, чтобы заткнуть утечку. Та же Claude session, те же JSONL-транскрипты, но с видимостью, которая на самом деле нужна флоту параллельных агентов.

Когда счетчик Claude Code token usage спасает тебя

Три реальные ситуации, в которых трекер токенов по сессиям окупает себя.

Агент застрял в цикле

Один агент перечитывает один и тот же файл и пробует одну и ту же правку. Его бейдж токенов краснеет за минуты, его cache hit rate падает, его соотношение сообщений перекошено. Ты замечаешь это на дашборде, вмешиваешься, переписываешь промпт, спасаешь бюджет.

Долгая задача идет отлично

Через три часа рефакторинга ты сомневаешься, на правильном ли пути агент. Открываешь монитор сессии : 700 сообщений, 180 использований инструментов, 78 процентов cache hit rate, все зеленое. Расход токенов высокий в абсолюте, нормальный по эффективности. Пусть варит.

Ночной запуск на флоте

Пять агентов перемалывают бэклог, пока ты спишь. Утром расход токенов по сессиям говорит тебе, кто был эффективен, кто зациклился, у кого закончился контекст. Триаж за две минуты вместо чтения каждого транскрипта.

Счетчик Claude Code token usage : это одна часть большей поверхности мониторинга. Живой статус агента, бейджи в доке и push-уведомления на мобильном дополняют картину.

Посмотреть, как AgentsRoom мониторит ИИ-агентов

FAQ

Точен ли трекер Claude Code token usage ?

Да. AgentsRoom читает те же JSONL-транскрипты, которые Claude сам пишет в ~/.claude/projects/. Input tokens, output tokens, cache writes и cache reads берутся напрямую из payload-а usage по каждому сообщению, который выдает Anthropic. Никаких оценок, никакого прокси, никакого округления. Цифры в мониторе сессии совпадают с тем, что Anthropic выставляет в счет.

Замедляет ли счетчик токенов моего агента ?

Нет. Опросчик читает локальные файлы каждые 15 секунд. Парсинг JSONL запускается, только когда монитор сессии открыт, каждые 10 секунд. Никаких лишних сетевых вызовов к Anthropic, никаких инструментаций, внедренных в Claude, никакого оверхеда на вызовы инструментов. Твой агент работает на полной скорости.

Когда бейдж краснеет ?

Когда суммарный Claude Code token usage по сессии пересекает порог тяжелого расхода, настроенный для нормальных длинных кодинг-сессий. Порог достаточно консервативен, чтобы простаивающая сессия никогда его не задела, и достаточно плотен, чтобы зацикленный цикл покраснел за несколько ходов. Красный : это предупреждение, а не троттлинг.

Почему cache hit rate так важен ?

Cache reads стоят примерно в 10 раз меньше, чем свежие input tokens. Сессия с 80 процентами cache hit rate примерно в пять раз дешевле той же сессии с 0 процентов. Cache hit rate : лучший единственный рычаг на твой Claude Code token usage. AgentsRoom показывает его в реальном времени, чтобы ты мог скорректировать курс посреди сессии, а не узнать постфактум.

Поддерживает ли он Codex, Gemini, OpenCode и Aider тоже ?

Монитор сессии в его текущей форме специфичен для Claude, потому что читает JSONL-транскрипты Claude, а разбивка prompt cache : это биллинговая фича только для Claude. Статус, роль и уведомления работают для каждого провайдера. Универсальный учет расхода для разных провайдеров у нас в роадмапе.

Отправляет ли AgentsRoom мой Claude Code token usage на сервер ?

Нет. Счетчик токенов, монитор сессии и cache hit rate считаются полностью на твоем Mac, из локальных файлов. Ничего не покидает твою машину. Если ты включишь опциональную зашифрованную синхронизацию с мобильным компаньоном, отправляются только те данные, которые ты явно выбрал зеркалить, и они end-to-end зашифрованы через relay AgentsRoom.

Можно ли сохранять советы как переиспользуемые промпты ?

Да. У каждого совета в мониторе сессии есть кнопка Fix this, которая открывает редактируемый, готовый промпт. Отправь его прямо в терминал агента, скопируй в буфер обмена или сохрани в свою глобальную библиотеку промптов, чтобы то же исправление было в одном клике на каждом проекте.

Перестань гадать о своем Claude Code token usage

Скачай AgentsRoom и получи живой счетчик токенов по сессиям на каждом агенте Claude. Красный при перерасходе, cache hit rate с одного взгляда, советы, как расходовать меньше. Все локально, все твое.

БесплатноСкачать AgentsRoom

Приложение-компаньон: следите за агентами на ходу

Работает с Claude, Codex, OpenCode, Gemini CLI и Aider

Установить расширение
Chrome Web Store

Отправляйте баги и запросы прямо в ваш публичный бэклог.

Мульти-проекты
Мульти-провайдер
Мульти-агенты
Статус онлайн
Diff и коммиты
Мобильное приложение
Live-превью
Команды агентов
Тесты в браузере
Разработка от backlog