Token usage : 세션별 : 실시간

Claude Code token usage,
세션별로, 실시간 추적

AgentsRoom은 모든 에이전트 터미널에서 Claude Code token usage를 감시합니다. 작은 토큰 카운터가 작성기에 자리잡고 실시간으로 갱신됩니다. 단일 Claude 세션에서 토큰 소비가 많아지면 배지가 빨갛게 변하며, 컨텍스트 윈도우를 다 쓰기 전에 경고합니다.

배지를 클릭하면 세션 모니터가 열립니다 : input tokens, output tokens, cache reads, cache writes, cache hit rate, 메시지 수, 라우팅된 모델, 세션 지속 시간, 그리고 도구 사용. 하나의 패널, 하나의 Claude 세션, Claude Code token usage를 좌우하는 모든 수치.

AgentsRoom의 Claude Code token usage 배지 실시간 데모 : 모든 에이전트 작성기에 자리잡고, 토큰 소비가 많아지면 빨갛게 변하며, input tokens, output tokens, cache reads, cache writes가 포함된 전체 세션 모니터를 엽니다.

Claude Code token usage는 AI 코딩 에이전트를 운영할 때 가장 중요한 가변 비용입니다. 모든 프롬프트, 모든 도구 호출, 모든 CLAUDE.md 재주입이 토큰을 소모합니다. 가시성이 없으면 API가 제한되거나 청구서가 도착했을 때 비로소 예산을 초과한 것을 알게 됩니다. AgentsRoom은 모든 에이전트 세션에 실시간 Claude Code token usage 미터를 띄워, 사후가 아니라 발생하는 순간에 소비를 볼 수 있게 합니다.

토큰 카운터는 터미널 작성기, 전송 버튼 바로 옆에 자리잡습니다. 각 Claude 턴 후 몇 초 만에 갱신됩니다. 토큰은 세션 전체에 걸쳐 누적됩니다 : input tokens, output tokens, cache writes, cache reads가 모두 합산되고 색상으로 구분되어 한눈에 읽을 수 있습니다. 세션별 Claude Code token usage가 과소비 임계값을 넘으면 배지가 경고 아이콘과 함께 빨갛게 뒤집어집니다. 연료 게이지가 탱크가 비기 전에 알려주는 것과 같은 방식입니다.

클릭하면 세션 모니터가 열립니다. 활성 Claude 세션의 실시간 스냅샷을 얻습니다 : 첫 메시지 이후 지속 시간, 사용자 프롬프트 대 어시스턴트 턴 수, 도구 사용, 대화를 처리한 모델, Claude 세션 id(--resume용으로 복사 가능), 그리고 전체 토큰 분석. Cache hit rate는 즉석에서 계산되며, 녹색 / 황색 / 빨강으로 색상 코딩되고, cache reads가 신규 입력보다 약 10배 저렴하다는 한 줄 알림이 함께합니다. 그 단일 패널이 Claude Code token usage를 블랙박스에서 실시간 게이지로 바꿔놓습니다.

왜 세션별 Claude Code token usage가 중요한가

대부분의 Claude 래퍼는 토큰 사용량을 계정 수준에서, 하루에 한 번, 직접 열어봐야 하는 대시보드에서 보고합니다. 그때쯤이면 이미 늦었습니다. AgentsRoom은 Claude Code token usage를 모든 에이전트 터미널의 표면으로 끌어올려 무시할 수 없게 만듭니다. 토큰 카운터는 전송 버튼에서 2센티미터 거리에 있습니다. 스마트폰의 읽지 않은 메시지 배지를 흘끗 보는 것처럼 보게 됩니다.

세션별이 올바른 단위입니다. 병렬로 실행되는 에이전트 팀은 누가 토큰을 태우고 있는지 알려주지 않습니다. 한 에이전트가 막힌 프롬프트에서 루프를 돌고 있을 수도 있고 다른 네 개는 조용할 수도 있습니다. 세션별 Claude Code token usage 미터가 있으면 시끄러운 에이전트가 즉시 눈에 띕니다 : 배지가 빨갛고, cache hit rate가 낮으며, 메시지 수가 빠르게 증가합니다. 끼어들어 프롬프트를 수정하고 예산을 절약합니다.

전체 기능은 로컬에서 작동합니다. AgentsRoom은 Claude가 ~/.claude/projects/에 작성하는 JSONL 트랜스크립트에서 직접 Claude Code token usage를 읽습니다. 어떤 것도 머신을 떠나지 않습니다. 서드파티 사용량 추적기 없음. API 앞단의 프록시 없음. AgentsRoom의 토큰 카운터는 Anthropic이 이미 디스크에 저장하는 데이터를 더 빠르고 더 잘 보이게 읽어내는 것일 뿐입니다.

AgentsRoom의 Claude Code token usage 모달 : 지속 시간, 상태, 메시지 수, 도구 사용, 모델, 세션 id, 그리고 input, output, cache writes, cache reads, cache hit rate가 포함된 토큰 분석

AgentsRoom의 Claude Code token usage 패널. 어떤 에이전트 작성기에서든 세션별 토큰 배지를 클릭하면 모든 중요한 수치와 토큰 소비를 줄이는 팁을 얻습니다.

Claude Code token usage 패널이 보여주는 것

토큰 배지를 한 번 클릭하면 실시간 세션 모니터가 열립니다. 활성 Claude 세션에서 얻는 모든 수치는 다음과 같습니다.

세션 지속 시간

활성 Claude 세션의 첫 메시지와 마지막 메시지 사이 경과 시간으로, 실시간 갱신됩니다. 몇 시간 동안 컨텍스트를 씹고 있는 에이전트를 발견하는 데 유용합니다.

실시간 에이전트 상태

유휴, 작업 중, 완료, 또는 입력 필요. 상태는 토큰 카운터와 짝을 이루어 어떤 Claude 세션이 소비 중이고 어떤 것이 그냥 자리만 차지하고 있는지 한눈에 보여줍니다.

메시지와 어시스턴트 턴

활성 Claude 세션의 사용자 프롬프트 대 어시스턴트 턴 수. 비대칭 비율은 에이전트가 루프를 돌거나 프롬프트가 너무 모호하다는 강력한 신호입니다.

도구 사용

세션에서 Claude가 실행한 Read, Edit, Bash, Grep, Glob 및 기타 도구 호출의 총 횟수. 도구 호출은 input tokens의 큰 비중을 차지하므로 이 수치는 Claude Code token usage를 밀접하게 추적합니다.

사용된 모델

세션에서 턴을 처리한 모든 Claude 모델 : Sonnet, Opus, Haiku, 날짜가 붙은 변형. AgentsRoom은 중복을 제거하고 이름을 짧게 만들어 세션이 모델 간에 자동 라우팅되었는지 즉시 보여줍니다.

Claude 세션 id

내부 Claude 세션 식별자로, 한 번의 클릭으로 복사 가능합니다. CLI에서 컨텍스트를 잃지 않고 동일한 대화를 claude --resume하는 데 사용하세요.

Input tokens

세션 동안 Claude로 전송된 신규 input tokens, 캐시 재사용 이전. 이는 Claude Code token usage에서 가장 비싼 버킷입니다.

Output tokens

세션에서 Claude가 생성한 토큰. Output tokens는 input보다 더 높은 요금으로 청구되므로 진전 없이 높은 값은 에이전트가 헛돌고 있다는 의미입니다.

Cache writes

세션 동안 Claude가 프롬프트 캐시에 작성하는 토큰. Cache writes는 약간의 프리미엄이 부과되지만 다음 턴에서 저렴한 cache reads를 가능하게 합니다.

Cache reads

신규 입력으로 다시 가격이 책정되는 대신 프롬프트 캐시에서 제공되는 토큰. Cache reads는 input tokens보다 약 10배 저렴하므로 cache hit rate가 Claude Code token usage의 핵심 지표입니다.

Cache hit rate

캐시에서 제공된 입력 측 토큰의 비율로, 70퍼센트 이상은 녹색, 30에서 70 사이는 황색, 30 미만은 빨강으로 색상 코딩됩니다. 높을수록 저렴합니다. Claude Code token usage에서 가장 강력한 단일 레버.

총 토큰

활성 세션의 input, output, cache writes, cache reads에 걸친 누적 합계. 에이전트 간 토큰 소비를 비교할 때 단일 헤드라인 수치로 유용합니다.

왜 토큰 미터가 빨갛게 변하는가

AgentsRoom은 폴링할 때마다 세션별 Claude Code token usage를 확인합니다. 누적 합계가 과소비 임계값을 넘으면 배지가 경고 아이콘과 함께 빨갛게 뒤집어집니다. 그것이 세션 모니터를 열고 어떻게 할지 결정하라는 신호입니다 : compact, 새 에이전트 분기, 모델 변경, 또는 그냥 작업을 끝내고 마무리.

빨강은 하드 리밋이 아닙니다. AgentsRoom은 에이전트를 제한하거나 실행을 중단시키지 않습니다. 단일 에이전트에 대한 시각적 알림이며, 다른 창에 집중하는 동안 폭주 루프가 조용히 Anthropic 예산을 고갈시키지 않게 합니다. 건강한 cache hit rate를 가진 긴 세션은 완전히 괜찮으며 녹색으로 유지됩니다.

AgentsRoom이 Claude Code token usage를 추적하는 방법

세 가지 레이어 : 사용량 폴러, JSONL 파서, 그리고 실시간 UI.

01

폴러가 15초마다 토큰 합계를 읽습니다

백그라운드 작업이 로컬 Claude 상태에서 세션별 토큰 사용량을 읽고 렌더러 스토어로 푸시합니다. API에 프록시 없음, 추가 네트워크 호출 없음. Claude가 이미 디스크에 작성하는 수치를 더 빠르고 잘 보이게 읽는 것일 뿐입니다.

02

모달이 열려 있는 동안 JSONL 파서가 10초마다 새로 고침

세션 모니터는 활성 Claude 세션의 JSONL 트랜스크립트를 순회하여 메시지 수, 어시스턴트 턴, 도구 사용, 라우팅된 모델, 첫/마지막 타임스탬프를 계산하는 일회성 IPC 호출을 추가합니다. 패널이 화면에 있는 동안 새로 고침이 10초마다 실행되므로 모든 렌더러 폴링에서 파서를 태우지 않고도 수치가 실시간으로 유지됩니다.

03

실시간 UI : 배지와 세션 모니터

터미널 작성기의 배지는 토큰 합계를 읽고 녹색 또는 빨강을 결정합니다. 클릭하면 세션 모니터가 열리며, 포털로 전체 창 위에 겹쳐집니다. 수치는 천 단위 구분 기호로 포맷되고, cache hit rate는 색상이 있으며, 팁 섹션이 더 적게 소비하도록 유도합니다.

Claude Code token usage를 줄이는 팁

세션 모니터는 실시간 cache hit rate에 따라 이러한 팁을 상황에 맞게 표시합니다. 한 번의 클릭으로 어떤 것이든 에이전트 터미널로 직접 전송할 수 있습니다.

낮은 cache hit rate : 프롬프트 접두부 안정화

30퍼센트 미만에서는 Claude가 매 턴마다 전체 입력 가격을 지불합니다. 세션 중에 CLAUDE.md를 편집하거나, 모델을 전환하거나, 초기 시스템 메시지를 재배열하면 캐시가 깨집니다. 프롬프트 상단을 잠그고 cache hit rate가 올라가는 것을 지켜보세요.

/clear 대신 /compact 사용

Slash clear는 대화를 지우고 다음 턴에 전체 입력 가격을 강제합니다. Slash compact는 작업을 유지하면서 히스토리를 요약으로 축소하므로 캐시 접두부가 살아남습니다. 같은 신선한 느낌, 훨씬 낮은 Claude Code token usage.

전체가 아닌 부분 Read

100줄보다 큰 파일에서는 에이전트에게 offset과 limit으로 Read를 사용하거나 먼저 심볼을 grep하라고 요청하세요. 매 턴마다 4000줄짜리 파일을 로드하는 것이 Claude Code token usage의 조용한 1위 누수입니다.

Write 대신 Edit

Edit 도구는 diff만 Claude에 다시 전송합니다. Write는 전체 파일을 재전송합니다. 600줄짜리 컴포넌트에서 이는 output tokens를 두 배로 만들고 다음 턴의 입력을 부풀립니다.

광범위한 검색을 위해 서브 에이전트 생성

수백 개의 파일에 걸친 Glob과 Grep은 메인 컨텍스트에 많은 잡음을 쏟아냅니다. Agent 도구는 자체 컨텍스트 윈도우에서 실행되며 요약만 반환하여 부모 프롬프트를 작게 유지합니다.

CLAUDE.md 축소

CLAUDE.md는 매 턴 앞에 추가됩니다. 거기에 있는 쓸모없는 단락 하나하나가 모든 메시지에 곱해진 캐시된 입력 토큰의 비용입니다. 긴 컨텍스트는 context/로 옮기고 필요할 때 참조하세요.

AgentsRoom 토큰 미터 vs 바닐라 Claude Code

바닐라 Claude Code는 세션이 끝날 때 토큰 합계를 보여줍니다. 위로 스크롤해야 찾을 수 있는 작은 푸터 줄에 말이죠. 실시간 미터 없음. 세션별 분석 없음. 한눈에 보이는 cache hit rate 없음. 소비가 급증할 때 경고 없음. API가 속도를 제한하거나 월별 청구서가 너무 높을 때 사후에 과사용을 발견합니다.

AgentsRoom은 Claude Code token usage를 일급 신호로 만듭니다. 모든 에이전트가 자체 토큰 카운터를 갖습니다. 과사용 시 빨강. 클릭하면 전체 분석. 실시간으로 계산되는 cache hit rate. 실시간 수치를 읽고 누수를 고치기 위한 즉시 사용 가능한 프롬프트를 제안하는 팁. 동일한 Claude 세션, 동일한 JSONL 트랜스크립트, 그러나 병렬 에이전트 무리에 실제로 필요한 가시성과 함께.

Claude Code token usage 미터가 당신을 구하는 순간

세션별 토큰 추적기가 본전을 뽑는 세 가지 실제 상황.

에이전트가 루프에 갇혔을 때

한 에이전트가 같은 파일을 계속 다시 읽고 같은 수정을 다시 시도합니다. 토큰 배지가 몇 분 안에 빨갛게 변하고, cache hit rate가 급락하며, 메시지 비율이 비대칭이 됩니다. 대시보드에서 발견하고 끼어들어 프롬프트를 다시 작성하고 예산을 절약합니다.

긴 작업이 잘 진행 중일 때

리팩토링 3시간 차에 에이전트가 여전히 궤도에 있는지 궁금합니다. 세션 모니터를 엽니다 : 700 메시지, 180 도구 사용, 78퍼센트 cache hit rate, 모두 녹색. 토큰 소비는 절대값으로는 높지만 효율로는 정상. 계속 돌리세요.

에이전트 무리의 야간 실행

당신이 자는 동안 다섯 에이전트가 백로그를 갈아냅니다. 아침에 세션별 토큰 사용량이 어느 것이 효율적이었는지, 어느 것이 루프를 돌았는지, 어느 것이 컨텍스트가 부족했는지 알려줍니다. 모든 트랜스크립트를 읽는 대신 2분 만에 분류.

Claude Code token usage 미터는 더 큰 모니터 표면의 한 조각입니다. 실시간 에이전트 상태, Dock 배지, 모바일 푸시 알림이 그림을 완성합니다.

AgentsRoom이 AI 에이전트를 모니터링하는 방법 보기

FAQ

Claude Code token usage 추적기는 정확합니까?

네. AgentsRoom은 Claude 자체가 ~/.claude/projects/에 작성하는 동일한 JSONL 트랜스크립트를 읽습니다. Input tokens, output tokens, cache writes, cache reads는 Anthropic이 발행하는 메시지별 사용량 페이로드에서 직접 가져옵니다. 추정 없음, 프록시 없음, 반올림 없음. 세션 모니터의 수치는 Anthropic이 청구하는 것과 일치합니다.

토큰 카운터가 에이전트를 느리게 만듭니까?

아닙니다. 폴러는 15초마다 로컬 파일을 읽습니다. JSONL 파싱은 세션 모니터가 열려 있을 때만, 10초마다 실행됩니다. Anthropic으로의 추가 네트워크 호출 없음, Claude에 주입된 계측 없음, 도구 호출에 대한 오버헤드 없음. 에이전트는 최고 속도로 실행됩니다.

배지가 언제 빨갛게 변합니까?

누적 세션별 Claude Code token usage가 일반적인 장문 코딩 세션에 맞춰 조정된 과소비 임계값을 넘을 때입니다. 임계값은 유휴 세션이 절대 트리거하지 않을 만큼 보수적이면서도, 폭주 루프가 몇 턴 안에 빨갛게 변할 만큼 빠듯합니다. 빨강은 경고이지 제한이 아닙니다.

왜 cache hit rate가 그렇게 중요합니까?

Cache reads는 신규 input tokens보다 약 10배 저렴합니다. 80퍼센트 cache hit rate인 세션은 0퍼센트인 동일한 세션보다 약 5배 저렴합니다. Cache hit rate는 Claude Code token usage에서 가장 강력한 단일 레버입니다. AgentsRoom은 그것을 실시간으로 보여주어 끝에 가서야 알게 되는 대신 세션 중에 진로를 수정할 수 있게 합니다.

Codex, Gemini, OpenCode, Aider도 지원합니까?

현재 형태의 세션 모니터는 Claude의 JSONL 트랜스크립트를 읽고 프롬프트 캐시 분석이 Claude 전용 청구 기능이기 때문에 Claude 전용입니다. 상태, 역할, 알림은 모든 공급자에 대해 작동합니다. 공급자 무관 사용량을 로드맵에서 추적하고 있습니다.

AgentsRoom이 내 Claude Code token usage를 서버로 전송합니까?

아닙니다. 토큰 카운터, 세션 모니터, cache hit rate는 로컬 파일에서 Mac 내에서 완전히 계산됩니다. 어떤 것도 머신을 떠나지 않습니다. 모바일 컴패니언으로의 선택적 암호화 동기화를 활성화하면, 명시적으로 미러링하기로 선택한 데이터만 전송되며, AgentsRoom 릴레이를 통해 종단 간 암호화됩니다.

팁을 재사용 가능한 프롬프트로 저장할 수 있습니까?

네. 세션 모니터의 각 팁에는 편집 가능하고 즉시 사용 가능한 프롬프트를 여는 Fix this 버튼이 있습니다. 에이전트 터미널로 바로 전송하거나, 클립보드로 복사하거나, 글로벌 프롬프트 라이브러리에 저장하여 모든 프로젝트에서 한 번의 클릭으로 동일한 수정을 사용할 수 있습니다.

Claude Code token usage 추측을 멈추세요

AgentsRoom을 다운로드하고 모든 Claude 에이전트에 실시간 세션별 토큰 미터를 받으세요. 과사용 시 빨강, 한눈에 보이는 cache hit rate, 더 적게 소비하는 팁. 모두 로컬에서, 모두 당신의 것.

무료AgentsRoom 다운로드

컴패니언 앱: 이동 중에도 에이전트를 모니터링

Claude, Codex, OpenCode, Gemini CLI, Aider와 호환

확장 프로그램 설치
Chrome Web Store

버그와 요청을 공개 백로그로 바로 보내세요.

멀티 프로젝트
멀티 프로바이더
멀티 에이전트
실시간 상태
파일 diff & 커밋
모바일 앱
라이브 프리뷰
에이전트 팀
브라우저 자동화
백로그 기반 개발