Token usage : theo phiên : trực tiếp

Claude Code token usage,
theo dõi theo từng phiên, theo thời gian thực

AgentsRoom theo dõi Claude Code token usage của bạn trong mọi terminal agent. Một bộ đếm token nhỏ nằm trong composer và cập nhật trực tiếp. Khi mức tiêu thụ token tăng cao trên một phiên Claude duy nhất, badge chuyển sang đỏ và cảnh báo bạn trước khi bạn vượt qua context window.

Nhấp vào badge và session monitor mở ra : input tokens, output tokens, cache reads, cache writes, cache hit rate, số lượng tin nhắn, các model được điều phối, thời lượng phiên và số lần dùng công cụ. Một panel, một phiên Claude, tất cả các con số chi phối Claude Code token usage của bạn.

Demo trực tiếp của badge Claude Code token usage trong AgentsRoom : nó nằm trong mọi composer agent, chuyển sang đỏ khi tiêu thụ token cao và mở một session monitor đầy đủ với input tokens, output tokens, cache reads và cache writes.

Claude Code token usage là chi phí biến đổi số một khi vận hành các AI coding agent. Mỗi prompt, mỗi tool call, mỗi lần re-inject CLAUDE.md đều tốn token. Không có khả năng nhìn thấy, bạn chỉ biết mình đã vượt ngân sách khi API bị throttle hoặc khi hóa đơn đến. AgentsRoom đặt một đồng hồ Claude Code token usage trực tiếp trên mỗi phiên agent để bạn thấy mức tiêu thụ ngay khi nó xảy ra, không phải sau đó.

Bộ đếm token nằm trong composer của terminal, ngay cạnh nút gửi. Nó cập nhật vài giây sau mỗi lượt Claude. Token cộng dồn trong toàn bộ phiên : input tokens, output tokens, cache writes và cache reads, tất cả được tổng hợp và tô màu để bạn có thể đọc trong nháy mắt. Khi Claude Code token usage theo phiên vượt ngưỡng tiêu thụ cao, badge chuyển sang đỏ với biểu tượng cảnh báo, giống như đồng hồ nhiên liệu nhắc bạn trước khi bình cạn.

Nhấp vào nó và session monitor mở ra. Bạn có một ảnh chụp trực tiếp về phiên Claude đang hoạt động : thời lượng kể từ tin nhắn đầu tiên, số prompt người dùng so với số lượt assistant, số lần dùng công cụ, các model đã xử lý cuộc hội thoại, Claude session id (có thể copy để dùng --resume), và phân tích token đầy đủ. Cache hit rate được tính ngay tại chỗ, tô màu xanh / vàng / đỏ, kèm một dòng nhắc rằng cache reads rẻ hơn input mới khoảng mười lần. Panel duy nhất đó biến Claude Code token usage từ một hộp đen thành một đồng hồ thời gian thực.

Tại sao Claude Code token usage theo phiên lại quan trọng

Hầu hết các wrapper Claude báo cáo token usage ở cấp tài khoản, mỗi ngày một lần, trong một dashboard mà bạn phải nhớ mở. Đến lúc đó thì thiệt hại đã xong. AgentsRoom đẩy Claude Code token usage lên bề mặt, trên mọi terminal agent, để bạn không thể bỏ qua. Bộ đếm token cách nút gửi hai centimet. Bạn liếc nhìn nó như liếc nhìn badge tin nhắn chưa đọc trên điện thoại.

Theo phiên là độ chi tiết phù hợp. Một đội agent chạy song song không cho bạn biết ai đang đốt token. Một agent có thể đang lặp đi lặp lại trên một prompt bị kẹt trong khi bốn agent khác im lặng. Với một đồng hồ Claude Code token usage theo phiên, agent gây ồn nổi bật ngay lập tức : badge của nó đỏ, cache hit rate thấp, số tin nhắn tăng nhanh. Bạn nhảy vào, sửa prompt, tiết kiệm ngân sách.

Toàn bộ tính năng là cục bộ. AgentsRoom đọc Claude Code token usage của bạn trực tiếp từ các transcript JSONL mà Claude ghi vào ~/.claude/projects/. Không có gì rời khỏi máy của bạn. Không có usage tracker bên thứ ba. Không có proxy đứng trước API. Bộ đếm token trong AgentsRoom chỉ là một cách đọc nhanh hơn, dễ thấy hơn các dữ liệu mà Anthropic đã lưu trên đĩa của bạn.

Modal Claude Code token usage trong AgentsRoom : thời lượng, trạng thái, số tin nhắn, số lần dùng công cụ, các model, session id, cộng với phân tích token gồm input, output, cache writes, cache reads và cache hit rate

Panel Claude Code token usage trong AgentsRoom. Nhấp vào badge token theo phiên trong bất kỳ composer agent nào, nhận mọi con số quan trọng, cộng với mẹo để giảm tiêu thụ token.

Panel Claude Code token usage hiển thị những gì

Một cú nhấp vào badge token mở session monitor trực tiếp. Đây là mọi con số bạn nhận được về phiên Claude đang hoạt động.

Thời lượng phiên

Thời gian trôi qua giữa tin nhắn đầu tiên và tin nhắn cuối cùng của phiên Claude đang hoạt động, làm mới trực tiếp. Hữu ích để phát hiện các agent đã nhai context trong nhiều giờ.

Trạng thái agent trực tiếp

Idle, working, done, hoặc needs input. Trạng thái đi cùng với bộ đếm token để bạn thấy trong nháy mắt phiên Claude nào đang tiêu thụ và phiên nào chỉ đang ngồi yên.

Tin nhắn và lượt assistant

Số lượng prompt người dùng so với lượt assistant trong phiên Claude đang hoạt động. Một tỷ lệ lệch là tín hiệu mạnh cho thấy agent đang lặp lại hoặc prompt của bạn quá mơ hồ.

Số lần dùng công cụ

Tổng số Read, Edit, Bash, Grep, Glob và các tool call khác do Claude thực thi trong phiên. Tool call chiếm phần lớn input tokens, vì vậy con số này theo sát Claude Code token usage.

Các model đã dùng

Mọi model Claude đã xử lý một lượt trong phiên : Sonnet, Opus, Haiku, các biến thể có ngày. AgentsRoom loại trùng lặp và rút ngắn tên để bạn thấy ngay nếu phiên của bạn đã được auto-route giữa các model.

Claude session id

Định danh phiên Claude nội bộ, có thể copy bằng một cú nhấp. Dùng nó để claude --resume cùng một cuộc hội thoại từ CLI mà không mất context.

Input tokens

Input tokens mới gửi tới Claude trong phiên, trước khi tái sử dụng cache. Đây là phần đắt nhất trong Claude Code token usage của bạn.

Output tokens

Token do Claude tạo ra trong phiên. Output tokens được tính giá cao hơn input, vì vậy giá trị cao mà không có tiến triển nghĩa là agent đang chạy vòng vòng.

Cache writes

Token mà Claude ghi vào prompt cache trong phiên. Cache writes bị tính với mức phí nhỏ thêm vào nhưng mở khóa cache reads rẻ ở các lượt tiếp theo.

Cache reads

Token được phục vụ từ prompt cache thay vì bị tính lại như input mới. Cache reads rẻ hơn input tokens khoảng 10 lần, đó là lý do cache hit rate là chỉ số hàng đầu của Claude Code token usage.

Cache hit rate

Tỷ lệ phần trăm token phía input được phục vụ từ cache, tô màu xanh trên 70 phần trăm, vàng giữa 30 và 70, đỏ dưới 30. Càng cao càng rẻ. Đòn bẩy tốt nhất duy nhất trên Claude Code token usage.

Tổng số token

Tổng tích lũy của input, output, cache writes và cache reads cho phiên đang hoạt động. Hữu ích như một con số tiêu đề duy nhất khi bạn so sánh tiêu thụ token giữa các agent.

Tại sao đồng hồ token chuyển sang đỏ

AgentsRoom kiểm tra Claude Code token usage theo phiên của bạn trên mỗi lần poll. Khi tổng đang chạy vượt ngưỡng tiêu thụ cao, badge chuyển sang đỏ với biểu tượng cảnh báo. Đó là dấu hiệu để mở session monitor và quyết định làm gì : compact, fork agent mới, đổi model, hoặc đơn giản là hoàn thành nhiệm vụ và kết thúc.

Đỏ không phải là giới hạn cứng. AgentsRoom không throttle agent của bạn hay làm gián đoạn việc chạy. Đó là một cú huých trực quan, trên một agent duy nhất, để một vòng lặp mất kiểm soát không lặng lẽ rút cạn ngân sách Anthropic của bạn trong khi bạn đang tập trung vào cửa sổ khác. Các phiên dài với cache hit rate lành mạnh hoàn toàn ổn và vẫn xanh.

Cách AgentsRoom theo dõi Claude Code token usage

Ba lớp : một poller usage, một parser JSONL và một UI trực tiếp.

01

Poller đọc tổng token mỗi 15 giây

Một tác vụ nền đọc token usage theo phiên từ trạng thái Claude cục bộ và đẩy nó vào store của renderer. Không có proxy trên API, không có network call thêm. Chỉ là một cách đọc nhanh hơn, dễ thấy hơn các con số mà Claude đã ghi xuống đĩa.

02

Parser JSONL làm mới mỗi 10 giây khi modal đang mở

Session monitor thêm một IPC call một-lần đi qua transcript JSONL của phiên Claude đang hoạt động để tính số tin nhắn, lượt assistant, số lần dùng công cụ, các model được điều phối và timestamp đầu/cuối. Việc làm mới chạy mỗi 10 giây khi panel hiển thị trên màn hình, để các con số luôn trực tiếp mà không đốt parser trên mỗi lần poll renderer.

03

UI trực tiếp : badge cộng session monitor

Badge trong composer của terminal đọc tổng token và quyết định xanh hoặc đỏ. Nhấp vào nó và session monitor mở ra, trong một portal để nó phủ lên toàn bộ cửa sổ. Các con số được định dạng với dấu phân tách nghìn, cache hit rate được tô màu, và một phần mẹo nhẹ nhàng nhắc bạn tiêu thụ ít hơn.

Mẹo để giảm Claude Code token usage của bạn

Session monitor đưa ra các mẹo này theo bối cảnh, dựa trên cache hit rate trực tiếp của bạn. Gửi bất kỳ mẹo nào trong số đó thẳng vào terminal agent bằng một cú nhấp.

Cache hit rate thấp : ổn định prefix của prompt

Dưới 30 phần trăm, Claude trả giá input đầy đủ mỗi lượt. Sửa CLAUDE.md giữa phiên, đổi model, hay sắp xếp lại các tin nhắn hệ thống đầu tiên đều phá cache. Khóa phần đầu của prompt và xem cache hit rate leo lên.

Dùng /compact thay vì /clear

Slash clear xóa cuộc hội thoại và buộc trả giá input đầy đủ ở lượt tiếp theo. Slash compact giữ nhiệm vụ và rút gọn lịch sử thành một bản tóm tắt, để cache prefix sống sót. Cùng cảm giác mới mẻ, Claude Code token usage thấp hơn nhiều.

Read một phần, không phải toàn bộ

Trên các file lớn hơn 100 dòng, hãy yêu cầu agent dùng Read với offset và limit, hoặc grep ký hiệu trước. Tải một file 4000 dòng mỗi lượt là cái lỗ Claude Code token usage số một và im lặng.

Edit thay vì Write

Tool Edit chỉ gửi diff trở lại Claude. Write truyền lại toàn bộ file. Trên một component 600 dòng, điều đó nhân đôi output tokens và làm phình input của lượt tiếp theo.

Tạo sub-agent cho các tìm kiếm rộng

Glob và Grep trên hàng trăm file đổ rất nhiều tiếng ồn vào context chính của bạn. Tool Agent chạy trong context window riêng và chỉ trả về một bản tóm tắt, giữ prompt cha nhỏ gọn.

Thu nhỏ CLAUDE.md của bạn

CLAUDE.md được nối thêm vào mọi lượt. Mỗi đoạn vô dụng ở đó tốn cached input tokens nhân với mỗi tin nhắn. Chuyển context dài vào context/ và tham chiếu nó khi cần.

Đồng hồ token AgentsRoom so với Claude Code thuần

Claude Code thuần hiển thị tổng token ở cuối phiên, trong một dòng footer nhỏ mà bạn phải cuộn lên để tìm. Không có đồng hồ trực tiếp. Không có phân tích theo phiên. Không có cache hit rate trong nháy mắt. Không có cảnh báo khi tiêu thụ tăng vọt. Bạn phát hiện việc dùng quá mức sau khi sự việc đã xảy ra, khi API bị rate-limit hoặc hóa đơn hàng tháng quá cao.

AgentsRoom biến Claude Code token usage thành một tín hiệu hạng nhất. Mỗi agent có bộ đếm token riêng. Đỏ khi dùng quá. Nhấp để xem phân tích đầy đủ. Cache hit rate được tính theo thời gian thực. Mẹo đọc các con số trực tiếp của bạn và đề xuất prompt sẵn sàng để vá lỗ rò rỉ. Cùng phiên Claude, cùng transcript JSONL, nhưng với khả năng nhìn thấy mà một đội agent song song thực sự cần.

Khi đồng hồ Claude Code token usage cứu bạn

Ba tình huống thực tế nơi trình theo dõi token theo phiên tự trả công cho mình.

Một agent bị kẹt trong vòng lặp

Một agent cứ đọc đi đọc lại cùng một file và thử đi thử lại cùng một bản sửa. Badge token của nó chuyển sang đỏ trong vài phút, cache hit rate tụt thẳng đứng, tỷ lệ tin nhắn lệch. Bạn phát hiện trên dashboard, nhảy vào, viết lại prompt, tiết kiệm ngân sách.

Một nhiệm vụ dài đang chạy tốt

Ba giờ vào một refactor, bạn tự hỏi liệu agent có còn đi đúng hướng. Mở session monitor : 700 tin nhắn, 180 lần dùng công cụ, 78 phần trăm cache hit rate, tất cả đều xanh. Tiêu thụ token cao về tuyệt đối, bình thường về hiệu quả. Cứ để nó nấu.

Chạy qua đêm trên một đội

Năm agent cày qua một backlog trong khi bạn ngủ. Sáng ra, token usage theo phiên cho bạn biết agent nào hiệu quả, agent nào lặp, agent nào hết context. Phân loại trong hai phút thay vì đọc từng transcript.

Đồng hồ Claude Code token usage là một mảnh trong một bề mặt giám sát lớn hơn. Trạng thái agent trực tiếp, badge dock và thông báo push di động hoàn thiện bức tranh.

Xem cách AgentsRoom giám sát AI agent

FAQ

Trình theo dõi Claude Code token usage có chính xác không ?

Có. AgentsRoom đọc cùng các transcript JSONL mà Claude tự ghi vào ~/.claude/projects/. Input tokens, output tokens, cache writes và cache reads được lấy trực tiếp từ payload usage theo từng tin nhắn mà Anthropic phát ra. Không ước lượng, không proxy, không làm tròn. Các con số trong session monitor khớp với hóa đơn của Anthropic.

Bộ đếm token có làm chậm agent của tôi không ?

Không. Poller đọc các file cục bộ mỗi 15 giây. Việc parse JSONL chỉ chạy khi session monitor đang mở, mỗi 10 giây. Không có network call thêm tới Anthropic, không có instrumentation tiêm vào Claude, không có overhead trên các tool call. Agent của bạn chạy ở tốc độ tối đa.

Khi nào badge chuyển sang đỏ ?

Khi Claude Code token usage tích lũy theo phiên vượt ngưỡng tiêu thụ cao được điều chỉnh cho các phiên coding dài bình thường. Ngưỡng đủ thận trọng để một phiên rảnh không bao giờ kích hoạt nó, và đủ chặt để một vòng lặp mất kiểm soát chuyển sang đỏ trong vài lượt. Đỏ là cảnh báo, không phải throttle.

Tại sao cache hit rate lại quan trọng đến vậy ?

Cache reads rẻ hơn input tokens mới khoảng 10 lần. Một phiên ở 80 phần trăm cache hit rate rẻ hơn khoảng năm lần so với cùng phiên ở 0 phần trăm. Cache hit rate là đòn bẩy tốt nhất duy nhất trên Claude Code token usage của bạn. AgentsRoom hiển thị nó trực tiếp để bạn có thể chỉnh hướng giữa phiên thay vì biết được vào lúc cuối.

Nó có hỗ trợ Codex, Gemini, OpenCode và Aider không ?

Session monitor ở dạng hiện tại là dành riêng cho Claude vì nó đọc các transcript JSONL của Claude và phân tích prompt-cache là một tính năng thanh toán chỉ có ở Claude. Trạng thái, vai trò và thông báo hoạt động cho mọi nhà cung cấp. Chúng tôi đang theo dõi usage không phụ thuộc nhà cung cấp trong roadmap.

AgentsRoom có gửi Claude Code token usage của tôi tới một server không ?

Không. Bộ đếm token, session monitor và cache hit rate được tính hoàn toàn trên Mac của bạn, từ các file cục bộ. Không có gì rời khỏi máy của bạn. Nếu bạn bật đồng bộ mã hóa tùy chọn tới ứng dụng đồng hành di động, chỉ những dữ liệu bạn chọn rõ ràng để mirror mới được gửi đi, và nó được mã hóa đầu cuối qua relay AgentsRoom.

Tôi có thể lưu các mẹo dưới dạng prompt tái sử dụng không ?

Có. Mỗi mẹo trong session monitor có một nút Fix this mở ra một prompt sẵn sàng có thể chỉnh sửa. Gửi nó thẳng vào terminal agent, copy vào clipboard, hoặc lưu vào thư viện prompt toàn cục để cùng một bản sửa chỉ cách một cú nhấp trên mọi dự án.

Ngừng đoán mò Claude Code token usage của bạn

Tải AgentsRoom và có một đồng hồ token theo phiên trực tiếp trên mọi agent Claude. Đỏ khi dùng quá, cache hit rate trong nháy mắt, mẹo để tiêu thụ ít hơn. Tất cả cục bộ, tất cả là của bạn.

Miễn phíTải AgentsRoom

Ứng dụng đồng hành: theo dõi agent khi đi đường

Hoạt động với Claude, Codex, OpenCode, Gemini CLI và Aider

Tải tiện ích mở rộng
Chrome Web Store

Gửi lỗi và yêu cầu thẳng vào backlog công khai của bạn.

Nhiều dự án
Đa nhà cung cấp
Nhiều agent
Trạng thái trực tiếp
File diff & commit
Ứng dụng đồng hành mobile
Xem trước trực tiếp
Đội agent
Tự động hóa trình duyệt
Dev theo backlog