Mức sử dụng token: theo phiên: trực tiếp

Mức sử dụng token Claude Code,
được theo dõi theo phiên, trong thời gian thực

AgentsRoom theo dõi mức sử dụng token Claude Code của bạn trong mỗi terminal agent. Một bộ đếm token nhỏ nằm trong trình soạn thảo và cập nhật trực tiếp. Khi mức tiêu thụ token của bạn tăng cao trong một phiên Claude duy nhất, huy hiệu chuyển sang màu đỏ và cảnh báo bạn trước khi bạn vượt qua cửa sổ ngữ cảnh.

Nhấp vào huy hiệu và công cụ theo dõi phiên mở ra: token đầu vào, token đầu ra, đọc cache, ghi cache, tỷ lệ hit cache, số lượng tin nhắn, mô hình đã định tuyến, thời gian phiên và số lần sử dụng công cụ. Một bảng điều khiển, một phiên Claude, tất cả các con số điều khiển mức sử dụng token Claude Code của bạn.

Tải xuống AgentsRoom Xem cách hoạt động của đồng hồ token

Miễn phí · macOS · 100% cục bộ, không proxy

Demo trực tiếp của huy hiệu mức sử dụng token Claude Code trong AgentsRoom: nó nằm trong mỗi trình soạn thảo agent, chuyển sang màu đỏ khi tiêu thụ token nặng, và mở một công cụ theo dõi phiên đầy đủ với token đầu vào, token đầu ra, đọc cache và ghi cache.

Mức sử dụng token Claude Code là chi phí biến đổi số một khi vận hành các agent lập trình AI. Mỗi prompt, mỗi cuộc gọi công cụ, mỗi lần tái chèn CLAUDE.md đều tiêu tốn token. Nếu không có sự minh bạch, bạn sẽ phát hiện ra rằng bạn đã vượt qua ngân sách khi API bị hạn chế hoặc hóa đơn đến. AgentsRoom đặt một đồng hồ mức sử dụng token Claude Code trực tiếp trên mỗi phiên agent để bạn thấy mức tiêu thụ khi nó xảy ra, chứ không phải sau.

Bộ đếm token nằm trong trình soạn thảo terminal, ngay bên cạnh nút gửi. Nó cập nhật vài giây sau mỗi lượt Claude. Các token cộng dồn trong suốt phiên: token đầu vào, token đầu ra, ghi cache và đọc cache, tất cả được tổng hợp và mã màu để bạn có thể đọc chúng chỉ trong một cái nhìn. Khi mức sử dụng token Claude Code theo phiên vượt qua ngưỡng tiêu thụ nặng, huy hiệu chuyển sang màu đỏ với biểu tượng cảnh báo, giống như cách mà đồng hồ nhiên liệu nhắc nhở bạn trước khi bình xăng cạn kiệt.

Nhấp vào nó và công cụ theo dõi phiên mở ra. Bạn nhận được một bức tranh trực tiếp về phiên Claude đang hoạt động: thời gian kể từ tin nhắn đầu tiên, số lượng prompt của người dùng so với lượt trợ lý, số lần sử dụng công cụ, các mô hình đã xử lý cuộc trò chuyện, id phiên Claude (có thể sao chép để --resume), và phân tích đầy đủ token. Tỷ lệ hit cache được tính toán ngay lập tức, mã màu xanh lá / vàng / đỏ, với một dòng nhắc nhở rằng việc đọc cache tốn khoảng mười lần ít hơn so với đầu vào mới. Bảng điều khiển đơn lẻ đó biến mức sử dụng token Claude Code từ một hộp đen thành một thước đo thời gian thực.

Cận cảnh trình soạn thảo agent của AgentsRoom với huy hiệu mức sử dụng token Claude Code chuyển sang màu đỏ, cảnh báo mức tiêu thụ cao ở 58 triệu token

Huy hiệu token nằm ngay cạnh nút gửi và chuyển sang màu đỏ khi mức tiêu thụ của một phiên tăng cao.

Tại sao mức sử dụng token Claude Code theo phiên lại quan trọng

Hầu hết các wrapper Claude báo cáo mức sử dụng token ở cấp tài khoản, một lần mỗi ngày, trong một bảng điều khiển mà bạn phải nhớ để mở. Đến lúc đó, thiệt hại đã xảy ra. AgentsRoom đưa mức sử dụng token Claude Code lên bề mặt, trên mỗi terminal agent, vì vậy bạn không thể bỏ qua nó. Bộ đếm token chỉ cách nút gửi hai centimet.

Theo phiên là độ phân giải đúng. Một nhóm các agent chạy song song không cho bạn biết ai đang tiêu tốn token. Một agent có thể đang lặp lại một prompt bị kẹt trong khi bốn agent khác thì im lặng. Với một đồng hồ mức sử dụng token Claude Code theo phiên, agent ồn ào nổi bật ngay lập tức: huy hiệu của nó màu đỏ, tỷ lệ hit cache của nó thấp, số lượng tin nhắn của nó đang tăng nhanh. Bạn nhảy vào, sửa prompt, tiết kiệm ngân sách.

Tính năng này hoàn toàn nội bộ. AgentsRoom đọc mức sử dụng token Claude Code của bạn trực tiếp từ các bản ghi JSONL mà Claude viết vào ~/.claude/projects/. Không có gì rời khỏi máy của bạn. Không có công cụ theo dõi sử dụng bên thứ ba. Không có proxy trước API. Bộ đếm token trong AgentsRoom chỉ là một cách đọc nhanh hơn, rõ ràng hơn về dữ liệu mà Anthropic đã lưu trên đĩa của bạn.

Modal mức sử dụng token Claude Code trong AgentsRoom: thời gian, trạng thái, số lượng tin nhắn, số lần sử dụng công cụ, mô hình, id phiên, cộng với phân tích token với đầu vào, đầu ra, ghi cache, đọc cache và tỷ lệ hit cache

Bảng điều khiển mức sử dụng token Claude Code trong AgentsRoom. Nhấp vào huy hiệu token theo phiên trong bất kỳ trình soạn thảo agent nào, nhận mọi con số quan trọng, cộng với mẹo để giảm mức tiêu thụ token của bạn.

Những gì bảng điều khiển mức sử dụng token Claude Code hiển thị

Một cú nhấp vào huy hiệu token mở ra một công cụ theo dõi phiên trực tiếp. Đây là mọi con số bạn nhận được trên phiên Claude đang hoạt động.

Thời gian phiên

Thời gian đã trôi qua giữa tin nhắn đầu tiên và tin nhắn cuối cùng của phiên Claude đang hoạt động, được làm mới trực tiếp. Hữu ích để phát hiện các agent đã tiêu tốn ngữ cảnh trong nhiều giờ.

Trạng thái agent trực tiếp

Nhàn rỗi, đang làm việc, đã hoàn thành, hoặc cần đầu vào. Trạng thái kết hợp với bộ đếm token để bạn có thể thấy ngay phiên Claude nào đang tiêu thụ và phiên nào chỉ đang ngồi đó.

Tin nhắn và lượt trợ lý

Số lượng prompt của người dùng so với lượt trợ lý trong phiên Claude đang hoạt động. Tỷ lệ không cân bằng là một tín hiệu mạnh cho thấy một agent đang lặp lại hoặc prompt của bạn quá mơ hồ.

Số lần sử dụng công cụ

Tổng số lần gọi Read, Edit, Bash, Grep, Glob và các công cụ khác được thực hiện bởi Claude trong phiên. Các cuộc gọi công cụ chiếm một phần lớn token đầu vào, vì vậy con số này theo dõi mức sử dụng token Claude Code rất sát sao.

Các mô hình đã sử dụng

Mỗi mô hình Claude đã xử lý một lượt trong phiên: Sonnet, Opus, Haiku, các biến thể có ngày. AgentsRoom loại bỏ trùng lặp và rút ngắn tên để bạn ngay lập tức thấy liệu phiên của bạn có được tự động định tuyến qua các mô hình hay không.

ID phiên Claude

Mã định danh phiên Claude nội bộ, có thể sao chép chỉ với một cú nhấp chuột. Sử dụng nó để claude --resume cuộc trò chuyện chính xác từ CLI mà không mất ngữ cảnh.

Token đầu vào

Các token đầu vào mới được gửi đến Claude trong phiên, trước khi tái sử dụng cache. Đây là phần tốn kém nhất trong mức sử dụng token Claude Code của bạn.

Token đầu ra

Các token được tạo ra bởi Claude trong phiên. Các token đầu ra được tính phí với mức cao hơn so với đầu vào, vì vậy các giá trị cao mà không có tiến triển có nghĩa là một agent đang quay vòng.

Ghi cache

Các token mà Claude ghi vào cache prompt trong phiên. Ghi cache được tính phí với một mức phí nhỏ nhưng chúng mở khóa việc đọc cache rẻ trong các lượt tiếp theo.

Đọc cache

Các token được phục vụ từ cache prompt thay vì được định giá lại như đầu vào mới. Đọc cache tốn khoảng 10 lần ít hơn so với token đầu vào, đó là lý do tại sao tỷ lệ hit cache là chỉ số hàng đầu về mức sử dụng token Claude Code của bạn.

Tỷ lệ hit cache

Phần trăm các token đầu vào được phục vụ từ cache, mã màu xanh lá trên 70 phần trăm, màu vàng giữa 30 và 70, màu đỏ dưới 30. Cao hơn thì rẻ hơn. Đây là công cụ tốt nhất duy nhất để điều chỉnh mức sử dụng token Claude Code.

Tổng số token

Tổng số cộng dồn giữa đầu vào, đầu ra, ghi cache và đọc cache cho phiên đang hoạt động. Hữu ích như một con số tiêu đề duy nhất khi bạn so sánh mức tiêu thụ token giữa các agent.

Tại sao đồng hồ token chuyển sang màu đỏ

AgentsRoom kiểm tra mức sử dụng token Claude Code theo phiên của bạn trên mỗi lần kiểm tra. Khi tổng số đang chạy vượt qua ngưỡng tiêu thụ nặng, huy hiệu chuyển sang màu đỏ với biểu tượng cảnh báo. Đó là tín hiệu để mở công cụ theo dõi phiên và quyết định phải làm gì: thu gọn, tạo một agent mới, chuyển mô hình, hoặc đơn giản là hoàn thành nhiệm vụ và kết thúc.

Màu đỏ không phải là giới hạn cứng. AgentsRoom không làm chậm agent của bạn hoặc ngắt quãng quá trình chạy. Đó là một sự nhắc nhở trực quan, trên một agent duy nhất, để một vòng lặp chạy trốn không âm thầm tiêu tốn ngân sách Anthropic của bạn trong khi bạn tập trung vào một cửa sổ khác. Các phiên dài với tỷ lệ hit cache khỏe mạnh hoàn toàn ổn và vẫn giữ màu xanh.

Cách AgentsRoom theo dõi mức sử dụng token Claude Code

Ba lớp: một công cụ kiểm tra mức sử dụng, một trình phân tích JSONL và một giao diện người dùng trực tiếp.

Công cụ kiểm tra đọc tổng số token mỗi 15 giây

Một tác vụ nền đọc mức sử dụng token theo phiên từ trạng thái Claude cục bộ của bạn và đẩy nó vào kho trình hiển thị. Không có proxy trên API, không có cuộc gọi mạng bổ sung. Chỉ là một cách đọc nhanh hơn, rõ ràng hơn về các con số mà Claude đã viết vào đĩa.

Trình phân tích JSONL làm mới mỗi 10 giây trong khi modal đang mở

Công cụ theo dõi phiên thêm một cuộc gọi IPC một lần mà đi qua bản ghi JSONL của phiên Claude đang hoạt động để tính toán số lượng tin nhắn, lượt trợ lý, số lần sử dụng công cụ, mô hình đã định tuyến và thời gian đầu/cuối. Việc làm mới diễn ra mỗi 10 giây trong khi bảng điều khiển đang hiển thị, vì vậy các con số vẫn trực tiếp mà không làm tốn tài nguyên của trình phân tích trên mỗi lần kiểm tra trình hiển thị.

Giao diện người dùng trực tiếp: huy hiệu cộng với công cụ theo dõi phiên

Huy hiệu trong trình soạn thảo terminal đọc tổng số token và quyết định màu xanh hoặc đỏ. Nhấp vào nó và công cụ theo dõi phiên mở ra, trong một cổng để nó phủ lên toàn bộ cửa sổ. Các con số được định dạng với dấu phân cách hàng nghìn, tỷ lệ hit cache được tô màu, và một phần mẹo nhắc nhở bạn tiêu thụ ít hơn.

Mẹo để giảm mức sử dụng token Claude Code của bạn

Công cụ theo dõi phiên đưa ra những mẹo này theo ngữ cảnh, dựa trên tỷ lệ hit cache trực tiếp của bạn. Gửi bất kỳ mẹo nào trong số đó trực tiếp đến terminal agent chỉ với một cú nhấp chuột.

Tỷ lệ hit cache thấp: ổn định tiền tố prompt

Dưới 30 phần trăm, Claude đang trả giá đầy đủ cho đầu vào mỗi lượt. Chỉnh sửa CLAUDE.md giữa phiên, chuyển mô hình, hoặc sắp xếp lại các tin nhắn hệ thống đầu tiên sẽ phá vỡ cache. Khóa phần đầu của prompt và theo dõi tỷ lệ hit cache tăng lên.

Sử dụng /compact thay vì /clear

Slash clear xóa cuộc trò chuyện và buộc định giá đầu vào đầy đủ trong lượt tiếp theo. Slash compact giữ nhiệm vụ và thu gọn lịch sử thành một tóm tắt, vì vậy tiền tố cache vẫn tồn tại. Cảm giác mới mẻ giống nhau, nhưng mức sử dụng token Claude Code thấp hơn nhiều.

Đọc một phần, không phải toàn bộ

Trên các tệp lớn hơn 100 dòng, yêu cầu agent sử dụng Read với offset và limit, hoặc grep cho ký hiệu trước. Tải một tệp 4000 dòng mỗi lượt là nguyên nhân số một âm thầm tiêu tốn mức sử dụng token Claude Code.

Chỉnh sửa thay vì Ghi

Công cụ Chỉnh sửa chỉ gửi sự khác biệt trở lại Claude. Ghi truyền tải toàn bộ tệp. Trên một thành phần 600 dòng, điều đó làm gấp đôi token đầu ra và làm tăng đầu vào của lượt tiếp theo.

Tạo các agent con cho các tìm kiếm rộng

Glob và Grep trên hàng trăm tệp tạo ra rất nhiều tiếng ồn vào ngữ cảnh chính của bạn. Công cụ Agent chạy trong một cửa sổ ngữ cảnh riêng và chỉ trả về một tóm tắt, giữ cho prompt cha nhỏ.

Thu nhỏ CLAUDE.md của bạn

CLAUDE.md được thêm vào mỗi lượt. Mỗi đoạn văn vô ích ở đó tiêu tốn token đầu vào đã được cache nhân với mỗi tin nhắn. Di chuyển ngữ cảnh dài vào context/ và tham chiếu nó theo yêu cầu.

Công cụ theo dõi phiên của AgentsRoom với thống kê sử dụng công cụ, các tệp đã đọc và mẹo theo ngữ cảnh để giảm mức sử dụng token Claude Code, mỗi mẹo có một nút Fix this chỉ với một cú nhấp

Công cụ theo dõi phiên đọc tỷ lệ hit cache trực tiếp của bạn và đưa ra các bản sửa sẵn sàng để gửi. Một cú nhấp vào Fix this sẽ gửi prompt thẳng đến agent.

Đồng hồ token AgentsRoom so với Claude Code gốc

Claude Code gốc hiển thị tổng số token vào cuối một phiên, trong một dòng chân nhỏ mà bạn phải cuộn lên để tìm. Không có đồng hồ trực tiếp. Không có phân tích theo phiên. Không có tỷ lệ hit cache ngay lập tức. Không có cảnh báo khi mức tiêu thụ tăng vọt. Bạn phát hiện ra việc sử dụng quá mức sau khi sự việc đã xảy ra, khi API hạn chế tốc độ hoặc hóa đơn hàng tháng quá cao.

AgentsRoom biến mức sử dụng token Claude Code thành một tín hiệu hàng đầu. Mỗi agent có bộ đếm token riêng. Đỏ khi sử dụng quá mức. Nhấp để xem phân tích đầy đủ. Tỷ lệ hit cache được tính toán trong thời gian thực. Mẹo đọc các con số trực tiếp của bạn và đề xuất các prompt đã chuẩn bị sẵn để khắc phục sự rò rỉ. Cùng một phiên Claude, cùng một bản ghi JSONL, nhưng với sự minh bạch mà một đội ngũ các agent song song thực sự cần.

Khi đồng hồ mức sử dụng token Claude Code cứu bạn

Ba tình huống thực tế mà công cụ theo dõi token theo phiên tự trả cho chính nó.

Một agent bị kẹt trong vòng lặp

Một agent liên tục đọc lại cùng một tệp và thử lại cùng một cách sửa. Huy hiệu token của nó chuyển sang màu đỏ trong vài phút, tỷ lệ hit cache của nó giảm mạnh, tỷ lệ tin nhắn của nó không cân bằng. Bạn phát hiện ra nó trên bảng điều khiển, nhảy vào, viết lại prompt, tiết kiệm ngân sách.

Một nhiệm vụ dài đang diễn ra tốt đẹp

Ba giờ vào một quá trình tái cấu trúc, bạn tự hỏi liệu agent có còn đúng hướng không. Mở công cụ theo dõi phiên: 700 tin nhắn, 180 lần sử dụng công cụ, 78 phần trăm tỷ lệ hit cache, tất cả đều màu xanh. Mức tiêu thụ token cao về tuyệt đối, bình thường về hiệu quả. Để nó tiếp tục.

Chạy qua đêm trên một đội ngũ

Năm agent làm việc qua một lượng công việc tồn đọng trong khi bạn ngủ. Vào buổi sáng, mức sử dụng token theo phiên cho bạn biết agent nào hiệu quả, agent nào bị lặp lại, agent nào hết ngữ cảnh. Phân loại trong hai phút thay vì đọc từng bản ghi.

Đồng hồ mức sử dụng token Claude Code là một phần của bề mặt theo dõi lớn hơn. Trạng thái agent trực tiếp, huy hiệu dock và thông báo đẩy di động hoàn thiện bức tranh.

Xem cách AgentsRoom theo dõi các agent AI

Thống kê dự án: thời gian và token theo từng dự ánỦy quyền agent: chuyển việc sang các model rẻ hơn

Thấy con số là bước đầu tiên. Hướng dẫn đầy đủ của chúng tôi phân tích chính xác nơi mà các token Claude Code đi và cách cắt giảm hóa đơn mà không làm chậm lại: ngữ cảnh chặt chẽ hơn, mô hình đúng, phân công và nhiều hơn nữa.

Đọc: cắt giảm chi phí token Claude Code của bạn

FAQ

Công cụ theo dõi mức sử dụng token Claude Code có chính xác không?

Có. AgentsRoom đọc cùng một bản ghi JSONL mà Claude tự viết vào ~/.claude/projects/. Các token đầu vào, token đầu ra, ghi cache và đọc cache được lấy trực tiếp từ payload sử dụng theo tin nhắn mà Anthropic phát ra. Không có ước lượng, không có proxy, không có làm tròn. Các con số trong công cụ theo dõi phiên khớp với những gì Anthropic tính phí.

Bộ đếm token có làm chậm agent của tôi không?

Không. Công cụ kiểm tra đọc các tệp cục bộ mỗi 15 giây. Phân tích JSONL chỉ chạy khi công cụ theo dõi phiên đang mở, mỗi 10 giây. Không có cuộc gọi mạng bổ sung đến Anthropic, không có công cụ nào được chèn vào Claude, không có chi phí bổ sung cho các cuộc gọi công cụ. Agent của bạn chạy với tốc độ tối đa.

Khi nào huy hiệu chuyển sang màu đỏ?

Khi mức sử dụng token Claude Code theo phiên cộng dồn vượt qua ngưỡng tiêu thụ nặng được điều chỉnh cho các phiên lập trình dài bình thường. Ngưỡng này đủ bảo thủ để một phiên nhàn rỗi không bao giờ vượt qua nó, và đủ chặt chẽ để một vòng lặp chạy trốn chuyển sang màu đỏ trong vài lượt. Màu đỏ là một cảnh báo, không phải là một giới hạn.

Tại sao tỷ lệ hit cache lại quan trọng như vậy?

Đọc cache tốn khoảng 10 lần ít hơn so với token đầu vào mới. Một phiên với tỷ lệ hit cache 80 phần trăm rẻ hơn khoảng năm lần so với cùng một phiên với tỷ lệ 0 phần trăm. Tỷ lệ hit cache là công cụ tốt nhất duy nhất để điều chỉnh mức sử dụng token Claude Code của bạn. AgentsRoom hiển thị nó trực tiếp để bạn có thể điều chỉnh hướng đi giữa phiên thay vì phát hiện ra ở cuối.

Nó có hỗ trợ Codex, Antigravity, OpenCode, Aider, Grok Build, Mistral Vibe và Kimi Code không?

Công cụ theo dõi phiên ở dạng hiện tại là cụ thể cho Claude vì nó đọc các bản ghi JSONL của Claude và phân tích cache prompt là một tính năng tính phí chỉ có ở Claude. Trạng thái, vai trò và thông báo hoạt động cho mọi nhà cung cấp. Chúng tôi đang theo dõi việc sử dụng không phụ thuộc vào nhà cung cấp trong lộ trình.

AgentsRoom có gửi mức sử dụng token Claude Code của tôi đến máy chủ không?

Không. Bộ đếm token, công cụ theo dõi phiên và tỷ lệ hit cache được tính toán hoàn toàn trên máy Mac của bạn, từ các tệp cục bộ. Không có gì rời khỏi máy của bạn. Nếu bạn bật đồng bộ hóa mã hóa tùy chọn đến ứng dụng di động, chỉ dữ liệu mà bạn chọn để phản chiếu được gửi, và nó được mã hóa đầu cuối qua relay của AgentsRoom.

Tôi có thể lưu các mẹo dưới dạng các prompt tái sử dụng không?

Có. Mỗi mẹo trong công cụ theo dõi phiên có một nút Sửa chữa này mở ra một prompt có thể chỉnh sửa, đã chuẩn bị sẵn. Gửi nó trực tiếp đến terminal agent, sao chép nó vào clipboard, hoặc lưu nó vào thư viện prompt toàn cầu của bạn để cùng một cách sửa chỉ cách một cú nhấp chuột trên mỗi dự án.

Ngừng đoán mức sử dụng token Claude Code của bạn

Tải xuống AgentsRoom và nhận một đồng hồ mức sử dụng token theo phiên trực tiếp trên mỗi agent Claude. Đỏ khi sử dụng quá mức, tỷ lệ hit cache ngay lập tức, mẹo để tiêu thụ ít hơn. Tất cả đều cục bộ, tất cả đều của bạn.

Miễn phíTải AgentsRoom

Ứng dụng đồng hành: theo dõi agent khi đi đường

Sử dụng Claude, Codex, Antigravity CLI hoặc nhà cung cấp AI khác.

Tải tiện ích mở rộng

Chrome Web Store

Gửi lỗi và yêu cầu thẳng vào backlog công khai của bạn.

Một cái nhìn về AgentsRoom đang hoạt động.

Nhiều dự án

Đa nhà cung cấp

Nhiều agent

Trạng thái trực tiếp

File diff & commit

Ứng dụng đồng hành mobile

Xem trước trực tiếp

Đội agent

Tự động hóa trình duyệt

Dev theo backlog

Thư viện prompt

Thư viện skill

Xem tất cả tính năng

Mức sử dụng token Claude Code,được theo dõi theo phiên, trong thời gian thực