टोकन उपयोग : प्रति सेशन : लाइव

Claude Code token usage,
प्रति सेशन ट्रैक, रियल-टाइम में

AgentsRoom हर एजेंट टर्मिनल में आपकी Claude Code token usage पर नज़र रखता है। कंपोज़र में एक छोटा टोकन काउंटर बैठता है और लाइव अपडेट होता है। जब किसी एक Claude सेशन में टोकन खपत भारी हो जाती है, तो बैज लाल हो जाता है और कॉन्टेक्स्ट विंडो ख़त्म होने से पहले आपको चेतावनी देता है।

बैज पर क्लिक करें और सेशन मॉनिटर खुलता है : input tokens, output tokens, cache reads, cache writes, cache hit rate, मैसेज काउंट, रूट किए गए मॉडल, सेशन अवधि और टूल उपयोग। एक पैनल, एक Claude सेशन, और हर वो आंकड़ा जो आपकी Claude Code token usage तय करता है।

AgentsRoom में Claude Code token usage बैज का लाइव डेमो : यह हर एजेंट कंपोज़र में बैठता है, भारी टोकन खपत पर लाल हो जाता है, और input tokens, output tokens, cache reads और cache writes के साथ पूरा सेशन मॉनिटर खोलता है।

Claude Code token usage AI कोडिंग एजेंट चलाने की सबसे बड़ी वेरिएबल कॉस्ट है। हर प्रॉम्प्ट, हर टूल कॉल, हर CLAUDE.md री-इंजेक्शन टोकन खाता है। बिना विज़िबिलिटी के, आपको तब पता चलता है जब API थ्रॉटल हो जाता है या बिल आता है। AgentsRoom हर एजेंट सेशन पर एक लाइव Claude Code token usage मीटर लगाता है ताकि खपत होते ही दिखे, बाद में नहीं।

टोकन काउंटर टर्मिनल कंपोज़र में, सेंड बटन के ठीक बगल में रहता है। यह हर Claude टर्न के कुछ सेकंड बाद अपडेट होता है। टोकन पूरे सेशन में जुड़ते हैं : input tokens, output tokens, cache writes और cache reads, सब जोड़कर रंग-कोडेड ताकि एक नज़र में पढ़ सकें। जब प्रति-सेशन Claude Code token usage भारी-खपत थ्रेशोल्ड पार करती है, तो बैज चेतावनी आइकन के साथ लाल हो जाता है, उसी तरह जैसे फ़्यूल गेज टैंक खाली होने से पहले टोकता है।

उस पर क्लिक करें और सेशन मॉनिटर खुलता है। आपको सक्रिय Claude सेशन का लाइव स्नैपशॉट मिलता है : पहले मैसेज से अब तक की अवधि, यूज़र प्रॉम्प्ट बनाम असिस्टेंट टर्न की संख्या, टूल उपयोग, बातचीत संभालने वाले मॉडल, Claude session id (--resume के लिए कॉपी करने योग्य), और पूर्ण टोकन ब्रेकडाउन। Cache hit rate तत्काल गणना होती है, हरा / एम्बर / लाल रंग-कोडेड, एक-लाइन रिमाइंडर के साथ कि cache reads ताज़े input से लगभग दस गुना सस्ते हैं। वह एक पैनल Claude Code token usage को ब्लैक बॉक्स से रियल-टाइम गेज में बदल देता है।

क्यों प्रति-सेशन Claude Code token usage मायने रखती है

ज़्यादातर Claude रैपर अकाउंट लेवल पर, दिन में एक बार, एक डैशबोर्ड में टोकन उपयोग रिपोर्ट करते हैं जिसे खोलना आपको याद रखना होता है। तब तक नुकसान हो चुका होता है। AgentsRoom Claude Code token usage को सतह पर लाता है, हर एजेंट टर्मिनल पर, ताकि आप उसे नज़रअंदाज़ न कर सकें। टोकन काउंटर सेंड बटन से दो सेंटीमीटर दूर है। आप उसे ऐसे देखते हैं जैसे फ़ोन पर अनरीड बैज देखते हैं।

प्रति-सेशन सही ग्रैन्युलैरिटी है। समानांतर चल रहे एजेंट्स की टीम यह नहीं बताती कौन टोकन जला रहा है। एक एजेंट किसी अटके प्रॉम्प्ट पर लूप कर सकता है जबकि चार चुप हैं। प्रति-सेशन Claude Code token usage मीटर के साथ, शोरगुल वाला एजेंट तुरंत खड़ा हो जाता है : उसका बैज लाल है, उसका cache hit rate कम है, उसका मैसेज काउंट तेज़ी से बढ़ रहा है। आप कूदते हैं, प्रॉम्प्ट सुधारते हैं, बजट बचाते हैं।

पूरा फ़ीचर लोकल है। AgentsRoom आपकी Claude Code token usage सीधे उन JSONL ट्रांस्क्रिप्ट से पढ़ता है जो Claude ~/.claude/projects/ में लिखता है। आपकी मशीन से कुछ बाहर नहीं जाता। कोई थर्ड-पार्टी उपयोग ट्रैकर नहीं। API के सामने कोई प्रॉक्सी नहीं। AgentsRoom में टोकन काउंटर बस एक तेज़, ज़्यादा दिखने वाली रीडिंग है उन डेटा की जिन्हें Anthropic पहले से आपकी डिस्क पर सेव करता है।

AgentsRoom में Claude Code token usage मोडल : अवधि, स्टेटस, मैसेज काउंट, टूल उपयोग, मॉडल, session id, साथ ही input, output, cache writes, cache reads और cache hit rate के साथ टोकन ब्रेकडाउन

AgentsRoom में Claude Code token usage पैनल। किसी भी एजेंट कंपोज़र में प्रति-सेशन टोकन बैज पर क्लिक करें, हर ज़रूरी आंकड़ा पाएं, साथ ही टोकन खपत कम करने के सुझाव।

Claude Code token usage पैनल क्या दिखाता है

टोकन बैज पर एक क्लिक से लाइव सेशन मॉनिटर खुलता है। सक्रिय Claude सेशन पर मिलने वाला हर आंकड़ा यहाँ है।

सेशन अवधि

सक्रिय Claude सेशन के पहले और आख़िरी मैसेज के बीच बीता समय, लाइव रिफ़्रेश। उन एजेंट्स को पहचानने में उपयोगी जो घंटों कॉन्टेक्स्ट चबा रहे हैं।

लाइव एजेंट स्टेटस

Idle, working, done, या needs input। स्टेटस टोकन काउंटर के साथ जुड़ा है ताकि एक नज़र में दिखे कौन सा Claude सेशन खपत कर रहा है और कौन सा बस बैठा है।

मैसेज और असिस्टेंट टर्न

सक्रिय Claude सेशन में यूज़र प्रॉम्प्ट बनाम असिस्टेंट टर्न की गिनती। असंतुलित अनुपात मज़बूत संकेत है कि एजेंट लूप कर रहा है या आपका प्रॉम्प्ट बहुत अस्पष्ट है।

टूल उपयोग

सेशन में Claude द्वारा निष्पादित Read, Edit, Bash, Grep, Glob और अन्य टूल कॉल की कुल संख्या। टूल कॉल input tokens का बड़ा हिस्सा चलाते हैं, इसलिए यह संख्या Claude Code token usage को क़रीब से ट्रैक करती है।

उपयोग किए गए मॉडल

हर Claude मॉडल जिसने सेशन में कोई टर्न संभाला : Sonnet, Opus, Haiku, dated variants। AgentsRoom डुप्लिकेट हटाता है और नाम छोटे करता है ताकि तुरंत दिखे कि आपका सेशन मॉडल्स के बीच ऑटो-राउट हुआ या नहीं।

Claude session id

आंतरिक Claude सेशन आइडेंटिफ़ायर, एक क्लिक में कॉपी करने योग्य। CLI से कॉन्टेक्स्ट खोए बिना ठीक उसी बातचीत को claude --resume करने के लिए इसका उपयोग करें।

Input tokens

सेशन के दौरान Claude को भेजे गए ताज़े input tokens, किसी कैश पुनः उपयोग से पहले। यह आपकी Claude Code token usage की सबसे महंगी बकेट है।

Output tokens

सेशन में Claude द्वारा जेनरेट किए गए टोकन। Output tokens input से ऊंची दर पर बिल होते हैं, इसलिए बिना प्रगति के ऊंचे मान का मतलब है एजेंट चक्कर काट रहा है।

Cache writes

सेशन के दौरान Claude द्वारा प्रॉम्प्ट कैश में लिखे गए टोकन। Cache writes थोड़े प्रीमियम पर चार्ज होते हैं लेकिन अगले टर्न पर सस्ते cache reads अनलॉक करते हैं।

Cache reads

ताज़े input के रूप में फिर से कीमत लगने के बजाय प्रॉम्प्ट कैश से सर्व किए गए टोकन। Cache reads input tokens से लगभग 10 गुना सस्ते पड़ते हैं, यही कारण है कि cache hit rate आपकी Claude Code token usage की प्रमुख मीट्रिक है।

Cache hit rate

कैश से सर्व किए गए input-side टोकन का प्रतिशत, 70 प्रतिशत से ऊपर हरा, 30 और 70 के बीच एम्बर, 30 से नीचे लाल रंग-कोडेड। ज़्यादा सस्ता है। Claude Code token usage पर सबसे बेहतरीन लीवर।

कुल टोकन

सक्रिय सेशन के लिए input, output, cache writes और cache reads में संचयी योग। एजेंट्स के बीच टोकन खपत की तुलना करते समय एकल हेडलाइन संख्या के रूप में उपयोगी।

टोकन मीटर लाल क्यों होता है

AgentsRoom हर पोल पर आपकी प्रति-सेशन Claude Code token usage चेक करता है। जब चलता हुआ कुल भारी-खपत थ्रेशोल्ड पार करता है, तो बैज चेतावनी आइकन के साथ लाल हो जाता है। यह संकेत है कि सेशन मॉनिटर खोलें और तय करें क्या करना है : compact करें, नया एजेंट फ़ोर्क करें, मॉडल बदलें, या बस काम पूरा करके समेटें।

लाल कोई हार्ड लिमिट नहीं है। AgentsRoom आपके एजेंट को थ्रॉटल नहीं करता या रन को रोकता नहीं। यह विज़ुअल नज है, एकल एजेंट पर, ताकि कोई बेलगाम लूप चुपचाप आपका Anthropic बजट खाली न करे जबकि आप दूसरी विंडो पर ध्यान दे रहे हैं। स्वस्थ cache hit rate वाले लंबे सेशन बिल्कुल ठीक हैं और हरे रहते हैं।

AgentsRoom Claude Code token usage कैसे ट्रैक करता है

तीन परतें : एक उपयोग पोलर, एक JSONL पार्सर और एक लाइव UI।

01

पोलर हर 15 सेकंड में टोकन कुल पढ़ता है

एक बैकग्राउंड टास्क आपके लोकल Claude स्टेट से प्रति-सेशन टोकन उपयोग पढ़ता है और रेंडरर स्टोर में पुश करता है। API पर कोई प्रॉक्सी नहीं, कोई अतिरिक्त नेटवर्क कॉल नहीं। बस उन आंकड़ों की एक तेज़, दिखने वाली रीडिंग जो Claude पहले से डिस्क पर लिखता है।

02

मोडल खुले रहने तक JSONL पार्सर हर 10 सेकंड में रिफ़्रेश होता है

सेशन मॉनिटर एक एक-शॉट IPC कॉल जोड़ता है जो सक्रिय Claude सेशन के JSONL ट्रांस्क्रिप्ट को चलाकर मैसेज काउंट, असिस्टेंट टर्न, टूल उपयोग, रूट किए गए मॉडल और पहले/आख़िरी टाइमस्टैंप गणना करता है। पैनल स्क्रीन पर रहते हुए हर 10 सेकंड में रिफ़्रेश चलता है, ताकि आंकड़े लाइव रहें बिना हर रेंडरर पोल पर पार्सर जलाए।

03

लाइव UI : बैज और सेशन मॉनिटर

टर्मिनल कंपोज़र में बैज टोकन कुल पढ़ता है और हरा या लाल तय करता है। उस पर क्लिक करें और सेशन मॉनिटर खुलता है, एक पोर्टल में ताकि वह पूरी विंडो को ओवरले करे। संख्याएं हज़ार सेपरेटर के साथ फ़ॉर्मेट होती हैं, cache hit rate रंगीन होता है, और सुझाव सेक्शन कम खपत करने को कहता है।

अपनी Claude Code token usage कम करने के सुझाव

सेशन मॉनिटर ये सुझाव संदर्भानुसार सतह पर लाता है, आपके लाइव cache hit rate के आधार पर। इनमें से कोई भी एक क्लिक में सीधे एजेंट टर्मिनल को भेजें।

कम cache hit rate : प्रॉम्प्ट प्रीफ़िक्स स्थिर करें

30 प्रतिशत से नीचे, Claude हर टर्न पर पूरा input दाम चुका रहा है। बीच-सेशन CLAUDE.md एडिट करना, मॉडल बदलना, या शुरुआती सिस्टम मैसेज पुनर्व्यवस्थित करना कैश तोड़ता है। प्रॉम्प्ट के टॉप को लॉक करें और cache hit rate चढ़ता देखें।

/clear के बजाय /compact का उपयोग करें

स्लैश clear बातचीत मिटा देता है और अगले टर्न पर पूरा input प्राइसिंग मजबूर करता है। स्लैश compact टास्क रखता है और इतिहास को सारांश में सिकोड़ता है, ताकि कैश प्रीफ़िक्स बच जाए। वही ताज़ा एहसास, बहुत कम Claude Code token usage।

Read partial, पूरा नहीं

100 लाइन से बड़ी फ़ाइलों पर, एजेंट से कहें Read का offset और limit के साथ उपयोग करे, या पहले symbol के लिए grep करे। हर टर्न पर 4000-लाइन फ़ाइल लोड करना चुपचाप नंबर एक Claude Code token usage सिंक है।

Write के बजाय Edit

Edit टूल केवल diff Claude को वापस भेजता है। Write पूरी फ़ाइल फिर से ट्रांसमिट करता है। 600-लाइन कंपोनेंट पर, यह output tokens दोगुना करता है और अगले टर्न का input बढ़ाता है।

व्यापक सर्च के लिए सब-एजेंट स्पॉन करें

सैकड़ों फ़ाइलों में Glob और Grep आपके मुख्य कॉन्टेक्स्ट में बहुत शोर डालता है। Agent टूल अपनी कॉन्टेक्स्ट विंडो में चलता है और केवल सारांश लौटाता है, पैरेंट प्रॉम्प्ट छोटा रखता है।

अपना CLAUDE.md छोटा करें

CLAUDE.md हर टर्न पर प्रीपेंड होता है। वहां हर बेकार पैराग्राफ कैश्ड input tokens गुना हर मैसेज खर्च करता है। लंबा कॉन्टेक्स्ट context/ में ले जाएं और मांग पर रेफ़र करें।

AgentsRoom टोकन मीटर बनाम वनिला Claude Code

वनिला Claude Code सेशन के अंत में टोकन कुल दिखाता है, एक छोटी फ़ुटर लाइन में जिसे ढूंढने के लिए ऊपर स्क्रॉल करना पड़ता है। कोई लाइव मीटर नहीं। कोई प्रति-सेशन ब्रेकडाउन नहीं। एक नज़र में कोई cache hit rate नहीं। खपत बढ़ने पर कोई चेतावनी नहीं। आप ज़्यादा उपयोग बाद में पता लगाते हैं, जब API रेट-लिमिट करता है या मासिक इनवॉइस बहुत ज़्यादा होता है।

AgentsRoom Claude Code token usage को फ़र्स्ट-क्लास सिग्नल बनाता है। हर एजेंट को अपना टोकन काउंटर मिलता है। ज़्यादा उपयोग पर लाल। पूर्ण ब्रेकडाउन के लिए क्लिक करें। रियल टाइम में cache hit rate की गणना। सुझाव जो आपके लाइव आंकड़े पढ़ते हैं और रिसाव सुधारने के लिए तैयार-निर्मित प्रॉम्प्ट सुझाते हैं। वही Claude सेशन, वही JSONL ट्रांस्क्रिप्ट, लेकिन उस विज़िबिलिटी के साथ जो समानांतर एजेंट्स के बेड़े को वास्तव में चाहिए।

जब Claude Code token usage मीटर आपको बचाता है

तीन वास्तविक स्थितियां जहां प्रति-सेशन टोकन ट्रैकर ख़ुद की क़ीमत वसूल करता है।

एक एजेंट लूप में फंसा है

एक एजेंट उसी फ़ाइल को बार-बार पढ़ता है और उसी फ़िक्स को बार-बार आज़माता है। उसका टोकन बैज मिनटों में लाल हो जाता है, उसका cache hit rate गिरता है, उसका मैसेज अनुपात असंतुलित होता है। आप डैशबोर्ड पर इसे पकड़ते हैं, कूदते हैं, प्रॉम्प्ट फिर से लिखते हैं, बजट बचाते हैं।

एक लंबा टास्क बढ़िया चल रहा है

रीफ़ैक्टर के तीन घंटे बाद, आप सोचते हैं क्या एजेंट अभी भी सही दिशा में है। सेशन मॉनिटर खोलें : 700 मैसेज, 180 टूल उपयोग, 78 प्रतिशत cache hit rate, सब हरा। टोकन खपत निरपेक्ष में ऊंची है, दक्षता में सामान्य। पकने दें।

बेड़े पर रातभर का रन

पांच एजेंट्स आपके सोते समय बैकलॉग पीसते हैं। सुबह, प्रति-सेशन टोकन उपयोग आपको बताता है कौन कुशल था, कौन लूप किया, कौन कॉन्टेक्स्ट से बाहर हो गया। हर ट्रांस्क्रिप्ट पढ़ने के बजाय दो मिनट में ट्रायेज।

Claude Code token usage मीटर एक बड़े मॉनिटर सर्फ़ेस का एक टुकड़ा है। लाइव एजेंट स्टेटस, dock बैज और मोबाइल पुश नोटिफिकेशन तस्वीर पूरी करते हैं।

देखें AgentsRoom AI एजेंट कैसे मॉनिटर करता है

FAQ

क्या Claude Code token usage ट्रैकर सटीक है ?

हां। AgentsRoom वही JSONL ट्रांस्क्रिप्ट पढ़ता है जो Claude ख़ुद ~/.claude/projects/ में लिखता है। Input tokens, output tokens, cache writes और cache reads सीधे उस प्रति-मैसेज usage पेलोड से खींचे जाते हैं जो Anthropic emit करता है। कोई अनुमान नहीं, कोई प्रॉक्सी नहीं, कोई राउंडिंग नहीं। सेशन मॉनिटर के आंकड़े Anthropic के बिल से मेल खाते हैं।

क्या टोकन काउंटर मेरे एजेंट को धीमा करता है ?

नहीं। पोलर हर 15 सेकंड में लोकल फ़ाइलें पढ़ता है। JSONL पार्स केवल तब चलता है जब सेशन मॉनिटर खुला हो, हर 10 सेकंड में। Anthropic को कोई अतिरिक्त नेटवर्क कॉल नहीं, Claude में कोई इंस्ट्रूमेंटेशन इंजेक्ट नहीं, टूल कॉल पर कोई ओवरहेड नहीं। आपका एजेंट पूरी रफ़्तार से चलता है।

बैज कब लाल हो जाता है ?

जब संचयी प्रति-सेशन Claude Code token usage सामान्य लंबे-फ़ॉर्म कोडिंग सेशन के लिए ट्यून किए गए भारी-खपत थ्रेशोल्ड को पार करती है। थ्रेशोल्ड इतना संरक्षणवादी है कि निष्क्रिय सेशन कभी इसे ट्रिप नहीं करता, और इतना तंग कि बेलगाम लूप कुछ टर्न में लाल हो जाता है। लाल चेतावनी है, थ्रॉटल नहीं।

Cache hit rate इतना महत्वपूर्ण क्यों है ?

Cache reads ताज़े input tokens से लगभग 10 गुना सस्ते पड़ते हैं। 80 प्रतिशत cache hit rate वाला सेशन उसी सेशन से 0 प्रतिशत पर लगभग पांच गुना सस्ता है। Cache hit rate आपकी Claude Code token usage पर एकल बेहतरीन लीवर है। AgentsRoom इसे लाइव दिखाता है ताकि अंत में पता चलने के बजाय आप बीच-सेशन में रास्ता सुधार सकें।

क्या यह Codex, Gemini, OpenCode और Aider को भी सपोर्ट करता है ?

मौजूदा रूप में सेशन मॉनिटर Claude-विशिष्ट है क्योंकि यह Claude के JSONL ट्रांस्क्रिप्ट पढ़ता है और प्रॉम्प्ट-कैश ब्रेकडाउन Claude-केवल बिलिंग फ़ीचर है। स्टेटस, रोल और नोटिफिकेशन हर प्रोवाइडर के लिए काम करते हैं। हम रोडमैप में प्रोवाइडर-अज्ञेय उपयोग ट्रैक कर रहे हैं।

क्या AgentsRoom मेरी Claude Code token usage सर्वर पर भेजता है ?

नहीं। टोकन काउंटर, सेशन मॉनिटर और cache hit rate पूरी तरह आपके Mac पर, लोकल फ़ाइलों से गणना होते हैं। आपकी मशीन से कुछ बाहर नहीं जाता। यदि आप मोबाइल कंपैनियन के लिए वैकल्पिक एन्क्रिप्टेड सिंक सक्षम करते हैं, तो केवल वही डेटा भेजा जाता है जिसे आप स्पष्ट रूप से मिरर करना चुनते हैं, और वह AgentsRoom रिले के माध्यम से एंड-टू-एंड एन्क्रिप्टेड होता है।

क्या मैं सुझावों को पुन: उपयोग योग्य प्रॉम्प्ट के रूप में सेव कर सकता हूं ?

हां। सेशन मॉनिटर में हर सुझाव पर एक Fix this बटन है जो एडिट करने योग्य, तैयार-निर्मित प्रॉम्प्ट खोलता है। इसे सीधे एजेंट टर्मिनल को भेजें, क्लिपबोर्ड पर कॉपी करें, या अपनी ग्लोबल प्रॉम्प्ट लाइब्रेरी में सेव करें ताकि वही फ़िक्स हर प्रोजेक्ट पर एक क्लिक दूर हो।

अपनी Claude Code token usage का अंदाज़ा लगाना बंद करें

AgentsRoom डाउनलोड करें और हर Claude एजेंट पर लाइव प्रति-सेशन टोकन मीटर पाएं। ज़्यादा उपयोग पर लाल, एक नज़र में cache hit rate, कम खपत के सुझाव। सब लोकल, सब आपका।

मुफ़्तAgentsRoom डाउनलोड करें

कंपेनियन ऐप: चलते-फिरते अपने एजेंट्स मॉनिटर करें

Claude, Codex, OpenCode, Gemini CLI और Aider के साथ काम करता है

एक्सटेंशन इंस्टॉल करें
Chrome Web Store

बग और अनुरोध सीधे अपने सार्वजनिक बैकलॉग में भेजें।

मल्टी-प्रोजेक्ट
मल्टी-प्रोवाइडर
मल्टी-एजेंट
लाइव स्टेटस
फाइल डिफ और कमिट
मोबाइल ऐप
लाइव प्रीव्यू
एजेंट टीमें
ब्राउज़र ऑटोमेशन
बैकलॉग-संचालित डेव