कैनरी ट्रिक: Claude (या किसी भी AI एजेंट) को मतिभ्रम शुरू करने से पहले पकड़ें

यह जानने के लिए एक लाइन की ट्रिक कि आपका AI कोडिंग एजेंट कब बिगड़ने लगा है: हर जवाब को एक नाम से शुरू करवाएँ। नाम गायब हुआ, तो कैनरी मर गई और नई सेशन शुरू करने का समय आ गया। Claude, Codex, Antigravity CLI, Mistral Vibe और हर LLM पर काम करती है।

18 जून 2026

AI कोडिंग एजेंट के साथ लंबी सेशन शायद ही कभी एक झटके में टूटती है। Claude एक ही बातचीत में तेज़ से बकवास तक नहीं गिर जाता। पहले वह चुपचाप एक छोटा निर्देश छोड़ देता है। एक-दो बारी बाद वह गढ़ना शुरू कर देता है: एक फ़ाइल जो मौजूद ही नहीं, एक API जो कभी थी ही नहीं, एक निर्णय जिसे आपने साफ़ तौर पर ख़ारिज किया था। जब तक आप किसी मतिभ्रम वाले पथ को पकड़ते हैं, तब तक पिछले कुछ जवाबों पर आपका भरोसा खो चुका होता है और आप अपने कोड के बजाय एजेंट को डीबग कर रहे होते हैं।

जल्दी चेतावनी पाने का एक मुफ़्त और लगभग शर्मनाक हद तक आसान तरीका है। इसे कैनरी कहते हैं, और यह एक लाइन में सेट हो जाता है।

एजेंट पटरी से क्यों उतरते हैं: कॉन्टेक्स्ट रॉट (context rot)

हर बारी पर एजेंट पहले संदेश से आख़िरी तक पूरी बातचीत दोबारा पढ़ता है और अपनी समझ शून्य से फिर बनाता है। ज्यों-ज्यों कॉन्टेक्स्ट विंडो भरती है, सबसे पहले निर्देशों का पालन ही डगमगाता है। मॉडल अब भी आत्मविश्वासी सुनाई देता है, पर साथ बने रहने के लिए वह सबसे कम ज़रूरी पाबंदियों को छोड़ने लगा है। शोधकर्ता इसे «context rot» कहते हैं, और इससे जुड़ा «lost in the middle» असर भी जाना जाता है: कॉन्टेक्स्ट जितना लंबा, उसके भीतर दबे किसी एक निर्देश को मॉडल उतना ही कम भरोसे से निभाता है।

यही मूल बात है। गिरावट मतिभ्रम से शुरू नहीं होती। यह मॉडल के किसी छोटे निर्देश को चुपचाप अनदेखा करने से शुरू होती है। इसलिए अगर आप एक नन्हा निर्देश बो दें जिसका एकमात्र काम है गायब होने पर ध्यान में आना, तो आपको एक ट्रिप-वायर मिल जाती है जो असली नुक़सान से पहले चल जाती है।

कैनरी ट्रिक है क्या

कभी खनिक खदान में एक कैनरी चिड़िया साथ ले जाते थे। यह पक्षी ज़हरीली गैसों के प्रति इंसानों से ज़्यादा संवेदनशील था: जब वह गाना बंद करती, खनिक समझ जाते कि ख़ुद कुछ महसूस होने से बहुत पहले बाहर निकल जाना चाहिए।

प्रॉम्प्ट की कैनरी भी यही विचार है। आप उस फ़ाइल में एक मामूली निर्देश जोड़ते हैं जिसे आपका एजेंट हर बारी पढ़ता है: हर जवाब एक चुने हुए नाम से शुरू करो। वह नाम आपकी कैनरी है। जब तक वह हर जवाब की शुरुआत में दिखता है, मॉडल अब भी आपके निर्देश पढ़ और निभा रहा है। नाम भूलने वाला पहला जवाब ही आपका संकेत है कि सेशन बिगड़ रही है, आम तौर पर असली मतिभ्रम आने से एक-दो बारी पहले। इस तरीके को एजेंटिक कोडिंग समुदाय में OpenClaw के निर्माता Peter Steinberger जैसे डेवलपरों ने लोकप्रिय किया, जो बिगड़ती सेशन को जल्दी पकड़ने के लिए छोटे कैनरी संकेतों पर भरोसा करते हैं।

एक वक्र जो दिखाता है कि लंबी सेशन के दौरान AI एजेंट का निर्देश-पालन कितना भरोसेमंद रहता है और कैसे गिरता है: कैनरी निर्देश मतिभ्रम शुरू होने से पहले गायब हो जाता है, एक जल्दी-चेतावनी की खिड़की छोड़ता हुआ।

कैनरी मतिभ्रम शुरू होने से पहले गायब हो जाती है। वही अंतराल प्रतिक्रिया करने की आपकी खिड़की है।

एक लाइन में सेट करें

निर्देश को उस फ़ाइल में रखें जिसे आपका एजेंट हर बारी लोड करता है:

Claude Code CLAUDE.md पढ़ता है।
Codex, Antigravity CLI, Mistral Vibe और ज़्यादातर अन्य CLI AGENTS.md पढ़ते हैं।

## कैनरी
हर जवाब "Felix" नाम से शुरू करो।

कोई छोटा और अलग दिखने वाला नाम चुनें: आपकी बिल्ली, कोई रंग, कुछ भी जो जवाब की शुरुआत में तुरंत आँख में चढ़ जाए। इसे एकदम सरल रखें। जटिल निर्देश मक़सद के ख़िलाफ़ जाता है, क्योंकि आपको वही चीज़ चाहिए जिसे मॉडल सबसे आसानी से छोड़ सके। अगर यह तक छूट जाए, तो आपके कॉन्टेक्स्ट की ज़्यादा बारीक बातें पहले ही ख़तरे में हैं।

कैनरी मर जाए तो क्या करें

नाम कभी असली मुद्दा था ही नहीं। असली बात समय की है। जब कैनरी गायब हो, तो मौजूदा सिलसिले को आगे मत धकेलें:

पिछले दो-तीन जवाबों पर भरोसा करना बंद करें और उन्हें शक़ की नज़र से दोबारा पढ़ें।
/clear चलाएँ या नई सेशन शुरू करें।
केवल वही कॉन्टेक्स्ट दोबारा डालें जो मायने रखता है: जो फ़ाइल आप संपादित कर रहे हैं, लक्ष्य, और पहले लिए जा चुके निर्णय।

कसे हुए ब्रीफ़ वाली साफ़ खिड़की हर बार भरी-भरी खिड़की को मात देती है। आप प्रगति नहीं खोते, बस वह बोझ उतार देते हैं जो मॉडल को नीचे खींच रहा था।

निर्णय लूप: एजेंट का जवाब पढ़ें, जाँचें कि वह नाम से शुरू होता है या नहीं। अगर हाँ, तो कैनरी ज़िंदा है, काम जारी रखें। अगर नहीं, तो कैनरी मर चुकी है, इसलिए कॉन्टेक्स्ट साफ़ करें या नई सेशन शुरू करें और मुख्य कॉन्टेक्स्ट दोबारा डालें।

पूरी आदत एक लूप में समा जाती है: पहले शब्द पर नज़र, फिर फ़ैसला, फिर जारी रखें या रीसेट करें।

यह हर मॉडल पर काम करती है, सिर्फ़ Claude पर नहीं

यह ट्रिक बनावट से ही प्रोवाइडर-निरपेक्ष है। Claude, Codex, Antigravity CLI, Mistral Vibe, Grok और Aider सबकी कॉन्टेक्स्ट सीमाएँ एक जैसी हैं, सब एक कॉन्टेक्स्ट फ़ाइल पढ़ते हैं, और सब एक कैनरी ले जा सकते हैं। हम पहले Claude पर ध्यान देते हैं क्योंकि आज यही सबसे ज़्यादा इस्तेमाल होने वाला कोडिंग एजेंट है, पर यहाँ कुछ भी Claude-विशेष नहीं है। अपना कॉन्टेक्स्ट भरने वाली कोई भी LLM सबसे पहले आपके सबसे छोटे निर्देश को छोड़ेगी, इसलिए वही कैनरी उन सबकी रक्षा करती है। अगर आप कोई AGENTS.md कॉन्टेक्स्ट फ़ाइल रखते हैं, तो कैनरी उसमें बस एक और लाइन है।

पूरे बेड़े पर कैनरी की निगरानी

हर जवाब में ग़ायब नाम ढूँढना एक एजेंट के साथ आसान है। कई एजेंट एक साथ चलाते समय यह नहीं चलता, और आज गंभीर काम ठीक वहीं होता है।

यही हिस्सा AgentsRoom आसान बना देता है। यह एक मल्टी-एजेंट कॉकपिट है: हर एजेंट का एक रोल, एक लाइव स्टेटस डॉट और अपना रंग होता है, और आप पूरे बेड़े की निगरानी एक ही विंडो से करते हैं। अपनी साझा CLAUDE.md या AGENTS.md में कैनरी एक बार डालें, और हर एजेंट उसे विरासत में पा लेता है। जब कोई एजेंट नाम छोड़ने लगे, आप उसे एक नज़र में पकड़ लेते हैं और पूरे प्रोजेक्ट के बजाय सिर्फ़ उसी सिलसिले को रीसेट करते हैं। वैकल्पिक git worktree आइसोलेशन इस दौरान समानांतर एजेंटों को एक-दूसरे पर पैर रखने से रोकता है।

दरअसल AgentsRoom यह ट्रिक बिल्ट-इन देता है, इसलिए आपको ख़ुद जवाब देखते रहने की भी ज़रूरत नहीं। यह जो भी एजेंट लॉन्च करता है, वह पहले से ही हर टर्न के अंत में एक-लाइन स्टेटस लिखता है, और AgentsRoom उसे canary की तरह बरतता है: जब कोई एजेंट लगातार दो टर्न तक उसे अपडेट करना बंद कर देता है, उस एजेंट के टर्मिनल के ऊपर एक चेतावनी आ जाती है, साफ़ कॉन्टेक्स्ट पर एक-क्लिक रीस्टार्ट और कॉम्पैक्ट करने की याद के साथ। आपको पूर्व-चेतावनी अपने-आप मिलती है, हर एजेंट पर, पूरे बेड़े पर। यह कैसे काम करता है, कॉन्टेक्स्ट ड्रिफ़्ट डिटेक्शन पेज पर पढ़ें।

सात प्रोवाइडर, एक कॉकपिट, और हर एक पर निगरानी रखती एक कैनरी। AgentsRoom डाउनलोड करें, यह देखने के लिए कि हर एजेंट क्या सपोर्ट करता है प्रोवाइडर संगतता मैट्रिक्स देखें, और मल्टी-प्रोवाइडर सपोर्ट के बारे में और पढ़ें कि बातचीत के बीच में स्विच करना आपके कॉन्टेक्स्ट को कैसे बरक़रार रखता है।

पढ़ते रहें

AgentsRoom डाउनलोड करें

अपने AI एजेंट्स (Claude, Codex, Antigravity CLI, OpenCode, Aider, Grok Build, Mistral Vibe, Kimi Code) को अपने सभी प्रोजेक्ट्स पर एक ही विंडो से चलाएं।

मुफ़्तAgentsRoom डाउनलोड करें

कंपेनियन ऐप: चलते-फिरते अपने एजेंट्स मॉनिटर करें

Claude, Codex, Antigravity CLI या किसी अन्य AI प्रदाता का उपयोग करें।

एक्सटेंशन इंस्टॉल करें

Chrome Web Store

बग और अनुरोध सीधे अपने सार्वजनिक बैकलॉग में भेजें।