कैनरी ट्रिक: Claude (या किसी भी AI एजेंट) को मतिभ्रम शुरू करने से पहले पकड़ें

यह जानने के लिए एक लाइन की ट्रिक कि आपका AI कोडिंग एजेंट कब बिगड़ने लगा है: हर जवाब को एक नाम से शुरू करवाएँ। नाम गायब हुआ, तो कैनरी मर गई और नई सेशन शुरू करने का समय आ गया। Claude, Codex, Gemini CLI, Mistral Vibe और हर LLM पर काम करती है।

AI कोडिंग एजेंट के साथ लंबी सेशन शायद ही कभी एक झटके में टूटती है। Claude एक ही बातचीत में तेज़ से बकवास तक नहीं गिर जाता। पहले वह चुपचाप एक छोटा निर्देश छोड़ देता है। एक-दो बारी बाद वह गढ़ना शुरू कर देता है: एक फ़ाइल जो मौजूद ही नहीं, एक API जो कभी थी ही नहीं, एक निर्णय जिसे आपने साफ़ तौर पर ख़ारिज किया था। जब तक आप किसी मतिभ्रम वाले पथ को पकड़ते हैं, तब तक पिछले कुछ जवाबों पर आपका भरोसा खो चुका होता है और आप अपने कोड के बजाय एजेंट को डीबग कर रहे होते हैं।

जल्दी चेतावनी पाने का एक मुफ़्त और लगभग शर्मनाक हद तक आसान तरीका है। इसे कैनरी कहते हैं, और यह एक लाइन में सेट हो जाता है।

एजेंट पटरी से क्यों उतरते हैं: कॉन्टेक्स्ट रॉट (context rot)

हर बारी पर एजेंट पहले संदेश से आख़िरी तक पूरी बातचीत दोबारा पढ़ता है और अपनी समझ शून्य से फिर बनाता है। ज्यों-ज्यों कॉन्टेक्स्ट विंडो भरती है, सबसे पहले निर्देशों का पालन ही डगमगाता है। मॉडल अब भी आत्मविश्वासी सुनाई देता है, पर साथ बने रहने के लिए वह सबसे कम ज़रूरी पाबंदियों को छोड़ने लगा है। शोधकर्ता इसे «context rot» कहते हैं, और इससे जुड़ा «lost in the middle» असर भी जाना जाता है: कॉन्टेक्स्ट जितना लंबा, उसके भीतर दबे किसी एक निर्देश को मॉडल उतना ही कम भरोसे से निभाता है।

यही मूल बात है। गिरावट मतिभ्रम से शुरू नहीं होती। यह मॉडल के किसी छोटे निर्देश को चुपचाप अनदेखा करने से शुरू होती है। इसलिए अगर आप एक नन्हा निर्देश बो दें जिसका एकमात्र काम है गायब होने पर ध्यान में आना, तो आपको एक ट्रिप-वायर मिल जाती है जो असली नुक़सान से पहले चल जाती है।

कैनरी ट्रिक है क्या

कभी खनिक खदान में एक कैनरी चिड़िया साथ ले जाते थे। यह पक्षी ज़हरीली गैसों के प्रति इंसानों से ज़्यादा संवेदनशील था: जब वह गाना बंद करती, खनिक समझ जाते कि ख़ुद कुछ महसूस होने से बहुत पहले बाहर निकल जाना चाहिए।

प्रॉम्प्ट की कैनरी भी यही विचार है। आप उस फ़ाइल में एक मामूली निर्देश जोड़ते हैं जिसे आपका एजेंट हर बारी पढ़ता है: हर जवाब एक चुने हुए नाम से शुरू करो। वह नाम आपकी कैनरी है। जब तक वह हर जवाब की शुरुआत में दिखता है, मॉडल अब भी आपके निर्देश पढ़ और निभा रहा है। नाम भूलने वाला पहला जवाब ही आपका संकेत है कि सेशन बिगड़ रही है, आम तौर पर असली मतिभ्रम आने से एक-दो बारी पहले। इस तरीके को एजेंटिक कोडिंग समुदाय में OpenClaw के निर्माता Peter Steinberger जैसे डेवलपरों ने लोकप्रिय किया, जो बिगड़ती सेशन को जल्दी पकड़ने के लिए छोटे कैनरी संकेतों पर भरोसा करते हैं।

एक वक्र जो दिखाता है कि लंबी सेशन के दौरान AI एजेंट का निर्देश-पालन कितना भरोसेमंद रहता है और कैसे गिरता है: कैनरी निर्देश मतिभ्रम शुरू होने से पहले गायब हो जाता है, एक जल्दी-चेतावनी की खिड़की छोड़ता हुआ।

कैनरी मतिभ्रम शुरू होने से पहले गायब हो जाती है। वही अंतराल प्रतिक्रिया करने की आपकी खिड़की है।

एक लाइन में सेट करें

निर्देश को उस फ़ाइल में रखें जिसे आपका एजेंट हर बारी लोड करता है:

  • Claude Code CLAUDE.md पढ़ता है।
  • Codex, Gemini CLI, Mistral Vibe और ज़्यादातर अन्य CLI AGENTS.md पढ़ते हैं।
## कैनरी
हर जवाब "Felix" नाम से शुरू करो।

कोई छोटा और अलग दिखने वाला नाम चुनें: आपकी बिल्ली, कोई रंग, कुछ भी जो जवाब की शुरुआत में तुरंत आँख में चढ़ जाए। इसे एकदम सरल रखें। जटिल निर्देश मक़सद के ख़िलाफ़ जाता है, क्योंकि आपको वही चीज़ चाहिए जिसे मॉडल सबसे आसानी से छोड़ सके। अगर यह तक छूट जाए, तो आपके कॉन्टेक्स्ट की ज़्यादा बारीक बातें पहले ही ख़तरे में हैं।

कैनरी मर जाए तो क्या करें

नाम कभी असली मुद्दा था ही नहीं। असली बात समय की है। जब कैनरी गायब हो, तो मौजूदा सिलसिले को आगे मत धकेलें:

  1. पिछले दो-तीन जवाबों पर भरोसा करना बंद करें और उन्हें शक़ की नज़र से दोबारा पढ़ें।
  2. /clear चलाएँ या नई सेशन शुरू करें।
  3. केवल वही कॉन्टेक्स्ट दोबारा डालें जो मायने रखता है: जो फ़ाइल आप संपादित कर रहे हैं, लक्ष्य, और पहले लिए जा चुके निर्णय।

कसे हुए ब्रीफ़ वाली साफ़ खिड़की हर बार भरी-भरी खिड़की को मात देती है। आप प्रगति नहीं खोते, बस वह बोझ उतार देते हैं जो मॉडल को नीचे खींच रहा था।

निर्णय लूप: एजेंट का जवाब पढ़ें, जाँचें कि वह नाम से शुरू होता है या नहीं। अगर हाँ, तो कैनरी ज़िंदा है, काम जारी रखें। अगर नहीं, तो कैनरी मर चुकी है, इसलिए कॉन्टेक्स्ट साफ़ करें या नई सेशन शुरू करें और मुख्य कॉन्टेक्स्ट दोबारा डालें।

पूरी आदत एक लूप में समा जाती है: पहले शब्द पर नज़र, फिर फ़ैसला, फिर जारी रखें या रीसेट करें।

यह हर मॉडल पर काम करती है, सिर्फ़ Claude पर नहीं

यह ट्रिक बनावट से ही प्रोवाइडर-निरपेक्ष है। Claude, Codex, Gemini CLI, Mistral Vibe, Grok और Aider सबकी कॉन्टेक्स्ट सीमाएँ एक जैसी हैं, सब एक कॉन्टेक्स्ट फ़ाइल पढ़ते हैं, और सब एक कैनरी ले जा सकते हैं। हम पहले Claude पर ध्यान देते हैं क्योंकि आज यही सबसे ज़्यादा इस्तेमाल होने वाला कोडिंग एजेंट है, पर यहाँ कुछ भी Claude-विशेष नहीं है। अपना कॉन्टेक्स्ट भरने वाली कोई भी LLM सबसे पहले आपके सबसे छोटे निर्देश को छोड़ेगी, इसलिए वही कैनरी उन सबकी रक्षा करती है। अगर आप कोई AGENTS.md कॉन्टेक्स्ट फ़ाइल रखते हैं, तो कैनरी उसमें बस एक और लाइन है।

पूरे बेड़े पर कैनरी की निगरानी

हर जवाब में ग़ायब नाम ढूँढना एक एजेंट के साथ आसान है। कई एजेंट एक साथ चलाते समय यह नहीं चलता, और आज गंभीर काम ठीक वहीं होता है।

यही हिस्सा AgentsRoom आसान बना देता है। यह एक मल्टी-एजेंट कॉकपिट है: हर एजेंट का एक रोल, एक लाइव स्टेटस डॉट और अपना रंग होता है, और आप पूरे बेड़े की निगरानी एक ही विंडो से करते हैं। अपनी साझा CLAUDE.md या AGENTS.md में कैनरी एक बार डालें, और हर एजेंट उसे विरासत में पा लेता है। जब कोई एजेंट नाम छोड़ने लगे, आप उसे एक नज़र में पकड़ लेते हैं और पूरे प्रोजेक्ट के बजाय सिर्फ़ उसी सिलसिले को रीसेट करते हैं। वैकल्पिक git worktree आइसोलेशन इस दौरान समानांतर एजेंटों को एक-दूसरे पर पैर रखने से रोकता है।

सात प्रोवाइडर, एक कॉकपिट, और हर एक पर निगरानी रखती एक कैनरी। AgentsRoom डाउनलोड करें, यह देखने के लिए कि हर एजेंट क्या सपोर्ट करता है प्रोवाइडर संगतता मैट्रिक्स देखें, और मल्टी-प्रोवाइडर सपोर्ट के बारे में और पढ़ें कि बातचीत के बीच में स्विच करना आपके कॉन्टेक्स्ट को कैसे बरक़रार रखता है।

AgentsRoom डाउनलोड करें

अपने सभी प्रोजेक्ट्स पर Claude एजेंट्स को एक ही विंडो से चलाएं।

मुफ़्तAgentsRoom डाउनलोड करें

कंपेनियन ऐप: चलते-फिरते अपने एजेंट्स मॉनिटर करें

Claude, Codex, Gemini CLI या किसी अन्य AI प्रदाता का उपयोग करें।

एक्सटेंशन इंस्टॉल करें
Chrome Web Store

बग और अनुरोध सीधे अपने सार्वजनिक बैकलॉग में भेजें।

AgentsRoom को कार्य करते देखें।

मल्टी-प्रोजेक्ट
मल्टी-प्रोवाइडर
मल्टी-एजेंट
लाइव स्टेटस
फाइल डिफ और कमिट
मोबाइल ऐप
लाइव प्रीव्यू
एजेंट टीमें
ब्राउज़र ऑटोमेशन
बैकलॉग-संचालित डेव
प्रॉम्प्ट लाइब्रेरी
स्किल्स लाइब्रेरी
सभी सुविधाएँ देखें