Trik kenari: tangkap Claude (atau agen AI mana pun) sebelum mulai berhalusinasi
Trik satu baris untuk tahu kapan agen coding AI Anda mulai menurun: buat ia mengawali setiap balasan dengan sebuah nama. Saat nama itu hilang, kenari sudah mati dan saatnya memulai sesi baru. Berfungsi dengan Claude, Codex, Gemini CLI, Mistral Vibe, dan semua LLM.
Sesi panjang dengan agen coding AI jarang rusak sekaligus. Claude tidak melompat dari tajam ke ngawur dalam satu giliran. Mula-mula ia diam-diam melewati satu instruksi kecil. Satu dua giliran kemudian, ia mulai mengarang: berkas yang tidak ada, API yang tak pernah ada, keputusan yang sudah Anda tolak secara eksplisit. Saat Anda menyadari sebuah jalur halusinasi, Anda sudah kehilangan kepercayaan pada beberapa balasan terakhir dan sedang men-debug agennya alih-alih kode Anda.
Ada cara gratis, nyaris memalukan karena saking sederhananya, untuk mendapat peringatan dini. Namanya kenari, dan disiapkan dalam satu baris.
Mengapa agen keluar jalur: pembusukan konteks (context rot)
Tiap giliran, agen membaca ulang seluruh percakapan, dari pesan pertama hingga terakhir, lalu menyusun ulang pemahamannya dari nol. Saat jendela konteks penuh, yang pertama goyah adalah kepatuhan pada instruksi. Model masih terdengar percaya diri, tetapi sudah mulai melepas batasan-batasan yang paling tidak penting agar bisa mengikuti. Para peneliti menyebutnya «context rot», beserta efek terkait «lost in the middle»: makin panjang konteksnya, makin tidak andal model menaati satu instruksi yang terkubur di dalamnya.
Itulah wawasan kuncinya. Penurunan tidak dimulai dengan halusinasi. Ia dimulai saat model diam-diam mengabaikan satu instruksi kecil. Jadi jika Anda menanam instruksi mungil yang satu-satunya tugasnya adalah dikenali saat menghilang, Anda mendapat kawat pemicu yang menyala sebelum kerusakan sesungguhnya.
Apa itu trik kenari
Dulu para penambang turun ke lubang dengan membawa kenari. Burung itu lebih peka terhadap gas beracun daripada manusia: ketika ia berhenti berkicau, penambang tahu harus keluar, jauh sebelum mereka sendiri merasakan apa pun.
Kenari prompt adalah gagasan yang sama. Anda menambahkan satu instruksi sepele ke berkas yang dibaca agen di tiap giliran: awali setiap balasan dengan nama yang dipilih. Nama itu adalah kenari Anda. Selama ia muncul di awal tiap balasan, model masih membaca dan menaati instruksi Anda. Balasan pertama yang melupakan nama itu adalah tanda bahwa sesi sedang menurun, biasanya satu dua giliran sebelum halusinasi sungguhan muncul. Teknik ini dipopulerkan di komunitas coding agentik oleh para pengembang seperti Peter Steinberger, pencipta OpenClaw, yang mengandalkan sinyal-sinyal kenari kecil untuk menangkap sesi yang mulai memburuk lebih dini.
Kenari menghilang sebelum halusinasi mulai. Celah itulah jendela Anda untuk bereaksi.
Siapkan dalam satu baris
Letakkan instruksi di berkas yang dimuat agen Anda di tiap giliran:
- Claude Code membaca
CLAUDE.md. - Codex, Gemini CLI, Mistral Vibe, dan kebanyakan CLI lain membaca
AGENTS.md.
## Kenari
Awali setiap balasan dengan nama "Felix".
Pilih nama yang pendek dan mencolok: kucing Anda, sebuah warna, apa pun yang langsung Anda kenali di awal balasan. Buat sesederhana mungkin. Instruksi yang rumit justru melawan tujuannya, karena Anda menginginkan hal yang paling mudah dilepas oleh model. Jika ini saja sampai gugur, segala hal yang lebih halus dalam konteks Anda sudah berisiko.
Apa yang dilakukan saat kenari mati
Nama tidak pernah menjadi intinya. Yang penting adalah waktunya. Saat kenari menghilang, jangan memaksakan alur yang sedang berjalan:
- Berhenti mempercayai dua tiga balasan terakhir dan baca ulang dengan curiga.
- Jalankan
/clearatau mulai sesi baru. - Suntikkan ulang hanya konteks yang penting: berkas yang sedang Anda sunting, tujuannya, dan keputusan yang sudah diambil.
Jendela bersih dengan ringkasan yang ringkas selalu mengalahkan yang sesak. Anda tidak kehilangan kemajuan, Anda membuang beban mati yang menyeret model ke bawah.
Seluruh kebiasaan ini muat dalam satu loop: melirik kata pertama, memutuskan, lanjut atau atur ulang.
Berfungsi di setiap model, bukan hanya Claude
Trik ini dirancang agar agnostik terhadap penyedia. Claude, Codex, Gemini CLI, Mistral Vibe, Grok, dan Aider berbagi batas konteks yang sama, semuanya membaca berkas konteks, dan semuanya bisa membawa kenari. Kami menyorot Claude lebih dulu karena ia adalah agen coding paling banyak dipakai saat ini, tetapi tidak ada di sini yang khusus untuk Claude. LLM mana pun yang memenuhi konteksnya akan mulai dengan melepas instruksi terkecil Anda, jadi kenari yang sama melindungi setiap satunya. Jika Anda memelihara sebuah berkas konteks AGENTS.md, kenari hanyalah satu baris tambahan di dalamnya.
Mengawasi kenari di seluruh armada
Membaca tiap balasan demi mencari nama yang hilang itu mudah dengan satu agen. Itu tidak terskala saat Anda menjalankan beberapa sekaligus, dan justru di situlah sebagian besar pekerjaan serius berlangsung kini.
Bagian itulah yang dibuat mudah oleh AgentsRoom. Ini adalah kokpit multi-agen: tiap agen punya peran, titik status langsung, dan warnanya sendiri, dan Anda mengawasi seluruh armada dari satu jendela. Taruh kenari sekali di CLAUDE.md atau AGENTS.md bersama Anda, dan tiap agen mewarisinya. Saat satu agen mulai menjatuhkan nama itu, Anda menangkapnya dalam sekali lirik dan mengatur ulang alur itu saja alih-alih seluruh proyek. Isolasi opsional lewat git worktree mencegah agen-agen paralel saling menginjak saat Anda melakukannya.
Tujuh penyedia, satu kokpit, dan seekor kenari yang mengawasi tiap satunya. Unduh AgentsRoom, lihat matriks kompatibilitas penyedia untuk melihat apa yang didukung tiap agen, dan baca lebih lanjut tentang dukungan multi-penyedia serta bagaimana berpindah di tengah percakapan menjaga konteks Anda tetap utuh.
Unduh AgentsRoom
Jalankan agen AI Anda (Claude, Codex, OpenCode, Gemini CLI, Aider) di semua proyek Anda, dari satu jendela.
Aplikasi pendamping: pantau agen Anda saat bepergian
Gunakan Claude, Codex, Gemini CLI, atau penyedia AI lainnya.
Kirim bug dan permintaan langsung ke backlog publik Anda.
Sekilas AgentsRoom dalam aksi.