AI Agent Loop: Cara Agen Coding yang Mengoreksi Diri Sendiri Menuntaskan Pekerjaan

AI agent loop mengubah prompt-lalu-perbaiki menjadi siklus yang mengoreksi diri sendiri: agen menulis rencana, membangunnya, mereview hasil kerjanya sendiri terhadap rencana, dan terus berputar sampai selesai. Begini cara loop bekerja di Claude Code, Codex, Gemini CLI, Cursor, dan Ralph loop.

21 Juni 2026

Cara kebanyakan orang masih memakai agen coding AI terlihat seperti main pingpong. Kamu nge-prompt, dia menjawab, kamu sadar ada yang salah, kamu nge-prompt lagi. Kamu yang jadi mesin koreksinya, dan kamu duduk di dalam loop di setiap giliran.

Sebuah loop membalik semua itu. Kamu jelaskan apa yang kamu mau, agen mulai bekerja, menulis checklist-nya sendiri, menemukan titik lemahnya sendiri, lalu berjalan lagi sampai hasilnya benar-benar solid. Kamu berhenti jadi orang yang menangkap kesalahan. Agennya yang menangkap kesalahannya sendiri.

Pergeseran ini bukan sekadar hype. Orang-orang yang membangun tool ini sendiri mengandalkannya. Boris Cherny dan Cat Wu, pembuat Claude Code, bicara soal coding di dalam agent loop. Geoffrey Huntley, yang menamai "Ralph loop", menjalankan agen dalam loop while polos sepanjang malam. Pola ini sudah punya nama sekarang, dan layak dipahami sebelum kamu menyalin tiga prompt dari Instagram.

Dari pingpong prompt ke sebuah loop

Satu prompt tunggal itu sekali tembak. Kamu bertanya, kamu dapat jawaban, transaksi selesai. Untuk memperbaikinya, kamu harus menyadari celahnya lalu nge-prompt lagi. Skalakan itu ke fitur sungguhan dan kamu sedang melakukan puluhan mikro-koreksi dengan tangan sendiri.

AI agent loop menutup celah itu di dalam agennya. Kamu pasang sebuah tujuan, agen merencanakan, bertindak, melihat hasilnya, dan mengoreksi, berulang-ulang, sampai tujuannya tercapai. Kamu tidak hilang, kamu tetap mereview di akhir. Tapi kamu bukan lagi penyumbat aliran di setiap iterasi.

Perbandingan berdampingan: di kiri, pingpong prompt di mana kamu nge-prompt, agen menjawab, kamu mengoreksi, lalu kamu ulangi dengan tangan sendiri sehingga kamu jadi penyumbat aliran di setiap giliran. Di kanan, sebuah loop, di mana kamu pasang tujuan sekali saja dan agen merencanakan, membangun, dan mereview dirinya sendiri, mengoreksi diri sampai selesai, jadi kamu hanya turun tangan di akhir.

Pingpong prompt menaruh kamu di dalam loop di setiap giliran. Loop sungguhan menaruh agennya di sana.

Apa itu AI agent loop sebenarnya

Setiap loop agentik berjalan pada empat ketukan yang sama: merencanakan, bertindak, mengamati, mengoreksi. Agen menentukan langkah berikutnya, melakukannya (menulis kode, menjalankan perintah, membaca file), membaca apa yang terjadi, lalu menyesuaikan. Claude menulis kode, menjalankan test, melihat kegagalan, memperbaikinya, menjalankan test lagi. Umpan balik itulah seluruh triknya. Itulah yang membuat loop mengoreksi diri sendiri, bukan sekadar berulang.

Versi loop yang paling kuat membagi ketukan-ketukan itu ke tiga peran: satu yang merencanakan, satu yang membangun, satu yang mereview. Memisahkan ketiganya itulah yang mencegah agen menilai tugasnya sendiri dalam satu tarikan napas saat dia menuliskannya.

Loop tiga perintah yang bisa kamu salin hari ini

Ini setup yang lagi beredar sekarang, dibangun ulang jadi tiga slash command Claude Code. Tempel masing-masing sekali, agen membuat perintahnya, lalu kamu jalankan secara berurutan.

Si perencana, /spec:

Wawancarai aku satu pertanyaan setiap kali sampai kamu benar-benar paham apa yang aku mau.
Lalu tulis rencana yang presisi ke specs/project.md: tujuannya, kebutuhan
yang tepat, kasus tepi, serta apa yang masuk lingkup dan apa yang di luar lingkup.
Buat singkat dan tajam, bukan sebuah novel.

Si pembangun, /build:

Baca specs/project.md dan bangun persis apa yang dijelaskan di sana, tidak lebih.
Saat selesai, daftarkan setiap kebutuhan dari rencana dan tandai mana saja
yang sudah kamu penuhi.

Si reviewer, /review:

Bandingkan apa yang sudah dibangun dengan specs/project.md, kebutuhan demi kebutuhan.
Untuk masing-masing, sebutkan apakah sudah terpenuhi. Tulis koreksi yang dibutuhkan lalu
serahkan kembali ke /build. Setujui hanya saat seluruh rencana sudah terpenuhi.

Tiga perintah, satu loop: spec menulis rencananya, build mengimplementasikannya, review mengeceknya terhadap rencana dan mengirim koreksi balik ke build. Ia terus berputar sampai setiap kebutuhan terpenuhi.

Loop agen yang mengoreksi diri sendiri: perintah spec menulis rencana, perintah build mengimplementasikannya, perintah review mengecek hasilnya terhadap rencana poin demi poin, mengirim koreksi balik ke build, dan baru merilis ketika seluruh rencana sudah terpenuhi.

Rencana adalah sumber kebenaran. Review mengukur hasil bangunan terhadapnya, bukan terhadap perasaan.

Ini sebenarnya spec-driven coding di baliknya: spec tertulislah, bukan riwayat chat, yang dijadikan patokan agen. Spec Kit open-source dari GitHub memformalkan ide yang sama dengan /specify, /plan, /tasks, dan /implement, dan berjalan di Claude Code, Copilot, Cursor, Codex CLI, maupun Gemini CLI.

Kenapa konteks segar membuat loop bekerja: Ralph loop

Geoffrey Huntley menamai versi paling polos dari semua ini di pertengahan 2025: Ralph loop. Idenya adalah loop shell polos yang menyuapkan prompt yang sama ke agen terhadap sebuah spec tertulis, membiarkannya memilih satu tugas dan menuntaskannya, lalu memulai agen yang benar-benar baru dengan konteks bersih dan menyuapkan prompt identik itu lagi.

while masih_ada_todo; do
  agent --prompt "Kerjakan tugas berikutnya dari todo.md" --non-interactive
done

Bagian yang tidak kentara adalah reset konteksnya. Sesi panjang membusuk: jendela penuh dengan penalaran lama, jalan buntu, dan isi file yang basi, lalu model diam-diam mulai menjatuhkan instruksi. Setiap iterasi Ralph adalah agen baru yang membaca repo dan daftar todo terkini dari disk, mengerjakan satu unit pekerjaan, commit, lalu keluar dengan bersih. Huntley menamainya dari karakter Simpsons dengan sengaja: kelihatannya terlalu bodoh untuk berhasil, tapi berhasil. Kalau kamu pernah melihat sesi panjang mulai berhalusinasi, kamu sudah tahu kenapa jendela segar mengalahkan jendela yang penuh sesak.

/loop dan /goal milik Claude Code

Claude Code membawa primitif loop secara langsung. /goal memasang kondisi akhir yang persisten, seperti apa "selesai" itu, dan Claude mengevaluasi kemajuannya terhadap itu setelah setiap putaran alih-alih sekadar menjalankan langkah berikutnya. /loop mengulang sebuah tugas pada irama tertentu atau sampai sebuah kondisi terpenuhi, dengan bentuk seperti /loop every 10m atau /loop until: <condition>. Dipakai bersama, keduanya membentuk loop yang mengarahkan dan menghentikan dirinya sendiri: Claude menggarap selisih antara kondisi saat ini dan tujuan, lalu berhenti saat tujuannya tercapai atau kamu menekan Ctrl+C.

Detail yang penting: sebuah loop menjaga kontinuitas. Ia ingat apa yang sudah dicoba dan kenapa gagal, jadi setiap putaran membangun di atas yang sebelumnya alih-alih mengulang jalan buntu yang sama. Itu kebalikan dari trade-off reset konteks bersih ala Ralph, dan keduanya valid. Kontinuitas untuk koreksi diri yang rapat, konteks segar saat jendela mulai membusuk. Tahu mana yang harus dipakai, itulah keahlian yang sebenarnya.

Loop yang sama, di setiap provider

Loop bukan fitur Claude, ini arah ke mana seluruh bidang ini menuju. Namanya berbeda, bentuknya tidak.

Tool	Mekanisme loop	Cara ia mengoreksi diri
Claude Code	`/goal` + `/loop`	Tujuan persisten, mengevaluasi selisih tiap putaran, berhenti saat tercapai
Codex CLI	`/goal`	"Versi Ralph loop" milik OpenAI: menjaga tujuan tetap hidup lintas giliran sampai tercapai
Gemini CLI	plan-act-observe agentik	Merencanakan, mengedit, menjalankan cek, mengoreksi diri tanpa persetujuan per langkah
Cursor	mode agen	Merencanakan langkah, mengedit file, menjalankan compiler, memperbaiki apa yang ia rusak
Spec Kit (agen mana pun)	`/specify` `/plan` `/tasks` `/implement`	Spec adalah sumber kebenaran sepanjang loop
Ralph / autoloop	loop shell `while`	Agen segar tiap iterasi terhadap sebuah spec tertulis

Codex CLI membawa loop ini paling jauh di ruang publik. Tim OpenAI membingkai /goal miliknya sebagai versi Ralph loop mereka, dan Andrew Chen dari a16z membiarkannya berjalan sepanjang malam untuk sebuah device driver selama 14 jam nonstop tanpa intervensi. Ia juga mencatat bahwa itu akan "10.000x pemakaian token", yang merupakan biaya jujur dari membiarkan agen menggiling selama setengah hari.

Jebakannya: sebuah loop memperkuat segalanya

Sebuah loop tidak hanya memperkuat output yang bagus, ia juga memperkuat rencana yang buruk. Arahkan agen yang mengoreksi diri ke spec yang kabur dan dia akan membangun hal yang salah dengan percaya diri, mereviewnya terhadap spec kabur yang sama, lalu menyetujuinya. Rencana itulah tuasnya. Spec yang tajam menghemat sepuluh prompt, spec yang buram menyia-nyiakan seratus.

Ada dua mode gagal yang perlu diwaspadai. Biaya membengkak liar: setiap iterasi membakar token, dan loop tanpa batas pada tujuan yang tidak jelas bisa membakar banyak sekali. Dan loop bisa berputar selamanya, mengaku menang atau mengejar target yang tidak akan pernah bisa ia penuhi. Beri batas: kondisi until yang jelas, plafon token, atau checkpoint manusia sebelum merge. Loop tanpa titik henti bukanlah otonomi, itu lepas kendali.

Menjalankan loop di seluruh armada

Satu agen yang mengoreksi diri itu mudah diasuh. Daya ungkitnya muncul ketika kamu menjalankan beberapa sekaligus, masing-masing berputar pada tugasnya sendiri, dan di situlah persisnya menatap satu terminal berhenti bisa diskalakan.

Untuk itulah AgentsRoom dibangun. Ini kokpit multi-agen: setiap agen punya peran, titik status langsung, dan warnanya sendiri, dan kamu mengawasi seluruh armada dari satu jendela. Lempar sebuah tiket ke backlog dan seorang agen mengambilnya, menjalankan loop plan-build-review-nya, lalu menyerahkan diff yang bersih. Itulah spec-driven AI coding dalam praktik: tiketnya adalah spec, agen menjalankan loop, kamu mereview hasilnya.

Karena loop panjang membusukkan konteks, AgentsRoom mengawasinya. Setiap agen menulis status satu baris di akhir setiap giliran, dan ketika seorang agen berhenti memperbaruinya dua giliran berturut-turut, sebuah peringatan muncul dengan restart satu klik pada konteks bersih, reset jendela segar yang sama persis dengan yang diandalkan Ralph loop. Baca cara kerjanya di halaman deteksi context drift.

Dan karena loop ini provider-agnostic, kamu tidak terkunci pada satu provider. Jalankan satu tiket di Claude Code, berikutnya di Codex, yang lain di Gemini CLI, semuanya di dashboard yang sama, masing-masing berputar di git worktree-nya sendiri agar agen paralel tidak pernah saling bertabrakan. Lepas mereka sebelum kamu log off, lalu review diff-nya di pagi hari, itulah inti dari agen coding latar belakang dan shift malam.

Pasang tujuan sekali, biarkan loop menuntaskannya, review di akhir. Unduh AgentsRoom, cek matriks kompatibilitas provider, dan baca lebih lanjut soal review per agen dan dukungan multi-provider.