Agent delegasyonu: dev'den QA'ya: testte daha ucuz model

Agent delegasyonu:
dev agent'ınız testi devreder

Agent delegasyonu, dev agent'ınızın bir özelliği bitirip doğrulamayı ayrı bir QA agent'ına devretmesine olanak tanır. Dev, zor problemlerde güvendiğiniz modelle kod yazmaya devam eder. QA agent'ı testi daha ucuz bir modelde çalıştırır. İkisi de AgentsRoom MCP sunucuları üzerinden konuşur, böylece agent delegasyonu uçtan uca çalışır ve hiçbir şeyi elle kopyalamanıza gerek kalmaz.

Browser tıklamaları için Opus fiyatı ödemeyi bırakırsınız. Dev agent'ınızın bağlamını ekran görüntüleri ve DOM dump'larıyla şişirmeyi bırakırsınız. Agent delegasyonu her görevi doğru fiyatta doğru modele yönlendirir ve QA agent'ı bitirince dev agent'a haber verir, böylece döngü kendiliğinden kapanır.

Agent delegasyonu iş başında: Codex dev agent'ı özelliği bitirir, run_qa_test çağırır, QA agent'ı daha ucuz bir modelde browser'ı açar ve sonucu raporlar.

Agent delegasyonunun çözdüğü problem şudur. Güçlü bir dev agent (Claude Opus, Codex, bir API tasarlayan veya bir store'u refaktör eden tür bir model) çalıştırıyorsunuz. Agent 10 dakikada özelliği teslim ediyor. Sonra özelliğin çalıştığını doğrulamak için 8 dakika boyunca bir browser'da tıklayıp duruyor. Aynı pahalı token oranı. Az önce domain mantığınızı düşünen aynı model, şimdi buton etiketlerini okuyor.

Agent delegasyonu bunu düzeltir. Özellik bittiğinde dev agent tek bir MCP aracını, run_qa_test'i, bir senaryoyla çağırır. AgentsRoom QA için seçtiğiniz modelde geçici bir QA agent spawn eder: Claude Haiku, Codex mini, GPT-4 mini, ne istersen. QA agent AgentsRoom Browser MCP'yi alır, sayfayı sürer, sonucu doğrular ve bir kararla yanıt verir. Dev agent kararı okur ve yoluna devam eder.

İşte bu agent delegasyonudur ve sayfanın kapsadığı tek döngü budur. Bir dev, bir QA, bir MCP. Bir kıdemli mühendisin regresyon testlerini bir junior'a veya QA'ya devretmesiyle aynı fikir: kıdemli tasarlamaya devam eder, junior kontrol listesini geçer. Agent delegasyonu modeller arasında size tam olarak bu ayrımı verir.

AgentsRoom'da agent delegasyonu: Codex dev agent'ı görevini bitirdi ve altına bir QA agent'ı delege edildi, agent listesinde dev'den QA'ya devretmeyi gösteren 'Codex agent için QA' etiketiyle

Agent delegasyonu görselleştirildi: ebeveyn dev agent (Codex) ve çocuk QA agent (Claude) aynı agent listesinde görünüyor, net bir dev'den QA'ya devretme ile.

Agent delegasyonunu bağlamaya neden değer

Birincisi, para. Claude Opus üzerinde bir test geçişi ile Claude Haiku üzerinde bir test geçişi kıyas kabul etmeyecek kadar farklı tutarlara mal olur. Aynı browser, aynı assert'ler, aynı ekran görüntüleri. Agent delegasyonu ucuz işi ucuz modele yaptırır. Bunu açan kişiler, yoğun QA günlerinde token faturalarının yüzde 5 veya 10 değil, gerçek ve ölçülebilir bir kat oranında düştüğünü raporluyor.

İkincisi, bağlam. Bir dev agent testi kendisi çalıştırdığında, her ekran görüntüsü, her DOM dump'ı, her konsol log'u dev agent'ın bağlam penceresinde sonlanır. Yirmi dakikalık tıklama, dev agent'ın oturumun geri kalanında taşıması gereken megabaytlarca gürültüdür. Agent delegasyonu bu gürültüyü geçici QA agent içinde izole eder. Dev agent'a yalnızca temiz bir 'pass' veya 'fail' mesajı döner, başka bir şey değil.

Üçüncüsü, ekolojik açı. Her agent delegasyonu gerçek bir hesaplama tasarrufu sağlar. Opus'un çalıştığı yerde Haiku çalıştırmak o adımdaki enerji ayak izini yarıya indirir. Ekipteki herkesle ve bir yıldaki her test döngüsüyle çarpın, agent delegasyonu stack'inizin karbon tarafında önemsiz olmayan bir kola dönüşür.

Dördüncüsü, güvenilirlik. Browser'ı kendi süren bir dev agent başıboş kalmaya meyillidir. İki ekran görüntüsünden sonra ne doğrulamaya çalıştığını unutur. Agent delegasyonundaki QA agent'ın tek bir işi ve tek bir prompt'u vardır. Test eder, raporlar, ölür. Döngü kısa, öngörülebilir ve debug'lanması kolaydır.

Agent delegasyonunun burada kapsadığı tek akış

Bir dev agent. Bir QA agent. Bir MCP çağrısı. Uçtan uca agent delegasyonu.

01

Dev agent özelliği teslim eder

Dev agent'ınız (Claude Opus, Codex high reasoning, güvendiğiniz hangi pahalı model olursa olsun) uygulamayı bitirir. Yeni endpoint, yeni ekran, yeni akış. Kod yazılır, dosyalar kaydedilir.

02

Dev agent run_qa_test çağırır

Browser'ı kendisi açmak yerine, dev agent AgentsRoom Test Runner sunucusundan tek bir MCP aracını çağırır: run_qa_test, düz İngilizce bir senaryoyla. Agent delegasyonunun tüm API yüzeyi budur.

03

AgentsRoom QA agent'ını spawn eder

AgentsRoom Test Runner, yapılandırdığınız daha ucuz modelde (Claude Haiku, Codex mini, GPT-4 mini) geçici bir QA agent spawn eder. QA agent AgentsRoom Browser MCP araçlarını alır: navigate, click, type, screenshot, evaluate, get_logs, get_state.

04

QA agent testi çalıştırır

QA agent sayfayı açar, senaryoyu yürür, sonucu doğrular, gerekirse ekran görüntüsü alır ve bir dev agent'ın kaçıracağı çalışma zamanı hatalarını yakalamak için konsol log'larını okur.

05

QA agent kararı gönderir

İşi bitince QA agent submit_verdict'i pass, fail veya inconclusive bir sonuçla ve kısa bir özetle çağırır. Ekran görüntüleri ve log'lar eklenir. QA agent süreci yok edilir. Bağlam penceresi de onunla birlikte gider.

06

Dev agent kararı okur ve yoluna devam eder

Dev agent kararı run_qa_test'in yanıtı olarak geri alır. Pass'te dev agent commit'ler veya bir sonraki ticket'a geçer. Fail'de dev agent başarısızlık özetini okur, bug'ı düzeltir ve yeni bir agent delegasyonu döngüsünü tetikler. Döngü kendi kendine kapanır.

Agent delegasyonunun ekonomisi

Akıllı bir dev ile QA ayrımının standartlarınızı düşürmeden AI faturanızı neden düşürdüğü.

Browser testleri tekrarlayıcıdır. Sayfayı aç, butona tıkla, etiketi oku, toast'u kontrol et. Milyon token başına 50 dolarlık bir model bu işi milyon token başına 3 dolarlık bir model kadar iyi yapar. Belki daha iyi yapar, çünkü ucuz model sıkılmaz. Agent delegasyonu işin sıkıcı yarısına ucuz modeli oturtur.

Gerçek oturumlardan gerçek sayılar: karmaşık bir akışın tipik bir uçtan uca testi, ekran görüntüleri, DOM dump'ları ve akıl yürütme adımları arasında 60 ile 200 bin token yakar. Opus'ta bu test başına gerçek paradır. Haiku'da bu bozukluktur. Agent delegasyonu günlük bir QA alışkanlığını bir bütçe kaygısından bedava bir refleks haline getirir.

Her döngüyle çarpın. Önemsiz olmayan bir özellik üzerinde normal bir geliştirme günü testi beş ile yirmi kez çalıştırır. Agent delegasyonu bu tekrarlarda birikir. Dev agent pahalı kalır (pahalı olmasını istiyorsunuz), QA agent ucuz kalır ve aradaki fark saf tasarruftur.

Agent delegasyonu gezegen için de daha nazik. Aynı işte daha az hesaplama, daha az enerji, datacenter'da daha az su, daha az karbon demektir. Agent delegasyonunu bağlamak için tek sebep değil, ama görevleri doğru büyüklükteki modellere yönlendirmenin dürüst bir yan etkisi.

Agent delegasyonu için gerçek bir model ayrımı

İnsanların agent delegasyonunun dev tarafına ve QA tarafına gerçekten ne bağladığı.

Dev tarafı (kasten pahalı tutuluyor)

  • Claude Opus 4.7
  • Claude Sonnet 4.6
  • Codex high reasoning
  • GPT-4 with deep reasoning
  • Gemini 2.5 Pro

QA tarafı (daha ucuza devredildi)

  • Claude Haiku 4
  • Claude Sonnet 4 (low effort)
  • Codex mini
  • GPT-4 mini
  • Gemini 2.5 Flash

Agent delegasyonu matrisi kilitlemez. QA modelini proje başına yapılandırırsınız. Hatta tamamen farklı bir sağlayıcıya agent delegasyonu yapabilirsiniz: dev'de Opus, QA'da Codex mini, ortak bağlam yok, sadece bir MCP çağrısı.

Agent delegasyonunun kaputun altında gerçekten yaptığı

Agent delegasyonu AgentsRoom MCP stack'inin üzerine oturur. Dev agent kendi CLI'sinin (Claude Code, Codex, Gemini, OpenCode, Aider) içinde çalışır. AgentsRoom bu agent'a Test Runner MCP sunucusunu enjekte eder. Test Runner tek bir araç açar: run_qa_test. Her agent delegasyonu çağrısının giriş noktası budur.

run_qa_test ateşlendiğinde AgentsRoom aynı projede farklı bir yapılandırmayla yeni bir CLI süreci spawn eder. O yapılandırmada Browser MCP eklidir, QA system prompt'u eklidir ve model QA tarafında ayarladığınız her ne ise ona değiştirilmiştir. Yeni süreç geçici bir QA agent'ıdır: test süresince yaşar ve submit_verdict'ten sonra ölür.

QA agent çalışırken dev agent run_qa_test çağrısında duraklatılmıştır. AgentsRoom QA agent'ı aynı agent listesinde, dev agent'ın altında girintili olarak gösterir (yukarıdaki görselde görülebilir). QA agent bittiğinde kararı run_qa_test sonucu olarak döner ve dev agent devam eder. Dev agent'ın bakış açısından agent delegasyonu tek bir MCP gidiş-dönüşüdür.

Dev agent browser araçlarını asla almaz. AgentsRoom spawn anında dev agent'ın izinli listesinden browser_* araçlarını çıkarır. Agent delegasyonunu güvenilir kılan kısım budur: dev agent içgüdüsel olarak bir ekran görüntüsü almak istese bile, testi kendisi yapmaya geri dönemez. İleri tek yol run_qa_test'tir. Agent delegasyonu istekle değil, çıkarmayla.

Agent delegasyonu bugün nerede çalışıyor ve sırada ne var

AgentsRoom'da agent delegasyonu bugün browser-first. Aynı şekil, daha fazla yüzey yolda.

Bugün: browser test delegasyonu

QA agent, AgentsRoom'un yerleşik browser'ını Browser MCP üzerinden sürer. Localhost dev sunucusu, herkese açık preview tüneli, staging URL, Chromium'un render edebildiği her şey. Formlar, modallar, drag and drop, dialog'lar, konsol log'ları, ağ hataları. Agent delegasyonu bir web QA mühendisinin kapsayacağı tüm yüzeyi kapsar.

Electron uygulaması test delegasyonu

Eğer kendi bir Electron uygulaması yayınlıyorsanız, AgentsRoom Electron MCP kütüphanesini projenize kurabilirsiniz. QA agent bir Chromium sekmesine bağlandığı şekilde Electron uygulamanıza bağlanır. Agent delegasyonu dev tarafında hiçbir şeyi değiştirmeden masaüstü uygulama testine geçer.

React Native uygulaması test delegasyonu (roadmap)

Aynı agent delegasyonu şekli React Native'e geliyor. QA agent bir iOS veya Android simülatörünü AgentsRoom React Native MCP üzerinden sürecek. Dev agent bir ekran teslim eder, QA agent ona tıklar. Aynı run_qa_test çağrısı, aynı dev'den QA'ya devretme, mobil hedef.

Agent delegasyonu olmadan vs agent delegasyonu ile

Aynı özellik, aynı QA geçişi. Farklı fatura, farklı bağlam, farklı güvenilirlik.

Agent delegasyonu olmadan

  • : Dev agent (pahalı) browser'ı kendisi açar.
  • : Her ekran görüntüsü, her DOM dump'ı ve her konsol log'u dev agent'ın bağlamına iner.
  • : 20 dakikalık tıklama, daha ucuz bir modelin yapacağı işte Opus token'ları yakar.
  • : Dev agent iki ekran görüntüsü sonra ne yaptığını unutur.
  • : Browser tıklamaları için tam fiyat ödersiniz, gezegen de tam fiyat öder.

Agent delegasyonu ile

  • : Dev agent run_qa_test çağırır ve bekler.
  • : Ucuz bir QA agent tıklamaları, assert'leri, ekran görüntüsü yakalamayı yapar.
  • : Dev agent'a yalnızca karar (pass, fail, özet) ulaşır.
  • : QA agent geçicidir: submit_verdict'ten sonra ölür, bağlam şişmesi olmaz.
  • : Token faturası düşer, dev agent odaklı kalır, döngü kendiliğinden kapanır.

Agent delegasyonu, bir kodlama agent kurulumuna bağlayabileceğiniz en ucuz güvenilirlik kazanımıdır.

Bir agent delegasyonu çağrısı nasıl görünür

İşte bir dev'den QA'ya agent delegasyonunun tüm şekli. Dev agent bunu Test Runner MCP üzerinden ateşler ve yanıtı bekler.

MCP araç çağrısı (dev agent)

run_qa_test({
  scenario: "Open http://localhost:3000/login.\n  Type the seeded test user in the email field.\n  Submit the form.\n  Assert the dashboard URL is reached and the user's name is shown in the header.\n  Capture a screenshot on success, capture console logs on failure."
})
Local-first agent delegasyonu
Agent delegasyonu tamamen sizin makinenizde çalışır. Dev agent, QA agent, MCP köprüsü, browser: hepsi loopback. Testle ilgili hiçbir şey üçüncü taraf bir buluta gönderilmez.
Sağlayıcılar arası agent delegasyonu
Agent delegasyonu sağlayıcılar arasında çalışır. Dev'de Codex, QA'da Claude Haiku. Dev'de Opus, QA'da GPT-4 mini. Agent delegasyonu bir protokol meselesidir, bir vendor meselesi değil.
Döngüde insan
Agent delegasyonu sizi dışarıda bırakmaz. QA kararını okuyabilir, QA agent'ı canlı izleyebilir, durdurabilir veya tekrar oynatabilirsiniz. Agent delegasyonu kaldıraçtır, otopilot değil.

FAQ

AgentsRoom'da agent delegasyonu nedir?

Agent delegasyonu, iki AI kodlama agent'ı arasında bir dev'den QA'ya devretmedir. Dev agent bir özelliği bitirir, tek bir MCP aracı (run_qa_test) çağırır ve geçici bir QA agent testi farklı bir modelde çalıştırır. Dev agent kararı okur ve yoluna devam eder. Tüm agent delegasyonu akışı AgentsRoom MCP sunucuları üzerinden gerçekleşir.

Neden hiç agent delegasyonu isteyeyim?

Üç sebep. Para: QA agent daha ucuz bir modelde çalışır, dolayısıyla test geçişleri dev modelde olacağın bir kesri kadar maliyete sahiptir. Bağlam: dev agent temiz kalır, tüm ekran görüntüleri ve DOM dump'ları QA agent ile birlikte ölür. Güvenilirlik: QA agent tek bir işe sahiptir, dolayısıyla browser tıklamaları arasında çok görev yapan bir dev agent'tan daha iyi test eder.

Agent delegasyonu için hangi modeller çalışır?

AgentsRoom'un desteklediği herhangi bir model: Claude (Opus, Sonnet, Haiku), Codex (high, mini), Gemini (Pro, Flash), OpenCode, Aider. Agent delegasyonu sağlayıcılar arasıdır. Yaygın bir ayrım dev tarafında Claude Opus veya Codex ve QA tarafında Claude Haiku veya Codex mini'dir, ama siz seçersiniz.

Agent delegasyonu sadece browser testleri için mi?

Bugün evet, QA agent AgentsRoom'un yerleşik Chromium browser'ını sürer. Yarın aynı agent delegasyonu şekli Electron uygulamalarını (AgentsRoom Electron MCP kütüphanesini Electron projenize kurarak) ve React Native uygulamalarını (roadmap, iOS ve Android simülatörleri) kapsayacak.

Agent delegasyonu dev agent'ın testi kendi yapmasını nasıl önler?

AgentsRoom spawn anında dev agent'tan browser_* araçlarını çıkarır. Dev agent kelimenin tam anlamıyla browser_navigate veya browser_screenshot çağıramaz. Tek browser yolu run_qa_test'tir ve agent delegasyonunu ateşler. Kısıtlama mekaniktir, bir prompt'ta nazik bir istek değil.

Agent delegasyonu bulut mu yoksa yerel mi?

Local-first. Dev agent, geçici QA agent, MCP köprüsü ve browser hepsi makinenizde çalışır. Agent delegasyonu yalnızca altta yatan model (Claude, Codex, Gemini) kendi sağlayıcısıyla konuştuğunda bulut kullanır, tıpkı normal bir agent çalışması gibi.

Agent delegasyonu gerçek para tasarrufu sağlar mı?

Evet, QA yoğun günler için anlamlı bir oranda. Opus veya Codex high'da karmaşık bir uçtan uca test ile Haiku veya Codex mini'de aynı test kabaca 10 kat maliyet farkıdır. Ekip genelinde bir geliştirme günü boyunca agent delegasyonu bu farkı hızla ölçeklendirir.

Dev agent agent delegasyonundan ne geri alır?

Kısa yapılandırılmış bir karar: pass, fail veya inconclusive, bir özetle, isteğe bağlı ekran görüntüsü yolu ve isteğe bağlı konsol log'larıyla. Bağlamda ham ekran görüntüleri yok, DOM dump'ları yok. Agent delegasyonunun tüm amacı budur: QA gürültüsünü QA agent içinde izole etmek.

QA agent başarısız olduğunda bir backlog ticket'ı açabilir mi?

Evet. Agent delegasyonu QA agent'a Backlog MCP'yi verir. Bir başarısızlık projede bir backlog ticket'ı olarak inebilir, senaryo, ekran görüntüsü ve konsol log'ları ekli. Dev agent kararı okur, backlog ticket'ı uzun form detayları taşır.

Agent delegasyonu diğer AgentsRoom özelliklerine göre nereye oturuyor?

Agent delegasyonu Browser Automation (QA agent'a browser'ı veren) ve AgentsRoom MCP sunucularının (her agent'a araç yüzeyini veren) üzerinde yaşar. Agent Teams daha geniş çok agent'lı workflow editörüdür: agent delegasyonu o workflow'un dev'den QA'ya çeşididir, ama tek bir MCP çağrısı olarak açıldığı için herhangi bir sağlayıcıdaki herhangi bir agent bir grafik yapılandırmadan onu kullanabilir.

Şununla iyi gider

QA tıklamaları için Opus fiyatı ödemeyi bırakın

AgentsRoom'u indirin ve agent delegasyonunu deneyin. Dev agent'ınızı güvendiğiniz modele, QA agent'ınızı daha ucuz bir modele bağlayın ve dev'den QA'ya devretmenin MCP üzerinden kendiliğinden olmasına izin verin.

ÜcretsizAgentsRoom'u Indir

Yardımcı uygulama: hareket halindeyken ajanlarinizi izleyin

Claude, Codex, Gemini CLI veya başka bir AI sağlayıcı kullan.

Uzantıyı yükleyin
Chrome Web Store

Hataları ve istekleri doğrudan genel backlogunuza gönderin.

Çoklu proje
Çoklu sağlayıcı
Çoklu ajan
Canlı durum
Diff ve commit
Mobil uygulama
Canlı önizleme
Ajan ekipleri
Tarayıcı otomasyonu
Backlog odaklı dev
Prompt kütüphanesi
Beceri kütüphanesi