Delega di agente : dev verso QA : modello più economico sul test

Delega di agente :
il tuo agente dev delega il test

La delega di agente permette al tuo agente dev di finire una feature e affidare la validazione a un agente QA separato. Il dev continua a consegnare codice con il modello su cui fai affidamento per i problemi difficili. L'agente QA esegue il test su un modello più economico. Entrambi parlano attraverso i server MCP di AgentsRoom, così la delega di agente funziona dall'inizio alla fine senza che tu debba copiare nulla in giro.

Smetti di pagare prezzi Opus per i click nel browser. Smetti di gonfiare il contesto del tuo agente dev con screenshot e dump del DOM. La delega di agente instrada ogni compito al modello giusto al prezzo giusto, e quando l'agente QA ha finito, fa ping all'agente dev così il loop si chiude da solo.

Scarica AgentsRoom Vedi come funziona la delega di agente

Delega di agente in azione : l'agente dev Codex finisce la feature, chiama run_qa_test, l'agente QA apre il browser su un modello più economico e riporta il risultato.

Ecco il problema che la delega di agente risolve. Fai girare un agente dev forte (Claude Opus, Codex, il tipo di modello che progetta un'API o rifattorizza uno store). L'agente consegna la feature in 10 minuti. Poi spende i successivi 8 minuti a cliccare in un browser per verificare che la feature funzioni. Stessa tariffa costosa per token. Stesso modello che stava ragionando duramente sulla logica di dominio, ora a leggere etichette di bottoni.

La delega di agente risolve questo. Quando la feature è pronta, l'agente dev chiama un singolo strumento MCP, run_qa_test, con uno scenario. AgentsRoom genera un agente QA effimero sul modello che hai scelto per il QA : Claude Haiku, Codex mini, GPT-4 mini, quello che vuoi. L'agente QA riceve l'AgentsRoom Browser MCP, guida la pagina, verifica il risultato e risponde con un verdetto. L'agente dev legge il verdetto e va avanti.

Questa è la delega di agente, e questo è l'unico loop che la pagina copre. Un dev, un QA, un MCP. Stessa idea di un ingegnere senior che delega il test di regressione a un junior o al QA : il senior continua a progettare, il junior esegue la checklist. La delega di agente ti dà la stessa divisione tra modelli.

Delega di agente in AgentsRoom : l'agente dev Codex ha finito il suo task e un agente QA è stato delegato sotto, con un'etichetta 'QA for Codex agent' che mostra l'handoff da dev a QA nella lista degli agenti

Delega di agente visualizzata : l'agente dev padre (Codex) e l'agente QA figlio (Claude) appaiono nella stessa lista degli agenti, con un chiaro handoff da dev a QA.

Perché vale la pena cablare la delega di agente

Primo, soldi. Un passaggio di test su Claude Opus e un passaggio di test su Claude Haiku costano cifre molto diverse. Stesso browser, stesse assertion, stessi screenshot. La delega di agente lascia che il modello economico faccia il lavoro economico. Chi l'ha attivata segnala un calo della bolletta dei token nelle giornate cariche di QA, di un fattore reale e misurabile, non del 5 o 10 percento.

Secondo, contesto. Quando un agente dev esegue il test da solo, ogni screenshot, ogni dump del DOM, ogni log della console finisce nella finestra di contesto dell'agente dev. Venti minuti di click sono megabyte di rumore che l'agente dev deve trascinare per il resto della sessione. La delega di agente isola quel rumore dentro l'agente QA effimero. L'agente dev riceve indietro un pulito messaggio 'pass' o 'fail', nient'altro.

Terzo, l'angolo ecologico. Ogni delega di agente risparmia calcolo reale. Far girare Haiku dove girava Opus dimezza l'impronta energetica di quel passo. Moltiplica per ogni membro del team e per ogni loop di test in un anno e la delega di agente diventa una leva non banale sul lato carbonio del tuo stack.

Quarto, affidabilità. Un agente dev che guida il browser da solo tende a divagare. Dopo due screenshot, dimentica cosa stava cercando di validare. L'agente QA nella delega di agente ha un solo compito e un solo prompt. Testa, riporta, muore. Il loop è corto, prevedibile e facile da debuggare.

L'unico flusso che la delega di agente copre qui

Un agente dev. Un agente QA. Una chiamata MCP. Delega di agente, dall'inizio alla fine.

L'agente dev consegna la feature

Il tuo agente dev (Claude Opus, Codex high reasoning, qualunque modello costoso su cui fai affidamento) finisce l'implementazione. Nuovo endpoint, nuova schermata, nuovo flusso. Il codice è scritto, i file sono salvati.

L'agente dev chiama run_qa_test

Invece di aprire il browser da solo, l'agente dev chiama un singolo strumento MCP dal server AgentsRoom Test Runner : run_qa_test, con uno scenario in inglese semplice. È l'intera superficie API della delega di agente.

AgentsRoom genera l'agente QA

AgentsRoom Test Runner genera un agente QA effimero sul modello più economico che hai configurato (Claude Haiku, Codex mini, GPT-4 mini). L'agente QA riceve gli strumenti AgentsRoom Browser MCP : navigate, click, type, screenshot, evaluate, get_logs, get_state.

L'agente QA esegue il test

L'agente QA apre la pagina, percorre lo scenario, verifica il risultato, cattura screenshot se serve e legge i log della console per intercettare gli errori a runtime che un agente dev si sarebbe perso.

L'agente QA invia il verdetto

Una volta finito, l'agente QA chiama submit_verdict con un risultato pass, fail o inconclusive e un breve riassunto. Screenshot e log sono allegati. Il processo dell'agente QA viene distrutto. La sua finestra di contesto se ne va con lui.

L'agente dev legge il verdetto e va avanti

L'agente dev riceve il verdetto come risposta a run_qa_test. In caso di pass, l'agente dev fa commit o passa al prossimo ticket. In caso di fail, l'agente dev legge il riassunto del fallimento, corregge il bug e fa partire un nuovo ciclo di delega di agente. Il loop si chiude da solo.

L'economia della delega di agente

Perché una divisione intelligente da dev a QA abbassa la bolletta AI senza abbassare i tuoi standard.

I test browser sono ripetitivi. Apri la pagina, clicca il bottone, leggi l'etichetta, controlla il toast. Un modello da 50 dollari per milione di token fa quel lavoro bene quanto uno da 3 dollari per milione di token. Forse meglio, perché il modello economico non si annoia. La delega di agente mette il modello economico sulla metà noiosa del lavoro.

Numeri reali da sessioni reali : un tipico test end-to-end su un flusso complesso brucia da 60k a 200k token tra screenshot, dump del DOM e passi di ragionamento. Su Opus, sono soldi veri per test. Su Haiku, sono spiccioli. La delega di agente trasforma un'abitudine quotidiana di QA da preoccupazione di budget a riflesso gratuito.

Moltiplica per ogni loop. Una normale giornata di dev su una feature non banale esegue il test da cinque a venti volte. La delega di agente cumula su queste ripetizioni. L'agente dev resta costoso (lo vuoi costoso), l'agente QA resta economico, e il divario è puro risparmio.

La delega di agente è anche più gentile col pianeta. Meno calcolo sullo stesso lavoro significa meno energia, meno acqua nel datacenter, meno carbonio. Non è l'unica ragione per cablare la delega di agente, ma è un equo effetto collaterale dell'instradare i compiti su modelli del giusto dimensionamento.

Una divisione di modello reale per la delega di agente

Cosa la gente collega davvero sul lato dev e sul lato QA della delega di agente.

Lato dev (tenuto costoso di proposito)

Claude Opus 4.7
Claude Sonnet 4.6
Codex high reasoning
GPT-4 with deep reasoning
Gemini 2.5 Pro

Lato QA (delegato a un modello più economico)

Claude Haiku 4
Claude Sonnet 4 (low effort)
Codex mini
GPT-4 mini
Gemini 2.5 Flash

La delega di agente non blocca la matrice. Configuri il modello QA per progetto. Puoi anche delegare a un provider completamente diverso : Opus sul dev, Codex mini sul QA, nessun contesto condiviso, solo una chiamata MCP.

Cosa fa davvero la delega di agente sotto il cofano

La delega di agente sta sullo stack MCP di AgentsRoom. L'agente dev gira dentro la sua CLI (Claude Code, Codex, Gemini, OpenCode, Aider). AgentsRoom inietta il server Test Runner MCP in quell'agente. Il Test Runner espone uno strumento : run_qa_test. Quello è il punto d'ingresso di ogni chiamata di delega di agente.

Quando run_qa_test parte, AgentsRoom genera un nuovo processo CLI nello stesso progetto, con una configurazione diversa. Quella configurazione ha il Browser MCP attaccato, il system prompt di QA attaccato, e il modello sostituito con quello che hai impostato sul lato QA. Il nuovo processo è un agente QA effimero : vive per la durata del test e muore dopo submit_verdict.

Mentre l'agente QA gira, l'agente dev è in pausa sulla chiamata run_qa_test. AgentsRoom mostra l'agente QA nella stessa lista degli agenti, indentato sotto l'agente dev (visibile nell'immagine sopra). Quando l'agente QA finisce, il suo verdetto è restituito come risultato di run_qa_test e l'agente dev riprende. Dal punto di vista dell'agente dev, la delega di agente è un singolo round trip MCP.

L'agente dev non ottiene mai gli strumenti del browser. AgentsRoom rimuove gli strumenti browser_* dalla lista permessa dell'agente dev al momento dello spawn. Questa è la parte che rende la delega di agente affidabile : l'agente dev non può ripiegare sull'eseguire il test da solo, anche quando il suo istinto è prendere uno screenshot. L'unica strada in avanti è run_qa_test. Delega di agente per rimozione, non per richiesta.

Dove la delega di agente gira oggi, e dove andrà

La delega di agente in AgentsRoom oggi è browser-first. Stessa forma, più superfici in arrivo.

Oggi : delega dei test browser

L'agente QA guida il browser embedded di AgentsRoom attraverso il Browser MCP. Server di sviluppo su localhost, tunnel pubblico di preview, URL di staging, qualunque cosa Chromium possa renderizzare. Form, modali, drag and drop, dialog, log di console, errori di rete. La delega di agente copre l'intera superficie che un ingegnere QA web coprirebbe.

Delega dei test su app Electron

Se consegni un'app Electron tu stesso, puoi installare la libreria AgentsRoom Electron MCP nel tuo progetto. L'agente QA si connette alla tua app Electron nello stesso modo in cui si connette a una scheda Chromium. La delega di agente entra nel testing di app desktop senza cambiare niente sul lato dev.

Delega dei test su app React Native (roadmap)

La stessa forma di delega di agente sta arrivando su React Native. L'agente QA guiderà un simulatore iOS o Android attraverso un AgentsRoom React Native MCP. L'agente dev consegna una schermata, l'agente QA ci clicca sopra. Stessa chiamata run_qa_test, stesso handoff da dev a QA, target mobile.

Senza delega di agente vs con delega di agente

Stessa feature, stesso passaggio di QA. Bolletta diversa, contesto diverso, affidabilità diversa.

Senza delega di agente

: L'agente dev (costoso) apre il browser da solo.
: Ogni screenshot, ogni dump del DOM e ogni log della console atterra nel contesto dell'agente dev.
: 20 minuti di click bruciano token Opus su lavoro che farebbe un modello più economico.
: L'agente dev dimentica cosa stava facendo dopo due screenshot.
: Paghi prezzo pieno per i click nel browser, e anche il pianeta paga prezzo pieno.

Con delega di agente

: L'agente dev chiama run_qa_test e aspetta.
: Un agente QA economico fa i click, le assertion, la cattura degli screenshot.
: Solo il verdetto (pass, fail, riassunto) arriva all'agente dev.
: L'agente QA è effimero : muore dopo submit_verdict, nessun gonfiore di contesto.
: La bolletta dei token scende, l'agente dev resta concentrato, il loop si chiude da solo.

La delega di agente è la vittoria di affidabilità più economica che puoi cablare in un setup di agente di codifica.

Com'è fatta una chiamata di delega di agente

Ecco l'intera forma di una delega di agente da dev a QA. L'agente dev lancia questo attraverso il Test Runner MCP e aspetta la risposta.

Chiamata di strumento MCP (agente dev)

run_qa_test({
  scenario: "Open http://localhost:3000/login.\n  Type the seeded test user in the email field.\n  Submit the form.\n  Assert the dashboard URL is reached and the user's name is shown in the header.\n  Capture a screenshot on success, capture console logs on failure."
})

Delega di agente local-first

La delega di agente gira interamente sulla tua macchina. Agente dev, agente QA, ponte MCP, browser : tutto in loopback. Niente del test viene mandato a un cloud di terze parti.

Delega di agente cross-provider

La delega di agente funziona tra provider. Codex sul dev, Claude Haiku sul QA. Opus sul dev, GPT-4 mini sul QA. La delega di agente è una questione di protocollo, non di fornitore.

Umano nel loop

La delega di agente non ti chiude fuori. Puoi leggere il verdetto QA, guardare l'agente QA in diretta, fermarlo o rigiocarlo. La delega di agente è leva, non pilota automatico.

FAQ

Cos'è la delega di agente in AgentsRoom ?

La delega di agente è un handoff da dev a QA tra due agenti AI di codifica. L'agente dev finisce una feature, chiama un singolo strumento MCP (run_qa_test), e un agente QA effimero esegue il test su un modello diverso. L'agente dev legge il verdetto e va avanti. L'intero flusso di delega di agente avviene attraverso i server MCP di AgentsRoom.

Perché dovrei volere la delega di agente ?

Tre ragioni. Soldi : l'agente QA gira su un modello più economico, quindi i passaggi di test costano una frazione di quello che costerebbero sul modello dev. Contesto : l'agente dev resta pulito, tutti gli screenshot e i dump del DOM muoiono con l'agente QA. Affidabilità : l'agente QA ha un solo compito, quindi testa meglio di un agente dev che fa multitasking sui click del browser.

Quali modelli funzionano per la delega di agente ?

Qualsiasi modello supportato da AgentsRoom : Claude (Opus, Sonnet, Haiku), Codex (high, mini), Gemini (Pro, Flash), OpenCode, Aider. La delega di agente è cross-provider. Una divisione comune è Claude Opus o Codex sul lato dev e Claude Haiku o Codex mini sul lato QA, ma scegli tu.

La delega di agente è solo per test browser ?

Oggi sì, l'agente QA guida il browser Chromium embedded di AgentsRoom. Domani, la stessa forma di delega di agente copre le app Electron (installa la libreria AgentsRoom Electron MCP nel tuo progetto Electron) e le app React Native (roadmap, simulatori iOS e Android).

Come fa la delega di agente a evitare che l'agente dev faccia il test da solo ?

AgentsRoom rimuove gli strumenti browser_* dall'agente dev al momento dello spawn. L'agente dev letteralmente non può chiamare browser_navigate o browser_screenshot. L'unica strada al browser è run_qa_test, che fa partire la delega di agente. Il vincolo è meccanico, non una richiesta cortese in un prompt.

La delega di agente è cloud o locale ?

Local-first. L'agente dev, l'agente QA effimero, il ponte MCP e il browser girano tutti sulla tua macchina. La delega di agente usa il cloud solo quando il modello sottostante (Claude, Codex, Gemini) parla con il proprio provider, esattamente come un normale run di un agente.

La delega di agente fa davvero risparmiare soldi ?

Sì, di un fattore significativo per le giornate cariche di QA. Un test end-to-end complesso su Opus o Codex high rispetto allo stesso test su Haiku o Codex mini è circa 10 volte di differenza in costo. La delega di agente per una giornata dev su tutto il team scala quel divario rapidamente.

Cosa ottiene indietro l'agente dev dalla delega di agente ?

Un breve verdetto strutturato : pass, fail o inconclusive, con un riassunto, percorso opzionale dello screenshot e log opzionali della console. Nessuno screenshot grezzo nel contesto, nessun dump del DOM. Quello è tutto il senso della delega di agente : isolare il rumore di QA dentro l'agente QA.

L'agente QA può aprire un ticket di backlog quando fallisce ?

Sì. La delega di agente dà all'agente QA il Backlog MCP. Un fallimento può atterrare come ticket di backlog sul progetto, con scenario, screenshot e log della console allegati. L'agente dev legge il verdetto e il ticket di backlog porta i dettagli più estesi.

Come si colloca la delega di agente rispetto alle altre feature di AgentsRoom ?

La delega di agente sta sopra Browser Automation (che dà all'agente QA il browser) e ai server MCP di AgentsRoom (che danno a ogni agente la sua superficie di strumenti). Agent Teams è l'editor più ampio di workflow multi-agente : la delega di agente è la variante da dev a QA di quel workflow, ma esposta come una singola chiamata MCP così qualunque agente di qualunque provider può usarla senza configurare un grafo.

Si abbina bene con

Browser Automation

Il layer Chromium e Browser MCP che il lato QA della delega di agente guida. Browser reale e persistente per progetto.

Agent Teams

Editor visivo di workflow multi-agente. La delega di agente è la variante da dev a QA, Agent Teams è la versione a grafo completo con N nodi e loop di feedback.

AgentsRoom MCP

I server MCP che rendono possibile la delega di agente : Test Runner, Browser, Backlog, Terminal Commands, Prompt Library.

Multi-Provider

Fai girare Claude, Codex, Gemini, OpenCode e Aider fianco a fianco. La delega di agente è l'angolo cross-provider della stessa idea.

Claude Code Token Usage

Contatore live dei token per sessione. Il modo più veloce per confermare i risparmi in dollari che la delega di agente ti dà in pratica.

Public Backlog

Quando un agente QA fallisce un passaggio di delega di agente, il bug atterra qui. Clienti e colleghi vedono la regressione, l'agente dev la riprende.

Smetti di pagare prezzi Opus per i click di QA

Scarica AgentsRoom e prova la delega di agente. Imposta il tuo agente dev sul modello su cui fai affidamento, il tuo agente QA su un modello più economico, e lascia che l'handoff da dev a QA avvenga da solo attraverso MCP.

GratisScarica AgentsRoom

App companion: monitora i tuoi agenti in movimento

Usa Claude, Codex, Gemini CLI o un altro provider IA.

Installa l'estensione

Chrome Web Store

Invia bug e richieste direttamente nel tuo backlog pubblico.

Multi-progetto

Multi-provider

Multi-agente

Stato in tempo reale

Diff e commit

App mobile

Anteprima live

Team di agenti

Test browser

Dev guidata da backlog

Libreria di prompt

Libreria di skill

Delega di agente :il tuo agente dev delega il test