Ủy quyền agent : dev sang QA : model rẻ hơn cho bài test

Ủy quyền agent :
agent dev của bạn ủy quyền bài test

Ủy quyền agent cho phép agent dev của bạn hoàn thành một tính năng và bàn giao việc xác thực cho một agent QA riêng biệt. Dev tiếp tục giao code với model bạn tin tưởng cho những vấn đề khó. Agent QA chạy bài test trên một model rẻ hơn. Cả hai trao đổi qua các máy chủ MCP của AgentsRoom, nên việc ủy quyền agent hoạt động đầu cuối mà bạn không cần sao chép gì cả.

Bạn không còn trả giá Opus cho việc click chuột trên trình duyệt. Bạn không còn làm phình ngữ cảnh của agent dev với ảnh chụp màn hình và dump DOM. Ủy quyền agent định tuyến mỗi tác vụ đến đúng model với đúng mức giá, và khi agent QA xong việc, nó ping ngược lại agent dev để vòng lặp tự đóng.

Tải xuống AgentsRoom Xem cách ủy quyền agent hoạt động

Ủy quyền agent trong thực tế : agent dev Codex hoàn thành tính năng, gọi run_qa_test, agent QA mở trình duyệt trên một model rẻ hơn và báo cáo ngược lại.

Đây là vấn đề mà ủy quyền agent giải quyết. Bạn chạy một agent dev mạnh (Claude Opus, Codex, kiểu model thiết kế một API hoặc tái cấu trúc một store). Agent giao tính năng trong 10 phút. Rồi nó dành 8 phút tiếp theo click quanh trình duyệt để xác minh tính năng hoạt động. Cùng mức token đắt đỏ. Cùng model vừa đang suy nghĩ căng thẳng về logic domain của bạn, giờ lại đang đọc nhãn nút.

Ủy quyền agent sửa chuyện đó. Khi tính năng xong, agent dev gọi một tool MCP duy nhất, run_qa_test, với một kịch bản. AgentsRoom sinh một agent QA tạm thời trên model bạn đã chọn cho QA : Claude Haiku, Codex mini, GPT-4 mini, bất cứ thứ gì bạn muốn. Agent QA nhận AgentsRoom Browser MCP, điều khiển trang, kiểm tra kết quả và trả lời bằng một verdict. Agent dev đọc verdict đó và đi tiếp.

Đó là ủy quyền agent, và đó là vòng lặp duy nhất trang này nói tới. Một dev, một QA, một MCP. Cùng ý tưởng như một kỹ sư senior ủy quyền kiểm thử hồi quy cho một junior hoặc cho QA : senior tiếp tục thiết kế, junior chạy checklist. Ủy quyền agent cho bạn chính sự phân chia đó giữa các model.

Ủy quyền agent trong AgentsRoom : agent dev Codex đã hoàn thành nhiệm vụ và một agent QA đã được ủy quyền bên dưới, với nhãn 'QA for Codex agent' cho thấy việc bàn giao dev sang QA trong danh sách agent

Hình ảnh hóa ủy quyền agent : agent dev cha (Codex) và agent QA con (Claude) xuất hiện trong cùng danh sách agent, với việc bàn giao dev sang QA rõ ràng.

Tại sao ủy quyền agent đáng để cài đặt

Đầu tiên, tiền. Một lượt test trên Claude Opus và một lượt test trên Claude Haiku có chi phí khác nhau rất nhiều. Cùng trình duyệt, cùng assertion, cùng ảnh chụp màn hình. Ủy quyền agent để model rẻ làm công việc rẻ. Những người bật tính năng này báo cáo hóa đơn token của họ trong những ngày nặng QA giảm với một hệ số thực sự, đo lường được, không phải 5 đến 10 phần trăm.

Thứ hai, ngữ cảnh. Khi một agent dev tự chạy bài test, mọi ảnh chụp màn hình, mọi dump DOM, mọi log console đều rơi vào cửa sổ ngữ cảnh của agent dev. Hai mươi phút click chuột là vài megabyte tiếng ồn mà agent dev phải mang theo trong suốt phần còn lại của phiên. Ủy quyền agent cô lập tiếng ồn đó bên trong agent QA tạm thời. Agent dev nhận lại một thông điệp 'pass' hoặc 'fail' sạch, không gì hơn.

Thứ ba, góc nhìn sinh thái. Mỗi lần ủy quyền agent tiết kiệm tính toán thực. Chạy Haiku ở nơi Opus đang chạy giảm một nửa dấu chân năng lượng trên bước đó. Nhân với mọi người trong nhóm và mọi vòng lặp test trong một năm, ủy quyền agent trở thành một nút điều chỉnh không tầm thường ở phía carbon của ngăn xếp của bạn.

Thứ tư, độ tin cậy. Một agent dev tự điều khiển trình duyệt có xu hướng đi lạc. Sau hai ảnh chụp màn hình, nó quên mất nó đang cố xác thực điều gì. Agent QA trong ủy quyền agent có một việc và một prompt. Nó test, nó báo cáo, nó chết. Vòng lặp ngắn, dễ dự đoán và dễ debug.

Luồng duy nhất mà ủy quyền agent đề cập ở đây

Một agent dev. Một agent QA. Một cuộc gọi MCP. Ủy quyền agent, đầu cuối.

Agent dev giao tính năng

Agent dev của bạn (Claude Opus, Codex high reasoning, bất kỳ model đắt nào bạn tin tưởng) hoàn thành phần triển khai. Endpoint mới, màn hình mới, luồng mới. Code được viết, file được lưu.

Agent dev gọi run_qa_test

Thay vì tự mở trình duyệt, agent dev gọi một tool MCP duy nhất từ máy chủ AgentsRoom Test Runner : run_qa_test, với một kịch bản tiếng Anh thuần. Đó là toàn bộ bề mặt API của ủy quyền agent.

AgentsRoom sinh agent QA

AgentsRoom Test Runner sinh một agent QA tạm thời trên model rẻ hơn mà bạn đã cấu hình (Claude Haiku, Codex mini, GPT-4 mini). Agent QA nhận các tool AgentsRoom Browser MCP : navigate, click, type, screenshot, evaluate, get_logs, get_state.

Agent QA chạy bài test

Agent QA mở trang, đi qua kịch bản, kiểm tra kết quả, chụp ảnh màn hình nếu cần và đọc log console để bắt những lỗi runtime mà agent dev sẽ bỏ lỡ.

Agent QA gửi verdict

Khi xong, agent QA gọi submit_verdict với kết quả pass, fail hoặc inconclusive và một tóm tắt ngắn. Ảnh chụp màn hình và log được đính kèm. Tiến trình agent QA bị hủy. Cửa sổ ngữ cảnh của nó cũng biến mất theo.

Agent dev đọc verdict và đi tiếp

Agent dev nhận verdict trở lại như phản hồi của run_qa_test. Khi pass, agent dev commit hoặc chuyển sang ticket tiếp theo. Khi fail, agent dev đọc tóm tắt thất bại, sửa bug và kích hoạt một chu trình ủy quyền agent mới. Vòng lặp tự đóng.

Kinh tế học của ủy quyền agent

Vì sao một sự phân chia dev sang QA thông minh hạ hóa đơn AI mà không hạ tiêu chuẩn của bạn.

Test trình duyệt mang tính lặp lại. Mở trang, click nút, đọc nhãn, kiểm tra toast. Một model 50 đô la trên mỗi triệu token làm việc đó tốt như một model 3 đô la trên mỗi triệu token. Có thể tốt hơn, vì model rẻ không chán. Ủy quyền agent đặt model rẻ vào nửa nhàm chán của công việc.

Con số thực từ các phiên thực : một bài test đầu cuối điển hình trên một luồng phức tạp đốt 60 nghìn đến 200 nghìn token giữa ảnh chụp màn hình, dump DOM và bước suy luận. Trên Opus, đó là tiền thật mỗi bài test. Trên Haiku, đó là tiền lẻ. Ủy quyền agent biến thói quen QA hàng ngày từ một mối lo ngân sách thành một phản xạ miễn phí.

Nhân với mỗi vòng lặp. Một ngày dev bình thường trên một tính năng không tầm thường chạy bài test năm đến hai mươi lần. Ủy quyền agent cộng dồn qua những lần lặp đó. Agent dev vẫn đắt (bạn muốn nó đắt), agent QA vẫn rẻ, và khoảng cách là tiết kiệm thuần.

Ủy quyền agent cũng tử tế hơn với hành tinh. Ít tính toán hơn trên cùng công việc nghĩa là ít năng lượng hơn, ít nước trong datacenter hơn, ít carbon hơn. Không phải lý do duy nhất để cài đặt ủy quyền agent, nhưng là một tác dụng phụ công bằng của việc định tuyến tác vụ đến các model đúng kích cỡ.

Một sự phân chia model thực cho ủy quyền agent

Những gì mọi người thực sự cắm vào phía dev và phía QA của ủy quyền agent.

Phía dev (cố ý giữ đắt)

Claude Opus 4.7
Claude Sonnet 4.6
Codex high reasoning
GPT-4 with deep reasoning
Gemini 2.5 Pro

Phía QA (được ủy quyền cho cái rẻ hơn)

Claude Haiku 4
Claude Sonnet 4 (low effort)
Codex mini
GPT-4 mini
Gemini 2.5 Flash

Ủy quyền agent không khóa ma trận. Bạn cấu hình model QA theo từng dự án. Bạn thậm chí có thể ủy quyền cho một nhà cung cấp hoàn toàn khác : Opus ở dev, Codex mini ở QA, không ngữ cảnh chung, chỉ một cuộc gọi MCP.

Ủy quyền agent thực sự làm gì dưới mui xe

Ủy quyền agent nằm trên ngăn xếp MCP của AgentsRoom. Agent dev chạy bên trong CLI của nó (Claude Code, Codex, Gemini, OpenCode, Aider). AgentsRoom tiêm máy chủ Test Runner MCP vào agent đó. Test Runner phơi bày một tool : run_qa_test. Đó là điểm vào của mỗi cuộc gọi ủy quyền agent.

Khi run_qa_test kích hoạt, AgentsRoom sinh một tiến trình CLI mới trong cùng dự án, với một cấu hình khác. Cấu hình đó có Browser MCP đính kèm, system prompt QA đính kèm và model được hoán đổi sang bất cứ thứ gì bạn đặt ở phía QA. Tiến trình mới là một agent QA tạm thời : nó sống trong suốt thời lượng bài test và chết sau submit_verdict.

Trong khi agent QA chạy, agent dev bị tạm dừng tại cuộc gọi run_qa_test. AgentsRoom hiển thị agent QA trong cùng danh sách agent, thụt vào dưới agent dev (nhìn thấy trong hình trên). Khi agent QA hoàn thành, verdict của nó được trả về như kết quả của run_qa_test và agent dev tiếp tục. Ủy quyền agent là một chuyến đi MCP duy nhất từ góc nhìn của agent dev.

Agent dev không bao giờ nhận được các tool trình duyệt. AgentsRoom tước các tool browser_* khỏi danh sách được phép của agent dev tại thời điểm spawn. Đó là phần làm cho ủy quyền agent đáng tin cậy : agent dev không thể quay lại tự làm bài test, ngay cả khi bản năng của nó là chụp một ảnh màn hình. Con đường duy nhất phía trước là run_qa_test. Ủy quyền agent bằng cách loại bỏ, không phải bằng yêu cầu.

Ủy quyền agent chạy ở đâu hôm nay, và đi tiếp ở đâu

Ủy quyền agent trong AgentsRoom ưu tiên trình duyệt hôm nay. Cùng hình dáng, thêm nhiều bề mặt sắp tới.

Hôm nay : ủy quyền test trình duyệt

Agent QA điều khiển trình duyệt nhúng của AgentsRoom thông qua Browser MCP. Máy chủ dev localhost, tunnel preview công khai, URL staging, bất cứ thứ gì Chromium có thể render. Form, modal, kéo thả, hộp thoại, log console, lỗi mạng. Ủy quyền agent bao phủ toàn bộ bề mặt mà một kỹ sư QA web sẽ bao phủ.

Ủy quyền test ứng dụng Electron

Nếu bạn tự giao một ứng dụng Electron, bạn có thể cài thư viện AgentsRoom Electron MCP trong dự án của mình. Agent QA kết nối tới ứng dụng Electron của bạn theo cùng cách nó kết nối tới một tab Chromium. Ủy quyền agent bước sang lĩnh vực kiểm thử ứng dụng desktop mà không thay đổi phía dev chút nào.

Ủy quyền test ứng dụng React Native (lộ trình)

Cùng hình dáng ủy quyền agent đang đến với React Native. Agent QA sẽ điều khiển một trình giả lập iOS hoặc Android thông qua một AgentsRoom React Native MCP. Agent dev giao một màn hình, agent QA chạm xuyên qua nó. Cùng cuộc gọi run_qa_test, cùng bàn giao dev sang QA, mục tiêu mobile.

Không có ủy quyền agent vs có ủy quyền agent

Cùng tính năng, cùng lượt QA. Khác hóa đơn, khác ngữ cảnh, khác độ tin cậy.

Không có ủy quyền agent

: Agent dev (đắt) tự mở trình duyệt.
: Mọi ảnh chụp màn hình, mọi dump DOM và mọi log console đều rơi vào ngữ cảnh của agent dev.
: 20 phút click chuột đốt token Opus cho công việc mà một model rẻ hơn có thể làm.
: Agent dev quên đang làm gì sau hai ảnh chụp màn hình.
: Bạn trả giá đầy đủ cho việc click trình duyệt, hành tinh cũng trả giá đầy đủ.

Có ủy quyền agent

: Agent dev gọi run_qa_test và chờ.
: Một agent QA rẻ làm việc click chuột, assertion, chụp ảnh màn hình.
: Chỉ verdict (pass, fail, tóm tắt) đến được agent dev.
: Agent QA là tạm thời : nó chết sau submit_verdict, không phình ngữ cảnh.
: Hóa đơn token giảm, agent dev giữ tập trung, vòng lặp tự đóng.

Ủy quyền agent là chiến thắng về độ tin cậy rẻ nhất mà bạn có thể cài đặt vào một thiết lập agent coding.

Một cuộc gọi ủy quyền agent trông như thế nào

Đây là toàn bộ hình dáng của một lần ủy quyền agent dev sang QA. Agent dev kích hoạt cái này thông qua Test Runner MCP và chờ phản hồi.

Cuộc gọi tool MCP (agent dev)

run_qa_test({
  scenario: "Open http://localhost:3000/login.\n  Type the seeded test user in the email field.\n  Submit the form.\n  Assert the dashboard URL is reached and the user's name is shown in the header.\n  Capture a screenshot on success, capture console logs on failure."
})

Ủy quyền agent ưu tiên cục bộ

Ủy quyền agent chạy hoàn toàn trên máy của bạn. Agent dev, agent QA, cầu MCP, trình duyệt : tất cả loopback. Không có gì về bài test được gửi đến đám mây bên thứ ba.

Ủy quyền agent liên nhà cung cấp

Ủy quyền agent hoạt động xuyên các nhà cung cấp. Codex ở dev, Claude Haiku ở QA. Opus ở dev, GPT-4 mini ở QA. Ủy quyền agent là một câu hỏi về giao thức, không phải câu hỏi về nhà cung cấp.

Con người trong vòng lặp

Ủy quyền agent không khóa bạn ra ngoài. Bạn có thể đọc verdict QA, xem agent QA trực tiếp, dừng nó, hoặc phát lại. Ủy quyền agent là đòn bẩy, không phải lái tự động.

FAQ

Ủy quyền agent trong AgentsRoom là gì ?

Ủy quyền agent là một sự bàn giao dev sang QA giữa hai agent coding AI. Agent dev hoàn thành một tính năng, gọi một tool MCP duy nhất (run_qa_test), và một agent QA tạm thời chạy bài test trên một model khác. Agent dev đọc verdict và đi tiếp. Toàn bộ luồng ủy quyền agent diễn ra qua các máy chủ MCP của AgentsRoom.

Tại sao tôi lại muốn ủy quyền agent ?

Ba lý do. Tiền : agent QA chạy trên một model rẻ hơn, nên các lượt test tốn một phần nhỏ so với khi chạy trên model dev. Ngữ cảnh : agent dev giữ sạch, mọi ảnh chụp màn hình và dump DOM chết cùng agent QA. Độ tin cậy : agent QA có một việc, nên nó test tốt hơn một agent dev đa nhiệm trên việc click trình duyệt.

Những model nào hoạt động cho ủy quyền agent ?

Bất kỳ model nào AgentsRoom hỗ trợ : Claude (Opus, Sonnet, Haiku), Codex (high, mini), Gemini (Pro, Flash), OpenCode, Aider. Ủy quyền agent là liên nhà cung cấp. Một sự phân chia phổ biến là Claude Opus hoặc Codex ở phía dev và Claude Haiku hoặc Codex mini ở phía QA, nhưng bạn là người chọn.

Ủy quyền agent có chỉ dành cho test trình duyệt không ?

Hôm nay, đúng, agent QA điều khiển trình duyệt Chromium nhúng của AgentsRoom. Ngày mai, cùng hình dáng ủy quyền agent bao phủ các ứng dụng Electron (cài thư viện AgentsRoom Electron MCP trong dự án Electron của bạn) và các ứng dụng React Native (lộ trình, trình giả lập iOS và Android).

Ủy quyền agent tránh việc agent dev tự làm bài test bằng cách nào ?

AgentsRoom tước các tool browser_* khỏi agent dev tại thời điểm spawn. Agent dev theo nghĩa đen không thể gọi browser_navigate hay browser_screenshot. Con đường trình duyệt duy nhất là run_qa_test, vốn kích hoạt ủy quyền agent. Ràng buộc là cơ học, không phải một lời yêu cầu lịch sự trong prompt.

Ủy quyền agent là đám mây hay cục bộ ?

Ưu tiên cục bộ. Agent dev, agent QA tạm thời, cầu MCP và trình duyệt đều chạy trên máy của bạn. Ủy quyền agent chỉ sử dụng đám mây khi model nền (Claude, Codex, Gemini) trao đổi với nhà cung cấp của chính nó, chính xác như một lượt chạy agent bình thường.

Ủy quyền agent có tiết kiệm tiền thật không ?

Có, với một hệ số đáng kể cho những ngày nặng QA. Một bài test đầu cuối phức tạp trên Opus hoặc Codex high so với cùng bài test trên Haiku hoặc Codex mini cách nhau khoảng 10 lần về chi phí. Ủy quyền agent xuyên một ngày dev và xuyên cả nhóm phóng đại khoảng cách đó nhanh chóng.

Agent dev nhận lại được gì từ ủy quyền agent ?

Một verdict có cấu trúc ngắn : pass, fail hoặc inconclusive, với một tóm tắt, đường dẫn ảnh chụp màn hình tùy chọn và log console tùy chọn. Không có ảnh chụp màn hình thô trong ngữ cảnh, không có dump DOM. Đó là toàn bộ điểm mấu chốt của ủy quyền agent : cô lập tiếng ồn QA bên trong agent QA.

Agent QA có thể tạo một ticket backlog khi nó thất bại không ?

Có. Ủy quyền agent cho agent QA Backlog MCP. Một thất bại có thể rơi xuống như một ticket backlog trong dự án, với kịch bản, ảnh chụp màn hình và log console đính kèm. Agent dev đọc verdict và ticket backlog mang chi tiết dạng dài.

Ủy quyền agent nằm ở đâu so với các tính năng khác của AgentsRoom ?

Ủy quyền agent sống trên Browser Automation (vốn cung cấp trình duyệt cho agent QA) và các máy chủ MCP của AgentsRoom (vốn cung cấp cho mỗi agent bề mặt tool của nó). Agent Teams là trình chỉnh sửa workflow đa agent rộng hơn : ủy quyền agent là biến thể dev sang QA của workflow đó, nhưng được phơi bày như một cuộc gọi MCP duy nhất để bất kỳ agent nào ở bất kỳ nhà cung cấp nào cũng có thể dùng mà không cần cấu hình đồ thị.

Đi kèm tốt với

Browser Automation

Lớp Chromium và Browser MCP mà phía QA của ủy quyền agent điều khiển. Trình duyệt thực sự bền vững theo dự án.

Agent Teams

Trình chỉnh sửa workflow đa agent trực quan. Ủy quyền agent là biến thể dev sang QA, Agent Teams là phiên bản đồ thị đầy đủ với N node và vòng lặp phản hồi.

AgentsRoom MCP

Các máy chủ MCP làm cho ủy quyền agent trở nên khả thi : Test Runner, Browser, Backlog, Terminal Commands, Prompt Library.

Multi-Provider

Chạy Claude, Codex, Gemini, OpenCode và Aider cạnh nhau. Ủy quyền agent là góc liên nhà cung cấp của cùng một ý tưởng.

Claude Code Token Usage

Đồng hồ token trực tiếp theo phiên. Cách nhanh nhất để xác nhận khoản tiết kiệm đô la mà ủy quyền agent mang lại cho bạn trong thực tế.

Public Backlog

Khi một agent QA thất bại một lượt ủy quyền agent, bug rơi xuống đây. Khách hàng và đồng đội thấy sự hồi quy, agent dev nhặt nó lên.

Ngừng trả giá Opus cho việc click QA

Tải xuống AgentsRoom và thử ủy quyền agent. Cắm agent dev của bạn vào model bạn tin tưởng, agent QA của bạn vào một model rẻ hơn, và để việc bàn giao dev sang QA tự diễn ra qua MCP.

Miễn phíTải AgentsRoom

Ứng dụng đồng hành: theo dõi agent khi đi đường

Sử dụng Claude, Codex, Gemini CLI hoặc nhà cung cấp AI khác.

Tải tiện ích mở rộng

Chrome Web Store

Gửi lỗi và yêu cầu thẳng vào backlog công khai của bạn.

Nhiều dự án

Đa nhà cung cấp

Nhiều agent

Trạng thái trực tiếp

File diff & commit

Ứng dụng đồng hành mobile

Xem trước trực tiếp

Đội agent

Tự động hóa trình duyệt

Dev theo backlog

Thư viện prompt

Thư viện skill

Ủy quyền agent :agent dev của bạn ủy quyền bài test