تفويض الوكيل: من المطوّر إلى ضمان الجودة: نموذج أرخص على الاختبار

تفويض الوكيل:
وكيل التطوير الخاص بك يفوّض الاختبار

تفويض الوكيل يتيح لوكيل التطوير لديك إنهاء الميزة وتسليم التحقق إلى وكيل ضمان جودة منفصل. يستمر المطوّر في شحن الكود بالنموذج الذي تثق به في المسائل الصعبة. ويشغّل وكيل ضمان الجودة الاختبار على نموذج أرخص. الاثنان يتحدثان عبر خوادم MCP الخاصة بـ AgentsRoom، فيعمل تفويض الوكيل من البداية إلى النهاية دون أن تنسخ أي شيء.

تتوقّف عن دفع أسعار Opus مقابل نقرات متصفح. تتوقّف عن إثقال سياق وكيل التطوير بلقطات الشاشة وتفريغات DOM. تفويض الوكيل يوجّه كل مهمة إلى النموذج المناسب بالسعر المناسب، وعندما ينتهي وكيل ضمان الجودة، يُبلّغ وكيل التطوير ليُغلق الحلقة من تلقاء نفسها.

تفويض الوكيل قيد التنفيذ: وكيل تطوير Codex يُنهي الميزة، ويستدعي run_qa_test، فيفتح وكيل ضمان الجودة المتصفح على نموذج أرخص ويعيد التقرير.

إليك المشكلة التي يحلّها تفويض الوكيل. تشغّل وكيل تطوير قويًا (Claude Opus، Codex، النموذج الذي يصمّم API أو يعيد هيكلة store). يشحن الوكيل الميزة في 10 دقائق. ثم يقضي الدقائق الثماني التالية في النقر داخل متصفح للتحقق من أن الميزة تعمل. نفس معدل التوكنز الباهظ. نفس النموذج الذي كان يفكّر بعمق في منطق مجالك، يقرأ الآن تسميات الأزرار.

تفويض الوكيل يصلح ذلك. عندما تكتمل الميزة، يستدعي وكيل التطوير أداة MCP واحدة، run_qa_test، مع سيناريو. يُنشئ AgentsRoom وكيل ضمان جودة مؤقّت على النموذج الذي اخترته لضمان الجودة: Claude Haiku، Codex mini، GPT-4 mini، أي شيء تريده. يحصل وكيل ضمان الجودة على AgentsRoom Browser MCP، ويقود الصفحة، ويتحقّق من النتيجة، ويردّ بحكم. يقرأ وكيل التطوير الحكم ويمضي.

هذا هو تفويض الوكيل، وهذه هي الحلقة الوحيدة التي تغطّيها الصفحة. مطوّر واحد، ضمان جودة واحد، MCP واحد. نفس فكرة مهندس كبير يفوّض اختبار الانحدار إلى مهندس مبتدئ أو إلى ضمان الجودة: الكبير يستمر في التصميم، والمبتدئ ينفّذ قائمة التحقق. تفويض الوكيل يمنحك نفس هذا التقسيم بين النماذج.

تفويض الوكيل في AgentsRoom: أنهى وكيل تطوير Codex مهمته وتمّ تفويض وكيل ضمان جودة تحته، مع تسمية 'QA for Codex agent' تُظهر التسليم من المطوّر إلى ضمان الجودة في قائمة الوكلاء

تفويض الوكيل مُصوَّرًا: وكيل التطوير الأب (Codex) ووكيل ضمان الجودة الابن (Claude) يظهران في نفس قائمة الوكلاء، مع تسليم واضح من المطوّر إلى ضمان الجودة.

لماذا يستحقّ تفويض الوكيل أن تُوصّله

أولًا، المال. تمريرة اختبار على Claude Opus وتمريرة اختبار على Claude Haiku تكلّفان مبالغ مختلفة جدًا. نفس المتصفح، نفس التأكيدات، نفس لقطات الشاشة. تفويض الوكيل يدع النموذج الرخيص يقوم بالعمل الرخيص. الأشخاص الذين فعّلوا هذا أبلغوا عن انخفاض فاتورة التوكنز في أيام ضمان الجودة الكثيف بعامل حقيقي قابل للقياس، وليس بنسبة 5 إلى 10 بالمئة.

ثانيًا، السياق. عندما يشغّل وكيل التطوير الاختبار بنفسه، كل لقطة شاشة، وكل تفريغ DOM، وكل سجل console ينتهي في نافذة سياق وكيل التطوير. عشرون دقيقة من النقر تساوي ميغابايتات من الضجيج يجب على وكيل التطوير حملها بقية الجلسة. تفويض الوكيل يعزل هذا الضجيج داخل وكيل ضمان الجودة المؤقّت. يستلم وكيل التطوير رسالة 'pass' أو 'fail' نظيفة، لا شيء آخر.

ثالثًا، الزاوية البيئية. كل تفويض وكيل يوفّر حسابًا حقيقيًا. تشغيل Haiku حيث كان Opus يعمل يخفّض البصمة الطاقية لتلك الخطوة إلى النصف. اضرب ذلك في كل أعضاء الفريق وفي كل حلقة اختبار في السنة، ويصبح تفويض الوكيل مقبضًا مهمًا على جانب الكربون من مكدّسك.

رابعًا، الموثوقية. وكيل التطوير الذي يقود المتصفح بنفسه يميل إلى الشرود. بعد لقطتي شاشة، ينسى ما الذي كان يحاول التحقّق منه. لوكيل ضمان الجودة في تفويض الوكيل مهمة واحدة وموجّه واحد. يختبر، يبلّغ، يموت. الحلقة قصيرة، متوقّعة، وسهلة التصحيح.

التدفق الوحيد الذي يغطّيه تفويض الوكيل هنا

وكيل تطوير واحد. وكيل ضمان جودة واحد. استدعاء MCP واحد. تفويض الوكيل، من البداية إلى النهاية.

01

وكيل التطوير يشحن الميزة

وكيل التطوير لديك (Claude Opus، Codex high reasoning، أي نموذج باهظ الثمن تثق به) يُنهي التنفيذ. نقطة وصول جديدة، شاشة جديدة، تدفّق جديد. تمّ كتابة الكود، وحفظ الملفات.

02

وكيل التطوير يستدعي run_qa_test

بدلًا من فتح المتصفح بنفسه، يستدعي وكيل التطوير أداة MCP واحدة من خادم AgentsRoom Test Runner: run_qa_test، مع سيناريو بلغة إنجليزية بسيطة. هذه هي كامل واجهة تفويض الوكيل.

03

AgentsRoom يُنشئ وكيل ضمان الجودة

AgentsRoom Test Runner يُنشئ وكيل ضمان جودة مؤقّتًا على النموذج الأرخص الذي قمت بإعداده (Claude Haiku، Codex mini، GPT-4 mini). يحصل وكيل ضمان الجودة على أدوات AgentsRoom Browser MCP: navigate، click، type، screenshot، evaluate، get_logs، get_state.

04

وكيل ضمان الجودة يشغّل الاختبار

يفتح وكيل ضمان الجودة الصفحة، ويمشي عبر السيناريو، ويتحقّق من النتيجة، ويلتقط لقطات الشاشة إذا لزم الأمر، ويقرأ سجلات console لاكتشاف أخطاء وقت التشغيل التي كان وكيل التطوير سيفوّتها.

05

وكيل ضمان الجودة يقدّم الحكم

عند الانتهاء، يستدعي وكيل ضمان الجودة submit_verdict بنتيجة pass أو fail أو inconclusive وملخّص قصير. تُرفق لقطات الشاشة والسجلات. تُدمَّر عملية وكيل ضمان الجودة. تذهب معها نافذة السياق.

06

وكيل التطوير يقرأ الحكم ويمضي

يستلم وكيل التطوير الحكم كردّ على run_qa_test. عند النجاح، يرتكب وكيل التطوير أو ينتقل إلى التذكرة التالية. عند الفشل، يقرأ وكيل التطوير ملخّص الفشل، يصلح الخلل، ويُطلق دورة تفويض وكيل جديدة. الحلقة تُغلق بنفسها.

اقتصاديات تفويض الوكيل

لماذا يخفّض تقسيم ذكي بين المطوّر وضمان الجودة فاتورة الذكاء الاصطناعي دون أن يخفّض معاييرك.

اختبارات المتصفح متكرّرة. افتح الصفحة، انقر الزرّ، اقرأ التسمية، تحقّق من toast. نموذج بـ 50 دولارًا لكل مليون توكن يقوم بهذا العمل بنفس كفاءة نموذج بـ 3 دولارات لكل مليون توكن. ربما أفضل، لأن النموذج الرخيص ليس مللًا. تفويض الوكيل يضع النموذج الرخيص على النصف المملّ من العمل.

أرقام حقيقية من جلسات حقيقية: اختبار نموذجي من البداية إلى النهاية على تدفّق معقّد يحرق 60 ألفًا إلى 200 ألف توكن بين لقطات الشاشة، وتفريغات DOM، وخطوات التفكير. على Opus، هذا مال حقيقي لكل اختبار. على Haiku، هذا فكّة. تفويض الوكيل يحوّل عادة ضمان الجودة اليومية من قلق ميزانية إلى ردّ فعل مجاني.

اضرب ذلك في كل حلقة. يوم تطوير عادي على ميزة غير تافهة يشغّل الاختبار من خمس إلى عشرين مرة. تفويض الوكيل يتراكم عبر تلك التكرارات. يبقى وكيل التطوير باهظًا (أنت تريده باهظًا)، ويبقى وكيل ضمان الجودة رخيصًا، والفارق توفير صافٍ.

تفويض الوكيل ألطف أيضًا بكوكب الأرض. عمل حسابي أقل على نفس المهمة يعني طاقة أقل، ماء أقل في مركز البيانات، كربون أقل. ليس السبب الوحيد لتوصيل تفويض الوكيل، لكنه أثر جانبي عادل لتوجيه المهام إلى نماذج بحجم مناسب.

تقسيم نماذج حقيقي لتفويض الوكيل

ما الذي يربطه الناس فعلًا على جانب التطوير وجانب ضمان الجودة في تفويض الوكيل.

جانب التطوير (يُبقى باهظًا عمدًا)

  • Claude Opus 4.7
  • Claude Sonnet 4.6
  • Codex high reasoning
  • GPT-4 with deep reasoning
  • Gemini 2.5 Pro

جانب ضمان الجودة (مفوّض إلى أرخص)

  • Claude Haiku 4
  • Claude Sonnet 4 (low effort)
  • Codex mini
  • GPT-4 mini
  • Gemini 2.5 Flash

تفويض الوكيل لا يقفل المصفوفة. تضبط نموذج ضمان الجودة لكل مشروع. يمكنك حتى أن تفوّض إلى موفّر مختلف تمامًا: Opus على التطوير، Codex mini على ضمان الجودة، بلا سياق مشترك، فقط استدعاء MCP.

ما الذي يفعله تفويض الوكيل فعليًا تحت الغطاء

يستقرّ تفويض الوكيل على مكدّس AgentsRoom MCP. يعمل وكيل التطوير داخل CLI الخاص به (Claude Code، Codex، Gemini، OpenCode، Aider). يحقن AgentsRoom خادم Test Runner MCP في ذلك الوكيل. يكشف Test Runner أداة واحدة: run_qa_test. هذه هي نقطة الدخول لكل استدعاء تفويض وكيل.

عندما يُطلق run_qa_test، يُنشئ AgentsRoom عملية CLI جديدة في نفس المشروع، بإعدادات مختلفة. هذه الإعدادات تحتوي على Browser MCP مرفقًا، وموجّه ضمان الجودة مرفقًا، والنموذج مُبدَّل إلى ما حدّدته على جانب ضمان الجودة. العملية الجديدة هي وكيل ضمان جودة مؤقّت: يحيا طوال مدة الاختبار ويموت بعد submit_verdict.

بينما يعمل وكيل ضمان الجودة، يكون وكيل التطوير متوقّفًا على استدعاء run_qa_test. يُظهر AgentsRoom وكيل ضمان الجودة في نفس قائمة الوكلاء، مُزاحًا تحت وكيل التطوير (مرئي في الصورة أعلاه). عندما ينتهي وكيل ضمان الجودة، يُعاد حكمه كنتيجة run_qa_test ويستأنف وكيل التطوير. تفويض الوكيل هو ذهاب وإياب MCP واحد من وجهة نظر وكيل التطوير.

وكيل التطوير لا يحصل أبدًا على أدوات المتصفح. يجرّد AgentsRoom أدوات browser_* من قائمة المسموح بها لوكيل التطوير عند الإنشاء. هذا هو الجزء الذي يجعل تفويض الوكيل موثوقًا: لا يستطيع وكيل التطوير أن يتراجع إلى القيام بالاختبار بنفسه، حتى عندما تكون غريزته أن يلتقط لقطة شاشة. الطريق الوحيد للأمام هو run_qa_test. تفويض الوكيل بالإزالة، لا بالطلب.

أين يعمل تفويض الوكيل اليوم، وأين بعد ذلك

تفويض الوكيل في AgentsRoom يضع المتصفح أولًا اليوم. نفس الشكل، أسطح أكثر قادمة.

اليوم: تفويض اختبار المتصفح

يقود وكيل ضمان الجودة متصفح AgentsRoom المدمج عبر Browser MCP. خادم تطوير محلي، نفق معاينة عام، عنوان staging، أي شيء يستطيع Chromium عرضه. النماذج، النوافذ المنبثقة، السحب والإفلات، مربّعات الحوار، سجلات console، أخطاء الشبكة. تفويض الوكيل يغطّي السطح الكامل الذي يغطّيه مهندس ضمان جودة ويب.

تفويض اختبار تطبيق Electron

إذا كنت تشحن تطبيق Electron بنفسك، يمكنك تثبيت مكتبة AgentsRoom Electron MCP في مشروعك. يتّصل وكيل ضمان الجودة بتطبيق Electron الخاص بك بنفس الطريقة التي يتّصل بها بعلامة تبويب Chromium. تفويض الوكيل يمتدّ إلى اختبار تطبيقات سطح المكتب دون تغيير جانب التطوير على الإطلاق.

تفويض اختبار تطبيق React Native (خارطة طريق)

نفس شكل تفويض الوكيل قادم إلى React Native. سيقود وكيل ضمان الجودة محاكي iOS أو Android عبر AgentsRoom React Native MCP. يشحن وكيل التطوير شاشة، ويضغط وكيل ضمان الجودة عليها. نفس استدعاء run_qa_test، نفس التسليم من المطوّر إلى ضمان الجودة، هدف موبايل.

بدون تفويض الوكيل مقابل مع تفويض الوكيل

نفس الميزة، نفس تمريرة ضمان الجودة. فاتورة مختلفة، سياق مختلف، موثوقية مختلفة.

بدون تفويض الوكيل

  • : وكيل التطوير (الباهظ) يفتح المتصفح بنفسه.
  • : كل لقطة شاشة، وكل تفريغ DOM، وكل سجل console ينزل في سياق وكيل التطوير.
  • : 20 دقيقة من النقر تحرق توكنز Opus على عمل سيقوم به نموذج أرخص.
  • : ينسى وكيل التطوير ما كان يفعله بعد لقطتي شاشة.
  • : تدفع السعر الكامل لنقرات المتصفح، والكوكب يدفع السعر الكامل أيضًا.

مع تفويض الوكيل

  • : يستدعي وكيل التطوير run_qa_test وينتظر.
  • : وكيل ضمان جودة رخيص يقوم بالنقرات، والتأكيدات، والتقاط لقطات الشاشة.
  • : فقط الحكم (pass، fail، summary) يصل إلى وكيل التطوير.
  • : وكيل ضمان الجودة مؤقّت: يموت بعد submit_verdict، لا انتفاخ سياق.
  • : تنخفض فاتورة التوكنز، يبقى وكيل التطوير مركّزًا، الحلقة تُغلق بنفسها.

تفويض الوكيل هو أرخص مكسب موثوقية يمكنك توصيله في إعداد وكيل ترميز.

كيف يبدو استدعاء تفويض الوكيل

إليك كامل شكل تفويض وكيل من المطوّر إلى ضمان الجودة. يُطلق وكيل التطوير هذا عبر Test Runner MCP وينتظر الردّ.

استدعاء أداة MCP (وكيل التطوير)

run_qa_test({
  scenario: "Open http://localhost:3000/login.\n  Type the seeded test user in the email field.\n  Submit the form.\n  Assert the dashboard URL is reached and the user's name is shown in the header.\n  Capture a screenshot on success, capture console logs on failure."
})
تفويض وكيل محلّي أولًا
تفويض الوكيل يعمل بالكامل على جهازك. وكيل التطوير، وكيل ضمان الجودة، جسر MCP، المتصفح: كلّها loopback. لا شيء حول الاختبار يُرسل إلى سحابة طرف ثالث.
تفويض وكيل عبر الموفّرين
تفويض الوكيل يعمل عبر الموفّرين. Codex على التطوير، Claude Haiku على ضمان الجودة. Opus على التطوير، GPT-4 mini على ضمان الجودة. تفويض الوكيل سؤال بروتوكول، لا سؤال بائع.
إنسان في الحلقة
تفويض الوكيل لا يقفلك خارجًا. تستطيع قراءة حكم ضمان الجودة، ومشاهدة وكيل ضمان الجودة مباشرة، وإيقافه، أو إعادة تشغيله. تفويض الوكيل رافعة، ليس قيادة آلية.

FAQ

ما هو تفويض الوكيل في AgentsRoom؟

تفويض الوكيل هو تسليم من المطوّر إلى ضمان الجودة بين وكيلَي ترميز ذكاء اصطناعي. ينهي وكيل التطوير ميزة، يستدعي أداة MCP واحدة (run_qa_test)، ويشغّل وكيل ضمان جودة مؤقّت الاختبار على نموذج مختلف. يقرأ وكيل التطوير الحكم ويمضي. كامل تدفّق تفويض الوكيل يحدث عبر خوادم AgentsRoom MCP.

لماذا قد أرغب في تفويض الوكيل أصلًا؟

ثلاثة أسباب. المال: يعمل وكيل ضمان الجودة على نموذج أرخص، فتكلّف تمريرات الاختبار جزءًا بسيطًا مما ستكلّفه على نموذج التطوير. السياق: يبقى وكيل التطوير نظيفًا، كل لقطات الشاشة وتفريغات DOM تموت مع وكيل ضمان الجودة. الموثوقية: لوكيل ضمان الجودة مهمة واحدة، فيختبر بشكل أفضل من وكيل تطوير يعمل بمهام متعدّدة على نقرات المتصفح.

أي النماذج تعمل لتفويض الوكيل؟

أي نموذج يدعمه AgentsRoom: Claude (Opus، Sonnet، Haiku)، Codex (high، mini)، Gemini (Pro، Flash)، OpenCode، Aider. تفويض الوكيل عبر الموفّرين. تقسيم شائع هو Claude Opus أو Codex على جانب التطوير وClaude Haiku أو Codex mini على جانب ضمان الجودة، لكنّك تختار.

هل تفويض الوكيل لاختبارات المتصفح فقط؟

اليوم، نعم، يقود وكيل ضمان الجودة متصفح AgentsRoom Chromium المدمج. غدًا، نفس شكل تفويض الوكيل يغطّي تطبيقات Electron (ثبّت مكتبة AgentsRoom Electron MCP في مشروع Electron الخاص بك) وتطبيقات React Native (خارطة طريق، محاكيات iOS وAndroid).

كيف يتجنّب تفويض الوكيل أن يقوم وكيل التطوير بالاختبار بنفسه؟

يجرّد AgentsRoom أدوات browser_* من وكيل التطوير عند الإنشاء. وكيل التطوير حرفيًا لا يستطيع استدعاء browser_navigate أو browser_screenshot. الطريق الوحيد للمتصفح هو run_qa_test، الذي يُطلق تفويض الوكيل. القيد ميكانيكي، ليس طلبًا مهذّبًا في موجّه.

هل تفويض الوكيل سحابي أم محلّي؟

محلّي أولًا. وكيل التطوير، وكيل ضمان الجودة المؤقّت، جسر MCP، والمتصفح كلّها تعمل على جهازك. تفويض الوكيل لا يستخدم السحابة إلا عندما يتحدّث النموذج الأساسي (Claude، Codex، Gemini) إلى موفّره الخاص، تمامًا مثل تشغيل وكيل عادي.

هل يوفّر تفويض الوكيل مالًا حقيقيًا؟

نعم، بعامل ذي معنى في أيام ضمان الجودة الكثيف. اختبار معقّد من البداية إلى النهاية على Opus أو Codex high مقابل نفس الاختبار على Haiku أو Codex mini هو تقريبًا فرق تكلفة 10 أضعاف. تفويض الوكيل عبر يوم تطوير عبر الفريق يوسّع تلك الفجوة بسرعة.

ماذا يستلم وكيل التطوير من تفويض الوكيل؟

حكم منظّم قصير: pass، fail، أو inconclusive، مع ملخّص، ومسار لقطة شاشة اختياري، وسجلات console اختيارية. لا لقطات شاشة خام في السياق، لا تفريغات DOM. هذا هو كامل هدف تفويض الوكيل: عزل ضجيج ضمان الجودة داخل وكيل ضمان الجودة.

هل يستطيع وكيل ضمان الجودة فتح تذكرة backlog عند الفشل؟

نعم. تفويض الوكيل يمنح وكيل ضمان الجودة Backlog MCP. يمكن أن يهبط الفشل كتذكرة backlog على المشروع، مع السيناريو، ولقطة الشاشة، وسجلات console مرفقة. يقرأ وكيل التطوير الحكم وتحمل تذكرة backlog التفاصيل الطويلة.

أين يقع تفويض الوكيل بالنسبة لميزات AgentsRoom الأخرى؟

تفويض الوكيل يعيش فوق أتمتة المتصفح (التي تمنح وكيل ضمان الجودة المتصفح) وخوادم AgentsRoom MCP (التي تمنح كل وكيل سطح أدواته). فرق الوكلاء هو محرّر تدفّق العمل متعدّد الوكلاء الأوسع: تفويض الوكيل هو نكهة المطوّر إلى ضمان الجودة من ذلك التدفّق، لكنه مُعرَّض كاستدعاء MCP واحد ليستخدمه أي وكيل في أي موفّر دون تكوين رسم بياني.

يتلاءم جيدًا مع

توقّف عن دفع أسعار Opus لنقرات ضمان الجودة

حمّل AgentsRoom وجرّب تفويض الوكيل. اربط وكيل التطوير على النموذج الذي تثق به، ووكيل ضمان الجودة على نموذج أرخص، ودع التسليم من المطوّر إلى ضمان الجودة يحدث بنفسه عبر MCP.

مجانيتحميل AgentsRoom

التطبيق المرافق: تابع وكلاءك أينما كنت

استخدم Claude أو Codex أو Gemini CLI أو أي مزود AI آخر.

تثبيت الملحق
Chrome Web Store

أرسل الأخطاء والطلبات مباشرة إلى قائمة المهام العامة.

مشاريع متعددة
متعدد المزوّدين
وكلاء متعددون
حالة مباشرة
فرق الملفات والإيداع
تطبيق الهاتف
معاينة مباشرة
فرق الوكلاء
أتمتة المتصفح
تطوير موجّه بالـ backlog
مكتبة البرومبت
مكتبة المهارات