الإملاء الصوتي: أملِ مطالباتك، ووكيلك يبرمج

كفّ عن كتابة مطالباتك.
أملِها.

الإملاء الصوتي يعيش مباشرة داخل محرّر الوكيل. انقر الميكروفون، أملِ مطالبتك، فيُدرَج النص المحوّل في المسودة عند موضع المؤشر. تحويل الكلام إلى نص لوكلاء البرمجة لديك، بلا تطبيق إملاء منفصل تُتابعه، وبلا نسخ ولصق بين النوافذ.

كتابة مطالبة طويلة ودقيقة تستهلك دقائق. إملاء المطالبة نفسها يستغرق ثوانٍ. سياق أوفر لوكيلك، وجولات توضيح أقل، ورموز أقل تُهدر. انتقلت القيمة من الكود إلى المطالبة، والإملاء الصوتي هو أسرع طريقة لكتابة مطالبة جيدة.

الإملاء الصوتي أثناء العمل: انقر الميكروفون، أملِ المطالبة، راقب الموجة الصوتية الحية، ويصل نص تحويل الكلام إلى نص في المحرّر جاهزاً للتحرير والإرسال.

هذا هو التحوّل الذي يجيب عنه الإملاء الصوتي. الجزء الصعب في العمل مع وكيل برمجة ذكي لم يعد كتابة الكود، فالوكيل يتولى ذلك. الجزء الصعب هو كتابة المطالبة: وصف ما تريده، والقيود، والحالات الحدّية، والملف الذي ينبغي تعديله، والسلوك الواجب تجنّبه. المطالبة الدقيقة هي الفرق بين نجاح من المحاولة الأولى وعشر جولات مرهقة. والمطالبة الدقيقة طويلة، ما يجعل كتابتها بطيئة.

الإملاء الصوتي يلغي ضريبة الكتابة. تنقر زر الميكروفون في المحرّر، فتقول كل ما كنت ستكتبه، وغالباً أكثر مما كنت ستتكبّد عناء كتابته، فيظهر نص تحويل الكلام إلى نص في المسودة. أنت تتحدث بمعدل 150 كلمة في الدقيقة، لكنك لا تكتب بمعدل 150 كلمة في الدقيقة. الإملاء ببساطة أسرع، والقناة الأسرع تعني أنك تمنح وكيلك سياقاً أوفر لكل مهمة.

هذه ليست إضافة ملصقة من الخارج. الميكروفون جزء من محرّر AgentsRoom، إلى جانب مكتبة المطالبات وأدوات الرسم. يُدرَج النص عند مؤشرك، فتمزج بين الكتابة والإملاء في المسودة نفسها. لا شيء يُرسَل تلقائياً: يصل النص إلى المسودة، فتقرأه، وتصحّح الكلمة الوحيدة التي أساء النموذج سماعها، وتضغط Enter حين تكون مستعداً. الإملاء الصوتي هنا أداة مساعدة على الكتابة، لا طيار آلي.

الإملاء الصوتي في محرّر AgentsRoom: زر ميكروفون يسجّل صوت المستخدم ويُدرَج نص تحويل الكلام إلى نص في مسودة مطالبة الوكيل، مع مُصوّر موجة صوتية حية

زر الميكروفون يقع في شريط أدوات المحرّر. أثناء التسجيل تُظهر موجة صوتية حية مستوى الإدخال، ثم تظهر المطالبة المحوّلة في المسودة.

لماذا تملي مطالباتك بدلاً من كتابتها

السرعة. أنت تتحدث أسرع بأضعاف من سرعة كتابتك، ولا تفقد تسلسل أفكارك وأنت تبحث عن المفاتيح. مطالبة من فقرتين تحتاج ثلاث دقائق لكتابتها تصبح إملاءً صوتياً في ثلاثين ثانية. على مدى يوم كامل من إملاء المطالبات على وكلائك، يتراكم هذا الوقت إلى ساعات حقيقية تستردّها.

الدقة. لأن الإملاء رخيص، تقول أكثر. تصف الحالة الحدّية التي كنت ستتجاوزها، والملف الذي لم تكن لتسمّيه، والسلوك الذي تريد تجنّبه. المطالبة الأغنى مطالبة أدق، والمطالبة الأدق هي بالضبط ما يجعل وكيل البرمجة الذكي ينجز المهمة من المحاولة الأولى.

اقتصاد الرموز. كل جولة توضيح مع الوكيل تكلّف رموزاً: الوكيل يسأل، أنت تجيب، وهو يعيد قراءة السياق. مطالبة مملاة ودقيقة منذ البداية تطوي هذه الجولات. عدد أقل من الأخذ والردّ يعني رموزاً أقل تُنفَق للوصول إلى النتيجة نفسها، وهو توفير مباشر في فاتورة برمجتك بالذكاء الاصطناعي.

بلا استخدام لليدين، وعلى الموبايل. على سطح المكتب تُبقي يديك حرّتين بينما يعمل وكيل، وتملي المطالبة التالية بصوتك. على الهاتف، الإملاء الصوتي هو أسرع طريقة على الإطلاق لتغذية وكيل دون مصارعة لوحة مفاتيح الموبايل. قل الفكرة، فتصل إلى وكيلك على الـ Mac.

كيف يعمل الإملاء الصوتي

انقر الميكروفون، أملِ، راجع، أرسل. أربع خطوات، بلا تطبيق منفصل، وبلا نسخ ولصق.

01

انقر الميكروفون في المحرّر

ضع مؤشرك في محرّر الوكيل وانقر زر الميكروفون في شريط الأدوات. في المرة الأولى يطلب macOS إذن الميكروفون، ويوجّه AgentsRoom هذا الطلب إلى النظام لتمنحه مرة واحدة.

02

أملِ مطالبتك

يتحوّل الزر إلى وضع التسجيل: حالة نابضة مع موجة صوتية حية تُظهر مستوى إدخالك في الوقت الحقيقي، لتعرف أن الميكروفون يلتقط الصوت فعلاً. قل كل ما تريد أن يعرفه وكيلك، بلغتك أنت.

03

أوقف التسجيل، فيتولّى التحويل

انقر مجدداً للإيقاف. يُرسَل الصوت إلى نموذج التحويل الذي اخترته (GPT-4o Transcribe افتراضياً، أو GPT-4o mini Transcribe، أو Whisper من OpenAI). يُظهر الزر حالة تحويل بينما يجري التعرف على الكلام وتحويل الكلام إلى نص.

04

يصل النص المحوّل عند مؤشرك

يُدرَج النص المحوّل في المسودة عند موضع المؤشر، مع مسافة فاصلة عند الحاجة. يُستعاد موضع مؤشرك، فتتابع الكتابة أو تملي مقطعاً آخر. تمتزج الكتابة والإملاء بحرية في المطالبة نفسها.

05

راجع وحرّر

لا شيء أُرسِل بعد. تبقى المطالبة في المسودة. اقرأها، صحّح الكلمة النادرة التي أساء النموذج سماعها، أضف سطراً بلوحة المفاتيح، أعد ترتيب جملة. تبقى مسيطراً تماماً على ما يتلقاه وكيلك فعلاً.

06

أرسل حين تكون مستعداً

اضغط Enter لإرسال المطالبة إلى وكيلك، تماماً كأي رسالة مكتوبة. من وجهة نظر الوكيل هو مجرد نص، لذا يعمل الإملاء الصوتي بالطريقة نفسها مع Claude Code وCodex وGemini CLI وOpenCode وAider.

مطالبات أسرع، رموز أقل

لماذا إملاء مطالبة أفضل منذ البداية أرخص من كتابة مطالبة هزيلة ثم التكرار عليها.

المطالبة الهزيلة مكلفة بطريقة لا تظهر على الساعة. لا يملك الوكيل ما يكفي ليبني عليه، فيخمّن، فتصحّح، فيعيد قراءة السياق كله، فتصحّح مجدداً. كل جولة من هذه هي رموز إدخال ورموز إخراج وقراءات من الذاكرة المؤقتة. ثلاث جولات لتوضيح ميزة قد تكلّف أكثر من الميزة نفسها.

الإملاء الصوتي يقلب المعادلة الاقتصادية. لأن الكلام سريع، تحمّل السياق مقدّماً: القيود، ومسارات الملفات، والسلوك الواجب تجنّبه، والمثال الذي يدور في ذهنك. يصيب الوكيل الهدف أقرب إلى المحاولة الأولى. تستبدل ثلاثين ثانية من الإملاء بدورتي توضيح أو ثلاث تتجنّبها.

وهذا يتراكم. اليوم العادي عشرات المطالبات. إذا وفّر الإملاء الصوتي جولة واحدة على جزء كبير منها، تتكدّس الرموز الموفّرة على مدى اليوم، وعبر الفريق، وعبر الشهر. أرخص رمز هو الذي لم تضطر قط إلى إنفاقه لتعيد شرح نفسك.

كما أنه ببساطة احتكاك أقل. الاحتكاك الأقل يعني أنك تكتب فعلاً المطالبة الأطول والأفضل بدلاً من السطر الواحد الكسول الذي كنت ستكتبه لأن كتابة النسخة الكاملة بدت عملاً مرهقاً. الإملاء الصوتي يجعل المطالبة الجيدة هي المطالبة السهلة.

اختر نموذج التحويل ولغتك

الإملاء الصوتي على سطح المكتب يتيح لك اختيار نموذج تحويل الكلام إلى نص واللغة المنطوقة في الإعدادات.

نماذج التحويل (سطح المكتب)

  • GPT-4o Transcribe (الافتراضي، أفضل جودة متعددة اللغات)
  • GPT-4o mini Transcribe (دقيق تقريباً بالقدر نفسه، وأرخص)
  • Whisper من OpenAI، whisper-1 (تسعير بسيط بالدقيقة، وأساس متعدد اللغات متين)

اللغات المنطوقة

  • الاكتشاف التلقائي (الافتراضي، النموذج يستنتج اللغة)
  • English, Français, Español, Deutsch, Italiano, Português
  • Русский, 中文, 日本語, 한국어
  • العربية, हिन्दी, Bahasa Indonesia, Polski, Türkçe, Tiếng Việt

الاكتشاف التلقائي هو الافتراضي ويتولّى معظم الحالات. أجبِر لغة بعينها حين تُكتشف التسجيلات القصيرة خطأً، لكن لا تُجبِر إلا اللغة التي تتحدث بها فعلاً. ست عشرة لغة إضافة إلى الاكتشاف التلقائي، فتملي بكلماتك ويتلقى وكيلك نصاً نظيفاً.

ماذا يفعل الإملاء الصوتي فعلاً تحت الغطاء

على سطح المكتب، يسجّل المحرّر صوتك عبر واجهة المتصفح MediaRecorder ويرسل الصوت إلى خادم التحويل الخلفي في AgentsRoom. يجري التحويل على جانب الخادم بالنموذج الذي اخترته، فلا يعتمد العبء الثقيل لتحويل الكلام إلى نص على جهازك، ويعود النص نصاً صرفاً يُدرَج عند مؤشرك. الميكروفون والتسجيل والإدراج كلها جزء من المحرّر نفسه الذي تكتب فيه أصلاً.

على الموبايل، يعمل الإملاء الصوتي بطريقة مختلفة عن قصد. يستخدم التطبيق المرافق التعرف على الكلام على الجهاز، فلا يغادر الصوت هاتفك أبداً. ثم يُمرَّر النص المُتعرَّف عليه إلى سطح المكتب عبر اتصال AgentsRoom المشفّر طرفاً إلى طرف ويُسقَط في حقل إدخال الوكيل الذي ركّزت عليه على الـ Mac. اضغط مطوّلاً على زر الميكروفون، تحدّث، ارفع إصبعك، فيظهر النص في وكيل سطح المكتب لديك.

تتشارك الواجهتان قاعدة واحدة: الإملاء الصوتي لا يرسل من تلقاء نفسه أبداً. على سطح المكتب يصل النص المحوّل إلى المسودة للمراجعة. على الموبايل يُلصَق النص في حقل إدخال الوكيل المركَّز عليه دون فاصل سطر، فتظل أنت من يضغط Enter. الإملاء وسيلة لكتابة المطالبة، لا وسيلة لإطلاقها بشكل أعمى.

الإعداد محايد تجاه المزوّد. تشير معرّفات نماذج التحويل إلى خادم تحويل الكلام إلى نص، لا إلى واجهة سطر أوامر وكيلك. سواء كان وكيلك Claude Code أو Codex أو Gemini CLI أو OpenCode أو Aider، فالنص المملى مجرد نص في المحرّر، لذا يتصرف الإملاء الصوتي على نحو متطابق عبر كل مزوّد يدعمه AgentsRoom.

أين يعمل الإملاء الصوتي

مدمج في محرّر سطح المكتب والتطبيق المرافق على الموبايل، بست عشرة لغة.

محرّر سطح المكتب

زر ميكروفون في محرّر الوكيل على macOS. تحويل على جانب الخادم عبر GPT-4o Transcribe أو GPT-4o mini Transcribe أو Whisper. موجة صوتية حية أثناء التسجيل، ونص يُدرَج عند المؤشر، بحرية مزجه مع الكتابة. اختر نموذجك ولغتك في الإعدادات.

التطبيق المرافق على الموبايل

على المرافق على iOS وAndroid، اضغط مطوّلاً على الميكروفون لتملي. يجري التعرف على الكلام على الجهاز فيبقى الصوت على الهاتف، ويُمرَّر النص المُتعرَّف عليه مشفّراً طرفاً إلى طرف إلى وكيل سطح المكتب المركَّز عليه. أسرع طريقة لتغذية وكيل من جيبك.

متعدد اللغات

ست عشرة لغة منطوقة إضافة إلى الاكتشاف التلقائي: الإنجليزية والفرنسية والإسبانية والألمانية والإيطالية والبرتغالية والروسية والصينية واليابانية والكورية والعربية والهندية والإندونيسية والبولندية والتركية والفيتنامية. أملِ بلغتك الأم، ويتلقى وكيلك نصاً محوّلاً نظيفاً.

كتابة المطالبات مقابل إملائها

الوكيل نفسه، المهمة نفسها. سرعة مختلفة، وسياق مختلف، وفاتورة رموز مختلفة.

كتابة كل مطالبة

  • : أنت تكتب بجزء بسيط من سرعة كلامك، فتبقى المطالبات قصيرة.
  • : المطالبات القصيرة تتجاوز السياق، فيخمّن الوكيل وتصحّحه أنت.
  • : كل تصحيح جولة أخرى، ومزيد من رموز الإدخال والإخراج.
  • : تطبيق إملاء منفصل أو إملاء النظام يعني النسخ واللصق بين النوافذ.
  • : على الهاتف، تجعل لوحة مفاتيح الموبايل المطالبات الطويلة مؤلمة، فلا تكاد تملي مطالبات أصلاً.

الإملاء بالإملاء الصوتي

  • : تملي المطالبة كاملة في ثوانٍ، فتقول أكثر بطبيعة الحال.
  • : سياق أوفر مقدّماً يعني أن الوكيل ينجز المهمة أقرب إلى المحاولة الأولى.
  • : جولات توضيح أقل تعني رموزاً أقل تُنفَق على النتيجة نفسها.
  • : الميكروفون في المحرّر، والنص المحوّل يصل إلى المسودة، بلا نسخ ولصق.
  • : على الهاتف، اضغط مطوّلاً على الميكروفون فيظهر النص في وكيل سطح المكتب عبر المُرحِّل المشفّر.

الإملاء الصوتي هو أرخص طريقة لجعل كل مطالبة أطول وأدق وأسرع كتابةً في الوقت نفسه.

كيف تبدو المطالبة المملاة

لا تضطر إلى كتابة أيٍّ من هذا. تقوله بصوت عالٍ، فيحوّله تحويل الكلام إلى نص إلى المطالبة أدناه، وتضغط Enter. جرّب قول مطالبة بهذا التفصيل عبر كتابتها وأحسّ كم تستغرق.

مملاة في الميكروفون

أضف rate limiter إلى endpoint تسجيل الدخول (login).
استخدم نافذة منزلقة من خمس محاولات في الدقيقة لكل IP.
أعِد 429 مع ترويسة Retry-After عند بلوغ الحد.
اترك مسار النجاح الحالي كما هو دون مساس.
أضف اختبار وحدة لبلوغ الحد وآخر لإعادة الضبط بعد دقيقة.
لا تمسّ endpoint التسجيل (signup).
لا شيء يُرسَل تلقائياً
الإملاء الصوتي يكتب في المسودة، لا في الإرسال أبداً. تقرأ النص المحوّل دائماً، تحرّره، وتضغط Enter بنفسك. الإملاء لوحة مفاتيح أسرع، لا طيار آلي.
على الجهاز على الموبايل
على الهاتف، يجري التعرف على الكلام على الجهاز: لا يغادر الصوت جهازك أبداً. ينتقل النص المُتعرَّف عليه إلى الـ Mac عبر مُرحِّل AgentsRoom المشفّر طرفاً إلى طرف.
يعمل مع كل وكيل
النص المملى مجرد نص في المحرّر، لذا يعمل الإملاء الصوتي بالطريقة نفسها مع Claude Code وCodex وGemini CLI وOpenCode وAider. محايد تجاه المزوّد بحكم التصميم.

FAQ

ما الإملاء الصوتي في AgentsRoom؟

الإملاء الصوتي زر ميكروفون في محرّر الوكيل يحوّل كلامك إلى نص. تنقر الميكروفون، تملي مطالبتك، فيُدرَج النص المحوّل في المسودة عند مؤشرك. إنه تحويل كلام إلى نص مدمج لكتابة المطالبات لوكلاء البرمجة الذكيين لديك، بلا تطبيق إملاء منفصل وبلا نسخ ولصق بين النوافذ.

لماذا أملي مطالباتي بدلاً من كتابتها؟

السرعة والدقة واقتصاد الرموز. أنت تتحدث أسرع بأضعاف من كتابتك، فتأخذ المطالبات ثوانٍ بدلاً من دقائق. ولأن الإملاء رخيص، تقول أكثر بطبيعة الحال، ما يجعل المطالبة أدق. والمطالبة الدقيقة تعني جولات توضيح أقل مع الوكيل، ما يعني رموزاً أقل للوصول إلى النتيجة نفسها.

أي نماذج تحويل يمكنني استخدامها؟

على سطح المكتب تختار من ثلاثة نماذج لتحويل الكلام إلى نص في الإعدادات: GPT-4o Transcribe (الافتراضي، أفضل جودة متعددة اللغات)، وGPT-4o mini Transcribe (دقيق تقريباً بالقدر نفسه وأرخص)، وWhisper من OpenAI، النموذج whisper-1، بتسعير بسيط بالدقيقة وأساس متعدد اللغات متين.

أهو مجرد Whisper من OpenAI؟

Whisper أحد النماذج التي يمكنك اختيارها، مدمج مباشرة في المحرّر بدلاً من تشغيله كتطبيق منفصل على الجانب. يمكنك أيضاً اختيار GPT-4o Transcribe أو GPT-4o mini Transcribe. مغزى الإملاء الصوتي في AgentsRoom أن الإملاء يستهدف حقل إدخال مطالبة وكيلك مباشرة، فلا تملي في نافذة لتنسخ وتلصق في أخرى.

ما اللغات التي يدعمها الإملاء الصوتي؟

ست عشرة لغة منطوقة إضافة إلى الاكتشاف التلقائي: الإنجليزية والفرنسية والإسبانية والألمانية والإيطالية والبرتغالية والروسية والصينية واليابانية والكورية والعربية والهندية والإندونيسية والبولندية والتركية والفيتنامية. الاكتشاف التلقائي هو الافتراضي. يمكنك إجبار لغة بعينها في الإعدادات حين تُكتشف التسجيلات القصيرة خطأً.

هل يُرسَل صوتي إلى خادم؟

يعتمد ذلك على الواجهة. على سطح المكتب، يُرسَل الصوت إلى خادم التحويل الخلفي في AgentsRoom، الذي يشغّل تحويل الكلام إلى نص بالنموذج الذي اخترته ويعيد النص. على الموبايل، يجري التعرف على الكلام على الجهاز، فلا يغادر الصوت هاتفك أبداً ويُمرَّر النص المُتعرَّف عليه فقط إلى سطح المكتب عبر الاتصال المشفّر طرفاً إلى طرف.

هل تُرسَل المطالبة تلقائياً بعد إملائها؟

لا. الإملاء الصوتي يُوصِل النص دائماً إلى المسودة، لا إلى الإرسال أبداً. تقرأ النص المحوّل، تصحّح الكلمة النادرة المسموعة خطأً، تضيف أو تعيد الترتيب بلوحة المفاتيح إن أردت، وتضغط Enter حين تكون مستعداً. تبقى مسيطراً على ما يتلقاه وكيلك بالضبط.

هل يمكنني مزج الكتابة والإملاء في المطالبة نفسها؟

نعم. يُدرَج النص المحوّل عند مؤشرك، لا محلّ المسودة كاملة. فتكتب النصف الأول، تملي فقرة طويلة في الوسط، ثم تكتب سطراً أخيراً. الإملاء الصوتي طريقة أسرع لملء المحرّر، متوافق تماماً مع لوحة المفاتيح.

هل يمكنني الإملاء من هاتفي إلى وكيل على الـ Mac؟

نعم. للتطبيق المرافق على الموبايل زر ميكروفون: اضغط عليه مطوّلاً، تحدّث، ارفع إصبعك. يُتعرَّف على الكلام على الجهاز ويُمرَّر النص مشفّراً طرفاً إلى طرف إلى الوكيل الذي ركّزت عليه على سطح المكتب. إنها أسرع طريقة لتغذية مطالبة إلى وكيل الـ Mac دون استخدام لوحة مفاتيح الموبايل.

هل يعمل الإملاء الصوتي مع Claude Code وCodex وGemini؟

نعم، مع جميعها، إضافة إلى OpenCode وAider. النص المملى مجرد نص في المحرّر، وإعداد التحويل محايد تجاه المزوّد، لذا يتصرف الإملاء الصوتي على نحو متطابق مهما كانت واجهة سطر أوامر الوكيل التي تشغّلها.

يتناسب مع

تحدّث إلى وكلائك، وكفّ عن كتابة المطالبات

نزّل AgentsRoom وأملِ مطالباتك مباشرة في المحرّر. أسرع كتابةً، أغنى سياقاً، أخفّ على الرموز. إملاء صوتي مدمج في بيئة تطوير وكلاء الذكاء الاصطناعي لديك، على سطح المكتب وعلى الموبايل.

مجانيتحميل AgentsRoom

التطبيق المرافق: تابع وكلاءك أينما كنت

استخدم Claude أو Codex أو Gemini CLI أو أي مزود AI آخر.

تثبيت الملحق
Chrome Web Store

أرسل الأخطاء والطلبات مباشرة إلى قائمة المهام العامة.

لمحة عن AgentsRoom أثناء العمل.

مشاريع متعددة
متعدد المزوّدين
وكلاء متعددون
حالة مباشرة
فرق الملفات والإيداع
تطبيق الهاتف
معاينة مباشرة
فرق الوكلاء
أتمتة المتصفح
تطوير موجّه بالـ backlog
مكتبة البرومبت
مكتبة المهارات
عرض جميع الميزات