Sesli dikte: prompt'larınızı dikte edin, ajanınız kodlasın

Prompt yazmayı bırakın.
Onları dikte edin.

Sesli dikte doğrudan ajan composer'ının içinde yaşar. Mikrofona tıklayın, prompt'unuzu konuşun, konuşmadan metne çevrilen yazı imlecinizin olduğu yerde taslağa düşsün. Yapay zeka kodlama ajanlarınız için konuşmadan metne dönüşüm: izlemeniz gereken ayrı bir dikte uygulaması ve pencereler arası kopyala yapıştır olmadan.

Uzun ve hassas bir prompt yazmak dakikalar alır. Aynı prompt'u dikte etmek saniyeler sürer. Ajanınıza daha fazla bağlam, daha az açıklama gidiş gelişi, daha az boşa giden token. Değer koddan prompt'a kaydı ve iyi bir prompt yazmanın en hızlı yolu sesli dikte.

Sesli dikte iş başında: mikrofona tıklayın, prompt'u konuşun, canlı ses dalga formunu izleyin ve konuşmadan metne dökümü composer'a düşsün, düzenlemeye ve göndermeye hazır.

Sesli dikte işte bu değişime yanıt veriyor. Bir yapay zeka kodlama ajanıyla çalışmanın zor kısmı artık kod yazmak değil, onu ajan yapıyor. Zor kısım prompt'u yazmak: ne istediğinizi, kısıtları, sınır durumlarını, dokunulacak dosyayı, kaçınılacak davranışı tarif etmek. Hassas bir prompt, tek seferde başarmakla on sinir bozucu gidiş gelişten geçmek arasındaki farktır. Ve hassas bir prompt uzundur, bu da onu yazmayı yavaşlatır.

Sesli dikte yazma vergisini ortadan kaldırır. Composer'daki mikrofon düğmesine tıklarsınız, yazacağınız her şeyi söylersiniz, çoğu zaman yazmaya zahmet edeceğinizden daha fazlasını, ve konuşmadan metne çevrilen döküm taslakta belirir. Dakikada 150 kelime konuşursunuz, dakikada 150 kelime yazamazsınız. Dikte etmek basitçe daha hızlıdır ve daha hızlı bir kanal, ajanınıza görev başına daha fazla bağlam vermeniz demektir.

Bu sonradan eklenmiş bir parça değil. Mikrofon, AgentsRoom composer'ının bir parçasıdır, prompt kütüphanesi ve çizim araçlarının yanında. Döküm imlecinizin olduğu yere eklenir, böylece aynı taslakta yazmayı ve dikte etmeyi karıştırabilirsiniz. Hiçbir şey otomatik gönderilmez: metin taslağa düşer, okursunuz, modelin yanlış duyduğu o tek kelimeyi düzeltirsiniz ve hazır olduğunuzda Enter'a basarsınız. Buradaki sesli dikte bir yazma yardımcısıdır, otomatik pilot değil.

AgentsRoom composer'ında sesli dikte: bir mikrofon düğmesi kullanıcının sesini kaydeder ve konuşmadan metne dökümü ajan prompt taslağına eklenir, canlı bir ses dalga formu görselleştiricisiyle

Mikrofon düğmesi composer araç çubuğunda yer alır. Kayıt sırasında canlı bir ses dalga formu giriş seviyesini gösterir, ardından metne çevrilen prompt taslakta belirir.

Prompt'larınızı yazmak yerine neden dikte etmelisiniz

Hız. Yazdığınızdan çok daha hızlı konuşursunuz ve tuş ararken düşüncenizin akışını kaybetmezsiniz. Yazması üç dakika sürecek iki paragraflık bir prompt, otuz saniyelik bir sesli diktedir. Ajanlarınıza prompt gönderdiğiniz tam bir gün boyunca bu kazanılan zaman gerçek saatlere ulaşır.

Hassasiyet. Dikte etmek ucuz olduğu için daha fazlasını söylersiniz. Atlayacağınız sınır durumunu, adını vermeyeceğiniz dosyayı, kaçınılmasını istediğiniz davranışı tarif edersiniz. Daha zengin bir prompt daha hassas bir prompt'tur ve daha hassas bir prompt, bir yapay zeka kodlama ajanının görevi ilk denemede başarmasını sağlayan şeyin tam kendisidir.

Token ekonomisi. Bir ajanla yapılan her açıklama gidiş gelişi token harcar: ajan sorar, siz cevaplarsınız, bağlamı yeniden okur. Baştan dikte edilen hassas bir prompt bu gidiş gelişleri ortadan kaldırır. Daha az ileri geri, aynı sonuca ulaşmak için daha az token harcanması demektir, bu da yapay zeka kodlama faturanızdan doğrudan bir tasarruftur.

Eller serbest ve mobil. Masaüstünde bir ajan çalışırken ellerinizi serbest tutar ve bir sonraki prompt'u sesli dikte edersiniz. Telefonda sesli dikte, mobil klavyeyle boğuşmadan bir ajanı beslemenin tek ve en hızlı yoludur. Fikri söyleyin, Mac'teki ajanınıza düşsün.

Sesli dikte nasıl çalışır

Mikrofona tıklayın, konuşun, gözden geçirin, gönderin. Dört adım, ayrı uygulama yok, kopyala yapıştır yok.

01

Composer'da mikrofona tıklayın

İmlecinizi ajan composer'ına yerleştirin ve araç çubuğundaki mikrofon düğmesine tıklayın. İlk seferinde macOS mikrofon izni ister, AgentsRoom bu isteği sisteme yönlendirir, böylece izni bir kez verirsiniz.

02

Prompt'unuzu konuşun

Düğme kayda geçer: giriş seviyenizi gerçek zamanlı gösteren canlı bir ses dalga formuyla nabız gibi atan bir durum, böylece mikrofonun gerçekten ses yakaladığını bilirsiniz. Ajanınızın bilmesini istediğiniz her şeyi kendi dilinizde söyleyin.

03

Durdurun, döküm yapsın

Durdurmak için tekrar tıklayın. Ses, seçtiğiniz döküm modeline gönderilir (varsayılan olarak GPT-4o Transcribe, GPT-4o mini Transcribe veya OpenAI Whisper). Konuşmadan metne dönüşüm çalışırken düğme bir döküm durumu gösterir.

04

Döküm imlecinizin olduğu yere düşer

Metne çevrilen yazı, gerektiğinde ayırıcı bir boşlukla taslakta imlecin olduğu yere eklenir. İmleç konumunuz geri yüklenir, böylece yazmaya devam edebilir veya başka bir parça dikte edebilirsiniz. Yazma ve dikte etme aynı prompt içinde özgürce karışır.

05

Gözden geçirin ve düzenleyin

Henüz hiçbir şey gönderilmez. Prompt taslakta durur. Okuyun, modelin yanlış duyduğu nadir kelimeyi düzeltin, klavyeyle bir satır ekleyin, bir cümleyi yeniden düzenleyin. Ajanınızın gerçekte ne aldığı konusunda tam kontrol sizde kalır.

06

Hazır olduğunuzda gönderin

Prompt'u tam olarak yazılmış bir mesaj gibi ajanınıza göndermek için Enter'a basın. Ajan açısından bu yalnızca metindir, bu yüzden sesli dikte Claude Code, Codex, Gemini CLI, OpenCode ve Aider ile aynı şekilde çalışır.

Daha hızlı prompt'lar, daha az token

Baştan daha iyi bir prompt dikte etmek, neden zayıf bir tane yazıp üzerinde döngüye girmekten daha ucuz?

Zayıf bir prompt, saatte görünmeyen bir şekilde pahalıdır. Ajanın elinde yeterince şey yoktur, bu yüzden tahmin eder, siz düzeltirsiniz, tüm bağlamı yeniden okur, siz tekrar düzeltirsiniz. Bu turların her biri giriş token'ları, çıkış token'ları ve önbellek okumalarıdır. Bir özelliği netleştirmek için üç gidiş geliş, özelliğin kendisinden daha pahalıya patlayabilir.

Sesli dikte bu ekonomiyi tersine çevirir. Konuşmak hızlı olduğu için bağlamı baştan yüklersiniz: kısıtları, dosya yollarını, kaçınılacak davranışı, aklınızdaki örneği. Ajan işi ilk denemeye daha yakın doğru yapar. Otuz saniyelik bir dikteyi, kaçınılan iki üç açıklama döngüsüyle takas edersiniz.

Bu birikir. Normal bir gün düzinelerce prompt demektir. Sesli dikte bunların önemli bir kısmında bir gidiş gelişten tasarruf sağlıyorsa, kazanılan token'lar gün boyunca, ekip boyunca, ay boyunca üst üste yığılır. En ucuz token, kendinizi yeniden anlatmak için harcamak zorunda kalmadığınız token'dır.

Ayrıca bu basitçe daha az sürtünme demektir. Daha az sürtünme, tam sürümü yazmak çok zahmetli geldiği için yazacağınız tembel tek satırlık yerine, daha uzun ve daha iyi prompt'u gerçekten yazmanız demektir. Sesli dikte iyi prompt'u kolay prompt haline getirir.

Döküm modelinizi ve dilinizi seçin

Masaüstünde sesli dikte, ayarlardan konuşmadan metne modelini ve konuşulan dili seçmenize izin verir.

Döküm modelleri (masaüstü)

  • GPT-4o Transcribe (varsayılan, en iyi çok dilli kalite)
  • GPT-4o mini Transcribe (neredeyse aynı isabette, daha ucuz)
  • OpenAI Whisper, whisper-1 (basit dakika başı fiyatlandırma, sağlam çok dilli temel)

Konuşulan diller

  • Otomatik algılama (varsayılan, dili model belirler)
  • English, Français, Español, Deutsch, Italiano, Português
  • Русский, 中文, 日本語, 한국어
  • العربية, हिन्दी, Bahasa Indonesia, Polski, Türkçe, Tiếng Việt

Otomatik algılama varsayılandır ve çoğu durumu halleder. Kısa kayıtlar yanlış algılandığında belirli bir dili zorlayın, ama yalnızca gerçekten konuştuğunuz dili zorlayın. On altı dil artı otomatik algılama, böylece kendi sözcüklerinizle dikte edersiniz ve ajanınız temiz metin alır.

Sesli dikte kaputun altında gerçekte ne yapar

Masaüstünde composer, sesinizi tarayıcının MediaRecorder API'siyle kaydeder ve sesi AgentsRoom döküm arka ucuna gönderir. Döküm, seçtiğiniz modelde sunucu tarafında çalışır, böylece ağır konuşmadan metne işi makinenize bağlı kalmaz ve döküm imlecinize eklenmiş düz metin olarak geri döner. Mikrofon, kayıt ve ekleme; hepsi zaten yazdığınız aynı composer'ın parçasıdır.

Mobilde sesli dikte bilinçli olarak farklı çalışır. Eşlik eden uygulama cihaz üzerinde konuşma tanıma kullanır, böylece ses telefonunuzdan hiç ayrılmaz. Tanınan metin ardından AgentsRoom uçtan uca şifreli bağlantı üzerinden masaüstüne aktarılır ve Mac'te odaklandığınız ajanın girişine bırakılır. Mikrofon düğmesini basılı tutun, konuşun, bırakın, metin masaüstü ajanınızda belirsin.

Her iki yüzey de tek bir kuralı paylaşır: sesli dikte asla kendi başına göndermez. Masaüstünde döküm gözden geçirme için taslağa düşer. Mobilde metin, satır sonu olmadan odaklanılan ajan girişine yapıştırılır, böylece Enter'a yine de kendiniz basarsınız. Dikte, prompt'u yazmanın bir yoludur, onu körlemesine ateşlemenin değil.

Yapılandırma sağlayıcıdan bağımsızdır. Döküm modeli kimlikleri konuşmadan metne arka ucuna eşlenir, ajan CLI'nize değil. Ajanınız ister Claude Code, Codex, Gemini CLI, OpenCode ya da Aider olsun, dikte edilen metin composer'da yalnızca metindir, bu yüzden sesli dikte AgentsRoom'un desteklediği her sağlayıcıda aynı şekilde davranır.

Sesli dikte nerelerde çalışır

Masaüstü composer'ına ve mobil eşlikçiye gömülü, on altı dilde.

Masaüstü composer

macOS'te ajan composer'ında bir mikrofon düğmesi. GPT-4o Transcribe, GPT-4o mini Transcribe veya Whisper üzerinde sunucu tarafı döküm. Kayıt sırasında canlı ses dalga formu, imlece eklenen döküm, yazmayla özgürce karıştırılabilir. Modelinizi ve dilinizi ayarlardan seçin.

Mobil eşlikçi

iOS ve Android eşlikçide dikte etmek için mikrofonu basılı tutun. Konuşma tanıma cihaz üzerinde çalışır, böylece ses telefonda kalır ve tanınan metin uçtan uca şifreli olarak odaklanılan masaüstü ajanına aktarılır. Cebinizden bir ajanı beslemenin en hızlı yolu.

Çok dilli

On altı konuşulan dil artı otomatik algılama: İngilizce, Fransızca, İspanyolca, Almanca, İtalyanca, Portekizce, Rusça, Çince, Japonca, Korece, Arapça, Hintçe, Endonezce, Lehçe, Türkçe ve Vietnamca. Kendi ana dilinizde dikte edin, ajanınız temiz, metne çevrilmiş yazı alsın.

Prompt yazmak ile dikte etmek karşılaştırması

Aynı ajan, aynı görev. Farklı hız, farklı bağlam, farklı token faturası.

Her prompt'u yazmak

  • : Konuşma hızınızın bir kesri kadar yazarsınız, bu yüzden prompt'lar kısa kalır.
  • : Kısa prompt'lar bağlamı atlar, bu yüzden ajan tahmin eder ve siz düzeltirsiniz.
  • : Her düzeltme bir gidiş geliş daha, daha fazla giriş ve çıkış token'ı demektir.
  • : Ayrı bir dikte uygulaması veya sistem diktesi, pencereler arası kopyala yapıştır demektir.
  • : Telefonda mobil klavye uzun prompt'ları zahmetli kılar, bu yüzden neredeyse hiç prompt yazmazsınız.

Sesli dikte ile dikte etmek

  • : Tam prompt'u saniyeler içinde konuşursunuz, bu yüzden doğal olarak daha fazlasını söylersiniz.
  • : Baştan daha fazla bağlam, ajanın görevi ilk denemeye daha yakın başarması demektir.
  • : Daha az açıklama gidiş gelişi, aynı sonuç için daha az token harcanması demektir.
  • : Mikrofon composer'da, döküm taslağa düşer, kopyala yapıştır yok.
  • : Telefonda mikrofonu basılı tutun, metin şifreli aktarım üzerinden masaüstü ajanınızda belirsin.

Sesli dikte; her prompt'u aynı anda daha uzun, daha hassas ve yazması daha hızlı hale getirmenin en ucuz yoludur.

Dikte edilen bir prompt nasıl duyulur

Bunların hiçbirini yazmak zorunda değilsiniz. Yüksek sesle söylersiniz, konuşmadan metne dönüşüm onu aşağıdaki prompt'a çevirir ve Enter'a basarsınız. Bu kadar ayrıntılı bir prompt'u yazarak söylemeyi deneyin ve ne kadar uzun sürdüğünü hissedin.

Mikrofona söylendi

Login endpoint'ine bir rate limiter ekle.
IP başına dakikada beş denemelik bir kayan pencere kullan.
Limit aşıldığında Retry-After header'ı ile bir 429 döndür.
Mevcut başarı yolunu olduğu gibi bırak.
Limite ulaşılması için bir birim testi ve bir dakika sonra sıfırlanması için bir tane ekle.
Signup endpoint'ine dokunma.
Hiçbir şey otomatik gönderilmez
Sesli dikte taslağa yazar, asla göndermeye değil. Dökümü her zaman okur, düzenler ve Enter'a kendiniz basarsınız. Dikte daha hızlı bir klavyedir, otomatik pilot değil.
Mobilde cihaz üzerinde
Telefonda konuşma tanıma cihaz üzerinde çalışır: ses cihazınızdan hiç ayrılmaz. Tanınan metin, AgentsRoom uçtan uca şifreli aktarım üzerinden Mac'inize gider.
Her ajanla çalışır
Dikte edilen metin composer'da yalnızca metindir, bu yüzden sesli dikte Claude Code, Codex, Gemini CLI, OpenCode ve Aider ile aynı şekilde çalışır. Tasarım gereği sağlayıcıdan bağımsız.

FAQ

AgentsRoom'da sesli dikte nedir?

Sesli dikte, ajan composer'ında konuşmanızı metne çeviren bir mikrofon düğmesidir. Mikrofona tıklarsınız, prompt'unuzu konuşursunuz ve metne çevrilen yazı imlecinizin olduğu yerde taslağa eklenir. Yapay zeka kodlama ajanlarınıza prompt yazmak için gömülü konuşmadan metne dönüşümdür: ayrı bir dikte uygulaması ve pencereler arası kopyala yapıştır olmadan.

Neden prompt'larımı yazmak yerine dikte edeyim?

Hız, hassasiyet ve token ekonomisi. Yazdığınızdan birkaç kat daha hızlı konuşursunuz, bu yüzden prompt'lar dakikalar yerine saniyeler alır. Dikte etmek ucuz olduğu için doğal olarak daha fazlasını söylersiniz, bu da prompt'u daha hassas kılar. Hassas bir prompt, ajanla daha az açıklama gidiş gelişi demektir, bu da aynı sonuca ulaşmak için daha az token harcanması demektir.

Hangi döküm modellerini kullanabilirim?

Masaüstünde ayarlardan üç konuşmadan metne modeli arasından seçim yaparsınız: GPT-4o Transcribe (varsayılan, en iyi çok dilli kalite), GPT-4o mini Transcribe (neredeyse aynı isabette ve daha ucuz) ve OpenAI Whisper, yani basit dakika başı fiyatlandırma ile sağlam bir çok dilli temele sahip whisper-1 modeli.

Bu sadece OpenAI Whisper mı?

Whisper, seçebileceğiniz modellerden biridir, yanda ayrı bir uygulama olarak çalışmak yerine doğrudan composer'a gömülüdür. GPT-4o Transcribe veya GPT-4o mini Transcribe'ı da seçebilirsiniz. AgentsRoom sesli diktenin amacı, diktenin doğrudan ajanınızın prompt girişini hedeflemesidir, böylece bir pencereye dikte edip başka bir pencereye kopyala yapıştır yapmazsınız.

Sesli dikte hangi dilleri destekler?

On altı konuşulan dil artı otomatik algılama: İngilizce, Fransızca, İspanyolca, Almanca, İtalyanca, Portekizce, Rusça, Çince, Japonca, Korece, Arapça, Hintçe, Endonezce, Lehçe, Türkçe ve Vietnamca. Otomatik algılama varsayılandır. Kısa kayıtlar yanlış algılandığında ayarlardan belirli bir dili zorlayabilirsiniz.

Sesim bir sunucuya gönderiliyor mu?

Yüzeye bağlı. Masaüstünde ses, konuşmadan metne dönüşümü seçtiğiniz modelde çalıştırıp metni döndüren AgentsRoom döküm arka ucuna gönderilir. Mobilde konuşma tanıma cihaz üzerinde çalışır, böylece ses telefonunuzdan hiç ayrılmaz ve yalnızca tanınan metin uçtan uca şifreli bağlantı üzerinden masaüstüne aktarılır.

Dikte ettikten sonra prompt otomatik gönderiliyor mu?

Hayır. Sesli dikte metni her zaman taslağa düşürür, asla göndermeye değil. Dökümü okursunuz, nadir görülen yanlış duyulmuş kelimeyi düzeltirsiniz, isterseniz klavyeyle ekler veya yeniden düzenlersiniz ve hazır olduğunuzda Enter'a basarsınız. Ajanınızın tam olarak ne aldığı konusunda kontrol sizde kalır.

Aynı prompt'ta yazma ve dikte etmeyi karıştırabilir miyim?

Evet. Döküm, tüm taslağın yerine değil, imlecinizin olduğu yere eklenir. Böylece ilk yarısını yazabilir, ortasına uzun bir paragraf dikte edebilir, sonra son bir satır yazabilirsiniz. Sesli dikte composer'ı doldurmanın daha hızlı bir yoludur, klavyeyle tamamen uyumlu.

Telefonumdan Mac'imdeki bir ajana dikte edebilir miyim?

Evet. Mobil eşlikçi uygulamasının bir mikrofon düğmesi vardır: basılı tutun, konuşun, bırakın. Konuşma cihaz üzerinde tanınır ve metin masaüstünde odaklandığınız ajana uçtan uca şifreli olarak aktarılır. Mobil klavye kullanmadan Mac ajanınıza bir prompt göndermenin en hızlı yoludur.

Sesli dikte Claude Code, Codex ve Gemini ile çalışır mı?

Evet, hepsiyle, artı OpenCode ve Aider ile. Dikte edilen metin composer'da yalnızca metindir ve döküm yapılandırması sağlayıcıdan bağımsızdır, bu yüzden hangi ajan CLI'sini çalıştırırsanız çalıştırın sesli dikte aynı şekilde davranır.

Şunlarla iyi gider

Ajanlarınızla konuşun, prompt yazmayı bırakın

AgentsRoom'u indirin ve prompt'larınızı doğrudan composer'a dikte edin. Yazması daha hızlı, bağlam açısından daha zengin, token açısından daha hafif. Yapay zeka kodlama IDE'nize gömülü sesli dikte, masaüstünde ve mobilde.

ÜcretsizAgentsRoom'u Indir

Yardımcı uygulama: hareket halindeyken ajanlarinizi izleyin

Claude, Codex, Gemini CLI veya başka bir AI sağlayıcı kullan.

Uzantıyı yükleyin
Chrome Web Store

Hataları ve istekleri doğrudan genel backlogunuza gönderin.

AgentsRoom'a kısa bir bakış.

Çoklu proje
Çoklu sağlayıcı
Çoklu ajan
Canlı durum
Diff ve commit
Mobil uygulama
Canlı önizleme
Ajan ekipleri
Tarayıcı otomasyonu
Backlog odaklı dev
Prompt kütüphanesi
Beceri kütüphanesi
Tüm özellikleri gör