Berhenti mengetik prompt.
Diktekan saja.
Dikte suara hidup tepat di dalam composer agen. Klik mikrofon, ucapkan prompt Anda, dan teks hasil transkripsi langsung jatuh ke draf di posisi kursor. Ucapan ke teks untuk agen koding AI Anda, tanpa aplikasi dikte terpisah yang harus diurus dan tanpa salin-tempel antar jendela.
Mengetik prompt panjang dan presisi memakan menit. Mendikte prompt yang sama hanya butuh detik. Lebih banyak konteks untuk agen Anda, lebih sedikit putaran klarifikasi, lebih sedikit token terbuang. Nilai telah berpindah dari kode ke prompt, dan dikte suara adalah cara tercepat untuk menulis prompt yang baik.
Dikte suara beraksi : klik mik, ucapkan prompt, amati gelombang suara langsung, dan transkrip ucapan ke teks mendarat di composer siap diedit dan dikirim.
Inilah pergeseran yang dijawab oleh dikte suara. Bagian sulit dalam bekerja dengan agen koding AI bukan lagi menulis kode, agen yang melakukannya. Bagian sulitnya adalah menulis prompt : menggambarkan apa yang Anda mau, batasannya, kasus tepinya, berkas yang harus disentuh, perilaku yang harus dihindari. Prompt yang presisi adalah pembeda antara sekali jadi dan sepuluh putaran yang melelahkan. Dan prompt yang presisi itu panjang, sehingga lambat untuk diketik.
Dikte suara menghapus pajak mengetik. Anda klik tombol mikrofon di composer, Anda ucapkan semua yang akan Anda ketik, sering kali lebih banyak daripada yang akan repot Anda ketik, dan transkripsi ucapan ke teks muncul di draf. Anda bicara 150 kata per menit, Anda tidak mengetik 150 kata per menit. Mendikte memang lebih cepat, dan kanal yang lebih cepat berarti Anda memberi agen Anda lebih banyak konteks per tugas.
Ini bukan tempelan. Mikrofon adalah bagian dari composer AgentsRoom, di samping pustaka prompt dan alat sketsa. Transkrip disisipkan di posisi kursor Anda, jadi Anda bisa mencampur mengetik dan mendikte dalam draf yang sama. Tidak ada yang dikirim otomatis : teks mendarat di draf, Anda membacanya, memperbaiki satu kata yang salah didengar model, lalu menekan Enter saat siap. Dikte suara di sini adalah alat bantu menulis, bukan autopilot.

Tombol mikrofon berada di bilah alat composer. Saat merekam, gelombang suara langsung menampilkan level masukan, lalu prompt hasil transkripsi muncul di draf.
Kenapa mendiktekan prompt alih-alih mengetiknya
Kecepatan. Anda bicara beberapa kali lebih cepat daripada mengetik, dan Anda tidak kehilangan alur pikiran sambil mencari tombol. Prompt dua paragraf yang butuh tiga menit untuk diketik hanya butuh tiga puluh detik dikte suara. Sepanjang hari penuh mendikte prompt ke agen Anda, waktu itu terkumpul menjadi jam-jam nyata yang kembali ke Anda.
Presisi. Karena mendikte itu murah, Anda mengucapkan lebih banyak. Anda menggambarkan kasus tepi yang akan Anda lewati, berkas yang tidak akan Anda sebut namanya, perilaku yang ingin Anda hindari. Prompt yang lebih kaya adalah prompt yang lebih presisi, dan prompt yang lebih presisi itulah yang membuat agen koding AI menuntaskan tugas pada percobaan pertama.
Ekonomi token. Setiap putaran klarifikasi dengan agen menghabiskan token : agen bertanya, Anda menjawab, ia membaca ulang konteks. Prompt yang didiktekan secara presisi di awal meruntuhkan putaran-putaran itu. Lebih sedikit bolak-balik berarti lebih sedikit token terpakai untuk mencapai hasil yang sama, yang merupakan penghematan langsung pada tagihan AI Anda.
Bebas tangan dan mobile. Di desktop, tangan Anda tetap bebas sementara agen berjalan dan Anda mendiktekan prompt berikutnya dengan suara. Di ponsel, dikte suara adalah cara paling cepat untuk memberi makan agen tanpa berkutat dengan keyboard mobile. Ucapkan idenya, ia mendarat di agen Anda di Mac.
Cara kerja dikte suara
Klik mik, ucapkan, tinjau, kirim. Empat langkah, tanpa aplikasi terpisah, tanpa salin-tempel.
Klik mikrofon di composer
Tempatkan kursor Anda di composer agen dan klik tombol mik di bilah alat. Pertama kali, macOS meminta izin mikrofon, AgentsRoom mengarahkan permintaan itu ke sistem sehingga Anda memberikannya sekali saja.
Ucapkan prompt Anda
Tombol beralih ke perekaman : keadaan berdenyut dengan gelombang suara langsung yang menampilkan level masukan Anda secara real time, sehingga Anda tahu mik benar-benar menangkap audio. Ucapkan semua yang perlu diketahui agen Anda, dalam bahasa Anda sendiri.
Berhenti, lalu ia mentranskripsi
Klik lagi untuk berhenti. Audio dikirim ke model transkripsi yang Anda pilih (GPT-4o Transcribe secara default, GPT-4o mini Transcribe, atau OpenAI Whisper). Tombol menampilkan keadaan transkripsi sementara ucapan ke teks berjalan.
Transkrip mendarat di posisi kursor Anda
Teks hasil transkripsi disisipkan ke draf di posisi kursor, dengan spasi pemisah saat diperlukan. Posisi kursor Anda dipulihkan, jadi Anda bisa terus mengetik atau mendiktekan potongan lain. Mengetik dan mendikte bercampur bebas dalam prompt yang sama.
Tinjau dan edit
Belum ada yang dikirim. Prompt diam di draf. Bacalah, perbaiki kata langka yang salah didengar model, tambahkan satu baris lewat keyboard, susun ulang sebuah kalimat. Anda tetap memegang kendali penuh atas apa yang sebenarnya diterima agen Anda.
Kirim saat siap
Tekan Enter untuk mengirim prompt ke agen Anda, persis seperti pesan yang diketik. Dari sudut pandang agen, itu hanya teks, jadi dikte suara bekerja sama saja dengan Claude Code, Codex, Gemini CLI, OpenCode, dan Aider.
Prompt lebih cepat, token lebih sedikit
Kenapa mendiktekan prompt yang lebih baik di awal lebih murah daripada mengetik prompt tipis lalu mengulang-ulang.
Prompt tipis itu mahal dengan cara yang tidak tampak di jam. Agen tidak punya cukup bahan, jadi ia menebak, Anda mengoreksi, ia membaca ulang seluruh konteks, Anda mengoreksi lagi. Setiap putaran itu adalah token masukan, token keluaran, dan pembacaan cache. Tiga putaran untuk mengklarifikasi satu fitur bisa lebih mahal daripada fiturnya sendiri.
Dikte suara membalik ekonominya. Karena bicara itu cepat, Anda memuat konteks di depan : batasannya, jalur berkasnya, perilaku yang harus dihindari, contoh yang ada di benak Anda. Agen menebak benar lebih dekat ke percobaan pertama. Anda menukar tiga puluh detik dikte dengan dua atau tiga siklus klarifikasi yang terhindarkan.
Ini berlipat ganda. Hari normal berisi puluhan prompt. Jika dikte suara menghemat satu putaran pada sebagian besar di antaranya, penghematan token menumpuk sepanjang hari, sepanjang tim, sepanjang bulan. Token termurah adalah token yang tidak pernah perlu Anda habiskan untuk menjelaskan ulang diri Anda.
Ini juga sekadar lebih sedikit friksi. Lebih sedikit friksi berarti Anda benar-benar menulis prompt yang lebih panjang dan lebih baik alih-alih satu baris malas yang akan Anda ketik karena mengetik versi lengkap terasa terlalu banyak kerja. Dikte suara membuat prompt yang baik menjadi prompt yang mudah.
Pilih model transkripsi dan bahasa Anda
Dikte suara di desktop memungkinkan Anda memilih model ucapan ke teks dan bahasa yang diucapkan di pengaturan.
Model transkripsi (desktop)
- GPT-4o Transcribe (default, kualitas multibahasa terbaik)
- GPT-4o mini Transcribe (hampir sama akurat, lebih murah)
- OpenAI Whisper, whisper-1 (harga sederhana per menit, basis multibahasa yang solid)
Bahasa yang diucapkan
- Deteksi otomatis (default, model menebak bahasanya)
- English, Français, Español, Deutsch, Italiano, Português
- Русский, 中文, 日本語, 한국어
- العربية, हिन्दी, Bahasa Indonesia, Polski, Türkçe, Tiếng Việt
Deteksi otomatis adalah default dan menangani sebagian besar kasus. Paksa bahasa tertentu saat rekaman pendek salah dideteksi, tetapi paksa hanya bahasa yang benar-benar Anda ucapkan. Enam belas bahasa plus deteksi otomatis, jadi Anda mendikte dengan kata-kata Anda sendiri dan agen Anda mendapatkan teks yang bersih.
Apa yang sebenarnya dilakukan dikte suara di balik layar
Di desktop, composer merekam suara Anda dengan API MediaRecorder peramban dan mengirim audio ke backend transkripsi AgentsRoom. Transkripsi berjalan di sisi server pada model pilihan Anda, sehingga kerja berat ucapan ke teks tidak bergantung pada mesin Anda, dan transkrip kembali sebagai teks polos yang disisipkan di posisi kursor Anda. Mikrofon, perekaman, dan penyisipan semuanya bagian dari composer yang sama yang sudah Anda ketik.
Di mobile, dikte suara bekerja secara berbeda dengan sengaja. Aplikasi pendamping memakai pengenalan suara on-device, sehingga audio tidak pernah meninggalkan ponsel Anda. Teks yang dikenali lalu direlai ke desktop lewat koneksi terenkripsi ujung ke ujung AgentsRoom dan dijatuhkan ke input agen yang sedang Anda fokuskan di Mac. Tahan tombol mik, bicara, lepas, dan teksnya muncul di agen desktop Anda.
Kedua permukaan berbagi satu aturan : dikte suara tidak pernah mengirim dengan sendirinya. Di desktop, transkrip mendarat di draf untuk ditinjau. Di mobile, teks ditempelkan ke input agen yang difokuskan tanpa baris baru, jadi Anda tetap menekan Enter sendiri. Mendikte adalah cara menulis prompt, bukan cara menembakkannya secara membabi buta.
Konfigurasinya netral terhadap provider. ID model transkripsi memetakan ke backend ucapan ke teks, bukan ke CLI agen Anda. Entah agen Anda Claude Code, Codex, Gemini CLI, OpenCode, atau Aider, teks yang didiktekan hanyalah teks di composer, jadi dikte suara berperilaku identik di setiap provider yang didukung AgentsRoom.
Di mana dikte suara bekerja
Terpasang di composer desktop dan pendamping mobile, dalam enam belas bahasa.
Composer desktop
Sebuah tombol mikrofon di composer agen pada macOS. Transkripsi di sisi server pada GPT-4o Transcribe, GPT-4o mini Transcribe, atau Whisper. Gelombang suara langsung saat merekam, transkrip disisipkan di posisi kursor, bebas dicampur dengan mengetik. Pilih model dan bahasa Anda di pengaturan.
Pendamping mobile
Di pendamping iOS dan Android, tahan mik untuk mendikte. Pengenalan suara berjalan on-device sehingga audio tetap di ponsel, dan teks yang dikenali direlai terenkripsi ujung ke ujung ke agen desktop yang difokuskan. Cara tercepat memberi makan agen dari saku Anda.
Multibahasa
Enam belas bahasa yang diucapkan plus deteksi otomatis : Inggris, Prancis, Spanyol, Jerman, Italia, Portugis, Rusia, Mandarin, Jepang, Korea, Arab, Hindi, Indonesia, Polandia, Turki, dan Vietnam. Diktekan dalam bahasa ibu Anda, agen Anda menerima teks hasil transkripsi yang bersih.
Mengetik prompt vs mendiktekannya
Agen yang sama, tugas yang sama. Kecepatan beda, konteks beda, tagihan token beda.
Mengetik setiap prompt
- : Anda mengetik dengan kecepatan sepersekian dari bicara, jadi prompt tetap pendek.
- : Prompt pendek melewatkan konteks, jadi agen menebak dan Anda mengoreksinya.
- : Setiap koreksi adalah satu putaran lagi, lebih banyak token masukan dan keluaran.
- : Aplikasi dikte terpisah atau dikte sistem berarti salin-tempel antar jendela.
- : Di ponsel, keyboard mobile membuat prompt panjang menyiksa, jadi Anda nyaris tidak mendikte sama sekali.
Mendikte dengan dikte suara
- : Anda mengucapkan prompt lengkap dalam hitungan detik, jadi Anda secara alami mengucapkan lebih banyak.
- : Lebih banyak konteks di depan berarti agen menuntaskan tugas lebih dekat ke percobaan pertama.
- : Lebih sedikit putaran klarifikasi berarti lebih sedikit token terpakai untuk hasil yang sama.
- : Mik ada di composer, transkrip mendarat di draf, tanpa salin-tempel.
- : Di ponsel, tahan mik dan teksnya muncul di agen desktop Anda lewat relai terenkripsi.
Dikte suara adalah cara termurah untuk membuat setiap prompt lebih panjang, lebih presisi, dan lebih cepat ditulis sekaligus.
Seperti apa bunyi prompt yang didiktekan
Anda tidak perlu menulis satu pun dari ini. Anda mengucapkannya dengan suara, ucapan ke teks mengubahnya menjadi prompt di bawah, lalu Anda menekan Enter. Cobalah mengetik prompt sedetail ini dan rasakan berapa lama waktunya.
Diucapkan ke mik
Tambahkan rate limiter ke endpoint login.
Gunakan sliding window lima percobaan per menit per IP.
Kembalikan 429 dengan header Retry-After saat batas tercapai.
Biarkan jalur sukses yang ada tidak tersentuh.
Tambahkan unit test untuk batas yang tercapai dan satu untuk reset setelah satu menit.
Jangan sentuh endpoint signup.FAQ
Apa itu dikte suara di AgentsRoom ?
Dikte suara adalah tombol mikrofon di composer agen yang mengubah ucapan Anda jadi teks. Anda klik mik, ucapkan prompt Anda, dan teks hasil transkripsi disisipkan ke draf di posisi kursor. Ini adalah ucapan ke teks bawaan untuk menulis prompt ke agen koding AI Anda, tanpa aplikasi dikte terpisah dan tanpa salin-tempel antar jendela.
Kenapa saya harus mendiktekan prompt alih-alih mengetiknya ?
Kecepatan, presisi, dan ekonomi token. Anda bicara beberapa kali lebih cepat daripada mengetik, jadi prompt butuh hitungan detik alih-alih menit. Karena mendikte itu murah, Anda secara alami mengucapkan lebih banyak, yang membuat prompt lebih presisi. Prompt yang presisi berarti lebih sedikit putaran klarifikasi dengan agen, yang berarti lebih sedikit token terpakai untuk mencapai hasil yang sama.
Model transkripsi mana yang bisa saya pakai ?
Di desktop Anda memilih dari tiga model ucapan ke teks di pengaturan : GPT-4o Transcribe (default, kualitas multibahasa terbaik), GPT-4o mini Transcribe (hampir sama akurat dan lebih murah), dan OpenAI Whisper, model whisper-1 dengan harga sederhana per menit dan basis multibahasa yang solid.
Apakah ini cuma OpenAI Whisper ?
Whisper adalah salah satu model yang bisa Anda pilih, terpasang langsung di composer alih-alih berjalan sebagai aplikasi terpisah di samping. Anda juga bisa memilih GPT-4o Transcribe atau GPT-4o mini Transcribe. Inti dari dikte suara AgentsRoom adalah dikte itu menyasar langsung input prompt agen Anda, jadi Anda tidak mendikte ke satu jendela lalu salin-tempel ke jendela lain.
Bahasa apa saja yang didukung dikte suara ?
Enam belas bahasa yang diucapkan plus deteksi otomatis : Inggris, Prancis, Spanyol, Jerman, Italia, Portugis, Rusia, Mandarin, Jepang, Korea, Arab, Hindi, Indonesia, Polandia, Turki, dan Vietnam. Deteksi otomatis adalah default. Anda bisa memaksa bahasa tertentu di pengaturan saat rekaman pendek salah dideteksi.
Apakah suara saya dikirim ke server ?
Tergantung permukaannya. Di desktop, audio dikirim ke backend transkripsi AgentsRoom, yang menjalankan ucapan ke teks pada model pilihan Anda dan mengembalikan teksnya. Di mobile, pengenalan suara berjalan on-device, jadi audio tidak pernah meninggalkan ponsel Anda dan hanya teks yang dikenali yang direlai ke desktop lewat koneksi terenkripsi ujung ke ujung.
Apakah prompt langsung dikirim otomatis setelah saya mendikte ?
Tidak. Dikte suara selalu mendaratkan teks di draf, bukan di pengiriman. Anda membaca transkrip, mengoreksi kata langka yang salah didengar, menambah atau menyusun ulang lewat keyboard jika mau, lalu menekan Enter saat siap. Anda tetap memegang kendali atas persis apa yang diterima agen Anda.
Bisakah saya mencampur mengetik dan mendikte dalam prompt yang sama ?
Bisa. Transkrip disisipkan di posisi kursor Anda, bukan menggantikan seluruh draf. Jadi Anda bisa mengetik paruh pertama, mendiktekan satu paragraf panjang di tengah, lalu mengetik baris terakhir. Dikte suara adalah cara lebih cepat untuk mengisi composer, sepenuhnya kompatibel dengan keyboard.
Bisakah saya mendikte dari ponsel ke agen di Mac saya ?
Bisa. Aplikasi pendamping mobile punya tombol mikrofon : tahan, bicara, lepas. Ucapan dikenali on-device dan teksnya direlai terenkripsi ujung ke ujung ke agen yang Anda fokuskan di desktop. Ini cara tercepat untuk mengirim prompt ke agen Mac Anda tanpa memakai keyboard mobile.
Apakah dikte suara bekerja dengan Claude Code, Codex, dan Gemini ?
Ya, dengan semuanya, plus OpenCode dan Aider. Teks yang didiktekan hanyalah teks di composer, dan konfigurasi transkripsi netral terhadap provider, jadi dikte suara berperilaku identik tak peduli CLI agen mana yang Anda jalankan.
Cocok dipadukan dengan
Scratchpad
Editor prompt yang lebih besar di footer. Diktekan brief panjang, sempurnakan di scratchpad, lalu kirim ke agen Anda.
Prompt Library
Simpan prompt yang Anda diktekan sebagai templat yang bisa dipakai ulang. Suara menulis draf pertama, pustaka menyimpan yang terbaik.
Sinkronisasi Mobile-Desktop
Tautan terenkripsi ujung ke ujung yang membawa teks diktean Anda dari ponsel ke agen yang difokuskan di Mac Anda.
Kendali Agen Jarak Jauh
Kendalikan agen desktop Anda dari ponsel. Mendikte adalah cara tercepat untuk mengirim prompt ke mereka saat Anda jauh dari keyboard.
Multi-Provider
Jalankan Claude, Codex, Gemini, OpenCode, dan Aider berdampingan. Dikte suara bekerja sama saja di setiap di antaranya.
Sketch
Gambar dan beri anotasi di composer. Padukan prompt diktean dengan sketsa cepat untuk memberi agen Anda kata-kata sekaligus gambar.
Bicara ke agen Anda, berhenti mengetik prompt
Unduh AgentsRoom dan diktekan prompt Anda langsung ke composer. Lebih cepat ditulis, lebih kaya konteks, lebih ringan token. Dikte suara terpasang di IDE koding AI Anda, di desktop dan di mobile.
Aplikasi pendamping: pantau agen Anda saat bepergian
Gunakan Claude, Codex, Gemini CLI, atau penyedia AI lainnya.
Kirim bug dan permintaan langsung ke backlog publik Anda.
Sekilas AgentsRoom dalam aksi.