Dikte suara : diktekan prompt, agen Anda yang ngoding

Berhenti mengetik prompt.
Diktekan saja.

Dikte suara hidup tepat di dalam composer agen. Klik mikrofon, ucapkan prompt Anda, dan teks hasil transkripsi langsung jatuh ke draf di posisi kursor. Ucapan ke teks untuk agen koding AI Anda, tanpa aplikasi dikte terpisah yang harus diurus dan tanpa salin-tempel antar jendela.

Mengetik prompt panjang dan presisi memakan menit. Mendikte prompt yang sama hanya butuh detik. Lebih banyak konteks untuk agen Anda, lebih sedikit putaran klarifikasi, lebih sedikit token terbuang. Nilai telah berpindah dari kode ke prompt, dan dikte suara adalah cara tercepat untuk menulis prompt yang baik.

Unduh AgentsRoom Lihat cara kerja dikte suara

Dikte suara beraksi : klik mik, ucapkan prompt, amati gelombang suara langsung, dan transkrip ucapan ke teks mendarat di composer siap diedit dan dikirim.

Inilah pergeseran yang dijawab oleh dikte suara. Bagian sulit dalam bekerja dengan agen koding AI bukan lagi menulis kode, agen yang melakukannya. Bagian sulitnya adalah menulis prompt : menggambarkan apa yang Anda mau, batasannya, kasus tepinya, berkas yang harus disentuh, perilaku yang harus dihindari. Prompt yang presisi adalah pembeda antara sekali jadi dan sepuluh putaran yang melelahkan. Dan prompt yang presisi itu panjang, sehingga lambat untuk diketik.

Dikte suara menghapus pajak mengetik. Anda klik tombol mikrofon di composer, Anda ucapkan semua yang akan Anda ketik, sering kali lebih banyak daripada yang akan repot Anda ketik, dan transkripsi ucapan ke teks muncul di draf. Anda bicara 150 kata per menit, Anda tidak mengetik 150 kata per menit. Mendikte memang lebih cepat, dan kanal yang lebih cepat berarti Anda memberi agen Anda lebih banyak konteks per tugas.

Ini bukan tempelan. Mikrofon adalah bagian dari composer AgentsRoom, di samping pustaka prompt dan alat sketsa. Transkrip disisipkan di posisi kursor Anda, jadi Anda bisa mencampur mengetik dan mendikte dalam draf yang sama. Tidak ada yang dikirim otomatis : teks mendarat di draf, Anda membacanya, memperbaiki satu kata yang salah didengar model, lalu menekan Enter saat siap. Dikte suara di sini adalah alat bantu menulis, bukan autopilot.

Dikte suara di composer AgentsRoom : sebuah tombol mikrofon merekam suara pengguna dan transkrip ucapan ke teks disisipkan ke draf prompt agen, dengan visualisator gelombang suara langsung

Tombol mikrofon berada di bilah alat composer. Saat merekam, gelombang suara langsung menampilkan level masukan, lalu prompt hasil transkripsi muncul di draf.

Kenapa mendiktekan prompt alih-alih mengetiknya

Kecepatan. Anda bicara beberapa kali lebih cepat daripada mengetik, dan Anda tidak kehilangan alur pikiran sambil mencari tombol. Prompt dua paragraf yang butuh tiga menit untuk diketik hanya butuh tiga puluh detik dikte suara. Sepanjang hari penuh mendikte prompt ke agen Anda, waktu itu terkumpul menjadi jam-jam nyata yang kembali ke Anda.

Presisi. Karena mendikte itu murah, Anda mengucapkan lebih banyak. Anda menggambarkan kasus tepi yang akan Anda lewati, berkas yang tidak akan Anda sebut namanya, perilaku yang ingin Anda hindari. Prompt yang lebih kaya adalah prompt yang lebih presisi, dan prompt yang lebih presisi itulah yang membuat agen koding AI menuntaskan tugas pada percobaan pertama.

Ekonomi token. Setiap putaran klarifikasi dengan agen menghabiskan token : agen bertanya, Anda menjawab, ia membaca ulang konteks. Prompt yang didiktekan secara presisi di awal meruntuhkan putaran-putaran itu. Lebih sedikit bolak-balik berarti lebih sedikit token terpakai untuk mencapai hasil yang sama, yang merupakan penghematan langsung pada tagihan AI Anda.

Bebas tangan dan mobile. Di desktop, tangan Anda tetap bebas sementara agen berjalan dan Anda mendiktekan prompt berikutnya dengan suara. Di ponsel, dikte suara adalah cara paling cepat untuk memberi makan agen tanpa berkutat dengan keyboard mobile. Ucapkan idenya, ia mendarat di agen Anda di Mac.

Cara kerja dikte suara

Klik mik, ucapkan, tinjau, kirim. Empat langkah, tanpa aplikasi terpisah, tanpa salin-tempel.

Klik mikrofon di composer

Tempatkan kursor Anda di composer agen dan klik tombol mik di bilah alat. Pertama kali, macOS meminta izin mikrofon, AgentsRoom mengarahkan permintaan itu ke sistem sehingga Anda memberikannya sekali saja.

Ucapkan prompt Anda

Tombol beralih ke perekaman : keadaan berdenyut dengan gelombang suara langsung yang menampilkan level masukan Anda secara real time, sehingga Anda tahu mik benar-benar menangkap audio. Ucapkan semua yang perlu diketahui agen Anda, dalam bahasa Anda sendiri.

Berhenti, lalu ia mentranskripsi

Klik lagi untuk berhenti. Audio dikirim ke model transkripsi yang Anda pilih (GPT-4o Transcribe secara default, GPT-4o mini Transcribe, atau OpenAI Whisper). Tombol menampilkan keadaan transkripsi sementara ucapan ke teks berjalan.

Transkrip mendarat di posisi kursor Anda

Teks hasil transkripsi disisipkan ke draf di posisi kursor, dengan spasi pemisah saat diperlukan. Posisi kursor Anda dipulihkan, jadi Anda bisa terus mengetik atau mendiktekan potongan lain. Mengetik dan mendikte bercampur bebas dalam prompt yang sama.

Tinjau dan edit

Belum ada yang dikirim. Prompt diam di draf. Bacalah, perbaiki kata langka yang salah didengar model, tambahkan satu baris lewat keyboard, susun ulang sebuah kalimat. Anda tetap memegang kendali penuh atas apa yang sebenarnya diterima agen Anda.

Kirim saat siap

Tekan Enter untuk mengirim prompt ke agen Anda, persis seperti pesan yang diketik. Dari sudut pandang agen, itu hanya teks, jadi dikte suara bekerja sama saja dengan Claude Code, Codex, Antigravity CLI, OpenCode, dan Aider.

Prompt lebih cepat, token lebih sedikit

Kenapa mendiktekan prompt yang lebih baik di awal lebih murah daripada mengetik prompt tipis lalu mengulang-ulang.

Prompt tipis itu mahal dengan cara yang tidak tampak di jam. Agen tidak punya cukup bahan, jadi ia menebak, Anda mengoreksi, ia membaca ulang seluruh konteks, Anda mengoreksi lagi. Setiap putaran itu adalah token masukan, token keluaran, dan pembacaan cache. Tiga putaran untuk mengklarifikasi satu fitur bisa lebih mahal daripada fiturnya sendiri.

Dikte suara membalik ekonominya. Karena bicara itu cepat, Anda memuat konteks di depan : batasannya, jalur berkasnya, perilaku yang harus dihindari, contoh yang ada di benak Anda. Agen menebak benar lebih dekat ke percobaan pertama. Anda menukar tiga puluh detik dikte dengan dua atau tiga siklus klarifikasi yang terhindarkan.

Ini berlipat ganda. Hari normal berisi puluhan prompt. Jika dikte suara menghemat satu putaran pada sebagian besar di antaranya, penghematan token menumpuk sepanjang hari, sepanjang tim, sepanjang bulan. Token termurah adalah token yang tidak pernah perlu Anda habiskan untuk menjelaskan ulang diri Anda.

Ini juga sekadar lebih sedikit friksi. Lebih sedikit friksi berarti Anda benar-benar menulis prompt yang lebih panjang dan lebih baik alih-alih satu baris malas yang akan Anda ketik karena mengetik versi lengkap terasa terlalu banyak kerja. Dikte suara membuat prompt yang baik menjadi prompt yang mudah.

Pilih model transkripsi dan bahasa Anda

Dikte suara di desktop memungkinkan Anda memilih model ucapan ke teks dan bahasa yang diucapkan di pengaturan.

Model transkripsi (desktop)

GPT-4o Transcribe (default, kualitas multibahasa terbaik)
GPT-4o mini Transcribe (hampir sama akurat, lebih murah)
OpenAI Whisper, whisper-1 (harga sederhana per menit, basis multibahasa yang solid)

Bahasa yang diucapkan

Deteksi otomatis (default, model menebak bahasanya)
English, Français, Español, Deutsch, Italiano, Português
Русский, 中文, 日本語, 한국어
العربية, हिन्दी, Bahasa Indonesia, Polski, Türkçe, Tiếng Việt

Deteksi otomatis adalah default dan menangani sebagian besar kasus. Paksa bahasa tertentu saat rekaman pendek salah dideteksi, tetapi paksa hanya bahasa yang benar-benar Anda ucapkan. Enam belas bahasa plus deteksi otomatis, jadi Anda mendikte dengan kata-kata Anda sendiri dan agen Anda mendapatkan teks yang bersih.

Apa yang sebenarnya dilakukan dikte suara di balik layar

Di desktop, composer merekam suara Anda dengan API MediaRecorder peramban dan mengirim audio ke backend transkripsi AgentsRoom. Transkripsi berjalan di sisi server pada model pilihan Anda, sehingga kerja berat ucapan ke teks tidak bergantung pada mesin Anda, dan transkrip kembali sebagai teks polos yang disisipkan di posisi kursor Anda. Mikrofon, perekaman, dan penyisipan semuanya bagian dari composer yang sama yang sudah Anda ketik.

Di mobile, dikte suara bekerja secara berbeda dengan sengaja. Aplikasi pendamping memakai pengenalan suara on-device, sehingga audio tidak pernah meninggalkan ponsel Anda. Teks yang dikenali lalu direlai ke desktop lewat koneksi terenkripsi ujung ke ujung AgentsRoom dan dijatuhkan ke input agen yang sedang Anda fokuskan di Mac. Tahan tombol mik, bicara, lepas, dan teksnya muncul di agen desktop Anda.

Kedua permukaan berbagi satu aturan : dikte suara tidak pernah mengirim dengan sendirinya. Di desktop, transkrip mendarat di draf untuk ditinjau. Di mobile, teks ditempelkan ke input agen yang difokuskan tanpa baris baru, jadi Anda tetap menekan Enter sendiri. Mendikte adalah cara menulis prompt, bukan cara menembakkannya secara membabi buta.

Konfigurasinya netral terhadap provider. ID model transkripsi memetakan ke backend ucapan ke teks, bukan ke CLI agen Anda. Entah agen Anda Claude Code, Codex, Antigravity CLI, OpenCode, atau Aider, teks yang didiktekan hanyalah teks di composer, jadi dikte suara berperilaku identik di setiap provider yang didukung AgentsRoom.

Di mana dikte suara bekerja

Terpasang di composer desktop dan pendamping mobile, dalam enam belas bahasa.

Composer desktop

Sebuah tombol mikrofon di composer agen pada macOS. Transkripsi di sisi server pada GPT-4o Transcribe, GPT-4o mini Transcribe, atau Whisper. Gelombang suara langsung saat merekam, transkrip disisipkan di posisi kursor, bebas dicampur dengan mengetik. Pilih model dan bahasa Anda di pengaturan.

Pendamping mobile

Di pendamping iOS dan Android, tahan mik untuk mendikte. Pengenalan suara berjalan on-device sehingga audio tetap di ponsel, dan teks yang dikenali direlai terenkripsi ujung ke ujung ke agen desktop yang difokuskan. Cara tercepat memberi makan agen dari saku Anda.

Multibahasa

Enam belas bahasa yang diucapkan plus deteksi otomatis : Inggris, Prancis, Spanyol, Jerman, Italia, Portugis, Rusia, Mandarin, Jepang, Korea, Arab, Hindi, Indonesia, Polandia, Turki, dan Vietnam. Diktekan dalam bahasa ibu Anda, agen Anda menerima teks hasil transkripsi yang bersih.

Mengetik prompt vs mendiktekannya

Agen yang sama, tugas yang sama. Kecepatan beda, konteks beda, tagihan token beda.

Mengetik setiap prompt

: Anda mengetik dengan kecepatan sepersekian dari bicara, jadi prompt tetap pendek.
: Prompt pendek melewatkan konteks, jadi agen menebak dan Anda mengoreksinya.
: Setiap koreksi adalah satu putaran lagi, lebih banyak token masukan dan keluaran.
: Aplikasi dikte terpisah atau dikte sistem berarti salin-tempel antar jendela.
: Di ponsel, keyboard mobile membuat prompt panjang menyiksa, jadi Anda nyaris tidak mendikte sama sekali.

Mendikte dengan dikte suara

: Anda mengucapkan prompt lengkap dalam hitungan detik, jadi Anda secara alami mengucapkan lebih banyak.
: Lebih banyak konteks di depan berarti agen menuntaskan tugas lebih dekat ke percobaan pertama.
: Lebih sedikit putaran klarifikasi berarti lebih sedikit token terpakai untuk hasil yang sama.
: Mik ada di composer, transkrip mendarat di draf, tanpa salin-tempel.
: Di ponsel, tahan mik dan teksnya muncul di agen desktop Anda lewat relai terenkripsi.

Dikte suara adalah cara termurah untuk membuat setiap prompt lebih panjang, lebih presisi, dan lebih cepat ditulis sekaligus.

Seperti apa bunyi prompt yang didiktekan

Anda tidak perlu menulis satu pun dari ini. Anda mengucapkannya dengan suara, ucapan ke teks mengubahnya menjadi prompt di bawah, lalu Anda menekan Enter. Cobalah mengetik prompt sedetail ini dan rasakan berapa lama waktunya.

Diucapkan ke mik

Tambahkan rate limiter ke endpoint login.
Gunakan sliding window lima percobaan per menit per IP.
Kembalikan 429 dengan header Retry-After saat batas tercapai.
Biarkan jalur sukses yang ada tidak tersentuh.
Tambahkan unit test untuk batas yang tercapai dan satu untuk reset setelah satu menit.
Jangan sentuh endpoint signup.

Tidak ada yang dikirim otomatis

Dikte suara menulis ke draf, bukan ke pengiriman. Anda selalu membaca transkrip, mengeditnya, dan menekan Enter sendiri. Mendikte adalah keyboard yang lebih cepat, bukan autopilot.

On-device di mobile

Di ponsel, pengenalan suara berjalan on-device : audio tidak pernah meninggalkan perangkat Anda. Teks yang dikenali bepergian ke Mac Anda lewat relai terenkripsi ujung ke ujung AgentsRoom.

Bekerja dengan setiap agen

Teks yang didiktekan hanyalah teks di composer, jadi dikte suara bekerja sama saja dengan Claude Code, Codex, Antigravity CLI, OpenCode, dan Aider. Netral terhadap provider secara desain.

FAQ

Apa itu dikte suara di AgentsRoom ?

Dikte suara adalah tombol mikrofon di composer agen yang mengubah ucapan Anda jadi teks. Anda klik mik, ucapkan prompt Anda, dan teks hasil transkripsi disisipkan ke draf di posisi kursor. Ini adalah ucapan ke teks bawaan untuk menulis prompt ke agen koding AI Anda, tanpa aplikasi dikte terpisah dan tanpa salin-tempel antar jendela.

Kenapa saya harus mendiktekan prompt alih-alih mengetiknya ?

Kecepatan, presisi, dan ekonomi token. Anda bicara beberapa kali lebih cepat daripada mengetik, jadi prompt butuh hitungan detik alih-alih menit. Karena mendikte itu murah, Anda secara alami mengucapkan lebih banyak, yang membuat prompt lebih presisi. Prompt yang presisi berarti lebih sedikit putaran klarifikasi dengan agen, yang berarti lebih sedikit token terpakai untuk mencapai hasil yang sama.

Model transkripsi mana yang bisa saya pakai ?

Di desktop Anda memilih dari tiga model ucapan ke teks di pengaturan : GPT-4o Transcribe (default, kualitas multibahasa terbaik), GPT-4o mini Transcribe (hampir sama akurat dan lebih murah), dan OpenAI Whisper, model whisper-1 dengan harga sederhana per menit dan basis multibahasa yang solid.

Apakah ini cuma OpenAI Whisper ?

Whisper adalah salah satu model yang bisa Anda pilih, terpasang langsung di composer alih-alih berjalan sebagai aplikasi terpisah di samping. Anda juga bisa memilih GPT-4o Transcribe atau GPT-4o mini Transcribe. Inti dari dikte suara AgentsRoom adalah dikte itu menyasar langsung input prompt agen Anda, jadi Anda tidak mendikte ke satu jendela lalu salin-tempel ke jendela lain.

Bahasa apa saja yang didukung dikte suara ?

Enam belas bahasa yang diucapkan plus deteksi otomatis : Inggris, Prancis, Spanyol, Jerman, Italia, Portugis, Rusia, Mandarin, Jepang, Korea, Arab, Hindi, Indonesia, Polandia, Turki, dan Vietnam. Deteksi otomatis adalah default. Anda bisa memaksa bahasa tertentu di pengaturan saat rekaman pendek salah dideteksi.

Apakah suara saya dikirim ke server ?

Tergantung permukaannya. Di desktop, audio dikirim ke backend transkripsi AgentsRoom, yang menjalankan ucapan ke teks pada model pilihan Anda dan mengembalikan teksnya. Di mobile, pengenalan suara berjalan on-device, jadi audio tidak pernah meninggalkan ponsel Anda dan hanya teks yang dikenali yang direlai ke desktop lewat koneksi terenkripsi ujung ke ujung.

Apakah prompt langsung dikirim otomatis setelah saya mendikte ?

Tidak. Dikte suara selalu mendaratkan teks di draf, bukan di pengiriman. Anda membaca transkrip, mengoreksi kata langka yang salah didengar, menambah atau menyusun ulang lewat keyboard jika mau, lalu menekan Enter saat siap. Anda tetap memegang kendali atas persis apa yang diterima agen Anda.

Bisakah saya mencampur mengetik dan mendikte dalam prompt yang sama ?

Bisa. Transkrip disisipkan di posisi kursor Anda, bukan menggantikan seluruh draf. Jadi Anda bisa mengetik paruh pertama, mendiktekan satu paragraf panjang di tengah, lalu mengetik baris terakhir. Dikte suara adalah cara lebih cepat untuk mengisi composer, sepenuhnya kompatibel dengan keyboard.

Bisakah saya mendikte dari ponsel ke agen di Mac saya ?

Bisa. Aplikasi pendamping mobile punya tombol mikrofon : tahan, bicara, lepas. Ucapan dikenali on-device dan teksnya direlai terenkripsi ujung ke ujung ke agen yang Anda fokuskan di desktop. Ini cara tercepat untuk mengirim prompt ke agen Mac Anda tanpa memakai keyboard mobile.

Apakah dikte suara bekerja dengan Claude Code, Codex, dan Antigravity ?

Ya, dengan semuanya, plus OpenCode dan Aider. Teks yang didiktekan hanyalah teks di composer, dan konfigurasi transkripsi netral terhadap provider, jadi dikte suara berperilaku identik tak peduli CLI agen mana yang Anda jalankan.

Cocok dipadukan dengan

Scratchpad

Editor prompt yang lebih besar di footer. Diktekan brief panjang, sempurnakan di scratchpad, lalu kirim ke agen Anda.

Prompt Library

Simpan prompt yang Anda diktekan sebagai templat yang bisa dipakai ulang. Suara menulis draf pertama, pustaka menyimpan yang terbaik.

Sinkronisasi Mobile-Desktop

Tautan terenkripsi ujung ke ujung yang membawa teks diktean Anda dari ponsel ke agen yang difokuskan di Mac Anda.

Kendali Agen Jarak Jauh

Kendalikan agen desktop Anda dari ponsel. Mendikte adalah cara tercepat untuk mengirim prompt ke mereka saat Anda jauh dari keyboard.

Multi-Provider

Jalankan Claude, Codex, Antigravity, OpenCode, dan Aider berdampingan. Dikte suara bekerja sama saja di setiap di antaranya.

Sketch

Gambar dan beri anotasi di composer. Padukan prompt diktean dengan sketsa cepat untuk memberi agen Anda kata-kata sekaligus gambar.

Bicara ke agen Anda, berhenti mengetik prompt

Unduh AgentsRoom dan diktekan prompt Anda langsung ke composer. Lebih cepat ditulis, lebih kaya konteks, lebih ringan token. Dikte suara terpasang di IDE koding AI Anda, di desktop dan di mobile.

GratisUnduh AgentsRoom

Aplikasi pendamping: pantau agen Anda saat bepergian

Gunakan Claude, Codex, Antigravity CLI, atau penyedia AI lainnya.

Dapatkan ekstensi

Chrome Web Store

Kirim bug dan permintaan langsung ke backlog publik Anda.

Sekilas AgentsRoom dalam aksi.

Beberapa proyek

Multi-penyedia

Beberapa agen

Status langsung

File diff & commit

Pendamping mobile

Pratinjau langsung

Tim agen

Otomatisasi browser

Dev berbasis backlog

Pustaka prompt

Pustaka skill

Lihat semua fitur

Berhenti mengetik prompt.Diktekan saja.

Kenapa mendiktekan prompt alih-alih mengetiknya

Cara kerja dikte suara

Klik mikrofon di composer

Ucapkan prompt Anda

Berhenti, lalu ia mentranskripsi

Transkrip mendarat di posisi kursor Anda

Tinjau dan edit

Kirim saat siap

Prompt lebih cepat, token lebih sedikit

Pilih model transkripsi dan bahasa Anda

Model transkripsi (desktop)

Bahasa yang diucapkan

Apa yang sebenarnya dilakukan dikte suara di balik layar

Di mana dikte suara bekerja

Composer desktop

Pendamping mobile

Multibahasa

Mengetik prompt vs mendiktekannya

Mengetik setiap prompt

Mendikte dengan dikte suara

Seperti apa bunyi prompt yang didiktekan

FAQ

Cocok dipadukan dengan

Scratchpad

Prompt Library

Sinkronisasi Mobile-Desktop

Kendali Agen Jarak Jauh

Multi-Provider

Sketch

Bicara ke agen Anda, berhenti mengetik prompt

Berhenti mengetik prompt.
Diktekan saja.