Azure AI Speech
Layanan terkelola menawarkan kemampuan ucapan terkemuka di industri seperti ucapan-ke-teks, teks-ke-ucapan, terjemahan ucapan, dan pengenalan pembicara.
Kembangkan aplikasi dengan dukungan suara berkualitas tinggi dengan cepat
Buat aplikasi AI generatif dengan dukungan suara dengan percaya diri dan cepat menggunakan Azure AI Speech. Transkripsikan ucapan ke teks dengan akurasi tinggi, hasilkan suara teks-ke-ucapan yang terdengar alami, terjemahkan audio yang diucapkan, dan gunakan pengenalan pembicara selama percakapan. Buat lebih cepat dengan model AI bawaan dan dapat disesuaikan di Azure AI Studio.
Kualitas terbaik di industri
Dapatkan ucapan-ke-teks yang canggih, teks-ke-ucapan yang nyata, dan pengenalan pembicara pemenang penghargaan.
Sesuai dan aman
Data Anda tetap menjadi milik Anda—input ucapan Anda tidak dicatat selama pemrosesan.
Suara dan model yang dapat disesuaikan
Buat suara kustom, tambahkan kata tertentu ke kosakata dasar, atau buat model Anda sendiri.
Penyebaran fleksibel
Jalankan Speech di mana saja, di cloud atau di edge dalam kontainer.
Mengonversi ucapan-ke-teks
Mentranskripsikan audio dengan cepat dan akurat dalam lebih dari 100 bahasa dan varian. Dapatkan wawasan pelanggan dengan transkripsi pusat panggilan, tingkatkan pengalaman dengan asisten yang dukungan suara, rekam diskusi penting dalam rapat, dan lainnya.
Berikan suara pada aplikasi Anda
Gunakan teks-ke-ucapan untuk membuat aplikasi dan layanan yang berbicara secara percakapan. Buat konten audio yang terdengar alami, tingkatkan aksesibilitas dengan fungsi baca-keras, dan buat asisten suara kustom.
Terjemahkan ucapan secara real time
Terjemahkan audio dari lebih dari 30 bahasa dan kustomisasi terjemahan untuk istilah khusus organisasi Anda—semua dalam bahasa pemrograman pilihan Anda.
Memverifikasi dan mengenali pembicara
Konfirmasikan identitas seseorang atau kenali siapa yang berbicara dalam rapat dengan menambahkan verifikasi dan identifikasi pembicara ke aplikasi Anda.
Aktifkan asisten atau perangkat IoT Anda dengan kata kunci kustom
Buat kata kunci kustom untuk perangkat IoT dan asisten berkemampuan suara untuk membedakan merek Anda—membuatnya lebih personal, menarik, dan aman.
Tambahkan perintah suara untuk skenario bebas genggam
Buat pengalaman tanpa sentuhan, mengutamakan suara untuk meningkatkan keselamatan dan mendukung skenario kembali-bekerja.
Keamanan dan kepatuhan bawaan yang komprehensif
-
Microsoft menginvestasikan lebih dari USD1 miliar setiap tahunnya untuk riset dan pengembangan keamanan cyber.
-
Kami mempekerjakan lebih dari 3.500 ahli keamanan yang sepenuhnya berkomitmen terhadap privasi dan keamanan data Anda.
-
Harga fleksibel memberi Anda kekuatan dan kontrol yang Anda perlukan
Bayar hanya untuk apa yang Anda gunakan, tanpa biaya di muka. Dengan Speech, bayar sesuai penggunaan berdasarkan:
- Jumlah jam audio yang Anda transkripsikan atau terjemahkan untuk ucapan ke teks dan terjemahan ucapan.
- Jumlah karakter yang Anda konversi menjadi audio untuk teks ke ucapan
- Jumlah transaksi untuk Pengenalan Pembicara
Mulai dengan akun gratis Azure
1
Mulai gratis. Dapatkan kredit sebesar USD200 untuk digunakan dalam 30 hari. Selama Anda memiliki kredit, dapatkan sejumlah layanan paling populer kami secara gratis, serta lebih dari 55+ layanan lainnya yang selalu gratis.
2
Setelah kredit berakhir, Anda tetap dapat menggunakan layanan gratis yang sama dengan beralih ke prabayar. Bayar hanya jika Anda menggunakan lebih dari jumlah bulanan gratis.
3
Dipercaya oleh berbagai perusahaan
AT&T menyenangkan pelanggan dengan pengalaman imersif
AT&T memamerkan jaringan 5G-nya dengan pengalaman imersif yang memungkinkan pelanggan berbicara langsung dengan Bugs Bunny.*
*LOONEY TUNES dan semua karakter dan elemen terkait © & ™ Warner Bros. Entertainment Inc. (s21)
Progressive menghadirkan Flo langsung ke pelanggan
Progressive menggunakan Custom Neural Voice untuk membangun Flo versi virtual yang terdengar alami untuk membantu pelanggan dalam segala hal mulai dari mendapatkan penawaran asuransi mobil gratis hingga pertanyaan asuransi umum.
KPMG menyederhanakan transkripsi panggilan
KPMG menggunakan Ucapan ke Teks untuk mentranskripsikan dan membuat katalog ribuan panggilan, mengurangi biaya kepatuhan untuk kliennya sebesar 80 persen.
Motorola membantu responden pertama mengakses data vital
Motorola Solutions membantu petugas pertolongan pertama di lapangan mengakses informasi penting dengan asisten virtual yang mengutamakan suara.
Dokumentasi dan sumber daya Speech
Mulai menggunakan AI Speech
Telusuri dokumentasi
Ikuti kursus Microsoft Learn Speech
Jelajahi sumber daya pengembang populer
Periksa kode sampel dan SDK kami
Bangun model ucapan dengan cepat studio Speech Stack Overflow