Lompat ke konten utama

Harga Azure AI Speech

Layanan ucapan terpadu untuk terjemahan ucapan, ucapan ke teks, teks ke ucapan.

Layanan Ucapan terpadu menyediakan berbagai kemampuan pengenalan dan pembuatan ucapan termasuk transkripsi ucapan, teks-ke-ucapan, dan terjemahan ucapan. Layanan Ucapan menyediakan berbagai kemampuan pengenalan dan pembuatan ucapan termasuk transkripsi ucapan, teks-ke-ucapan, terjemahan ucapan, dan pengenalan pembicara.

Jelajahi opsi harga

Terapkan filter untuk menyesuaikan opsi harga dengan kebutuhan Anda.

Harga hanya perkiraan dan tidak dimaksudkan sebagai penawaran harga aktual. Harga sebenarnya dapat bervariasi tergantung jenis perjanjian yang dibuat dengan Microsoft, tanggal pembelian, dan nilai tukar mata uang. Harga dihitung berdasarkan dolar AS dan dikonversi menggunakan kurs spot penutupan bursa London yang diperoleh dalam dua hari kerja sebelum hari kerja terakhir pada akhir bulan sebelumnya. Jika dua hari kerja sebelum akhir bulan jatuh pada hari libur bank di pasar utama, tarif umumnya ditetapkan pada hari tepat sebelum dua hari kerja tersebut. Tarif ini berlaku untuk semua transaksi selama 1 bulan mendatang. Masuk ke Kalkulator harga Azure untuk melihat harga berdasarkan program/penawaran Anda saat ini dengan Microsoft. Hubungi spesialis penjualan Azure untuk informasi selengkapnya tentang harga atau untuk meminta penawaran harga. Lihat tanya jawab umum tentang harga Azure.

Gratis (F0)

Kategori Fitur Harga
Ucapan ke Teks
(tagihan per detik)
Standar 5 jam audio gratis per bulan3
Kustom 5 jam audio gratis per bulan3
Hosting titik akhir: 1 model gratis per bulan1
Audio Multisaluran Transkripsi Percakapan PRATINJAU 5 jam audio gratis per bulan
Teks ke Ucapan
(tagihan per karakter)
Neural 0.5 million karakter gratis per bulan
Terjemahan Ucapan
(tagihan per detik)
Standar 5 jam audio gratis per bulan
Pengenalan Pembicara
(tagihan per transaksi)
Verifikasi Pembicara2 10,000 transaksi gratis per bulan
Identifikasi Pembicara2 10,000 transaksi gratis per bulan
Penyimpanan Profil Suara 10,000 transaksi gratis per bulan

Lihat dokumentasi untuk informasi tentang kuota, batas, dan petunjuk tentang cara meningkatkan permintaan serentak.

1Model yang tidak digunakan akan dinonaktifkan secara otomatis setelah 7 hari.

2Pengenalan Pembicara adalah fitur akses terbatas dengan kebutuhan untuk mengajukan permohonan akses.

3Jam audio gratis untuk ucapan ke teks dibagi antara Standar dan Kustom, Batch tidak didukung.

Prabayar: bayar hanya untuk apa yang Anda gunakan.

Kategori Fitur Harga
Ucapan ke Teks
(tagihan per detik)
Real time API Batch
v3.2 atau yang lebih tinggi4
Standar $- per jam $- per jam
Kustom $- per jam
Hosting titik akhir: $- per model per jam
$- per jam
Hosting titik akhir: T/T
Pelatihan Ucapan Kustom6 $- per jam komputasi
Fitur add-on yang ditingkatkan:
  • Identifikasi bahasa Berkelanjutan
  • Diarisasi
  • Penilaian Pengucapan (prosodi, tata bahasa, kosakata, topik)
$- per jam per fitur Identifikasi Bahasa Berkelanjutan dan Diarisasi Disertakan5
Audio Multisaluran Transkripsi Percakapan PRATINJAU $- per jam1 N/A
Teks ke Ucapan
(tagihan per karakter)
Neural Sintesis batch & real time: $- per 1M karakter
Neural HD Sintesis real-time & batch: $- per 1Jt karakter
Neural Kustom2 Pelatihan: $- per jam komputasi, hingga $- per pelatihan
Sintesis batch & real time: $- per 1M karakter
Hosting titik akhir: $- per model per jam
Suara Personal8 Pembuatan suara: gratis
Penyimpanan profil suara: $- per 1.000 profil suara per bulan
Sintesis: $- per 1Jt karakter
Avatar Teks ke Ucapan (tagihan per detik) Avatar Sintesis batch dan real time : $- per menit
Avatar Kustom9 Sintesis real-time: $- per menit
Sintesis batch: $- per menit
Hosting titik akhir: $- per model per jam
Terjemahan Ucapan
(tagihan per detik)
Standar $- per jam audio7
Pengenalan Pembicara
(tagihan per transaksi)
Verifikasi Pembicara3 $- per 1,000 transaksi
Identifikasi Pembicara3 $- per 1,000 transaksi
Penyimpanan Profil Suara $- per 1,000 profil suara (10,000 profil suara gratis per bulan)

Lihat dokumentasi untuk informasi tentang kuota, batas, dan petunjuk tentang cara meningkatkan permintaan serentak.

Jam ucapan ke teks dihitung sebagai jam audio yang dikirim ke layanan, ditagih dengan kelipatan kedua.

1 Ini mencerminkan harga pratinjau publik. Harga GA akan diumumkan nanti di GA.

2 Suara Neural Kustom (CNV) adalah kemampuan akses terbatas yang memiliki versi Pro dan Lite. Dengan CNV Lite (pratinjau publik), pelanggan dapat merekam suara mereka sendiri dan membuat model untuk demonstrasi/evaluasi, sebelum mengajukan akses ke Pro. Periksa di mana CNV tersedia.

3 Pengenalan Pembicara adalah fitur akses terbatas dengan kebutuhan untuk mengajukan permohonan akses.

4 Untuk memanfaatkan harga baru ini, Anda perlu menggunakan Ucapan ke teks baru untuk versi pratinjau baru REST API V3.2. Lihat Membuat transkripsi batch - Layanan ucapan - layanan Azure AI | Microsoft Learn untuk informasi tentang penggunaan versi pratinjau baru API v3.2.

5 Fitur add-on yang disempurnakan disertakan dalam harga Batch untuk semua versi API Batch.

6 Pelatihan Ucapan Kustom berlaku saat menyesuaikan model dasar apa pun yang dirilis pada atau setelah 1 Okt 2023.

7 Harga ini mencakup 1 input dan output audio, hingga 2 bahasa terjemahan teks menggunakan Ucapan ke Teks standar atau kustom serta Terjemahan standar. Untuk terjemahan kustom atau 3+ bahasa terjemahan, silakan lihat halaman harga Terjemahan Teks Azure AI Penerjemah.

8 Hal ini mencerminkan harga pratinjau publik. Harga GA akan diumumkan nanti pada saat GA. Suara Personal adalah fitur akses terbatas yang hanya ditujukan untuk kasus penggunaan tertentu yang telah disetujui sebelumnya, yang diperoleh dengan cara mengajukan permohonan akses. Untuk mempelajari selengkapnya tentang layanan ini, periksa dokumen.

9 Avatar kustom adalah fitur kemampuan akses terbatas yang diperoleh dengan cara mengajukan permohonan akses

Tingkat Komitmen – Azure - Standar

Kategori Fitur Harga (per bulan) Kelebihan
Ucapan ke Teks Standar $- selama 2,000 jam $- per jam
$- selama 10,000 jam $- per jam
$- selama 50,000 jam $- per jam
Kustom $- selama 2,000 jam $- per jam
$- selama 10,000 jam $- per jam
$- selama 50,000 jam $- per jam
Fitur add-on yang ditingkatkan:2
  • Identifikasi bahasa Berkelanjutan
  • Diarisasi
  • Penilaian Pengucapan (prosodi, tata bahasa, kosakata, topik)
$- selama 2,000 jam $- per jam
$- selama 10,000 jam $- per jam
$- selama 50,000 jam $- per jam
Teks ke Ucapan Neural1 $- untuk 80 juta karakter $- per 1 juta karakter
$- untuk 400 juta karakter $- per 1 juta karakter
$- untuk 2,000 juta karakter $- per 1 juta karakter

1Sintesis real-time saja, ini tidak termasuk pembuatan audio panjang.

2Ucapan ke teks real-time saja, fitur add-on Identifikasi Bahasa Berkelanjutan dan Diarisasi disertakan dengan ucapan ke teks batch.

Tingkat Komitmen – Kontainer tersambung

Kategori Fitur Harga (per bulan) Kelebihan
Ucapan ke Teks2 Standar $- selama 2,000 jam $- per jam
$- selama 10,000 jam $- per jam
$- selama 50,000 jam $- per jam
Kustom $- selama 2,000 jam $- per jam
$- selama 10,000 jam $- per jam
$- selama 50,000 jam $- per jam
Fitur add-on yang ditingkatkan:2
  • Identifikasi bahasa
  • Diarisasi
$- selama 2,000 jam $- per jam
$- selama 10,000 jam $- per jam
$- selama 50,000 jam $- per jam
Teks ke Ucapan Neural1 $- untuk 80 juta karakter $- per 1 juta karakter
$- untuk 400 juta karakter $- per 1 juta karakter
$- untuk 2,000 juta karakter $- per 1 juta karakter

1Sintesis real-time saja, ini tidak termasuk pembuatan audio panjang.

2Harga berlaku untuk kasus penggunaan secara real time dan batch. Tidak ada harga batch terpisah untuk kontainer.

Lihat dokumentasi untuk informasi tentang tingkat Komitmen.

Tingkat Komitmen – Kontainer terputus

Daftar untuk mengakses ucapan di kontainer terputus, atau pelajari selengkapnya

Kategori Fitur Harga (per tahun) Penggunaan maks (per tahun) Penggunaan yang diperkirakan (per bulan)
Ucapan ke Teks2 Standar $-
$-
Daftar untuk mendapatkan akses
Pelajari lebih lanjut
120,000 Jam
600,000 Jam
10,000 Jam
50,000 Jam
Kustom $-
$-
Daftar untuk mendapatkan akses
Pelajari lebih lanjut
120,000 Jam
600,000 Jam
10,000 Jam
50,000 Jam
Fitur add-on yang ditingkatkan:
  • Identifikasi bahasa
  • Diarisasi
$-
$-
120,000 Jam
600,000 Jam
10,000 Jam
50,000 Jam
Teks ke Ucapan Neural1 $-
$-
Daftar untuk mendapatkan akses
Pelajari lebih lanjut
4,8 M karakter
24 M karakter
400 JT karakter
2.000 M karakter

1Sintesis real-time saja, ini tidak termasuk pembuatan audio panjang.

2Harga berlaku untuk kasus penggunaan secara real time dan batch. Tidak ada harga batch terpisah untuk kontainer.

Fitur-fitur ini tidak digunakan lagi dan hanya tersedia untuk digunakan oleh pelanggan yang sudah ada. Periksa detail dan pelajari cara bermigrasi ke fitur baru.

Instans Kategori Fitur Harga
Gratis - Web/Kontainer
1permintaan serentak
Teks ke Ucapan Standar 5 million karakter gratis per bulan
Kustom 5 million karakter gratis per bulan
Hosting titik akhir: 1 model gratis per bulan
Standar - Web/Kontainer
100 permintaan serentak untuk model Dasar
20 permintaan serentak untuk model Kustom
Teks ke Ucapan Standar $- per 1M karakter
Kustom $- per 1M karakter
Hosting titik akhir: $- per model per jam

Opsi harga dan pembelian Azure

Terhubung dengan kami secara langsung

Dapatkan panduan harga Azure. Pahami harga untuk solusi cloud Anda, pelajari tentang pengoptimalan biaya, dan minta proposal khusus.

Bicara dengan spesialis penjualan

Lihat cara pembelian

Beli layanan Azure melalui situs web Azure, perwakilan Microsoft, atau mitra Azure.

Jelajahi opsi Anda

Sumber daya tambahan

Azure AI Speech

Pelajari selengkapnya tentang fitur dan kemampuan Azure AI Speech.

Kalkulator harga

Perkirakan biaya bulanan Anda untuk penggunaan kombinasi produk Azure apa pun.

Dokumentasi

Tinjau tutorial teknis, video, dan Azure AI Speech sumber daya lainnya.

    • Untuk Ucapan ke Teks dan Terjemahan Ucapan, penggunaan ditagih dalam kelipatan satu detik.
    • Untuk Teks ke Ucapan: penggunaan ditagih per karakter. Periksa definisi karakter dalam catatan harga.
    • Untuk hosting suara neural kustom: biaya penggunaan dikenakan per titik akhir per detik. Periksa detailnya di catatan harga.
    • Untuk penyimpanan profil suara personal: biaya penggunaan dikenakan per profil suara per hari. Periksa detailnya di catatan harga.
    • Untuk Avatar Teks ke Ucapan, penggunaan ditagih per detik.
    • Untuk Ucapan ke Teks dan Teks ke Ucapan (termasuk Avatar), hosting titik akhir untuk model kustom ditagih per detik per model.
  • Layanan Ucapan memungkinkan pengguna untuk menyesuaikan model dasar berdasarkan data akustik dan bahasa mereka sendiri, yang mengarah ke model ucapan kustom yang dapat digunakan terhadap Ucapan ke Teks dan Penerjemahan Ucapan.

  • Model bahasa adalah distribusi probabilitas atas urutan kata. Model bahasa membantu sistem memutuskan di antara urutan kata yang terdengar sama, berdasarkan kemungkinan urutan kata itu sendiri. Misalnya, suara “recognize speech” dan “wreck a nice beach” terdengar sama, tetapi hipotesis pertama jauh lebih mungkin terjadi, dan karenanya akan diberi skor yang lebih tinggi oleh model bahasa. Jika Anda mengharapkan kueri suara pada aplikasi Anda berisi item kosakata tertentu, seperti nama produk atau jargon yang jarang muncul dalam ucapan biasa, Anda mungkin dapat memperoleh peningkatan kinerja dengan menyesuaikan model bahasanya. Misalnya, jika Anda membuat aplikasi untuk mencari MSDN dengan suara, kemungkinan istilah seperti “object-oriented” atau “namespace” atau “dot net” akan muncul lebih sering daripada dalam aplikasi suara biasa. Mengustomisasi model bahasa akan memungkinkan sistem mempelajari hal ini.

  • Model akustik adalah penggolong yang melabeli fragmen-fragmen pendek audio ke dalam salah satu dari beberapa fonem, atau unit suara, dalam setiap bahasa. Fonem-fonem ini kemudian dapat ditautkan bersama-sama untuk membentuk kata. Misalnya, kata “speech” terdiri dari empat fonem “s p iy ch”. Klasifikasi ini dibuat dengan urutan 100 kali per detik. Mengustomisasi model akustik dapat memungkinkan sistem untuk belajar melaksanakan pekerjaan mengenali ucapan dengan lebih baik di lingkungan yang tidak biasa. Misalnya, jika Anda memiliki aplikasi yang dirancang untuk digunakan oleh pekerja di gudang atau pabrik, model akustik yang dikustomisasi dapat lebih akurat mengenali ucapan jika ada kebisingan yang ditemukan di lingkungan tersebut.

  • Layanan Ucapan menawarkan berbagai font suara teks-ke-ucapan (TTS), namun suara neural kustom memungkinkan Anda untuk membangun suara kustom Anda sendiri yang sesuai dengan kebutuhan dan merek Anda. Baca blog untuk informasi selengkapnya.

  • Identifikasi bahasa memungkinkan Anda mengidentifikasi peralihan dalam bahasa lisan dan mentranskripsikan ucapan dengan benar. Metode ini dapat diterapkan dalam skenario apabila bahasa audio tidak diketahui atau ketika pembicara mungkin berbicara dalam beberapa bahasa. Identifikasi Bahasa Tunggal tersedia tanpa biaya tambahan. Identifikasi Bahasa Berkelanjutan adalah fitur tambahan yang disempurnakan. Kunjungi dokumen untuk mempelajari selengkapnya.

    • Penilaian pengucapan mengevaluasi pengucapan ucapan dan memberikan umpan balik kepada pembicara tentang akurasi dan kefasihan audio lisan. Dengan penilaian pengucapan, pelajar bahasa dapat berlatih, mendapatkan umpan balik instan, dan meningkatkan pengucapan sehingga mereka dapat berbicara dan menyajikan dengan percaya diri. Pendidik dapat menggunakan kemampuan untuk mengevaluasi pengucapan beberapa pembicara secara real time. Buka dokumentasi untuk mempelajari selengkapnya.
    • Ini dikenakan biaya sebagai Ucapan ke Teks standar, contoh:
      Untuk evaluasi 8 detik ucapan, Anda akan dikenakan biaya sekitar $-

Hubungi ahli penjualan untuk panduan harga Azure. Pahami harga untuk solusi cloud Anda.

Dapatkan layanan cloud gratis dan kredit $200 untuk menjelajahi Azure selama 30 hari.

Ditambahkan ke perkiraan. Tekan 'v' untuk melihat pada kalkulator