Azure Yapay Zeka Konuşma fiyatlandırma
Konuşmayı metne dönüştürme, metin okuma ve konuşma çevirisi için birleşik konuşma hizmetleri
Birleşik Konuşma hizmetleri tarafından konuşma transkripsiyonu, metin okuma ve konuşma çevirisi dahil olmak üzere geniş bir yelpazede konuşma tanıma ve oluşturma özellikleri sağlanır. Konuşma hizmeti tarafından konuşma transkripsiyonu, metin okuma, konuşma çevirisi ve konuşmacı tanıma da dahil olmak üzere geniş bir yelpazede konuşma tanıma ve oluşturma özellikleri sağlanır.
Fiyatlandırma seçeneklerini keşfetme
Fiyatlandırma seçeneklerini gereksinimlerinize göre özelleştirmek için filtre uygulayın.
Fiyatlar yalnızca tahmini olup gerçek fiyat teklifi değildir. Gerçek fiyatlandırma, Microsoft ile girilen sözleşmenin türüne, satın alma tarihine ve döviz kuruna göre değişebilir. Fiyatlar ABD doları olarak hesaplanıp önceki ayın son iş gününden önceki iki iş gününde alınan Londra spot oranları kullanılarak dönüştürülür. Büyük pazarlarda, ay sonundan önceki iki iş günü resmi tatile denk gelirse fiyat ayarlama günü, genellikle iki iş gününden hemen önceki gün olur. Bu oran, gelecek ay boyunca tüm işlemlerde geçerlidir. Microsoft ile geçerli programınıza/teklifinize göre fiyatlandırmayı görmek için Azure fiyatlandırma hesaplayıcısı’nda oturum açın. Fiyatlandırma hakkında daha fazla bilgi almak veya fiyat teklifi istemek için Azure satış uzmanı ile görüşün. Azure fiyatlandırması hakkında bilgi için sık sorulan sorular bölümüne bakın.
ABD kamu kuruluşları, Azure Kamu hizmetlerini ön finansal taahhüt zorunluluğu olmadan, bir lisanslama çözümü sağlayıcısı (LSP) aracılığıyla ya da kullandıkça öde çevrimiçi aboneliğiyle doğrudan satın almaya uygundur.
Önemli: R$ cinsinden fiyat yalnızca bir referanstır; bu uluslararası bir işlemdir ve son fiyat, döviz kurlarının yanı sıra IOF vergilerinin dahil edilmesiyle belirlenir. eNF verilmeyecektir.
ABD kamu kuruluşları, Azure Kamu hizmetlerini ön finansal taahhüt zorunluluğu olmadan, bir lisanslama çözümü sağlayıcısı (LSP) aracılığıyla ya da kullandıkça öde çevrimiçi aboneliğiyle doğrudan satın almaya uygundur.
Önemli: R$ cinsinden fiyat yalnızca bir referanstır; bu uluslararası bir işlemdir ve son fiyat, döviz kurlarının yanı sıra IOF vergilerinin dahil edilmesiyle belirlenir. eNF verilmeyecektir.
Ücretsiz (F0)
| Kategori | Özellikler | Fiyat |
|---|---|---|
| Konuşmayı Metne Dönüştürme (saniye başına faturalama) |
Standart | Aylık 5 saatlik ses ücretsiz3 |
| Özel |
Aylık 5 saatlik ses ücretsiz3 Uç nokta barındırma: Aylık 1 model ücretsiz1 |
|
| Konuşma Transkripsiyonu Çok Kanallı Ses ÖNİZLEME | Aylık 5 saatlik ses ücretsiz | |
| Metin Okuma (karakter başına faturalama) |
Nöral | Aylık 0.5 million karakter ücretsiz |
| Konuşma Çevirisi (saniye başına faturalama) |
Standart | Aylık 5 saatlik ses ücretsiz |
| Konuşmacı Tanıma (işlem başına faturalama) |
Konuşmacı Doğrulama2 | Aylık 10,000 ücretsiz işlem |
| Konuşmacı Tanıma2 | Aylık 10,000 ücretsiz işlem | |
| Ses Profili Depolama | Aylık 10,000 ücretsiz işlem |
See the documentation for information on quotas, limits and instructions on how to increase concurrent requests.
1Kullanılmayan modeller, 7 günün sonunda otomatik olarak kullanımdan kaldırılır.
2Speaker Recognition is a limited access feature with a need to apply for access.
3Konuşmadan metne dönüştürme için ücretsiz ses saatleri Standart ve Özel arasında paylaşılır, Batch desteklenmiyor.
Kullandığın Kadar Öde: yalnızca kullandığınız miktar için ödeme yapın.
| Kategori | Fiyat | |
|---|---|---|
| Voice Live Pro (m belirteci faturalandırması başına)VL1 | Metin |
Giriş: $- Önbelleğe Alınan Giriş: $- Çıktı: $- |
| Audio with Azure Speech in Foundry Tools - Standard |
Giriş: $- Önbelleğe Alınan Giriş: $- Çıktı: $- |
|
| Audio with Azure Speech in Foundry Tools - CustomVL2 |
Giriş: $- Önbelleğe Alınan Giriş: $- Çıktı: $- |
|
| Native audio with speech-to-speech real-time model |
Giriş: $- Önbelleğe Alınan Giriş: $- Çıktı: $- |
|
| Voice Live Standard (per m token billing)VL1 | Metin |
Giriş: $- Önbelleğe Alınan Giriş: $- Çıktı: $- |
| Audio with Azure Speech in Foundry Tools - Standard |
Giriş: $- Önbelleğe Alınan Giriş: $- Çıktı: $- |
|
| Audio with Azure Speech in Foundry Tools - CustomVL2 |
Giriş: $- Önbelleğe Alınan Giriş: $- Çıktı: $- |
|
| Native audio with speech-to-speech real-time model |
Giriş: $- Önbelleğe Alınan Giriş: $- Çıktı: $- |
|
| Voice Live Lite (m belirteci faturalandırması başına)VL1 | Metin |
Giriş: $- Önbelleğe Alınan Giriş: $- Çıktı: $- |
| Audio with Azure Speech in Foundry Tools - Standard |
Giriş: $- Önbelleğe Alınan Giriş: $- Çıktı: $- |
|
| Audio with Azure Speech in Foundry Tools - CustomVL2 |
Önbelleğe Alınan Giriş: $- Çıktı: $- |
|
| Native audio with speech-to-speech real-time model |
Giriş: $- Önbelleğe Alınan Giriş: $- |
|
| Voice Live BYO (per m token billing)VL1 | Audio with Azure AI Speech - Standard |
Giriş: $- Çıktı: $- |
| Audio with Azure AI Speech - CustomVL2 |
Giriş: $- Çıktı: $- |
|
| Voice Live Avatar (per minute billing) | Avatar output with Voice Live | Charged through Text to Speech Avatar ‘interactive avatar (real-time)’. See below Text to Speech pricing table for details. |
| Konuşmayı Metne Dönüştürme (saniye başına faturalama) |
Standart Döküm |
Gerçek zamanlı Transkripsiyon: $- / saat Hızlı Transkripsiyon: $- / saat9 Toplu Transkripsiyon: $- / saat1 |
| Özel Döküm |
Gerçek zamanlı Transkripsiyon: $- / saat Toplu Transkripsiyon: $- / saat1 Uç nokta barındırma: Model başına saatlik $- Özel Konuşma Eğitimi5: İşlem saati başına $- |
|
Gelişmiş eklenti özellikleri:
|
Gerçek zamanlı: Özellik başına saatlik $- Toplu İş (Sürekli Dil tanımlama, Temizleme): Standart/Özel'e dahildir (ek ücret ödemez) |
|
| Konuşma Transkripsiyonu Çok Kanallı Ses ÖNİZLEME | $- / saat2 | |
| Konuşma Çevirisi (saniye başına faturalama) |
Gerçek zamanlı Konuşma Çevirisi | Saatlik ses başına $-3 |
| Live Interpreter |
Input audio: Saatlik ses başına $- Output text: Her 1 milyon karakter başına $- Output audio (Standard voice): $- per audio hourLI Output audio (Custom voice): $- per audio hourLI |
|
| Video Çevirisi |
Giriş videosu: $- / saat Çıkış videosu (Standart ses): $- / saat Çıkış videosu (Kişisel ses): $- / saat |
|
| Metin Okuma8 | Standart Ses |
Nöral (gerçek zamanlı ve toplu): Her 1 milyon karakter başına $- Nöral HD (gerçek zamanlı ve toplu)4: Her 1 milyon karakter başına $- |
| Özel Ses |
Profesyonel Ses:
Sentez (gerçek zamanlı ve toplu işlem): 1M karakter başına $-
Sentez (nöral HD gerçek zamanlı ve toplu): 1 milyon karakter başına $- Ses modeli eğitimi: İşlem saati başına $-, en fazla Eğitim başına $- Uç nokta barındırma: Model başına saatlik $- |
|
|
Kişisel Ses6:
Sentez (gerçek zamanlı ve toplu işlem): 1M karakter başına $-
Ses oluşturma: Ücretsiz Ses profili depolama alanı: Aylık 1.000 ses profili başına $- |
||
| Geliştirilmiş Eklenti özelliği: Avatar |
Standart:
Etkileşimli avatar (gerçek zamanlı): dakika başına $-
Etkileşimli 4K avatar (gerçek zamanlı): dakika başına $- Avatar videosu (toplu iş): dakika başına $- 4K avatar videosu (toplu): dakika başına $- |
|
|
Özel:
Avatar modeli eğitimi: İşlem saati başına $-
Etkileşimli avatar (gerçek zamanlı): dakika başına $- Etkileşimli 4K avatar (gerçek zamanlı): dakika başına $- Avatar videosu (toplu iş): dakika başına $- 4K avatar videosu (toplu): dakika başına $- Uç nokta barındırma: saatte model başına $- |
||
| Konuşmacı Tanıma (işlem başına faturalama) |
Konuşmacı Doğrulama7 | 1,000 işlem başına $- |
| Konuşmacı Tanıma7 | 1,000 işlem başına $- | |
| Ses Profili Depolama | 1,000 ses profili başına $- (aylık 10,000 ücretsiz ses profili) | |
See the documentation for information on quotas, limits and instructions on how to increase concurrent requests.
Konuşmayı metne dönüştürme saatleri, servise gönderilen ses saatleri olarak ölçülür ve ikinci artışlarla faturalanır.
1To take advantage of this new Batch Transcription pricing you need to use Speech to text REST API V3.2 or later versions. See Speech to text REST API for information.
2Bu, genel önizleme fiyatlandırmasını yansıtır.
3This price includes 1 audio input and output, up to 2 text translation language using standard or custom Speech to Text and standard Translation. For custom Translation or 3+ translation languages, please reference the Azure Translator in Foundry Tools Text Translation pricing page.
4Selected text to speech voices are available via two model variants: Neural and NeuralHD. Learn more here.
5Özel Konuşma Eğitimi, 1 Ekim 2023 tarihinde veya sonrasında yayınlanan temel modellerin özelleştirilmesi sırasında geçerlidir.
6Personal Voice is a limited access feature restricted to certain pre-approved use cases only, with a need to applying for access. To learn more about the service, check the document.
7Speaker Recognition is a limited access feature with a need to apply for access.
8Metinden Konuşmaya: Konuşma sentezi kullanımı karakter başına faturalandırılır. Avatar saniye başına faturalandırılır. Eğitim ve model barındırma saniye başına faturalandırılır.
9To use Fast Transcription you need to use Speech to text REST API 2024-05-15-preview or later versions. See Speech to text REST API for information.
VL1With Voice Live Pro, developers can choose from larger LLMs such as GPT-Realtime, GPT-4o and GPT-4.1 models. With Voice Live Standard, developers can choose from smaller LLMs such as GPT-4o-Mini-Realtime, GPT-4o Mini and GPT-4.1 Mini models. With Voice Live Lite, developers can choose from SLMs and equivalent models such as GPT-4.1 Nano and Phi models. Models for each tier will be updated or retired as they become available. To learn more how Voice Live API pricing works, click here.
VL2You will be charged separately for custom speech and custom voice model training and hosting. Refer to the ‘Speech to Text – Custom Transcription’ and ‘Text to Speech – Custom Voice – Professional’ pricing for details. Custom voice is a limited access feature. Learn more about how to create custom voices.
LIThis price includes text output
Taahhüt Katmanları – Azure - Standart
| Kategori | Özellikler | Fiyat (aylık) | Fazla Kullanım |
|---|---|---|---|
| Konuşmayı Metne Dönüştürme | Standart | 2,000 saat için $- | $-/saat |
| 10,000 saat için $- | $-/saat | ||
| 50,000 saat için $- | $-/saat | ||
| Özel | 2,000 saat için $- | $-/saat | |
| 10,000 saat için $- | $-/saat | ||
| 50,000 saat için $- | $-/saat | ||
Gelişmiş eklenti özellikleri:2
|
2,000 saat için $- | $-/saat | |
| 10,000 saat için $- | $-/saat | ||
| 50,000 saat için $- | $-/saat | ||
| Metin Okuma | Nöral1 | 80 Milyon karakter için $- | 1 Milyon karakter başına $- |
| 400 Milyon karakter için $- | 1 Milyon karakter başına $- | ||
| 2,000 Milyon karakter için $- | 1 Milyon karakter başına $- |
1Bu, hem gerçek zamanlı sentezi hem de önceden oluşturulmuş HD olmayan ve AOAI olmayan nöral sesler bulunan toplu sentezi içerir. HD sesler, AOAI sesleri, Özel Nöral Ses ve Kişisel Ses dahil değildir.
2Yalnızca gerçek zamanlı konuşmayı metne dönüştürme, Toplu konuşmayı metne dönüştürmeye dâhil edilen Sürekli Dil Tanımlama ve Sınıflandırma eklentisi özellikleri.
Taahhüt Katmanları – Bağlı kapsayıcı
| Kategori | Özellikler | Fiyat (aylık) | Fazla Kullanım |
|---|---|---|---|
| Konuşmayı Metne Dönüştürme2 | Standart | 2,000 saat için $- | $-/saat |
| 10,000 saat için $- | $-/saat | ||
| 50,000 saat için $- | $-/saat | ||
| Özel | 2,000 saat için $- | $-/saat | |
| 10,000 saat için $- | $-/saat | ||
| 50,000 saat için $- | $-/saat | ||
Gelişmiş eklenti özellikleri:2
|
2,000 saat için $- | $-/saat | |
| 10,000 saat için $- | $-/saat | ||
| 50,000 saat için $- | $-/saat | ||
| Metin Okuma | Nöral1 | 80 Milyon karakter için $- | 1 Milyon karakter başına $- |
| 400 Milyon karakter için $- | 1 Milyon karakter başına $- | ||
| 2,000 Milyon karakter için $- | 1 Milyon karakter başına $- |
1Bu, önceden oluşturulmuş HD olmayan ve AOAI olmayan nöral sesler bulunan gerçek zamanlı sentezi içerir. HD sesler, AOAI sesleri ve özel sesler (hem profesyonel hem de kişisel sesler) dahil değildir. Toplu işlem sentezi dahil değildir.
2Fiyatlandırma, gerçek zamanlı ve toplu kullanım örnekleri için geçerlidir. Kapsayıcılar için ayrı toplu fiyatlandırma yoktur.
See the documentation for information on Commitment tiers.
Taahhüt Katmanları – Bağlantısı kesik kapsayıcı
Sign up to access speech in disconnected containers, or learn more
| Kategori | Özellikler | Fiyat (yıllık) | En fazla kullanım (yıllık) | Tahmini kullanım (aylık) |
|---|---|---|---|---|
| Konuşmayı Metne Dönüştürme2 | Standart |
$-
$- Erişim almak için kaydolun Daha fazla bilgi |
120.000 saat
600.000 saat |
10.000 saat
50.000 saat |
| Özel |
$-
$- Erişim almak için kaydolun Daha fazla bilgi |
120.000 saat
600.000 saat |
10.000 saat
50.000 saat |
|
Gelişmiş eklenti özellikleri:
|
$-
$- |
120.000 saat
600.000 saat |
10.000 saat
50.000 saat |
|
| Metin Okuma | Nöral1 |
$-
$- Erişim almak için kaydolun Daha fazla bilgi |
4,8 milyar karakter
24 milyar karakter |
400 milyon karakter
2 milyar karakter |
1Bu, önceden oluşturulmuş HD olmayan ve AOAI olmayan nöral sesler bulunan gerçek zamanlı sentezi içerir. HD sesler, AOAI sesleri ve özel sesler (hem profesyonel hem de kişisel sesler) dahil değildir. Toplu işlem sentezi dahil değildir.
2Fiyatlandırma, gerçek zamanlı ve toplu kullanım örnekleri için geçerlidir. Kapsayıcılar için ayrı toplu fiyatlandırma yoktur.
Bu özellikler kullanım dışı bırakılıyor ve yalnızca mevcut müşteriler tarafından kullanılabilecek. Ayrıntıları denetleyin ve yeni özelliklere nasıl geçiş yapacağınızı öğrenin.
| Örnek | Kategori | Özellikler | Fiyat |
|---|---|---|---|
| Ücretsiz - Web/Kapsayıcı 1 eş zamanlı istek |
Metin Okuma | Standart | Aylık 5 million karakter ücretsiz |
| Özel |
Aylık 5 million karakter ücretsiz Uç nokta barındırma: Aylık 1 model ücretsiz |
||
| Standart: Web/Kapsayıcı Temel model için eş zamanlı 100 istek Özel model için eş zamanlı 20 istek |
Metin Okuma | Standart | Her 1 milyon karakter başına $- |
| Özel |
Her 1 milyon karakter başına $- Uç nokta barındırma: Model başına saatlik $- |
Azure için fiyatlandırma ve satın alma seçenekleri
Doğrudan bize bağlanın
Azure fiyatlandırması kılavuzluğu alın. Bulut çözümünüzün fiyatlandırmasını anlayın, maliyet iyileştirmesi hakkında bilgi edinin ve özel bir teklif isteyin.
Bir satış uzmanıyla görüşünSatın alma yollarını görme
Azure web sitesi, bir Microsoft temsilcisi veya bir Azure iş ortağı aracılığıyla Azure hizmetlerini satın alın.
Seçenekleri keşfetmeEk kaynaklar
Azure Yapay Zeka Konuşma
Azure Yapay Zeka Konuşma özellikleri ve becerileri hakkında daha fazla bilgi edinin.
Ücretlendirme hesaplayıcı
Çeşitli Azure ürünlerini bir arada kullandığınızda ortaya çıkması beklenen aylık maliyetleri tahmin edin.
Belgeler
Teknik öğreticileri, videoları ve daha fazla Azure Yapay Zeka Konuşma kaynağını gözden geçirin.
Sık sorulan sorular
-
- Konuşmayı Metne Dönüştürme ve Konuşma Çevirisi için, kullanım bir saniyelik artışlarla faturalandırılır.
- For Text to Speech: usage is billed per character. Check the definition of character in the pricing note.
- For custom neural voice hosting: usage is billed per endpoint per second. Check details in the pricing note.
- For personal voice profile storage: usage is billed per voice profile per day. Check details in the pricing note.
- Metin Okuma Avatarı için kullanım saniye başına faturalandırılır.
- Konuşmayı Metne Dönüştürme ve Metin Okuma’da (Avatar dahil), özel modeller için uç nokta barındırma, model başına saniyelik olarak faturalandırılır.
-
Konuşma hizmeti, kullanıcıların temel modelleri kendi akustik ve dil verilerine göre uyarlayarak hem Konuşmayı Metne Dönüştürme hem de Konuşma Çevirisi ile kullanılabilecek özel konuşma modelleri elde etmesine olanak tanır.
-
Dil modeli, sözcük dizileri üzerine bir olasılık dağılımıdır. Dil modeli sistemin, söyleniş biçimi birbirine benzeyen söz dizileri arasından seçim yapmasına yardımcı olur. Sistem bu seçimi, söz dizisinin kullanılma olasılığına göre yapar. Örneğin, “konuşma tanıma” ile “konuş vatanıma” ifadelerinin söylenişi birbirine benzer, ancak birinci hipotezin gerçekleşme olasılığı çok daha yüksek olduğundan dil modeli, birinci modele daha yüksek bir puan atar. Uygulamanıza yönelik sesli sorguların belirli sözlük öğelerini (ürün adları veya gündelik konuşmada nadiren kullanılan terimler) içermesini bekliyorsanız, dil modelini özelleştirerek daha iyi bir performans elde edebilirsiniz. Örneğin, MSDN’de sesli arama gerçekleştirmeye yönelik bir uygulama oluşturuyor olsaydınız “nesne odaklı”, “ad alanı” veya “dot net” gibi terimler, normal ses tanıma uygulamalarına kıyasla daha sık görülürdü. Dil modelinin özelleştirilmesi, sistemin bunu öğrenmesine olanak tanır.
-
Akustik model, kısa ses parçalarını her dildeki çeşitli fonemlere (ses birimlerine) göre nitelendiren bir sınıflandırıcıdır. Bu sınıflandırma sayesinde fonemler birleştirilerek sözcükler oluşturulabilir. Örneğin İngilizcedeki “speech” (konuşma) sözcüğü, “s p iy ch” şeklinde dört fonemden oluşur. Bu sınıflandırmalar, saniyede yaklaşık 100 kez gerçekleştirilir. Akustik modelin özelleştirilmesi, sistemin alışılmadık ortamlarda konuşmaları daha iyi tanımasını sağlayabilir. Örneğin, bir depo veya fabrikadaki çalışanlar tarafından kullanılmak üzere tasarlanmış bir uygulamanız varsa, özelleştirilmiş bir akustik model, bu gürültülü ortamlarda konuşmaların daha doğru bir şekilde tanınmasını sağlayabilir.
-
Speech service offers a wide range of text-to-speech (TTS) voice fonts, however custom neural voice allows you to build your own custom voice that suits your needs and your brand. Read the blog for more information.
-
Language identification allows you to identify a switch in spoken language and transcribe speech accordingly. This can be applied in scenarios where the audio language is unknown, or when speaker(s) may speak multiple languages. Single Language Identification is available at no additional cost. Continuous Language Identification is an enhanced add-on feature. Visit docs to learn more.
-
- Pronunciation assessment evaluates speech pronunciation and gives speakers feedback on the accuracy and fluency of spoken audio. With pronunciation assessment, language learners can practice, get instant feedback, and improve their pronunciation so that they can speak and present with confidence. Educators can use the capability to evaluate pronunciation of multiple speakers in real time. Visit docs to learn more.
- It is charged as standard Speech to Text, example:
For evaluation of 8 seconds of speech, you will be charged around $-
Azure fiyatlandırması hakkında ayrıntılı bilgi için bir satış uzmanıyla görüşün. Bulut çözümünüzün fiyatlandırmasını anlayın.
Azure’ı 30 gün boyunca keşfetmek için ücretsiz bulut hizmetlerinden ve $200 değerinde krediden yararlanın.