Jednotné hlasové služby pro převod řeči na text, textu na řeč a překlad řeči
Sjednocené hlasové služby poskytují širokou škálu možností rozpoznávání a generování řeči, včetně přepisu řeči, převodu textu na řeč a překladu řeči. Služba Speech poskytuje širokou škálu možností rozpoznávání a generování řeči, včetně přepisu řeči, převodu textu na řeč, překladu řeči a rozpoznávání mluvčího.
Projděte si cenové možnosti
Využijte filtry a přizpůsobte cenové možnosti vašim potřebám.
Prices are estimates only and are not intended as actual price quotes. Actual pricing may vary depending on the type of agreement entered with Microsoft, date of purchase, and the currency exchange rate. Prices are calculated based on US dollars and converted using London closing spot rates that are captured in the two business days prior to the last business day of the previous month end. If the two business days prior to the end of the month fall on a bank holiday in major markets, the rate setting day is generally the day immediately preceding the two business days. This rate applies to all transactions during the upcoming month. Sign in to the Azure pricing calculator to see pricing based on your current program/offer with Microsoft. Contact an Azure sales specialist for more information on pricing or to request a price quote. See frequently asked questions about Azure pricing.
Entity státní správy USA mají nárok na zakoupení služeb Azure Government od poskytovatele řešení licencí bez jakýchkoli finančních závazků předem nebo přímo prostřednictvím online předplatného s průběžnými platbami.
Důležité – Cena v R$ je jenom referenční. Jde o mezinárodní transakci a konečná cena závisí na směnných kurzech a na tom, jestli se bude účtovat daň IOF. Nebude se vydávat doklad eNF.
Entity státní správy USA mají nárok na zakoupení služeb Azure Government od poskytovatele řešení licencí bez jakýchkoli finančních závazků předem nebo přímo prostřednictvím online předplatného s průběžnými platbami.
Důležité – Cena v R$ je jenom referenční. Jde o mezinárodní transakci a konečná cena závisí na směnných kurzech a na tom, jestli se bude účtovat daň IOF. Nebude se vydávat doklad eNF.
Free (F0)
Kategorie | Funkce | Cena |
---|---|---|
Převod řeči na text (fakturace za sekundu) |
Standard | 5 hodin zvuku zdarma za měsíc3 |
Vlastní |
5 hodin zvuku zdarma za měsíc3 Hostování koncového bodu: 1 model zdarma za měsíc1 |
|
Vícekanálový zvuk k přepisu konverzace PREVIEW | 5 hodin zvuku zdarma za měsíc | |
Převod textu na řeč (fakturace podle znaků) |
Neurální | 0.5 million znaků zdarma za měsíc |
Překlad řeči (fakturace za sekundu) |
Standard | 5 hodin zvuku zdarma za měsíc |
Rozpoznávání mluvčího (podle fakturace transakce) |
Ověření mluvčího2 | 10,000 transakcí zdarma za měsíc |
Identifikace mluvčího2 | 10,000 transakcí zdarma za měsíc | |
Úložiště hlasového profilu | 10,000 transakcí zdarma za měsíc |
Průběžné platby: Plaťte jen za to, co využijete.
Kategorie | Funkce | Cena | |
---|---|---|---|
Převod řeči na text (fakturace za sekundu) |
V reálném čase | Batch rozhraní API verze 3.2 nebo vyšší4 |
|
Standard | $- za hodinu | $- za hodinu | |
Vlastní |
$- za hodinu Hostování koncového bodu: $- za model a hodinu |
$- za hodinu Hostování koncového bodu: není k dispozici |
|
Trénování služby Custom Speech6 | $- za výpočetní hodinu | ||
Vylepšené doplňkové funkce:
|
$- za hodinu na funkci | Zahrnuta průběžná identifikace jazyka a diarizace5 | |
Vícekanálový zvuk k přepisu konverzace PREVIEW | $- za hodinu1 | Není k dispozici | |
Převod textu na řeč (fakturace podle znaků) |
Neurální |
Syntéza v reálném čase a syntéza dávky: $- za 1 mil.
znaků Vytvoření dlouhého zvukového záznamu: $- za 1 milion znaků |
|
Vlastní neurální2 |
Trénování: $- za výpočetní hodinu, až $- za natrénování Syntéza v reálném čase a syntéza dávky: $- za 1 milion znaků Hostování koncového bodu: $- za model a hodinu Vytvoření dlouhého zvukového záznamu: $- za 1 milion znaků |
||
Překlad řeči (fakturace za sekundu) |
Standard | $- za hodinu zvuku7 | |
Rozpoznávání mluvčího (podle fakturace transakce) |
Ověření mluvčího3 | $- za 1,000 transakcí | |
Identifikace mluvčího3 | $- za 1,000 transakcí | ||
Úložiště hlasového profilu | $- za 1,000 hlasových profilů (10,000 hlasových profilů zdarma za měsíc) |
Vrstvy závazku – Azure – Standard
Kategorie | Funkce | Cena (za měsíc) | Nadlimitní využití |
---|---|---|---|
Převod řeči na text | Standard | $- za 2,000 hod | $- za hodinu |
$- za 10,000 hod | $- za hodinu | ||
$- za 50,000 hod | $- za hodinu | ||
Vlastní | $- za 2,000 hod | $- za hodinu | |
$- za 10,000 hod | $- za hodinu | ||
$- za 50,000 hod | $- za hodinu | ||
Vylepšené doplňkové funkce:2
|
$- za 2,000 hod | $- za hodinu | |
$- za 10,000 hod | $- za hodinu | ||
$- za 50,000 hod | $- za hodinu | ||
Převod textu na řeč | Neurální1 | $- za 80 mil. znaků | $- na 1 mil. znaků |
$- za 400 mil. znaků | $- na 1 mil. znaků | ||
$- za 2,000 mil. znaků | $- na 1 mil. znaků |
1Jen syntéza v reálném čase, nezahrnuje dlouhé vytváření zvuku.
2Funkce převodu řeči na text pouze v reálném čase, průběžné identifikace jazyka a doplňkové funkce diarizace jsou součástí dávkového převodu řeči na text.
Vrstvy závazku – připojený kontejner
Kategorie | Funkce | Cena (za měsíc) | Nadlimitní využití |
---|---|---|---|
Převod řeči na text2 | Standard | $- za 2,000 hod | $- za hodinu |
$- za 10,000 hod | $- za hodinu | ||
$- za 50,000 hod | $- za hodinu | ||
Vlastní | $- za 2,000 hod | $- za hodinu | |
$- za 10,000 hod | $- za hodinu | ||
$- za 50,000 hod | $- za hodinu | ||
Vylepšené doplňkové funkce:2
|
$- za 2,000 hod | $- za hodinu | |
$- za 10,000 hod | $- za hodinu | ||
$- za 50,000 hod | $- za hodinu | ||
Převod textu na řeč | Neurální1 | $- za 80 mil. znaků | $- na 1 mil. znaků |
$- za 400 mil. znaků | $- na 1 mil. znaků | ||
$- za 2,000 mil. znaků | $- na 1 mil. znaků |
1Jen syntéza v reálném čase, nezahrnuje dlouhé vytváření zvuku.
2Ceny se vztahují na případy použití v reálném čase a na případy dávkového použití. Pro kontejnery nejsou k dispozici žádné samostatné ceny za dávku.
Informace o úrovních závazku najdete v dokumentaci.
Vrstvy závazku – odpojený kontejner
Zaregistrujte se a získejte přístup ke službám Speech v odpojených kontejnerech nebo si přečtěte další informace.
Kategorie | Funkce | Cena (za rok) | Maximální využití (za rok) | Předpokládané využití (za měsíc) |
---|---|---|---|---|
Převod řeči na text2 | Standard |
$-
$- Zaregistrovat se a získat přístup Další informace |
120 000 hodin
600 000 hodin |
10 000 hodin
50 000 hodin |
Vlastní |
$-
$- Zaregistrovat se a získat přístup Další informace |
120 000 hodin
600 000 hodin |
10 000 hodin
50 000 hodin |
|
Převod textu na řeč | Neurální1 |
$-
$- Zaregistrovat se a získat přístup Další informace |
4,8 mld. znaků
24 mld. znaků |
400 mil. znaků
2 000 mil. znaků |
1Jen syntéza v reálném čase, nezahrnuje dlouhé vytváření zvuku.
2Ceny se vztahují na případy použití v reálném čase a na případy dávkového použití. Pro kontejnery nejsou k dispozici žádné samostatné ceny za dávku.
Tyto funkce jsou zastaralé a dostupné jenom pro stávající zákazníky. Projděte si podrobnosti a zjistěte, jak migrovat na nové funkce..
Instance | Kategorie | Funkce | Cena |
---|---|---|---|
Zdarma - Web/kontejner 1 souběžný požadavek |
Převod textu na řeč | Standard | 5 million znaků zdarma za měsíc |
Vlastní |
5 million znaků zdarma za měsíc Hostování koncového bodu: 1 model zdarma za měsíc |
||
Standard – web/kontejner 100 souběžných požadavků pro základní model 20 souběžných požadavků pro vlastní model |
Převod textu na řeč | Standard | $- za 1 milion znaků |
Vlastní |
$- za 1 milion znaků Hostování koncového bodu: $- za model a hodinu |
Možnosti nákupu a ceny služeb Azure

Spojte se s námi přímo
Projděte si ceny Azure. Projděte si ceny cloudového řešení, seznamte se s optimalizací nákladů a vyžádejte si vlastní návrh.
Spojte se s prodejním specialistouPodívejte se na možnosti nákupu
Služby Azure můžete nakoupit prostřednictvím webu Azure, zástupce Microsoftu nebo partnera Azure.
Projít možnostiDalší prostředky
Azure AI Speech
Další informace o funkcích a možnostech produktu Azure AI Speech
Cenová kalkulačka
Odhadněte očekávané měsíční náklady na používání libovolné kombinace produktů Azure.
Dokumentace
Projděte si technické výukové programy, videa a další materiály k produktu Azure AI Speech
Nejčastější dotazy
-
- V případě převodu řeči na text a překlad řeči se využití účtuje po sekundách.
- Převod textu na řeč: využití se účtuje po znacích. Zkontrolujte definici znaku vpoznámce k ceně.
- Pro převod řeči na text a převod textu na řeč se hostování koncových bodů pro vlastní modely účtuje za sekundu za model.
- Pro vlastní příkazy: fakturace se sleduje jako spotřeba služeb převodu řeči na text, převodu textu na řeč a Language Understanding. Vlastní příkazy nezavádějí nové měřiče fakturace.
- Za trénování modelů převodu řeči na text se neúčtují žádné poplatky. Jedinými náklady jsou hostování koncových bodů na model po nasazení a potom náklady na hodinu zvuku u vlastních převodů řeči na text.
-
Služba Speech umožňuje uživatelům přizpůsobit základní modely na základě vlastních akustických a jazykových dat a vytvářet tak modely řeči, které je možné použít v překladu řeči na text i překladu řeči.
-
Jazykový model je pravděpodobnostní rozdělení přes posloupnosti slov. Jazykový model pomáhá systému zvolit takovou posloupnost slov, která zní podobně, a to na základě pravděpodobnosti jednotlivých posloupností slov. Například posloupnosti „recognize speech“ a „wreck a nice beach“ znějí podobně, ale výskyt první z nich je mnohem pravděpodobnější, takže jí bude jazykovým modelem přiřazené vyšší ohodnocení. Pokud očekáváte, že hlasové dotazy na vaši aplikaci budou obsahovat určité slovníkové položky, jako jsou názvy produktů nebo žargon, který se v běžné řeči vyskytuje zřídka, je pravděpodobné, že úpravou jazykového modelu můžete výkon zlepšit. Pokud například vytváříte aplikaci umožňující hlasové dotazy na web MSDN, je pravděpodobné, že termíny jako „object-oriented“, „namespace“ nebo „dot net“ se budou vyskytovat častěji než v klasických hlasových aplikacích. Přizpůsobení jazykového modelu umožní systému se to naučit.
-
Akustický model je klasifikátor, který označuje krátké zvukové fragmenty jedním z několika fonémů, nebo zvukových jednotek, v každém jazyce. Tyto fonémy lze sestavit tak, aby tvořily slova. Například slovo „speech“ je tvořeno čtyřmi fonémy „s p iy ch“. Tyto klasifikace se provádějí řádově stokrát za sekundu. Přizpůsobení akustického modelu může systému umožnit naučit se lépe rozpoznávat řeč v atypických prostředích. Pokud máte například aplikaci, která je určená pracovníkům ve skladu nebo v továrně, přizpůsobený akustický model může přesněji rozpoznat řeč v přítomnosti dalších zvuků z tohoto prostředí.
-
Služba Speech nabízí širokou škálu hlasových písem pro převod textu na řeč (TTS), ale vlastní neurální hlas vám umožní vytvořit si vlastní hlas, který bude vyhovovat vašim potřebám a vaší značce. Další informace najdete na blogu.
-
Identifikace jazyka umožňuje identifikovat přechod v mluveném jazyce a odpovídajícím způsobem přepisovat řeč. To se dá použít ve scénářích, kdy není známý jazyk zvuku nebo když mluvící osoba nebo osoby můžou mluvit několika jazyky. Identifikace jednoho jazyka je k dispozici bez dalších poplatků. Průběžná identifikace jazyka je vylepšená doplňková funkce. Další informace získáte navštívením dokumentace
-
- Posouzení výslovnosti vyhodnocuje výslovnost a dává mluvčím zpětnou vazbu, pokud jde přesnost a plynulost mluveného projevu. Můžou ho studenti jazyků k procvičování, přičemž budou dostávat okamžitou zpětnou vazbu, takže můžou zlepšovat svou výslovnost, aby dokázali hovořit a prezentovat se sebejistotou. Další informace najdete v dokumentech.
- Platí se za něj jako za standardní Převod řeči na text, například:
Za vyhodnocení 8 sekund řeči se vám bude účtovat přibližně $-
Promluvte si s prodejním specialistou a nechte si ceny Azure vysvětlit podrobně. Seznamte se s principy cen pro cloudová řešení.
Získejte bezplatné cloudové služby a kredit $200, který vám umožní zkoumat Azure po dobu 30 dní.