Ceny za Azure AI Speech

Jednotné hlasové služby pro převod řeči na text, textu na řeč a překlad řeči

Sjednocené hlasové služby poskytují širokou škálu možností rozpoznávání a generování řeči, včetně přepisu řeči, převodu textu na řeč a překladu řeči. Služba Speech poskytuje širokou škálu možností rozpoznávání a generování řeči, včetně přepisu řeči, převodu textu na řeč, překladu řeči a rozpoznávání mluvčího.

Projděte si cenové možnosti

Využijte filtry a přizpůsobte cenové možnosti vašim potřebám.

Ceny jsou pouze odhadované a nepředstavují skutečné cenové nabídky. Skutečné ceny se můžou lišit v závislosti na typu smlouvy uzavírané se společností Microsoft, datu nákupu a měnovém kurzu. Ceny se vypočítávají na základě amerických dolarů a převádí pomocí londýnských uzavíracích spotových kurzů z posledních dvou pracovních dnů předcházejících poslednímu pracovnímu dni předchozího měsíce. Pokud dva pracovní dny před koncem měsíce spadají na státní svátek na hlavních trzích, den nastavení sazby obvykle představuje den bezprostředně předcházející dvěma pracovním dnům. Tato sazba se vztahuje na všechny transakce během nadcházejícího měsíce. Přihlaste se do cenové kalkulačky Azure a prohlédněte si ceny na základě vašeho aktuálního programu nebo nabídky od společnosti Microsoft. Pokud chcete získat více informací o cenách nebo si vyžádat cenovou nabídku, kontaktujte obchodního specialistu Azure. Další informace najdete v častých otázkách týkající se cen Azure.

Oblast:

Měna:

Free (F0)

Informace o kvótách, limitech a pokynech, jak zvýšit počet souběžných požadavků, najdete v dokumentaci.

¹Nepoužité modely budou automaticky vyřazeny z provozu po 7 dnech.

²Rozpoznávání mluvčího je funkce s omezeným přístupem, která vyžaduje žádost o přístup.

³Hodiny bezplatného zvuku pro převod řeči na text se sdílí mezi standardem a vlastním. Batch se nepodporuje.
Kategorie	Funkce	Cena
Převod řeči na text (fakturace za sekundu)	Standard	5 hodin zvuku zdarma za měsíc³
	Vlastní	5 hodin zvuku zdarma za měsíc³ Hostování koncového bodu: 1 model zdarma za měsíc¹
	Vícekanálový zvuk k přepisu konverzace ^PREVIEW	5 hodin zvuku zdarma za měsíc
Převod textu na řeč (fakturace podle znaků)	Neurální	0.5 million znaků zdarma za měsíc
Překlad řeči (fakturace za sekundu)	Standard	5 hodin zvuku zdarma za měsíc
Rozpoznávání mluvčího (podle fakturace transakce)	Ověření mluvčího²	10,000 transakcí zdarma za měsíc
	Identifikace mluvčího²	10,000 transakcí zdarma za měsíc
	Úložiště hlasového profilu	10,000 transakcí zdarma za měsíc

Průběžné platby: Plaťte jen za to, co využijete.

Informace o kvótách, limitech a pokynech, jak zvýšit počet souběžných požadavků, najdete v dokumentaci.

Hodiny převodu řeči na text se měří jako hodiny zvuku odeslaného do služby, které se účtují po sekundách.

¹Pokud chcete využít tyto nové ceny dávkového přepisu, musíte použít verzi rozhraní Speech to Text REST API V3.2 nebo novější. Informace najdete tady: Speech to text REST API.

²To odpovídá cenám verze Public Preview.

³Tato cena zahrnuje 1 zvukový vstup a výstup, až 2 jazyky pro překlad textu pomocí standardního nebo vlastního převodu řeči na text a standardního překladu. V případě vlastního překladu nebo překladu do více než 3 jazyků najdete další informace na stránce s cenami za překlad textu pomocí Azure AI Překladače.

⁴Vybrané hlasy pro převod textu na řeč jsou k dispozici prostřednictvím dvou variant modelu: Neurální a Neurální HD. Další informace najdete tady.

⁵Custom Speech Training se používá při přizpůsobování jakéhokoli základního modelu vydaného 1. října 2023 nebo později.

⁶Osobní hlas je funkce omezeného přístupu omezená jenom na některé předem schválené případy použití a je potřeba požádat o přístup. Další informace o službě najdete v dokumentu.

⁷Rozpoznávání mluvčího je funkce s omezeným přístupem, která vyžaduje žádost o přístup.

⁸Převod textu na řeč: Využití syntézy řeči se účtuje podle znaků. Avatar je účtován za sekundu. Trénování a hostování modelů se účtují za sekundu.

⁹Pokud chcete používat rychlý přepis, musíte použít rozhraní Speech to text REST API 2024-05-15-preview nebo novější verzi. Informace najdete tady: Speech to text REST API.
Kategorie	Cena
Převod řeči na text (fakturace za sekundu)	Standard	Přepis v reálném čase: $- za hodinu Rychlý přepis: $- za hodinu⁹ Dávkový přepis: $- za hodinu¹
	Vlastní	Přepis v reálném čase: $- za hodinu Dávkový přepis: $- za hodinu¹ Hostování koncového bodu: $- za model a hodinu Trénování služby Custom Speech⁵: $- za výpočetní hodinu
	Vylepšené doplňkové funkce: Průběžná identifikace jazyka Diarizace Posouzení výslovnosti (prozódie, gramatika, slovní zásoba, téma)	V reálném čase: $- za hodinu na funkci Dávka (průběžná identifikace jazyka, diarizace): Zahrnuto v: Standard/Vlastní (bez příplatku)
	Vícekanálový zvuk k přepisu konverzace ^PREVIEW	$- za hodinu²
Překlad řeči (fakturace za sekundu)	Překlad řeči v reálném čase	$- za hodinu zvuku³
Překlad řeči (fakturace za sekundu)	Překlad videa^Preview	Dávka: $- na minutu výstupu videa Úpravy obsahu: $- na minutu výstupu videa Osobní hlas: $- na minutu výstupu videa
Převod textu na řeč⁸	Standardní hlas	Neurální (v reálném čase a dávkové použití): $- za 1 milion znaků Neurální HD (v reálném čase a dávkové použití)⁴: $- za 1 milion znaků
	Custom Voice	Profesionální hlas: Syntéza (v reálném čase a dávkové použití): $- na 1 milion znaků Trénování hlasového modelu: $- za výpočetní hodinu, až $- za natrénování Hostování koncového bodu: $- za model a hodinu
	Custom Voice	Osobní hlas⁶: Syntéza (v reálném čase a dávkové použití): $- na 1 milion znaků Vytváření hlasu: zdarma Úložiště hlasových profilů: $- za 1 000 hlasových profilů za měsíc
	Vylepšené doplňkové funkce: avatar	Standard: Interaktivní avatar (v reálném čase): $- za minutu Video avatara (dávkové použití): $- za minutu
	Vylepšené doplňkové funkce: avatar	Vlastní: Trénování modelu avatara: $- za výpočetní hodinu Interaktivní avatar (v reálném čase): $- za minutu Video avatara (dávkové použití): $- za minutu Hostování koncového bodu: $- za model za hodinu
Rozpoznávání mluvčího (podle fakturace transakce)	Ověření mluvčího⁷	$- za 1,000 transakcí
	Identifikace mluvčího⁷	$- za 1,000 transakcí
	Úložiště hlasového profilu	$- za 1,000 hlasových profilů (10,000 hlasových profilů zdarma za měsíc)

Vrstvy závazku – Azure – Standard

Kategorie	Funkce	Cena (za měsíc)	Nadlimitní využití
Převod řeči na text	Standard	$- za 2,000 hod	$- za hodinu
		$- za 10,000 hod	$- za hodinu
		$- za 50,000 hod	$- za hodinu
	Vlastní	$- za 2,000 hod	$- za hodinu
		$- za 10,000 hod	$- za hodinu
		$- za 50,000 hod	$- za hodinu
	Vylepšené doplňkové funkce:² Průběžná identifikace jazyka Diarizace Posouzení výslovnosti (prozódie, gramatika, slovní zásoba, téma)	$- za 2,000 hod	$- za hodinu
		$- za 10,000 hod	$- za hodinu
		$- za 50,000 hod	$- za hodinu
Převod textu na řeč	Neurální¹	$- za 80 mil. znaků	$- na 1 mil. znaků
		$- za 400 mil. znaků	$- na 1 mil. znaků
		$- za 2,000 mil. znaků	$- na 1 mil. znaků

¹Zahrnuje syntézu v reálném čase i dávkovou syntézu s předem vytvořenými neurálními hlasy, které nevyužívají HD ani AOAI. Nezahrnuje hlasy HD, hlasy AOAI, vlastní neurální hlas ani osobní hlas.

²Funkce převodu řeči na text pouze v reálném čase, průběžné identifikace jazyka a doplňkové funkce diarizace jsou součástí dávkového převodu řeči na text.

Vrstvy závazku – připojený kontejner

Kategorie	Funkce	Cena (za měsíc)	Nadlimitní využití
Převod řeči na text²	Standard	$- za 2,000 hod	$- za hodinu
		$- za 10,000 hod	$- za hodinu
		$- za 50,000 hod	$- za hodinu
	Vlastní	$- za 2,000 hod	$- za hodinu
		$- za 10,000 hod	$- za hodinu
		$- za 50,000 hod	$- za hodinu
	Vylepšené doplňkové funkce:² Identifikace jazyka Diarizace	$- za 2,000 hod	$- za hodinu
		$- za 10,000 hod	$- za hodinu
		$- za 50,000 hod	$- za hodinu
Převod textu na řeč	Neurální¹	$- za 80 mil. znaků	$- na 1 mil. znaků
		$- za 400 mil. znaků	$- na 1 mil. znaků
		$- za 2,000 mil. znaků	$- na 1 mil. znaků

¹Zahrnuje syntézu v reálném čase s předem vytvořenými neurálními hlasy, které nevyužívají HD ani AOAI. Nezahrnuje hlasy HD, hlasy AOAI ani vlastní hlasy (profesionální ani osobní). Nezahrnuje dávkovou syntézu.

²Ceny se vztahují na případy použití v reálném čase a na případy dávkového použití. Pro kontejnery nejsou k dispozici žádné samostatné ceny za dávku.

Informace o úrovních závazku najdete v dokumentaci.

Vrstvy závazku – odpojený kontejner

Zaregistrujte se a získejte přístup ke službám Speech v odpojených kontejnerech nebo si přečtěte další informace.

Kategorie	Funkce	Cena (za rok)	Maximální využití (za rok)	Předpokládané využití (za měsíc)
Převod řeči na text²	Standard	$- $- Zaregistrovat se a získat přístup Další informace	120 000 hodin 600 000 hodin	10 000 hodin 50 000 hodin
	Vlastní	$- $- Zaregistrovat se a získat přístup Další informace	120 000 hodin 600 000 hodin	10 000 hodin 50 000 hodin
	Vylepšené doplňkové funkce: Identifikace jazyka Diarizace	$- $-	120 000 hodin 600 000 hodin	10 000 hodin 50 000 hodin
Převod textu na řeč	Neurální¹	$- $- Zaregistrovat se a získat přístup Další informace	4,8 mld. znaků 24 mld. znaků	400 mil. znaků 2 000 mil. znaků

¹Zahrnuje syntézu v reálném čase s předem vytvořenými neurálními hlasy, které nevyužívají HD ani AOAI. Nezahrnuje hlasy HD, hlasy AOAI ani vlastní hlasy (profesionální ani osobní). Nezahrnuje dávkovou syntézu.

²Ceny se vztahují na případy použití v reálném čase a na případy dávkového použití. Pro kontejnery nejsou k dispozici žádné samostatné ceny za dávku.

Tyto funkce jsou zastaralé a dostupné jenom pro stávající zákazníky. Projděte si podrobnosti a zjistěte, jak migrovat na nové funkce..

Instance	Kategorie	Funkce	Cena
Zdarma - Web/kontejner 1 souběžný požadavek	Převod textu na řeč	Standard	5 million znaků zdarma za měsíc
Zdarma - Web/kontejner 1 souběžný požadavek	Převod textu na řeč	Vlastní	5 million znaků zdarma za měsíc Hostování koncového bodu: 1 model zdarma za měsíc
Standard – web/kontejner 100 souběžných požadavků pro základní model 20 souběžných požadavků pro vlastní model	Převod textu na řeč	Standard	$- za 1 milion znaků
	Převod textu na řeč	Vlastní	$- za 1 milion znaků Hostování koncového bodu: $- za model a hodinu

Možnosti nákupu a ceny služeb Azure

Spojte se s námi přímo

Projděte si ceny Azure. Projděte si ceny cloudového řešení, seznamte se s optimalizací nákladů a vyžádejte si vlastní návrh.

Spojte se s prodejním specialistou

Podívejte se na možnosti nákupu

Služby Azure můžete nakoupit prostřednictvím webu Azure, zástupce Microsoftu nebo partnera Azure.

Projít možnosti

Další prostředky

Nejčastější dotazy

Nejčastější dotazy týkající se cen Azure

- V případě převodu řeči na text a překlad řeči se využití účtuje po sekundách.
- Převod textu na řeč: využití se účtuje po znacích. Zkontrolujte definici znaku vpoznámce k ceně.
- Pro vlastní hostování neurálního hlasu: využití se účtuje za koncový bod a sekundu. Podívejte se na podrobnosti v poznámce k cenám.
- Pro úložiště osobního hlasového profilu: využití se účtuje za hlasový profil a den. Podívejte se na podrobnosti v poznámce k cenám.
- U avatara převodu textu na řeč se využití účtuje po sekundách.
- Pro převod řeči na text a textu na řeč (včetně avatara) se hostování koncových bodů pro vlastní modely účtuje za sekundu a model.
Služba Speech umožňuje uživatelům přizpůsobit základní modely na základě vlastních akustických a jazykových dat a vytvářet tak modely řeči, které je možné použít v překladu řeči na text i překladu řeči.
Jazykový model je pravděpodobnostní rozdělení přes posloupnosti slov. Jazykový model pomáhá systému zvolit takovou posloupnost slov, která zní podobně, a to na základě pravděpodobnosti jednotlivých posloupností slov. Například posloupnosti „recognize speech“ a „wreck a nice beach“ znějí podobně, ale výskyt první z nich je mnohem pravděpodobnější, takže jí bude jazykovým modelem přiřazené vyšší ohodnocení. Pokud očekáváte, že hlasové dotazy na vaši aplikaci budou obsahovat určité slovníkové položky, jako jsou názvy produktů nebo žargon, který se v běžné řeči vyskytuje zřídka, je pravděpodobné, že úpravou jazykového modelu můžete výkon zlepšit. Pokud například vytváříte aplikaci umožňující hlasové dotazy na web MSDN, je pravděpodobné, že termíny jako „object-oriented“, „namespace“ nebo „dot net“ se budou vyskytovat častěji než v klasických hlasových aplikacích. Přizpůsobení jazykového modelu umožní systému se to naučit.
Akustický model je klasifikátor, který označuje krátké zvukové fragmenty jedním z několika fonémů, nebo zvukových jednotek, v každém jazyce. Tyto fonémy lze sestavit tak, aby tvořily slova. Například slovo „speech“ je tvořeno čtyřmi fonémy „s p iy ch“. Tyto klasifikace se provádějí řádově stokrát za sekundu. Přizpůsobení akustického modelu může systému umožnit naučit se lépe rozpoznávat řeč v atypických prostředích. Pokud máte například aplikaci, která je určená pracovníkům ve skladu nebo v továrně, přizpůsobený akustický model může přesněji rozpoznat řeč v přítomnosti dalších zvuků z tohoto prostředí.
Služba Speech nabízí širokou škálu hlasových písem pro převod textu na řeč (TTS), ale vlastní neurální hlas vám umožní vytvořit si vlastní hlas, který bude vyhovovat vašim potřebám a vaší značce. Další informace najdete na blogu.
Identifikace jazyka umožňuje identifikovat přechod v mluveném jazyce a odpovídajícím způsobem přepisovat řeč. To se dá použít ve scénářích, kdy není známý jazyk zvuku nebo když mluvící osoba nebo osoby můžou mluvit několika jazyky. Identifikace jednoho jazyka je k dispozici bez dalších poplatků. Průběžná identifikace jazyka je vylepšená doplňková funkce. Další informace získáte navštívením dokumentace
- Posouzení výslovnosti vyhodnocuje výslovnost a dává mluvčím zpětnou vazbu, pokud jde přesnost a plynulost mluveného projevu. Můžou ho studenti jazyků k procvičování, přičemž budou dostávat okamžitou zpětnou vazbu, takže můžou zlepšovat svou výslovnost, aby dokázali hovořit a prezentovat se sebejistotou. Další informace najdete v dokumentech.
- Platí se za něj jako za standardní Převod řeči na text, například:
  Za vyhodnocení 8 sekund řeči se vám bude účtovat přibližně $-

Promluvte si s prodejním specialistou a nechte si ceny Azure vysvětlit podrobně. Seznamte se s principy cen pro cloudová řešení.

Požádat o cenovou nabídku

Získejte bezplatné cloudové služby a kredit $200, který vám umožní zkoumat Azure po dobu 30 dní.

Vyzkoušet Azure zdarma