Ceny služeb Cognitive Services – Custom Speech Service PREVIEW

Využití inteligentních rozhraní API k povolení možností pro zpracování řeči, jazyka, vidění a znalostí

Custom Speech Service umožňuje vytvářet vlastní modely pro rozpoznávání řeči a nasazovat je na koncový bod pro převod řeči na text, který je upraven pro vaši aplikaci. Pomocí služby Custom Speech Service můžete upravit jazykový model modulu pro rozpoznávání řeči, takže se naučí slovník vaší aplikace a styl mluvy uživatelů. Můžete také upravit akustický model modulu pro rozpoznávání řeči, aby lépe vyhovoval očekávanému prostředí a uživatelům aplikace.

Adaptace modelů je zdarma.

Podrobnosti o cenách

Nasazení vlastního modelu 0–1 – Free
1+ – $-/model/měsíc
Přizpůsobení modelu Free
Testy přesnosti 0–2 hodin – Free
2+ – $-/hodina
Škálování na více systémů $-/jednotka/den, přičemž každá jednotka umožňuje odeslat pět souběžných požadavků
Bez trasování $-/model/měsíc
Ceny za požadavky 0–2 hodin – Free
2+ – $-/hodina

Podpora a SLA

  • Bezplatná podpora k fakturaci a správě předplatného
  • Potřebujete technickou podporu ke službám ve verzi Preview? Navštivte naše fóra.
  • U služeb Cognitive Services spuštěných na úrovni Standard garantujeme minimální dostupnost 99,9 %. Pro úroveň Free neposkytujeme žádnou smlouvu SLA. Přečtěte si smlouvu SLA
  • V období Preview neposkytujeme smlouvu SLA. Další informace

Nejčastější dotazy

Custom Speech Service

  • Úroveň 1 může zpracovat až čtyři úryvky zvuku (tj. čtyři přepisy) najednou a přitom stále reagovat v reálném čase. Pokud uživatel odešle víc než čtyři souběžné úryvky zvuku, každý další úryvek se odmítne a pošle zpátky s chybovým kódem, který indikuje příliš mnoho souběžných rozpoznávání. Obdobně to platí pro úroveň 2, kde jde zpracovat až 12 souběžných přepisů. Úroveň Free poskytuje jeden souběžný přepis. Předpokládá se, že zvuk se odesílá v reálném čase. Pokud se zvuk odešle rychleji, z hlediska souběžnosti se bude požadavek stále považovat ze probíhající, dokud trvání zvuku neskončí (i když výsledek rozpoznání může být vrácen dříve).

    Poznámka: Pokud potřebujete vyšší úroveň souběžnosti, obraťte se prosím na nás.

  • Jazykový model je pravděpodobnostní rozdělení přes posloupnosti slov. Jazykový model pomáhá systému zvolit takovou posloupnost slov, která zní podobně, a to na základě pravděpodobnosti jednotlivých posloupností slov. Například posloupnosti „recognize speech“ a „wreck a nice beach“ znějí podobně, ale výskyt první z nich je mnohem pravděpodobnější, takže jí bude jazykovým modelem přiřazené vyšší ohodnocení. Pokud očekáváte, že hlasové dotazy na vaši aplikaci budou obsahovat určité slovníkové položky, jako jsou názvy produktů nebo žargon, který se v běžné řeči vyskytuje zřídka, je pravděpodobné, že úpravou jazykového modelu můžete výkon zlepšit. Pokud například vytváříte aplikaci umožňující hlasové dotazy na web MSDN, je pravděpodobné, že termíny jako „object-oriented“, „namespace“ nebo „dot net“ se budou vyskytovat častěji než v klasických hlasových aplikacích. Přizpůsobení jazykového modelu umožní systému se to naučit.

  • Akustický model je klasifikátor, který označuje krátké zvukové fragmenty jedním z několika fonémů, nebo zvukových jednotek, v každém jazyce. Tyto fonémy lze sestavit tak, aby tvořily slova. Například slovo „speech“ je tvořeno čtyřmi fonémy „s p iy ch“. Tyto klasifikace se provádějí řádově stokrát za sekundu. Přizpůsobení akustického modelu může systému umožnit naučit se lépe rozpoznávat řeč v atypických prostředích. Pokud máte například aplikaci, která je určená pracovníkům ve skladu nebo v továrně, přizpůsobený akustický model může přesněji rozpoznat řeč v přítomnosti dalších zvuků z tohoto prostředí.

  • Rozpoznání krátkých frází podporuje promluvy dlouhé do 15 sekund. Při použití s knihovnou řečového klienta obdrží klient po odeslání dat na server několik částečných výsledků a jeden konečný výsledek s několika volbami N-best.

  • Rozpoznávání dlouhých diktátů podporuje promluvy dlouhé až dvě minuty. Při použití s knihovnou řečového klienta obdrží klient po odeslání dat na server několik částečných výsledků a několik konečných výsledků, a to podle toho, kde server označí pomlky mezi větami.

  • Pokud například zákazník používá úroveň S1 pro zpracování jednoho milionu přepisů, bude mu účtována cena za úroveň ($-), prvních 100,000 přepisů bude za cenu $- za 1,000 přepisů a zbývajících 900,000 přepisů bude za cenu $- za 1,000 přepisů. Výsledná účtovaná částka zákazníka je $- + 100,000 * ($- / 1,000) + 900,000 * ($- / 1,000) = $4500.

  • Prohlédněte si informace o službě Custom Speech Service na webové stránce Microsoft Cognitive Services a na webu Custom Speech Service www.cris.ai.

  • Nasazení vlastního modelu je proces zabalení a následného zveřejnění vlastního modelu jako služby. Výsledný nasazený vlastní model vystavuje koncový bod, přes který se k němu dá přistupovat. Uživatelé se můžou rozhodnout nasadit tolik modelů, kolik potřebují.

  • Custom Speech Service uživatelům umožňuje upravit základní modely na základě vlastních akustických a jazykových dat. Tomuto procesu říkáme přizpůsobení modelu.

  • Po vytvoření vlastního modelu mají uživatelé možnost nahrát testovací data pro vyhodnocení nově vytvořeného modelu. Uživatelé můžou k testování vlastních modelů použít tolik dat, kolik potřebují, tj. můžou spouštět neomezený počet testů přesnosti.

  • Po nasazení vlastního modelu může jeho identifikátor URI najednou zpracovávat pouze jeden požadavek na zpracování zvuku. U scénářů, ve kterých se na daný identifikátor URI odesílá víc než jeden požadavek na zpracování zvuku najednou, se uživatelé můžou rozhodnout horizontálně navýšit kapacitu, a to postupně po pěti souběžných požadavcích. To se provádí zakoupením jednotek škálování. Každá jednotka škálování garantuje až pět souběžných požadavků na zpracování zvuku a účtuje se cenou $200 za škálovací jednotku. Pokud například uživatel počítá s tím, že na koncový bod bude odesílat 23 požadavků na zpracování zvuku současně, bude muset zakoupit pět škálovacích jednotek, které garantují až 25 souběžných požadavků.

  • Správa protokolů uživatelům umožňuje vypnutí protokolování nasazených modelů. Uživatelé s obavami o ochranu osobních údajů můžou protokolování nasazeného modelu vypnout, za což se jim bude účtovat $20 za měsíc.

  • Ceny za požadavky se týkají nákladů na požadavky na zpracování zvuku koncovým bodem nasazeného vlastního modelu.

Obecné

  • Rozhraní API pro rozpoznávání emocí, rozhraní Face API, rozhraní LUIS (Language Understanding Intelligent Service) API, rozhraní Bing Speech to Text API a rozhraní API pro převod textu na řeč služby Bing se účtují po 1000 transakcích API, když se aktivně zpracovává volání API produkčního prostředí. Počty volání API produkčního prostředí se účtují poměrně.

    Služba rozhraní API pro rozpoznávání dlouhých úseků řeči služby Bing se účtuje po hodinách analyzované řeči. Fakturuje se poměrnou částí po minutách.

    Rozhraní Recommendations API a Text Analytics API se dají koupit po jednotkách úrovně Standard za pevnou cenu. Každá jednotka konkrétní úrovně zahrnuje určitý počet transakcí API. Pokud uživatel překročí zahrnutý počet transakcí, překročení limitu se účtuje sazbou uvedenou v tabulce cen výš. Překročení limitu se účtují poměrně a služba se fakturuje měsíčně. Počty transakcí zahrnuté v jednotlivých úrovních se každý měsíc resetují.

  • Když se u úrovně Free dosáhne limitu transakcí, použití se omezí. U úrovně Free zákazníci nemůžou kumulovat překročení limitu.

  • Pokud se přesáhne využití u úrovně Standard, účet začne kumulovat překročení limitu. Tato překročení limitu se účtují po měsících a používají se přitom sazby stanovené pro jednotlivé úrovně.

  • Jakékoli volání rozhraní API (s výjimkou volání dávkového vyhodnocování) se počítá jako jedna transakce. Volání dávkového vyhodnocování se započítávají podle počtu položek, které je třeba v transakci zohlednit.

  • Když se u úrovně Free dosáhne limitu transakcí, použití se omezí. U úrovně Free zákazníci nemůžou kumulovat překročení limitu. Dávkové vyhodnocování není na úrovni Free podporované.

  • Rozhraní Recommendations API a je možné nakupovat po jednotkách úrovně Standard za pevnou cenu. Každá jednotka konkrétní úrovně zahrnuje určitý počet transakcí API. Pokud uživatel překročí zahrnutý počet transakcí, překročení limitu se účtuje sazbou uvedenou v tabulce cen výš. Překročení limitu se účtují poměrně a služba se fakturuje měsíčně. Počty transakcí zahrnuté v jednotlivých úrovních se každý měsíc resetují.

  • Rozhraní API pro hledání, automatické návrhy a kontrolu pravopisu služby Bing se účtují po měsících. V závislosti na zakoupené úrovni jsou zahrnuté konkrétní počty transakcí definovaných jako volání API. Zahrnuté počty jsou vždy vázány ke kalendářnímu měsíci, bez ohledu na začátek využití. Pokud uživatel překročí zahrnutý počet transakcí, překročení limitu se účtuje sazbou uvedenou v tabulce cen. Tato překročení limitu se neúčtují poměrně a služba se fakturuje měsíčně. Počty transakcí zahrnuté v jednotlivých úrovních se každý měsíc resetují.

  • Pokud si chcete vyžádat bezplatné zkušební verze, navštivte web https://www.microsoft.com/cognitive-services/en-US/subscriptions.

  • Na vyšší úroveň můžete upgradovat kdykoli. Fakturační sazby a počty transakcí zahrnuté ve vyšší úrovni se začnou uplatňovat okamžitě.

Materiály

Kalkulačka

Odhad měsíčních nákladů na služby Azure

Nejčastější dotazy k nákupu

Přečtěte si nejčastější dotazy k cenám Azure

Podrobnosti o produktu

Další informace o službě Cognitive Services

Dokumentace

Technické výukové programy, videa a další materiály

Zaregistrujte se a získejte $200 v kreditech Azure.

Začněte ještě dnes