Převod řeči na text

Rozhraní API pro převod řeči na text je součástí hlasových služeb Azure Cognitive Services.

Hlasové zadávání textu

Pomocí služby Převod řeči na text, která je součástí služby Speech, můžete rychle převádět zvuk z různých zdrojů na text. Modely si můžete přizpůsobit a odstranit tak bariéry při rozpoznávání řeči, jako jsou jedinečné slovníky, styly řeči nebo šum na pozadí. Nabídněte přístupnější zvuk tím, že pomůžete komukoli sledovat konverzace a zapojovat se do nich v reálném čase.

Převratné inovace

Využívejte výhody mimořádně přesného rozpoznávání řeči s využitím modelů hlubokých neurálních sítí.

Zapojení v reálném čase

Přepisujte zvuk na text v reálném čase, aby se mohli naplno zapojit všichni účastníci konverzace.

Přizpůsobené rozpoznávání řeči

Rozpoznávání řeči můžete přizpůsobit stylům řeči a terminologii specifické pro konkrétní oblasti.

Flexibilní nasazení

Převod řeči na text můžete provozovat kdekoli – v cloudu, v místním prostředí nebo v kontejnerech na hraničních zařízeních.

Využití převratné hlasového technologie

Enhance your apps with speech capabilities powered by decades of breakthrough research. Microsoft was the first to reach human parity on the Switchboard conversational speech recognition task, and continues to drive cutting-edge research in speech recognition.

Další informace o rozpoznávání řeči, které se vyrovná člověku

Pokud si chcete ukázku vyzkoušet s vlastním hlasem s použitím mikrofonu, použijte jiný prohlížeč s podporou WebRTC, jako je aktuální verze Microsoft Edge, Firefox nebo Chrome.

Chcete na tom stavět?

Optimalizace rozpoznávání řeči s využitím přizpůsobených modelů

Modely rozpoznávání řeči můžete přizpůsobit a odstranit tak obvyklé bariéry při rozpoznávání řeči. Jazykové modely můžete přizpůsobit stylům řeči uživatelů, přízvukům nebo jedinečným slovníkům zahrnujícím například názvy míst, produktů nebo výrazy specifické pro konkrétní odvětví. Zajistěte optimální rozpoznávání řeči s ohledem na výrazy specifické pro vaši organizaci díky automatickému generování vlastních modelů s využitím vašich dat v Office 365.

Začít používat službu Custom Speech

Ukázkové věty

Reference

Custom Speech

Chcete na tom stavět?

Získávání informací z konverzací

Přepisujte konverzace více uživatelů v reálném čase a umožněte tak účastníkům soustředit se na obsah diskuze. Identifikujte, kdo co a kdy řekl, a rychle přistupujte k dalším krokům. Optimalizujte prostředí pro zařízení s více mikrofony. Povolte analýzu textového přepisu a získejte ze svých konverzací další informace.

Další informace o funkci přepisu konverzace

Nasazení kdekoli, od cloudu až po hraniční zařízení

Převod řeči na text můžete s využitím kontejnerů spouštět v cloudu nebo místním prostředí pro scénáře, ve kterých je prvořadé zabezpečení dat a nízká latence.

Další informace o službě Speech v kontejnerech

Zabezpečení pro podniky

  • Microsoft investuje do výzkumu a vývoje v oblasti kybernetického zabezpečení více než 1 miliardu USD ročně.

  • Zaměstnáváme přes 3 500 odborníků na zabezpečení, kteří se plně věnují zabezpečení vašich dat a ochraně osobních údajů.

  • Azure má více certifikací dodržování předpisů než jakýkoli jiný poskytovatel cloudu. Podívejte se na kompletní seznam.

Výkon a možnosti kontroly a přizpůsobení, které potřebujete, s flexibilními cenami

Plaťte jenom za to, co opravdu využijete, bez počátečních nákladů. Za službu Převod řeči na text platíte průběžně podle počtu hodin přepsaného zvuku.

Zobrazit ceny služby Převod řeči na text

Začínáme se službou Převod řeči na text ve třech krocích

Zaregistrujte si bezplatný účet Azure a získejte okamžitý přístup a kredit 200 USD.
Přihlaste se k webu Azure Portal a přidejte službu Speech.
Zjistěte, jak vložit Převod řeči na text, s využitím kurzu a dokumentace.

Materiály ke službě Převod řeči na text pro vývojáře

Kurzy a dokumentace

Začněte se službou Převod řeči na text.

Kurzy

Absolvujte kurz Pluralsight, který vás provede používáním služby Převod řeči na text.

Případy použití

Seznamte se se scénáři pro službu Převod řeči na text, jako jsou přepisy konverzací a nahrávek z call centra.

Nejčastější dotazy ke službě Převod řeči na text

  • Úplný seznam jazyků podporovaných službou Převod řeči na text najdete v naší dokumentaci.
  • Sada SDK a rozhraní REST API služby Speech umožňují zachytávat zvuk z mikrofonu, číst ze streamu nebo přistupovat ke zvukovým souborům v úložišti. Sada SDK služby Speech podporuje rozpoznávání řeči u 16bitových zvukových souborů WAV nebo PCM s jedním kanálem a frekvencí 16 nebo 8 kHz. Podpora dalších zvukových formátů je k dispozici při použití koncového bodu rozhraní REST služby Převod řeči na text nebo služby dávkového přepisu.

Začínáme se službou Převod řeči na text