Převod řeči na text

Funkce služby Speech, která přesně převede mluvený zvuk na text

Jednání na základě mluveného slova

Quickly and accurately transcribe audio to text in more than 85 languages and variants. Customize models to enhance accuracy for domain-specific terminology. Get more value from spoken audio by enabling search or analytics on transcribed text or facilitating action—all in your preferred programming language.

Vysoce kvalitní přepis

Špičkové rozpoznávání řeči vám umožní získat přesné přepisy.

Přizpůsobitelné modely

Můžete přidat konkrétní slova do základního slovníku, nebo sestavit vlastní modely.

Flexibilní nasazení

Službu Převod řeči na text můžete provozovat kdekoli – v cloudu nebo v kontejnerech na hraničních zařízeních.

Připraveno pro produkční prostředí

Získejte přístup ke stejné robustní technologii, která stojí za rozpoznáváním řeči v produktech Microsoftu.

Vyzkoušejte si převod řeči na text s touto ukázkovou aplikací, vytvořenou s použitím sady JavaScript SDK.

Pokud si chcete ukázku vyzkoušet s vlastním hlasem s použitím mikrofonu, použijte jiný prohlížeč s podporou WebRTC, jako je aktuální verze Microsoft Edge, Firefox nebo Chrome.

Vaše hlasová data se neuloží.

Přesný přepis řeči z různých zdrojů

Na text můžete převádět zvuk z nejrůznějších zdrojů, včetně mikrofonů, zvukových souborů a úložiště objektů blob. Vytvořením deníku můžete určit, který mluvčí co kdy řekl. Automatické formátování a interpunkce umožňuje získat čitelné přepisy.

Přizpůsobení modelů řeči vašim potřebám

Přizpůsobte si modely řeči tak, aby rozuměly terminologii specifické pro konkrétní organizaci a odvětví. Překonejte bariéry při rozpoznávání řeči, jako jsou hluk na pozadí, přízvuky nebo jedinečný slovník. Modely můžete přizpůsobit nahráním zvukových dat a přepisů. Optimalizujte přesnost rozpoznávání řeči s ohledem na vaši organizaci díky automatickému generování vlastních modelů s využitím dat Office 365.

Nasazení kdekoli, od cloudu až po hraniční zařízení

Run Speech to Text wherever your data resides. Build speech applications that are optimized for both robust cloud capabilities and edge locality using containers and language detection (preview). Speech containers support both standard and custom speech.

Dokonalá ochrana osobních údajů a zabezpečení

  • Služba Speech, která je součástí služby Azure Cognitive Services, je certifikována organizacemi SOC, FedRAMP, PCI DSS, HIPAA, HITECH a ISO.
  • Vaše data zůstávají ve vašem držení. Váš zvukový vstup a data přepisu se během zpracování zvuku neprotokolují.
  • Svá vlastní řečová data a modely můžete kdykoli zobrazit a odstranit. Vaše data jsou v úložišti zašifrována.
  • Služba Speech využívá infrastrukturu Azure a nabízí zabezpečení, dostupnost, dodržování předpisů a možnosti správy na podnikové úrovni.

Flexibilní ceny vám poskytují výkon a kontrolu, které potřebujete

Plaťte jenom za to, co opravdu využijete, bez počátečních nákladů. Za službu Převod řeči na text platíte průběžně podle počtu hodin přepsaného zvuku.

Dokumentace a zdroje informací

Začínáme

Přečtěte si naši dokumentaci

Absolvujte kurz Microsoft Learn

Prozkoumejte ukázky kódu

Prohlédněte si ukázkový kód

Prohlédněte si materiály k přizpůsobení

Přizpůsobte své hlasové řešení nástrojem Speech Studio. Nevyžaduje se žádný kód.

Vývoj pomocí rozhraní Převod řeči na text

KPMG zjednodušuje přepis volání

KPMG využívá Převod řeči na text k přepisu a katalogizaci tisíců hodin volání a snižuje tak pro své klienty náklady na dodržování předpisů až o 80 procent.

KPMG

Motorola pomáhá složkám záchranného systému získat přístup k důležitým datům pomocí hlasu

Motorola Solutions pomáhá policistům a dalším složkám záchranného systému rychleji získat přístup k důležitým informacím pomocí virtuálního asistenta s podporou hlasových služeb.

Motorola Solutions

Universal Electronics nabízí inteligentní domácí prostředí s podporou hlasu

Universal Electronics pomáhá značkovým firmám poskytovat funkce pro hlasovou navigaci a ovládání, které fungují v domácích zařízeních každodenního života, a nabízí tak skutečně unikátní zákaznické prostředí.

Universal Electronics

Hochtief dokumentuje konstrukční vady pomocí hlasových služeb

Hochtief pomáhá projektovým manažerům identifikovat a dokumentovat konstrukční vady na staveništích pomocí virtuálního pomocníka s podporou hlasových služeb.

Cheetah Mobile

NTT DATA urychlují rozhodování pomocí přehledů ze schůzí

NTT DATA poskytuje přehledy z hlasových dat pomocí přepisů schůzí v reálném čase. Pomocí služby Custom Speech můžou přizpůsobit modely rozpoznávání řeči, aby rozuměli termínům pro konkrétní organizaci.

NTTDATA

Insight nabízí bankovní prostředí založené na konverzaci

Insight Enterprises pomáhá bankám přinést digitální rychlost a pohodlí na jejich pobočky pomocí bankovního řešení, které používá konverzační služby založené na umělé inteligenci. Převod řeči na text převede to, co řekne zákazník, na data, která se dají zpracovávat a analyzovat, aby zákazníci mohli dostat včasné a relevantní odpovědi.

Insight Enterprise, Inc.

Začínáme se službou Speech