Převod řeči na text

Funkce služby Speech, která přesně převede mluvený zvuk na text

Jednání na základě mluveného slova

Zvuk můžete na text rychle a přesně přepisovat ve více než 85 jazycích a variantách. Přizpůsobením modelů zvýšíte přesnost terminologie v konkrétním oboru. Povolením prohledávání či analýzy přepsaného textu nebo podporou akcí získáte ze záznamu řeči větší hodnotu – to vše ve vámi preferovaném programovacím jazyce.

Vysoce kvalitní přepis

Špičkové rozpoznávání řeči vám umožní získat přesné přepisy.

Přizpůsobitelné modely

Můžete přidat konkrétní slova do základního slovníku, nebo sestavit vlastní modely.

Flexibilní nasazení

Službu Převod řeči na text můžete provozovat kdekoli – v cloudu nebo v kontejnerech na hraničních zařízeních.

Připraveno pro produkční prostředí

Získejte přístup ke stejné robustní technologii, která stojí za rozpoznáváním řeči v produktech Microsoftu.

Vyzkoušejte si převod řeči na text s touto ukázkovou aplikací vytvořenou s použitím sady JavaScript SDK.

Pokud si chcete ukázku vyzkoušet s vlastním hlasem s použitím mikrofonu, použijte jiný prohlížeč s podporou WebRTC, jako je aktuální verze Microsoft Edge, Firefox nebo Chrome.

Vaše hlasová data se neuloží.

Přesný přepis řeči z různých zdrojů

Na text můžete převádět zvuk z nejrůznějších zdrojů, včetně mikrofonů, zvukových souborů a úložiště objektů blob. Vytvořením deníku můžete určit, který mluvčí co kdy řekl. Automatické formátování a interpunkce umožňuje získat čitelné přepisy.

Přizpůsobení modelů řeči vašim potřebám

Přizpůsobte si modely řeči tak, aby rozuměly terminologii specifické pro konkrétní organizaci a odvětví. Překonejte bariéry při rozpoznávání řeči, jako jsou hluk na pozadí, přízvuky nebo jedinečný slovník. Modely můžete přizpůsobit nahráním zvukových dat a přepisů. Optimalizujte přesnost rozpoznávání řeči s ohledem na vaši organizaci díky automatickému generování vlastních modelů s využitím dat Office 365.

Nasazení kdekoli, od cloudu až po hraniční zařízení

Službu Převod řeči na text můžete provozovat bez ohledu na to, kde jsou uložená vaše data. Vytvářejte hlasové aplikace optimalizované jak pro cloudové funkce, tak pro umístění v hraničních zařízeních s využitím kontejnerů a detekce jazyka (Preview). Kontejnery služby Speech podporují standardní i vlastní hlasy.

Dokonalá ochrana osobních údajů a zabezpečení

  • Služba Speech, která je součástí služby Azure Cognitive Services, je certifikována organizacemi SOC, FedRAMP, PCI DSS, HIPAA, HITECH a ISO.
  • Vaše data zůstávají ve vašem držení. Váš zvukový vstup a data přepisu se během zpracování zvuku neprotokolují.
  • Svá vlastní řečová data a modely můžete kdykoli zobrazit a odstranit. Vaše data jsou v úložišti zašifrována.
  • Služba Speech využívá infrastrukturu Azure a nabízí zabezpečení, dostupnost, dodržování předpisů a možnosti správy na podnikové úrovni.

Flexibilní ceny vám poskytují výkon a kontrolu, které potřebujete

Plaťte jenom za to, co opravdu využijete, bez počátečních nákladů. Za službu Převod řeči na text platíte průběžně podle počtu hodin přepsaného zvuku.

Dokumentace a zdroje informací

Začínáme

Přečtěte si naši dokumentaci

Absolvujte kurz Microsoft Learn

Prozkoumejte ukázky kódu

Prohlédněte si ukázkový kód

Prohlédněte si materiály k přizpůsobení

Přizpůsobte své hlasové řešení nástrojem Speech Studio. Nevyžaduje se žádný kód.

Vývoj pomocí rozhraní Převod řeči na text

KPMG zjednodušuje přepis volání

KPMG využívá Převod řeči na text k přepisu a katalogizaci tisíců hodin volání a snižuje tak pro své klienty náklady na dodržování předpisů až o 80 procent.

KPMG

Motorola pomáhá složkám záchranného systému získat přístup k důležitým datům pomocí hlasu

Motorola Solutions pomáhá policistům a dalším složkám záchranného systému rychleji získat přístup k důležitým informacím pomocí virtuálního asistenta s podporou hlasových služeb.

Motorola Solutions

Universal Electronics nabízí inteligentní domácí prostředí s podporou hlasu

Universal Electronics pomáhá značkovým firmám poskytovat funkce pro hlasovou navigaci a ovládání, které fungují v domácích zařízeních každodenního života, a nabízí tak skutečně unikátní zákaznické prostředí.

Universal Electronics

Hochtief dokumentuje konstrukční vady pomocí hlasových služeb

Hochtief pomáhá projektovým manažerům identifikovat a dokumentovat konstrukční vady na staveništích pomocí virtuálního pomocníka s podporou hlasových služeb.

Cheetah Mobile

NTT DATA urychlují rozhodování pomocí přehledů ze schůzí

NTT DATA poskytuje přehledy z hlasových dat pomocí přepisů schůzí v reálném čase. Pomocí služby Custom Speech můžou přizpůsobit modely rozpoznávání řeči, aby rozuměli termínům pro konkrétní organizaci.

NTTDATA

Insight nabízí bankovní prostředí založené na konverzaci

Insight Enterprises pomáhá bankám přinést digitální rychlost a pohodlí na jejich pobočky pomocí bankovního řešení, které používá konverzační služby založené na umělé inteligenci. Převod řeči na text převede to, co řekne zákazník, na data, která se dají zpracovávat a analyzovat, aby zákazníci mohli dostat včasné a relevantní odpovědi.

Insight Enterprise, Inc.

Začínáme se službou Speech