Převod řeči na text

Rychle převádějte zvuk na text a dosáhněte přirozené reakční doby.

Převod řeči na text ve službách Cognitive Services nabízí celou řadu funkcí, které můžete vložit do své aplikace a zajistit tak podporu různých scénářů přepisu, včetně přepisu konverzace, přepisu řeči a vlastního přepisu řeči.

Přepis konverzace

Umožněte přepis osobních setkání. Přepis konverzace zachycuje řeč v reálném čase, takže se do diskuze můžou naplno zapojit všichni účastníci setkání, kteří můžou identifikovat, kdo co a kdy řekl, a rychle přistupovat k dalším krokům.

Přepis konverzace:

  • Umožňuje zachytávat řeč z celé zasedací místnosti.
  • Pomáhá chránit data díky špičkovým certifikátům zabezpečení a dodržování předpisů.
  • Prostřednictvím spárování se sadou SDK služby Speech podporuje pořádání setkání a konferencí s využitím mikrofonů a videokamer.

Prohlédnout v akci

Při načítání této ukázky došlo k chybě, počkejte a zkuste to znovu

Přednášející Přepis

Tato ukázka je nekompatibilní s vaším prohlížečem. Pro zajištění nejlepších výsledků použijte jiný prohlížeč.

Chcete na tom stavět?

Přepis řeči

Mluvené slovo můžete převést na text. Rozhraní API umožňuje rozpoznat zvuk z mikrofonu, jiných zdrojů streamování zvuku v reálném čase nebo z nahraného zvukového souboru. Po odeslání zvuku na server se na vyžádání vrátí částečné výsledky rozpoznávání.

Pomocí rozhraní API můžete vytvářet chytré aplikace aktivované hlasem. Vyzkoušejte si ukázku a podívejte se, jak to funguje. Vyberte cílový jazyk, klikněte na mikrofon a začněte mluvit. Nebo stačí jen kliknout na jednu z ukázek řeči.*

Prohlédnout v akci

Pokud si chcete ukázku vyzkoušet s vlastním hlasem s použitím mikrofonu, použijte jiný prohlížeč s podporou WebRTC, jako je aktuální verze Microsoft Edge, Firefox nebo Chrome.

Chcete na tom stavět?

Custom Speech Service: Přepis řeči s využitím vlastního modelu

Překonejte bariéry při rozpoznání řeči, jako jsou mluvený styl, slovník a šum na pozadí. Naše technologie rozpoznávání řeči kombinují k získání textového výstupu více rozhraní API. Zákazníci můžou rozhraní API přizpůsobit svým potřebám a dostupným datům.

Prohlédnout v akci

Ukázkové věty

Reference

Custom Speech

Vytvoření vlastních jazykových modelů přizpůsobených stylu řeči uživatelů

Nedopusťte, aby různé slovníky a styly řeči bránily porozumění. Přizpůsobte jazykový model pro rozpoznávání řeči ve své aplikaci specifickým oborovým výrazům, technickým, zeměpisným nebo tržním termínům, a dokonce i individuálnímu stylu řeči.

Přizpůsobení uživatelskému prostředí pomocí vlastních zvukových modelů

Zajistěte, aby rozpoznávání řeči ve vaší aplikaci fungovalo ve všech prostředích. Díky vlastním zvukovým modelům můžete vzít v úvahu hluk na pozadí a vyhovět tomu, jaké prostředí uživatelé očekávají.

Využití robustních modelů řeči od Microsoftu

Umožněte výkonné a přizpůsobené rozpoznávání řeči díky vytváření vlastních přizpůsobených modelů rozpoznávání řeči, které můžete používat vedle stávajících špičkových modelů Microsoftu.

Chcete na tom stavět?

Prozkoumejte konkrétní scénář řeči

Call centrum

Speech ServicesWith Speech Services, it's easy to transcribe every call. Index the transcription for full-text search, or apply Text Analytics to detect sentiment, language, and key phrases for insights. If your call center recordings involve specialized terminology, such as product names or IT jargon, create a custom language model to teach Speech Services the vocabulary. A custom acoustic model helps Speech Services understand speakers even with background noise or poor phone connections. For more information, read how batch transcription works with Speech Services.
  1. Přehled
  2. Tok

Hlasové služby

Přehled

Služba Speech umožňuje snadno přepisovat všechny hovory. Přepis můžete indexovat pro fulltextové vyhledávání nebo použít Analýzu textu k rozpoznání mínění, jazyka a klíčových frází. Pokud nahrávky z call centra obsahují odbornou terminologii (například názvy produktů nebo žargon IT), vytvořte vlastní jazykový model, kterým službu Speech tuto slovní zásobu naučíte. Vlastní akustický model pomáhá službě Speech porozumět mluvčím i přes šum na pozadí nebo špatné telefonní spojení.

Pokud chcete další informace, přečtěte si, jak funguje dávkový přepis s využitím služby Speech.

Tok

  1. 1 Přizpůsobení modelu pro vaši doménu a jeho nasazení
  2. 2 Odeslání nahrávek do kontejneru objektů blob
  3. 3 Vytvoření požadavku POST pro dávkový přepis
  4. 4 Služba Speech naplánuje úlohu přepisu
  5. 5 Stereo soubory se rozdělí na dva kanálů
  6. 6 Mono soubory projdou diarizací, která zajistí rozlišení jednotlivých mluvčích
  7. 7 Stažení přepisu s použitím ID přepisu

Prozkoumejte rozhraní API služeb Cognitive Services

Počítačové zpracování obrazu

Zjištění využitelných informací z obrázků

Tvář

Detekce, identifikace, analýza, uspořádání a označení tváří na fotografiích

Rozpoznávání rukopisu PREVIEW

Služba AI, která rozpoznává obsah digitálního rukopisu, jako je rukopis, tvary a rozložení rukopisných dokumentů

Video Indexer

Odhalení nových poznatků z videí

Custom Vision

Jednoduché přizpůsobení vlastních špičkových modelů počítačového zpracování obrazu pro jedinečné případy použití

Rozpoznávání formulářů PREVIEW

Služba extrakce dokumentace založená na AI, která rozumí vašim formulářům

Analýza textu

Snadné vyhodnocení subjektivního hodnocení a témat a pochopení, co uživatelé chtějí

Translator Text

Snadný strojový překlad textů pomocí jednoduchého volání rozhraní REST API

QnA Maker

Dostaňte z informací srozumitelné odpovědi, které lze snadno procházet.

Language Understanding

Naučte svoje aplikace, aby rozuměly příkazům uživatelů

Asistivní čtečka PREVIEW

Umožnění čtení a porozumění textu všem uživatelům bez ohledu na věk a schopnosti

Hlasové služby

Jednotné hlasové služby pro převod řeči na text, textu na řeč a překlad řeči

Rozpoznávání mluvčího PREVIEW

Jednotliví mluvčí se dají identifikovat a ověřit pomocí hlasu

Content Moderator

Automatizované moderování obrázků, textu a videa

Detektor anomálií PREVIEW

Jednoduše přidejte možnosti detekce anomálií do vašich aplikací.

Personalizace PREVIEW

Služba AI, která zajišťuje individuální uživatelské prostředí

Využijte sadu Speech Devices SDK pro sestavení ambientního zařízení a vytvoření vlastního aktivačního slova

Další informace