Přeskočit navigaci
NYNÍ K DISPOZICI

Představujeme řešení Ingestion Client pro Azure Speech

Datum publikování: 28 června, 2021

Speech je kognitivní služba Azure, která umožňuje vytvářet škálovatelná řešení zvládající různé úlohy související s řečí, jako je přepis zvukového záznamu, vytváření přirozeně znějících hlasů nebo rozpoznávání mluvčího, a zpracovávat překlad řeči.

Dnes představujeme nástroj Ingestion Client. Toto řešení Azure monitoruje váš vyhrazený kontejner služby Azure Storage a zajišťuje automatický přepis zvukových souborů, které se do tohoto úložiště dostanou.

Tento nástroj jsme vytvořili, abychom vám pomohli nastavit plnohodnotný, škálovatelný a bezpečný přepisovací kanál, a to prostřednictvím jednoduché konfigurace a bez nutnosti vynakládat jakéhokoli úsilí v oblasti vývoje. Součástí nástroje Ingestion Client jsou osvědčené postupy pro zvládnutí maximálního počtu požadavků na přepis z hlediska škálování (až stovky tisíc souborů), správy chyb, logiky opakování a různých dalších optimalizací. Toto nastavení se provádí prostřednictvím nasazení ARM. Architektura řešení, které tato šablona ARM zavádí, je popsána na obrázku níže.

 

Grafické uživatelské rozhraní, diagram, aplikace

Automaticky generovaný popis

Když uživatel uloží zvukový soubor do vyhrazeného úložiště služby Azure Storage, řešení Azure Functions aktivované časovačem vezme tento soubor a žádost o přepis, a to pomocí rozhraní REST API pro převod řeči na text v3.0 nebo sady Speech SDK (volba uživatele). Po úspěšném dokončení operace řešení zapíše přepis do kontejnerů, ze kterých byl zvukový soubor získán. Kromě toho si uživatelé mohou zvolit, zda chtějí na přepis aplikovat analytické funkce, vytvářet sestavy nebo provádět úpravy, což je výsledkem nasazení dalších prostředků prostřednictvím šablony ARM.

Projděte si našeho průvodce, kde najdete k tomuto nástroji další informace a instalační poznámky, a stáhněte si kód z tohoto úložiště Github.

  • Převod řeči na text
  • Hlasové služby
  • Operating System
  • SDK and Tools