Vývoj multimodálních aplikací s generativní AI s využitím modelů řeči
Přepis řeči do textu
Přepisujte hovory v call centru nebo na schůzkách. Zvukové titulky ve více než 100 jazycích jsou globální.
Převod textu na řeč
Vytvářejte roboty, kteří mluví přirozeně. Odlište svou značku pomocí přizpůsobených, realistických hlasů a stylů mluvení.
Analýza řeči
Analyzujte záznamy zvukových hovorů nebo videohovorů a získejte podrobné přehledy. Shrnujte klíčová témata a extrahujte nebo redigujte osobní identifikační údaje.
Přepis zvuku pomocí modelu OpenAI Whisper
Transformujte svá call centra pomocí nejnovějšího modelu OpenAI Whisper ve službě Azure AI Speech nebo Azure OpenAI Service.
Vytváření vlastních hlasů
Vytvářejte přirozeně znějící hlasy pomocí funkce Vlastní neurální hlas.
Vytváření vlastních avatarů
Oživte svou značku pomocí předem připravených nebo vlastních avatarů s přirozeně znějícími hlasy.
Ověřování a rozpoznávání mluvčích
Přidejte k aplikaci identifikaci a ověření mluvčího, abyste potvrdili identitu osoby nebo rozpoznali, kdo mluví na schůzce.
Umožnění vícejazyčné komunikace
Překládejte zvuková nebo obrazová data z/do neustále rostoucího seznamu podporovaných jazyků. Přizpůsobte překlady svému oboru.
Integrace řeči
Pomocí integrované řeči můžete využívat scénáře převodu řeči na text a textu na řeč na zařízeních, kdy je připojení ke cloudu přerušované nebo nedostupné.
„Naším největším případem použití pro Azure je oblast AI, kognitivních služeb a řeči. Dotýká se to prakticky každé části naší platformy.“
Jeff Gallino, spoluzakladatel a ředitel pro technologie, CallMiner
„V Brazílii jsme byli průkopníky. Učinili jsme odvážné rozhodnutí investovat do používání neurálního syntetického hlasu, když to ještě nikdo jiný nedělal. Každý rok mluvíme s miliony zákazníků, takže změna našeho hlasu je odvážným krokem.“
Olimpio Fernandes, ředitel centra Cognitive Experience Center, TIM
„Je poměrně obtížné nabízet vysoce kvalitní hlasy ve velkém rozsahu, ale Microsoft nám skutečně pomohl začít využívat služby převodu textu na řeč a dostat hlasy k našim zákazníkům.“
Azure AI Speech nabízí řadu funkcí a schopností, včetně převodu řeči na text, převodu textu na řeč a překladu řeči. Tyty funkce jsou nabízeny prostřednictvím sad SDK v několika programovacích jazycích, včetně jazyků C#, C++, Java a dalších.
Azure AI Speech podporuje stále se rozšiřující sadu jazyků. Aktuální seznam podporovaných jazyků najdete v tomto seznamu.
Zákazníci vytvářejí zajímavé aplikace pomocí Azure AI Služeb. Začněte používat analýzu řeči v Azure AI Foundry pro konverzační AI, analýzu po volání, souhrny videí a další případy použití.
Další kroky
Zvolte účet Azure, který je pro vás nejvhodnější
Plaťte průběžně nebo Azure vyzkoušejte zdarma až na 30 dní.