Az alkalmazásban testre szabhatja a beszédet a saját területére – beleértve az OpenAI Whisper modelljét –, vagy saját márkás hangot is adhat a másodpilótának.
Átírást készíthet ügyfélszolgálati vagy konferenciabeszélgetésekről. A több mint 100 nyelven elérhető hangfeliratozással globálisan is megjelenhet.
Szöveg átalakítása beszéddé
Olyan robotokat hozhat létre, amelyek természetes módon beszélnek. Egyedi, valósághű hangokkal és beszédstílusokkal különböztetheti meg márkáját.
Beszédelemzés
Elemezheti a hang- és videohívások felvételeit, és részletes betekintéseket kaphat róluk. Összefoglalhatja a legfontosabb témákat, a személyes azonosító adatokat pedig kiszűrheti vagy törölheti.
Hang átírása az OpenAI Whisper használatával
Az ügyfélszolgálatokat az Azure AI Beszéd vagy az Azure OpenAI Service legújabb OpenAI Whisper modelljével alakíthatja át.
Egyéni hangok létrehozása
Természetes hangzású hangokat hozhat létre egyéni neurális hangokkal.
Avatarok létrehozása
Keltse életre márkáját előre elkészített vagy egyéni avatarokkal és természetes hangzású hangokkal.
Beszélők ellenőrzése és felismerése
A beszélő-ellenőrzés és -azonosítás alkalmazáshoz való hozzáadásával ellenőrizheti a személyek személyazonosságát, és azonosíthatja, hogy kik beszélnek egy értekezleten.
Többnyelvű kommunikáció lehetővé tétele
Hang- és videoadatokat fordíthat le a támogatott nyelvekre, melyek köre folyamatosan bővül. A fordításokat testre szabhatja a saját ágazatához.
Beágyazott beszéd
Beágyazott beszéd használatával bekapcsolhatja az eszközön a beszédfelismerést és a szövegfelolvasást olyan helyzetekben, amikor a felhőkapcsolat időszakos vagy nem érhető el.
Az Azure-termékek együtt még hatékonyabban működnek
Az Azure AI Beszéd és más Azure AI-termékek használatával átfogó megoldásokat hozhat létre.
Azure OpenAI Service
Multimodalistást építhet be, és az alkalmazásokat olyan modellekkel fejlesztheti, amelyek többféle adattípust (például szöveget, képeket, videót és hangot) kombinálnak.
A felelősen alkalmazott mesterséges intelligencia elveit a gyakorlatban megvalósító beépített eszközökkel biztonságos és megbízható megoldásokat szállíthat.
„Nálunk az Azure legfőbb felhasználási területei a mesterséges intelligencia, a kognitív szolgáltatások és a beszéd. Ez a platform szinte minden egyes részét érinti.”
Jeff Gallino, társalapító és műszaki igazgató, CallMiner
„Itt, Brazíliában mi úttörők vagyunk. Merész döntést hoztunk azzal, hogy neurális, szintetizált hang használatába fektettünk be, amikor senki más nem csinált hasonlót. Évente több millió ügyféllel beszélgetünk, így a hangunk megváltoztatása merész lépés.”
Olimpio Fernandes, a TIM Kognitív Élményközpont igazgatója
„Meglehetősen nehéz kiváló minőségű hangokat kínálni nagy mennyiségben, a Microsoft azonban sokat segített nekünk abban, hogy elinduljunk a szövegfelolvasás területén, és eljuttassuk a hangokat az ügyfeleinkhez.”
Az Azure AI Beszéd számos funkciót és képességet kínál, többek között beszédfelismerést, szövegfelolvasást és tolmácsolást. Ezeket SDK-k használatával lehet elérni számos programozási nyelven, többek között C#, C++, Java és más nyelveken.
Az Azure AI Beszéd egyre több nyelvet támogat. A támogatott nyelvek listáját ebben a listában találja.
Az ügyfelek izgalmas alkalmazásokat fejlesztenek az Azure AI Services használatával. Kezdje el használni a beszédelemzést az Azure AI Foundry-ban beszélgetési AI, hívás utáni elemzések, videó összefoglalások és további felhasználási lehetőségekhez.
Következő lépések
Válassza ki az Önnek megfelelő Azure-fiókot
Választhat használatalapú fizetést, vagy kipróbálhatja az Azure-t akár 30 napig ingyenesen.
Böngésszen a Microsoft üzleti megoldásközpontjában, és keresse meg azokat a termékeket és megoldásokat, amelyek segíthetnek a szervezet céljainak elérésében.