Használjon alapmodelleket a testreszabott hangbemeneti és hangkimeneti modellek mellett, hogy hanggal működtesse az ügynököket.
Átírás beszédfelismeréssel
Átírást készíthet ügyfélszolgálati vagy konferenciabeszélgetésekről. A több mint 100 nyelven elérhető hangfeliratozással globálisan is megjelenhet.
Szöveg átalakítása beszéddé
Olyan robotokat hozhat létre, amelyek természetes módon beszélnek. Egyedi, valósághű hangokkal és beszédstílusokkal különböztetheti meg márkáját.
Hívás utáni elemzések használata
Elemezheti a hang- vagy videohívások felvételeit, hogy mélyebb betekintést nyerjen az Azure AI tartalommegértés alapmodelljei segítségével.
Hang átírása az OpenAI Whisper használatával
Az ügyfélszolgálatokat az Azure AI Beszéd vagy az Azure OpenAI legújabb OpenAI Whisper modelljével alakíthatja át.
Egyéni hangok létrehozása
Természetes hangzású hangokat hozhat létre egyéni neurális hangokkal.
Avatarok létrehozása
Keltse életre márkáját előre elkészített vagy egyéni avatarokkal és természetes hangzású hangokkal.
Többnyelvű kommunikáció lehetővé tétele
Hang- és videoadatokat fordíthat le a támogatott nyelvekre, melyek köre folyamatosan bővül. A fordításokat testre szabhatja a saját ágazatához.
Beszéd beágyazása
Beágyazott beszéd használatával bekapcsolhatja az eszközön a beszédfelismerést és a szövegfelolvasást olyan helyzetekben, amikor a felhőkapcsolat időszakos vagy nem érhető el.
Az Azure AI Beszéd és más Azure AI-termékek használatával átfogó megoldásokat hozhat létre.
Azure OpenAI
Multimodalitást építhet be, és az alkalmazásokat olyan modellekkel fejlesztheti, amelyek többféle adattípust (például szöveget, képeket, videót és hangot) kombinálnak.
A felelősen alkalmazott mesterséges intelligencia elveit a gyakorlatban megvalósító beépített eszközökkel biztonságos és megbízható megoldásokat szállíthat.
„Nálunk az Azure legfőbb felhasználási területei a mesterséges intelligencia, a kognitív szolgáltatások és a beszéd. Ez a platform szinte minden egyes részét érinti.”
Jeff Gallino, társalapító és műszaki igazgató, CallMiner
„Itt, Brazíliában mi úttörők vagyunk. Merész döntést hoztunk azzal, hogy neurális, szintetizált hang használatába fektettünk be, amikor senki más nem csinált hasonlót. Évente több millió ügyféllel beszélgetünk, így a hangunk megváltoztatása merész lépés.”
Olimpio Fernandes, a TIM Kognitív Élményközpont igazgatója
„Meglehetősen nehéz kiváló minőségű hangokat kínálni nagy mennyiségben, a Microsoft azonban sokat segített nekünk abban, hogy elinduljunk a szövegfelolvasás területén, és eljuttassuk a hangokat az ügyfeleinkhez.”
Az Azure AI Beszéd számos funkciót és képességet kínál, többek között beszédfelismerést, szövegfelolvasást és tolmácsolást. Ezeket SDK-k használatával lehet elérni számos programozási nyelven, többek között C#, C++, Java és más nyelveken.
A Beszéd egyre több nyelvet támogat. A támogatott nyelvek listáját az aktuális listában találja.
Az ügyfelek izgalmas alkalmazásokat fejlesztenek az Azure AI Services használatával. Kezdje el az Azure AI Foundry Azure AI Beszédelemzését használni olyan felhasználási esetekhez, mint a beszélgetési AI, a hívás utáni elemzés és a videóösszesítés.
Következő lépések
Válassza ki az Önnek megfelelő Azure-fiókot
Választhat használatalapú fizetést, vagy kipróbálhatja az Azure-t akár 30 napig ingyenesen.
Böngésszen a Microsoft üzleti megoldásközpontjában, és keresse meg azokat a termékeket és megoldásokat, amelyek segíthetnek a szervezet céljainak elérésében.