Természetes beszédhangokkal keltheti életre az alkalmazásait
Hozzon létre természetes nyelven megszólaló alkalmazásokat és szolgáltatásokat. Testreszabott, valósághű hanggal megkülönböztetheti márkáját, és a felhasználási esetnek megfelelő különböző beszédstílusú és érzelmi tónusú hangokhoz férhet hozzá – a szövegfelolvasóktól és beszélőktől az ügyfélszolgálati csevegőrobotokig.
Életszerű szintetizált beszéd
Folyékony, természetesnek hangzó szövegfelolvasást tehet lehetővé, amely tükrözi az emberi hangoknak megfelelő hanglejtést és érzelmeket.
Testre szabható szövegfelolvasási hangok
Olyan egyedi AI-hanggenerátort hozhat létre, amely kifejezi az Ön márkájának jellegzetességét.
Részletes szövegfelolvasási hangvezérlők
A sebességet, a hangmagasságot, a szüneteket és más jellemezőket egyszerűen testre szabhatja, így a hangkimenetet saját forgatókönyvére hangolhatja.
Rugalmas üzembe helyezés
A szövegfelolvasás bárhol futtatható – a felhőben, a helyszínen, és peremhálózati tárolókban egyaránt.
A beszédkimenet testreszabása
A szintetizált beszédet saját helyzetére testre szabhatja. Szótárakat definiálhat és szabályozhatja a beszéd olyan paramétereit, mint a hangmagasság, a sebesség, a szünetek és a hanglejtés a Speech Synthesis Markup Language (SSML) használatával vagy az audiótartalom-készítési eszközzel.
A szövegfelolvasás a felhőtől a peremhálózatokig bárhol üzembe helyezhető
A szövegfelolvasást ott futtathatja, ahol az adatai vannak. A tárolókkal felhőalapú képességekre és peremhálózatokra egyaránt optimalizálható beszédszintetizáló funkciókat építhet be az alkalmazásaiba.
Egyéni hang létrehozása saját márkához
Saját márkáját egyedi egyéni hangokkal különbözteti meg. Az egyéni neurális hangképzési funkcióval valósághű hangok hozhatók létre a természetesebb társalgási felületekhez, kezdetben 30 perces hanganyaggal. Íme néhány példa olyan szervezetekre, amelyek jelenleg AI-hanggenerálást végeznek:
Alkalmazásinnováció ösztönzése felhőalapú AI-szolgáltatásokkal
Ismerje meg azt az öt legfontosabb módszert, amellyel a szervezete használatba veheti a mesterséges intelligenciát, hogy gyorsan értéket teremtsen.
Átfogó adatvédelem és biztonság
Dokumentáció
Az Azure AI Services részét képező AI Speech szolgáltatás SOC, FedRamp, PCI, HIPAA, HITECH és ISO tanúsítvánnyal rendelkezik.
Egyéni hangadatait és szintetizált beszédmodelljeit bármikor megtekintheti és törölheti. Adatait titkosítva tároljuk.
Képzés
Adatai az Ön tulajdonában maradnak. A szöveges adatok nem lesznek tárolva az adatfeldolgozás vagy a hang létrehozása során.
Az Azure infrastruktúráján alapuló AI Speech szolgáltatás ipari szintű biztonságot, rendelkezésre állást, megfelelőséget és kezelhetőséget kínál.
Beépített átfogó biztonság és megfelelőség
-
A Microsoft több mint 1 milliárd USD-t költ évente a kiberbiztonsággal kapcsolatos kutatás-fejlesztési projektekre.
-
Több mint 3500 biztonsági szakértőnk dolgozik azon, hogy megfelelő szintű adatbiztonságot és adatvédelmet nyújthassunk Önnek.
-
Az Azure minden más felhőszolgáltatónál több minősítéssel rendelkezik. Tekintse meg a teljes listát.
-
A rugalmas díjszabás biztosítja a szükséges hatékonyságot és ellenőrzést
Csak a tényleges használatért kell fizetnie, előzetes költség nélkül. A Text to Speech szolgáltatásban csak a valós használatért kell fizetnie, a hanggá alakított karakterek száma alapján.
Kezdjen egy ingyenes Azure-fiókkal
1
2
A kredit felhasználása után váltson használatalapú fizetésre, hogy továbbra is használhassa ezeket az ingyenes szolgáltatásokat. Csak akkor kell fizetnie, ha az ingyenes havi mennyiségnél többet használ.
3
Útmutató a szintetikus hangok felelősségteljes létrehozásához
További információ a felelős üzembe helyezésről
A szintetikus hangokat úgy kell kialakítani, hogy megbízhatónak hangozzanak. Megtudhatja, hogyan készíthet olyan szintetikus hangokat, amelyek bizalmat ébresztenek cége és szolgáltatásai iránt.
Beleegyezés kérése a hangszolgáltatótól
Segítséget nyújt a hangforrásoknak annak megértésében, hogyan működik a neurális szövegfelolvasás (TTS), és információt kínál az ajánlott használati esetekről.
Legyen átlátható
Az átláthatóság alapvető fontosságú a számítógépes hanggenerátorok és szintetikus hangok felelősségteljes használatánál. Gondoskodhat róla, hogy a felhasználók tudják, mikor hallanak szintetikus hangokat, a hangot szolgáltató személyek pedig tisztában vannak azzal, hogy milyen célra használja a hangjukat. Ismerje meg a közzététel-tervezési útmutatónkat.
Dokumentáció és források
Első lépések
A dokumentáció elolvasása
Végezze el a Microsoft Learn tanfolyamot
Kódminták tanulmányozása
Tekintse meg a kódmintákat
Tekintse meg a testreszabást ismertető segédanyagainkat
Beszédfelismerési megoldása a Speech Studio használatával testreszabható. Nem kell programkódot írnia.