Navigáció kihagyása

Text to Speech

Természetes beszédhangokkal keltheti életre az alkalmazásait

Készítsen természetes beszédet használó alkalmazásokat és szolgáltatásokat. Különböztesse meg márkáját testreszabott hanggal, és használja a különböző beszédstílusú és érzelmi tónusú hangokat, amelyek megfelelnek a felhasználási esetnek – a szövegfelolvasóktól kezdve a beszélő robotokon át az ügyfélszolgálati csevegőrobotokig.

Életszerű szintetizált beszéd

Folyékony, természetesnek hangzó szövegfelolvasást tehet lehetővé, amely az emberinek megfelelő lejtésű és érzelmi tónusú hangokat alkalmaz.

Testreszabható szövegfelolvasási hangok

A márka identitását kifejező, mesterséges intelligenciát használó, egyedi hanggenerátor alakítható ki.

Részletes szövegfelolvasási hangvezérlők

A sebességet, a hangmagasságot, a szüneteket és más jellemezőket egyszerűen testre szabhatja, így a hangkimenetet saját forgatókönyvére hangolhatja.

Rugalmas üzembe helyezés

A Text to Speech bárhol futtatható – a felhőben, a helyszínen, és peremhálózati tárolókban egyaránt.

Minden helyzethez számos különféle hangból választhat

Kapcsolatba léphet a globális célközönséggel több mint 400 neurális hang, valamint 140 nyelv és nyelvváltozat használatával. A nagyon kifejező és emberihez hasonló hangokkal élethűvé tehetők a szövegolvasók, a hangvezérelt asszisztensek és más eszközök. A neurális szövegfelolvasás több beszédstílust támogat, beleértve a hírolvasói és az ügyfélszolgálati stílust, továbbá a kiabálást, a suttogást, valamint az érzelmeket, mint például a vidámságot és a szomorúságot.

Próbálja ki a szövegfelolvasást a JavaScript SDK-ra épülő bemutató alkalmazással

Megjegyzés: A rendszer nem tárolja az adatokat.

Útmutató a létrehozáshoz

Megjegyzés: A rendszer nem tárolja az adatokat.

Útmutató a létrehozáshoz

A beszédkimenet testreszabása

A szintetizált beszédhang finomhangolása a forgatókönyvnek megfelelően. Lexikonok definiálása és a beszédparaméterek, mint például a kiejtés, a hangmagasság, a sebesség, a szünetek és az intonációt ellenőrizése a Speech Synthesis Markup Language (SSML) szolgáltatással vagy a hanganyagkészítő eszközzel.

A Text to Speech a felhőtől a peremhálózatokig bárhol üzembe helyezhető

A Text to Speechet ott futtathatja, ahol az adatai vannak. A tárolók használatával élethű beszédszintézist építhet az alkalmazásokba, melyeket hatékony felhőbeli képességekre és peremhálózati használatra optimalizálhat.

Egyéni hang létrehozása saját márkához

Saját márkáját egyedi egyéni hangokkal teheti különlegessé. Az egyedi neurális hang funkciójával valósághű hangok hozhatók létre a természetesebb társalgási felületekhez, kezdetben 30 perces hanganyaggal. Íme néhány szervezet, amelyek mesterséges intelligenciát használnak a hanggeneráláshoz:

A Swisscom többnyelvű hangvezérelt asszisztenssel növeli a felhasználói élményt.

A Swisscom az Azure Cognitive Service beszédhez szolgáltatást használva hozott létre természetes hangzású egyéni szövegfelolvasási hangvezérelt asszisztenst a csak a Swisscomra jellemző egyedi hangokkal angol, francia, német és olasz nyelven.

A történet elolvasása

Az AT&T magával ragadó élménnyel örvendezteti meg ügyfeleit

Az AT&T olyan modern felülettel mutatja be az 5G hálózata hatékonyságát, amelyen az ügyfelek közvetlenül Tapsi Hapsival beszélhetnek*.

*A BOLONDOS DALLAMOK (LOONEY TUNES) és az összes kapcsolódó karakter és elem a Warner Bros. Entertainment Inc. védjegye és bejegyzett védjegye. (s21)

A videó megtekintése

A Progressive a Flót közvetlenül elérhetővé teszi ügyfelei számára

A Progressive egyéni neurális hang használatával hozta létre a Flo egy természetes hangzású virtuális verzióját, amely számos dologban segíti az ügyfeleket az ingyenes autóbiztosítástól kezdve az általános kérdésekig.

A történet elolvasása

Az alkalmazásinnováció elősegítése felhőbeli AI-szolgáltatásokkal

Bemutatunk 5 kulcsfontosságú módszert, amelyek bevezetik a szervezetet a mesterséges intelligencia használatába, és hozzásegítik a gyors értékteremtéshez.

Átfogó adatvédelem és biztonság

  • Az Azure Cognitive Services részét képező Speech Service a SOC, a FedRAMP, a PCI DSS, a HIPAA, a HITECH és az ISOtanúsítványaival rendelkezik.
  • Adatai az Ön tulajdonában maradnak. A szöveges adatok nem lesznek tárolva az adatfeldolgozás vagy a hanglétrehozás során.
  • Egyéni hangadatait és szintetizált beszédmodelljeit bármikor megtekintheti és törölheti. Adatait titkosítva tároljuk.
  • Az Azure infrastruktúráján alapuló Speech szolgáltatás ipari szintű biztonságot, rendelkezésre állást, megfelelőséget és kezelhetőséget biztosít.

A rugalmas díjszabás biztosítja a szükséges hatékonyságot és ellenőrzést

Fizessen csak a tényleges használatért előzetes költség nélkül. A Text to Speech szolgáltatásban csak a valós használatért kell fizetnie, a hanggá alakított karakterek száma alapján.

Útmutató a szintetikus hangok felelősségteljes létrehozásához

További információ a felelős üzembe helyezésről

A szintetikus hangokat úgy kell kialakítani, hogy elnyerjék mások bizalmát. Megismerheti a szintetikus hangok létrehozásának alapelveit, amelyek bizalmat ébresztenek a cége és szolgáltatásai iránt.

Beleegyezés kérése a hangszolgáltatótól

Segítséget nyújt a hangokkal dolgozóknak annak megértésében, hogyan működik a neurális szövegfelolvasás (TTS), és információt kínál az ajánlott használati esetekről.

Legyen átlátható

Az átláthatóság alapvető fontosságú a számítógépes hanggenerátorok és a szintetikus hangok felelősségteljes használatához. Gondoskodhat róla, hogy a felhasználók tudják, mikor hallanak szintetikus hangokat, és arról is, hogy a hangot szolgáltató személyek tudják, hogy milyen célra használja a hangjukat. A részletekért tekintse meg a közzététel-tervezési útmutatónkat.

Dokumentáció és források

Tanulmányozza kódmintáinkat

Tekintse meg a mintakódot

Tekintse meg a testreszabást ismertető segédanyagainkat

Beszédfelismerési megoldása a Speech Studio használatával testreszabható. Nem kell programkódot írnia.

A Text to Speech használatával készült

A BBC új módon nyújt megbízható tartalmat

A BBC az Azure Cognitive Services és az Azure Bot Service használatával egy teljes körű, testre szabott, digitális hangvezérelt asszisztenst hozott létre, amely igazodik a márkához, és lehetővé teszi, hogy beszélt nyelvi kapcsolatot hozzon létre széles körű közönségével.

BBC

A Swisscom többnyelvű hangvezérelt asszisztenssel fejleszti tovább a felhasználói élményt

A Swisscom a Speech szolgáltatást használva hozott létre természetes hangzású egyéni hangvezérelt asszisztenst a csak a Swisscomra jellemző egyedi hangokkal angol, francia, német és olasz nyelven.

Swisscom

A Motorola a frontvonalban dolgozókat segíti fontos adatok elérésében

A Motorola Solutions a rendőröknek és más vészhelyzeti tevékenységet végzőknek teszi lehetővé, hogy egy hangvezérelt virtuális asszisztenssel gyorsabban érhessék el a fontos információkat.

Motorola Solutions

A Universal Electronics hatékonyabbá teszi a csatlakoztatott intelligens otthonokat

A Universal Electronics olyan hangvezérelt navigációs és vezérlési lehetőségekkel segíti a gyártókat, amelyek többféle otthoni intelligens eszközön is működnek.

Universal Electronics

A Cheetah Mobile bővíti a nemzetközi fordítást

A Cheetah Mobile egy olyan mobilinternetes vállalat, amelynek az alkalmazását több mint 200 országban és régióban használják. A cég most a Text to Speech használatával terjeszti ki a fordítási eszközének és alkalmazásának akadálymentességét a nemzetközi piacokon.

Cheetah Mobile

Ha készen áll, állítsa be ingyenes Azure-fiókját