A speech API-szolgáltatások típusai

Az Azure Cognitive Services Speech szolgáltatással szóbeli nyelvi átalakításokat hajthat végre, beleértve a beszédfelismerést, a szövegfelolvasást, a beszédfordítást és a beszélőfelismerést.

Megjegyzés

Használja az Azure Cognitive Service for Language szolgáltatást, ha kifejezésekkel vagy kifejezésekkel kapcsolatos megállapításokat szeretne gyűjteni, vagy részletes kontextuselemzést szeretne kapni a beszélt vagy írott nyelvről.

Szolgáltatások

  • A beszédfelismerés valós időben vagy kötegben képes szöveggé alakítani a hangstreameket.
  • A szövegfelolvasás lehetővé teszi, hogy az alkalmazások emberi beszédgé alakítsa a szöveget.
  • A beszédfordítás többnyelvű beszédfelolvasást és a hangstreamek szöveggé alakítását teszi lehetővé.

Beszédszolgáltatás kiválasztása

Ez a folyamatábra segítséget nyújt az igényeinek megfelelő beszédfelismerési szolgáltatás kiválasztásában:

A beszédszolgáltatás kiválasztását bemutató ábra.

A diagram bal oldalán a hang-hang vagy a szöveggé alakítás folyamata látható.

  • A beszédfelolvasás a hangforrás beszédének szövegformátumúvá alakítására szolgál.
  • A beszédfelolvasás az egyik nyelv beszédének egy másik nyelven történő fordítására szolgál.

A diagram jobb oldalán a szöveg-hang folyamatok láthatók.

  • A szövegfelolvasással kimondott hangokat hozhat létre szövegforrásból.

Gyakori használati helyzetek

Az alábbi táblázat szolgáltatásokat javasol néhány gyakori használati esethez.

Használati eset Használandó szolgáltatás
Feliratok megadása rögzített vagy élő videókhoz Diktálás
Telefonhívás vagy értekezlet átiratának létrehozása Diktálás
Automatizált jegyzetdiktálás implementálása Diktálás
További feldolgozásra szánt felhasználói bevitel meghatározása Diktálás
A felhasználói bevitelre adott szóbeli válaszok létrehozása Szövegfelolvasás
Hangmenük létrehozása telefonrendszerekhez Szövegfelolvasás
E-mailek vagy sms-ek felolvasása kéz nélküli forgatókönyvekben Szövegfelolvasás
Közlemények közvetítése nyilvános helyeken, például vasútállomásokon vagy repülőtereken Szövegfelolvasás
Valós idejű feliratozás készítése beszédhez vagy egy beszélt beszélgetés egyidejű kétirányú fordításához Diktálás

Közreműködők

Ezt a cikket a Microsoft tartja karban. Eredetileg a következő közreműködők írták.

Fő szerzők:

Egyéb közreműködők:

A nem nyilvános LinkedIn-profilok megtekintéséhez jelentkezzen be a LinkedInbe.

Következő lépések