Speech to Text
A Speech szolgáltatás funkciója, amely pontosan írja át szöveggé a beszédet
Műveletindítás beszédhang alapján
Gyorsan és pontosan átírhatja a hangot szöveggé több mint 100 nyelven és változatban. A modelleket a tartományspecifikus terminológia pontosságának növelése érdekében testre szabhatja. Jobban kihasználhatja a beszédhangot, ha engedélyezi az átírt szövegekkel kapcsolatos keresést vagy elemzést, illetve megkönnyíti a műveletet – mindezt az Ön által előnyben részesített programozási nyelven.
Kiváló minőségű átiratok
Pontos diktálásátiratok a legkorszerűbb beszédfelismerési szolgáltatás révén.
Testreszabható modellek
Az alapszókincshez egyedi szavakat is hozzáadhat, de létrehozhat saját diktálási modelleket is.
Rugalmas üzembe helyezés
A Beszédfelismerést bárhol futtathatja – a felhőben és a peremhálózati tárolókban egyaránt.
Üzemkész állapotban
Ugyanazt a robusztus technológiát veheti igénybe, amelyet a Microsoft-termékekben megszokott beszédfelismerés is használ.
Próbálja ki a diktálást ezzel a JavaScript SDK-t használó demóalkalmazással
Ha szeretné kipróbálni a demót a saját hangjával és egy mikrofonnal, váltson olyan böngészőre, amely támogatja a WebRTC-t – ilyen böngésző például a Microsoft Edge, a Firefox vagy a Chrome legújabb verziója.
A rendszer nem tárolja a beszédfelismerési adatokat
Pontos átirat számos különböző beszédforrás esetében
Számos különböző forrásból származó hangot szöveggé konvertálhat, használhat például mikrofonokat, hangfájlokat és blobtárolót is. A beszélők elkülönítése funkcióval meghatározhatja ki mikor mit mondott. Olvasható átiratok automatikus formázással és írásjelekkel.
A beszédfelismerési modellek igény szerint testre szabhatók
A beszédfelismerési modellek testre szabhatók, hogy felismerjék a vállalat tevékenységére és az iparágra jellemző terminológiát. Kiküszöbölheti az olyan beszédfelismerést akadályozó tényezőket mint a háttérzaj, a különféle akcentusok, és az egyedi szóhasználat. Hangadatok és átiratok feltöltésével testre szabhatja a modelleket. Office 365-adatok használatával automatikusan létrehozhat egyéni modelleket, és optimalizálhatja a vállalat a beszédfelismerési képességeinek pontosságát.
Bárhol üzembe helyezhető
A beszédfelismerést bárhol futtathatja, ahol az adatai vannak. A tárolókkal robusztus felhőalapú képességekre és helyszínre optimalizálható beszédalapú alkalmazások készíthetők.
Az alkalmazásinnováció elősegítése felhőbeli AI-szolgáltatásokkal
Ismerjen meg 5 kulcsfontosságú módszert, ahogyan szervezete elkezdheti az AI használatát, hogy gyorsan értéket teremtsen.
Átfogó adatvédelem és biztonság
- Az Azure Cognitive Services részét képező Speech Service a SOC, a FedRAMP, a PCI DSS, a HIPAA, a HITECH és az ISOtanúsítványaival rendelkezik.
- Adatai az Ön tulajdonában maradnak. A hangbemenet és az átírási adatok nem kerülnek naplózásra a hangfeldolgozás során.
- Egyéni beszédfelismerési adatait és modelljeit bármikor megtekintheti és törölheti. Adatait titkosítva tároljuk.
- Az Azure infrastruktúráján alapuló Speech szolgáltatás ipari szintű biztonságot, rendelkezésre állást, megfelelőséget és kezelhetőséget biztosít.
A rugalmas díjszabás biztosítja a szükséges ellenőrzést
A Speech to Text szolgáltatásnál az átírt hanganyag órái alapján, csak a tényleges használatért kell fizetnie, előzetes költésgek nélkül.
Dokumentáció és források
Az első lépések
A dokumentáció tallózása
Beszédszolgáltatás létrehozása a Microsoft Learn-kurzus alapján
Tanulmányozza kódmintáinkat
Tekintse meg a mintakódot
Tekintse meg a testreszabást ismertető segédanyagainkat
A Speech Studio használatával üzembe helyezheti és testre szabhatja a diktálási megoldását. Nincs szükség kódolásra.
A Speech to Text szolgáltatásra építő üzletek
A KPMG leegyszerűsíti a hívásátírást
A KPMG a Speech to Text használatával több ezer órányi hívás átírását és katalogizálását végzi el, és ezzel akár 80%-kal is képes csökkenti az ügyfeleknél a megfelelőségi költségeket.

A Motorola a frontvonalban dolgozókat segíti hangszolgáltatásokkal a fontos adatok elérésében
A Motorola Solutions a rendőröknek és más vészhelyzeti tevékenységet végzőknek teszi lehetővé, hogy egy hangvezérelt virtuális asszisztenssel gyorsabban érhessék el a fontos információkat.

A Universal Electronics hangvezérelt okosotthonélményeket biztosít
A Universal Electronics segíti a márkákat az otthonokban megtalálható mindennapi eszközökkel használható hangvezérelt navigációs és vezérlési funkciók biztosításában, hogy azok valóban egyedi felhasználói élményt nyújthassanak.

Hochtief dokumentumok létrehozási hibái hangparancsok használatakor
A Hochtief egy hangvezérelt virtuális asszisztenssel segíti a projektmenedzsereket abban, hogy felderítsék és dokumentálják a kivitelezési hibákat a projektjeik helyszínein.

Az NTT DATA felgyorsítja a döntések meghozatalát az értekezletek információi segítségével
Az NTT DATA valós idejű értekezletátírással elérhetővé teszi az elhangzottak adatelemzését. A Custom Speech szolgáltatás segítségével testre szabhatja a beszédfelismerési modelleket a szervezet által használt speciális kifejezések felismerése érdekében.

Az Insight elősegíti a társalgási élményeket a bankok számára
Az Insight Enterprises egy AI-alapú megoldással segíti a bankokat és fiókjaikat a digitális átállás sebességének és kényelmének elérésében. A Speech to Text feldolgozható és elemezhető adatokká alakítja az ügyfelek által elmondottakat, hogy az ügyfelek gyorsan releváns válaszokat kapjanak.

Gyakori kérdések a Diktálásról
-
A Speech szolgáltatásnak ez a funkciója pontosan és gyorsan ír át beszédet szöveggé.
-
A Cognitive Services testreszabható, előre elkészített AI-modellek gyűjteménye, amelyek felhasználhatók, hogy mesterséges intelligenciát építsen az alkalmazásokba. Több részterülete van, köztük a Speech, a Decision, a Language és a Vision. A Speech to Text a Speech szolgáltatás egyik funkciója. A Speech-hez kapcsolódó szolgáltatások közé tartozik még a Text to Speech (diktálás), a Speech Translation (tolmácsolás) és a Speaker Recognition (beszélőfelismerés). A Decision-szolgáltatásokra példa a Personalizer, amellyel személyre szabott, releváns élményeket kínálhat. Language-szolgáltatás többek között a Language Understanding (nyelv megértése), a természetes nyelvi feldolgozásra szolgáló Text Analytics, a GYIK-felületekhez használható QnA Maker és a tolmácsolásra szolgáló Translator.