Navigáció kihagyása

Speech to Text

A Speech szolgáltatás funkciója, amely pontosan írja át szöveggé a beszédet

Műveletindítás beszédhang alapján

Gyors és pontos átiratok készíthetők hanganyagokról több mint 85 nyelven és nyelvváltozaton. Az adott tartományra jellemző terminológia pontosabb átírása érdekében a modellek testre szabhatók. Az átírt beszédből további értékes információkat is kinyerhet keresések és elemzés futtatásával, vagy feltételes műveletindítással – mindezt választott programozási nyelvén.

Kiváló minőségű átiratok

Pontos diktálásátiratok a legkorszerűbb beszédfelismerési szolgáltatás révén.

Testreszabható modellek

Az alapszókincshez egyedi szavakat is hozzáadhat, de létrehozhat saját diktálási modelleket is.

Rugalmas üzembe helyezés

A Beszédfelismerést bárhol futtathatja – a felhőben és a peremhálózati tárolókban egyaránt.

Üzemkész állapotban

Ugyanazt a robusztus technológiát veheti igénybe, amelyet a Microsoft-termékekben megszokott beszédfelismerés is használ.

Próbálja ki a diktálást ezzel a JavaScript SDK-t használó demóalkalmazással

Ha szeretné kipróbálni a demót a saját hangjával és egy mikrofonnal, váltson olyan böngészőre, amely támogatja a WebRTC-t – ilyen böngésző például a Microsoft Edge, a Firefox vagy a Chrome legújabb verziója.

A rendszer nem tárolja a beszédfelismerési adatokat

Pontos átirat számos különböző beszédforrás esetében

Számos különböző forrásból származó hangot szöveggé konvertálhat, használhat például mikrofonokat, hangfájlokat és blobtárolót is. A beszélők elkülönítése funkcióval meghatározhatja ki mikor mit mondott. Olvasható átiratok automatikus formázással és írásjelekkel.

A beszédfelismerési modellek igény szerint testre szabhatók

A beszédfelismerési modellek testre szabhatók, hogy felismerjék a vállalat tevékenységére és az iparágra jellemző terminológiát. Kiküszöbölheti az olyan beszédfelismerést akadályozó tényezőket mint a háttérzaj, a különféle akcentusok, és az egyedi szóhasználat. Hangadatok és átiratok feltöltésével testre szabhatja a modelleket. Office 365-adatok használatával automatikusan létrehozhat egyéni modelleket, és optimalizálhatja a vállalat a beszédfelismerési képességeinek pontosságát.

Bárhol üzembe helyezhető

A beszédfelismerést bárhol futtathatja, ahol az adatai vannak. A tárolókkal robusztus felhőalapú képességekre és helyszínre optimalizálható beszédalapú alkalmazások készíthetők.

Átfogó adatvédelem és biztonság

  • Az Azure Cognitive Services részét képező Speech Service a SOC, a FedRAMP, a PCI DSS, a HIPAA, a HITECH és az ISOtanúsítványaival rendelkezik.
  • Adatai az Ön tulajdonában maradnak. A hangbemenet és az átírási adatok nem kerülnek naplózásra a hangfeldolgozás során.
  • Egyéni beszédfelismerési adatait és modelljeit bármikor megtekintheti és törölheti. Adatait titkosítva tároljuk.
  • Az Azure infrastruktúráján alapuló Speech szolgáltatás ipari szintű biztonságot, rendelkezésre állást, megfelelőséget és kezelhetőséget biztosít.

A rugalmas díjszabás biztosítja a szükséges ellenőrzést

A Speech to Text szolgáltatásnál az átírt hanganyag órái alapján, csak a tényleges használatért kell fizetnie, előzetes költésgek nélkül.

Dokumentáció és források

Az első lépések

A dokumentáció tallózása

Beszédszolgáltatás létrehozása a Microsoft Learn-kurzus alapján

Tanulmányozza kódmintáinkat

Tekintse meg a mintakódot

Tekintse meg a testreszabást ismertető segédanyagainkat

Diktálási megoldás testreszabása a Speech Studióval. Nem kell programkódot írnia.

A Speech to Text szolgáltatásra építő üzletek

A KPMG egyszerűsíti a hívások átírását

A KPMG a Speech to Text használatával több ezer órányi hívás átírását és katalogizálását végzi el, és ezzel akár 80%-kal is képes csökkenti az ügyfeleknél a megfelelőségi költségeket.

KPMG

A Motorola a frontvonalban dolgozókat segíti hangszolgáltatásokkal a fontos adatok elérésében

A Motorola Solutions a rendőröknek és más vészhelyzeti tevékenységet végzőknek teszi lehetővé, hogy egy hangvezérelt virtuális asszisztenssel gyorsabban érhessék el a fontos információkat.

Motorola Solutions

A Universal Electronics hangvezérelt okosotthonélményeket biztosít

A Universal Electronics segíti a márkákat az otthonokban megtalálható mindennapi eszközökkel használható hangvezérelt navigációs és vezérlési funkciók biztosításában, hogy azok valóban egyedi felhasználói élményt nyújthassanak.

Universal Electronics

A Hochtief hang használatával dokumentálja a kivitelezési hibákat

A Hochtief egy hangvezérelt virtuális asszisztenssel segíti a projektmenedzsereket abban, hogy felderítsék és dokumentálják a kivitelezési hibákat a projektjeik helyszínein.

Cheetah Mobile

Az NTT DATA felgyorsítja a döntések meghozatalát az értekezletek információi segítségével

Az NTT DATA valós idejű értekezletátírással elérhetővé teszi az elhangzottak adatelemzését. A Custom Speech szolgáltatás segítségével testre szabhatja a beszédfelismerési modelleket a szervezet által használt speciális kifejezések felismerése érdekében.

NTTDATA

Az Insight elősegíti a társalgási élményeket a bankok számára

Az Insight Enterprises egy AI-alapú megoldással segíti a bankokat és fiókjaikat a digitális átállás sebességének és kényelmének elérésében. A Speech to Text feldolgozható és elemezhető adatokká alakítja az ügyfelek által elmondottakat, hogy az ügyfelek gyorsan releváns válaszokat kapjanak.

Insight Enterprise, Inc.

Gyakori kérdések a Diktálásról

  • A Speech szolgáltatásnak ez a funkciója pontosan és gyorsan ír át beszédet szöveggé.
  • A Cognitive Services testreszabható, előre elkészített AI-modellek gyűjteménye, amelyek felhasználhatók, hogy mesterséges intelligenciát építsen az alkalmazásokba. Több részterülete van, köztük a Speech, a Decision, a Language és a Vision. A Speech to Text a Speech szolgáltatás egyik funkciója. A Speech-hez kapcsolódó szolgáltatások közé tartozik még a Text to Speech (diktálás), a Speech Translation (tolmácsolás) és a Speaker Recognition (beszélőfelismerés). A Decision-szolgáltatásokra példa a Personalizer, amellyel személyre szabott, releváns élményeket kínálhat. Language-szolgáltatás többek között a Language Understanding (nyelv megértése), a természetes nyelvi feldolgozásra szolgáló Text Analytics, a GYIK-felületekhez használható QnA Maker és a tolmácsolásra szolgáló Translator.

Ismerkedés a Speech szolgáltatással