Speech to Text

A Speech szolgáltatás funkciója, amely pontosan konvertálja szöveggé a hangos beszédet

Műveletindítás beszédhang alapján

Gyors és pontos átiratok készíthetők hanganyagokról több mint 85 nyelven és nyelvváltozaton. Az adott tartományra jellemző terminológia pontosabb átírása érdekében a modellek testre szabhatók. Az átírt beszédből további értékes információkat is kinyerhet keresések és elemzés futtatásával, vagy feltételes műveletindítással – mindezt választott programozási nyelvén.

Kiváló minőségű átiratok

Pontos átiratok a legkorszerűbb beszédfelismerési szolgáltatás révén.

Testreszabható modellek

Az alapszókincshez egyedi szavakat is hozzáadhat, de létrehozhatja a saját modelljeit is.

Rugalmas üzembe helyezés

A Beszédfelismerést bárhol futtathatja – a felhőben és a peremhálózati tárolókban egyaránt.

Üzemkész szolgáltatás

Ugyanazt a robusztus technológiát veheti igénybe, amelyet a Microsoft-termékekben megszokott beszédfelismerés is használ.

Próbálja ki a diktálást ezzel a JavaScript SDK-t használó demóalkalmazással

Ha szeretné kipróbálni a demót a saját hangjával és egy mikrofonnal, váltson olyan böngészőre, amely támogatja a WebRTC-t – ilyen böngésző például a Microsoft Edge, a Firefox vagy a Chrome legújabb verziója.

A rendszer nem tárolja a beszédfelismerési adatokat

Pontos átirat számos különböző beszédforrás esetében

Számos különböző forrásból származó hangot szöveggé konvertálhat, használhat például mikrofonokat, hangfájlokat és blobtárolót is. A beszélők elkülönítése funkcióval meghatározhatja ki mikor mit mondott. Olvasható átiratok automatikus formázással és írásjelekkel.

A beszédfelismerési modellek igény szerint testre szabhatók

A beszédfelismerési modellek testre szabhatók, hogy felismerjék a vállalat tevékenységére és az iparágra jellemző terminológiát. Kiküszöbölheti az olyan beszédfelismerést akadályozó tényezőket mint a háttérzaj, a különféle akcentusok, és az egyedi szóhasználat. Hangadatok és átiratok feltöltésével testre szabhatja a modelleket. Office 365-adatok használatával automatikusan létrehozhat egyéni modelleket, és optimalizálhatja a vállalat a beszédfelismerési képességeinek pontosságát.

A felhőtől a peremhálózatokig bárhol üzembe helyezhető

A beszédfelismerést bárhol futtathatja, ahol az adatai vannak. A tárolókkal és az előzetes verzióban elérhető nyelvfelismerési funkcióval robusztus felhőalapú képességekre és peremhálózatokra egyaránt optimalizálható beszédalapú alkalmazások készíthetők. A Speech tárolói támogatják a szabványos és az egyéni beszédet is.

Átfogó adatvédelem és biztonság

  • Az Azure Cognitive Services részét képező Speech Service a SOC, a FedRAMP, a PCI DSS, a HIPAA, a HITECH és az ISOtanúsítványaival rendelkezik.
  • Adatai az Ön tulajdonában maradnak. A hangbemenet és az átírási adatok nem kerülnek naplózásra a hangfeldolgozás során.
  • Egyéni beszédfelismerési adatait és modelljeit bármikor megtekintheti és törölheti. Adatait titkosítva tároljuk.
  • Az Azure infrastruktúráján alapuló Speech Service ipari szintű biztonságot, rendelkezésre állást, megfelelőséget és kezelhetőséget biztosít.

A rugalmas díjszabás biztosítja a szükséges hatékonyságot és ellenőrzést

Fizessen csak a tényleges használatért előzetes költség nélkül. A Beszédfelismerés szolgáltatásnál az átírt hanganyag órái alapján, csak a tényleges használatért kell fizetnie.

Dokumentáció és források

Az első lépések

Olvassa el dokumentációt

Végezze el a Microsoft Learn-tanfolyamot

Tanulmányozza kódmintáinkat

Tekintse meg a mintakódot

Tekintse meg a testreszabást ismertető segédanyagainkat

Beszédfelismerési megoldása a Speech Studio használatával testreszabható. Nincs szükség kódírásra.

A Speech to Text használatával készült

A KPMG egyszerűsíti a hívások átírását

A KPMG a Speech to Text használatával több ezer órányi hívás átírását és katalogizálását végzi el, és ezzel akár 80%-kal is képes csökkenti az ügyfeleknél a megfelelőségi költségeket.

KPMG

A Motorola a frontvonalban dolgozókat segíti hangszolgáltatásokkal a fontos adatok elérésében

A Motorola Solutions a rendőröknek és más vészhelyzeti tevékenységet végzőknek teszi lehetővé, hogy egy hangvezérelt virtuális asszisztenssel gyorsabban érhessék el a fontos információkat.

Motorola Solutions

A Universal Electronics hangvezérelt okosotthonélményeket biztosít

A Universal Electronics segíti a márkákat az otthonokban megtalálható mindennapi eszközökkel használható hangvezérelt navigációs és vezérlési funkciók biztosításában, hogy azok valóban egyedi felhasználói élményt nyújthassanak.

Universal Electronics

A Hochtief hang használatával dokumentálja a kivitelezési hibákat

A Hochtief egy hangvezérelt virtuális asszisztenssel segíti a projektmenedzsereket abban, hogy felderítsék és dokumentálják a kivitelezési hibákat a projektjeik helyszínein.

Cheetah Mobile

Az NTT DATA felgyorsítja a döntések meghozatalát az értekezletek információi segítségével

Az NTT DATA valós idejű értekezletátírással elérhetővé teszi az elhangzottak adatelemzését. A Custom Speech szolgáltatás segítségével testre szabhatja a beszédfelismerési modelleket a szervezet által használt speciális kifejezések felismerése érdekében.

NTTDATA

Az Insight elősegíti a társalgási élményeket a bankok számára

Az Insight Enterprises egy AI-alapú megoldással segíti a bankokat és fiókjaikat a digitális átállás sebességének és kényelmének elérésében. A Speech to Text feldolgozható és elemezhető adatokká alakítja az ügyfelek által elmondottakat, hogy az ügyfelek gyorsan releváns válaszokat kapjanak.

Insight Enterprise, Inc.

Ismerkedés a Speech szolgáltatással