Speech to Text

A Speech szolgáltatás funkciója, amely pontosan konvertálja szöveggé a hangos beszédet

Műveletindítás beszédhang alapján

Gyors és pontos beszédfelismerés több mint 30 nyelven. Az adott tartományra jellemző terminológia pontosabb átírása érdekében a modellek testre szabhatók. Az átírt beszédből további értékes információkat is kinyerhet keresések és elemzés futtatásával, vagy feltételes műveletindítással – mindezt választott programozási nyelvén.

Kiváló minőségű átiratok

Pontos átiratok a legkorszerűbb beszédfelismerési szolgáltatás révén.

Testreszabható modellek

Az alapszókincshez egyedi szavakat is hozzáadhat, de létrehozhatja a saját modelljeit is.

Rugalmas üzembe helyezés

A Beszédfelismerést bárhol futtathatja – a felhőben és a peremhálózati tárolókban egyaránt.

Üzemkész szolgáltatás

Ugyanazt a robusztus technológiát veheti igénybe, amelyet a Microsoft-termékekben megszokott beszédfelismerés is használ.

Próbálja ki a diktálást ezzel a JavaScript SDK-t használó demóalkalmazással

Ha szeretné kipróbálni a demót a saját hangjával és egy mikrofonnal, váltson olyan böngészőre, amely támogatja a WebRTC-t – ilyen böngésző például a Microsoft Edge, a Firefox vagy a Chrome legújabb verziója.

A rendszer nem tárolja a beszédfelismerési adatokat

Pontos átirat számos különböző beszédforrás esetében

Számos különböző forrásból származó hangot szöveggé konvertálhat, használhat például mikrofonokat, hangfájlokat és blobtárolót is. A beszélők elkülönítése funkcióval meghatározhatja ki mikor mit mondott. Olvasható átiratok automatikus formázással és írásjelekkel.

A beszédfelismerési modellek igény szerint testre szabhatók

A beszédfelismerési modellek testre szabhatók, hogy felismerjék a vállalat tevékenységére és az iparágra jellemző terminológiát. Kiküszöbölheti az olyan beszédfelismerést akadályozó tényezőket mint a háttérzaj, a különféle akcentusok, és az egyedi szóhasználat. Hangadatok és átiratok feltöltésével testre szabhatja a modelleket. Office 365-adatok használatával automatikusan létrehozhat egyéni modelleket, és optimalizálhatja a vállalat a beszédfelismerési képességeinek pontosságát.

A felhőtől a peremhálózatokig bárhol üzembe helyezhető

A beszédfelismerést bárhol futtathatja, ahol az adatai vannak. Az előzetes verzióban elérhető tárolók használatával olyan beszéd alapú alkalmazásokat készíthet, amelyek robusztus felhőalapú képességek és peremhálózatok használatára egyaránt optimalizálva vannak. A Speech tárolói támogatják a szabványos és az egyéni beszédet is.

Átfogó adatvédelem és biztonság

  • Az Azure Cognitive Services részét képező Speech Service a SOC, a FedRAMP, a PCI DSS, a HIPAA, a HITECH és az ISOtanúsítványaival rendelkezik.
  • Adatai az Ön tulajdonában maradnak. A hangbemenet és az átírási adatok nem kerülnek naplózásra a hangfeldolgozás során.
  • Egyéni beszédfelismerési adatait és modelljeit bármikor megtekintheti és törölheti. Adatait titkosítva tároljuk.
  • Az Azure infrastruktúráján alapuló Speech Service ipari szintű biztonságot, rendelkezésre állást, megfelelőséget és kezelhetőséget biztosít.

A rugalmas díjszabás biztosítja a szükséges hatékonyságot és ellenőrzést

Fizessen csak a tényleges használatért előzetes költség nélkül. A Beszédfelismerés szolgáltatásnál az átírt hanganyag órái alapján, csak a tényleges használatért kell fizetnie.

Dokumentáció és források

Tanulmányozza kódmintáinkat

Tekintse meg a testreszabást ismertető segédanyagainkat

Beszédfelismerési megoldása a Speech Studio használatával testreszabható. Nincs szükség kódírásra.

KPMG

A KPMG a beszédfelismerés testre szabhatóságának kiaknázásával leegyszerűsítette a beérkező hívások átírásának és fordításának folyamatát, és 90%-os vagy még magasabb átírási pontosságot ért el.

Ismerkedés a Speech szolgáltatással