Speech to Text

Beszédet alakít írott szöveggé a természetesebb interakciókhoz

Fejlett beszédfelismerés

A Beszéd szolgáltatás részét képező Diktálással gyorsan konvertálhat hangokat írott szöveggé számos forrásból. A modellek testreszabásával gyakori beszédfelismerési, például az egyéni szókészletek, beszédstílusok és a háttérzaj által felállított korlátokat törhet át. A hangfelvételeket akadálymentesebbé teheti, ha segít valós időben követni a beszélgetéseket, illetve részt venni bennük.

Úttörő innováció

Használja ki a mély neurális hálózati modellekkel működtetett modern beszédfelismerési pontosságot.

Valós idejű részvétel

Valós időben átírhatja a hangokat, így a beszélgetések minden tagja teljes értékű résztvevő lehet.

Egyéni beszédfelismerés

A beszédfelismerést beszédstílusokhoz és tartományspecifikus terminológiához igazíthatja.

Rugalmas üzembe helyezés

A Diktálást bárhol futtathatja – a felhőben, a helyszínen, a peremhálózaton vagy tárolókban.

Úttörő beszédtechnológia

Alkalmazásait több évtizednyi úttörő kutatás eredményeképp létrejött beszédfunkciókkal fejlesztheti tovább. A Microsoft elsőként érte el az emberivel összemérhető teljesítményt a Switchboard társalgási beszédfelismerési feladatban, és továbbra is a modern beszédfelismerési kutatás élenjárója.

További információ a beszédtechnológiák fejleményeiről

Ha szeretné kipróbálni a demót a saját hangjával és egy mikrofonnal, váltson olyan böngészőre, amely támogatja a WebRTC-t – ilyen böngésző például a Microsoft Edge, a Firefox vagy a Chrome legújabb verziója.

Szeretné ezt elkészíteni?

A beszédfelismerés optimalizálása személyre szabott modellekkel

A beszédfelismerési modelljeinek testreszabásával gyakori beszédfelismerési korlátokat törhet át. A nyelvi modelleket a felhasználók beszédstílusához, akcentusaihoz, és egyéni szókészletükhöz (például helynevekhez, termékekhez vagy iparágspecifikus kifejezésekhez) igazíthatja. Az Office 365-adatokkal automatikusan létrehozhat egyéni modelleket, és cégspecifikus kifejezésekre optimalizálhatja a beszédfelismerés pontosságát.

Az Egyéni beszéd használatba vétele

Példamondatok

Alapterv

Egyéni beszéd

Szeretné ezt elkészíteni?

Elemzéseket nyerhet ki beszélgetéseiből

Valós időben írhat át több felhasználót tartalmazó beszélgetéseket, a résztvevőknek így csak a párbeszédre kell összpontosítaniuk. Azonosíthatja a beszélőket, a mondandót, és annak időpontját, majd további lépéseket tehet. Az élményt több mikrofonos eszközökre optimalizálhatja. Az átiraton engedélyezheti az elemzéseket, így további adatokat nyerhet ki a beszélgetésekből.

További információ a beszédátírás funkcióról

A felhőtől a peremhálózatokig bárhol üzembe helyezhető

A Diktálást felhőben vagy helyszínen, tárolókkal futtathatja olyan forgatókönyvek esetén, ahol kulcsfontosságú az adatbiztonság és az alacsony késés.

További információ a Beszéld tárolókban való használatáról

Nagyvállalati biztonság

  • A Microsoft több mint 1 milliárd USD-t költ évente a kiberbiztonsággal kapcsolatos kutatás-fejlesztési projektekre.

  • Több mint 3500 biztonsági szakértőnk dolgozik azon, hogy megfelelő szintű adatbiztonságot és adatvédelmet nyújthassunk Önnek.

  • Az Azure bármely más felhőszolgáltatónál több megfelelési tanúsítvánnyal rendelkezik. Tekintse meg átfogó listánkat.

Igény szerinti hatékonyság, vezérlés és testreszabás rugalmas díjszabással

Fizessen csak a tényleges használatért előzetes költség nélkül. A Diktálással az átírt hanganyag órái alapján, csak a tényleges használatért kell fizetnie.

A Diktálás díjszabása

A Diktálás használatba vétele három lépésben

Azonnali hozzáférést és 200 USD értékű kreditet kap, ha ingyenes Azure-fiókot regisztrál.
Jelentkezzen be az Azure Portalra, és adja hozzá a Beszédet.
A rövid útmutatókból és a dokumentációból megtudhatja, hogyan ágyazhatja be a Diktálást.

A Diktálás fejlesztői erőforrásai

Dokumentáció és oktatóanyagok

A Diktálás első lépései.

Tanfolyamok

A Pluralsight-kurzussal megismerkedhet a Diktálás szolgáltatással.

Használati példák

További információ a Diktálás forgatókönyveiről, például a beszélgetések és ügyfélközpontok hanganyagainak átírásáról.

Gyakori kérdések a Diktálásról

  • A Diktálás által támogatott nyelvek teljes listája a dokumentációban tekinthető meg.
  • A Beszéd SDK-val és REST API-kkal könnyen rögzítheti egy mikrofon hangját, felolvashat egy streamből, és tárolt hangfájlokhoz férhet hozzá. A Beszéd SDK 16 bites, 16 kHz/8 kHz frekvenciájú, egycsatornás WAV/PCM hangot támogat a beszédfelismeréshez. További hangformátumok a speech-to-text REST-végponttal vagy a kötegelt átírási szolgáltatással támogathatók.

A Diktálás első lépései