Navigáció kihagyása

Bing – Beszédfelismerés

Hanganyagot alakíthat át szöveggé, szándékfelismerést végezhet, valamint a természetes válaszhoz szöveget alakíthat át beszéddé

Beszédfelismerés

Hanganyagot alakíthat át szöveggé. Az API-t utasítani lehet arra, hogy bekapcsolás után képes legyen felismerni a mikrofonból származó valós idejű hangot, másik audioforrásból származó valós idejű hangot, vagy fájlból származó hanganyagot. A valós idejű stream bármikor rendelkezésre áll, így amikor a hangot a kiszolgálóra küldik, azzal egyidejűleg a rendszer már részleges felismerési eredményeket is ad.

A Szöveg-hang transzformációs API segítségével olyan intelligens alkalmazásokat fejleszthet, amelyek indítása hanggal történik. A működés megtekintéséhez válassza ki a célnyelvet, majd kattintson a mikrofonra, és kezdjen el beszélni. Vagy egyszerűen kattintson valamelyik beszédmintára, és megismerheti, hogyan működik a beszédfelismerés. A demó használatával beleegyezik abba, hogy a rendszer elküldje a hangbeviteli adatokat a Microsoftnak a szolgáltatás fejlesztése céljából

Nézze meg működés közben

Ha szeretné kipróbálni a demót a saját hangjával és egy mikrofonnal, váltson olyan böngészőre, amely támogatja a WebRTC-t – ilyen böngésző például a Microsoft Edge, a Firefox vagy a Chrome legújabb verziója.

Szeretné ezt elkészíteni?

Szöveg-hang transzformáció

A szöveg beszédhanggá alakítható. Amikor az alkalmazásoknak „beszélniük kell” a felhasználókhoz, az API használatával lejátszható hanggá lehet alakítani az alkalmazás által generált szöveget.

A Szöveg-hang transzformációs API használatával olyan intelligens alkalmazásokat fejleszthet, amelyek képesek megszólalni. Akár most is tesztelheti: egyszerűen válassza ki a célnyelvet, adja meg a mondatokat, majd kattintson a Lejátszás gombra, és ismerje meg a beszédszintézis működését. A demó használatával beleegyezik abba, hogy a rendszer elküldje a hangbeviteli adatokat a Microsoftnak a szolgáltatás fejlesztése céljából.

Nézze meg működés közben

500 karakter maradt

Szeretné ezt elkészíteni?

Ismerje meg a Cognitive Services API-kat

Számítógépes látástechnológia

Hasznos információkhoz juthat a képekből

Arcfelismerés

Arcok felismerése, azonosítása, elemzése, rendszerezése és megjelölése a képeken

Video Indexer ELŐZETES VERZIÓ

Tárja fel a videókban rejlő információkat

Content Moderator

Automatizált kép-, szöveg- és videomoderálás

Custom Vision ELŐZETES VERZIÓ

Könnyedén testre szabhatja a saját legkorszerűbb számítógépes látástechnológiai modelljeit az egyedi használati esetekhez

Szövegelemzés

Érzelmek és témakörök egyszerű kiértékelése a felhasználók szándékainak megértésére

Fordítói szöveg

Gépi fordítás egy egyszerű REST API-hívással

Bing – Helyesírás-ellenőrzés

Helyesírási hibák észlelése és javítása az alkalmazásokban

Content Moderator

Automatizált kép-, szöveg- és videomoderálás

Hangfelismerés

Megtaníthatja alkalmazásait a felhasználói parancsok értelmezésére.

Bing – Beszédfelismerés

A felhasználó szándékának megértése a beszéd írott szöveggé alakításával – és fordítva

Beszélőfelismerés ELŐZETES VERZIÓ

Beszéd használata az egyes beszélők azonosításához és ellenőrzéséhez

Fordítói beszéd

Valós idejű beszédfordítás egy egyszerű REST API-hívással

Egyéni beszéd ELŐZETES VERZIÓ

A beszédfelismerést akadályozó tényezők, például a különféle beszédstílusok, a háttérzaj vagy a szókincs kiküszöbölése

Beszédszolgáltatások ELŐZETES VERZIÓ

Egységes beszédszolgáltatások diktáláshoz, szövegfelolvasáshoz és tolmácsoláshoz

QnA Maker

Az információkból közérthető, könnyen átlátható válaszokat nyerhet ki

Szeretné magasabb szintre kapcsolni alkalmazását?