Bing Beszédfelismerő API

Hanganyagot alakíthat át szöveggé, szándékfelismerést végezhet, valamint a természetes válaszhoz szöveget alakíthat át beszéddé

Beszédfelismerés

Hanganyagot alakíthat át szöveggé. Az API-t utasítani lehet arra, hogy bekapcsolás után képes legyen felismerni a mikrofonból származó valós idejű hangot, másik audioforrásból származó valós idejű hangot, vagy fájlból származó hanganyagot. A valós idejű stream bármikor rendelkezésre áll, így amikor a hangot a kiszolgálóra küldik, azzal egyidejűleg a rendszer már részleges felismerési eredményeket is ad.

A Szöveg-hang transzformációs API segítségével olyan intelligens alkalmazásokat fejleszthet, amelyek indítása hanggal történik. A működés megtekintéséhez válassza ki a célnyelvet, majd kattintson a mikrofonra, és kezdjen el beszélni. Vagy egyszerűen kattintson valamelyik beszédmintára, és megismerheti, hogyan működik a beszédfelismerés. A demó használatával beleegyezik abba, hogy a rendszer elküldje a hangbeviteli adatokat a Microsoftnak a szolgáltatás fejlesztése céljából

Nézze meg működés közben

Ha szeretné kipróbálni a demót a saját hangjával és egy mikrofonnal, váltson olyan böngészőre, amely támogatja a WebRTC-t – ilyen böngésző például a Microsoft Edge, a Firefox vagy a Chrome legújabb verziója.

Azzal, hogy adatokat tölt fel a demóba, beleegyezik, hogy a Microsoft tárolja azokat, és felhasználja a Microsoft-szolgáltatások javításához, például ennek az API-nak a továbbfejlesztéséhez. Személyes adatainak védelmében igyekszünk megszüntetni az adatok azonosíthatóságát és biztonságba helyezni őket. Adatait nem tesszük közzé és nem bocsátjuk mások rendelkezésére.

Szeretné ezt elkészíteni?

Szöveg-hang transzformáció

A szöveg beszédhanggá alakítható. Amikor az alkalmazásoknak „beszélniük kell” a felhasználókhoz, az API használatával lejátszható hanggá lehet alakítani az alkalmazás által generált szöveget.

A Szöveg-hang transzformációs API használatával olyan intelligens alkalmazásokat fejleszthet, amelyek képesek megszólalni. Akár most is tesztelheti: egyszerűen válassza ki a célnyelvet, adja meg a mondatokat, majd kattintson a Lejátszás gombra, és ismerje meg a beszédszintézis működését. A demó használatával beleegyezik abba, hogy a rendszer elküldje a hangbeviteli adatokat a Microsoftnak a szolgáltatás fejlesztése céljából.

Nézze meg működés közben
500 karakter maradt

Azzal, hogy adatokat tölt fel a demóba, beleegyezik, hogy a Microsoft tárolja azokat, és felhasználja a Microsoft-szolgáltatások javításához, például ennek az API-nak a továbbfejlesztéséhez. Személyes adatainak védelmében igyekszünk megszüntetni az adatok azonosíthatóságát és biztonságba helyezni őket. Adatait nem tesszük közzé és nem bocsátjuk mások rendelkezésére.

Szeretné ezt elkészíteni?

Ismerje meg a Cognitive Services egyéb API-jait

Számítógépes látástechnológiai API

Hasznos információkhoz juthat a képekből

Content Moderator

Automatizált kép-, szöveg- és videomoderálás

Video API ELŐZETES VERZIÓ

Intelligens videófeldolgozás

Video Indexer ELŐZETES VERZIÓ

Tárja fel a videókban rejlő információkat

Arcfelismerő API

Arcok felismerése, elemzése, rendszerezése és megjelölése képeken

Érzelemfelismerési API ELŐZETES VERZIÓ

Testreszabott, érzelemfelismerésre alkalmas felhasználói környezetek kialakítása

Custom Vision Service ELŐZETES VERZIÓ

Könnyedén testre szabhatja a saját legkorszerűbb számítógépes látástechnológiai modelljeit az egyedi használati esetekhez.

Intelligens hangfelismerési szolgáltatás ELŐZETES VERZIÓ

Megtaníthatja alkalmazásait a felhasználói parancsok értelmezésére.

Bing Helyesírás-ellenőrzési API

Helyesírási hibák észlelése és javítása az alkalmazásokban

Webes nyelvi modell API ELŐZETES VERZIÓ

Használja ki a webes méretű adatokon tanított prediktív nyelvi modellek hatékonyságát

Szövegelemzési API ELŐZETES VERZIÓ

Érzelmek és témakörök egyszerű kiértékelése a felhasználók szándékainak megértésére

Szövegfordító API

Gépi fordítás egy egyszerű REST API-hívással

Nyelvi elemzési API ELŐZETES VERZIÓ

A Nyelvi elemzési API használatával egyszerűsítheti a bonyolult nyelvi szerkezeteket és szövegelemzést is végezhet.

Translator Speech API

Valós idejű beszédfordítás egy egyszerű REST API-hívással

Bing Beszédfelismerő API

A felhasználó szándékának megértése a beszéd írott szöveggé alakításával – és fordítva

Hangfelismerő API ELŐZETES VERZIÓ

Beszéd használata az egyes beszélők azonosításához és hitelesítéséhez

Custom Speech Service ELŐZETES VERZIÓ

A beszédfelismerést akadályozó tényezők, például a különféle beszédstílusok, a háttérzaj vagy a szókincs kiküszöbölése

Ajánlatok API ELŐZETES VERZIÓ

Az ügyfelek által igényelt cikkek előrejelzése és ajánlása

Knowledge Exploration Service ELŐZETES VERZIÓ

Strukturált adatokon természetes nyelvi bemenetekkel végezhet interaktív kereséseket

Entitáskapcsolási intelligens szolgáltatás API ELŐZETES VERZIÓ

Tegye hatékonyabbá alkalmazása adatkapcsolatait elnevezett entitásfelismeréssel és -egyértelműsítéssel.

Academic Knowledge API ELŐZETES VERZIÓ

Használja ki a Microsoft Academic Graph gazdag tudományos tartalmát

QnA Maker API ELŐZETES VERZIÓ

Az információkból közérthető, könnyen átlátható válaszokat nyerhet ki.

Custom Decision Service ELŐZETES VERZIÓ

Felhőalapú, környezetfüggő döntéshozó API, amely a tapasztalatok felhasználásával egyre pontosabbá válik

Project Prague

Gesture based controls

Project Nanjing

Isochrones calculations

Project Johannesburg

Route logistics

Project Cuzco

Event associated with Wikipedia entries

Project Abu Dhabi

Distance matrix

Project Wollongong

Location insights

Szeretné magasabb szintre kapcsolni alkalmazását?