Bing Beszédfelismerő API

Hanganyagot alakíthat át szöveggé, szándékfelismerést végezhet, valamint a természetes válaszhoz szöveget alakíthat át beszéddé

Beszédfelismerés

Hanganyagot alakíthat át szöveggé. Az API-t utasítani lehet arra, hogy bekapcsolás után képes legyen felismerni a mikrofonból származó valós idejű hangot, másik audioforrásból származó valós idejű hangot, vagy fájlból származó hanganyagot. A valós idejű stream bármikor rendelkezésre áll, így amikor a hangot a kiszolgálóra küldik, azzal egyidejűleg a rendszer már részleges felismerési eredményeket is ad.

A Szöveg-hang transzformációs API segítségével olyan intelligens alkalmazásokat fejleszthet, amelyek indítása hanggal történik. A működés megtekintéséhez válassza ki a célnyelvet, majd kattintson a mikrofonra, és kezdjen el beszélni. Vagy egyszerűen kattintson valamelyik beszédmintára, és megismerheti, hogyan működik a beszédfelismerés. A demó használatával beleegyezik abba, hogy a rendszer elküldje a hangbeviteli adatokat a Microsoftnak a szolgáltatás fejlesztése céljából

Nézze meg működés közben

Ha szeretné kipróbálni a demót a saját hangjával és egy mikrofonnal, váltson olyan böngészőre, amely támogatja a WebRTC-t – ilyen böngésző például a Microsoft Edge, a Firefox vagy a Chrome legújabb verziója.

Azzal, hogy adatokat tölt fel a demóba, beleegyezik, hogy a Microsoft tárolja azokat, és felhasználja a Microsoft-szolgáltatások javításához, például ennek az API-nak a továbbfejlesztéséhez. Személyes adatainak védelmében igyekszünk megszüntetni az adatok azonosíthatóságát és biztonságba helyezni őket. Adatait nem tesszük közzé és nem bocsátjuk mások rendelkezésére.

Szeretné ezt elkészíteni?

Szöveg-hang transzformáció

A szöveg beszédhanggá alakítható. Amikor az alkalmazásoknak „beszélniük kell” a felhasználókhoz, az API használatával lejátszható hanggá lehet alakítani az alkalmazás által generált szöveget.

A Szöveg-hang transzformációs API használatával olyan intelligens alkalmazásokat fejleszthet, amelyek képesek megszólalni. Akár most is tesztelheti: egyszerűen válassza ki a célnyelvet, adja meg a mondatokat, majd kattintson a Lejátszás gombra, és ismerje meg a beszédszintézis működését. A demó használatával beleegyezik abba, hogy a rendszer elküldje a hangbeviteli adatokat a Microsoftnak a szolgáltatás fejlesztése céljából.

Nézze meg működés közben

500 karakter maradt

Azzal, hogy adatokat tölt fel a demóba, beleegyezik, hogy a Microsoft tárolja azokat, és felhasználja a Microsoft-szolgáltatások javításához, például ennek az API-nak a továbbfejlesztéséhez. Személyes adatainak védelmében igyekszünk megszüntetni az adatok azonosíthatóságát és biztonságba helyezni őket. Adatait nem tesszük közzé és nem bocsátjuk mások rendelkezésére.

Szeretné ezt elkészíteni?

Ismerje meg a Cognitive Services API-kat

Számítógépes látástechnológiai API

Hasznos információkhoz juthat a képekből

Arcfelismerő API

Arcok felismerése, azonosítása, elemzése, rendszerezése és megjelölése a képeken

Content Moderator

Automatizált kép-, szöveg- és videomoderálás

Érzelemfelismerési API ELŐZETES VERZIÓ

Testreszabott, érzelemfelismerésre alkalmas felhasználói környezetek kialakítása

Custom Vision Service ELŐZETES VERZIÓ

Könnyedén testre szabhatja a saját legkorszerűbb számítógépes látástechnológiai modelljeit az egyedi használati esetekhez

Video Indexer ELŐZETES VERZIÓ

Tárja fel a videókban rejlő információkat

Language Understanding Intelligent Service (LUIS)

Megtaníthatja alkalmazásait a felhasználói parancsok értelmezésére.

Szövegelemzési API

Érzelmek és témakörök egyszerű kiértékelése a felhasználók szándékainak megértésére

Bing Helyesírás-ellenőrzési API

Helyesírási hibák észlelése és javítása az alkalmazásokban

Szövegfordító API

Gépi fordítás egy egyszerű REST API-hívással

Webes nyelvi modell API ELŐZETES VERZIÓ

Használja ki a webes méretű adatokon tanított prediktív nyelvi modellek hatékonyságát

Nyelvi elemzési API ELŐZETES VERZIÓ

A Nyelvi elemzési API használatával egyszerűsítheti a bonyolult nyelvi szerkezeteket, és szövegelemzést is végezhet

Translator Speech API

Valós idejű beszédfordítás egy egyszerű REST API-hívással

Hangfelismerő API ELŐZETES VERZIÓ

Beszéd használata az egyes beszélők azonosításához és hitelesítéséhez

Bing Beszédfelismerő API

A felhasználó szándékának megértése a beszéd írott szöveggé alakításával – és fordítva

Custom Speech Service ELŐZETES VERZIÓ

A beszédfelismerést akadályozó tényezők, például a különféle beszédstílusok, a háttérzaj vagy a szókincs kiküszöbölése

Ajánlatok API ELŐZETES VERZIÓ

Az ügyfelek által igényelt cikkek előrejelzése és ajánlása

Academic Knowledge API ELŐZETES VERZIÓ

Használja ki a Microsoft Academic Graph gazdag tudományos tartalmát

Knowledge Exploration Service ELŐZETES VERZIÓ

Strukturált adatokon természetes nyelvi bemenetekkel végezhet interaktív kereséseket

QnA Maker API ELŐZETES VERZIÓ

Az információkból közérthető, könnyen átlátható válaszokat nyerhet ki

Entitáskapcsolási intelligens szolgáltatás API ELŐZETES VERZIÓ

Tegye hatékonyabbá alkalmazása adatkapcsolatait elnevezett entitásfelismeréssel és -egyértelműsítéssel

Custom Decision Service ELŐZETES VERZIÓ

Felhőalapú, környezetfüggő döntéshozó API, amely a tapasztalatok felhasználásával egyre pontosabbá válik

Project Prague

Irányítás kézmozdulatokkal

Project Cuzco

Wikipedia-bejegyzésekhez tartozó esemény

Project Nanjing

Izokrón-számítások

Project Abu Dhabi

Távolsági mátrix

Project Johannesburg

Útvonal-logisztika

Project Wollongong

Helyinformációk

Szeretné magasabb szintre kapcsolni alkalmazását?