Hoppa över navigering

Bing-taligenkänning

Konvertera ljud till text, förstå innehållet och konvertera tillbaka texten till tal

Taligenkänning

Konvertera talat ljud till text. API:t kan styras till att aktivera och känna igen ljud från mikrofonen i realtid, känna igen ljud från en annan ljudkälla i realtid eller känna igen ljud i en fil. I samtliga fall är strömning i realtid tillgängligt. Det innebär att när ljudet skickas till servern returneras också delvisa igenkänningsresultat.

Med API:t för tal till text kan du skapa smarta appar som styrs med rösten. Se hur det fungerar genom att välja ett målspråk och sedan klicka på mikrofonen och börja prata. Eller så kan du klicka på någon av exempelfraserna för att se hur taligenkänningen fungerar. När du ser den här demon samtycker du till att röstindata skickas till Microsoft i syfte att förbättra tjänsten

Se hur det fungerar

För att kunna prova demon med din egen röst via en mikrofon måste du byta till en annan webbläsare som stöder WebRTC, till exempel en senare version av Microsoft Edge, Firefox eller Chrome.

Vill du skapa det här?

Text till tal

Omvandla text till talat ljud. När program behöver ”tala” tillbaka till sina användare, kan denna API användas till att omvandla text som skapats av appen till ljud som kan spelas upp för användaren.

Med text till tal-API:t kan du byta smarta appar som kan prata. Du kan prova nu. Det är bara att välja ett målspråk, skriva några meningar och klicka på uppspelningsknappen för att se hur talsyntes fungerar. När du använder den här demon samtycker du till att röstindata skickas till Microsoft i syfte att förbättra tjänsten.

Se hur det fungerar

500 tecken kvar

Vill du skapa det här?

Utforska API:erna för Cognitive Services

Visuellt innehåll

Sammanfatta användbar information från bilder

Ansikte

Spåra, identifiera, analysera, organisera och tagga ansikten i foton

Video Indexer FÖRHANDSVERSION

Få tillgång till information i video

Content Moderator

Automatiserad bild-, text- och videomoderering

Custom Vision FÖRHANDSVERSION

Du kan enkelt anpassa egna avancerade modeller för visuellt innehåll som passar ditt unika användningsscenario

Textanalys

Utvärdera enkelt sentiment och ämnen och förstå vad användare vill ha

Translator för textöversättning

Utför enkelt maskinöversättning i realtid med ett enkelt REST API-anrop

Stavningskontroll i Bing

Hitta och korrigera stavfel direkt i din app

Content Moderator

Automatiserad bild-, text- och videomoderering

Språkförståelse

Lär apparna att förstå kommandon från dina användare

Bing-taligenkänning

Omvandla tal till text och tillbaka igen och förstå användaravsikten

Talarigenkänning FÖRHANDSVERSION

Använd tal till att identifiera och verifiera individuella talare

Translator för talöversättning

Utför talöversättning enkelt i realtid med ett enda REST API-anrop

Custom Speech FÖRHANDSVERSION

Komma över hinder för taligenkänning som samtalsstil, bakgrundsljus och vokabulär

Taltjänster FÖRHANDSVERSION

Unified Speech Services för tal-till-text, text-till-tal och talöversättning

QnA Maker

Omformulera information till konversationsanpassade, navigerbara svar

Är du redo att ge din app ett lyft?