Taltjänster

Konvertera ljud till text, utför talöversättning och text till tal med våra enhetliga taltjänster

Tal till text – konverterar talat ljud till text så att du kan interagera enklare

Lägg enkelt till realtidsfunktioner för tal-till-text i dina program för scenarier som röstkommandon, samtalstranskription och logganalyser för callcenter.

Skräddarsy modellerna för taligenkänning så att de anpassas efter användarnas sätt att tala, uttryck eller unika ordförråd. Du kan även ta hänsyn till specifika bakgrundsljud, dialekter och röstmönster.

Läs mer
Tal till text

Text till tal – ge dina appar en naturlig röst

Skapa smarta appar och tjänster som kan kommunicera naturligt med användarna via text till tal. Konvertera text till ljud praktiskt taget i realtid. Du kan även anpassa tjänsten efter talhastighet, röstläge, volym och andra faktorer.

Ge din app en unik röst som är lätt att identifiera med våra anpassade röstmodeller. Spela bara in och ladda upp träningsdata, så skapar tjänsten en unik rösttyp anpassad efter din inspelning.

Läs mer
Text till tal

Talöversättning

Bygg in funktioner för realtidsöversättning av tal på något av språken som stöds, och få antingen en text eller talöversättning tillbaka. Modellerna för talöversättning bygger på en taligenkänning i absolut framkant och tekniker för neural maskinöversättning. De är optimerade för att förstå hur människor pratar i verkligheten och att generera översättningar av utmärkt kvalitet.

Läs mer
Talöversättning

Företagsscenarier byggda på taltjänster

Transkribera enkelt alla samtal och optimera resultatet genom batchtranskription och anpassade taltjänster förbättrade för callcenter-scenarier. Indexera samtalstranskriptioner för fulltextsökning eller tillämpa textanalys för att identifiera attityd, språk och nyckelfraser för insikter.

Läs mer
Företagstaltjänster
"We are impressed with the initial transcription accuracy of Custom Speech and Speaker Recognition. We are now working to optimise for a live environment which would be breakthrough for British Telecom Sport versus the current manual process."

Kevin Blyth, British Telecom Research and Innovation

Utforska API:erna för Cognitive Services

Visuellt innehåll

Sammanfatta användbar information från bilder

Ansikte

Spåra, identifiera, analysera, organisera och tagga ansikten i foton

Handskriftsigenkänning

En AI-tjänst som identifierar digitala pennanteckningar, som handskrift, former och layouter

Video Indexer

Få tillgång till information i video

Custom Vision

Du kan enkelt anpassa egna avancerade modeller för visuellt innehåll som passar ditt unika användningsscenario

Formigenkänning

En AI-driven dokumentextraheringstjänst som känner igen dina former

Textanalys

Utvärdera enkelt sentiment och ämnen och förstå vad användare vill ha

Translator för textöversättning

Utför enkelt maskinöversättning i realtid med ett enkelt REST API-anrop

QnA Maker

Omformulera information till konversationsanpassade, navigerbara svar

Språkförståelse

Lär apparna att förstå kommandon från dina användare

Avancerad läsare

Stärk läsningen och läsförståelsen för användare i alla åldrar och med alla förmågor

Taltjänster

Unified Speech Services för tal-till-text, text-till-tal och talöversättning

Talarigenkänning

Använd tal till att identifiera och verifiera individuella talare

Talöversättning

Integrera enkelt realtidsöversättning av tal i din app

Tal till text

Konvertera talljud till text för att skapa mer naturliga interaktioner

Text till tal

Konvertera text till tal och skapa mer naturliga, användarvänliga gränssnitt

Content Moderator

Automatiserad bild-, text- och videomoderering

Avvikelseidentifiering

Lägg enkelt till funktioner för avvikelseidentifiering i dina appar.

Personanpassning

En AI-tjänst som levererar en personanpassad användarupplevelse

Är du redo att ge din app ett lyft?