Speech-tjenester

Konverter lyd til tekst, utfør taleoversettelse og tekst til tale med de samlede Speech-tjenestene

Tale til tekst – konverterer muntlig lyd til tekst for intuitiv samhandling

Legg til «tale til tekst»-funksjoner i sanntid på en enkel måte i programmene dine for scenarier som talekommando, samtaletranskripsjon og logganalyse for telefonsentre.

Talegjenkjenningsmodellene kan tilpasses brukeres måte å snakke på, uttrykk og unike ordforråd, samt ta hensyn til bakgrunnslyder, aksenter og talemønstre.

Mer informasjon
Tale til tekst

Tekst til tale – gi appene dine en naturlig stemme

Utvikle smarte apper og tjenester som snakker med brukerne på en naturlig måte med «tekst til tale»-tjenesten. Konverter tekst til lyd nærmest i sanntid, tilpass for å endre hastigheten på talen, stemmen, volumet og mer.

Gi programmet ditt en enestående, gjenkjennelig merkestemme ved hjelp av tilpassede stemmemodeller. Bare spill inn og last opp læredataene, og tjenestene vil opprette en unik stemmetype som er innstilt etter opptaket ditt.

Mer informasjon
Tekst til tale

Taleoversettelse

Gi appen din taleoversettelse-kapabiliteter på et av de støttede språkene og få en oversettelse tilbake i form av tekst eller tale. Speech-oversettelsesmodeller er basert på ledende teknologier for talegjenkjenning og nevral maskinoversettelse (NMT). De er optimalisert for å forstå måten folk faktisk snakker på, og generere oversettelser av eksepsjonell kvalitet.

Mer informasjon
Taleoversettelse

Scenarier for foretak basert på taletjenester

Transkriber enkelt hvert oppkall og optimaliser resultatene gjennom bunketranskripsjon og tilpassede taletjenester utvidet til scenarier for telefonsentre. Indekser oppkallstranskripsjoner for fulltekst-søk, eller bruk tekstanalyse til å registrere sentiment, språk og nøkkelord for innsikt.

Mer informasjon
Taletjenester for foretak
"We are impressed with the initial transcription accuracy of Custom Speech and Speaker Recognition. We are now working to optimise for a live environment which would be breakthrough for British Telecom Sport versus the current manual process."

Kevin Blyth, British Telecom Research and Innovation

Utforsk API-ene for Cognitive Services

Visuelt innhold

Hent ut brukbar informasjon fra bilder

Ansikt

Registrer, identifiser, analyser, ordne og tagg ansikter i bilder

Ink Recognizer TESTVERSJON

En AI-tjeneste som gjenkjenner innhold i digital blekk, for eksempel håndskrift, figurer og oppsett i dokumenter

Video Indexer

Lås opp videoinnsikter

Custom Vision

Du kan enkelt tilpasse dine egne, moderne datamodeller for visuelt innhold til dine spesielle behov

Form Recognizer TESTVERSJON

Den AI-drevne dokumentuttrekkingstjenesten som forstår skjemaene dine

Tekstanalyser

Evaluer enkelt følelser og emner for å forstå hva brukerne vil ha

Translator Text

Utfør maskinoversettelse helt enkelt med en enkel REST-API-oppkalling

QnA Maker

Trekk ut informasjonen, og produser svar som er enkle å forstå og har en konversasjonslignende tone

Language Understanding

Lær appene dine å forstå kommandoer fra brukerne

Engasjerende leser TESTVERSJON

Gi brukere i alle aldre og ved alle nivåer muligheten til å lese og forstå tekst

Speech-tjenester

Samlede taletjenester for tale til tekst, tekst til tale og taleoversettelse

Talergjenkjennings TESTVERSJON

Bruk tale til å identifisere og bekrefte enkelttalere

Content Moderator

Automatisert bilde, tekst og videomoderering

Avviksdetektor TESTVERSJON

Enkelt legg funksjoner for avviksdeteksjon inn i appene dine.

Personalizer TESTVERSJON

En kunstig intelligens-tjeneste som leverer en personlig tilpasset brukeropplevelse

Er du klar til å superlade appen din?