Speech Services

Konvertér lyd til tekst, udfør taleoversættelse og tekst til tale med Speech Services

Tale til tekst – konverterer talt lyd til tekst for intuitiv interaktion

Føj nemt egenskaber for tale til tekst til dine programmer til scenarier såsom stemmekommandoer, samtaletransskription og analyse af callcenterlogge.

Tilpas dine talegenkendelsesmodeller, så de tager højde for brugernes talestil, udtryk eller særlige ordforråd. Du kan også tage højde for baggrundsstøj, dialekter og stemmemønstre.

Få mere at vide
Tale til tekst

Tekst til tale – giv dine apps en naturlig stemme

Byg smarte apps og tjenester, som taler med brugerne naturligt med tjenesten Tekst til tale. Konvertér tekst til lyd næsten i realtid, tilpas for at ændre talehastigheden, tonefaldet, stemmestyrken og andet.

Giv din app en stemme, som bliver kendetegnet for din app, ved hjælp af brugerdefinerede stemmemodeller. Du skal blot optage og overføre træningsdata, så opretter tjenesten en unik stemmetype, der er afpasset efter din optagelse.

Få mere at vide
Tekst-til-tale

Taleoversættelse

Giv din app funktionalitet til at håndtere taleoversættelse i realtid på et hvilket som helst af de understøttede sprog, og modtag oversættelserne som enten tekst eller tale. Taleoversættelsesmodellerne er baseret på førende teknologier inden for talegenkendelse og neural maskinoversættelse. De er optimeret til at forstå den måde, folk taler på, og returnere oversættelser af meget høj kvalitet.

Få mere at vide
Taleoversættelse

Virksomhedsscenarier baseret på Speech Services

Transskriber nemt alle opkald, og optimer resultaterne via batchtransskription og brugerdefinerede taletjenester, der er forbedret til scenarier med callcentre. Indeksér opkaldstransskriptioner for at kunne foretage fuldtekstsøgning, eller anvend tekstanalyse for at registrere synspunkter, sprog og vigtige udtryk for at få indsigt.

Få mere at vide
Speech Services til virksomheder
"We are impressed with the initial transcription accuracy of Custom Speech and Speaker Recognition. We are now working to optimise for a live environment which would be breakthrough for British Telecom Sport versus the current manual process."

Kevin Blyth, British Telecom Research and Innovation

Lær mere om API''erne til Cognitive Services

Computer Vision

Udtræk oplysninger fra billeder, der kan handles ud fra

Ansigt

Registrer, identificer, analysér, organiser og tag ansigter i fotos

Ink Recognizer

En AI-tjeneste, der genkender digitalt håndskrevet indhold, f.eks. håndskrift, figurer og dokumentlayout

Video Indexer

Få adgang til Video Insights

Custom Vision

Du kan nemt tilpasse dine egne avancerede Computer Vision-modeller til den pågældende use case

Form Recognizer

Den AI-drevne tjeneste til udtrækning af dokumenter, der forstår dine formularer

Tekstanalyse

Evaluer nemt synspunkter og emner for at forstå, hvad brugerne vil have

Oversætter

Gennemfør let tekstoversættelse vha. et enkelt REST API-opkald

QnA Maker

Udtræk oplysninger til samtaleagtige spørgsmål, som er nemme at navigere rundt i

Language Understanding

Lær dine apps at forstå brugernes kommandoer

Forenklet læser

Gør brugere i alle aldre og med forskellige færdigheder i stand til at læse og forstå tekst

Speech Services

Samlede taletjenester for tale-til-tekst, tekst-til-tale og taleoversættelse

Speaker Recognition

En taletjenestefunktion, der verificerer og identificerer de talende

Taleoversættelse

Integrer nemt taleoversættelse i realtid i din app

Tale til tekst

En taletjenestefunktion, som nøjagtigt konverterer talt lyd til tekst

Tekst-til-tale

En taletjenestefunktion, der konverterer tekst til naturtro tale

Content Moderator

Automatiseret redigering af billede, tekst og video

Afvigelsesregistrering

Føj let egenskaber for afvigelsesregistrering til dine apps.

Personalizer

En AI-tjeneste, der giver brugeren en personligt tilpasset oplevelse

Er du klar til at optimere din app?