Tale til tekst

Konverter raskt lyd til tekst for naturlig respons.

Cognitive Services Tale til tekst gir en rekke funksjonaliteter som du kan bygge inn i programmene dine for å støtte ulike transkripsjonsscenarioer, blant annet samtaletranskripsjon, taletranskripsjon og tilpasset taletranskripsjon.

Samtaletranskripsjon

Aktiver transkripsjon av møter ansikt til ansikt. Samtaletranskripsjon fanger opp tale i sanntid, slik at alle møtedeltakerne kan delta fullt ut i samtalen, identifisere hvem som sa hva, når, og raskt følge opp de neste trinnene.

Bruk samtaletranskripsjon til å:

  • Fang opp tale fra hele møterommet.
  • Bidra til å beskytte data med bransjeledende sikkerhets- og overholdelsessertifiseringer.
  • Støtte for møte- og konferanseoppsett som bruker mikrofoner og videokameraer, gjennom sammenkobling med SDK for taleenheter.

Se i praksis

Det oppstod en feil ved innlastingen av denne demoen, vent litt og prøv på nytt

Høyttaler Utskrift

Denne demoen er ikke kompatibel med nettleseren du bruker. Bruk en annen nettleser for å få best resultat.

Vil du bygge dette?

Taletranskripsjon

Konverter tale til tekst. Oppkall API-en for å gjenkjenne lyd som kommer fra mikrofonen, fra andre strømmende lydkilder i sanntid eller fra en innspilt lydfil. Hvis lyd sendes til serveren, sendes delvise gjenkjenningsresultater tilbake hvis forespurt.

Du kan bruke API-en for å utvikle taleutløste smarte apper. Prøv demonstrasjonen for å se hvordan det fungerer. Velger du målspråket, klikk på mikrofonen og begynn å snakke. Eller bare klikk på ett av eksemplene for talesetninger.*

Se i praksis

Hvis du vil prøve demoen med din egen stemme ved bruk av en mikrofon, må du bytte til en annen nettleser som har WebRTC-støtte, for eksempel en nyere versjon av Microsoft Edge, Firefox eller Chrome.

Vil du bygge dette?

Custom Speech Service: Taletranskripsjon med egendefinert modell

Overvinn talegjenkjenningsproblemer knyttet til talemåte, ordforråd og bakgrunnsstøy. Våre teknologier for talegjenkjenning kombinerer flere API-er for å produsere tekstresultatet. Kunder kan tilpasse API-ene etter deres behov og tilgjengelige data.

Se i praksis

Eksempelsetninger

Grunnlinje

Custom Speech

Opprett tilpassede språkmodeller som er skreddersydd for brukernes talestiler

Ikke la variasjoner i vokabular og talestiler blokkere forståelsen din. Tilpass språkmodellen til appens talegjenkjenning ved å skreddersy den til dine bransjeuttrykk, tekniske og geografiske uttrykk, og markedsuttrykk, til og med talerstil.

Tilpass deg brukermiljøet med tilpassede akustiske modeller

Sikre at appens talegjenkjenning kan fungere i alle miljøer. Med tilpassede akustikkmodeller, kan du ta hensyn til bakgrunnsstøy og matche brukernes forventede miljøer.

Bruk solide talemodeller fra Microsoft

Aktiver kraftig, tilpasset talegjenkjenning ved å utvikle dine egne tilpassede modeller for talegjenkjenning over Microsofts eksisterende banebrytende modeller.

Vil du bygge dette?

Utforsk et talescenario

Telefonsentral

Serviços de VozCom os Serviços de Voz, é fácil transcrever todas as chamadas. Indexe a transcrição para pesquisa em texto completo ou aplique a Análise de Texto para detetar o sentimento, o idioma e expressões-chave. Se as suas gravações de centro de atendimento telefónico envolverem terminologia especializada (por exemplo, nomes de produtos ou gíria informática), crie um modelo de linguagem personalizado para ensinar aos Serviços de Voz esse vocabulário. Um modelo acústico personalizado ajuda os Serviços de Voz a compreender os oradores mesmo com ruído de fundo ou ligações telefónicas fracas. Para mais informações, leia sobre como funciona a transcrição em lote com os Serviços de Voz.
  1. Oversikt
  2. Flyt

Speech-tjenester

Oversikt

Med Speech-tjenester er det enkelt å transkribere hver samtale. Indekser transkripsjonene for fulltekstsøk, eller bruk tekstanalyse til å registrere sentiment, språk og nøkkeluttrykk for innsikt. Hvis innspillingene fra telefonsenteret inneholder spesialisert terminologi, for eksempel produktnavn eller IT-språk, kan du opprette en egendefinert språkmodell slik at Speech-tjenestene lærer vokabularet. Med en egendefinert akustisk modell kan Speech-tjenestene forstå talere selv med bakgrunnsstøy eller dårlig telefonforbindelse.

Hvis du vil ha mer informasjon, kan du lese hvordan Batch-transkripsjon fungerer med Speech-tjenester.

Flyt

  1. 1 Tilpass en modell for domenet og distribuer den modellen
  2. 2 Last opp innspillingene til en blob-beholder
  3. 3 Opprett en POST-forespørsel for Batch-transkripsjon
  4. 4 Speech-tjenester planlegger transkripsjonsjobben
  5. 5 Stereofiler deles inn i to kanaler
  6. 6 Monofiler gjennomgår diarisering for å skille mellom talere
  7. 7 Last ned transkripsjonen ved hjelp av transkripsjons-ID-en

Utforsk API-ene for Cognitive Services

Visuelt innhold

Hent ut brukbar informasjon fra bilder

Ansikt

Registrer, identifiser, analyser, ordne og tagg ansikter i bilder

Ink Recognizer TESTVERSJON

En AI-tjeneste som gjenkjenner innhold i digital blekk, for eksempel håndskrift, figurer og oppsett i dokumenter

Video Indexer

Lås opp videoinnsikter

Custom Vision

Du kan enkelt tilpasse dine egne, moderne datamodeller for visuelt innhold til dine spesielle behov

Form Recognizer TESTVERSJON

Den AI-drevne dokumentuttrekkingstjenesten som forstår skjemaene dine

Tekstanalyser

Evaluer enkelt følelser og emner for å forstå hva brukerne vil ha

Translator Text

Utfør maskinoversettelse helt enkelt med en enkel REST-API-oppkalling

QnA Maker

Trekk ut informasjonen, og produser svar som er enkle å forstå og har en konversasjonslignende tone

Language Understanding

Lær appene dine å forstå kommandoer fra brukerne

Engasjerende leser TESTVERSJON

Gi brukere i alle aldre og på alle nivåer muligheten til å lese og forstå tekst

Speech-tjenester

Samlede taletjenester for tale til tekst, tekst til tale og taleoversettelse

Talergjenkjennings TESTVERSJON

Bruk tale til å identifisere og bekrefte enkelttalere

Content Moderator

Automatisert bilde, tekst og videomoderering

Avviksdetektor TESTVERSJON

Enkelt legg funksjoner for avviksdeteksjon inn i appene dine.

Personalizer TESTVERSJON

En kunstig intelligens-tjeneste som leverer en personlig tilpasset brukeropplevelse

Bruk Speech Devices SDK for å utvikle en omgivelsesenhet og opprett et tilpasset oppvåkningsord

Mer informasjon