Hopp over navigasjon

Priser for Cognitive Services – taletjenester

Bruk intelligens-API-er til å aktivere visuelle funksjoner samt tale-, språk- og kunnskapsfunksjoner

Den enhetlige taletjenesten har mange former for talegjenkjenning og generering, inkludert taletranskripsjon, tekst til tale og taleoversettelse.

Prisdetaljer

Forekomst Samtidig forespørsel Funksjoner Pris
Gratis 1 samtidig forespørsel Taleoversettelse 5 timer gratis per måned
Tale til tekst 5 timer gratis per måned
Tale til tekst med egendefinert talemodell 5 timer gratis per måned
Driving av Speech-endepunkt1 1 modell gratis per måned
Text to Speech with Standard Voices 5M tegn gratis per måned
Tekst til tale med egendefinert stemmetype 5M tegn gratis per måned
Text to Speech with Neural Voices 0.5M characters free per month
Egendefinert stemmetypedrifting1 1 modell gratis per måned
Standard 20 samtidige forespørsler Taleoversettelse $- per time
Tale til tekst $- per time
Tale til tekst med egendefinert talemodell $- per time
Driving av Speech-endepunkt $-/modell/måned
Text to Speech with Standard Voices $- per 1M tegn
Tekst til tale med egendefinert stemmetype $- per 1M tegn
Text to Speech with Neural Voices $- per 1M tegn2
Egendefinert stemmetypedrifting $-/modell/måned
1Ubrukte modeller blir automatisk avviklet etter syv dager
2This is a public preview price for Text to Speech with Neural Voices.

Kundestøtte og tjenestenivåavtaler

  • Gratis fakturerings- og abonnementsstøtte er inkludert.
  • Vi garanterer at Cognitive Services som kjører på standardnivået, er tilgjengelig minst 99,9 prosent av tiden. Ingen tjenestenivåavtale gis for gratis prøveversjon. Les servicenivåvilkårene.

Vanlige spørsmål

Speech-tjenester

    • For taleoversettelse, tale til tekst og tale til tekst med egendefinert talemodell: bruk faktureres i trinn på ett sekund
    • For tekst til tale og tekst til tale med egendefinert stemmetype: bruk faktureres per tegn
    • For drifting av egendefinert talemodell og drifting av egendefinert stemmetype: bruk faktureres daglig
  • Ved hjelp av taletjenesten kan brukere tilpasse grunnmodeller basert på sine egne akustikk- og språkdata, og dermed få egendefinerte talemodeller som kan brukes både i tale til tekst og taleoversettelse.

  • Språkmodellen er en sannsynlighetsfordeling over sekvenser av ord. Språkmodellen lar systemet velge mellom sekvenser av ord som høres nesten like ut, basert på sannsynligheten for selve ordsekvensene. Eksempler (på engelsk): "recognize speech" og "wreck a nice beach" høres likt ut, men fordi det er mye mer sannsynlig at det første utsagnet forekommer, vil det tildeles en høyere poengsum av språkmodellen. Hvis du forventer at talespørringer til ditt program vil inneholde bestemte ord, for eksempel produktnavn eller en sjargong som sjelden forekommer i vanlig tale, kan du sannsynligvis forbedre ytelsen ved å tilpasse språkmodellen. Hvis du for eksempel bygger en app som søker i MSDN ved hjelp av stemmen, er det sannsynlig at uttrykk som "objektorientert" eller "navneområde" eller "punktum net" forekommer oftere enn i vanlige taleprogrammer. Når språkmodellen tilpasses, kan systemet lære dette.

  • Den akustiske modellen er en klassifiserer, som merker korte lydfragmenter som ett av flere fonemer, eller lydenheter, i hvert språk. Disse fonemene kan deretter slås sammen for å danne ord. Det engelske ordet "speech" består for eksempel av fire fonemer, "s p iy ch". Disse klassifiseringene utføres inntil 100 ganger per sekund. Hvis den akustiske modellen tilpasses, kan systemet lære å gjøre en bedre jobb med å gjenkjenne tale i atypiske miljøer. Hvis du for eksempel har en app som er laget for å brukes av arbeidere i et varehus eller en fabrikk, kan en tilpasset akustisk modell føre til at tale gjenkjennes mer presist i nærheten av den støyen man finner i disse miljøene.

  • Microsofts Speech-tjenester leverer over 70 standardstemmer (også kalt stemmetyper) på over 40 språk, som du kan bruke til å konvertere teksten din til lyd. Med fremveksten av den virtuelle assistenten og flere taleaktiverte programmer vil imidlertid mange selskaper ønske en unik stemme som representerer deres virksomhet, nøye tilpasset til deres egen merkeidentitet. Hvis du for eksempel utvikler en chatrobot for brukerstøttetjenesten, kan du knytte den til en unik merkevarestemme i ditt selskap for å utvikle kundetilhørighet. På samme måte kan en som utvikler programvare for bilnavigasjonssystemer, aktivere tekst til tale med forskjellige tilpassede stemmer for å berike brukeropplevelsen.

    Gjennom Voice Studio, den egendefinerte portalen for stemmebygging, er det enkelt. Med dine egne lyddata (innspilt menneskestemme med sine tilhørende skript) kan du generere en egendefinert stemmetype som deretter distribueres til Microsofts tekst til tale-tjeneste og enkelt kan kobles til dine programmer med et API-endepunkt for egen bruk.

Generelt

  • API-er for Bing-søkeforslag faktureres basert på antallet transaksjoner (også kalt API-oppkall). Dette er forbruksbetalte abonnementer som ikke blir belastet ekstrakostnader for omfattende spørringer og mer enn 10 resultater (opptil 50 resultater i de fleste tilfeller).

  • Hvis du overskrider det angitte antallet transaksjoner per sekund (TPS), blir bruken begrenset til den angitte grensen. Hvis programmet ditt behøver en høyere TPS enn den som er angitt på denne siden, kan du ta kontakt med Azure-kundestøtte.

  • For faktureringsformål, er en transaksjon en vellykket Bing API-oppkallsforespørsel (men det finnes begrensninger for DoS-angrep). For loggings- og rapporteringsformål som Bing Statistics-tilleggsprogrammet, er det alle Bing API-oppkall, enten de er vellykkede eller ikke.

  • Du kan endre tjenestenivået når som helst. Påse at du bruker de riktige nøklene i API-oppkallene. Hvis du har en foretaksavtale med Microsoft, kan du ta kontakt med kontoansvarlig for avtalen.

Ressurser

Beregn dine månedlige kostnader for Azure-tjenester

Se gjennom vanlige spørsmål om Azure-priser

Les mer om Kognitive tjenester

Se gjennom tekniske opplæringer, videoer og flere ressurser

Legg til estimat. Trykk «v» for å vise på kalkulator Vis på kalkulator

Lær hvordan du utvikler med $200 i kreditt, og fortsett gratis