Samlede taletjenester for tale til tekst, tekst til tale og taleoversettelse
Den enhetlige taletjenesten har mange former for talegjenkjenning og generering, inkludert taletranskripsjon, tekst til tale og taleoversettelse. Speech-tjenesten leverer mange former for talegjenkjenning og -generering, inkludert taletranskripsjon, tekst til tale, taleoversettelse og talergjenkjenning.
Se nærmere på prisalternativene
Legg til filtre for å tilpasse prisalternativene til dine behov.
Prices are estimates only and are not intended as actual price quotes. Actual pricing may vary depending on the type of agreement entered with Microsoft, date of purchase, and the currency exchange rate. Prices are calculated based on US dollars and converted using London closing spot rates that are captured in the two business days prior to the last business day of the previous month end. If the two business days prior to the end of the month fall on a bank holiday in major markets, the rate setting day is generally the day immediately preceding the two business days. This rate applies to all transactions during the upcoming month. Sign in to the Azure pricing calculator to see pricing based on your current program/offer with Microsoft. Contact an Azure sales specialist for more information on pricing or to request a price quote. See frequently asked questions about Azure pricing.
Myndighetene i USA er kvalifisert for å kjøpe Azure Government-tjenester fra en lisensløsningsleverandør uten forhåndskostnader, eller direkte via et forbruksbetalt nettabonnement.
Viktig – Prisen i brasilianske real er bare for referanse. Dette er ikke en internasjonal transaksjon, og den endelige prisen avhenger av vekslingskurser og inkludering av IOF-avgifter. Det blir ikke utstedt noen eNF.
Myndighetene i USA er kvalifisert for å kjøpe Azure Government-tjenester fra en lisensløsningsleverandør uten forhåndskostnader, eller direkte via et forbruksbetalt nettabonnement.
Viktig – Prisen i brasilianske real er bare for referanse. Dette er ikke en internasjonal transaksjon, og den endelige prisen avhenger av vekslingskurser og inkludering av IOF-avgifter. Det blir ikke utstedt noen eNF.
Gratis (F0)
Kategori | Funksjoner | Pris |
---|---|---|
Tale til tekst (fakturering per sekund) |
Standard | 5 timer lyd gratis per måned3 |
Tilpasset |
5 timer lyd gratis per måned3 Drifting av endepunkt: 1 modell gratis per måned1 |
|
Samtaletranskripsjon med flerkanalslyd TESTVERSJON | 5 timer lyd gratis per måned | |
Tekst til tale (fakturering per tegn) |
Nevral | 0.5 million tegn gratis per måned |
Taleoversettelse (fakturering per sekund) |
Standard | 5 timer lyd gratis per måned |
Talergjenkjenning (per transaksjonsfakturering) |
Talerverifisering2 | 10,000 gratis transaksjoner per måned |
Taleridentifisering2 | 10,000 gratis transaksjoner per måned | |
Taleprofillagring | 10,000 gratis transaksjoner per måned |
Bruksbasert betaling: betal bare for det du bruker.
Kategori | Funksjoner | Pris | |
---|---|---|---|
Tale til tekst (fakturering per sekund) |
Sanntid | Batch v3.2 API eller nyere4 |
|
Standard | $- per time | $- per time | |
Tilpasset |
$- per time Drifting av endepunkt: $- per modell per time |
$- per time Vertstjenester for endepunkt: I/A |
|
Tilpasset taleopplæring6 | $- per datatime | ||
Forbedrede tilleggsfunksjoner:
|
$- per time per funksjon | Kontinuerlig språkidentifikasjon og diarisering inkludert5 | |
Samtaletranskripsjon med flerkanalslyd TESTVERSJON | $- per time1 | I/T | |
Tekst til tale (fakturering per tegn) |
Nevral |
Sanntids- og bunkesyntese: $- per 1 M
tegn Oppretting av lang lyd: $- per 1 mill. tegn |
|
Tilpasset nevral2 |
Opplæring: $- per datatime, opptil $- per opplæring Sanntids- og bunkesyntese: $- per 1 mill. tegn Drifting av endepunkt: $- per modell per time Oppretting av lang lyd: $- per 1 mill. tegn |
||
Taleoversettelse (fakturering per sekund) |
Standard | $- per time med lyd7 | |
Talergjenkjenning (per transaksjonsfakturering) |
Talerverifisering3 | $- per 1,000 transaksjoner | |
Taleridentifisering3 | $- per 1,000 transaksjoner | ||
Taleprofillagring | $- for 1,000 stemmeprofiler (10,000 gratis stemmeprofiler per måned) |
Forpliktelsesnivåer – Azure – standard
Kategori | Funksjoner | Pris (per måned) | Overforbruk |
---|---|---|---|
Tale til tekst | Standard | $- i 2,000 timer | $- per time |
$- i 10,000 timer | $- per time | ||
$- i 50,000 timer | $- per time | ||
Tilpasset | $- i 2,000 timer | $- per time | |
$- i 10,000 timer | $- per time | ||
$- i 50,000 timer | $- per time | ||
Forbedrede tilleggsfunksjoner:2
|
$- i 2,000 timer | $- per time | |
$- i 10,000 timer | $- per time | ||
$- i 50,000 timer | $- per time | ||
Tekst til tale | Nevral1 | $- for 80 millioner tegn | $- per 1 millioner tegn |
$- for 400 millioner tegn | $- per 1 millioner tegn | ||
$- for 2,000 millioner tegn | $- per 1 millioner tegn |
1Bare sanntidssyntese. Dette inkluderer ikke lang oppretting av lyd.
2Kun tale til tekst i sanntid, tilleggsfunksjoner for kontinuerlig språkidentifisering og diarisering inkludert med satsvis tale til tekst.
Forpliktelsesnivåer – tilkoblet beholder
Kategori | Funksjoner | Pris (per måned) | Overforbruk |
---|---|---|---|
Tale til tekst2 | Standard | $- i 2,000 timer | $- per time |
$- i 10,000 timer | $- per time | ||
$- i 50,000 timer | $- per time | ||
Tilpasset | $- i 2,000 timer | $- per time | |
$- i 10,000 timer | $- per time | ||
$- i 50,000 timer | $- per time | ||
Forbedrede tilleggsfunksjoner:2
|
$- i 2,000 timer | $- per time | |
$- i 10,000 timer | $- per time | ||
$- i 50,000 timer | $- per time | ||
Tekst til tale | Nevral1 | $- for 80 millioner tegn | $- per 1 millioner tegn |
$- for 400 millioner tegn | $- per 1 millioner tegn | ||
$- for 2,000 millioner tegn | $- per 1 millioner tegn |
1Bare sanntidssyntese. Dette inkluderer ikke lang oppretting av lyd.
2Priser gjelder for tilfeller av sanntids- og bunkebruk. Det finnes ingen separate satsvise priser for beholdere.
Se dokumentasjonen for informasjon om forpliktelsesnivåer.
Forpliktelsesnivåer – frakoblet beholder
Registrer deg for å få tilgang til tale i frakoblede beholdere eller finne ut mer
Kategori | Funksjoner | Pris (per år) | Maksimal bruk (per år) | Forventet bruk (per måned) |
---|---|---|---|---|
Tale til tekst2 | Standard |
$-
$- Registrer deg for å få tilgang Finn ut mer |
120 000 timer
600 000 timer |
10 000 timer
50 000 timer |
Tilpasset |
$-
$- Registrer deg for å få tilgang Finn ut mer |
120 000 timer
600 000 timer |
10 000 timer
50 000 timer |
|
Tekst til tale | Nevral1 |
$-
$- Registrer deg for å få tilgang Finn ut mer |
4,8 milliarder tegn
24 milliarder tegn |
400 millioner tegn
2 milliarder tegn |
1Bare sanntidssyntese. Dette inkluderer ikke lang oppretting av lyd.
2Priser gjelder for tilfeller av sanntids- og bunkebruk. Det finnes ingen separate satsvise priser for beholdere.
Disse funksjonene avskrives og er bare tilgjengelige for eksisterende kunder å bruke. Kontroller detaljer og finn ut hvordan du overfører til nye funksjoner.
Forekomst | Kategori | Funksjoner | Pris |
---|---|---|---|
Gratis - Nett/beholder 1 samtidig forespørsel |
Tekst til tale | Standard | 5 million tegn gratis per måned |
Tilpasset |
5 million tegn gratis per måned Drifting av endepunkt: 1 modell gratis per måned |
||
Standard – nett/beholder 100 samtidige forespørsler for basismodell 20 samtidige forespørsler for egendefinert modell |
Tekst til tale | Standard | $- per 1 mill. tegn |
Tilpasset |
$- per 1 mill. tegn Drifting av endepunkt: $- per modell per time |
Alternativer for Azure-priser og -kjøp

Få direkte kontakt med oss
Få en gjennomgang av Azure-priser. Forstå prisingen for skyløsningen din, lær om kostnadsoptimalisering og be om et egendefinert forslag.
Snakk med en selgerSe måter å kjøpe på
Kjøp Azure-tjenester via Azure-nettstedet, en Microsoft-representant eller en Azure-partner.
Se nærmere på alternativene dineFlere ressurser
Azure AI Speech
Les mer om Azure AI Speech funksjoner og evner.
Priskalkulator
Beregn de forventede månedlige kostnadene ved å bruke en hvilken som helst kombinasjon av Azure-produkter.
Dokumentasjon
Se gjennom tekniske opplæringer, videoer og flere Azure AI Speech ressurser.
Vanlige spørsmål
-
- For Tale til tekst og taleoversettelse faktureres bruken i intervaller på ett sekund.
- For tekst-til-tale: bruk faktureres per tegn. Kontroller definisjonen av tegn i prisnotatet.
- For Tale til tekst og Tekst til tale faktureres endepunktdrifting for egendefinerte modeller per sekund per modell.
- For egendefinerte kommandoer: Faktureringen spores som forbruk av Tale til tekst, Tekst til tale og Language Understanding. Egendefinerte kommandoer introduserer ikke nye faktureringsmålere.
- Det er ingen kostnader for opplæring Tale til tekst modeller. De eneste kostnadene er endepunktdrifting per modell når den er rullet ut, og deretter kostnaden per lydtime for Egendefinert tale til tekst.
-
Ved hjelp av taletjenesten kan brukere tilpasse grunnmodeller basert på sine egne akustikk- og språkdata, og dermed få egendefinerte talemodeller som kan brukes både i tale til tekst og taleoversettelse.
-
Språkmodellen er en sannsynlighetsfordeling over sekvenser av ord. Språkmodellen lar systemet velge mellom sekvenser av ord som høres nesten like ut, basert på sannsynligheten for selve ordsekvensene. Eksempler (på engelsk): “recognize speech” og “wreck a nice beach” høres likt ut, men fordi det er mye mer sannsynlig at det første utsagnet forekommer, vil det tildeles en høyere poengsum av språkmodellen. Hvis du forventer at talespørringer til ditt program vil inneholde bestemte ord, for eksempel produktnavn eller en sjargong som sjelden forekommer i vanlig tale, kan du sannsynligvis forbedre ytelsen ved å tilpasse språkmodellen. Hvis du for eksempel bygger en app som søker i MSDN ved hjelp av stemmen, er det sannsynlig at uttrykk som “objektorientert” eller “navneområde” eller “punktum net” forekommer oftere enn i vanlige taleprogrammer. Når språkmodellen tilpasses, kan systemet lære dette.
-
Den akustiske modellen er en klassifiserer, som merker korte lydfragmenter som ett av flere fonemer, eller lydenheter, i hvert språk. Disse fonemene kan deretter slås sammen for å danne ord. Det engelske ordet “speech” består for eksempel av fire fonemer, “s p iy ch”. Disse klassifiseringene utføres inntil 100 ganger per sekund. Hvis den akustiske modellen tilpasses, kan systemet lære å gjøre en bedre jobb med å gjenkjenne tale i atypiske miljøer. Hvis du for eksempel har en app som er laget for å brukes av arbeidere i et varehus eller en fabrikk, kan en tilpasset akustisk modell føre til at tale gjenkjennes mer presist i nærheten av den støyen man finner i disse miljøene.
-
Taletjeneste tilbyr et bredt spekter av TTS (tekst-til-tale)-stemmetyper, men egendefinert nevralstemme lar deg bygge din egendefinerte stemme som passer dine behov og ditt varemerke. Les bloggen for mer informasjon.
-
Språkgjenkjenning lar deg identifisere en veksling i talespråk og transkribere tale i henhold til det. Dette kan brukes i situasjoner der språket i lyden er ukjent, eller når taler(e) kan snakke flere språk. Identifisering av ett språk er tilgjengelig uten ekstra kostnad. Kontinuerlig språkgjenkjenning er en forbedret tilleggsfunksjon. Gå til dokumenter for å lære mer.
-
- Uttalevurdering evaluerer uttale og gir talere tilbakemelding angående nøyaktigheten og flyten av språket. Med uttalevurdering kan de som lærer et nytt språk øve, få umiddelbar tilbakemelding og forbedre uttalen, slik at de kan snakke og kommunisere med selvsikkerhet. Lærere kan bruke funksjonen til å evaluere uttalen til flere elever i sanntid. Gå til dokumenter for å finne ut mer.
- Den belastes som standard Tale til tekst, for eksempel:
Du blir belastet rundt $-
Snakk med en selger for å få en gjennomgang av Azure-prisene. Forstå prisene for skyløsningen din.
Få gratis skytjenester og $200 i kredit til å utforske Azure i 30 dager.