Startside
Azure-priser
Priser for Azure AI Tale

Priser for Azure AI Tale

Samlede taletjenester for tale-til-tekst, tekst-til-tale og taleoversættelse

De samlede taletjenester giver en bred vifte af funktioner til talegenkendelse og generering, herunder transskribering af tale, tekst til tale og taleoversættelse. Taletjenesten indeholder en lang række egenskaber til talegenkendelse og -generering, herunder taletransskription, taleoversættelse og genkendelse af den talende.

Se prismuligheder

Anvend filtre for at tilpasse prismulighederne efter dine behov.

Priserne er kun estimater og er ikke beregnet som faktiske pristilbud. De faktiske priser kan variere afhængigt af den type aftale, der er indgået med Microsoft, købsdatoen og valutakursen. Priserne beregnes ud fra den amerikanske dollar og konverteres ved hjælp af London børsens slutkurs, der registreres i løbet af de to hverdage før den sidste hverdag i den forrige måned. Hvis de to hverdage før månedens slutning falder på en banklukkedag på større markeder, angives kursen umiddelbart dagen før de to hverdage. Denne kurs gælder for alle transaktioner i løbet af den kommende måned. Log på Azure-prisberegneren for at se priser baseret på dit aktuelle program/tilbud med Microsoft. Kontakt en Azure-salgsspecialist for at få flere oplysninger om priser eller for at anmode om et pristilbud. Se ofte stillede spørgsmål om Azure-priser.

Område:

Valuta:

Amerikanske myndigheder kan købe Azure Government-tjenester hos en licensudbyder uden økonomisk forpligtelse eller direkte via et Betalt efter forbrug-onlineabonnement.

Få mere at vide

Vigtigt – Prisen i R$ er kun vejledende. Det er en international transaktion, og den endelige pris kan ændres, afhængigt af valutakurser og inkludering af IOF-afgifter. Der udstedes ikke en eNF.

Amerikanske myndigheder kan købe Azure Government-tjenester hos en licensudbyder uden økonomisk forpligtelse eller direkte via et Betalt efter forbrug-onlineabonnement.

Få mere at vide

Vigtigt – Prisen i R$ er kun vejledende. Det er en international transaktion, og den endelige pris kan ændres, afhængigt af valutakurser og inkludering af IOF-afgifter. Der udstedes ikke en eNF.

Gratis (F0)

Se dokumentationen for at få oplysninger om kvotaer, grænser og instruktioner om, hvordan du øger samtidige anmodninger.

¹Ubrugte modeller tages automatisk ud af drift efter 7 dage.

²Speaker Recognition er en funktion med begrænset adgang, hvor du skal ansøge om adgang.

³Gratis lydtimer for tale til tekst deles mellem standard og brugerdefineret. Batch understøttes ikke.
Kategori	Funktioner	Pris
Tale til tekst (fakturering pr. sekund)	Standard	5 gratis lydtimer pr. måned³
	Brugerdefineret	5 gratis lydtimer pr. måned³ Slutpunktshosting: 1 gratis model pr. måned¹
	Lyd via flere kanaler til samtaletransskription ^{PRØVEVERSION}	5 gratis lydtimer pr. måned
Tekst-til-tale (fakturering pr. tegn)	Neural	0.5 million gratis tegn pr. måned
Taleoversættelse (fakturering pr. sekund)	Standard	5 gratis lydtimer pr. måned
Speaker Recognition (fakturering pr. transaktion)	Verificering af den talende²	10,000 gratis transaktioner pr. måned
	Identifikation af den talende²	10,000 gratis transaktioner pr. måned
	Voice Profile Storage	10,000 gratis transaktioner pr. måned

Pay As You Go: Betal kun for det, du bruger.

Se dokumentationen for at få oplysninger om kvotaer, grænser og instruktioner om, hvordan du øger samtidige anmodninger.

Tale til tekst-timer måles som de timer med lyd, der sendes til tjenesten, faktureret i sekundintervaller.

¹Hvis du vil drage fordel af denne nye pris for Batch Transskription, skal du bruge Tale til tekst REST API V3.2 eller nyere versioner. Se Tale til tekst-REST API for at få flere oplysninger.

²Dette afspejler prisfastsættelsen for den offentlige prøveversion.

³Denne pris inkluderer 1 lydinput og -output, op til 2 tekstoversættelsessprog ved hjælp af standard- eller brugerdefinerede Tale til tekst og standardoversættelse. Hvis du vil have brugerdefineret oversættelse eller mere end 3 oversættelsessprog, skal du se siden med priser på Azure AI Translator Text Translation.

⁴OpenAI-tekst til tale-stemmer er tilgængelig via to modelvarianter: Neural og NeuralHD. Få mere at vide her.

⁵Custom Speech-træning gælder, når du tilpasser en grundmodel, der er udgivet den 1. oktober 2023 eller derefter.

⁶Personal Voice er en begrænset adgangsfunktion, der er begrænset til visse forhåndsgodkendte use cases, der kun er, med behov for at ansøge om adgang. Du kan få mere at vide om tjenesten ved kontrollere dokumentet.

⁷Speaker Recognition er en funktion med begrænset adgang, hvor du skal ansøge om adgang.

⁸Tekst-til-tale: Forbrug af talesyntese faktureres pr. tegn. Avatar faktureres pr. sekund. Træning og modelhosting faktureres pr. sekund.

⁹Hvis du vil bruge Hurtig transskription, skal du bruge Tale til tekst-REST API 2024-05-15-forhåndsvisning eller nyere versioner. Se Tale til tekst-REST API for at få flere oplysninger.
Kategori	Pris
Tale til tekst (fakturering pr. sekund)	Standard	Transskription i realtid: $- pr. time Hurtig transskription: $- pr. time⁹ Batchtransskription: $- pr. time¹
	Brugerdefineret	Transskription i realtid: $- pr. time Batchtransskription: $- pr. time¹ Slutpunktshosting: $- pr. model pr. time Brugerdefineret træning i Tale⁵: $- pr. beregningstime
	Forbedrede funktioner til tilføjelsesprogrammer: Kontinuerlig sprogidentifikation Diarization Vurdering af udtale (prosodi, grammatik, ordforråd, emne)	Realtid: $- pr. time pr. funktion Batch (fortløbende sprogidentifikation, dagbogsføring): Inkluderet i standard/brugerdefineret (uden ekstra omkostninger)
	Lyd via flere kanaler til samtaletransskription ^{PRØVEVERSION}	$- pr. time²
Taleoversættelse (fakturering pr. sekund)	Taleoversættelse i realtid	$- pr. lydtime³
Taleoversættelse (fakturering pr. sekund)	Videooversættelse^{Prøveversion}	Batch: $- videominut pr. output Redigering af indhold: $- videominut pr. output Personlig stemme: $- videominut pr. output
Tekst-til-tale⁸	Standardstemme	Neural: $- pr. 1 mio. tegn Neural HD⁴: $- pr. 1 mio. tegn
	Custom Voice	Professionel stemme: Syntese: $- pr. 1 mio. tegn Oplæring af stemmemodel: $- pr. beregningstime, op til $- pr. træning Slutpunktshosting: $- pr. model pr. time
	Custom Voice	Personlig stemme⁶: Syntese: $- pr. 1 mio. tegn Stemmeoprettelse: gratis Stemmeprofillager: $- pr. 1.000 stemmeprofiler pr. måned
	Forbedret funktion til tilføjelsesprogram: Avatar	Standard: $- pr. minut
	Forbedret funktion til tilføjelsesprogram: Avatar	Brugerdefineret: Syntese i realtid: $- pr. minut Batchsyntese: $- pr. minut Slutpunktshosting: $- pr. model pr. måned
Speaker Recognition (fakturering pr. transaktion)	Verificering af den talende⁷	$- pr. 1,000 transaktioner
	Identifikation af den talende⁷	$- pr. 1,000 transaktioner
	Voice Profile Storage	$- pr. 1,000 stemmeprofiler (10,000 stemmeprofiler pr. måned)

Bindingsniveauer – Azure – Standard

Kategori	Funktioner	Pris (pr. måned)	Overforbrug
Tale til tekst	Standard	$- i 2,000 timer	$- pr. time
		$- i 10,000 timer	$- pr. time
		$- i 50,000 timer	$- pr. time
	Brugerdefineret	$- i 2,000 timer	$- pr. time
		$- i 10,000 timer	$- pr. time
		$- i 50,000 timer	$- pr. time
	Forbedrede funktioner til tilføjelsesprogrammer:² Kontinuerlig sprogidentifikation Diarization Vurdering af udtale (prosodi, grammatik, ordforråd, emne)	$- i 2,000 timer	$- pr. time
		$- i 10,000 timer	$- pr. time
		$- i 50,000 timer	$- pr. time
Tekst-til-tale	Neural¹	$- for 80 mio. tegn	$- pr. 1 mio. tegn
		$- for 400 mio. tegn	$- pr. 1 mio. tegn
		$- for 2,000 mio. tegn	$- pr. 1 mio. tegn

¹Kun syntese i realtid. Dette inkluderer ikke lang lydoprettelse.

²Kun tale til tekst i realtid, funktioner til identifikation af fortløbende sprog og diarisering, der følger med batch tale til tekst.

Bindingsniveauer – forbundet objektbeholder

Kategori	Funktioner	Pris (pr. måned)	Overforbrug
Tale til tekst²	Standard	$- i 2,000 timer	$- pr. time
		$- i 10,000 timer	$- pr. time
		$- i 50,000 timer	$- pr. time
	Brugerdefineret	$- i 2,000 timer	$- pr. time
		$- i 10,000 timer	$- pr. time
		$- i 50,000 timer	$- pr. time
	Forbedrede funktioner til tilføjelsesprogrammer:² Sprogidentifikation Diarization	$- i 2,000 timer	$- pr. time
		$- i 10,000 timer	$- pr. time
		$- i 50,000 timer	$- pr. time
Tekst-til-tale	Neural¹	$- for 80 mio. tegn	$- pr. 1 mio. tegn
		$- for 400 mio. tegn	$- pr. 1 mio. tegn
		$- for 2,000 mio. tegn	$- pr. 1 mio. tegn

¹Kun syntese i realtid. Dette inkluderer ikke lang lydoprettelse.

²Priserne gælder for use cases i realtid og batch. Der er ingen separate batchpriser for objektbeholdere.

Se dokumentationen for at få oplysninger om bindingsniveauer.

Bindingsniveauer – ikke-forbundet objektbeholder

Tilmeld dig for at få adgang til tale i objektbeholdere uden forbindelse, eller få mere at vide

Kategori	Funktioner	Pris (pr. år)	Maks. forbrug (pr. år)	Forventet forbrug (pr. måned)
Tale til tekst²	Standard	$- $- Tilmeld dig for at få adgang Få mere at vide	120.000 timer 600.000 timer	10.000 timer 50.000 timer
	Brugerdefineret	$- $- Tilmeld dig for at få adgang Få mere at vide	120.000 timer 600.000 timer	10.000 timer 50.000 timer
	Forbedrede funktioner til tilføjelsesprogrammer: Sprogidentifikation Diarization	$- $-	120.000 timer 600.000 timer	10.000 timer 50.000 timer
Tekst-til-tale	Neural¹	$- $- Tilmeld dig for at få adgang Få mere at vide	4.8 mia. tegn 24 mia. tegn	400 mio. tegn 2 mia. tegn

¹Kun syntese i realtid. Dette inkluderer ikke lang lydoprettelse.

²Priserne gælder for use cases i realtid og batch. Der er ingen separate batchpriser for objektbeholdere.

Disse funktioner udfases og er kun tilgængelige for eksisterende kunder. Tjek oplysninger og få mere at vide om, hvordan du migrerer til nye funktioner.

Instans	Kategori	Funktioner	Pris
Gratis - Web/Container 1 samtidig anmodning	Tekst-til-tale	Standard	5 million gratis tegn pr. måned
Gratis - Web/Container 1 samtidig anmodning	Tekst-til-tale	Brugerdefineret	5 million gratis tegn pr. måned Slutpunktshosting: 1 gratis model pr. måned
Standard – Web/Objektbeholder 100 samtidige anmodninger om basismodel 20 samtidige anmodninger om brugerdefineret model	Tekst-til-tale	Standard	$- pr. 1 mio. tegn
	Tekst-til-tale	Brugerdefineret	$- pr. 1 mio. tegn Slutpunktshosting: $- pr. model pr. time

Azure-priser og købsmuligheder

Få direkte kontakt til os

Få en gennemgang af Azure-prisfastsættelse. Få en forståelse af prisfastsættelsen på din skyløsning, få mere at vide om omkostningsoptimering, og anmod om et tilpasset tilbud.

Tal med en sælger

Se flere måder at købe på

Køb Azure-tjenester via Azure-webstedet, en Microsoft-repræsentant eller en Azure-partner.

Se nærmere på dine muligheder

Flere ressourcer

Ofte stillede spørgsmål

Ofte stillede spørgsmål om priser på Azure

- For Tale til tekst og Taleoversættelse faktureres forbruget i intervaller på ét sekund.
- For Tekst-til-tale: forbrug faktureres pr. tegn. Kontrollér definitionen af tegn i bemærkningen til prisfastsættelsen.
- For hosting af brugerdefineret neural stemme: Forbrug faktureres pr. slutpunkt pr. sekund. Se detaljerne i prisnoten.
- For personligt stemmeprofillager: Forbrug faktureres pr. stemmeprofil pr. dag. Se detaljerne i prisnoten.
- For Tekst-til-tale Avatar faktureres forbruget pr. sekund.
- For Tale-til-tekst og Tekst-til-tale (herunder Avatar) faktureres slutpunktshosting for brugerdefinerede modeller pr. sekund pr. model.
Speech Service giver brugerne mulighed for at tilpasse grundlæggende modeller på baggrund af deres egne akustiske data og sprogdata. Det giver brugerdefinerede talemodeller, som kan bruges til både Tale til tekst og Taleoversættelse.
Sprogmodellen er en sandsynlighedsdistribution baseret på ordsekvenser. Sprogmodellen hjælper systemet med at fastlægge ordsekvenser, der lyder ens, på baggrund af sandsynligheden for selve ordsekvenserne. \"Genkend tale\" og \"gentænd svale\" lyder f.eks. ens, men den første hypotese er meget mere sandsynlig og vil derfor blive tildelt en meget højere score af sprogmodellen. Hvis du har en forventning om, at stemmeanmodninger til dit program indeholder særlige elementer af ordforråd, såsom produktnavne eller jargon, der er ikke opstår ofte i almindelig tale, kan du sandsynligvis opnå en forbedre ydeevne ved at tilpasse sprogmodellen. Hvis du f.eks. bygger en app til at søge MSDN med tale, er det sandsynligt, at termer såsom \"objektorienteret\" eller \"navneområde\" eller \"dot.net\" forekommer hyppigere end i almindelige stemmeprogrammer. En tilpasning af sprogmodellen gør det muligt for systemet at lære dette.
Den akustiske model er en klassificering, der markerer korte fragmenter af lyd i adskillige fonemer eller lydenheder på hvert sprog. Disse fonemer kan derefter sættes sammen og forme ord. Ordet \"tale\" indeholder f.eks. fire fonemer, \"t a l e\". Disse klassificeringer er lavet 100 gange i sekundet efter ordre. Tilpasning af den akustiske model gør det muligt for systemet bedre at lære at genkende tale i atypiske miljøer. Hvis du f.eks. har en app, der er designet til at blive brugt af en medarbejder på et lager eller en fabrik, kan en tilpasset akustisk model genkende tale i disse lydmiljøer mere præcist.
Tale-tjenesten tilbyder en lang række tekst til tale-stemmetyper (TTS), men den brugerdefinerede neurale stemme giver dig mulighed for at skabe din egen brugerdefinerede stemme, der passer til dine behov og dit brand. Læs bloggen for at få flere oplysninger.
Sprogsidentifikation giver dig mulighed for at identificere et skift i talt sprog og transskribere tale i overensstemmelse hermed. Dette kan anvendes i scenarier, hvor lydsproget er ukendt, eller når taler(e) kan tale flere sprog. Enkeltsprogsidentifikation er tilgængelig uden ekstra omkostninger. Fortløbende sprogidentifikation er en forbedret funktion til tilføjelsesprogrammer. Vis dokumenter for at få mere at vide.
- Vurdering af udtale evaluerer udtale af tale og giver talende feedback om nøjagtigheden og talefærdigheden af den indtalte lyd. Med udtalevurdering kan sprogelever øve sig, få øjeblikkelig feedback og forbedre deres udtale, så de kan tale og præsentere med ro i sindet. Undervisere kan bruge funktionen til at evaluere udtalen af flere talere i realtid. Besøg dokumenter for at få mere at vide.
- Det faktureres som standard Tale til tekst, f.eks.:
  For evaluering af 8 sekunders tale faktureres du omkring $-

Tal med en sælger, og få en gennemgang af Azure-priserne. Få en forståelse af prisen på din cloudløsning.

Anmod om et pristilbud

Få gratis cloudtjenester og en kredit på $200, så du kan udforske Azure i 30 dage.

Prøv Azure gratis

Tilføjet for at beregne. Tryk på 'v' for at få vist på beregner

Priser for Azure AI Tale

Samlede taletjenester for tale-til-tekst, tekst-til-tale og taleoversættelse

Se prismuligheder

Gratis (F0)

Pay As You Go: Betal kun for det, du bruger.

Bindingsniveauer – Azure – Standard

Bindingsniveauer – forbundet objektbeholder

Bindingsniveauer – ikke-forbundet objektbeholder

Udfaset

Azure-priser og købsmuligheder

Få direkte kontakt til os

Se flere måder at købe på

Flere ressourcer

Azure AI Tale

Prisberegner

Dokumentation

Ofte stillede spørgsmål