Spring over navigation

Priser for Speech Services

Samlede taletjenester for tale-til-tekst, tekst-til-tale og taleoversættelse

De samlede taletjenester giver en bred vifte af funktioner til talegenkendelse og generering, herunder transskribering af tale, tekst til tale og taleoversættelse. Taletjenesten indeholder en lang række egenskaber til talegenkendelse og -generering, herunder taletransskription, taleoversættelse og genkendelse af den talende.

Se prismuligheder

Anvend filtre for at tilpasse prismulighederne efter dine behov.

Prices are estimates only and are not intended as actual price quotes. Actual pricing may vary depending on the type of agreement entered with Microsoft, date of purchase, and the currency exchange rate. Prices are calculated based on US dollars and converted using Thomson Reuters benchmark rates refreshed on the first day of each calendar month. Sign in to the Azure pricing calculator to see pricing based on your current program/offer with Microsoft. Contact an Azure sales specialist for more information on pricing or to request a price quote. See frequently asked questions about Azure pricing.

Gratis

Instans Kategori Funktioner Pris
Gratis - Web/Container
1 samtidig anmodning1
Tale til tekst Standard2 5 gratis lydtimer pr. måned
Brugerdefineret 5 gratis lydtimer pr. måned
Slutpunktshosting: 1 gratis model pr. måned 3
Lyd via flere kanaler til samtaletransskription PRØVEVERSION 4 5 gratis lydtimer pr. måned
Tekst-til-tale Standard 5 million gratis tegn pr. måned
Neural 0.5 million gratis tegn pr. måned
Brugerdefineret 5 million gratis tegn pr. måned
Slutpunktshosting: 1 gratis model pr. måned
Taleoversættelse Standard 5 gratis lydtimer pr. måned
Speaker Recognition Verificering af den talende 10,000 gratis transaktioner pr. måned
Identifikation af den talende 10,000 gratis transaktioner pr. måned
Talelagring 10,000 gratis transaktioner pr. måned

Se i dokumentationen for at få mere detaljerede oplysninger om kvoter og begrænsninger for alle prisniveauer.

1Hvis du vil øge antallet af samtidige anmodninger, skal du se instruktionerne.

2Tale til tekst inkluderer nu bedømmelse af udtale for både den gratis forekomst (f.eks. 5 gratis lydtimer pr. måned) samt standardforekomsten, der følger standardprisen på $1 pr. lydtime.

3Ubrugte modeller tages automatisk ud af drift efter 7 dage.

4Samtaletransskription via flere kanaler anbefaler en mikrofonenhed med cirkulært matrix. Du kan få flere oplysninger i Microsoft Speech Device SDK.

Betal efter forbrug

Instans Kategori Funktioner Pris
Standard – Web/Objektbeholder
100 samtidige anmodninger om basismodel
20 samtidige anmodninger om brugerdefineret model1
Tale til tekst Standard2 $- pr. lydtime
Brugerdefineret $- pr. lydtime
Slutpunktshosting: $- pr. model pr. time
Lyd via flere kanaler til samtaletransskription PRØVEVERSION 4 $- pr. lydtime 5
Tekst-til-tale Standard $- pr. 1 mio. tegn
Neural $- pr. 1 mio. tegn 6
Oprettelse af langvarig lyd: $- pr. 1 mio. tegn
Brugerdefineret $- pr. 1 mio. tegn
Slutpunktshosting: $- pr. model pr. time 8
Brugerdefineret neural 7 Træning: $- pr. beregningstime, op til $- pr. træning
Syntese i realtid: $- pr. 1 mio. tegn
Slutpunktshosting: $- pr. model pr. time
Oprettelse af langvarig lyd: $- pr. 1 mio. tegn
Taleoversættelse Standard $- pr. lydtime
Speaker Recognition Verificering af den talende $- pr. 1,000 transaktioner
Identifikation af den talende $- pr. 1,000 transaktioner
Talelagring $- pr. 1,000 stemmeprofiler (10,000 stemmeprofiler pr. måned)

Se i dokumentationen for at få mere detaljerede oplysninger om kvoter og begrænsninger for alle prisniveauer.

1Hvis du vil øge antallet af samtidige anmodninger, skal du se instruktionerne.

2Tale til tekst inkluderer nu bedømmelse af udtale for både den gratis forekomst (f.eks. 5 gratis lydtimer pr. måned) samt standardforekomsten, der følger standardprisen på $1 pr. lydtime.

3Ubrugte modeller tages automatisk ud af drift efter 7 dage.

4Samtaletransskription via flere kanaler anbefaler en mikrofonenhed med cirkulært matrix. Du kan få flere oplysninger i Microsoft Speech Device SDK.

5Dette afspejler prisfastsættelsen for den offentlige prøveversion. Priserne for den generelt tilgængelige version vil blive meddelt senere.

6Se i dokumentationen til Neural for de områder, hvor Neural tekst til tale er tilgængelig.

7Funktionaliteten Brugerdefineret neural stemme er en adgangsbegrænset funktion. Få mere at vide om processen med begrænset adgang. Kontrollér, hvor Brugerdefineret neural stemme er tilgængelig.

8Brugerdefinerede stemmer udfases den 29. februar 2024. Vi tilbyder nu et forbedret tilbud i Brugerdefineret neural stemme. Migrer til Brugerdefineret neural stemme.

Bindingsniveauer

This pricing is limited access. Apply here.

Instans Kategori Funktioner Pris (pr. måned) Overforbrug
Azure – Standard Tale til tekst Standard $- i 2,000 timer $- pr. time
$- i 10,000 timer $- pr. time
$- i 50,000 timer $- pr. time
Tekst-til-tale Neural $- for 80 mio. tegn $- pr. 1 mio. tegn
$- for 400 mio. tegn $- pr. 1 mio. tegn
$- for 2,000 mio. tegn $- pr. 1 mio. tegn
Forbundet objektbeholder – Standard Tale til tekst Standard $- i 2,000 timer $- pr. time
$- i 10,000 timer $- pr. time
$- i 50,000 timer $- pr. time
Tekst-til-tale Neural $- for 80 mio. tegn $- pr. 1 mio. tegn
$- for 400 mio. tegn $- pr. 1 mio. tegn
$- for 2,000 mio. tegn $- pr. 1 mio. tegn

Azure-priser og købsmuligheder

Få direkte kontakt til os

Få en gennemgang af Azure-priser. Få en forståelse af prisen på din cloudløsning, få mere at vide om omkostningsoptimering, og anmod om et brugerdefineret tilbud.

Tal med en sælger

Se flere måder at købe på

Køb Azure-tjenester via Azure-webstedet, en Microsoft-repræsentant eller en Azure-partner.

Se nærmere på dine muligheder

Flere ressourcer

Detaljer om Speech Services

Få mere at vide om funktioner og egenskaber i forbindelse med Speech Services.

Prisberegner

Anslå dine forventede månedlige omkostninger ved hjælp af en hvilken som helst kombination af Azure-produkter.

Dokumentation

Se tekniske vejledninger, videoer og andet Speech Services-materiale.

    • For Taleoversættelse, Tale til tekst og Tale til tekst med brugerdefineret talemodel: Forbruget faktureres i intervaller på ét sekund.
    • For Tekst-til-tale med neurale eller brugerdefinerede neurale stemmer: Forbrug faktureres pr. tegn. Kontrollér definitionen af tegn i bemærkningen til prisfastsættelsen.
    • For hosting af brugerdefineret talemodel: Forbruget faktureres pr. time. For hosting af brugerdefineret stemmetype: Forbruget faktureres dagligt.
    • For brugerdefinerede kommandoer: Fakturering spores i forhold til forbruget af Tale til tekst, Tekst til tale og Language Understanding. Brugerdefinerede kommandoer introducerer ikke nye fakturerings målinger.
    • Der er intet gebyr for oplæring af talemodeller. De eneste omkostninger er for hosting af modellen, når den er oplært og derefter omkostningerne pr. time i forbindelse med taletransskription.
  • Speech Service giver brugerne mulighed for at tilpasse grundlæggende modeller på baggrund af deres egne akustiske data og sprogdata. Det giver brugerdefinerede talemodeller, som kan bruges til både Tale til tekst og Taleoversættelse.

  • Sprogmodellen er en sandsynlighedsdistribution baseret på ordsekvenser. Sprogmodellen hjælper systemet med at fastlægge ordsekvenser, der lyder ens, på baggrund af sandsynligheden for selve ordsekvenserne. "Genkend tale" og "gentænd svale" lyder f.eks. ens, men den første hypotese er meget mere sandsynlig og vil derfor blive tildelt en meget højere score af sprogmodellen. Hvis du har en forventning om, at stemmeanmodninger til dit program indeholder særlige elementer af ordforråd, såsom produktnavne eller jargon, der er ikke opstår ofte i almindelig tale, kan du sandsynligvis opnå en forbedre ydeevne ved at tilpasse sprogmodellen. Hvis du f.eks. bygger en app til at søge MSDN med tale, er det sandsynligt, at termer såsom "objektorienteret" eller "navneområde" eller "dot.net" forekommer hyppigere end i almindelige stemmeprogrammer. En tilpasning af sprogmodellen gør det muligt for systemet at lære dette.

  • Den akustiske model er en klassificering, der markerer korte fragmenter af lyd i adskillige fonemer eller lydenheder på hvert sprog. Disse fonemer kan derefter sættes sammen og forme ord. Ordet "tale" indeholder f.eks. fire fonemer, "t a l e". Disse klassificeringer er lavet 100 gange i sekundet efter ordre. Tilpasning af den akustiske model gør det muligt for systemet bedre at lære at genkende tale i atypiske miljøer. Hvis du f.eks. har en app, der er designet til at blive brugt af en medarbejder på et lager eller en fabrik, kan en tilpasset akustisk model genkende tale i disse lydmiljøer mere præcist.

  • Tale-tjenesten tilbyder en lang række tekst til tale-stemmetyper (TTS), men den brugerdefinerede neurale stemme giver dig mulighed for at skabe din egen brugerdefinerede stemme, der passer til dine behov og dit brand. Læs bloggen for at få flere oplysninger.

  • Der er scenarier, hvor en eller flere talere kan tale flere sprog i den samme lydfil eller livepræsentation. Løbende registrering af sprog giver dig mulighed for at identificere et skift i det talte sprog og præcist transskribere talen, selv om sproget er skiftet. Denne funktion er gratis som privat prøveversion og kan tilgås via SDK'et til Tale. Besøg dokumentationen for at få mere at vide.

Tal med en sælger, og få en gennemgang af Azure-priserne. Få en forståelse af prisen på din cloudløsning.

Få gratis cloudtjenester og en kredit på $200, så du kan udforske Azure i 30 dage.

Tilføjet for at beregne. Tryk på 'v' for at få vist på beregner