Samlede taletjenester for tale-til-tekst, tekst-til-tale og taleoversættelse
De samlede taletjenester giver en bred vifte af funktioner til talegenkendelse og generering, herunder transskribering af tale, tekst til tale og taleoversættelse. Taletjenesten indeholder en lang række egenskaber til talegenkendelse og -generering, herunder taletransskription, taleoversættelse og genkendelse af den talende.
Se prismuligheder
Anvend filtre for at tilpasse prismulighederne efter dine behov.
Priserne er kun estimater og er ikke beregnet som faktiske pristilbud. De faktiske priser kan variere afhængigt af den type aftale, der er indgået med Microsoft, købsdatoen og valutakursen. Priserne beregnes ud fra den amerikanske dollar og konverteres ved hjælp af London børsens slutkurs, der registreres i løbet af de to hverdage før den sidste hverdag i den forrige måned. Hvis de to hverdage før månedens slutning falder på en banklukkedag på større markeder, angives kursen umiddelbart dagen før de to hverdage. Denne kurs gælder for alle transaktioner i løbet af den kommende måned. Log på Azure-prisberegneren for at se priser baseret på dit aktuelle program/tilbud med Microsoft. Kontakt en Azure-salgsspecialist for at få flere oplysninger om priser eller for at anmode om et pristilbud. Se ofte stillede spørgsmål om Azure-priser.
Amerikanske myndigheder kan købe Azure Government-tjenester hos en licensudbyder uden økonomisk forpligtelse eller direkte via et Betalt efter forbrug-onlineabonnement.
Vigtigt – Prisen i R$ er kun vejledende. Det er en international transaktion, og den endelige pris kan ændres, afhængigt af valutakurser og inkludering af IOF-afgifter. Der udstedes ikke en eNF.
Amerikanske myndigheder kan købe Azure Government-tjenester hos en licensudbyder uden økonomisk forpligtelse eller direkte via et Betalt efter forbrug-onlineabonnement.
Vigtigt – Prisen i R$ er kun vejledende. Det er en international transaktion, og den endelige pris kan ændres, afhængigt af valutakurser og inkludering af IOF-afgifter. Der udstedes ikke en eNF.
Gratis (F0)
Kategori | Funktioner | Pris |
---|---|---|
Tale til tekst (fakturering pr. sekund) |
Standard | 5 gratis lydtimer pr. måned3 |
Brugerdefineret |
5 gratis lydtimer pr. måned3 Slutpunktshosting: 1 gratis model pr. måned1 |
|
Lyd via flere kanaler til samtaletransskription PRØVEVERSION | 5 gratis lydtimer pr. måned | |
Tekst-til-tale (fakturering pr. tegn) |
Neural | 0.5 million gratis tegn pr. måned |
Taleoversættelse (fakturering pr. sekund) |
Standard | 5 gratis lydtimer pr. måned |
Speaker Recognition (fakturering pr. transaktion) |
Verificering af den talende2 | 10,000 gratis transaktioner pr. måned |
Identifikation af den talende2 | 10,000 gratis transaktioner pr. måned | |
Voice Profile Storage | 10,000 gratis transaktioner pr. måned |
Pay As You Go: Betal kun for det, du bruger.
Kategori | Pris | |
---|---|---|
Tale til tekst (fakturering pr. sekund) |
Standard |
Transskription i realtid: $- pr. time Hurtig transskription: $- pr. time9 Batchtransskription: $- pr. time1 |
Brugerdefineret |
Transskription i realtid: $- pr. time Batchtransskription: $- pr. time1 Slutpunktshosting: $- pr. model pr. time Brugerdefineret træning i Tale5: $- pr. beregningstime |
|
Forbedrede funktioner til tilføjelsesprogrammer:
|
Realtid: $- pr. time pr. funktion Batch (fortløbende sprogidentifikation, dagbogsføring): Inkluderet i standard/brugerdefineret (uden ekstra omkostninger) |
|
Lyd via flere kanaler til samtaletransskription PRØVEVERSION | $- pr. time2 | |
Taleoversættelse (fakturering pr. sekund) |
Taleoversættelse i realtid | $- pr. lydtime3 |
VideooversættelsePrøveversion |
Batch: $- videominut pr. output Redigering af indhold: $- videominut pr. output Personlig stemme: $- videominut pr. output |
|
Tekst-til-tale8 | Standardstemme |
Neural: $- pr. 1 mio. tegn Neural HD4: $- pr. 1 mio. tegn |
Custom Voice |
Professionel stemme:
Syntese: $- pr. 1 mio. tegn
Oplæring af stemmemodel: $- pr. beregningstime, op til $- pr. træning Slutpunktshosting: $- pr. model pr. time |
|
Personlig stemme6:
Syntese: $- pr. 1 mio. tegn
Stemmeoprettelse: gratis Stemmeprofillager: $- pr. 1.000 stemmeprofiler pr. måned |
||
Forbedret funktion til tilføjelsesprogram: Avatar | Standard: $- pr. minut | |
Brugerdefineret:
Syntese i realtid: $- pr. minut
Batchsyntese: $- pr. minut Slutpunktshosting: $- pr. model pr. måned |
||
Speaker Recognition (fakturering pr. transaktion) |
Verificering af den talende7 | $- pr. 1,000 transaktioner |
Identifikation af den talende7 | $- pr. 1,000 transaktioner | |
Voice Profile Storage | $- pr. 1,000 stemmeprofiler (10,000 stemmeprofiler pr. måned) |
Bindingsniveauer – Azure – Standard
Kategori | Funktioner | Pris (pr. måned) | Overforbrug |
---|---|---|---|
Tale til tekst | Standard | $- i 2,000 timer | $- pr. time |
$- i 10,000 timer | $- pr. time | ||
$- i 50,000 timer | $- pr. time | ||
Brugerdefineret | $- i 2,000 timer | $- pr. time | |
$- i 10,000 timer | $- pr. time | ||
$- i 50,000 timer | $- pr. time | ||
Forbedrede funktioner til tilføjelsesprogrammer:2
|
$- i 2,000 timer | $- pr. time | |
$- i 10,000 timer | $- pr. time | ||
$- i 50,000 timer | $- pr. time | ||
Tekst-til-tale | Neural1 | $- for 80 mio. tegn | $- pr. 1 mio. tegn |
$- for 400 mio. tegn | $- pr. 1 mio. tegn | ||
$- for 2,000 mio. tegn | $- pr. 1 mio. tegn |
1Kun syntese i realtid. Dette inkluderer ikke lang lydoprettelse.
2Kun tale til tekst i realtid, funktioner til identifikation af fortløbende sprog og diarisering, der følger med batch tale til tekst.
Bindingsniveauer – forbundet objektbeholder
Kategori | Funktioner | Pris (pr. måned) | Overforbrug |
---|---|---|---|
Tale til tekst2 | Standard | $- i 2,000 timer | $- pr. time |
$- i 10,000 timer | $- pr. time | ||
$- i 50,000 timer | $- pr. time | ||
Brugerdefineret | $- i 2,000 timer | $- pr. time | |
$- i 10,000 timer | $- pr. time | ||
$- i 50,000 timer | $- pr. time | ||
Forbedrede funktioner til tilføjelsesprogrammer:2
|
$- i 2,000 timer | $- pr. time | |
$- i 10,000 timer | $- pr. time | ||
$- i 50,000 timer | $- pr. time | ||
Tekst-til-tale | Neural1 | $- for 80 mio. tegn | $- pr. 1 mio. tegn |
$- for 400 mio. tegn | $- pr. 1 mio. tegn | ||
$- for 2,000 mio. tegn | $- pr. 1 mio. tegn |
1Kun syntese i realtid. Dette inkluderer ikke lang lydoprettelse.
2Priserne gælder for use cases i realtid og batch. Der er ingen separate batchpriser for objektbeholdere.
Se dokumentationen for at få oplysninger om bindingsniveauer.
Bindingsniveauer – ikke-forbundet objektbeholder
Tilmeld dig for at få adgang til tale i objektbeholdere uden forbindelse, eller få mere at vide
Kategori | Funktioner | Pris (pr. år) | Maks. forbrug (pr. år) | Forventet forbrug (pr. måned) |
---|---|---|---|---|
Tale til tekst2 | Standard |
$-
$- Tilmeld dig for at få adgang Få mere at vide |
120.000 timer
600.000 timer |
10.000 timer
50.000 timer |
Brugerdefineret |
$-
$- Tilmeld dig for at få adgang Få mere at vide |
120.000 timer
600.000 timer |
10.000 timer
50.000 timer |
|
Forbedrede funktioner til tilføjelsesprogrammer:
|
$-
$- |
120.000 timer
600.000 timer |
10.000 timer
50.000 timer |
|
Tekst-til-tale | Neural1 |
$-
$- Tilmeld dig for at få adgang Få mere at vide |
4.8 mia. tegn
24 mia. tegn |
400 mio. tegn
2 mia. tegn |
1Kun syntese i realtid. Dette inkluderer ikke lang lydoprettelse.
2Priserne gælder for use cases i realtid og batch. Der er ingen separate batchpriser for objektbeholdere.
Disse funktioner udfases og er kun tilgængelige for eksisterende kunder. Tjek oplysninger og få mere at vide om, hvordan du migrerer til nye funktioner.
Instans | Kategori | Funktioner | Pris |
---|---|---|---|
Gratis - Web/Container 1 samtidig anmodning |
Tekst-til-tale | Standard | 5 million gratis tegn pr. måned |
Brugerdefineret |
5 million gratis tegn pr. måned Slutpunktshosting: 1 gratis model pr. måned |
||
Standard – Web/Objektbeholder 100 samtidige anmodninger om basismodel 20 samtidige anmodninger om brugerdefineret model |
Tekst-til-tale | Standard | $- pr. 1 mio. tegn |
Brugerdefineret |
$- pr. 1 mio. tegn Slutpunktshosting: $- pr. model pr. time |
Azure-priser og købsmuligheder
Få direkte kontakt til os
Få en gennemgang af Azure-prisfastsættelse. Få en forståelse af prisfastsættelsen på din skyløsning, få mere at vide om omkostningsoptimering, og anmod om et tilpasset tilbud.
Tal med en sælgerSe flere måder at købe på
Køb Azure-tjenester via Azure-webstedet, en Microsoft-repræsentant eller en Azure-partner.
Se nærmere på dine mulighederFlere ressourcer
Azure AI Tale
Få mere at vide om funktioner og egenskaber i forbindelse med Azure AI Tale.
Prisberegner
Anslå dine forventede månedlige omkostninger ved hjælp af en hvilken som helst kombination af Azure-produkter.
Dokumentation
Se tekniske vejledninger, videoer og andet Azure AI Tale-materiale.
Ofte stillede spørgsmål
-
- For Tale til tekst og Taleoversættelse faktureres forbruget i intervaller på ét sekund.
- For Tekst-til-tale: forbrug faktureres pr. tegn. Kontrollér definitionen af tegn i bemærkningen til prisfastsættelsen.
- For hosting af brugerdefineret neural stemme: Forbrug faktureres pr. slutpunkt pr. sekund. Se detaljerne i prisnoten.
- For personligt stemmeprofillager: Forbrug faktureres pr. stemmeprofil pr. dag. Se detaljerne i prisnoten.
- For Tekst-til-tale Avatar faktureres forbruget pr. sekund.
- For Tale-til-tekst og Tekst-til-tale (herunder Avatar) faktureres slutpunktshosting for brugerdefinerede modeller pr. sekund pr. model.
-
Speech Service giver brugerne mulighed for at tilpasse grundlæggende modeller på baggrund af deres egne akustiske data og sprogdata. Det giver brugerdefinerede talemodeller, som kan bruges til både Tale til tekst og Taleoversættelse.
-
Sprogmodellen er en sandsynlighedsdistribution baseret på ordsekvenser. Sprogmodellen hjælper systemet med at fastlægge ordsekvenser, der lyder ens, på baggrund af sandsynligheden for selve ordsekvenserne. \"Genkend tale\" og \"gentænd svale\" lyder f.eks. ens, men den første hypotese er meget mere sandsynlig og vil derfor blive tildelt en meget højere score af sprogmodellen. Hvis du har en forventning om, at stemmeanmodninger til dit program indeholder særlige elementer af ordforråd, såsom produktnavne eller jargon, der er ikke opstår ofte i almindelig tale, kan du sandsynligvis opnå en forbedre ydeevne ved at tilpasse sprogmodellen. Hvis du f.eks. bygger en app til at søge MSDN med tale, er det sandsynligt, at termer såsom \"objektorienteret\" eller \"navneområde\" eller \"dot.net\" forekommer hyppigere end i almindelige stemmeprogrammer. En tilpasning af sprogmodellen gør det muligt for systemet at lære dette.
-
Den akustiske model er en klassificering, der markerer korte fragmenter af lyd i adskillige fonemer eller lydenheder på hvert sprog. Disse fonemer kan derefter sættes sammen og forme ord. Ordet \"tale\" indeholder f.eks. fire fonemer, \"t a l e\". Disse klassificeringer er lavet 100 gange i sekundet efter ordre. Tilpasning af den akustiske model gør det muligt for systemet bedre at lære at genkende tale i atypiske miljøer. Hvis du f.eks. har en app, der er designet til at blive brugt af en medarbejder på et lager eller en fabrik, kan en tilpasset akustisk model genkende tale i disse lydmiljøer mere præcist.
-
Tale-tjenesten tilbyder en lang række tekst til tale-stemmetyper (TTS), men den brugerdefinerede neurale stemme giver dig mulighed for at skabe din egen brugerdefinerede stemme, der passer til dine behov og dit brand. Læs bloggen for at få flere oplysninger.
-
Sprogsidentifikation giver dig mulighed for at identificere et skift i talt sprog og transskribere tale i overensstemmelse hermed. Dette kan anvendes i scenarier, hvor lydsproget er ukendt, eller når taler(e) kan tale flere sprog. Enkeltsprogsidentifikation er tilgængelig uden ekstra omkostninger. Fortløbende sprogidentifikation er en forbedret funktion til tilføjelsesprogrammer. Vis dokumenter for at få mere at vide.
-
- Vurdering af udtale evaluerer udtale af tale og giver talende feedback om nøjagtigheden og talefærdigheden af den indtalte lyd. Med udtalevurdering kan sprogelever øve sig, få øjeblikkelig feedback og forbedre deres udtale, så de kan tale og præsentere med ro i sindet. Undervisere kan bruge funktionen til at evaluere udtalen af flere talere i realtid. Besøg dokumenter for at få mere at vide.
- Det faktureres som standard Tale til tekst, f.eks.:
For evaluering af 8 sekunders tale faktureres du omkring $-
Tal med en sælger, og få en gennemgang af Azure-priserne. Få en forståelse af prisen på din cloudløsning.
Få gratis cloudtjenester og en kredit på $200, så du kan udforske Azure i 30 dage.