Samengevoegde spraakservices voor spraak-naar-tekst, tekst-naar-spraak en spraakomzetting
De samengevoegde spraakservices bieden een groot aantal spraakherkennings- en generatiemogelijkheden zoals spraaktranscriptie, tekst naar spraak en spraakomzetting. De spraakservice biedt een groot aantal spraakherkennings- en generatiemogelijkheden zoals spraaktranscriptie, tekst naar spraak, spraakomzetting en sprekerherkenning.
Prijsopties verkennen
Pas filters toe om de prijsopties aan te passen aan uw behoeften.
De prijzen zijn slechts schattingen en zijn niet bedoeld als werkelijke prijsopgaven. De werkelijke prijzen kunnen variëren afhankelijk van het type overeenkomst dat is afgesloten met Microsoft, de aankoopdatum en de valutakoers. De prijzen worden berekend op basis van Amerikaanse dollars en worden geconverteerd op basis van de slotspot-tarieven in Londen die zijn vastgelegd in de twee werkdagen voor de laatste werkdag van de vorige maand. Als de twee werkdagen voor het einde van de maand vallen op een feestdag in de voornaamste markten, is de dag direct voorafgaande aan de twee werkdagen de dag van de tariefvaststelling. Dit tarief is van toepassing op alle transacties gedurende de aankomende maand. Meld u zich aan bij de Azure-prijscalculator voor prijzen op basis van uw huidige programma/aanbieding bij Microsoft. Neemt u contact op met een Azure-verkoopspecialist voor meer informatie over prijzen of om een prijsopgave aan te vragen. Zie veelgestelde vragen over Azure-prijzen.
Amerikaanse overheidsinstanties komen in aanmerking om Azure Government-services van een LSP aan te schaffen zonder betaling vooraf of rechtstreeks met een onlineabonnement met betalen per gebruik.
Belangrijk: De prijs in R$ geldt slechts als referentie; dit is een internationale transactie en de uiteindelijke prijs is onderhevig aan wisselkoersverschillen en de toepassing van IOF-belastingen. Er wordt geen eNF uitgegeven.
Amerikaanse overheidsinstanties komen in aanmerking om Azure Government-services van een LSP aan te schaffen zonder betaling vooraf of rechtstreeks met een onlineabonnement met betalen per gebruik.
Belangrijk: De prijs in R$ geldt slechts als referentie; dit is een internationale transactie en de uiteindelijke prijs is onderhevig aan wisselkoersverschillen en de toepassing van IOF-belastingen. Er wordt geen eNF uitgegeven.
Gratis (F0)
Categorie | Functies | Prijs |
---|---|---|
Spraak-naar-tekst (facturering per seconde) |
Standard | 5 audio-uur gratis per maand3 |
Aangepast |
5 audio-uur gratis per maand3 Hosting van eindpunt: 1 model gratis per maand1 |
|
Gesprektranscriptie - meerkanaals geluid PREVIEW | 5 audio-uur gratis per maand | |
Tekst-naar-spraak (facturering per teken) |
Neuraal | 0.5 million tekens gratis per maand |
Spraakomzetting (facturering per seconde) |
Standard | 5 audio-uur gratis per maand |
Sprekerherkenning (per transactiefacturering) |
Sprekerverificatie2 | 10,000 gratis transacties per maand |
Sprekeridentificatie2 | 10,000 gratis transacties per maand | |
Spraakprofielopslag | 10,000 gratis transacties per maand |
Betalen naar gebruik: betaal alleen voor wat u gebruikt.
Categorie | Prijs | |
---|---|---|
Spraak-naar-tekst (facturering per seconde) |
Standard |
Realtimetranscriptie: $- per uur Snelle transcriptie: $- per uur9 Batchtranscriptie: $- per uur1 |
Aangepast |
Realtimetranscriptie: $- per uur Batchtranscriptie: $- per uur1 Hosting van eindpunt: $- per model per uur Aangepaste spraaktraining5: $- per rekenuur |
|
Verbeterde functies voor invoegtoepassingen:
|
Realtime: $- per uur per functie Batch (continue taalidentificatie, diarisatie): Inbegrepen in Standaard/Aangepast (geen extra kosten) |
|
Gesprektranscriptie - meerkanaals geluid PREVIEW | $- per uur2 | |
Spraakomzetting (facturering per seconde) |
Realtime Speech Translation | $- per audio-uur3 |
VideovertalingPreview |
Batch: $- per uitvoervideominuut Inhoud bewerken: $- per uitvoervideominuut Persoonlijke stem: $- per uitvoervideominuut |
|
Text to Speech8 | Standaardstem |
Neural (real-time and batch): $- per 1 miljoen tekens Neural HD (real-time and batch)4: $- per 1 miljoen tekens |
Custom Voice |
Professionele stem:
Synthesis (real-time and batch): $- per 1M characters
Training van spraakmodel: $- per rekenuur tot $- per training Hosting van eindpunt: $- per model per uur |
|
Persoonlijke stem6:
Synthesis (real-time and batch): $- per 1M characters
Stem maken: gratis Opslag van spraakprofielen: $- per 1000 spraakprofielen per maand |
||
Verbeterde functies voor invoegtoepassingen: Avatar | Standard: $- per minuut | |
Aangepast:
Avatar model training: $- per rekenuur
Interactive avatar (real-time): $- per minute Avatar video (batch): $- per minute Eindpunthosting: $- per model per uur |
||
Sprekerherkenning (per transactiefacturering) |
Sprekerverificatie7 | $- per 1,000 transacties |
Sprekeridentificatie7 | $- per 1,000 transacties | |
Spraakprofielopslag | $- per 1,000 spraakprofielen (10,000 gratis spraakprofielen per maand) |
Toezeggingslagen: Azure, Standard
Categorie | Functies | Prijs (per maand) | Overschrijding |
---|---|---|---|
Speech to Text | Standard | $- voor 2,000 uur | $- per uur |
$- voor 10,000 uur | $- per uur | ||
$- voor 50,000 uur | $- per uur | ||
Aangepast | $- voor 2,000 uur | $- per uur | |
$- voor 10,000 uur | $- per uur | ||
$- voor 50,000 uur | $- per uur | ||
Verbeterde functies voor invoegtoepassingen:2
|
$- voor 2,000 uur | $- per uur | |
$- voor 10,000 uur | $- per uur | ||
$- voor 50,000 uur | $- per uur | ||
Text to Speech | Neuraal1 | $- voor 80 miljoen tekens | $- per 1 miljoen tekens |
$- voor 400 miljoen tekens | $- per 1 miljoen tekens | ||
$- voor 2,000 miljoen tekens | $- per 1 miljoen tekens |
1This includes both real-time synthesis and batch synthesis with prebuilt non-HD and non-AOAI neural voices. HD voices, AOAI voices, Custom Neural Voice and Personal Voice are not included.
2Alleen realtime spraak-naar-tekst, invoegtoepassingsfuncties voor continue taalidentificatie en diarisatie die zijn opgenomen in batchspraak naar tekst.
Toezeggingslagen : verbonden container
Categorie | Functies | Prijs (per maand) | Overschrijding |
---|---|---|---|
Speech to Text2 | Standard | $- voor 2,000 uur | $- per uur |
$- voor 10,000 uur | $- per uur | ||
$- voor 50,000 uur | $- per uur | ||
Aangepast | $- voor 2,000 uur | $- per uur | |
$- voor 10,000 uur | $- per uur | ||
$- voor 50,000 uur | $- per uur | ||
Verbeterde functies voor invoegtoepassingen:2
|
$- voor 2,000 uur | $- per uur | |
$- voor 10,000 uur | $- per uur | ||
$- voor 50,000 uur | $- per uur | ||
Text to Speech | Neuraal1 | $- voor 80 miljoen tekens | $- per 1 miljoen tekens |
$- voor 400 miljoen tekens | $- per 1 miljoen tekens | ||
$- voor 2,000 miljoen tekens | $- per 1 miljoen tekens |
1This includes real-time synthesis with prebuilt non-HD and non-AOAI neural voices. HD voices, AOAI voices, and custom voices (both professional and personal voices) are not included. Batch synthesis is not included.
2Prijzen zijn van toepassing op realtime- en batchgebruikscases. Er zijn geen afzonderlijke batchprijzen voor containers.
Raadpleeg de documentatie voor informatie over toezeggingsniveaus.
Toezeggingslagen : container is niet verbonden
Meld u aan voor toegang tot spraak in niet-verbonden containers of meer informatie
Categorie | Functies | Prijs (per jaar) | Maximaal gebruik (per jaar) | Geprojecteerd gebruik (per maand) |
---|---|---|---|---|
Speech to Text2 | Standard |
$-
$- Registreren om toegang te krijgen Meer informatie |
120.000 uur
600.000 uur |
10.000 uur
50.000 uur |
Aangepast |
$-
$- Registreren om toegang te krijgen Meer informatie |
120.000 uur
600.000 uur |
10.000 uur
50.000 uur |
|
Verbeterde functies voor invoegtoepassingen:
|
$-
$- |
120.000 uur
600.000 uur |
10.000 uur
50.000 uur |
|
Text to Speech | Neuraal1 |
$-
$- Registreren om toegang te krijgen Meer informatie |
4,8 miljard tekens
24 miljard tekens |
400 miljoen tekens
2000 miljoen tekens |
1This includes real-time synthesis with prebuilt non-HD and non-AOAI neural voices. HD voices, AOAI voices, and custom voices (both professional and personal voices) are not included. Batch synthesis is not included.
2Prijzen zijn van toepassing op realtime- en batchgebruikscases. Er zijn geen afzonderlijke batchprijzen voor containers.
Deze functies worden afgeschaft en zijn alleen beschikbaar voor bestaande klanten. Lees de details en ontdek hoe u kunt migreren naar nieuwe functies.
Exemplaar | Categorie | Functies | Prijs |
---|---|---|---|
Gratis - Web/container 1 gelijktijdige aanvraag |
Text to Speech | Standard | 5 million tekens gratis per maand |
Aangepast |
5 million tekens gratis per maand Hosting van eindpunt: 1 model gratis per maand |
||
Standaard - web/container 100 gelijktijdige aanvragen voor basismodel 20 gelijktijdige aanvragen voor aangepast model |
Text to Speech | Standard | $- per 1 miljoen tekens |
Aangepast |
$- per 1 miljoen tekens Hosting van eindpunt: $- per model per uur |
Azure-prijzen en -aankoopopties
Neem rechtstreeks contact met ons op
Bekijk een overzicht van Azure-prijzen. Krijg inzicht in prijscategorieën voor uw cloudoplossing, leer meer over kostenoptimalisatie en vraag een aangepast voorstel aan.
Praat met een verkoopspecialistAanschafmethoden bekijken
Koop Azure-services via de Azure-website, uw Microsoft-vertegenwoordiger of een Azure-partner.
Verken uw optiesAanvullende bronnen
Azure AI Spraak
Meer informatie over functies en mogelijkheden van Azure AI Spraak.
Prijscalculator
Bereken de verwachte maandelijkse kosten voor het gebruik van een willekeurige combinatie van Azure-producten.
Documentatie
Gebruik technische zelfstudies, video's en andere Azure AI Spraak-bronnen.
Veelgestelde vragen
-
- Voor Spraak-naar-tekst en Spraakomzetting wordt verbruik gefactureerd in stappen van 1 seconde.
- Voor Tekst-naar-spraak: gebruik wordt gefactureerd per teken. Controleer de definitie van 'teken' in prijsnota.
- Voor hosting van aangepaste neurale stem: gebruik wordt per eindpunt per seconde gefactureerd. Bekijk de details in de prijsnotitie.
- Voor opslag van persoonlijke spraakprofielen: het gebruik wordt per spraakprofiel per dag gefactureerd. Bekijk de details in de prijsnotitie.
- Voor Text to Speech Avatar wordt het gebruik per seconde gefactureerd.
- Voor Spraak-naar-tekst en Tekst-naar-spraak (inclusief Avatar) wordt eindpunthosting voor aangepaste modellen gefactureerd per seconde per model.
-
Met behulp van de spraakservice kunnen gebruikers basislijnmodellen aanpassen op basis van hun eigen akoestiek- en taalgegevens. Hierdoor ontstaan aangepaste spraakmodellen die voor zowel Spraak naar tekst als Spraakomzetting kunnen worden gebruikt.
-
Het taalmodel is een waarschijnlijkheidsverdeling over reeksen woorden. Het taalmodel helpt het systeem een beslissing te nemen bij reeksen woorden die (bijna) hetzelfde klinken, op basis van de waarschijnlijkheid van de woordreeksen zelf. Zo klinken 'hij drinkt water' en 'hij dringt water' bijna hetzelfde, maar omdat de eerste vorm veel vaker zal voorkomen dan de tweede, krijgt deze een hogere score in het taalmodel. Als u verwacht dat gesproken query's voor uw toepassing bepaalde items bevatten zoals productnamen of vaktermen die in gewone gesproken taal nauwelijks voorkomen, kunt u de prestaties in veel gevallen verbeteren door het taalmodel aan te passen. Als u bijvoorbeeld een app aan het bouwen bent om met gesproken opdrachten te zoeken in MSDN, komen termen als 'objectgeoriënteerd', 'naamruimte' of 'dot net' waarschijnlijk vaker voor dan in doorsnee spraaktoepassingen. Door het taalmodel aan te passen zorgt u ervoor dat het systeem dergelijke termen leert kennen.
-
Het akoestisch model is een classificatie waarbij in elke taal korte audiofragmenten worden gekwalificeerd als een van verschillende fonemen, of klankeenheden. Deze fonemen kunnen worden samengevoegd om woorden te vormen. Het woord 'spraak' bijvoorbeeld bestaat uit vijf fonemen: 's p r aa k'. Deze classificaties worden gemaakt in de orde van grootte van 100 keer per seconde. Door aanpassing van het akoestisch model kan het systeem leren om spraak beter te herkennen in atypische omgevingen. Als u bijvoorbeeld een app hebt die bedoeld is voor werknemers in een magazijn of fabriek, kan een aangepast akoestisch model spraak nauwkeuriger herkennen tussen alle andere geluiden in dergelijke omgevingen.
-
De spraakservice biedt een breed scala aan TTS-spraakstijlen (tekst-naar-spraak), maar met Aangepaste neurale stem kunt u uw eigen aangepaste stem bouwen die aansluit bij uw behoeften en uw merk. Lees het blog voor meer informatie.
-
Met taalidentificatie kunt u een overschakeling in gesproken taal identificeren en spraak dienovereenkomstig transcriberen. Dit kan worden toegepast in scenario's waarin de audiotaal onbekend is of wanneer spreker(s) meerdere talen kunnen spreken. Identificatie van één taal is gratis beschikbaar. Continue taalidentificatie is een verbeterde invoegtoepassingsfunctie. Ga naar de documentatie voor meer informatie.
-
- Uitspraakevaluatie evalueert de uitspraak van spraak en geeft sprekers feedback over de nauwkeurigheid en vlotheid van gesproken audio. Met uitspraakevaluatie kunnen taalstudenten oefenen, directe feedback krijgen en hun uitspraak verbeteren, zodat ze met vertrouwen kunnen spreken en presenteren. Docenten kunnen de mogelijkheid gebruiken om de uitspraak van meerdere sprekers in realtime te evalueren. Ga naar de documentatie voor meer informatie.
- De kosten worden in rekening gebracht als standaard Speech to Text, bijvoorbeeld:
Voor de evaluatie van 8 seconden spraak wordt er ongeveer $- in rekening gebracht
Praat met een verkoopspecialist voor een overzicht van de Azure-prijzen. Krijg inzicht in de prijzen voor uw cloudoplossing.
Maak gratis gebruik van cloudservices en $200 tegoed om Azure gedurende 30 dagen te kunnen verkennen.