Prijzen voor Cognitive Services - spraakservices

Gebruik intelligente API's om beeld-, spraak- en zoekfuncties in te stellen.

De samengevoegde spraakservices bieden een groot aantal spraakherkennings- en generatiemogelijkheden zoals spraaktranscriptie, tekst naar spraak en spraakomzetting. De spraakservice biedt een groot aantal spraakherkennings- en generatiemogelijkheden zoals spraaktranscriptie, tekst naar spraak, spraakomzetting en sprekerherkenning.

Prijsinformatie

Exemplaar Categorie Functies Prijs
Gratis - Web/container
1 gelijktijdige aanvraag1
Speech to Text Standard 5 audio-uur gratis per maand
Aangepast 5 audio-uur gratis per maand
Hosting van eindpunt: 1 model gratis per maand 2
Gesprektranscriptie - meerkanaals geluid PREVIEW 3 5 audio-uur gratis per maand
Text to Speech Standard 5 million tekens gratis per maand
Neuraal 0.5 million tekens gratis per maand
Aangepast 5 million tekens gratis per maand
Hosting van eindpunt: 1 model gratis per maand
Speech Translation Standard 5 audio-uur gratis per maand
Speaker Recognition7 Sprekerverificatie 10,000 gratis transacties per maand
Sprekeridentificatie 10,000 gratis transacties per maand
Standard - Web/container
20 gelijktijdige aanvraag 1
Speech to Text Standard $- per audio-uur
Aangepast $- per audio-uur
Hosting van eindpunt: $- per model per uur
Gesprektranscriptie - meerkanaals geluid PREVIEW 3 $- per audio-uur 4
Text to Speech Standard $- per 1 miljoen tekens
Neuraal $- per 1 miljoen tekens 5
Lange audio maken: $- per 1 miljoen tekens
Aangepast $- per 1 miljoen tekens
Hosting van eindpunt: $- per model per uur
Aangepaste neurale PREVIEW 6 stem bouwen: contact opnemen
Realtime synthese: $- per 1 miljoen tekens
Hosting van eindpunt: $- per model per uur
Lange audio maken: $- per 1 miljoen tekens
Speech Translation Standard $- per audio-uur
Speaker Recognition7 Sprekerverificatie $- per 1,000 transacties
Sprekeridentificatie $- per 1,000 transacties

1Als u het aantal gelijktijdige aanvragen wilt verhogen, raadpleegt u de instructies.

2Niet-gebruikte modellen worden na zeven dagen automatisch buiten bedrijf gesteld.

3Bij Gesprekstranscriptie - meerdere kanalen wordt een cirkelvormige microfoonarray aanbevolen. Raadpleeg voor meer informatie de Microsoft Speech Device SDK.

4Hierin worden de prijzen voor de preview-versie vermeld. De prijs bij algemene beschikbaarheid wordt aangekondigd wanneer het product algemeen beschikbaar wordt.

5Bekijk de documentatie voor neurale tekst-naar-spraak voor de regio's waar neurale tekst-naar-spraak beschikbaar is.

6De functie Aangepaste neurale stem is beschikbaar als gated preview-functie. Meer informatie over het gating-proces.

7Speaker Recognition is momenteel alleen beschikbaar in US - west. Selecteer US - west als regio om de prijzen voor Speaker Recognition te bekijken.

Ondersteuning en SLA

  • Gratis ondersteuning voor facturerings- en abonnementsbeheer is inbegrepen.
  • Wij bieden de garantie dat Cognitive Services die in de standaardlaag worden uitgevoerd, minimaal 99,9% van de tijd beschikbaar zijn. Er is geen SLA voor de gratis proefversie. De SLA lezen.

Veelgestelde vragen

    • Voor de modellen Spraakomzetting, Spraak naar tekst en Spraak naar tekst met aangepaste spraak: verbruik wordt gefactureerd in stappen van 1 seconde.
    • Voor Tekst naar spraak en Tekst naar spraak met aangepaste spraakstijl: verbruik wordt gefactureerd per teken.
    • Voor Hosting aangepast spraakmodel: verbruik wordt per uur gefactureerd; voor Hosting aangepaste spraakstijl: verbruik wordt dagelijks gefactureerd.
    • Voor aangepaste opdrachten: facturering wordt getraceerd als het gebruik van spraak naar tekst, tekst naar spraak en taalbegrip. Met aangepaste opdrachten worden geen nieuwe factureringsmeters geïntroduceerd.
  • Met behulp van de spraakservice kunnen gebruikers basislijnmodellen aanpassen op basis van hun eigen akoestiek- en taalgegevens. Hierdoor ontstaan aangepaste spraakmodellen die voor zowel Spraak naar tekst als Spraakomzetting kunnen worden gebruikt.

  • Het taalmodel is een waarschijnlijkheidsverdeling over reeksen woorden. Het taalmodel helpt het systeem een beslissing te nemen bij reeksen woorden die (bijna) hetzelfde klinken, op basis van de waarschijnlijkheid van de woordreeksen zelf. Zo klinken 'hij drinkt water' en 'hij dringt water' bijna hetzelfde, maar omdat de eerste vorm veel vaker zal voorkomen dan de tweede, krijgt deze een hogere score in het taalmodel. Als u verwacht dat gesproken query's voor uw toepassing bepaalde items bevatten zoals productnamen of vaktermen die in gewone gesproken taal nauwelijks voorkomen, kunt u de prestaties in veel gevallen verbeteren door het taalmodel aan te passen. Als u bijvoorbeeld een app aan het bouwen bent om met gesproken opdrachten te zoeken in MSDN, komen termen als 'objectgeoriënteerd', 'naamruimte' of 'dot net' waarschijnlijk vaker voor dan in doorsnee spraaktoepassingen. Door het taalmodel aan te passen zorgt u ervoor dat het systeem dergelijke termen leert kennen.

  • Het akoestisch model is een classificatie waarbij in elke taal korte audiofragmenten worden gekwalificeerd als een van verschillende fonemen, of klankeenheden. Deze fonemen kunnen worden samengevoegd om woorden te vormen. Het woord 'spraak' bijvoorbeeld bestaat uit vijf fonemen: 's p r aa k'. Deze classificaties worden gemaakt in de orde van grootte van 100 keer per seconde. Door aanpassing van het akoestisch model kan het systeem leren om spraak beter te herkennen in atypische omgevingen. Als u bijvoorbeeld een app hebt die bedoeld is voor werknemers in een magazijn of fabriek, kan een aangepast akoestisch model spraak nauwkeuriger herkennen tussen alle andere geluiden in dergelijke omgevingen.

  • Microsoft Speech Services biedt meer dan 70 standaardstijlen (spraakstijlen) in meer dan 40 talen om u te helpen uw tekst naar audio om te zetten. Met de opkomst van Virtual Assistant en verschillende toepassingen met spraakmogelijkheden, willen veel bedrijven echter een unieke stem hebben die goed bij hun bedrijf past en die met zorg is ontworpen voor hun eigen merkidentiteit. Als u bijvoorbeeld een chatbot ontwikkelt voor uw klantenservice, dan kunt u hier een unieke stem voor uw merk aan koppelen zodat klanten meer betrokken zijn bij uw bedrijf. Op dezelfde wijze kan de fabrikant van autonavigatie tekst naar spraak met verschillende aangepaste stemmen inschakelen voor een betere gebruikerservaring.

    Met Voice Studio, de portal voor het bouwen van aangepaste stemmen, is dat kinderspel. Met behulp van uw eigen audiogegevens (opgenomen menselijke stem met daaraan gekoppelde scripts) kunt u een aangepaste spraakstijl genereren die vervolgens naar de Tekst naar spraak-service van Microsoft wordt geïmplementeerd. Deze spraakstijl kan eenvoudig in uw toepassingen worden ingevoegd met behulp van een API-eindpunt voor eigen gebruik.

Bronnen

Schat uw maandelijkse kosten voor Azure-services

Lees de veelgestelde vragen over Azure-prijzen

Meer informatie over Azure Cognitive Services

Gebruik technische zelfstudies, video's en andere bronnen

Toevoegen aan schatting. Druk op 'v' om weer te geven in Calculator

Leren en bouwen met $200 aan tegoed en blijven doorwerken