Prijsinformatie Cognitive Services - Custom Speech Service PREVIEW

Gebruik intelligente API's om beeld-, spraak-, taal- en kennisfuncties in te stellen

Met Custom Speech Service kunt u aangepaste modellen voor spraakherkenning maken en deze implementeren voor een spraak-naar-teksteindpunt dat op uw toepassing is afgestemd. Met Custom Speech Service kunt u het taalmodel van de spraakherkenning aanpassen, zodat het model het vocabulaire van uw toepassing en de spreekstijl van uw gebruikers leert kennen. U kunt ook het akoestisch model van de spraakherkenning aanpassen, zodat dit beter aansluit bij de verwachte omgeving en gebruikerspopulatie van de toepassing.

Prijsdetails

Modelaanpassing is gratis.

Gratis S1
Modelimplementaties 1 model $-/model/maand
Modelaanpassing 3 uur/maand Onbeperkt
Nauwkeurigheidstests 2 uur/maand 2 uur gratis; daarna $- per uur
Opwaarts schalen N/A $-/eenheid/maand, waarbij u met elke eenheid vijf gelijktijdige aanvragen kunt verzenden
Geen tracering N/A $-/model/maand
Prijsaanvraag 2 uur/maand 2 uur gratis; daarna $- per uur

Ondersteuning en SLA

  • Gratis ondersteuning voor facturerings- en abonnementsbeheer is inbegrepen.
  • Hebt u technische ondersteuning nodig voor preview-services? Gebruik onze forums.
  • Wij bieden de garantie dat Cognitive Services die in de standaardlaag worden uitgevoerd, minimaal 99,9% van de tijd beschikbaar zijn. Er is geen SLA voor de gratis laag. De SLA lezen.
  • Geen SLA tijdens preview-periode. Meer informatie.

Veelgestelde vragen

Custom Speech Service

  • Categorie 1 kan tot vier audioblokken (ofwel vier transcripties) tegelijk verwerken en nog steeds in real time reageren. Als de gebruiker meer dan vier audioblokken tegelijk verstuurt, wordt elk daaropvolgend audioblok geweigerd en teruggestuurd met een foutcode die aangeeft dat er te veel blokken tegelijk worden ontvangen. Hetzelfde geldt voor Categorie 2, waarvoor 12 transcripties tegelijk kunnen worden verwerkt. In de gratis versie kan slechts één transcriptie per keer worden verstuurd. Er wordt van uitgegaan dat de audio in real time wordt geüpload. Wordt audio sneller geüpload, dan wordt vanwege de gelijktijdigheid ervan uitgegaan dat de aanvraag doorgaat totdat de duur van de audio is verstreken (ook al is het mogelijk dat het herkenningsresultaat eerder wordt teruggestuurd).

    Opmerking: als er een hogere mate van gelijktijdigheid nodig is, kunt u contact met ons opnemen.

  • Het taalmodel is een waarschijnlijkheidsverdeling over reeksen woorden. Het taalmodel helpt het systeem een beslissing te nemen bij reeksen woorden die (bijna) hetzelfde klinken, op basis van de waarschijnlijkheid van de woordreeksen zelf. Zo klinken 'hij drinkt water' en 'hij dringt water' bijna hetzelfde, maar omdat de eerste vorm veel vaker zal voorkomen dan de tweede, krijgt deze een hogere score in het taalmodel. Als u verwacht dat gesproken query's voor uw toepassing bepaalde items bevatten zoals productnamen of vaktermen die in gewone gesproken taal nauwelijks voorkomen, kunt u de prestaties in veel gevallen verbeteren door het taalmodel aan te passen. Als u bijvoorbeeld een app aan het bouwen bent om met gesproken opdrachten te zoeken in MSDN, komen termen als 'objectgeoriënteerd', 'naamruimte' of 'dot net' waarschijnlijk vaker voor dan in doorsnee spraaktoepassingen. Door het taalmodel aan te passen zorgt u ervoor dat het systeem dergelijke termen leert kennen.

  • Het akoestisch model is een classificatie waarbij in elke taal korte audiofragmenten worden gekwalificeerd als een van verschillende fonemen, of klankeenheden. Deze fonemen kunnen worden samengevoegd om woorden te vormen. Het woord 'spraak' bijvoorbeeld bestaat uit vijf fonemen: 's p r aa k'. Deze classificaties worden gemaakt in de orde van grootte van 100 keer per seconde. Door aanpassing van het akoestisch model kan het systeem leren om spraak beter te herkennen in atypische omgevingen. Als u bijvoorbeeld een app hebt die bedoeld is voor werknemers in een magazijn of fabriek, kan een aangepast akoestisch model spraak nauwkeuriger herkennen tussen alle andere geluiden in dergelijke omgevingen.

  • Short Phrase-herkenning ondersteunt gesproken tekst van maximaal 15 seconden. Als in combinatie met de Speech Client-bibliotheek gegevens naar de server worden verzonden, ontvangt de client meerdere gedeeltelijke resultaten en één eindresultaat op basis van meerdere N-beste keuzen.

  • Long Dictation-herkenning ondersteunt gesproken tekst van maximaal twee minuten. Als in combinatie met de Speech Client-bibliotheek gegevens naar de server worden verzonden, ontvangt de client meerdere gedeeltelijke resultaten en meerdere eindresultaten, op basis van de positie waar de server pauzes in zinnen aangeeft.

  • Als een klant bijvoorbeeld de S1-categorie gebruikt om 1 miljoen transcripties te verwerken, betaalt hij de categorieprijs ($-), waarbij de eerste 100,000 transcripties in rekening worden gebracht voor $- per 1,000 transcripties en de resterende 900,000 transcripties voor $- per 1,000 transcripties. Dat betekent dat de klant $- + 100,000 * ($- / 1,000) + 900,000 * ($- / 1,000) = $4500 in rekening wordt gebracht.

  • Raadpleeg de informatie over Custom Speech Service op de webpagina van Microsoft Cognitive Services en op de website van Custom Speech Service, www.cris.ai.

  • Aangepaste modelimplementatie is het proces van het inpakken van een aangepast model en dat vervolgens aanbieden als een service. Het resulterende geïmplementeerde aangepaste model biedt een eindpunt via welke het kan worden benaderd. Gebruikers kunnen zoveel modellen implementeren als ze willen.

  • Met Custom Speech Service kunnen gebruikers basislijnmodellen aanpassen op basis van hun eigen akoestische en taalgegevens. Dat proces noemen we modelaanpassing.

  • Bij het maken van een aangepast model hebben gebruikers de optie testgegevens te uploaden om het nieuwe model te evalueren. Gebruikers kunnen de nieuwe aangepaste modellen testen met net zoveel gegevens als ze willen en kunnen bijvoorbeeld onbeperkte nauwkeurigheidstests uitvoeren.

  • Wanneer een aangepast model geïmplementeerd is, kan de bijbehorende URI één audioaanvraag per keer verwerken. Voor scenario’s waarbij meerdere audioaanvragen tegelijkertijd naar die URI worden verzonden, kunnen gebruikers uitschalen naar een frequentie van vijf gelijktijdige aanvragen per keer. Dat wordt gerealiseerd door schaaleenheden aan te schaffen. Elke schaaleenheid garandeert maximaal vijf gelijktijdige audioaanvragen tegen $200 per schaaleenheid. Als een gebruiker bijvoorbeeld voorziet dat dit eindpunt wordt bereikt met 23 audioaanvragen per keer, moet die gebruiker vijf schaaleenheden aanschaffen om 25 gelijktijdige aanvragen te garanderen.

  • Met logboekbeheer kunnen gebruikers logboekregistratie voor hun geïmplementeerde modellen uitschakelen. Gebruikers die zich zorgen maken over privacy, kunnen ervoor kiezen logboekregistratie voor een geïmplementeerd model uit te schakelen met een frequentie van $20 per maand.

  • Prijsaanvraag verwijst naar de kosten van het verwerken van audioaanvragen door het eindpunt van een geïmplementeerd aangepaste model.

Algemeen

  • The Emotion API, Face API, Language Understanding Intelligent Service API, Bing Speech-to-Text API, and Bing Text-to-Speech API are billed per 1.000 API transaction calls when a production API call is being actively executed. Billing is prorated for production API transaction call quantities.

    The Bing Long Form Speech API service is billed per hour of speech that is analyzed. The billing is prorated on a per-minute basis.

    The Recommendations API and Text Analytics API can be purchased in units of the standard tiers at a fixed price. Each unit of a tier comes with included quantities of API transactions. If the user exceeds the included quantities, overages are charged at the rate specified in the pricing table above. These overages are prorated, and the service is billed on a monthly basis. The included quantities in a tier are reset each month.

  • Het gebruik wordt vertraagd als de transactielimiet wordt bereikt op de gratis laag. Klanten kunnen overschrijdingen op de Gratis laag niet verrekenen.

  • Any annotation to a document counts as a transaction. Batch scoring calls will also take into consideration the number of documents that need to be scored in that transaction. So for instance, if 1.000 documents are sent for sentiment analysis in a single API call, that will count for 1.000 transactions. If an API supports more than one annotation operation, that will also be considered. Let’s say an API call performs both sentiment analysis and key-phrase extraction on 1.000 documents, that will count for 2.000 transactions (2 annotations * 1.000 documents).

  • Als het gebruik op een standaardlaag wordt overschreden, worden in het account overschrijdingen verzameld. Deze overschrijdingen worden maandelijks gefactureerd en berekend op basis van het tarief dat voor elke laag geldt.

  • Elke API-aanroep (met uitzondering van batchscore-aanroepen) wordt als een transactie gerekend. De telling van batchscore-aanroepen is gebaseerd op het aantal items dat moet worden genoteerd in die transactie .

  • Het gebruik wordt vertraagd als de transactielimiet wordt bereikt op de gratis laag. Klanten kunnen overschrijdingen op de Gratis laag niet verrekenen. Batchscores worden niet ondersteund op de Gratis laag.

  • De Recommendations-API is tegen een vaste prijs verkrijgbaar in eenheden van de standaardlagen. Bij elke eenheid van een laag zijn bepaalde aantallen API-transacties inbegrepen. Als de gebruiker de vaste aantallen overschrijdt, wordt de overschrijding in rekening gebracht tegen het tarief dat in bovenstaande prijstabel wordt vermeld. Deze overschrijdingen worden pro rata berekend en de service wordt op maandbasis in rekening gebracht. De inbegrepen aantallen van een laag worden elke maand opnieuw ingesteld.

  • U kunt op elk gewenst moment een upgrade naar een hogere laag uitvoeren. Tarieven en vaste aantallen die bij de hogere laag behoren, worden onmiddellijk toegepast.

Bronnen

Schat uw maandelijkse kosten voor Azure-services

Lees de veelgestelde vragen over Azure-prijzen

Meer informatie over Cognitive Services

Gebruik technische zelfstudies, video's en andere bronnen

Leren en bouwen met $200 aan tegoed en blijven doorwerken

Gratis account