Spring over navigation

Priser på Cognitive Services – Speech Services

Brug intelligens-API'er til at aktivere egenskaber som vision, tale, sprog og viden

De samlede taletjenester giver en bred vifte af funktioner til talegenkendelse og generering, herunder transskribering af tale, tekst til tale og taleoversættelse.

Prisoplysninger

Instans Samtidig anmodning Funktioner Pris
Gratis 1 samtidig anmodning Taleoversættelse 5 gratis timer pr. måned
Tale til tekst 5 gratis timer pr. måned
Tale til tekst med brugerdefineret talemodel 5 gratis timer pr. måned
Speech Endpoint Hosting* 1 gratis model pr. måned
Tekst-til-tale 5 mio. gratis tegn pr. måned
Tekst til tale med brugerdefineret stemmetype 5 mio. gratis tegn pr. måned
Hosting af brugerdefineret stemmetype* 1 gratis model pr. måned
Standard 20 samtidige anmodninger Taleoversættelse $- pr. time
Tale til tekst $- pr. time
Tale til tekst med brugerdefineret talemodel $- pr. time
Speech Endpoint Hosting $-/model/måned
Tekst-til-tale $- pr. 1 mio. tegn
Tekst til tale med brugerdefineret stemmetype $- pr. 1 mio. tegn
Hosting af brugerdefineret stemmetype $-/model/måned
*Ubrugte modeller tages automatisk ud af drift efter 7 dage

Support og SLA 

 • Gratis support til administration af fakturering og abonnement er inkluderet.
 • Vi garanterer, at Cognitive Services, der kører på standardniveauet, er tilgængelige i mindst 99,9 % af tiden. Der er ingen SLA for den gratis prøveversion. Læs SLA'en.

Ofte stillede spørgsmål

Speech Services

  • Til Taleoversættelse, Tale til tekst og Tale til tekst med brugerdefineret talemodel: forbruget faktureres efter sekundintervaller
  • For Tekst til tale og Tekst til tale med brugerdefineret stemmetype: forbruget faktureres pr. tegn
  • For Hosting af brugerdefineret talemodel og Hosting af brugerdefineret stemmetype: forbruget faktureres dagligt
 • Speech Service giver brugerne mulighed for at tilpasse grundlæggende modeller på baggrund af deres egne akustiske data og sprogdata. Det giver brugerdefinerede talemodeller, som kan bruges til både Tale til tekst og Taleoversættelse.

 • Sprogmodellen er en sandsynlighedsdistribution baseret på ordsekvenser. Sprogmodellen hjælper systemet med at fastlægge ordsekvenser, der lyder ens, på baggrund af sandsynligheden for selve ordsekvenserne. "Genkend tale" og "gentænd svale" lyder f.eks. ens, men den første hypotese er meget mere sandsynlig og vil derfor blive tildelt en meget højere score af sprogmodellen. Hvis du har en forventning om, at stemmeanmodninger til dit program indeholder særlige elementer af ordforråd, såsom produktnavne eller jargon, der er ikke opstår ofte i almindelig tale, kan du sandsynligvis opnå en forbedre ydeevne ved at tilpasse sprogmodellen. Hvis du f.eks. bygger en app til at søge MSDN med tale, er det sandsynligt, at termer såsom "objektorienteret" eller "navneområde" eller "dot.net" forekommer hyppigere end i almindelige stemmeprogrammer. En tilpasning af sprogmodellen gør det muligt for systemet at lære dette.

 • Den akustiske model er en klassificering, der markerer korte fragmenter af lyd i adskillige fonemer eller lydenheder på hvert sprog. Disse fonemer kan derefter sættes sammen og forme ord. Ordet "tale" indeholder f.eks. fire fonemer, "t a l e". Disse klassificeringer er lavet 100 gange i sekundet efter ordre. Tilpasning af den akustiske model gør det muligt for systemet bedre at lære at genkende tale i atypiske miljøer. Hvis du f.eks. har en app, der er designet til at blive brugt af en medarbejder på et lager eller en fabrik, kan en tilpasset akustisk model genkende tale i disse lydmiljøer mere præcist.

 • Microsoft Speech Services indeholder mere end 70 stemmer som standard (kaldes også stemmetyper) på mere end 40 sprog, så du kan konvertere din tekst til lyd. Med virtuelle assistenter og forskellige taleunderstøttede apps vil mange virksomheder dog gerne have deres egne unikke stemmer, som repræsenterer deres virksomhed, og som er skræddersyet til deres eget brand. Hvis du for eksempel udvikler en chatbot til din kundeservice, kan du knytte den til virksomhedens unikke brandstemme for at styrke kundernes tilknytning. På samme måde kan udviklere af navigationssoftware til biler aktivere Tale til tekst med forskellige brugerdefinerede stemmer for at forbedre kundeoplevelsen.

  Det gøres nemt ved hjælp af Voice Studio, som er en portal til at bygge brugerdefinerede stemmer. Du kan bruge dine egne lyddata (optaget tale med tilknyttede scripts) til at generere en brugerdefineret stemmetype, som derefter udrulles til Microsofts Tekst til tale-tjeneste, hvorefter du nemt kan tilknytte den til dine apps via et API-slutpunkt.

Generelt

 • Bing Search API'er faktureres på baggrund af antallet af transaktioner (også kendt som API-kald). Disse planer er betalt efter forbrug, og der påløber ikke ekstra omkostninger for komplekse forespørgsler og mere end 10 resultater (op til 50 resultater i de fleste tilfælde).

 • Hvis du kommer til at overskride det nævnte antal transaktioner pr. sekund (TPS), begrænses dit forbrug, så det ligger inden for den nævnte grænse. Hvis programmet skal have et højere TPS end dem, der er nævnt på denne side, skal du kontakte Azures supportteam.

 • I forbindelse med fakturering er en transaktion en vellykket anmodning om Bing API-kald (selvom der er hensyn i forbindelse med DoS-angreb). I forbindelse med logføring og rapportering, f.eks. for tilføjelsesprogrammet Bing Statistics, gælder det for alle Bing API-kald, uanset om de lykkes eller ej.

 • Du kan ændre niveauet for tjenesten når som helst. Sørg for at anvende de relevante nøgler i dine API-kald. Hvis du har indgået en Enterprise Agreement med Microsoft, skal du kontakte din kontoadministrator.

Ressourcer

Beregn dine månedlige udgifter til Azure-tjenester

Se ofte stillede spørgsmål vedr. prissætning på Azure

Få mere at vide om Cognitive Services

Se tekniske vejledninger, videoer og anden dokumentation

Tilføjet for at beregne. Tryk på 'v' for at få vist på beregner Se på beregner

Få mere at vide og byg med $200 i kredit, og fortsæt gratis