Cognitive Services díjszabás – Custom Speech Service ELŐZETES VERZIÓ

Intelligens API-k használata látás- és beszédtechnológiához, valamint nyelvi és ismeretkezelési képességekhez

A Custom Speech Service szolgáltatással egyéni beszédfelismerési modelleket hozhat létre, amelyeket a saját alkalmazására szabott beszédfelismerési végpontokon helyezhet üzembe. A Custom Speech Service lehetővé teszi a beszédfelismerő nyelvi modelljének testreszabását, így az megtanulja az alkalmazás szóhasználatát és a felhasználók beszédmódját is. A beszédfelismerő akusztikai modellje szintén testreszabható, így az jobban illeszkedhet az alkalmazás várható környezetéhez és a felhasználói körhöz.

Díjszabás részletei

A modellbetanítás ingyenes.

Ingyenes S1
Model Deployments 1 model $-/model/month
Model Adaptation 3 hours/month Unlimited
Pontossági tesztek 2 hours/month 2 hours free and then $-/hour
Bővítés $-/egység/nap, ahol minden egység öt kérés párhuzamos küldését teszi lehetővé
Nincs nyomkövetés $-/modell/hó
Kérések díjszabása 2 hours/month 2 hours free and then $-/hour

Támogatás és szolgáltatásszintek

  • A számlázással és az előfizetéssel kapcsolatos ügyintézés és támogatás díjmentes
  • Műszaki támogatásra van szüksége az előzetes verzióhoz? Használja fórumainkat
  • Garantáljuk a standard szintű Cognitive Services legalább 99,9%-os rendelkezésre állását. Az ingyenes csomaghoz nem biztosítunk szolgáltatásiszint-szerződést. A szolgáltatásszintek áttekintése
  • Az előzetes verzió ideje alatt nem biztosítunk szolgáltatásszint-szerződést. Részletek

Gyakori kérdések

Custom Speech Service

  • Az 1. szint egyszerre legfeljebb négy hanganyagot tud feldolgozni (azaz négy beszédátírást), miközben még mindig valós időben ad választ. Ha a felhasználó négynél több hanganyagot küld egyszerre, a fennmaradó hanganyagokat a rendszer elutasítja, és egy hibakódot küld vissza, amely a túl sok egyidejű felismerést jelzi. Ugyanez vonatkozik a 2. szintre, ahol 12 beszédátírás dolgozható fel egyidejűleg. Az ingyenes szint egyszerre egy beszédátírást tesz lehetővé. Azt feltételezzük, hogy a hanganyag valós időben lesz feltöltve. Ha a hanganyagot gyorsabban töltik fel, a párhuzamosság szempontjából a kérést a rendszer a hanganyag hosszának végéig folyamatban lévőnek tekinti (noha a felismerés eredményét korábban is visszaküldheti).

    Megjegyzés: Ha ennél nagyobb kapacitású párhuzamosságra van szüksége, lépjen velünk kapcsolatba.

  • A nyelvi modell szószekvenciák valószínűségi eloszlását jelenti. A nyelvi modell segíti a rendszert abban, hogy válasszon a hasonló hangzású szószekvenciák közül. Ehhez maguknak a szószekvenciáknak a valószínűségét használja fel. A „recognize speech” és a „wreck a nice beach” például ugyanúgy hangzik, de az első változat sokkal valószínűbb, ezért magasabb pontszámot kap a nyelvi modellben. Ha az alkalmazáshoz várhatóan érkeznek majd olyan lekérdezések, amelyek speciális szókincset használnak (például termékneveket vagy a tipikus beszédben ritkán előforduló szakkifejezéseket), akkor a nyelvi modell testreszabásával nagy valószínűséggel hatékonyabb működés érhető el. Ha például az alkalmazás hangalapú keresést végez az MSDN-ben, valószínű, hogy az olyan kifejezések, mint az „objektumorientált”, a „névtér” vagy a „dot net” gyakrabban fordulnak majd elő, mint más alkalmazások esetében. A nyelvi modell testreszabásával lehetővé válik, hogy a rendszer megtanulja ezeket.

  • Az akusztikai modell besorolást végez: a hanganyag rövid részleteit egy adott nyelv fonémáiként (hangegységeiként) azonosít be. Ezekből a fonémákból állíthatók össze a szavak. Az angol „speech” (beszéd) szó például négy fonémából áll: „sz, p, í, cs”. Ezek a besorolások másodpercenként százas nagyságrendben zajlanak le. Az akusztikai modell testreszabása lehetővé teszi, hogy a rendszer nem tipikus környezetekben jobb hatékonysággal ismerje fel a beszédet. Egy olyan alkalmazásnál például, amelyet egy raktár vagy egy gyár dolgozói használnak, a testreszabott akusztikai modell pontosabb beszédfelismerést tehet lehetővé az ilyen környezetekben található zajok mellett is.

  • A rövid kifejezés felismerése legfeljebb 15 másodperc hosszúságú kimondott szöveget támogat. A beszédfelismerő ügyfélkódtárral együtt használva az adatok kiszolgálóra küldésekor az ügyfél több részleges és egy olyan végső eredményt kap, amely több valószínű változatot tartalmaz.

  • A hosszú diktálás felismerése akár két perc hosszúságú beszédet támogat. A beszédfelismerő ügyfélkódtárral együtt használva az adatok kiszolgálóra küldésekor az ügyfél több részleges és több végső eredményt is megkap, attól függően, hogy a kiszolgáló hol jelez mondaton belüli szünetet.

  • Ha például egy ügyfél az S1 szintet használja egymillió beszédátírásra, akkor a szintnek megfelelő díjat számoljuk fel ($-), az első 100,000 beszédátírást $- / 1,000 beszédátírás díjjal, míg a fennmaradó 900,000 beszédátírást $- / 1,000 beszédátírás díjjal számoljuk fel. Így az ügyfél teljes díja $- + 100,000 * ($- / 1,000) + 900,000 * ($- / 1,000) = $4500.

  • A Custom Speech Service-ről további információt talál a Microsoft Cognitive Services honlapján, valamint a Custom Speech Service honlapján: www.cris.ai.

  • Az egyéni modell-üzembehelyezés egy egyéni modell becsomagolásának és szolgáltatásként való elérhetővé tételének folyamata. A folyamat eredményeként kapott üzemelő egyéni modell egy végponttal rendelkezik, amelyen keresztül az elérhető. A felhasználók annyi egyéni modellt helyezhetnek üzembe, amennyit szükségesnek tartanak.

  • A Custom Speech Service használatával a felhasználók saját akusztikai és nyelvi adatokra alapuló kiindulási modelleket alkalmazhatnak. Ezt a folyamatot a modell testreszabásának nevezzük.

  • Egyéni modell létrehozásánál a felhasználónak lehetősége van tesztadatok feltöltésére az újonnan létrehozott modell tesztelése érdekében. Az egyéni modell bármilyen mennyiségű adat használatával tesztelhető, azaz a felhasználók korlátlan számú pontossági tesztet hajthatnak végre.

  • Miután az egyéni modellt üzembe helyezték, az URI-ja egyidejűleg egy audiókérést tud feldolgozni. Arra az esetre, ha az URI-ra egyszerre több audiókérés is érkezik, a felhasználó horizontális felskálázást választhat egyenként öt párhuzamos kérés kezelésére alkalmas lépésekben. Ezt skálázási egységek vásárlásával lehet megtenni. Minden skálázási egység legfeljebb öt audiókérés párhuzamos feldolgozását teszi lehetővé. Egy skálázási egység díja $200. Ha például várhatóan párhuzamosan 23 audiókérés érkezik majd a végpontra, akkor öt skálázási egységet szükséges vásárolni, amely 25 párhuzamos kérés feldolgozását garantálja.

  • A naplókezeléssel a felhasználók kikapcsolhatják a naplózást az üzembe helyezett modellnél. A felhasználó adatvédelmi megfontolásokból havi $20 díj mellett ki is kapcsolhatja a naplózást az üzembe helyezett modellnél.

  • A kérések díjszabása azoknak az audiókéréseknek a feldolgozására vonatkozik, amelyeket egy üzembe helyezett egyéni modell végpontja végrehajt.

Általános

  • Az Érzelemfelismerési API, az Arcfelismerési API, a Language Understanding Intelligent Service API, a Bing Hang-szöveg transzformációs API és a Bing Szöveg-hang transzformációs API számlázása 1000 API-tranzakciós hívásonként történik, éles környezetbeli API-hívások aktív végrehajtása esetén. A díjakat az éles környezetbeli API-tranzakciós hívások mennyisége alapján arányosítjuk.

    A Bing Diktálásfelismerési API szolgáltatásért fizetendő díjat az elemzett beszéd időtartama (órák száma) alapján állapítjuk meg. A percek díját is felszámítjuk.

    Az Ajánlatok API és a Szövegelemzési API a standard csomagokhoz tartozó egységekben vásárolható, fix áron. A csomagokban minden egységhez adott mennyiségű API-tranzakció vehető igénybe. Ha a felhasználó túllépi a csomagban foglalt mennyiséget, a túllépések számlázása a fenti díjszabás alapján történik. A túllépések számát arányosítjuk, a szolgáltatást pedig hónapra lebontva számlázzuk. A csomagban foglalt mennyiségek számlálása havonta újraindul.

  • Az ingyenes szinten a tranzakciókorlát elérése esetén a használatot korlátozzuk. Az ügyfél tehát az ingyenes szinten nem lépheti túl a keretet.

  • Ha a standard csomagban túllépi a használati korlátot, a fiókban elkezdjük számolni a túlhasználatot. A túlhasználat számlázása havi rendszerességgel történik, az adott szinthez megállapított díjak alapján.

  • Bármilyen API-hívás (a kötegelt kiértékelési hívások kivételével) egy tranzakciónak számít. A kötegelt kiértékelési hívások számlálása az adott tranzakcióban kiértékelendő elemek számán alapul.

  • Az ingyenes szinten a tranzakciókorlát elérése esetén a használatot korlátozzuk. Az ügyfél tehát az ingyenes szinten nem lépheti túl a keretet. A kötegelt kiértékelést az ingyenes szint nem támogatja.

  • Az Ajánlatok API a standard csomagokhoz tartozó egységekben vásárolható meg, fix áron. A csomagokban minden egységhez adott mennyiségű API-tranzakció vehető igénybe. Ha a felhasználó túllépi a csomagban foglalt mennyiséget, a túllépések számlázása a fenti díjszabás alapján történik. A túllépések számát arányosítjuk, a szolgáltatást pedig hónapra lebontva számlázzuk. A csomagban foglalt mennyiségek számlálása havonta újraindul.

  • A Bing keresési API-k, a Bing Automatikus kiegészítés API és a Bing Helyesírás-ellenőrző API számlázása havi rendszerességgel történik. A megvásárolt csomagtól függően lesznek olyan benne foglalt tranzakciómennyiségek, amelyek API-hívásokként vannak definiálva. A csomagban foglalt mennyiségek mindig a naptári hónapra vonatkoznak, függetlenül a használatba vétel időpontjától. Ha a felhasználó túllépi a csomagban foglalt mennyiséget, a túllépések számlázása a díjszabási táblázat alapján történik. A túllépések számát nem arányosítjuk, a szolgáltatást pedig hónapra lebontva számlázzuk. Az egyes csomagokban foglalt mennyiségek számlálása havonta újraindul.

  • Please visit the Cognitive Services subscription page to request free trials.

  • Bármikor válthat egy magasabb szintű csomagra. A magasabb szintű csomag díjszabása és a csomagban foglalt mennyiségek azonnal érvénybe lépnek.

Erőforrások

Díjkalkulátor

Azure-szolgáltatások várható havi díjának becslése

Gyakori vásárlási kérdések

Gyakori kérdések az Azure díjszabásáról

Termékadatok

Cognitive Services – további információ

Dokumentáció

Műszaki oktatóanyagok, videók és más háttéranyagok

Ha most regisztrál, $200 összegű Azure-kredittel jutalmazzuk

Miért várna holnapig?