Cognitive Services — cennik

Używaj interfejsów API analizy, aby dodawać funkcje analizy obrazu, języka i wyszukiwania.

Cennik

Aby uzyskać więcej opcji dla poszczególnych ofert interfejsu API, wybierz ofertę z powyższej listy rozwijanej.

Funkcja QnA Maker, usługi Mowa i narzędzie Custom Vision są obecnie dostępne tylko jako pojedyncze interfejsy API.

Produkt Funkcje Cena
Przetwarzanie obrazów S1
do 10 żądań na sekundę
Tag
Rozpoznawanie twarzy
GetThumbnail
Kolor
Typ obrazu
GetAreaOfInterest
0–1 mln transakcji — $- za 1000 transakcji
1–5 mln transakcji — $- za 1000 transakcji
5–10 mln transakcji — $- za 1000 transakcji
10–100 mln transakcji — $- za 1000 transakcji
Ponad 100 mln transakcji — $- za 1000 transakcji
OCR
Dla dorosłych
Osobistość
Charakterystyczny element krajobrazu
Wykrywanie, obiekty
Marka
0–1 mln transakcji — $- za 1000 transakcji
1–5 mln transakcji — $- za 1000 transakcji
5–10 mln transakcji — $- za 1000 transakcji
10–100 mln transakcji — $- za 1000 transakcji
Ponad 100 mln transakcji — $- za 1000 transakcji
Opis+
Rozpoznawanie tekstu*
Odczyt
$- za 1000 transakcji
Content Moderator S0
do 10 żądań na sekundę
Średnia, Przegląd Od 0 do 1 mln transakcji - $- za 1 000 transakcji
Od 1 mln do 5 mln transakcji - $- za 1 000 transakcji
Od 5 mln do 10 mln transakcji - $- za 1 000 transakcji
Ponad 10 mln transakcji - $- za 1 000 transakcji
Rozpoznawanie twarzy Standardowa
do 10 żądań na sekundę
Wykrywanie twarzy
Weryfikacja twarzy
Identyfikacja twarzy
Grupowanie twarzy
Wyszukiwanie podobnych twarzy
Od 0 do 1 mln transakcji - $- za 1000 transakcji
Od 1 mln do 5 mln transakcji - $- za 1000 transakcji
Od 5 mln do 100 mln transakcji - $- za 1000 transakcji
Ponad 100 mln transakcji - $- za 1000 transakcji
Magazyn twarzy $- za 1000 twarzy na miesiąc

Przetwarzanie obrazów S1: Klienci są obciążani opłatami za transakcję, a nie za wywołanie interfejsu API. Poniżej możesz dowiedzieć się więcej na temat tego, czym są transakcje.

* Produkty w wersji zapoznawczej

+ Języki inne niż angielski są dostępne w wersji zapoznawczej

** Wartość transakcji na sekundę ma zastosowanie do internetowego punktu końcowego

Produkt Funkcje Cena
Language Understanding Standardowa
do 50 żądań na sekundę
Żądania tekstowe $- za 1000 transakcji
Żądania wymawiane $- za 1000 transakcji
Analiza tekstu Standardowa
do 100 żądań na sekundę i 1 000 żądań na minutę
Analiza tonacji
Wyodrębnianie kluczowych fraz
Wykrywanie języka
Rozpoznawanie jednostek znaku (niedostępne w kontenerze)
0–500 000 rekordów tekstu — $- za 1 000 rekordów tekstu
0,5M–2,5M rekordów tekstu — $- za 1 000 rekordów tekstu
2,5M–10,0M rekordów tekstu — $- za 1 000 rekordów tekstu
10M+ rekordów tekstu — $- za 1 000 rekordów tekstu
Tłumaczenie tekstu w usłudze Translator S1 Tłumaczenie tekstu
Dostosowywanie
Wykrywanie języka
Słownik dwujęzyczny
Transliteracja
$- za milion znaków (Płatność zgodnie z rzeczywistym użyciem)
Produkt Funkcje Cena
Wyszukiwanie Bing S1
do 250 żądań na sekundę
Wyszukiwanie w Internecie Bing
Wyszukiwanie obrazów Bing
Wyszukiwanie wiadomości Bing
Wyszukiwanie wideo Bing
Wyszukiwanie jednostek Bing
Automatyczne sugerowanie Bing*
Sprawdzanie pisowni Bing*
$7 za 1 000 transakcji
$7 za 25 000 transakcji*
Opcjonalny dodatek Statystyka Bing $1 za 1 000 transakcji
Wyszukiwanie Bing S9
do 30 żądań na sekundę
Wyszukiwanie wizualne Bing $3 za 1 000 transakcji
Opcjonalny dodatek Statystyka Bing $1 za 1 000 transakcji
Wyszukiwanie niestandardowe Bing S3
do 150 żądań na sekundę
Usługa wyszukiwania niestandardowego Bing z wyszukiwaniem obrazów, wyszukiwaniem wideo i funkcjami dodatku Statystyka $6 za 1 000 transakcji

Wyszukiwanie Bing S1:

Odpowiedzi wyszukiwania w Internecie będą zawierały i porządkowały odpowiednie wyniki z Internetu dla zapytania, obrazu, wiadomości, wideo, jednostki i odpowiednich odpowiedzi wyszukiwania. W odpowiedzi na zapytanie zostanie zawarte sprawdzanie pisowni. Ten pakiet zawiera również dodatkowe odpowiedzi, takie jak strefę czasową, konwersję jednostek, tłumaczenie i kalkulator, o ile jest to odpowiednie, oraz możliwość wywoływanie interfejsów API automatycznego sugerowania* i sprawdzania pisowni*.

Wyszukiwanie Bing S9:

Oferta wyszukiwania wizualnego Bing będzie udostępniać kontekstowe informacje pochodzące z obrazów lub adresów URL obrazów.

Wyszukiwanie niestandardowe Bing S3:

Ta warstwa pozycjonuje odpowiednie strony internetowe dla danego zapytania, zachowując konfigurację wystąpienia wyszukiwania niestandardowego. Funkcje, takie jak dodawanie witryn, blokowanie witryn, przypinanie witryn, tworzenie wystąpień tymczasowych oraz udostępnianie wystąpień, można łatwo konfigurować i obsługiwać w portalu tworzenia.

Ten pakiet umożliwia także wyszukiwanie obrazów i wideo w wybranych domenach oraz uwzględnienie takich obrazów na własnych stronach wyszukiwania razem ze stronami internetowymi, dzięki czemu środowisko użytkownika jest pełniejsze. Oddzielny punkt końcowy umożliwia wybór między korzystaniem z samych obrazów lub wideo, a korzystaniem ze stron internetowych, obrazów i wideo łącznie. Ten pakiet obejmuje także funkcję statystyki, której można użyć do analizowania użycia wystąpienia wyszukiwania niestandardowego. Istnieje możliwość gromadzenia metryk, takich jak wolumin wywołań, najpopularniejsze zapytania, dystrybucja kodów odpowiedzi interfejsu API i podział rynku oraz wielu innych.

Pomoc techniczna i umowa SLA

  • Oferta obejmuje bezpłatną pomoc techniczną dotyczącą rozliczeń i zarządzania subskrypcją.
  • Gwarantujemy, że usługi Cognitive Services działające w warstwie Standardowa będą dostępne przez co najmniej 99,9% czasu. W bezpłatnej wersji próbnej nie jest dostępna umowa SLA. Przeczytaj umowę SLA.

Często zadawane pytania

Interfejs API wizualizacji komputerowej

  • Zobacz dokumentację, aby uzyskać bardziej szczegółowy opis tych operacji.

    • Tagi — interfejs API przetwarzania obrazów zwraca tagi na podstawie ponad 2,000 rozpoznawalnych obiektów, istot żywych, scenerii i akcji. W przypadkach, w których tagi mogą być niejednoznaczne lub wykraczać poza popularną wiedzę, odpowiedź interfejsu API zapewnia „wskazówki”, aby wyjaśnić ich znaczenie.
    • Twarze — wykrywa twarze osób na zdjęciu.
    • Uzyskiwanie miniatur — po przekazaniu obrazu funkcja uzyskiwania miniatury generuje wysokiej jakości miniaturę. Algorytm interfejsu API przetwarzania obrazów analizuje obiekty na obrazie, a następnie przycina obraz zgodnie z wymaganiami „regionu zainteresowania” (ROI).
    • Kolor — algorytm przetwarzania obrazów wyodrębnia kolory z obrazu. Kolory są analizowane w trzech różnych kontekstach: na pierwszym planie, w tle i w całości obrazu. Kolory są pogrupowane na 12 dominujących kolorów akcentu.
    • Typ obrazu — interfejs API przetwarzania obrazów może ustawić flagę logiczną, aby wskazywać, że obraz jest czarno biały lub kolorowy, oraz przy użyciu tej samej metody wskazywać, czy obraz jest obiektem rysunkowym. Funkcja typu obrazu wskazuje również, czy obraz jest obiektem clipart, oraz określa jego jakość.
    • Optyczne rozpoznawanie znaków — technologia optycznego rozpoznawania znaków (OCR) wykrywa zawartość tekstową na obrazie. Zidentyfikowany tekst jest następnie wyodrębniany do strumienia znaków czytelnych dla maszyny, co umożliwia wyszukiwanie i realizację wielu innych zadań, od prowadzenia rekordów medycznych po kwestie związane z zabezpieczeniami i bankowością. Funkcja automatycznie wykrywa język. Optyczne rozpoznawanie znaków oszczędza czas i zapewnia wygodę dla użytkowników, umożliwiając im wykonywanie zdjęć tekstu zamiast jego przepisywania. Zobacz dokumentację, aby uzyskać informację o obsługiwanych językach.
    • Treści dla dorosłych — stosuj ustawienia zawartości dla dorosłych, aby umożliwić automatyczne ograniczanie takiej zawartości w obrazach.
    • Osobistości — model rozpoznawania osobistości platformy Azure rozpoznaje 200,000 osobistości z całego świata i różnych dziedzin: biznes, polityka, sport i rozrywka.
    • Analiza — pozwala wywołać wiele operacji naraz. Określ, które funkcje chcesz uruchomić, a interfejs API uruchomi je wszystkie jednocześnie. Każda operacja ujęta w „analizie” będzie liczona jako oddzielna transakcja.
  • W przypadku operacji Rozpoznawanie tekstu każde wywołanie POST jest liczone jako transakcja. Wszystkie wywołania GET służące do sprawdzenia wyników usługi asynchronicznej są liczone jako transakcje, ale są bezpłatne. W przypadku wszystkich innych operacji każde wywołanie funkcji jest liczone jako transakcja, bez względu na to, czy jest to wywołanie niezależne, czy zgrupowane w wywołaniu analizy. Wywołania analizy służą do upraszczania wywołań interfejsu API, ale każda użyta funkcja jest liczona jako transakcja. Przykładowo wywołanie analizy zawierające operacje Tagi, Rozpoznawanie twarzy i Treści dla dorosłych zostanie policzone jako trzy transakcje.

    Pełną listę operacji i ich szczegółowy opis można znaleźć w dokumentacji.

  • Każda operacja, wywoływana osobno lub za pośrednictwem operacji Analiza, będzie liczona jako transakcja. Łączny rachunek będzie bazować na liczbie transakcji każdego typu operacji w trakcie miesięcznego okresu rozliczeniowego.

    Na przykład załóżmy, że w pewnym miesięcznym okresie rozliczeniowym użyte zostały następujące wywołania:

    • 1,500,000 Operacje Analiza, każda wywołująca operacje Tag i Opis
    • 500,000 Operacje OCR
    • 4,000,000 Operacje Rozpoznawanie tekstu

    Końcowy rachunek będzie wyglądać następująco:

    Operacje Zasób Obliczenia Suma częściowa
    1,500,000 Operacje Tagi i 1,500,000 Rozpoznawanie twarzy: Transakcje w warstwie S1 Pierwszych 1,000,000 transakcji: $-/1000 * 1,000,000 = $-
    Pozostałych 2,000,000 transakcji: $-/1000 * 2,000,000 = $-
    $-
    500,000 Operacje OCR: Transakcje w warstwie S2 $-/1000 * 500,000 = $- $-
    1,500,000 Operacje Opisywanie i 4,000,000 Rozpoznawanie tekstu: Transakcje w warstwie S3 $-/1000 * 5,500,000 = $- $-
    Łącznie $- $-

Content Moderator

  • W przypadku korzystania z interfejsu API obrazy muszą mieć minimalnie 128 pikseli i maksymalny rozmiar pliku wynoszący 4 MB. Maksymalnie dopuszczalna liczba znaków to 1024.

  • Interfejs API rozpoznawania tekstu zwróci kod błędu informujący o tym, że długość tekstu jest większa niż dozwolona. Interfejs API rozpoznawania obrazów zwróci kod błędy informujący o tym, że rozmiar obrazu nie spełnia wymagań.

  • Subskrypcja obejmuje również narzędzie do przeglądu przez ludzi.

Interfejs API twarzy

  • W przypadku operacji dotyczących uczenia się w milionowej skali (dostępnych od 1 marca 2018 r.) transakcja jest liczona za następującą liczbę przetworzonych obrazów: 1 000. Operacje „LargePersonGroup – Train” i „LargeFaceList – Train” należą do tej kategorii. Każda operacja z tej kategorii jest zaokrąglana w górę do najbliższej wielokrotności następującej liczby obrazów: 1 000. Na przykład dla operacji „LargeFaceList – Train” zawierającej następującą liczbę obrazów: 849 500 zostanie naliczona następująca liczba transakcji: 850.

    W przypadku wszystkich innych operacji każde wywołanie interfejsu API będzie liczone jako jedna transakcja.

    Zobacz dokumentację, aby uzyskać pełną listę i szczegółowy opis operacji.

  • Magazyn twarzy umożliwia korzystanie z subskrypcji pozwalającej na przechowywanie dodatkowych twarzy w przypadku używania obiektów osób oraz list twarzy na potrzeby identyfikacji lub dopasowywania podobieństw przy użyciu interfejsu API rozpoznawania twarzy.

  • Opłata za przechowywane twarze jest naliczana przy użyciu stawki wynoszącej $- za 1 000 twarzy proporcjonalnie do liczby dni.

    Jeśli na przykład konto korzystało z 10 000 przechowywanych twarzy w każdym dniu pierwszej połowy miesiąca i nie korzystało z twarzy w drugiej połowie miesiąca, opłata zostanie naliczona za następującą liczbę twarzy: 10 000 przy użyciu liczby dni przechowywania. Obliczenie będzie wyglądało następująco: ($-/1 000) * (10 000*15+0*16)/31 = $-

    Drugi przykład: jeśli każdego dnia miesiąca kilka twarzy, powiedzmy 1 000, jest przechowywanych przez kilka godzin, a następnie są one nocą usuwane, nadal będą naliczane opłaty za przechowywanie 1 000 twarzy każdego dnia.

  • Przydział liczby przechowywanych grup osób wynosi teraz 1 mln, przy maksymalnie 1 mln osób w grupie osób lub na liście twarzy.

LUIS

  • W przypadku żądań tekstowych transakcja to wywołanie interfejsu API z maksymalną długością zapytania wynoszącą 500 znaków.

    W przypadku żądań wymawianych transakcja to wypowiedź z maksymalną długością zapytania wynoszącą 15 sekund.

  • Nie, warstwa Bezpłatna obejmuje tylko żądania tekstowe o maksymalnej długości wynoszącej 500 znaków.

  • Wyślij to funkcja umożliwiająca przetwarzanie 2 modeli/aplikacji przy użyciu 1 wywołania interfejsu API.

Analiza tekstu

  • Interfejs API analizy tekstu można zakupić w stałej cenie jednostek warstwy S0-S4. Każda jednostka warstwy obejmuje pewną liczbę transakcji interfejsu API. Jeśli użytkownik przekroczy tę liczbę, za kolejne transakcje będą naliczane opłaty określone w powyższym cenniku. Opłaty za dodatkowe transakcje są naliczane proporcjonalnie, a za usługę jest naliczana opłata miesięczna. Liczba transakcji dostępnych w ramach danej warstwy jest resetowana co miesiąc. W warstwie S opłaty za usługę są naliczane wyłącznie za ilość rekordów tekstu przesłanych do usługi.
  • W przypadku osiągnięcia limitu transakcji w ramach warstwy Bezpłatna użycie jest ograniczane. Klienci nie mogą wliczać dodatkowych transakcji do opłat za warstwę Bezpłatna.
  • Każda adnotacja do dokumentu jest uznawana za transakcję. Wywołania wsadowego oceniania będą uwzględniane na podstawie liczby dokumentów, które mają zostać ocenione w ramach transakcji. Na przykład wysłanie 1 000 dokumentów do analizy tonacji w jednym wywołaniu interfejsu API zostanie uznane za 1 000 transakcji. Jeśli interfejs API obsługuje więcej niż jedną operację adnotacji, również zostanie to uwzględnione. Na przykład wywołanie interfejsu API, które przeprowadza analizę tonacji i wyodrębnianie kluczowych fraz w 1 000 dokumentów, jest uznawane za 2 000 transakcji (2 adnotacje × 1 000 dokumentów).
  • W przypadku przekroczenia limitu użycia w ramach warstwy S0-S4 na koncie są naliczane opłaty za dodatkowe transakcje. Dodatkowe transakcje są rozliczane miesięcznie zgodnie ze stawką określoną dla danej warstwy.
  • Usługi można w dowolnym momencie uaktualnić do wyższej warstwy. Spowoduje to natychmiastowe rozpoczęcie naliczania opłat i korzystania z liczby dostępnych transakcji odpowiadających wybranej wyższej warstwie.
  • Rekord tekstu w warstwie S zawiera maksymalnie 1 000 znaków mierzonych przez właściwość StringInfo.LengthInTextElements Jeśli dokument wejściowy do interfejsu API analizy tekstu przekracza długość 1 000 znaków, jest on liczony jako jeden rekord tekstu dla każdej jednostki składającej się z 1 000 znaków. Jeśli na przykład dokument wejściowy wysłany do interfejsu API zawiera 7 500 znaków, będzie on liczony jako 8 rekordów tekstu. Jeśli dokument wejściowy wysłany do interfejsu API zawiera 500 znaków, będzie on liczony jako 1 rekord tekstu. Jeśli zostaną przesłane dwa dokumenty, jeden zawierający 500 znaków i drugi zawierający 1 200 znaków, za usługę zostaną naliczone opłaty za łącznie trzy rekordy tekstu: jeden rekord za dokument zawierający 500 znaków i dwa rekordy tekstu za dokument zawierający 1 200 znaków.

Wyszukiwanie niestandardowe Bing

  • Nie, wyszukiwanie niestandardowe Bing jest ograniczone tak, aby spełniało warunki określonej oferty dla każdej warstwy. Na przykład warstwa S3 jest przeznaczona dla klientów, którzy chcą wykorzystywać tylko wyniki niestandardowego wyszukiwania internetowego i niestandardowego wyszukiwania obrazów dla wybranego zbioru domen. Warstwa S3 udostępnia także możliwości dotyczące statystyki. Odpowiedź interfejsu API różni się w zależności od punktu końcowego wywołanego w ramach określonej warstwy. Każdy punkt końcowy ma własny schemat odpowiedzi.

  • Oto różne punkty końcowe:

    • Wyszukiwanie niestandardowe Bing (punkt końcowy niestandardowego wyszukiwania w Internecie)
    • Wyszukiwanie niestandardowe Bing z funkcją wyszukiwania obrazów (punkt końcowy niestandardowego wyszukiwania obrazów)
  • Warstwy są wyceniane na podstawie liczby transakcji. Na przykład w warstwie S3 cena za transakcje w liczbie 1 000 to $6, a w warstwie S4 cena za transakcje w liczbie 10 000 to $4. Jeśli na końcu okresu rozliczeniowego liczba transakcji zarejestrowanych w warstwie S3 to 20 000, a w warstwie S4 to 40 000, kwota łączna $136 zostanie obliczona jako $6*(20 000/1 000) + $4*(40 000/10 000).

  • Dodatek Statystyka jest oferowany w ramach warstw S2 i S3. W ciągu 24 godzin od wywołania interfejsu API niestandardowego wyszukiwania internetowego Bing lub wyszukiwania obrazów za pomocą klucza warstwy S2 lub S3 wykresy w portalu tworzenia zaczną być zapełniane danymi statystycznymi. Istnieje możliwość gromadzenia metryk, takich jak wolumin wywołań, najpopularniejsze zapytania, dystrybucja kodów odpowiedzi interfejsu API i podział rynku oraz wielu innych.

  • Funkcja niestandardowego automatycznego sugerowania jest oferowana w ramach odrębnej warstwy innej niż warstwa S4. Funkcję niestandardowego automatycznego sugerowania można kupić i zintegrować oddzielenie, aby uzyskiwać automatyczne podpowiedzi w warstwach S1, S2 i S3. Jeśli na przykład klient chce używać warstw S1 i S4, musi zakupić je oddzielnie, a rozliczenie będzie wyglądać następująco:

    Jeśli w warstwie S1 liczba transakcji zużyta przez klienta to łącznie 3 000, a w warstwie S4 to łącznie 40 000, wtedy kwota rozliczenia $28 jest obliczana jako $4*(3 000/1 000) + $4*(40 000/10 000).

  • Tłumaczenie standardowe to prosty jednoetapowy proces, w którym wprowadzasz zdanie wejściowe, a wstępnie wytrenowane modele platformy Azure tłumaczą je na język docelowy. Natomiast tłumaczenie niestandardowe to proces dwuetapowy, w ramach którego najpierw trenujesz własne modele przy użyciu danych treningowych przekazanych do usługi tłumaczenia. Po wytrenowaniu modelu możesz wykonywać tłumaczenie tak samo jak w przypadku tłumaczenia standardowego.

  • W ramach tłumaczenia niestandardowego możesz wykonywać trzy działania, za które są naliczane opłaty:

    1. Hostowanie modelu: Hostowanie modelu oznacza udostępnianie go do użycia na potrzeby tłumaczenia niestandardowego. Za każdy hostowany model w okresie rozliczeniowym jest naliczana stała opłata. Opłata nie jest naliczana proporcjonalnie, jeśli model jest hostowany tylko przez część miesiąca.
    2. Trenowanie: Każdorazowo podczas trenowania modelu jest naliczana opłata za każdy znak w danych treningowych. Opłata jest naliczana za znaki w zestawie treningowym zarówno w języku źródłowym, jak i docelowym, ale obowiązuje limit, który ogranicza maksymalną opłatę za przebieg trenowania niezależnie od liczby znaków w danych treningowych. Ten limit jest stosowany dla przebiegów trenowania oddzielnie, tzn. opłata zostanie naliczona, jeśli ponownie uruchomisz trenowanie przy użyciu tego samego zestawu.
    3. Tłumaczenie: Opłata jest naliczana za każdy znak tekstu przetłumaczonego przez model tłumaczenia niestandardowego.
  • Warstwy S1–S4 zaprojektowano tak, aby zapewnić rabaty użytkownikom, którzy co miesiąc tłumaczą duże ilości tekstu w ramach tłumaczenia standardowego, ale nie niestandardowego. W przypadku warstw S1–S4 stawka za tłumaczenie standardowe podlega rabatowi, natomiast nie obowiązuje żaden rabat na tłumaczenie niestandardowe. Warstwy C2–C4 mają zapewnić rabaty klientom, którzy regularnie tłumaczą duże ilości tekstu, korzystając z tłumaczenia niestandardowego. W przypadku warstw C2–C4 stawka za tłumaczenie niestandardowe podlega rabatowi, natomiast nie obowiązuje żaden rabat na tłumaczenie standardowe.

  • Aby uzyskać rabaty ilościowe zarówno na tłumaczenie standardowe, jak i niestandardowe, musisz alokować wystąpienie S1–S4 oraz wystąpienie C2–C4, i skierować tłumaczenie standardowe do wystąpienia S, a tłumaczenie niestandardowe do wystąpienia C.

Zasoby

Oszacuj miesięczne koszty usług systemu Azure

Przejrzyj często zadawane pytania na temat cennika platformy Azure

Dowiedz się więcej o Cognitive Services

Przejrzyj samouczki techniczne, materiały wideo i inne zasoby

Dodano do oszacowania. Naciśnij klawisz „v”, aby wyświetlić w kalkulatorze

Rozpocznij naukę i tworzenie ze środkami w wysokości $200 i kontynuuj korzystanie z bezpłatnych opcji