Przejdź do głównej zawartości
Azure

Azure OpenAI Service — cennik

Przegląd cen dotyczących usługi Azure OpenAI Service

Usługa Azure OpenAI Service zapewnia gotową do użycia w przedsiębiorstwie funkcję generatywnej AI z zaawansowanymi modelami OpenAI, dzięki czemu organizacje mogą wprowadzać innowacje za pomocą funkcji tekstu, dźwięku i przetwarzania obrazów. Poza najnowocześniejszymi modelami firmy wybierają usługę Azure OpenAI Service, aby zapewnić wbudowaną prywatność danych, elastyczność regionalną/obszarową/globalną oraz bezproblemową integrację z ekosystemem platformy Azure, w tym Fabric, Cosmos DB i Azure AI Search. Firmy wszystkich rozmiarów mogą bez obaw skalować rozwiązania sztucznej inteligencji, aby ulepszać środowisko klienta, zautomatyzować przepływy pracy i odblokować potencjał twórczy, co zwiększa wymierny wpływ i konkurencyjne zróżnicowanie.

Aby pomóc klientom w podróży, oferujemy rozwiązania do zarządzania cenami i kosztami spełniające Twoje potrzeby, w tym:
  • Warstwa Standardowa (na żądanie): płatności zgodnie z rzeczywistym użyciem dla tokenów wejściowych i wyjściowych.
  • Aprowizowane (PTU): Przydziel przepływność z przewidywalnymi kosztami, z dostępnymi rezerwacjami miesięcznymi i rocznymi na potrzeby zmniejszenia ogólnych wydatków.
  • Interfejs API Batch: Modele językowe są teraz również dostępne w interfejsie API Batch dla wdrożeń globalnych i w trzech regionach, który zwraca uzupełnienia w ciągu 24 godzin za 50% od globalnej ceny standardowej.
Możesz wybrać spośród następujących typów wdrożeń standardowych i aprowizowanych, które zapewniają większą elastyczność i kontrolę nad cenami i wydajnością. Ta elastyczność pomaga w przypadku coraz bardziej restrykcyjnych granic przetwarzania danych oraz potrzeby zwiększenia przepływności i obniżenia cen.
  • Globalne wdrożenie — globalna jednostka SKU
  • Wdrożenie według strefy danych – oparte na geografii (UE lub Stany Zjednoczone)
  • Wdrożenie regionalne — region lokalny (do 27 regionów)

Eksplorowanie opcji cennika

Zastosuj filtry, aby dostosować opcje cennika do własnych potrzeb.

Ceny są jedynie szacunkowe i nie stanowią rzeczywistych ofert cenowych. Rzeczywiste ceny mogą się różnić w zależności od typu umowy zawartej z firmą Microsoft, daty zakupu i kursu wymiany walut. Ceny są obliczane na podstawie kursu dolara amerykańskiego i przeliczane przy użyciu londyńskich kursów zamknięcia typu spot z dwóch dni roboczych przed ostatnim dniem roboczym końca poprzedniego miesiąca. Jeżeli dwa dni robocze poprzedzające koniec miesiąca przypadają na dni świąteczne na głównych rynkach, dniem ustalenia kursu jest zazwyczaj dzień bezpośrednio poprzedzający te dwa dni robocze. Ten kurs dotyczy wszystkich transakcji w nadchodzącym miesiącu. Zaloguj się do kalkulatora cen platformy Azure, aby zobaczyć ceny na podstawie bieżącego programu/oferty firmy Microsoft. Skontaktuj się ze specjalistą ds. sprzedaży platformy Azure, aby uzyskać więcej informacji na temat cen lub poprosić o wycenę. Zobacz często zadawane pytania dotyczące cen platformy Azure.

o3

o3 is a powerful reasoning model from the o-series of reasoning models, pushing the frontier across coding, math, science, and visual perception. It excels in complex queries requiring multi-faceted analysis and performs strongly in visual tasks like analyzing images, charts, and graphics. The model features a 200k token context window and has a knowledge cutoff of June 2024.

Model Cennik (1 mln tokenów) Ceny z interfejsem API usługi Batch (1 mln tokenów)
o3 2025-04-16 Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy

o4-mini

o4-mini is a compact, efficient, and cost-effective reasoning model from OpenAI's o-series. It excels in math, coding, and visual tasks. The model features a 200k token context window and has a knowledge cutoff of June 2024.

Model Cennik (1 mln tokenów) Ceny z interfejsem API usługi Batch (1 mln tokenów)
o4-mini 2025-04-16 Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy

GPT-4.1 series

GPT-4.1 series is a highly advanced general-purpose model with extensive world knowledge and an enhanced ability to understand user intent, making it particularly adept at creative tasks and agentic planning. The series features a 1 million token context window and has a knowledge cutoff of June 2024

Model Cennik (1 mln tokenów) Ceny z interfejsem API usługi Batch (1 mln tokenów)
GPT-4.1-2025-04-14 Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy
GPT-4.1-mini-2025-04-14 Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy
GPT-4.1-nano-2025-04-14 Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy

GPT-4.5

Model GPT-4.5 w wersji zapoznawczej to najnowszy model ogólnego przeznaczenia z dogłębną wiedzą o świecie i lepszym zrozumieniem intencji użytkownika, który dobrze sobie radzi z kreatywnymi zadaniami i planowaniem. Model ma kontekst 128 KB i limit wiedzy z października 2023 r.

Model Cennik (1 mln tokenów) Ceny z interfejsem API usługi Batch (1 mln tokenów)
Model GPT-4.5 w wersji zapoznawczej – 27 lutego 2025 — wersja globalna Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy

o1

o1 to nowa seria modeli określania przyczyn dla złożonych zadań. Model ma kontekst 200 KB i limit wiedzy z października 2023 r.

Model Cennik (1 mln tokenów) Ceny z interfejsem API usługi Batch (1 mln tokenów)
o1 2024-12-17 Globalny Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy
o1 2024-12-17 US/EU — strefy danych Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy
o1 2024-12-17 Regionalny Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy
o1 wersja zapoznawcza 2024-09-12 Globalny Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy
o1 wersja zapoznawcza 2024-09-12 US/UE — strefy danych Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy
o1 wersja zapoznawcza 2024-09-12 Regionalny Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy

Planowanie za pomocą kalkulatora cen

o3 Mini

Model o3 mini to zaktualizowana wersja modelu o1 mini. Model o3-mini to szybki, ekonomiczny model wnioskowania dostosowany do przypadków użycia kodowania, matematyki i nauki.

Model o3-mini zapewnia teraz rozszerzone kontekstowe okno wprowadzania 200 000 tokenów i maksymalne dane wyjściowe wynoszące 100 000 tokenów, co zapewnia dużą ilość miejsca na złożone i szczegółowe odpowiedzi. Model o1 mini ma dane wejściowe kontekstu wynoszące 128 000. Modele o3 i o1 mają próg wiedzy z października 2023 r.

Model Cennik (1 mln tokenów) Ceny z interfejsem API usługi Batch (1 mln tokenów)
o3 mini 2025-01-31 Globalny Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Dane wejściowe: $-
Dane wyjściowe: $-
o3 mini 2025-01-31-US/EU — strefy danych Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Dane wejściowe: $-
Dane wyjściowe: $-
o3 mini 2025-01-31 Regionalny Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy
o1-mini 2024-09-12 Globalny Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy
o1-mini 2024-09-12 US/EU — strefy danych Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy
o1-mini 2024-09-12 Regionalny Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy

Planowanie za pomocą kalkulatora cen

Agent korzystający z komputera (CUA)

Agent Używający Komputera (CUA) to wyspecjalizowany model sztucznej inteligencji, który pozwala AI na interakcję z graficznymi interfejsami użytkownika (GUI), nawigowanie po aplikacjach oraz automatyzowanie zadań wieloetapowych — wszystko to za pomocą instrukcji w języku naturalnym. Model CUA może być wykorzystywany jako narzędzie w interfejsie API odpowiedzi.

Model Ceny
podgląd użycia komputera w wersji globalnej Dane wejściowe: $- / 1 mln tokenów
Dane wyjściowe: $- / 1 mln tokenów

Wbudowane narzędzia

Interfejs API odpowiedzi i interfejs API asystentów umożliwiają płynne interakcje z narzędziami, takimi jak korzystanie z komputera, interpreter kodu, wywoływanie funkcji oraz wyszukiwanie plików, co ułatwia deweloperom tworzenie agentów AI.

Narzędzie Dane wejściowe
Użycie komputera (tylko API odpowiedzi) Dane wejściowe: $- / 1 mln tokenów
Dane wyjściowe: $- / 1 mln tokenów
Wywołanie narzędzia wyszukiwania plików (tylko interfejs API odpowiedzi) wywołania narzędzi $-/1K
Wyszukiwanie plików* $-/GB magazynu wektorowego dziennie (1 GB bezpłatnie)
Interpreter kodu** $-/sesja

*GB odnosi się do gigabajtów danych binarnych, gdzie 1 GB to 2^30 bajtów.

**Jeśli asystent wywoła interpreter kodu jednocześnie w dwóch różnych wątkach, spowoduje to utworzenie dwóch sesji interpretera kodu (2 * $-). Każda sesja jest domyślnie aktywna przez godzinę, co oznacza, że tę opłatę należy uiścić tylko raz, jeśli użytkownik będzie nadal udzielać instrukcji interpreterowi kodu w tym samym wątku przez maksymalnie jedną godzinę.

Koszt wnioskowania (dane wejściowe i wyjściowe) zależy od modelu GPT używanego z każdym asystentem. Jeśli asystent wywoła interpretera kodu jednocześnie w dwóch różnych wątkach, spowoduje to utworzenie dwóch sesji interpretera kodu (2 * $-). Każda sesja jest domyślnie aktywna przez godzinę, co oznacza, że cena dotyczy maksymalnie jednej godziny wydawania poleceń interpreterowi kodu w tym samym wątku.

Interfejs API czasu rzeczywistego

Interfejs GPT-4o-Realtime-Preview, który jest polecany na platformie Realtime API, obsługuje wielojęzyczne funkcje zamiany mowy na mowę. Zoptymalizowane pod kątem konwersacji o małych opóźnieniach w czasie rzeczywistym, umożliwiają naturalne interakcje z minimalnym opóźnieniem, idealne dla czatbotów i konwersacyjnej sztucznej inteligencji. Model GPT-4o to kompleksowa, bardziej zaawansowana wersja przeznaczona do złożonych zadań, natomiast GPT-4o Mini to mniejsza, bardziej przystępna cenowo opcja, idealna dla prostszych aplikacji, w których priorytetem jest efektywność kosztowa i szybkość.

Model Cennik (1 mln tokenów)
GPT-4o-Realtime-Preview-2024-12-17-Global Tekst
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-

Audio
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-Realtime-Preview-2024-12-17-US/EU — strefy danych Tekst
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-

Audio
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-Realtime-Preview-2024-12-17-Regional Tekst
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-

Audio
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global Tekst
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-

Audio
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU — strefy danych Tekst
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-

Audio
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional Tekst
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-

Audio
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-Realtime-Preview-2024-10-01-Global Tekst
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-

Audio
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-Realtime-Preview-2024-10-01-US/EU — strefy danych Tekst
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-

Audio
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-Realtime-Preview-2024-10-01-Regional Tekst
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-

Audio
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-

Interfejs API uzupełniania czatu

Model GPT 4o-Audio-Preview, który jest polecany w interfejsie API uzupełniania czatu, przetwarza i generuje zawartość audio. Obsługuje zaawansowane funkcje, takie jak rozpoznawanie mowy i synteza dźwięku, idealne do asynchronicznych interakcji mowy i analizy tonacji. Model GPT-4o to kompleksowa, bardziej zaawansowana wersja przeznaczona do złożonych zadań, natomiast GPT-4o Mini to mniejsza, bardziej przystępna cenowo opcja, idealna dla prostszych aplikacji, w których priorytetem jest efektywność kosztowa i szybkość.

Model Cennik (1 mln tokenów)
GPT-4o-Audio-Preview-2024-12-17-Global Tekst
Dane wejściowe: $-
Dane wyjściowe: $-

Audio
Dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-Audio-Preview-2024-12-17-US/EU — strefy danych Tekst
Dane wejściowe: $-
Dane wyjściowe: $-

Audio
Dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-Audio-Preview-2024-12-17-Regional Tekst
Dane wejściowe: $-
Dane wyjściowe: $-

Audio
Dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Global Tekst
Dane wejściowe: $-
Dane wyjściowe: $-

Audio
Dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU — strefy danych Tekst
Dane wejściowe: $-
Dane wyjściowe: $-

Audio
Dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional Tekst
Dane wejściowe: $-
Dane wyjściowe: $-

Audio
Dane wejściowe: $-
Dane wyjściowe: $-

GPT-4o

GPT-4o to najbardziej zaawansowany model wielomodalny, który jest szybszy i tańszy niż GPT-4 Turbo z silniejszymi możliwościami przetwarzania obrazów. Model ma kontekst 128 KB i limit wiedzy z października 2023 r.

Model Cennik (1 mln tokenów) Ceny z interfejsem API usługi Batch (1 mln tokenów)
GPT-4o-2024-1120 — globalna Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-2024-1120 USA/UE — strefy danych Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-2024-1120 — regionalna Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy
GPT-4o-2024-08-06 – Globalny Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-2024-08-06 USA/UE — strefy danych Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-2024-08-06 — regionalna Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy
GPT-4o-2024-0513 – Globalny Dane wejściowe: $-
Dane wyjściowe: $-
Dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-2024-0513 US/EU — strefy danych Dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy
GPT-4o-2024-0513 — regionalna Dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy

Planowanie za pomocą kalkulatora cen

GPT-4o mini

GPT-4o mini to najbardziej ekonomiczny mały model i ma możliwości przetwarzania obrazów. Model ma kontekst 128 KB i limit wiedzy z października 2023 r.

Model Cennik (1 mln tokenów) Ceny z interfejsem API usługi Batch (1 mln tokenów)
GPT-4o-mini-0718 — globalny Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-mini-0718 US/EU — strefy danych Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-mini-0718 — regionalny Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy

Planowanie za pomocą kalkulatora cen

Aprowizowano

Możesz przydzielać przepływność wdrożeń i zarządzać nią, zapewniając przewidywalną wydajność i stabilną pojemność. Opłaty są naliczane godzinowo za model niezależnie od użycia, ale możesz również zapewnić dodatkowe oszczędności dzięki rezerwacjom miesięcznym i rocznym. Dowiedz się, jak przenieść wdrożenia regionalne i aprowizowane rezerwacje do stref globalnych i stref danych na tej stronie Learn.

Model Minimalna liczba jednostek PTU Cennik godzinny PTU Cennik miesięcznych rezerwacji PTU Cennik rocznej rezerwacji PTU
GPT-4o – Globalny 15 $- $- $-
Strefy danych GPT-4o w US/UE 15 $- $- $-
Regionalny model GPT-4o 50 $- $- $-
Dostosowany GPT-4o-regionalne 50 $- $- $-
GPT-4o Mini Global 15 $- $- $-
Strefa danych GPT-4o Mini US/EU 15 $- $- $-
Mini regionalny model GPT-4o 25 $- $- $-
Dostosowany GPT-4o-Mini regionalne 25 $- $- $-

Planowanie za pomocą kalkulatora cen

Modele podstawowe

Modele Użycie na 1000 tokenów
Babbage-002 $-
Davinci-002 $-

Dostrajanie modeli

Model Ceny
GPT-4.1 Regionalny Dane wejściowe: $- / 1 mln tokenów
Buforowane dane wejściowe: $- / 1 mln tokenów
Dane wyjściowe: $- / 1 mln tokenów
Szkolenia: $- / 1 mln tokenów
Hosting: $-/godz.
Cały świat Dane wejściowe: $- / 1 mln tokenów
Buforowane dane wejściowe: $- / 1 mln tokenów
Dane wyjściowe: $- / 1 mln tokenów
Szkolenia: $- / 1 mln tokenów
Hosting: $-/godz.
GPT-4.1-mini Regionalny Dane wejściowe: $- / 1 mln tokenów
Buforowane dane wejściowe: $- / 1 mln tokenów
Dane wyjściowe: $- / 1 mln tokenów
Szkolenia: $- / 1 mln tokenów
Hosting: $-/godz.
Cały świat Dane wejściowe: $- / 1 mln tokenów
Buforowane dane wejściowe: $- / 1 mln tokenów
Dane wyjściowe: $- / 1 mln tokenów
Szkolenia: $- / 1 mln tokenów
Hosting: $-/godz.
GPT-4o-2024-08-06 Regionalny Dane wejściowe: $- / 1 mln tokenów
Buforowane dane wejściowe: $- / 1 mln tokenów
Dane wyjściowe: $- / 1 mln tokenów
Szkolenia: $- / 1 mln tokenów
Hosting: $-/godz.
Cały świat Dane wejściowe: $- / 1 mln tokenów
Buforowane dane wejściowe: $- / 1 mln tokenów
Dane wyjściowe: $- / 1 mln tokenów
Szkolenia: użyj regionalnej
Hosting: $-/godz.
GPT-4o-mini Regionalny Dane wejściowe: $- / 1 mln tokenów
Buforowane dane wejściowe: $- / 1 mln tokenów
Dane wyjściowe: $- / 1 mln tokenów
Szkolenia: $- / 1 mln tokenów
Hosting: $-/godz.
Cały świat Dane wejściowe: $- / 1 mln tokenów
Buforowane dane wejściowe: $- / 1 mln tokenów
Dane wyjściowe: $- / 1 mln tokenów
Szkolenia: użyj regionalnej
Hosting: $-/godz.
GPT-3.5-Turbo (16K) Regionalny Dane wejściowe: $- / 1 mln tokenów
Dane wyjściowe: $- / 1 mln tokenów
Szkolenia: $- / 1 mln tokenów
Hosting: $-/godz.
GPT-3.5-Turbo (4K) Regionalny Dane wejściowe: $- / 1 mln tokenów
Dane wyjściowe: $- / 1 mln tokenów
Szkolenia: $- / 1 mln tokenów
Hosting: $-/godz.

Modele obrazów

Modele Jakość Rozdzielczość Cena (za 100 obrazów)
Dall-E-3 Standardowa 1024 * 1024 $-
Standardowa 1024 * 1792,
1792 * 1024
$-
Dall-E-3 HD 1024 * 1024 $-
HD 1024 * 1792,
1792 * 1024
$-
Dall-E-2 Standardowa 1024 * 1024 $-

Osadzanie modeli

Modele Na 1000 tokenów
Ada $-
text-embedding-3-large $-
text-embedding-3-small $-

Modele mowy

Modele Cena
Szept $-/godz.
TTS (zamiana tekstu na mowę) $-/1 mln znaków
TTS HD $-/1 mln znaków

Starsze modele językowe

Modele Kontekst Dane wejściowe (na 1 mln tokenów) Dane wejściowe (na 1 mln tokenów)
GPT-3.5-Turbo-0301 4K $- $-
GPT-3.5-Turbo-0613 4K $- $-
GPT-3.5-Turbo-0613 16K $- $-
GPT-3.5-Turbo-1106 16K $- $-
GPT-3.5-Turbo-0125 16K $- $-
GPT-3.5-Turbo-Instruct 4K $- $-
GPT-4-Turbo 128K $- $-
GPT-4-Turbo-Vision 128K $- $-
GPT-4 8K $- $-
GPT-4 32K $- $-

Opcje cen i zakupu platformy Azure

Skontaktuj się z nami bezpośrednio

Zapoznaj się z przewodnikiem dotyczącym cen platformy Azure. Poznaj ceny rozwiązania w chmurze, dowiedz się więcej o optymalizacji kosztów i poproś o ofertę niestandardową.

Rozmowa ze specjalistą ds. sprzedaży

Zobacz sposoby zakupu

Kup usługi platformy Azure za pośrednictwem witryny internetowej platformy Azure, przedstawiciela firmy Microsoft lub partnera platformy Azure.

Poznaj swoje opcje

Dodatkowe zasoby

Azure OpenAI Service

Dowiedz się więcej o funkcjach i możliwościach produktu Azure OpenAI Service.

Kalkulator cen

Oszacuj oczekiwane miesięczne koszty używania dowolnej kombinacji produktów platformy Azure.

Umowa SLA

Przejrzyj Umowę dotyczącą poziomu usług dla produktu Azure OpenAI Service.

Dokumentacja

Przejrzyj samouczki techniczne, materiały wideo i inne zasoby dotyczące produktu Azure OpenAI Service.

  • Usługa Azure OpenAI Service oferuje ceny na podstawie zarówno jednostek rozliczanych według płatności zgodnie z rzeczywistym użyciem oraz aprowizowanej przepływności (PTU). Płatność zgodnie z rzeczywistym użyciem umożliwia płacenie za używane zasoby, dzięki czemu jest ona elastyczna w przypadku zmiennych obciążeń. Jednostki PTU oferują przewidywalny model cen, w którym rezerwujesz i wdrażasz określoną ilość pojemności przetwarzania modelu. Ten model jest idealny dla obciążeń ze spójnymi lub przewidywalnymi wzorcami użycia, zapewniając stabilność i kontrolę kosztów.
  • Aby dowiedzieć się więcej na temat jednostek PTU i cen platformy Azure OpenAI, przeczytaj dokumentację dotyczącą jednostek PTU lub skontaktuj się z naszym specjalistą ds. sprzedaży.

Porozmawiaj ze specjalistą ds. sprzedaży, który przedstawi Ci cennik platformy Azure. Zapoznaj się z informacjami o cenach swojego rozwiązania w chmurze.

Uzyskaj bezpłatne usługi online i $200 środków na eksplorowanie platformy Azure przez 30 dni.

Dodano do oszacowania. Naciśnij klawisz „v”, aby wyświetlić w kalkulatorze