Przejdź do głównej zawartości
Azure

Azure OpenAI Service — cennik

Przegląd cen dotyczących usługi Azure OpenAI Service

Usługa Azure OpenAI Service zapewnia gotową do użycia w przedsiębiorstwie funkcję generatywnej AI z zaawansowanymi modelami OpenAI, dzięki czemu organizacje mogą wprowadzać innowacje za pomocą funkcji tekstu, dźwięku i przetwarzania obrazów. Poza najnowocześniejszymi modelami firmy wybierają usługę Azure OpenAI Service, aby zapewnić wbudowaną prywatność danych, elastyczność regionalną/obszarową/globalną oraz bezproblemową integrację z ekosystemem platformy Azure, w tym Fabric, Cosmos DB i Azure AI Search. Firmy wszystkich rozmiarów mogą bez obaw skalować rozwiązania sztucznej inteligencji, aby ulepszać środowisko klienta, zautomatyzować przepływy pracy i odblokować potencjał twórczy, co zwiększa wymierny wpływ i konkurencyjne zróżnicowanie.

Aby pomóc klientom w podróży, oferujemy rozwiązania do zarządzania cenami i kosztami spełniające Twoje potrzeby, w tym:
  • Warstwa Standardowa (na żądanie): płatności zgodnie z rzeczywistym użyciem dla tokenów wejściowych i wyjściowych.
  • Aprowizowane (PTU): Przydziel przepływność z przewidywalnymi kosztami, z dostępnymi rezerwacjami miesięcznymi i rocznymi na potrzeby zmniejszenia ogólnych wydatków.
  • Interfejs API Batch: Modele językowe są teraz również dostępne w interfejsie API Batch dla wdrożeń globalnych i w trzech regionach, który zwraca uzupełnienia w ciągu 24 godzin za 50% od globalnej ceny standardowej.
Możesz wybrać spośród następujących typów wdrożeń standardowych i aprowizowanych, które zapewniają większą elastyczność i kontrolę nad cenami i wydajnością. Ta elastyczność pomaga w przypadku coraz bardziej restrykcyjnych granic przetwarzania danych oraz potrzeby zwiększenia przepływności i obniżenia cen.
  • Globalne wdrożenie — globalna jednostka SKU
  • Wdrożenie według strefy danych – oparte na geografii (UE lub Stany Zjednoczone)
  • Wdrożenie regionalne — region lokalny (do 27 regionów)

Eksplorowanie opcji cennika

Zastosuj filtry, aby dostosować opcje cennika do własnych potrzeb.

Ceny są jedynie szacunkowe i nie stanowią rzeczywistych ofert cenowych. Rzeczywiste ceny mogą się różnić w zależności od typu umowy zawartej z firmą Microsoft, daty zakupu i kursu wymiany walut. Ceny są obliczane na podstawie kursu dolara amerykańskiego i przeliczane przy użyciu londyńskich kursów zamknięcia typu spot z dwóch dni roboczych przed ostatnim dniem roboczym końca poprzedniego miesiąca. Jeżeli dwa dni robocze poprzedzające koniec miesiąca przypadają na dni świąteczne na głównych rynkach, dniem ustalenia kursu jest zazwyczaj dzień bezpośrednio poprzedzający te dwa dni robocze. Ten kurs dotyczy wszystkich transakcji w nadchodzącym miesiącu. Zaloguj się do kalkulatora cen platformy Azure, aby zobaczyć ceny na podstawie bieżącego programu/oferty firmy Microsoft. Skontaktuj się ze specjalistą ds. sprzedaży platformy Azure, aby uzyskać więcej informacji na temat cen lub poprosić o wycenę. Zobacz często zadawane pytania dotyczące cen platformy Azure.

GPT-5 series

Model Cennik (1 mln tokenów)
GPT-5 2025-08-07 Global Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
GPT-5 Data Zone Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
GPT-5-mini Global Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
GPT-5-mini Data Zone Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
GPT-5-nano Global Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
GPT-5-nano Data Zone Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
GPT-5 chat Global Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-

Deep Research

Deep Research enables developers and enterprises to automate complex research tasks with structured, citation-rich answers. It is suitable for building customer support bots, internal knowledge assistants, or market analysis tools. Deep Research delivers transparent, auditable insights grounded in real-time web data. Search context tokens are charged input token prices for the model being used. You’ll separately incur charges for Grounding with Bing Search and the base GPT model being used for clarifying questions.

Model Ceny
o3-deep research Global Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-

o3

o3 to zaawansowany model wnioskowania z serii o-series modeli wnioskowania, który przesuwa granicę między kodowaniem, matematyką, nauką i percepcją wizualną. Sprawdza się doskonale w przypadku złożonych zapytań wymagających analizy wieloaspektowej i działa skutecznie w przypadku zadań wizualnych, takich jak analizowanie obrazów, wykresów i grafik. Model zawiera okno kontekstu obejmujące 200 tys. tokenów i ma limit wiedzy z czerwca 2024 r.

Model Cennik (1 mln tokenów) Ceny z interfejsem API usługi Batch (1 mln tokenów)
o3 2025-04-16 Globalny Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Dane wejściowe: $-
Dane wyjściowe: $-
o3 2025-04-16 Strefa danych Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Dane wejściowe: $-
Dane wyjściowe: $-
o3 2025-04-16 Regionalny Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy

o4-mini

O4-mini to kompaktowy, wydajny i ekonomiczny model wnioskowania z serii o-series firmy OpenAI. Sprawdza się w zadaniach matematycznych, kodowaniu i zadaniach wizualnych. Model zawiera okno kontekstu obejmujące 200 tys. tokenów i ma limit wiedzy z czerwca 2024 r.

Model Cennik (1 mln tokenów) Ceny z interfejsem API usługi Batch (1 mln tokenów)
o4-mini 2025-04-16 Globalny Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Dane wejściowe: $-
Dane wyjściowe: $-
o4-mini 2025-04-16 Strefa danych Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Dane wejściowe: $-
Dane wyjściowe: $-
o4-mini 2025-04-16 Regionalny Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy

Seria GPT-4.1

Seria GPT-4.1 to wysoce zaawansowany model ogólnego przeznaczenia z obszerną wiedzą o świecie i ulepszoną możliwością interpretacji intencji użytkownika, co sprawia, że jest on szczególnie przydatny w zadaniach twórczych i planowaniu agentycznym. Ta seria zawiera okno kontekstu obejmujące 1 mln tokenów i ma limit wiedzy z czerwca 2024 roku.

Model Cennik (1 mln tokenów) Ceny z interfejsem API usługi Batch (1 mln tokenów)
GPT-4.1-2025-04-14 Globalny Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Dane wejściowe: $-
Dane wyjściowe: $-
GPT-4.1-2025-04-14 Strefa danych Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Dane wejściowe: $-
Dane wyjściowe: $-
GPT-4.1-2025-04-14 Regionalny Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy
GPT-4.1-mini-2025-04-14 Globalny Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Dane wejściowe: $-
Dane wyjściowe: $-
GPT-4.1-mini-2025-04-14 Strefa danych Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Dane wejściowe: $-
Dane wyjściowe: $-
GPT-4.1-mini-2025-04-14 Regionalny Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy
GPT-4.1-nano-2025-04-14 Globalny Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Dane wejściowe: $-
Dane wyjściowe: $-
GPT-4.1-nano-2025-04-14 Strefa danych Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Dane wejściowe: $-
Dane wyjściowe: $-
GPT-4.1-nano-2025-04-14 Regionalny Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy

Model Sora w usłudze Azure OpenAI

Sora to wielomodalny model generatywnej sztucznej inteligencji, który jest teraz dostępny w usłudze Azure AI Foundry, zaprojektowany z myślą o ułatwianiu zespołom kreatywnym wprowadzania pomysłów w życie dzięki bezproblemowej integracji z interfejsem API. Oparty na infrastrukturze klasy korporacyjnej platformy Azure oferuje bezpieczne, skalowalne wdrożenie umożliwiające przekształcanie koncepcji w zawartość wizualną o wysokiej jakości.

Cena na sekundę 1–5 s 6–10 s 11–15 s 16–20 s
480 Square Global $- $- $- $-
480p Global $- $- $- $-
480 Square Regional $- $- $- $-
480p Regional $- $- $- $-
720 Square Global $- $- $- $-
720p Global $- $- $- $-
720 Square Regional $- $- $- $-
720p Regional $- $- $- $-
1080 Square Global $- $- $- $-
1080p Global $- $- $- $-
1080 Square Regional $- $- $- $-
1080p Regional $- $- $- $-

GPT-Image-1

Model GPT-image-1 ulepsza model DALL·E, oferując lepsze przestrzeganie instrukcji, dokładne renderowanie tekstu oraz wsparcie dla wprowadzania i edytowania obrazów. Model jest wyceniany na podstawie tokenów, z różnymi cenami dla tokenów tekstowych i obrazowych.

Model Cennik (1 mln tokenów) Ceny z interfejsem API usługi Batch (1 mln tokenów)
GPT-Image-1 Global Tekst wejściowy: $-
Obraz wejściowy: $-
Obraz wyjściowy: $-
Nie dotyczy
GPT-Image-1 Regional Tekst wejściowy: $-
Obraz wejściowy: $-
Obraz wyjściowy: $-
Nie dotyczy
Strefa danych GPT-Image-1 Tekst wejściowy: $-
Obraz wejściowy: $-
Obraz wyjściowy: $-
Nie dotyczy

GPT-4.5

Model GPT-4.5 w wersji zapoznawczej to najnowszy model ogólnego przeznaczenia z dogłębną wiedzą o świecie i lepszym zrozumieniem intencji użytkownika, który dobrze sobie radzi z kreatywnymi zadaniami i planowaniem. Model ma kontekst 128 KB i limit wiedzy z października 2023 r.

Model Cennik (1 mln tokenów) Ceny z interfejsem API usługi Batch (1 mln tokenów)
Model GPT-4.5 w wersji zapoznawczej – 27 lutego 2025 — wersja globalna Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy

o1

o1 to nowa seria modeli określania przyczyn dla złożonych zadań. Model ma kontekst 200 KB i limit wiedzy z października 2023 r.

Model Cennik (1 mln tokenów) Ceny z interfejsem API usługi Batch (1 mln tokenów)
o1 2024-12-17 Globalny Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy
o1 2024-12-17 US/EU — strefy danych Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy
o1 2024-12-17 Regionalny Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy
o1 wersja zapoznawcza 2024-09-12 Globalny Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy
o1 wersja zapoznawcza 2024-09-12 US/UE — strefy danych Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy
o1 wersja zapoznawcza 2024-09-12 Regionalny Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy

Planowanie za pomocą kalkulatora cen

o3 Mini

Model o3 mini to zaktualizowana wersja modelu o1 mini. Model o3-mini to szybki, ekonomiczny model wnioskowania dostosowany do przypadków użycia kodowania, matematyki i nauki.

Model o3-mini zapewnia teraz rozszerzone kontekstowe okno wprowadzania 200 000 tokenów i maksymalne dane wyjściowe wynoszące 100 000 tokenów, co zapewnia dużą ilość miejsca na złożone i szczegółowe odpowiedzi. Model o1 mini ma dane wejściowe kontekstu wynoszące 128 000. Modele o3 i o1 mają próg wiedzy z października 2023 r.

Model Cennik (1 mln tokenów) Ceny z interfejsem API usługi Batch (1 mln tokenów)
o3 mini 2025-01-31 Globalny Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Dane wejściowe: $-
Dane wyjściowe: $-
o3 mini 2025-01-31-US/EU — strefy danych Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Dane wejściowe: $-
Dane wyjściowe: $-
o3 mini 2025-01-31 Regionalny Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy
o1-mini 2024-09-12 Globalny Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy
o1-mini 2024-09-12 US/EU — strefy danych Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy
o1-mini 2024-09-12 Regionalny Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy

Planowanie za pomocą kalkulatora cen

Modele audio

Usługa Azure OpenAI zawiera zaawansowane modele audio GPT-4o-Transcribe, GPT-4o-Mini-Transcribe i GPT-4o-Mini-TTS. Te modele rozszerzają możliwości zamiany mowy na tekst i zamiany tekstu na mowę, oferując wysoką dokładność i dostosowywalne dane wyjściowe mowy dla różnych zastosowań. Idealne rozwiązanie dla centrów obsługi klientów, napisów na żywo i interakcyjnych danych wyjściowych głosowych, wykorzystuje rozbudowane techniki wstępnego trenowania i techniki zaawansowanej destylacji w celu uzyskania najwyższej wydajności.

Model Cennik (1 mln tokenów) Ceny z interfejsem API usługi Batch (1 mln tokenów)
GPT-4o-Transcribe Tekst
Dane wejściowe: $-
Dane wyjściowe: $-

Audio
Dane wejściowe: $-
Dane wyjściowe: Nie dotyczy
Nie dotyczy
GPT-4o-Mini-Transcribe Tekst
Dane wejściowe: $-
Dane wyjściowe: $-

Audio
Dane wejściowe: $-
Dane wyjściowe: Nie dotyczy
Nie dotyczy
GPT-4o-Mini-TTS Tekst
Dane wejściowe: $-
Dane wyjściowe: Nie dotyczy

Audio
Dane wejściowe: Nie dotyczy
Dane wyjściowe: $-
Nie dotyczy

Agent korzystający z komputera (CUA)

Agent Używający Komputera (CUA) to wyspecjalizowany model sztucznej inteligencji, który pozwala AI na interakcję z graficznymi interfejsami użytkownika (GUI), nawigowanie po aplikacjach oraz automatyzowanie zadań wieloetapowych — wszystko to za pomocą instrukcji w języku naturalnym. Model CUA może być wykorzystywany jako narzędzie w interfejsie API odpowiedzi.

Model Ceny
podgląd użycia komputera w wersji globalnej Dane wejściowe: $- / 1 mln tokenów
Dane wyjściowe: $- / 1 mln tokenów

Wbudowane narzędzia

Interfejs API odpowiedzi i interfejs API asystentów umożliwiają płynne interakcje z narzędziami, takimi jak korzystanie z komputera, interpreter kodu, wywoływanie funkcji oraz wyszukiwanie plików, co ułatwia deweloperom tworzenie agentów AI.

Narzędzie Dane wejściowe
Użycie komputera (tylko API odpowiedzi) Dane wejściowe: $- / 1 mln tokenów
Dane wyjściowe: $- / 1 mln tokenów
Wywołanie narzędzia wyszukiwania plików (tylko interfejs API odpowiedzi) wywołania narzędzi $-/1K
Wyszukiwanie plików* $-/GB magazynu wektorowego dziennie (1 GB bezpłatnie)
Interpreter kodu** $-/sesja

*GB odnosi się do gigabajtów danych binarnych, gdzie 1 GB to 2^30 bajtów.

**Jeśli asystent wywoła interpreter kodu jednocześnie w dwóch różnych wątkach, spowoduje to utworzenie dwóch sesji interpretera kodu (2 * $-). Każda sesja jest domyślnie aktywna przez godzinę, co oznacza, że tę opłatę należy uiścić tylko raz, jeśli użytkownik będzie nadal udzielać instrukcji interpreterowi kodu w tym samym wątku przez maksymalnie jedną godzinę.

Koszt wnioskowania (dane wejściowe i wyjściowe) zależy od modelu GPT używanego z każdym asystentem. Jeśli asystent wywoła interpretera kodu jednocześnie w dwóch różnych wątkach, spowoduje to utworzenie dwóch sesji interpretera kodu (2 * $-). Każda sesja jest domyślnie aktywna przez godzinę, co oznacza, że cena dotyczy maksymalnie jednej godziny wydawania poleceń interpreterowi kodu w tym samym wątku.

Interfejs API czasu rzeczywistego

Interfejs GPT-4o-Realtime-Preview, który jest polecany na platformie Realtime API, obsługuje wielojęzyczne funkcje zamiany mowy na mowę. Zoptymalizowane pod kątem konwersacji o małych opóźnieniach w czasie rzeczywistym, umożliwiają naturalne interakcje z minimalnym opóźnieniem, idealne dla czatbotów i konwersacyjnej sztucznej inteligencji. Model GPT-4o to kompleksowa, bardziej zaawansowana wersja przeznaczona do złożonych zadań, natomiast GPT-4o Mini to mniejsza, bardziej przystępna cenowo opcja, idealna dla prostszych aplikacji, w których priorytetem jest efektywność kosztowa i szybkość.

Model Cennik (1 mln tokenów)
GPT-4o-Realtime-Preview-2024-12-17-Global Tekst
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-

Audio
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-Realtime-Preview-2024-12-17-US/EU — strefy danych Tekst
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-

Audio
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-Realtime-Preview-2024-12-17-Regional Tekst
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-

Audio
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global Tekst
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-

Audio
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU — strefy danych Tekst
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-

Audio
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional Tekst
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-

Audio
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-Realtime-Preview-2024-10-01-Global Tekst
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-

Audio
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-Realtime-Preview-2024-10-01-US/EU — strefy danych Tekst
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-

Audio
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-Realtime-Preview-2024-10-01-Regional Tekst
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-

Audio
Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-

Interfejs API uzupełniania czatu

Model GPT 4o-Audio-Preview, który jest polecany w interfejsie API uzupełniania czatu, przetwarza i generuje zawartość audio. Obsługuje zaawansowane funkcje, takie jak rozpoznawanie mowy i synteza dźwięku, idealne do asynchronicznych interakcji mowy i analizy tonacji. Model GPT-4o to kompleksowa, bardziej zaawansowana wersja przeznaczona do złożonych zadań, natomiast GPT-4o Mini to mniejsza, bardziej przystępna cenowo opcja, idealna dla prostszych aplikacji, w których priorytetem jest efektywność kosztowa i szybkość.

Model Cennik (1 mln tokenów)
GPT-4o-Audio-Preview-2024-12-17-Global Tekst
Dane wejściowe: $-
Dane wyjściowe: $-

Audio
Dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-Audio-Preview-2024-12-17-US/EU — strefy danych Tekst
Dane wejściowe: $-
Dane wyjściowe: $-

Audio
Dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-Audio-Preview-2024-12-17-Regional Tekst
Dane wejściowe: $-
Dane wyjściowe: $-

Audio
Dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Global Tekst
Dane wejściowe: $-
Dane wyjściowe: $-

Audio
Dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU — strefy danych Tekst
Dane wejściowe: $-
Dane wyjściowe: $-

Audio
Dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional Tekst
Dane wejściowe: $-
Dane wyjściowe: $-

Audio
Dane wejściowe: $-
Dane wyjściowe: $-

GPT-4o

GPT-4o to najbardziej zaawansowany model wielomodalny, który jest szybszy i tańszy niż GPT-4 Turbo z silniejszymi możliwościami przetwarzania obrazów. Model ma kontekst 128 KB i limit wiedzy z października 2023 r.

Model Cennik (1 mln tokenów) Ceny z interfejsem API usługi Batch (1 mln tokenów)
GPT-4o-2024-1120 — globalna Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-2024-1120 USA/UE — strefy danych Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-2024-1120 — regionalna Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy
GPT-4o-2024-08-06 – Globalny Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-2024-08-06 USA/UE — strefy danych Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-2024-08-06 — regionalna Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy
GPT-4o-2024-0513 – Globalny Dane wejściowe: $-
Dane wyjściowe: $-
Dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-2024-0513 US/EU — strefy danych Dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy
GPT-4o-2024-0513 — regionalna Dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy

Planowanie za pomocą kalkulatora cen

GPT-4o mini

GPT-4o mini to najbardziej ekonomiczny mały model i ma możliwości przetwarzania obrazów. Model ma kontekst 128 KB i limit wiedzy z października 2023 r.

Model Cennik (1 mln tokenów) Ceny z interfejsem API usługi Batch (1 mln tokenów)
GPT-4o-mini-0718 — globalny Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-mini-0718 US/EU — strefy danych Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Dane wejściowe: $-
Dane wyjściowe: $-
GPT-4o-mini-0718 — regionalny Dane wejściowe: $-
Buforowane dane wejściowe: $-
Dane wyjściowe: $-
Nie dotyczy

Planowanie za pomocą kalkulatora cen

Aprowizowano

You can allocate and manage throughput for deployments, ensuring predictable performance and stable capacity. You are charged an hourly rate per model regardless of usage, but you can also secure additional savings through monthly and annual reservations. Discover how to transition your regional deployments and provisioned reservations to global and data zones on this Learn page.

Model Minimalna liczba jednostek PTU Cennik godzinny PTU Cennik miesięcznych rezerwacji PTU Cennik rocznej rezerwacji PTU
GPT-5 Global 15 $- $- $-
GPT-5 Data Zones 15 $- $- $-
GPT-5 Regional 50 $- $- $-
GPT-4.1, strefa globalna 15 $- $- $-
GPT-4.1, strefy danych 15 $- $- $-
GPT-4.1, strefa regionalna 50 $- $- $-
GPT-4.1-mini, strefa globalna 15 $- $- $-
GPT-4.1-mini, strefy danych USA/UE 15 $- $- $-
GPT-4.1-mini, strefa regionalna 25 $- $- $-
GPT-4.1-nano, strefa globalna 15 $- $- $-
GPT-4.1-nano, strefy danych USA/UE 15 $- $- $-
GPT-4.1-nano, strefa regionalna 25 $- $- $-
o3-mini Global 15 $- $- $-
o3-mini US/EU Data Zones 15 $- $- $-
o3-mini Regional 25 $- $- $-
o3 — strefa globalna 15 $- $- $-
o3, strefy danych USA/UE 15 $- $- $-
o3, strefa regionalna 50 $- $- $-
o4-mini, strefa globalna 15 $- $- $-
o4-mini, strefy danych USA/UE 15 $- $- $-
o4-mini, strefa regionalna 25 $- $- $-
GPT-4o – Globalny 15 $- $- $-
Strefy danych GPT-4o w US/UE 15 $- $- $-
Regionalny model GPT-4o 50 $- $- $-
Dostosowany GPT-4o-regionalne 50 $- $- $-
GPT-4o Mini Global 15 $- $- $-
Strefa danych GPT-4o Mini US/EU 15 $- $- $-
Mini regionalny model GPT-4o 25 $- $- $-
Dostosowany GPT-4o-Mini regionalne 25 $- $- $-

Planowanie za pomocą kalkulatora cen

Modele podstawowe

Modele Użycie na 1000 tokenów
Babbage-002 $-
Davinci-002 $-

Dostrajanie modeli

Model Ceny
o4-mini (dostrajanie wzmacniania) Regionalny Dane wejściowe: $- / 1 mln tokenów
Dane wyjściowe: $- / 1 mln tokenów
Szkolenia: $-/godz.
Hosting: $-/godz.

Dane wejściowe oceniającego:
o4-mini: $- / 1 mln tokenów
4,1-mini: $- / 1 mln tokenów
4.1: $- / 1 mln tokenów
4.1 nano: $- / 1 mln tokenów
o3: $- / 1 mln tokenów

Buforowane dane wejściowe oceniającego:
o4-mini: $- / 1 mln tokenów
4,1-mini: $- / 1 mln tokenów
4.1: $- / 1 mln tokenów
4.1 nano: $- / 1 mln tokenów
o3: $- / 1 mln tokenów

Dane wyjściowe oceniającego:
o4-mini: $- / 1 mln tokenów
4,1-mini: $- / 1 mln tokenów
4.1: $- / 1 mln tokenów
4.1 nano: $- / 1 mln tokenów
o3: $- / 1 mln tokenów
Cały świat Dane wejściowe: $- / 1 mln tokenów
Dane wyjściowe: $- / 1 mln tokenów
Szkolenia: $-/godz.
Hosting: $-/godz.

Dane wejściowe oceniającego:
o4-mini: $- / 1 mln tokenów
4,1-mini: $- / 1 mln tokenów
4.1: $- / 1 mln tokenów
4.1 nano: $- / 1 mln tokenów
o3: $- / 1 mln tokenów

Buforowane dane wejściowe oceniającego:
o4-mini: $- / 1 mln tokenów
4,1-mini: $- / 1 mln tokenów
4.1: $- / 1 mln tokenów
4.1 nano: $- / 1 mln tokenów
o3: $- / 1 mln tokenów

Dane wyjściowe oceniającego:
o4-mini: $- / 1 mln tokenów
4,1-mini: $- / 1 mln tokenów
4.1: $- / 1 mln tokenów
4.1 nano: $- / 1 mln tokenów
o3: $- / 1 mln tokenów
GPT-4.1 Regionalny Dane wejściowe: $- / 1 mln tokenów
Buforowane dane wejściowe: $- / 1 mln tokenów
Dane wyjściowe: $- / 1 mln tokenów
Szkolenia: $- / 1 mln tokenów
Hosting: $-/godz.
Cały świat Dane wejściowe: $- / 1 mln tokenów
Buforowane dane wejściowe: $- / 1 mln tokenów
Dane wyjściowe: $- / 1 mln tokenów
Szkolenia: $- / 1 mln tokenów
Hosting: $-/godz.
Deweloper Dane wejściowe: $- / 1 mln tokenów
Buforowane dane wejściowe: $- / 1 mln tokenów
Dane wyjściowe: $- / 1 mln tokenów
GPT-4.1-mini Regionalny Dane wejściowe: $- / 1 mln tokenów
Buforowane dane wejściowe: $- / 1 mln tokenów
Dane wyjściowe: $- / 1 mln tokenów
Szkolenia: $- / 1 mln tokenów
Hosting: $-/godz.
Cały świat Dane wejściowe: $- / 1 mln tokenów
Buforowane dane wejściowe: $- / 1 mln tokenów
Dane wyjściowe: $- / 1 mln tokenów
Szkolenia: $- / 1 mln tokenów
Hosting: $-/godz.
Deweloper Dane wejściowe: $- / 1 mln tokenów
Buforowane dane wejściowe: $- / 1 mln tokenów
Dane wyjściowe: $- / 1 mln tokenów
GPT-4.1-nano Regionalny Dane wejściowe: $- / 1 mln tokenów
Buforowane dane wejściowe: $- / 1 mln tokenów
Dane wyjściowe: $- / 1 mln tokenów
Szkolenia: $- / 1 mln tokenów
Hosting: $-/godz.
Cały świat Dane wejściowe: $- / 1 mln tokenów
Buforowane dane wejściowe: $- / 1 mln tokenów
Dane wyjściowe: $- / 1 mln tokenów
Szkolenia: $- / 1 mln tokenów
Hosting: $-/godz.
Deweloper Dane wejściowe: $- / 1 mln tokenów
Buforowane dane wejściowe: $- / 1 mln tokenów
Dane wyjściowe: $- / 1 mln tokenów
GPT-4o-2024-08-06 Regionalny Dane wejściowe: $- / 1 mln tokenów
Buforowane dane wejściowe: $- / 1 mln tokenów
Dane wyjściowe: $- / 1 mln tokenów
Szkolenia: $- / 1 mln tokenów
Hosting: $-/godz.
Cały świat Dane wejściowe: $- / 1 mln tokenów
Buforowane dane wejściowe: $- / 1 mln tokenów
Dane wyjściowe: $- / 1 mln tokenów
Szkolenia: użyj regionalnej
Hosting: $-/godz.
GPT-4o-mini Regionalny Dane wejściowe: $- / 1 mln tokenów
Buforowane dane wejściowe: $- / 1 mln tokenów
Dane wyjściowe: $- / 1 mln tokenów
Szkolenia: $- / 1 mln tokenów
Hosting: $-/godz.
Cały świat Dane wejściowe: $- / 1 mln tokenów
Buforowane dane wejściowe: $- / 1 mln tokenów
Dane wyjściowe: $- / 1 mln tokenów
Szkolenia: użyj regionalnej
Hosting: $-/godz.
GPT-3.5-Turbo (16K) Regionalny Dane wejściowe: $- / 1 mln tokenów
Dane wyjściowe: $- / 1 mln tokenów
Szkolenia: $- / 1 mln tokenów
Hosting: $-/godz.

Modele obrazów

Modele Jakość Rozdzielczość Cena (za 100 obrazów)
Dall-E-3 Standardowa 1024 * 1024 $-
Standardowa 1024 * 1792,
1792 * 1024
$-
Dall-E-3 HD 1024 * 1024 $-
HD 1024 * 1792,
1792 * 1024
$-
Dall-E-2 Standardowa 1024 * 1024 $-

Osadzanie modeli

Modele Na 1000 tokenów
Ada $-
text-embedding-3-large $-
text-embedding-3-small $-

Modele mowy

Modele Cena
Szept $-/godz.
TTS (zamiana tekstu na mowę) $-/1 mln znaków
TTS HD $-/1 mln znaków

Starsze modele językowe

Modele Kontekst Dane wejściowe (na 1 mln tokenów) Dane wejściowe (na 1 mln tokenów)
GPT-3.5-Turbo-0301 4K $- $-
GPT-3.5-Turbo-0613 4K $- $-
GPT-3.5-Turbo-0613 16K $- $-
GPT-3.5-Turbo-1106 16K $- $-
GPT-3.5-Turbo-0125 16K $- $-
GPT-3.5-Turbo-Instruct 4K $- $-
GPT-4-Turbo 128K $- $-
GPT-4-Turbo-Vision 128K $- $-
GPT-4 8K $- $-
GPT-4 32K $- $-

Opcje cen i zakupu platformy Azure

Skontaktuj się z nami bezpośrednio

Zapoznaj się z przewodnikiem dotyczącym cen platformy Azure. Poznaj ceny rozwiązania w chmurze, dowiedz się więcej o optymalizacji kosztów i poproś o ofertę niestandardową.

Rozmowa ze specjalistą ds. sprzedaży

Zobacz sposoby zakupu

Kup usługi platformy Azure za pośrednictwem witryny internetowej platformy Azure, przedstawiciela firmy Microsoft lub partnera platformy Azure.

Poznaj swoje opcje

Dodatkowe zasoby

Azure OpenAI Service

Dowiedz się więcej o funkcjach i możliwościach produktu Azure OpenAI Service.

Kalkulator cen

Oszacuj oczekiwane miesięczne koszty używania dowolnej kombinacji produktów platformy Azure.

Umowa SLA

Przejrzyj Umowę dotyczącą poziomu usług dla produktu Azure OpenAI Service.

Dokumentacja

Przejrzyj samouczki techniczne, materiały wideo i inne zasoby dotyczące produktu Azure OpenAI Service.

  • Usługa Azure OpenAI Service oferuje ceny na podstawie zarówno jednostek rozliczanych według płatności zgodnie z rzeczywistym użyciem oraz aprowizowanej przepływności (PTU). Płatność zgodnie z rzeczywistym użyciem umożliwia płacenie za używane zasoby, dzięki czemu jest ona elastyczna w przypadku zmiennych obciążeń. Jednostki PTU oferują przewidywalny model cen, w którym rezerwujesz i wdrażasz określoną ilość pojemności przetwarzania modelu. Ten model jest idealny dla obciążeń ze spójnymi lub przewidywalnymi wzorcami użycia, zapewniając stabilność i kontrolę kosztów.
  • Aby dowiedzieć się więcej na temat jednostek PTU i cen platformy Azure OpenAI, przeczytaj dokumentację dotyczącą jednostek PTU lub skontaktuj się z naszym specjalistą ds. sprzedaży.

Porozmawiaj ze specjalistą ds. sprzedaży, który przedstawi Ci cennik platformy Azure. Zapoznaj się z informacjami o cenach swojego rozwiązania w chmurze.

Uzyskaj bezpłatne usługi online i $200 środków na eksplorowanie platformy Azure przez 30 dni.

Dodano do oszacowania. Naciśnij klawisz „v”, aby wyświetlić w kalkulatorze