Przegląd cen dotyczących usługi Azure OpenAI Service
Aby pomóc klientom w podróży, oferujemy rozwiązania do zarządzania cenami i kosztami spełniające Twoje potrzeby, w tym:
- Warstwa Standardowa (na żądanie): płatności zgodnie z rzeczywistym użyciem dla tokenów wejściowych i wyjściowych.
- Aprowizowane (PTU): Przydziel przepływność z przewidywalnymi kosztami, z dostępnymi rezerwacjami miesięcznymi i rocznymi na potrzeby zmniejszenia ogólnych wydatków.
- Interfejs API Batch: Modele językowe są teraz również dostępne w interfejsie API Batch dla wdrożeń globalnych i w trzech regionach, który zwraca uzupełnienia w ciągu 24 godzin za 50% od globalnej ceny standardowej.
- Globalne wdrożenie — globalna jednostka SKU
- Wdrożenie według strefy danych – oparte na geografii (UE lub Stany Zjednoczone)
- Wdrożenie regionalne — region lokalny (do 27 regionów)
Eksplorowanie opcji cennika
Zastosuj filtry, aby dostosować opcje cennika do własnych potrzeb.
Ceny są jedynie szacunkowe i nie stanowią rzeczywistych ofert cenowych. Rzeczywiste ceny mogą się różnić w zależności od typu umowy zawartej z firmą Microsoft, daty zakupu i kursu wymiany walut. Ceny są obliczane na podstawie kursu dolara amerykańskiego i przeliczane przy użyciu londyńskich kursów zamknięcia typu spot z dwóch dni roboczych przed ostatnim dniem roboczym końca poprzedniego miesiąca. Jeżeli dwa dni robocze poprzedzające koniec miesiąca przypadają na dni świąteczne na głównych rynkach, dniem ustalenia kursu jest zazwyczaj dzień bezpośrednio poprzedzający te dwa dni robocze. Ten kurs dotyczy wszystkich transakcji w nadchodzącym miesiącu. Zaloguj się do kalkulatora cen platformy Azure, aby zobaczyć ceny na podstawie bieżącego programu/oferty firmy Microsoft. Skontaktuj się ze specjalistą ds. sprzedaży platformy Azure, aby uzyskać więcej informacji na temat cen lub poprosić o wycenę. Zobacz często zadawane pytania dotyczące cen platformy Azure.
Instytucje rządowe USA mogą zakupić usługi platformy Azure Government u dostawcy rozwiązań licencjonowania bez zobowiązań finansowych z góry lub bezpośrednio w ramach subskrypcji w modelu płatności zgodnie z rzeczywistym użyciem.
Ważne: cena w R$ jest ceną orientacyjną; jest to transakcja międzynarodowa, a cena ostateczna jest uzależniona od kursów walut i podatku transakcyjnego (IOF). Dokument eNF nie zostanie wystawiony.
Instytucje rządowe USA mogą zakupić usługi platformy Azure Government u dostawcy rozwiązań licencjonowania bez zobowiązań finansowych z góry lub bezpośrednio w ramach subskrypcji w modelu płatności zgodnie z rzeczywistym użyciem.
Ważne: cena w R$ jest ceną orientacyjną; jest to transakcja międzynarodowa, a cena ostateczna jest uzależniona od kursów walut i podatku transakcyjnego (IOF). Dokument eNF nie zostanie wystawiony.
GPT-5 series
Model | Cennik (1 mln tokenów) |
---|---|
GPT-5 2025-08-07 Global |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
GPT-5 Data Zone |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
GPT-5-mini Global |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
GPT-5-mini Data Zone |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
GPT-5-nano Global |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
GPT-5-nano Data Zone |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
GPT-5 chat Global |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Deep Research
Deep Research enables developers and enterprises to automate complex research tasks with structured, citation-rich answers. It is suitable for building customer support bots, internal knowledge assistants, or market analysis tools. Deep Research delivers transparent, auditable insights grounded in real-time web data. Search context tokens are charged input token prices for the model being used. You’ll separately incur charges for Grounding with Bing Search and the base GPT model being used for clarifying questions.
Model | Ceny |
---|---|
o3-deep research Global |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
o3
o3 to zaawansowany model wnioskowania z serii o-series modeli wnioskowania, który przesuwa granicę między kodowaniem, matematyką, nauką i percepcją wizualną. Sprawdza się doskonale w przypadku złożonych zapytań wymagających analizy wieloaspektowej i działa skutecznie w przypadku zadań wizualnych, takich jak analizowanie obrazów, wykresów i grafik. Model zawiera okno kontekstu obejmujące 200 tys. tokenów i ma limit wiedzy z czerwca 2024 r.
Model | Cennik (1 mln tokenów) | Ceny z interfejsem API usługi Batch (1 mln tokenów) |
---|---|---|
o3 2025-04-16 Globalny |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Dane wejściowe: $- Dane wyjściowe: $- |
o3 2025-04-16 Strefa danych |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Dane wejściowe: $- Dane wyjściowe: $- |
o3 2025-04-16 Regionalny |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
o4-mini
O4-mini to kompaktowy, wydajny i ekonomiczny model wnioskowania z serii o-series firmy OpenAI. Sprawdza się w zadaniach matematycznych, kodowaniu i zadaniach wizualnych. Model zawiera okno kontekstu obejmujące 200 tys. tokenów i ma limit wiedzy z czerwca 2024 r.
Model | Cennik (1 mln tokenów) | Ceny z interfejsem API usługi Batch (1 mln tokenów) |
---|---|---|
o4-mini 2025-04-16 Globalny |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Dane wejściowe: $- Dane wyjściowe: $- |
o4-mini 2025-04-16 Strefa danych |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Dane wejściowe: $- Dane wyjściowe: $- |
o4-mini 2025-04-16 Regionalny |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
Seria GPT-4.1
Seria GPT-4.1 to wysoce zaawansowany model ogólnego przeznaczenia z obszerną wiedzą o świecie i ulepszoną możliwością interpretacji intencji użytkownika, co sprawia, że jest on szczególnie przydatny w zadaniach twórczych i planowaniu agentycznym. Ta seria zawiera okno kontekstu obejmujące 1 mln tokenów i ma limit wiedzy z czerwca 2024 roku.
Model | Cennik (1 mln tokenów) | Ceny z interfejsem API usługi Batch (1 mln tokenów) |
---|---|---|
GPT-4.1-2025-04-14 Globalny |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Dane wejściowe: $- Dane wyjściowe: $- |
GPT-4.1-2025-04-14 Strefa danych |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Dane wejściowe: $- Dane wyjściowe: $- |
GPT-4.1-2025-04-14 Regionalny |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
GPT-4.1-mini-2025-04-14 Globalny |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Dane wejściowe: $- Dane wyjściowe: $- |
GPT-4.1-mini-2025-04-14 Strefa danych |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Dane wejściowe: $- Dane wyjściowe: $- |
GPT-4.1-mini-2025-04-14 Regionalny |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
GPT-4.1-nano-2025-04-14 Globalny |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Dane wejściowe: $- Dane wyjściowe: $- |
GPT-4.1-nano-2025-04-14 Strefa danych |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Dane wejściowe: $- Dane wyjściowe: $- |
GPT-4.1-nano-2025-04-14 Regionalny |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
Model Sora w usłudze Azure OpenAI
Sora to wielomodalny model generatywnej sztucznej inteligencji, który jest teraz dostępny w usłudze Azure AI Foundry, zaprojektowany z myślą o ułatwianiu zespołom kreatywnym wprowadzania pomysłów w życie dzięki bezproblemowej integracji z interfejsem API. Oparty na infrastrukturze klasy korporacyjnej platformy Azure oferuje bezpieczne, skalowalne wdrożenie umożliwiające przekształcanie koncepcji w zawartość wizualną o wysokiej jakości.
Cena na sekundę | 1–5 s | 6–10 s | 11–15 s | 16–20 s |
---|---|---|---|---|
480 Square Global | $- | $- | $- | $- |
480p Global | $- | $- | $- | $- |
480 Square Regional | $- | $- | $- | $- |
480p Regional | $- | $- | $- | $- |
720 Square Global | $- | $- | $- | $- |
720p Global | $- | $- | $- | $- |
720 Square Regional | $- | $- | $- | $- |
720p Regional | $- | $- | $- | $- |
1080 Square Global | $- | $- | $- | $- |
1080p Global | $- | $- | $- | $- |
1080 Square Regional | $- | $- | $- | $- |
1080p Regional | $- | $- | $- | $- |
GPT-Image-1
Model GPT-image-1 ulepsza model DALL·E, oferując lepsze przestrzeganie instrukcji, dokładne renderowanie tekstu oraz wsparcie dla wprowadzania i edytowania obrazów. Model jest wyceniany na podstawie tokenów, z różnymi cenami dla tokenów tekstowych i obrazowych.
Model | Cennik (1 mln tokenów) | Ceny z interfejsem API usługi Batch (1 mln tokenów) |
---|---|---|
GPT-Image-1 Global |
Tekst wejściowy: $- Obraz wejściowy: $- Obraz wyjściowy: $- |
Nie dotyczy |
GPT-Image-1 Regional |
Tekst wejściowy: $- Obraz wejściowy: $- Obraz wyjściowy: $- |
Nie dotyczy |
Strefa danych GPT-Image-1 |
Tekst wejściowy: $- Obraz wejściowy: $- Obraz wyjściowy: $- |
Nie dotyczy |
GPT-4.5
Model GPT-4.5 w wersji zapoznawczej to najnowszy model ogólnego przeznaczenia z dogłębną wiedzą o świecie i lepszym zrozumieniem intencji użytkownika, który dobrze sobie radzi z kreatywnymi zadaniami i planowaniem. Model ma kontekst 128 KB i limit wiedzy z października 2023 r.
Model | Cennik (1 mln tokenów) | Ceny z interfejsem API usługi Batch (1 mln tokenów) |
---|---|---|
Model GPT-4.5 w wersji zapoznawczej – 27 lutego 2025 — wersja globalna |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
o1
o1 to nowa seria modeli określania przyczyn dla złożonych zadań. Model ma kontekst 200 KB i limit wiedzy z października 2023 r.
Model | Cennik (1 mln tokenów) | Ceny z interfejsem API usługi Batch (1 mln tokenów) |
---|---|---|
o1 2024-12-17 Globalny |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
o1 2024-12-17 US/EU — strefy danych |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
o1 2024-12-17 Regionalny |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
o1 wersja zapoznawcza 2024-09-12 Globalny |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
o1 wersja zapoznawcza 2024-09-12 US/UE — strefy danych |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
o1 wersja zapoznawcza 2024-09-12 Regionalny |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
Planowanie za pomocą kalkulatora cen
o3 Mini
Model o3 mini to zaktualizowana wersja modelu o1 mini. Model o3-mini to szybki, ekonomiczny model wnioskowania dostosowany do przypadków użycia kodowania, matematyki i nauki.
Model o3-mini zapewnia teraz rozszerzone kontekstowe okno wprowadzania 200 000 tokenów i maksymalne dane wyjściowe wynoszące 100 000 tokenów, co zapewnia dużą ilość miejsca na złożone i szczegółowe odpowiedzi. Model o1 mini ma dane wejściowe kontekstu wynoszące 128 000. Modele o3 i o1 mają próg wiedzy z października 2023 r.
Model | Cennik (1 mln tokenów) | Ceny z interfejsem API usługi Batch (1 mln tokenów) |
---|---|---|
o3 mini 2025-01-31 Globalny |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Dane wejściowe: $- Dane wyjściowe: $- |
o3 mini 2025-01-31-US/EU — strefy danych |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Dane wejściowe: $- Dane wyjściowe: $- |
o3 mini 2025-01-31 Regionalny |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
o1-mini 2024-09-12 Globalny |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
o1-mini 2024-09-12 US/EU — strefy danych |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
o1-mini 2024-09-12 Regionalny |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
Planowanie za pomocą kalkulatora cen
Modele audio
Usługa Azure OpenAI zawiera zaawansowane modele audio GPT-4o-Transcribe, GPT-4o-Mini-Transcribe i GPT-4o-Mini-TTS. Te modele rozszerzają możliwości zamiany mowy na tekst i zamiany tekstu na mowę, oferując wysoką dokładność i dostosowywalne dane wyjściowe mowy dla różnych zastosowań. Idealne rozwiązanie dla centrów obsługi klientów, napisów na żywo i interakcyjnych danych wyjściowych głosowych, wykorzystuje rozbudowane techniki wstępnego trenowania i techniki zaawansowanej destylacji w celu uzyskania najwyższej wydajności.
Model | Cennik (1 mln tokenów) | Ceny z interfejsem API usługi Batch (1 mln tokenów) |
---|---|---|
GPT-4o-Transcribe |
Tekst Dane wejściowe: $- Dane wyjściowe: $- Audio Dane wejściowe: $- Dane wyjściowe: Nie dotyczy |
Nie dotyczy |
GPT-4o-Mini-Transcribe |
Tekst Dane wejściowe: $- Dane wyjściowe: $- Audio Dane wejściowe: $- Dane wyjściowe: Nie dotyczy |
Nie dotyczy |
GPT-4o-Mini-TTS |
Tekst Dane wejściowe: $- Dane wyjściowe: Nie dotyczy Audio Dane wejściowe: Nie dotyczy Dane wyjściowe: $- |
Nie dotyczy |
Agent korzystający z komputera (CUA)
Agent Używający Komputera (CUA) to wyspecjalizowany model sztucznej inteligencji, który pozwala AI na interakcję z graficznymi interfejsami użytkownika (GUI), nawigowanie po aplikacjach oraz automatyzowanie zadań wieloetapowych — wszystko to za pomocą instrukcji w języku naturalnym. Model CUA może być wykorzystywany jako narzędzie w interfejsie API odpowiedzi.
Model | Ceny |
---|---|
podgląd użycia komputera w wersji globalnej |
Dane wejściowe: $- / 1 mln tokenów Dane wyjściowe: $- / 1 mln tokenów |
Wbudowane narzędzia
Interfejs API odpowiedzi i interfejs API asystentów umożliwiają płynne interakcje z narzędziami, takimi jak korzystanie z komputera, interpreter kodu, wywoływanie funkcji oraz wyszukiwanie plików, co ułatwia deweloperom tworzenie agentów AI.
Narzędzie | Dane wejściowe |
---|---|
Użycie komputera (tylko API odpowiedzi) |
Dane wejściowe: $- / 1 mln tokenów Dane wyjściowe: $- / 1 mln tokenów |
Wywołanie narzędzia wyszukiwania plików (tylko interfejs API odpowiedzi) | wywołania narzędzi $-/1K |
Wyszukiwanie plików* | $-/GB magazynu wektorowego dziennie (1 GB bezpłatnie) |
Interpreter kodu** | $-/sesja |
*GB odnosi się do gigabajtów danych binarnych, gdzie 1 GB to 2^30 bajtów.
**Jeśli asystent wywoła interpreter kodu jednocześnie w dwóch różnych wątkach, spowoduje to utworzenie dwóch sesji interpretera kodu (2 * $-). Każda sesja jest domyślnie aktywna przez godzinę, co oznacza, że tę opłatę należy uiścić tylko raz, jeśli użytkownik będzie nadal udzielać instrukcji interpreterowi kodu w tym samym wątku przez maksymalnie jedną godzinę.
Koszt wnioskowania (dane wejściowe i wyjściowe) zależy od modelu GPT używanego z każdym asystentem. Jeśli asystent wywoła interpretera kodu jednocześnie w dwóch różnych wątkach, spowoduje to utworzenie dwóch sesji interpretera kodu (2 * $-). Każda sesja jest domyślnie aktywna przez godzinę, co oznacza, że cena dotyczy maksymalnie jednej godziny wydawania poleceń interpreterowi kodu w tym samym wątku.
Interfejs API czasu rzeczywistego
Interfejs GPT-4o-Realtime-Preview, który jest polecany na platformie Realtime API, obsługuje wielojęzyczne funkcje zamiany mowy na mowę. Zoptymalizowane pod kątem konwersacji o małych opóźnieniach w czasie rzeczywistym, umożliwiają naturalne interakcje z minimalnym opóźnieniem, idealne dla czatbotów i konwersacyjnej sztucznej inteligencji. Model GPT-4o to kompleksowa, bardziej zaawansowana wersja przeznaczona do złożonych zadań, natomiast GPT-4o Mini to mniejsza, bardziej przystępna cenowo opcja, idealna dla prostszych aplikacji, w których priorytetem jest efektywność kosztowa i szybkość.
Model | Cennik (1 mln tokenów) |
---|---|
GPT-4o-Realtime-Preview-2024-12-17-Global |
Tekst Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- Audio Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-Realtime-Preview-2024-12-17-US/EU — strefy danych |
Tekst Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- Audio Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-Realtime-Preview-2024-12-17-Regional |
Tekst Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- Audio Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global |
Tekst Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- Audio Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU — strefy danych |
Tekst Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- Audio Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional |
Tekst Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- Audio Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-Realtime-Preview-2024-10-01-Global |
Tekst Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- Audio Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-Realtime-Preview-2024-10-01-US/EU — strefy danych |
Tekst Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- Audio Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-Realtime-Preview-2024-10-01-Regional |
Tekst Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- Audio Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Interfejs API uzupełniania czatu
Model GPT 4o-Audio-Preview, który jest polecany w interfejsie API uzupełniania czatu, przetwarza i generuje zawartość audio. Obsługuje zaawansowane funkcje, takie jak rozpoznawanie mowy i synteza dźwięku, idealne do asynchronicznych interakcji mowy i analizy tonacji. Model GPT-4o to kompleksowa, bardziej zaawansowana wersja przeznaczona do złożonych zadań, natomiast GPT-4o Mini to mniejsza, bardziej przystępna cenowo opcja, idealna dla prostszych aplikacji, w których priorytetem jest efektywność kosztowa i szybkość.
Model | Cennik (1 mln tokenów) |
---|---|
GPT-4o-Audio-Preview-2024-12-17-Global |
Tekst Dane wejściowe: $- Dane wyjściowe: $- Audio Dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-Audio-Preview-2024-12-17-US/EU — strefy danych |
Tekst Dane wejściowe: $- Dane wyjściowe: $- Audio Dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-Audio-Preview-2024-12-17-Regional |
Tekst Dane wejściowe: $- Dane wyjściowe: $- Audio Dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Global |
Tekst Dane wejściowe: $- Dane wyjściowe: $- Audio Dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU — strefy danych |
Tekst Dane wejściowe: $- Dane wyjściowe: $- Audio Dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional |
Tekst Dane wejściowe: $- Dane wyjściowe: $- Audio Dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o
GPT-4o to najbardziej zaawansowany model wielomodalny, który jest szybszy i tańszy niż GPT-4 Turbo z silniejszymi możliwościami przetwarzania obrazów. Model ma kontekst 128 KB i limit wiedzy z października 2023 r.
Model | Cennik (1 mln tokenów) | Ceny z interfejsem API usługi Batch (1 mln tokenów) |
---|---|---|
GPT-4o-2024-1120 — globalna |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-2024-1120 USA/UE — strefy danych |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-2024-1120 — regionalna |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
GPT-4o-2024-08-06 – Globalny |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-2024-08-06 USA/UE — strefy danych |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-2024-08-06 — regionalna |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
GPT-4o-2024-0513 – Globalny |
Dane wejściowe: $- Dane wyjściowe: $- |
Dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-2024-0513 US/EU — strefy danych |
Dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
GPT-4o-2024-0513 — regionalna |
Dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
Planowanie za pomocą kalkulatora cen
GPT-4o mini
GPT-4o mini to najbardziej ekonomiczny mały model i ma możliwości przetwarzania obrazów. Model ma kontekst 128 KB i limit wiedzy z października 2023 r.
Model | Cennik (1 mln tokenów) | Ceny z interfejsem API usługi Batch (1 mln tokenów) |
---|---|---|
GPT-4o-mini-0718 — globalny |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-mini-0718 US/EU — strefy danych |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-mini-0718 — regionalny |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
Planowanie za pomocą kalkulatora cen
Aprowizowano
You can allocate and manage throughput for deployments, ensuring predictable performance and stable capacity. You are charged an hourly rate per model regardless of usage, but you can also secure additional savings through monthly and annual reservations. Discover how to transition your regional deployments and provisioned reservations to global and data zones on this Learn page.
Model | Minimalna liczba jednostek PTU | Cennik godzinny PTU | Cennik miesięcznych rezerwacji PTU | Cennik rocznej rezerwacji PTU |
---|---|---|---|---|
GPT-5 Global | 15 | $- | $- | $- |
GPT-5 Data Zones | 15 | $- | $- | $- |
GPT-5 Regional | 50 | $- | $- | $- |
GPT-4.1, strefa globalna | 15 | $- | $- | $- |
GPT-4.1, strefy danych | 15 | $- | $- | $- |
GPT-4.1, strefa regionalna | 50 | $- | $- | $- |
GPT-4.1-mini, strefa globalna | 15 | $- | $- | $- |
GPT-4.1-mini, strefy danych USA/UE | 15 | $- | $- | $- |
GPT-4.1-mini, strefa regionalna | 25 | $- | $- | $- |
GPT-4.1-nano, strefa globalna | 15 | $- | $- | $- |
GPT-4.1-nano, strefy danych USA/UE | 15 | $- | $- | $- |
GPT-4.1-nano, strefa regionalna | 25 | $- | $- | $- |
o3-mini Global | 15 | $- | $- | $- |
o3-mini US/EU Data Zones | 15 | $- | $- | $- |
o3-mini Regional | 25 | $- | $- | $- |
o3 — strefa globalna | 15 | $- | $- | $- |
o3, strefy danych USA/UE | 15 | $- | $- | $- |
o3, strefa regionalna | 50 | $- | $- | $- |
o4-mini, strefa globalna | 15 | $- | $- | $- |
o4-mini, strefy danych USA/UE | 15 | $- | $- | $- |
o4-mini, strefa regionalna | 25 | $- | $- | $- |
GPT-4o – Globalny | 15 | $- | $- | $- |
Strefy danych GPT-4o w US/UE | 15 | $- | $- | $- |
Regionalny model GPT-4o | 50 | $- | $- | $- |
Dostosowany GPT-4o-regionalne | 50 | $- | $- | $- |
GPT-4o Mini Global | 15 | $- | $- | $- |
Strefa danych GPT-4o Mini US/EU | 15 | $- | $- | $- |
Mini regionalny model GPT-4o | 25 | $- | $- | $- |
Dostosowany GPT-4o-Mini regionalne | 25 | $- | $- | $- |
Planowanie za pomocą kalkulatora cen
Modele podstawowe
Modele | Użycie na 1000 tokenów |
---|---|
Babbage-002 | $- |
Davinci-002 | $- |
Dostrajanie modeli
Model | Ceny | |
---|---|---|
o4-mini (dostrajanie wzmacniania) | Regionalny |
Dane wejściowe: $- / 1 mln tokenów Dane wyjściowe: $- / 1 mln tokenów Szkolenia: $-/godz. Hosting: $-/godz. Dane wejściowe oceniającego: o4-mini: $- / 1 mln tokenów 4,1-mini: $- / 1 mln tokenów 4.1: $- / 1 mln tokenów 4.1 nano: $- / 1 mln tokenów o3: $- / 1 mln tokenów Buforowane dane wejściowe oceniającego: o4-mini: $- / 1 mln tokenów 4,1-mini: $- / 1 mln tokenów 4.1: $- / 1 mln tokenów 4.1 nano: $- / 1 mln tokenów o3: $- / 1 mln tokenów Dane wyjściowe oceniającego: o4-mini: $- / 1 mln tokenów 4,1-mini: $- / 1 mln tokenów 4.1: $- / 1 mln tokenów 4.1 nano: $- / 1 mln tokenów o3: $- / 1 mln tokenów |
Cały świat |
Dane wejściowe: $- / 1 mln tokenów Dane wyjściowe: $- / 1 mln tokenów Szkolenia: $-/godz. Hosting: $-/godz. Dane wejściowe oceniającego: o4-mini: $- / 1 mln tokenów 4,1-mini: $- / 1 mln tokenów 4.1: $- / 1 mln tokenów 4.1 nano: $- / 1 mln tokenów o3: $- / 1 mln tokenów Buforowane dane wejściowe oceniającego: o4-mini: $- / 1 mln tokenów 4,1-mini: $- / 1 mln tokenów 4.1: $- / 1 mln tokenów 4.1 nano: $- / 1 mln tokenów o3: $- / 1 mln tokenów Dane wyjściowe oceniającego: o4-mini: $- / 1 mln tokenów 4,1-mini: $- / 1 mln tokenów 4.1: $- / 1 mln tokenów 4.1 nano: $- / 1 mln tokenów o3: $- / 1 mln tokenów |
|
GPT-4.1 | Regionalny |
Dane wejściowe: $- / 1 mln tokenów Buforowane dane wejściowe: $- / 1 mln tokenów Dane wyjściowe: $- / 1 mln tokenów Szkolenia: $- / 1 mln tokenów Hosting: $-/godz. |
Cały świat |
Dane wejściowe: $- / 1 mln tokenów Buforowane dane wejściowe: $- / 1 mln tokenów Dane wyjściowe: $- / 1 mln tokenów Szkolenia: $- / 1 mln tokenów Hosting: $-/godz. |
|
Deweloper |
Dane wejściowe: $- / 1 mln tokenów Buforowane dane wejściowe: $- / 1 mln tokenów Dane wyjściowe: $- / 1 mln tokenów |
|
GPT-4.1-mini | Regionalny |
Dane wejściowe: $- / 1 mln tokenów Buforowane dane wejściowe: $- / 1 mln tokenów Dane wyjściowe: $- / 1 mln tokenów Szkolenia: $- / 1 mln tokenów Hosting: $-/godz. |
Cały świat |
Dane wejściowe: $- / 1 mln tokenów Buforowane dane wejściowe: $- / 1 mln tokenów Dane wyjściowe: $- / 1 mln tokenów Szkolenia: $- / 1 mln tokenów Hosting: $-/godz. |
|
Deweloper |
Dane wejściowe: $- / 1 mln tokenów Buforowane dane wejściowe: $- / 1 mln tokenów Dane wyjściowe: $- / 1 mln tokenów |
|
GPT-4.1-nano | Regionalny |
Dane wejściowe: $- / 1 mln tokenów Buforowane dane wejściowe: $- / 1 mln tokenów Dane wyjściowe: $- / 1 mln tokenów Szkolenia: $- / 1 mln tokenów Hosting: $-/godz. |
Cały świat |
Dane wejściowe: $- / 1 mln tokenów Buforowane dane wejściowe: $- / 1 mln tokenów Dane wyjściowe: $- / 1 mln tokenów Szkolenia: $- / 1 mln tokenów Hosting: $-/godz. |
|
Deweloper |
Dane wejściowe: $- / 1 mln tokenów Buforowane dane wejściowe: $- / 1 mln tokenów Dane wyjściowe: $- / 1 mln tokenów |
|
GPT-4o-2024-08-06 | Regionalny |
Dane wejściowe: $- / 1 mln tokenów Buforowane dane wejściowe: $- / 1 mln tokenów Dane wyjściowe: $- / 1 mln tokenów Szkolenia: $- / 1 mln tokenów Hosting: $-/godz. |
Cały świat |
Dane wejściowe: $- / 1 mln tokenów Buforowane dane wejściowe: $- / 1 mln tokenów Dane wyjściowe: $- / 1 mln tokenów Szkolenia: użyj regionalnej Hosting: $-/godz. |
|
GPT-4o-mini | Regionalny |
Dane wejściowe: $- / 1 mln tokenów Buforowane dane wejściowe: $- / 1 mln tokenów Dane wyjściowe: $- / 1 mln tokenów Szkolenia: $- / 1 mln tokenów Hosting: $-/godz. |
Cały świat |
Dane wejściowe: $- / 1 mln tokenów Buforowane dane wejściowe: $- / 1 mln tokenów Dane wyjściowe: $- / 1 mln tokenów Szkolenia: użyj regionalnej Hosting: $-/godz. |
|
GPT-3.5-Turbo (16K) | Regionalny |
Dane wejściowe: $- / 1 mln tokenów Dane wyjściowe: $- / 1 mln tokenów Szkolenia: $- / 1 mln tokenów Hosting: $-/godz. |
Modele obrazów
Modele | Jakość | Rozdzielczość | Cena (za 100 obrazów) |
---|---|---|---|
Dall-E-3 | Standardowa | 1024 * 1024 | $- |
Standardowa | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-3 | HD | 1024 * 1024 | $- |
HD | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-2 | Standardowa | 1024 * 1024 | $- |
Osadzanie modeli
Modele | Na 1000 tokenów |
---|---|
Ada | $- |
text-embedding-3-large | $- |
text-embedding-3-small | $- |
Modele mowy
Modele | Cena |
---|---|
Szept | $-/godz. |
TTS (zamiana tekstu na mowę) | $-/1 mln znaków |
TTS HD | $-/1 mln znaków |
Starsze modele językowe
Modele | Kontekst | Dane wejściowe (na 1 mln tokenów) | Dane wejściowe (na 1 mln tokenów) |
---|---|---|---|
GPT-3.5-Turbo-0301 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 16K | $- | $- |
GPT-3.5-Turbo-1106 | 16K | $- | $- |
GPT-3.5-Turbo-0125 | 16K | $- | $- |
GPT-3.5-Turbo-Instruct | 4K | $- | $- |
GPT-4-Turbo | 128K | $- | $- |
GPT-4-Turbo-Vision | 128K | $- | $- |
GPT-4 | 8K | $- | $- |
GPT-4 | 32K | $- | $- |
Opcje cen i zakupu platformy Azure

Skontaktuj się z nami bezpośrednio
Zapoznaj się z przewodnikiem dotyczącym cen platformy Azure. Poznaj ceny rozwiązania w chmurze, dowiedz się więcej o optymalizacji kosztów i poproś o ofertę niestandardową.
Rozmowa ze specjalistą ds. sprzedażyZobacz sposoby zakupu
Kup usługi platformy Azure za pośrednictwem witryny internetowej platformy Azure, przedstawiciela firmy Microsoft lub partnera platformy Azure.
Poznaj swoje opcjeDodatkowe zasoby
Azure OpenAI Service
Dowiedz się więcej o funkcjach i możliwościach produktu Azure OpenAI Service.
Kalkulator cen
Oszacuj oczekiwane miesięczne koszty używania dowolnej kombinacji produktów platformy Azure.
Umowa SLA
Przejrzyj Umowę dotyczącą poziomu usług dla produktu Azure OpenAI Service.
Dokumentacja
Przejrzyj samouczki techniczne, materiały wideo i inne zasoby dotyczące produktu Azure OpenAI Service.
Często zadawane pytania
-
Usługa Azure OpenAI Service oferuje ceny na podstawie zarówno jednostek rozliczanych według płatności zgodnie z rzeczywistym użyciem oraz aprowizowanej przepływności (PTU). Płatność zgodnie z rzeczywistym użyciem umożliwia płacenie za używane zasoby, dzięki czemu jest ona elastyczna w przypadku zmiennych obciążeń. Jednostki PTU oferują przewidywalny model cen, w którym rezerwujesz i wdrażasz określoną ilość pojemności przetwarzania modelu. Ten model jest idealny dla obciążeń ze spójnymi lub przewidywalnymi wzorcami użycia, zapewniając stabilność i kontrolę kosztów.
-
Aby dowiedzieć się więcej na temat jednostek PTU i cen platformy Azure OpenAI, przeczytaj dokumentację dotyczącą jednostek PTU lub skontaktuj się z naszym specjalistą ds. sprzedaży.
Porozmawiaj ze specjalistą ds. sprzedaży, który przedstawi Ci cennik platformy Azure. Zapoznaj się z informacjami o cenach swojego rozwiązania w chmurze.
Uzyskaj bezpłatne usługi online i $200 środków na eksplorowanie platformy Azure przez 30 dni.