Przegląd cen dotyczących usługi Azure OpenAI Service
Aby pomóc klientom w podróży, oferujemy rozwiązania do zarządzania cenami i kosztami spełniające Twoje potrzeby, w tym:
- Warstwa Standardowa (na żądanie): płatności zgodnie z rzeczywistym użyciem dla tokenów wejściowych i wyjściowych.
- Aprowizowane (PTU): Przydziel przepływność z przewidywalnymi kosztami, z dostępnymi rezerwacjami miesięcznymi i rocznymi na potrzeby zmniejszenia ogólnych wydatków.
- Interfejs API Batch: Modele językowe są teraz również dostępne w interfejsie API Batch dla wdrożeń globalnych i w trzech regionach, który zwraca uzupełnienia w ciągu 24 godzin za 50% od globalnej ceny standardowej.
- Globalne wdrożenie — globalna jednostka SKU
- Wdrożenie według strefy danych – oparte na geografii (UE lub Stany Zjednoczone)
- Wdrożenie regionalne — region lokalny (do 27 regionów)
Eksplorowanie opcji cennika
Zastosuj filtry, aby dostosować opcje cennika do własnych potrzeb.
Ceny są jedynie szacunkowe i nie stanowią rzeczywistych ofert cenowych. Rzeczywiste ceny mogą się różnić w zależności od typu umowy zawartej z firmą Microsoft, daty zakupu i kursu wymiany walut. Ceny są obliczane na podstawie kursu dolara amerykańskiego i przeliczane przy użyciu londyńskich kursów zamknięcia typu spot z dwóch dni roboczych przed ostatnim dniem roboczym końca poprzedniego miesiąca. Jeżeli dwa dni robocze poprzedzające koniec miesiąca przypadają na dni świąteczne na głównych rynkach, dniem ustalenia kursu jest zazwyczaj dzień bezpośrednio poprzedzający te dwa dni robocze. Ten kurs dotyczy wszystkich transakcji w nadchodzącym miesiącu. Zaloguj się do kalkulatora cen platformy Azure, aby zobaczyć ceny na podstawie bieżącego programu/oferty firmy Microsoft. Skontaktuj się ze specjalistą ds. sprzedaży platformy Azure, aby uzyskać więcej informacji na temat cen lub poprosić o wycenę. Zobacz często zadawane pytania dotyczące cen platformy Azure.
Instytucje rządowe USA mogą zakupić usługi platformy Azure Government u dostawcy rozwiązań licencjonowania bez zobowiązań finansowych z góry lub bezpośrednio w ramach subskrypcji w modelu płatności zgodnie z rzeczywistym użyciem.
Ważne: cena w R$ jest ceną orientacyjną; jest to transakcja międzynarodowa, a cena ostateczna jest uzależniona od kursów walut i podatku transakcyjnego (IOF). Dokument eNF nie zostanie wystawiony.
Instytucje rządowe USA mogą zakupić usługi platformy Azure Government u dostawcy rozwiązań licencjonowania bez zobowiązań finansowych z góry lub bezpośrednio w ramach subskrypcji w modelu płatności zgodnie z rzeczywistym użyciem.
Ważne: cena w R$ jest ceną orientacyjną; jest to transakcja międzynarodowa, a cena ostateczna jest uzależniona od kursów walut i podatku transakcyjnego (IOF). Dokument eNF nie zostanie wystawiony.
o3
o3 is a powerful reasoning model from the o-series of reasoning models, pushing the frontier across coding, math, science, and visual perception. It excels in complex queries requiring multi-faceted analysis and performs strongly in visual tasks like analyzing images, charts, and graphics. The model features a 200k token context window and has a knowledge cutoff of June 2024.
Model | Cennik (1 mln tokenów) | Ceny z interfejsem API usługi Batch (1 mln tokenów) |
---|---|---|
o3 2025-04-16 |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
o4-mini
o4-mini is a compact, efficient, and cost-effective reasoning model from OpenAI's o-series. It excels in math, coding, and visual tasks. The model features a 200k token context window and has a knowledge cutoff of June 2024.
Model | Cennik (1 mln tokenów) | Ceny z interfejsem API usługi Batch (1 mln tokenów) |
---|---|---|
o4-mini 2025-04-16 |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
GPT-4.1 series
GPT-4.1 series is a highly advanced general-purpose model with extensive world knowledge and an enhanced ability to understand user intent, making it particularly adept at creative tasks and agentic planning. The series features a 1 million token context window and has a knowledge cutoff of June 2024
Model | Cennik (1 mln tokenów) | Ceny z interfejsem API usługi Batch (1 mln tokenów) |
---|---|---|
GPT-4.1-2025-04-14 |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
GPT-4.1-mini-2025-04-14 |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
GPT-4.1-nano-2025-04-14 |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
GPT-4.5
Model GPT-4.5 w wersji zapoznawczej to najnowszy model ogólnego przeznaczenia z dogłębną wiedzą o świecie i lepszym zrozumieniem intencji użytkownika, który dobrze sobie radzi z kreatywnymi zadaniami i planowaniem. Model ma kontekst 128 KB i limit wiedzy z października 2023 r.
Model | Cennik (1 mln tokenów) | Ceny z interfejsem API usługi Batch (1 mln tokenów) |
---|---|---|
Model GPT-4.5 w wersji zapoznawczej – 27 lutego 2025 — wersja globalna |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
o1
o1 to nowa seria modeli określania przyczyn dla złożonych zadań. Model ma kontekst 200 KB i limit wiedzy z października 2023 r.
Model | Cennik (1 mln tokenów) | Ceny z interfejsem API usługi Batch (1 mln tokenów) |
---|---|---|
o1 2024-12-17 Globalny |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
o1 2024-12-17 US/EU — strefy danych |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
o1 2024-12-17 Regionalny |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
o1 wersja zapoznawcza 2024-09-12 Globalny |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
o1 wersja zapoznawcza 2024-09-12 US/UE — strefy danych |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
o1 wersja zapoznawcza 2024-09-12 Regionalny |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
Planowanie za pomocą kalkulatora cen
o3 Mini
Model o3 mini to zaktualizowana wersja modelu o1 mini. Model o3-mini to szybki, ekonomiczny model wnioskowania dostosowany do przypadków użycia kodowania, matematyki i nauki.
Model o3-mini zapewnia teraz rozszerzone kontekstowe okno wprowadzania 200 000 tokenów i maksymalne dane wyjściowe wynoszące 100 000 tokenów, co zapewnia dużą ilość miejsca na złożone i szczegółowe odpowiedzi. Model o1 mini ma dane wejściowe kontekstu wynoszące 128 000. Modele o3 i o1 mają próg wiedzy z października 2023 r.
Model | Cennik (1 mln tokenów) | Ceny z interfejsem API usługi Batch (1 mln tokenów) |
---|---|---|
o3 mini 2025-01-31 Globalny |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Dane wejściowe: $- Dane wyjściowe: $- |
o3 mini 2025-01-31-US/EU — strefy danych |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Dane wejściowe: $- Dane wyjściowe: $- |
o3 mini 2025-01-31 Regionalny |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
o1-mini 2024-09-12 Globalny |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
o1-mini 2024-09-12 US/EU — strefy danych |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
o1-mini 2024-09-12 Regionalny |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
Planowanie za pomocą kalkulatora cen
Agent korzystający z komputera (CUA)
Agent Używający Komputera (CUA) to wyspecjalizowany model sztucznej inteligencji, który pozwala AI na interakcję z graficznymi interfejsami użytkownika (GUI), nawigowanie po aplikacjach oraz automatyzowanie zadań wieloetapowych — wszystko to za pomocą instrukcji w języku naturalnym. Model CUA może być wykorzystywany jako narzędzie w interfejsie API odpowiedzi.
Model | Ceny |
---|---|
podgląd użycia komputera w wersji globalnej |
Dane wejściowe: $- / 1 mln tokenów Dane wyjściowe: $- / 1 mln tokenów |
Wbudowane narzędzia
Interfejs API odpowiedzi i interfejs API asystentów umożliwiają płynne interakcje z narzędziami, takimi jak korzystanie z komputera, interpreter kodu, wywoływanie funkcji oraz wyszukiwanie plików, co ułatwia deweloperom tworzenie agentów AI.
Narzędzie | Dane wejściowe |
---|---|
Użycie komputera (tylko API odpowiedzi) |
Dane wejściowe: $- / 1 mln tokenów Dane wyjściowe: $- / 1 mln tokenów |
Wywołanie narzędzia wyszukiwania plików (tylko interfejs API odpowiedzi) | wywołania narzędzi $-/1K |
Wyszukiwanie plików* | $-/GB magazynu wektorowego dziennie (1 GB bezpłatnie) |
Interpreter kodu** | $-/sesja |
*GB odnosi się do gigabajtów danych binarnych, gdzie 1 GB to 2^30 bajtów.
**Jeśli asystent wywoła interpreter kodu jednocześnie w dwóch różnych wątkach, spowoduje to utworzenie dwóch sesji interpretera kodu (2 * $-). Każda sesja jest domyślnie aktywna przez godzinę, co oznacza, że tę opłatę należy uiścić tylko raz, jeśli użytkownik będzie nadal udzielać instrukcji interpreterowi kodu w tym samym wątku przez maksymalnie jedną godzinę.
Koszt wnioskowania (dane wejściowe i wyjściowe) zależy od modelu GPT używanego z każdym asystentem. Jeśli asystent wywoła interpretera kodu jednocześnie w dwóch różnych wątkach, spowoduje to utworzenie dwóch sesji interpretera kodu (2 * $-). Każda sesja jest domyślnie aktywna przez godzinę, co oznacza, że cena dotyczy maksymalnie jednej godziny wydawania poleceń interpreterowi kodu w tym samym wątku.
Interfejs API czasu rzeczywistego
Interfejs GPT-4o-Realtime-Preview, który jest polecany na platformie Realtime API, obsługuje wielojęzyczne funkcje zamiany mowy na mowę. Zoptymalizowane pod kątem konwersacji o małych opóźnieniach w czasie rzeczywistym, umożliwiają naturalne interakcje z minimalnym opóźnieniem, idealne dla czatbotów i konwersacyjnej sztucznej inteligencji. Model GPT-4o to kompleksowa, bardziej zaawansowana wersja przeznaczona do złożonych zadań, natomiast GPT-4o Mini to mniejsza, bardziej przystępna cenowo opcja, idealna dla prostszych aplikacji, w których priorytetem jest efektywność kosztowa i szybkość.
Model | Cennik (1 mln tokenów) |
---|---|
GPT-4o-Realtime-Preview-2024-12-17-Global |
Tekst Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- Audio Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-Realtime-Preview-2024-12-17-US/EU — strefy danych |
Tekst Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- Audio Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-Realtime-Preview-2024-12-17-Regional |
Tekst Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- Audio Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global |
Tekst Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- Audio Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU — strefy danych |
Tekst Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- Audio Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional |
Tekst Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- Audio Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-Realtime-Preview-2024-10-01-Global |
Tekst Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- Audio Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-Realtime-Preview-2024-10-01-US/EU — strefy danych |
Tekst Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- Audio Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-Realtime-Preview-2024-10-01-Regional |
Tekst Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- Audio Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Interfejs API uzupełniania czatu
Model GPT 4o-Audio-Preview, który jest polecany w interfejsie API uzupełniania czatu, przetwarza i generuje zawartość audio. Obsługuje zaawansowane funkcje, takie jak rozpoznawanie mowy i synteza dźwięku, idealne do asynchronicznych interakcji mowy i analizy tonacji. Model GPT-4o to kompleksowa, bardziej zaawansowana wersja przeznaczona do złożonych zadań, natomiast GPT-4o Mini to mniejsza, bardziej przystępna cenowo opcja, idealna dla prostszych aplikacji, w których priorytetem jest efektywność kosztowa i szybkość.
Model | Cennik (1 mln tokenów) |
---|---|
GPT-4o-Audio-Preview-2024-12-17-Global |
Tekst Dane wejściowe: $- Dane wyjściowe: $- Audio Dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-Audio-Preview-2024-12-17-US/EU — strefy danych |
Tekst Dane wejściowe: $- Dane wyjściowe: $- Audio Dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-Audio-Preview-2024-12-17-Regional |
Tekst Dane wejściowe: $- Dane wyjściowe: $- Audio Dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Global |
Tekst Dane wejściowe: $- Dane wyjściowe: $- Audio Dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU — strefy danych |
Tekst Dane wejściowe: $- Dane wyjściowe: $- Audio Dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional |
Tekst Dane wejściowe: $- Dane wyjściowe: $- Audio Dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o
GPT-4o to najbardziej zaawansowany model wielomodalny, który jest szybszy i tańszy niż GPT-4 Turbo z silniejszymi możliwościami przetwarzania obrazów. Model ma kontekst 128 KB i limit wiedzy z października 2023 r.
Model | Cennik (1 mln tokenów) | Ceny z interfejsem API usługi Batch (1 mln tokenów) |
---|---|---|
GPT-4o-2024-1120 — globalna |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-2024-1120 USA/UE — strefy danych |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-2024-1120 — regionalna |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
GPT-4o-2024-08-06 – Globalny |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-2024-08-06 USA/UE — strefy danych |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-2024-08-06 — regionalna |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
GPT-4o-2024-0513 – Globalny |
Dane wejściowe: $- Dane wyjściowe: $- |
Dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-2024-0513 US/EU — strefy danych |
Dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
GPT-4o-2024-0513 — regionalna |
Dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
Planowanie za pomocą kalkulatora cen
GPT-4o mini
GPT-4o mini to najbardziej ekonomiczny mały model i ma możliwości przetwarzania obrazów. Model ma kontekst 128 KB i limit wiedzy z października 2023 r.
Model | Cennik (1 mln tokenów) | Ceny z interfejsem API usługi Batch (1 mln tokenów) |
---|---|---|
GPT-4o-mini-0718 — globalny |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-mini-0718 US/EU — strefy danych |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Dane wejściowe: $- Dane wyjściowe: $- |
GPT-4o-mini-0718 — regionalny |
Dane wejściowe: $- Buforowane dane wejściowe: $- Dane wyjściowe: $- |
Nie dotyczy |
Planowanie za pomocą kalkulatora cen
Aprowizowano
Możesz przydzielać przepływność wdrożeń i zarządzać nią, zapewniając przewidywalną wydajność i stabilną pojemność. Opłaty są naliczane godzinowo za model niezależnie od użycia, ale możesz również zapewnić dodatkowe oszczędności dzięki rezerwacjom miesięcznym i rocznym. Dowiedz się, jak przenieść wdrożenia regionalne i aprowizowane rezerwacje do stref globalnych i stref danych na tej stronie Learn.
Model | Minimalna liczba jednostek PTU | Cennik godzinny PTU | Cennik miesięcznych rezerwacji PTU | Cennik rocznej rezerwacji PTU |
---|---|---|---|---|
GPT-4o – Globalny | 15 | $- | $- | $- |
Strefy danych GPT-4o w US/UE | 15 | $- | $- | $- |
Regionalny model GPT-4o | 50 | $- | $- | $- |
Dostosowany GPT-4o-regionalne | 50 | $- | $- | $- |
GPT-4o Mini Global | 15 | $- | $- | $- |
Strefa danych GPT-4o Mini US/EU | 15 | $- | $- | $- |
Mini regionalny model GPT-4o | 25 | $- | $- | $- |
Dostosowany GPT-4o-Mini regionalne | 25 | $- | $- | $- |
Planowanie za pomocą kalkulatora cen
Modele podstawowe
Modele | Użycie na 1000 tokenów |
---|---|
Babbage-002 | $- |
Davinci-002 | $- |
Dostrajanie modeli
Model | Ceny | |
---|---|---|
GPT-4.1 | Regionalny |
Dane wejściowe: $- / 1 mln tokenów Buforowane dane wejściowe: $- / 1 mln tokenów Dane wyjściowe: $- / 1 mln tokenów Szkolenia: $- / 1 mln tokenów Hosting: $-/godz. |
Cały świat |
Dane wejściowe: $- / 1 mln tokenów Buforowane dane wejściowe: $- / 1 mln tokenów Dane wyjściowe: $- / 1 mln tokenów Szkolenia: $- / 1 mln tokenów Hosting: $-/godz. |
|
GPT-4.1-mini | Regionalny |
Dane wejściowe: $- / 1 mln tokenów Buforowane dane wejściowe: $- / 1 mln tokenów Dane wyjściowe: $- / 1 mln tokenów Szkolenia: $- / 1 mln tokenów Hosting: $-/godz. |
Cały świat |
Dane wejściowe: $- / 1 mln tokenów Buforowane dane wejściowe: $- / 1 mln tokenów Dane wyjściowe: $- / 1 mln tokenów Szkolenia: $- / 1 mln tokenów Hosting: $-/godz. |
|
GPT-4o-2024-08-06 | Regionalny |
Dane wejściowe: $- / 1 mln tokenów Buforowane dane wejściowe: $- / 1 mln tokenów Dane wyjściowe: $- / 1 mln tokenów Szkolenia: $- / 1 mln tokenów Hosting: $-/godz. |
Cały świat |
Dane wejściowe: $- / 1 mln tokenów Buforowane dane wejściowe: $- / 1 mln tokenów Dane wyjściowe: $- / 1 mln tokenów Szkolenia: użyj regionalnej Hosting: $-/godz. |
|
GPT-4o-mini | Regionalny |
Dane wejściowe: $- / 1 mln tokenów Buforowane dane wejściowe: $- / 1 mln tokenów Dane wyjściowe: $- / 1 mln tokenów Szkolenia: $- / 1 mln tokenów Hosting: $-/godz. |
Cały świat |
Dane wejściowe: $- / 1 mln tokenów Buforowane dane wejściowe: $- / 1 mln tokenów Dane wyjściowe: $- / 1 mln tokenów Szkolenia: użyj regionalnej Hosting: $-/godz. |
|
GPT-3.5-Turbo (16K) | Regionalny |
Dane wejściowe: $- / 1 mln tokenów Dane wyjściowe: $- / 1 mln tokenów Szkolenia: $- / 1 mln tokenów Hosting: $-/godz. |
GPT-3.5-Turbo (4K) | Regionalny |
Dane wejściowe: $- / 1 mln tokenów Dane wyjściowe: $- / 1 mln tokenów Szkolenia: $- / 1 mln tokenów Hosting: $-/godz. |
Modele obrazów
Modele | Jakość | Rozdzielczość | Cena (za 100 obrazów) |
---|---|---|---|
Dall-E-3 | Standardowa | 1024 * 1024 | $- |
Standardowa | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-3 | HD | 1024 * 1024 | $- |
HD | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-2 | Standardowa | 1024 * 1024 | $- |
Osadzanie modeli
Modele | Na 1000 tokenów |
---|---|
Ada | $- |
text-embedding-3-large | $- |
text-embedding-3-small | $- |
Modele mowy
Modele | Cena |
---|---|
Szept | $-/godz. |
TTS (zamiana tekstu na mowę) | $-/1 mln znaków |
TTS HD | $-/1 mln znaków |
Starsze modele językowe
Modele | Kontekst | Dane wejściowe (na 1 mln tokenów) | Dane wejściowe (na 1 mln tokenów) |
---|---|---|---|
GPT-3.5-Turbo-0301 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 16K | $- | $- |
GPT-3.5-Turbo-1106 | 16K | $- | $- |
GPT-3.5-Turbo-0125 | 16K | $- | $- |
GPT-3.5-Turbo-Instruct | 4K | $- | $- |
GPT-4-Turbo | 128K | $- | $- |
GPT-4-Turbo-Vision | 128K | $- | $- |
GPT-4 | 8K | $- | $- |
GPT-4 | 32K | $- | $- |
Opcje cen i zakupu platformy Azure

Skontaktuj się z nami bezpośrednio
Zapoznaj się z przewodnikiem dotyczącym cen platformy Azure. Poznaj ceny rozwiązania w chmurze, dowiedz się więcej o optymalizacji kosztów i poproś o ofertę niestandardową.
Rozmowa ze specjalistą ds. sprzedażyZobacz sposoby zakupu
Kup usługi platformy Azure za pośrednictwem witryny internetowej platformy Azure, przedstawiciela firmy Microsoft lub partnera platformy Azure.
Poznaj swoje opcjeDodatkowe zasoby
Azure OpenAI Service
Dowiedz się więcej o funkcjach i możliwościach produktu Azure OpenAI Service.
Kalkulator cen
Oszacuj oczekiwane miesięczne koszty używania dowolnej kombinacji produktów platformy Azure.
Umowa SLA
Przejrzyj Umowę dotyczącą poziomu usług dla produktu Azure OpenAI Service.
Dokumentacja
Przejrzyj samouczki techniczne, materiały wideo i inne zasoby dotyczące produktu Azure OpenAI Service.
Często zadawane pytania
-
Usługa Azure OpenAI Service oferuje ceny na podstawie zarówno jednostek rozliczanych według płatności zgodnie z rzeczywistym użyciem oraz aprowizowanej przepływności (PTU). Płatność zgodnie z rzeczywistym użyciem umożliwia płacenie za używane zasoby, dzięki czemu jest ona elastyczna w przypadku zmiennych obciążeń. Jednostki PTU oferują przewidywalny model cen, w którym rezerwujesz i wdrażasz określoną ilość pojemności przetwarzania modelu. Ten model jest idealny dla obciążeń ze spójnymi lub przewidywalnymi wzorcami użycia, zapewniając stabilność i kontrolę kosztów.
-
Aby dowiedzieć się więcej na temat jednostek PTU i cen platformy Azure OpenAI, przeczytaj dokumentację dotyczącą jednostek PTU lub skontaktuj się z naszym specjalistą ds. sprzedaży.
Porozmawiaj ze specjalistą ds. sprzedaży, który przedstawi Ci cennik platformy Azure. Zapoznaj się z informacjami o cenach swojego rozwiązania w chmurze.
Uzyskaj bezpłatne usługi online i $200 środków na eksplorowanie platformy Azure przez 30 dni.