Przegląd cen dotyczących usługi Azure OpenAI Service
To help customers in the journey, we offer pricing and cost management solutions to meet your needs. including:
- Standard (On-Demand): Pay-as-you-go for input and output tokens.
- Provisioned (PTUs): Allocate throughput with predictable costs, with monthly and annual reservations available to reduce overall spend.
- Batch API: Language models are also now available in the Batch API for global deployments and three regions, that returns completions within 24 hours for a 50% discount on Global Standard Pricing.
- Global Deployment – Global SKU
- Data Zone Deployment – Geographic based (EU or US)
- Regional Deployment – Local Region (up to 27 regions)
Eksplorowanie opcji cennika
Zastosuj filtry, aby dostosować opcje cennika do własnych potrzeb.
Ceny są jedynie szacunkowe i nie stanowią rzeczywistych ofert cenowych. Rzeczywiste ceny mogą się różnić w zależności od typu umowy zawartej z firmą Microsoft, daty zakupu i kursu wymiany walut. Ceny są obliczane na podstawie kursu dolara amerykańskiego i przeliczane przy użyciu londyńskich kursów zamknięcia typu spot z dwóch dni roboczych przed ostatnim dniem roboczym końca poprzedniego miesiąca. Jeżeli dwa dni robocze poprzedzające koniec miesiąca przypadają na dni świąteczne na głównych rynkach, dniem ustalenia kursu jest zazwyczaj dzień bezpośrednio poprzedzający te dwa dni robocze. Ten kurs dotyczy wszystkich transakcji w nadchodzącym miesiącu. Zaloguj się do kalkulatora cen platformy Azure, aby zobaczyć ceny na podstawie bieżącego programu/oferty firmy Microsoft. Skontaktuj się ze specjalistą ds. sprzedaży platformy Azure, aby uzyskać więcej informacji na temat cen lub poprosić o wycenę. Zobacz często zadawane pytania dotyczące cen platformy Azure.
Instytucje rządowe USA mogą zakupić usługi platformy Azure Government u dostawcy rozwiązań licencjonowania bez zobowiązań finansowych z góry lub bezpośrednio w ramach subskrypcji w modelu płatności zgodnie z rzeczywistym użyciem.
Ważne: cena w R$ jest ceną orientacyjną; jest to transakcja międzynarodowa, a cena ostateczna jest uzależniona od kursów walut i podatku transakcyjnego (IOF). Dokument eNF nie zostanie wystawiony.
Instytucje rządowe USA mogą zakupić usługi platformy Azure Government u dostawcy rozwiązań licencjonowania bez zobowiązań finansowych z góry lub bezpośrednio w ramach subskrypcji w modelu płatności zgodnie z rzeczywistym użyciem.
Ważne: cena w R$ jest ceną orientacyjną; jest to transakcja międzynarodowa, a cena ostateczna jest uzależniona od kursów walut i podatku transakcyjnego (IOF). Dokument eNF nie zostanie wystawiony.
o1 Preview
o1 is the new reasoning model series for complex tasks. The model has 128K context and an October 2023 knowledge cutoff.
Model | Pricing (1M Tokens) |
---|---|
Global |
Dane wejściowe: $- Cached Input: $- Output: $- |
US/EU – Data Zones |
Dane wejściowe: $- Cached Input: $- Output: $- |
Regional |
Dane wejściowe: $- Cached Input: $- Output: $- |
Plan with the Pricing Calculator
o1 Mini
o1-mini is a fast, cost-efficient reasoning model tailored to coding, math, and science use cases. The model has 128K context and an October 2023 knowledge cutoff.
Model | Pricing (1M Tokens) |
---|---|
Global |
Dane wejściowe: $- Cached Input: $- Output: $- |
US/EU – Data Zones |
Dane wejściowe: $- Cached Input: $- Output: $- |
Regional |
Dane wejściowe: $- Cached Input: $- Output: $- |
Plan with the Pricing Calculator
Realtime API
Featured in the Realtime API, the GPT-4o-Realtime-Preview supports multilingual speech-to-speech capabilities. Optimized for real-time, low-latency conversations, it enables natural interactions with minimal delay, ideal for chatbots and conversational AI.
Model | Pricing (1M Tokens) |
---|---|
GPT-4o-Realtime-Preview-Global |
Text Dane wejściowe: $- Cached Input: $- Output: $- Audio Dane wejściowe: $- Cached Input: $- Output: $- |
GPT-4o-Realtime-Preview-US/EU – Data Zones |
Text Dane wejściowe: $- Cached Input: $- Output: $- Audio Dane wejściowe: $- Cached Input: $- Output: $- |
GPT-4o-Realtime-Preview-Regional |
Text Dane wejściowe: $- Cached Input: $- Output: $- Audio Dane wejściowe: $- Cached Input: $- Output: $- |
Chat Completions API - Coming soon
Featured in the Chat Completions API, the GPT 4o-Audio-Preview model processes and generates audio content. It supports advanced features like speech recognition and audio synthesis, ideal for asynchronous speech interactions and sentiment analysis.
Model | Pricing (1M Tokens) |
---|---|
GPT-4o-Audio-Preview-Global |
Text Dane wejściowe: $- Cached Input: Nie dotyczy Output: $- Audio Dane wejściowe: $- Cached Input: Nie dotyczy Output: $- |
GPT-4o
GPT-4o is the most advanced multimodal model that’s faster and cheaper than GPT-4 Turbo with stronger vision capabilities. The model has 128K context and an October 2023 knowledge cutoff.
Model | Pricing (1M Tokens) | Pricing with Batch API (1M Tokens) |
---|---|---|
GPT-4o-2024-08-06 Global |
Dane wejściowe: $- Cached Input: $- Output: $- |
Dane wejściowe: $- Output: $- |
US/EU – Data Zones |
Dane wejściowe: $- Cached Input: $- Output: $- |
Nie dotyczy |
Regional |
Dane wejściowe: $- Cached Input: $- Output: $- |
Nie dotyczy |
GPT-4o-0513 Global |
Dane wejściowe: $- Output: $- |
Dane wejściowe: $- Output: $- |
US/EU – Data Zones |
Dane wejściowe: $- Output: $- |
Nie dotyczy |
Regional |
Dane wejściowe: $- Output: $- |
Nie dotyczy |
Plan with the Pricing Calculator
GPT-4o mini
GPT-4o mini is the most cost-efficient small model, and has vision capabilities. The model has 128K context and an October 2023 knowledge cutoff.
Model | Pricing (1M Tokens) | Pricing with Batch API (1M Tokens) |
---|---|---|
Global |
Dane wejściowe: $- Cached Input: $- Output: $- |
Dane wejściowe: $- Output: $- |
US/EU – Data Zones |
Dane wejściowe: $- Cached Input: $- Output: $- |
Nie dotyczy |
Regional |
Dane wejściowe: $- Cached Input: $- Output: $- |
Nie dotyczy |
Plan with the Pricing Calculator
Provisioned
You can allocate and manage throughput for deployments, ensuring predictable performance and stable capacity. You are charged an hourly rate per model regardless of usage, but you can also secure additional savings through monthly and annual reservations. Discover how to transition your regional deployments and provisioned reservations to global and data zones on this Learn page.
Model | Min PTUs | PTU Hourly pricing | PTU Monthly Reservation Pricing | PTU Yearly Reservation Pricing |
---|---|---|---|---|
GPT-4o Global | 50 | $- | $- | $- |
GPT-4o US/EU Data Zones | 50 | $- | $- | $- |
GPT-4o Regional | 50 | $- | $- | $- |
GPT-4o Mini Global | 25 | $- | $- | $- |
GPT-4o Mini US/EU Data Zones | 25 | $- | $- | $- |
GPT-4o Mini Regional | 25 | $- | $- | $- |
Plan with the Pricing Calculator
Modele podstawowe
Modele | Użycie na 1000 tokenów |
---|---|
Babbage-002 | $- |
Davinci-002 | $- |
Dostrajanie modeli
Modele | Szkolenie na 1000 tokenów | Hosting na godzinę | Użycie danych wejściowych na 1000 tokenów | Użycie danych wyjściowych na 1000 tokenów | Cached Input per 1,000 tokens |
---|---|---|---|---|---|
Babbage-002 | $- | $- | $- | $- | Nie dotyczy |
Davinci-002 | $- | $- | $- | $- | Nie dotyczy |
GPT-3.5-Turbo (4K) | $- | $- | $- | $- | Nie dotyczy |
GPT-3.5-Turbo (16K) | $- | $- | $- | $- | Nie dotyczy |
GPT-4 (8 K) | $- | $- | $- | $- | Nie dotyczy |
GPT-4o | $- | $- | $- | $- | Nie dotyczy |
GPT-4o-mini | $- | $- | $- | $- | $- |
GPT-4o-0806 | Nie dotyczy | Nie dotyczy | Nie dotyczy | Nie dotyczy | $- |
Interfejs API Asystenci
Interfejs API Asystentów i jego narzędzia ułatwiają deweloperom tworzenie asystentów AI w swoich aplikacjach.
Tokeny używane dla interfejsu API asystentów są rozliczane według stawek za dane wejściowe/wyjściowe tokenu wybranego modelu językowego używanych z każdym asystentem. Ponadto pobieramy następujące opłaty za użycie narzędzia:
Narzędzie | Dane wejściowe |
---|---|
Wyszukiwanie plików* | $-/GB magazynu wektorowego dziennie (1 GB bezpłatnie) |
Interpreter kodu** | $-/sesja |
*GB odnosi się do gigabajtów danych binarnych, gdzie 1 GB to 2^30 bajtów.
**Jeśli asystent wywoła interpreter kodu jednocześnie w dwóch różnych wątkach, spowoduje to utworzenie dwóch sesji interpretera kodu (2 * $-). Każda sesja jest domyślnie aktywna przez godzinę, co oznacza, że tę opłatę należy uiścić tylko raz, jeśli użytkownik będzie nadal udzielać instrukcji interpreterowi kodu w tym samym wątku przez maksymalnie jedną godzinę.
Koszt wnioskowania (dane wejściowe i wyjściowe) zależy od modelu GPT używanego z każdym asystentem. Jeśli asystent wywoła interpretera kodu jednocześnie w dwóch różnych wątkach, spowoduje to utworzenie dwóch sesji interpretera kodu (2 * $-). Każda sesja jest domyślnie aktywna przez godzinę, co oznacza, że cena dotyczy maksymalnie jednej godziny wydawania poleceń interpreterowi kodu w tym samym wątku.
Modele obrazów
Modele | Jakość | Rozdzielczość | Cena (za 100 obrazów) |
---|---|---|---|
Dall-E-3 | Standardowa | 1024 * 1024 | $- |
Standardowa | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-3 | HD | 1024 * 1024 | $- |
HD | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-2 | Standardowa | 1024 * 1024 | $- |
Osadzanie modeli
Modele | Na 1000 tokenów |
---|---|
Ada | $- |
text-embedding-3-large | $- |
text-embedding-3-small | $- |
Modele mowy
Modele | Cena |
---|---|
Szept | $-/godz. |
TTS (zamiana tekstu na mowę) | $-/1 mln znaków |
TTS HD | $-/1 mln znaków |
Starsze modele językowe
Modele | Kontekst | Input (Per 1M Tokens) | Output (Per 1M Tokens) |
---|---|---|---|
GPT-3.5-Turbo-0301 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 16K | $- | $- |
GPT-3.5-Turbo-1106 | 16K | $- | $- |
GPT-3.5-Turbo-0125 | 16K | $- | $- |
GPT-3.5-Turbo-Instruct | 4K | $- | $- |
GPT-4-Turbo | 128K | $- | $- |
GPT-4-Turbo-Vision | 128K | $- | $- |
GPT-4 | 8K | $- | $- |
GPT-4 | 32K | $- | $- |
Opcje cen i zakupu platformy Azure
Skontaktuj się z nami bezpośrednio
Zapoznaj się z przewodnikiem dotyczącym cen platformy Azure. Poznaj ceny rozwiązania w chmurze, dowiedz się więcej o optymalizacji kosztów i poproś o ofertę niestandardową.
Rozmowa ze specjalistą ds. sprzedażyZobacz sposoby zakupu
Kup usługi platformy Azure za pośrednictwem witryny internetowej platformy Azure, przedstawiciela firmy Microsoft lub partnera platformy Azure.
Poznaj swoje opcjeDodatkowe zasoby
Azure OpenAI Service
Dowiedz się więcej o funkcjach i możliwościach produktu Azure OpenAI Service.
Kalkulator cen
Oszacuj oczekiwane miesięczne koszty używania dowolnej kombinacji produktów platformy Azure.
Umowa SLA
Przejrzyj Umowę dotyczącą poziomu usług dla produktu Azure OpenAI Service.
Dokumentacja
Przejrzyj samouczki techniczne, materiały wideo i inne zasoby dotyczące produktu Azure OpenAI Service.
Często zadawane pytania
-
Usługa Azure OpenAI Service oferuje ceny na podstawie zarówno jednostek rozliczanych według płatności zgodnie z rzeczywistym użyciem oraz aprowizowanej przepływności (PTU). Płatność zgodnie z rzeczywistym użyciem umożliwia płacenie za używane zasoby, dzięki czemu jest ona elastyczna w przypadku zmiennych obciążeń. Jednostki PTU oferują przewidywalny model cen, w którym rezerwujesz i wdrażasz określoną ilość pojemności przetwarzania modelu. Ten model jest idealny dla obciążeń ze spójnymi lub przewidywalnymi wzorcami użycia, zapewniając stabilność i kontrolę kosztów.
-
Aby dowiedzieć się więcej na temat jednostek PTU i cen platformy Azure Open AI, przeczytaj dokumentację dotyczącą jednostek PTU lub skontaktuj się z naszym specjalistą ds. sprzedaży
Porozmawiaj ze specjalistą ds. sprzedaży, który przedstawi Ci cennik platformy Azure. Zapoznaj się z informacjami o cenach swojego rozwiązania w chmurze.
Uzyskaj bezpłatne usługi online i $200 środków na eksplorowanie platformy Azure przez 30 dni.