Przejdź do głównej zawartości
Azure

Azure OpenAI Service — cennik

Przegląd cen dotyczących usługi Azure OpenAI Service

Azure OpenAI Service delivers enterprise-ready generative AI featuring powerful models from OpenAI, enabling organizations to innovate with text, audio, and vision capabilities. Beyond the cutting-edge models, companies choose Azure OpenAI Service for built-in data privacy, regional/area/global flexibility, and seamless integration into the Azure ecosystem including Fabric, Cosmos DB and Azure AI Search. Companies of all sizes can confidently scale AI solutions to enhance customer experience, automate workflows, and unlock creative potential, driving measurable impact and competitive differentiation.

To help customers in the journey, we offer pricing and cost management solutions to meet your needs. including:
  • Standard (On-Demand): Pay-as-you-go for input and output tokens.
  • Provisioned (PTUs): Allocate throughput with predictable costs, with monthly and annual reservations available to reduce overall spend.
  • Batch API: Language models are also now available in the Batch API for global deployments and three regions, that returns completions within 24 hours for a 50% discount on Global Standard Pricing.
You can choose from the following deployment types for Standard and Provisioned, which enable greater flexibility and control of pricing and performance. This flexibility helps when there is increasingly more restrictive data processing boundaries and need for increased throughput and lower price.
  • Global Deployment – Global SKU
  • Data Zone Deployment – Geographic based (EU or US)
  • Regional Deployment – Local Region (up to 27 regions)

Eksplorowanie opcji cennika

Zastosuj filtry, aby dostosować opcje cennika do własnych potrzeb.

Ceny są jedynie szacunkowe i nie stanowią rzeczywistych ofert cenowych. Rzeczywiste ceny mogą się różnić w zależności od typu umowy zawartej z firmą Microsoft, daty zakupu i kursu wymiany walut. Ceny są obliczane na podstawie kursu dolara amerykańskiego i przeliczane przy użyciu londyńskich kursów zamknięcia typu spot z dwóch dni roboczych przed ostatnim dniem roboczym końca poprzedniego miesiąca. Jeżeli dwa dni robocze poprzedzające koniec miesiąca przypadają na dni świąteczne na głównych rynkach, dniem ustalenia kursu jest zazwyczaj dzień bezpośrednio poprzedzający te dwa dni robocze. Ten kurs dotyczy wszystkich transakcji w nadchodzącym miesiącu. Zaloguj się do kalkulatora cen platformy Azure, aby zobaczyć ceny na podstawie bieżącego programu/oferty firmy Microsoft. Skontaktuj się ze specjalistą ds. sprzedaży platformy Azure, aby uzyskać więcej informacji na temat cen lub poprosić o wycenę. Zobacz często zadawane pytania dotyczące cen platformy Azure.

o1 Preview

o1 is the new reasoning model series for complex tasks. The model has 128K context and an October 2023 knowledge cutoff.

Model Pricing (1M Tokens)
Global Dane wejściowe: $-
Cached Input: $-
Output: $-
US/EU – Data Zones Dane wejściowe: $-
Cached Input: $-
Output: $-
Regional Dane wejściowe: $-
Cached Input: $-
Output: $-

Plan with the Pricing Calculator

o1 Mini

o1-mini is a fast, cost-efficient reasoning model tailored to coding, math, and science use cases. The model has 128K context and an October 2023 knowledge cutoff.

Model Pricing (1M Tokens)
Global Dane wejściowe: $-
Cached Input: $-
Output: $-
US/EU – Data Zones Dane wejściowe: $-
Cached Input: $-
Output: $-
Regional Dane wejściowe: $-
Cached Input: $-
Output: $-

Plan with the Pricing Calculator

Realtime API

Featured in the Realtime API, the GPT-4o-Realtime-Preview supports multilingual speech-to-speech capabilities. Optimized for real-time, low-latency conversations, it enables natural interactions with minimal delay, ideal for chatbots and conversational AI.

Model Pricing (1M Tokens)
GPT-4o-Realtime-Preview-Global Text
Dane wejściowe: $-
Cached Input: $-
Output: $-

Audio
Dane wejściowe: $-
Cached Input: $-
Output: $-
GPT-4o-Realtime-Preview-US/EU – Data Zones Text
Dane wejściowe: $-
Cached Input: $-
Output: $-

Audio
Dane wejściowe: $-
Cached Input: $-
Output: $-
GPT-4o-Realtime-Preview-Regional Text
Dane wejściowe: $-
Cached Input: $-
Output: $-

Audio
Dane wejściowe: $-
Cached Input: $-
Output: $-

Chat Completions API - Coming soon

Featured in the Chat Completions API, the GPT 4o-Audio-Preview model processes and generates audio content. It supports advanced features like speech recognition and audio synthesis, ideal for asynchronous speech interactions and sentiment analysis.

Model Pricing (1M Tokens)
GPT-4o-Audio-Preview-Global Text
Dane wejściowe: $-
Cached Input: Nie dotyczy
Output: $-

Audio
Dane wejściowe: $-
Cached Input: Nie dotyczy
Output: $-

GPT-4o

GPT-4o is the most advanced multimodal model that’s faster and cheaper than GPT-4 Turbo with stronger vision capabilities. The model has 128K context and an October 2023 knowledge cutoff.

Model Pricing (1M Tokens) Pricing with Batch API (1M Tokens)
GPT-4o-2024-08-06 Global Dane wejściowe: $-
Cached Input: $-
Output: $-
Dane wejściowe: $-
Output: $-
US/EU – Data Zones Dane wejściowe: $-
Cached Input: $-
Output: $-
Nie dotyczy
Regional Dane wejściowe: $-
Cached Input: $-
Output: $-
Nie dotyczy
GPT-4o-0513 Global Dane wejściowe: $-
Output: $-
Dane wejściowe: $-
Output: $-
US/EU – Data Zones Dane wejściowe: $-
Output: $-
Nie dotyczy
Regional Dane wejściowe: $-
Output: $-
Nie dotyczy

Plan with the Pricing Calculator

GPT-4o mini

GPT-4o mini is the most cost-efficient small model, and has vision capabilities. The model has 128K context and an October 2023 knowledge cutoff.

Model Pricing (1M Tokens) Pricing with Batch API (1M Tokens)
Global Dane wejściowe: $-
Cached Input: $-
Output: $-
Dane wejściowe: $-
Output: $-
US/EU – Data Zones Dane wejściowe: $-
Cached Input: $-
Output: $-
Nie dotyczy
Regional Dane wejściowe: $-
Cached Input: $-
Output: $-
Nie dotyczy

Plan with the Pricing Calculator

Provisioned

You can allocate and manage throughput for deployments, ensuring predictable performance and stable capacity. You are charged an hourly rate per model regardless of usage, but you can also secure additional savings through monthly and annual reservations. Discover how to transition your regional deployments and provisioned reservations to global and data zones on this Learn page.

Model Min PTUs PTU Hourly pricing PTU Monthly Reservation Pricing PTU Yearly Reservation Pricing
GPT-4o Global 50 $- $- $-
GPT-4o US/EU Data Zones 50 $- $- $-
GPT-4o Regional 50 $- $- $-
GPT-4o Mini Global 25 $- $- $-
GPT-4o Mini US/EU Data Zones 25 $- $- $-
GPT-4o Mini Regional 25 $- $- $-

Plan with the Pricing Calculator

Modele podstawowe

Modele Użycie na 1000 tokenów
Babbage-002 $-
Davinci-002 $-

Dostrajanie modeli

Modele Szkolenie na 1000 tokenów Hosting na godzinę Użycie danych wejściowych na 1000 tokenów Użycie danych wyjściowych na 1000 tokenów Cached Input per 1,000 tokens
Babbage-002 $- $- $- $- Nie dotyczy
Davinci-002 $- $- $- $- Nie dotyczy
GPT-3.5-Turbo (4K) $- $- $- $- Nie dotyczy
GPT-3.5-Turbo (16K) $- $- $- $- Nie dotyczy
GPT-4 (8 K) $- $- $- $- Nie dotyczy
GPT-4o $- $- $- $- Nie dotyczy
GPT-4o-mini $- $- $- $- $-
GPT-4o-0806 Nie dotyczy Nie dotyczy Nie dotyczy Nie dotyczy $-

Interfejs API Asystenci

Interfejs API Asystentów i jego narzędzia ułatwiają deweloperom tworzenie asystentów AI w swoich aplikacjach.

Tokeny używane dla interfejsu API asystentów są rozliczane według stawek za dane wejściowe/wyjściowe tokenu wybranego modelu językowego używanych z każdym asystentem. Ponadto pobieramy następujące opłaty za użycie narzędzia:

Narzędzie Dane wejściowe
Wyszukiwanie plików* $-/GB magazynu wektorowego dziennie (1 GB bezpłatnie)
Interpreter kodu** $-/sesja

*GB odnosi się do gigabajtów danych binarnych, gdzie 1 GB to 2^30 bajtów.

**Jeśli asystent wywoła interpreter kodu jednocześnie w dwóch różnych wątkach, spowoduje to utworzenie dwóch sesji interpretera kodu (2 * $-). Każda sesja jest domyślnie aktywna przez godzinę, co oznacza, że tę opłatę należy uiścić tylko raz, jeśli użytkownik będzie nadal udzielać instrukcji interpreterowi kodu w tym samym wątku przez maksymalnie jedną godzinę.

Koszt wnioskowania (dane wejściowe i wyjściowe) zależy od modelu GPT używanego z każdym asystentem. Jeśli asystent wywoła interpretera kodu jednocześnie w dwóch różnych wątkach, spowoduje to utworzenie dwóch sesji interpretera kodu (2 * $-). Każda sesja jest domyślnie aktywna przez godzinę, co oznacza, że cena dotyczy maksymalnie jednej godziny wydawania poleceń interpreterowi kodu w tym samym wątku.

Modele obrazów

Modele Jakość Rozdzielczość Cena (za 100 obrazów)
Dall-E-3 Standardowa 1024 * 1024 $-
Standardowa 1024 * 1792,
1792 * 1024
$-
Dall-E-3 HD 1024 * 1024 $-
HD 1024 * 1792,
1792 * 1024
$-
Dall-E-2 Standardowa 1024 * 1024 $-

Osadzanie modeli

Modele Na 1000 tokenów
Ada $-
text-embedding-3-large $-
text-embedding-3-small $-

Modele mowy

Modele Cena
Szept $-/godz.
TTS (zamiana tekstu na mowę) $-/1 mln znaków
TTS HD $-/1 mln znaków

Starsze modele językowe

Modele Kontekst Input (Per 1M Tokens) Output (Per 1M Tokens)
GPT-3.5-Turbo-0301 4K $- $-
GPT-3.5-Turbo-0613 4K $- $-
GPT-3.5-Turbo-0613 16K $- $-
GPT-3.5-Turbo-1106 16K $- $-
GPT-3.5-Turbo-0125 16K $- $-
GPT-3.5-Turbo-Instruct 4K $- $-
GPT-4-Turbo 128K $- $-
GPT-4-Turbo-Vision 128K $- $-
GPT-4 8K $- $-
GPT-4 32K $- $-

Opcje cen i zakupu platformy Azure

Skontaktuj się z nami bezpośrednio

Zapoznaj się z przewodnikiem dotyczącym cen platformy Azure. Poznaj ceny rozwiązania w chmurze, dowiedz się więcej o optymalizacji kosztów i poproś o ofertę niestandardową.

Rozmowa ze specjalistą ds. sprzedaży

Zobacz sposoby zakupu

Kup usługi platformy Azure za pośrednictwem witryny internetowej platformy Azure, przedstawiciela firmy Microsoft lub partnera platformy Azure.

Poznaj swoje opcje

Dodatkowe zasoby

Azure OpenAI Service

Dowiedz się więcej o funkcjach i możliwościach produktu Azure OpenAI Service.

Kalkulator cen

Oszacuj oczekiwane miesięczne koszty używania dowolnej kombinacji produktów platformy Azure.

Umowa SLA

Przejrzyj Umowę dotyczącą poziomu usług dla produktu Azure OpenAI Service.

Dokumentacja

Przejrzyj samouczki techniczne, materiały wideo i inne zasoby dotyczące produktu Azure OpenAI Service.

  • Usługa Azure OpenAI Service oferuje ceny na podstawie zarówno jednostek rozliczanych według płatności zgodnie z rzeczywistym użyciem oraz aprowizowanej przepływności (PTU). Płatność zgodnie z rzeczywistym użyciem umożliwia płacenie za używane zasoby, dzięki czemu jest ona elastyczna w przypadku zmiennych obciążeń. Jednostki PTU oferują przewidywalny model cen, w którym rezerwujesz i wdrażasz określoną ilość pojemności przetwarzania modelu. Ten model jest idealny dla obciążeń ze spójnymi lub przewidywalnymi wzorcami użycia, zapewniając stabilność i kontrolę kosztów.
  • Aby dowiedzieć się więcej na temat jednostek PTU i cen platformy Azure Open AI, przeczytaj dokumentację dotyczącą jednostek PTU lub skontaktuj się z naszym specjalistą ds. sprzedaży

Porozmawiaj ze specjalistą ds. sprzedaży, który przedstawi Ci cennik platformy Azure. Zapoznaj się z informacjami o cenach swojego rozwiązania w chmurze.

Uzyskaj bezpłatne usługi online i $200 środków na eksplorowanie platformy Azure przez 30 dni.

Dodano do oszacowania. Naciśnij klawisz „v”, aby wyświetlić w kalkulatorze