Přeskočit na hlavní obsah
Azure

Ceny za Azure OpenAI Service

Přehled cen služby Azure OpenAI Service

Azure OpenAI Service delivers enterprise-ready generative AI featuring powerful models from OpenAI, enabling organizations to innovate with text, audio, and vision capabilities. Beyond the cutting-edge models, companies choose Azure OpenAI Service for built-in data privacy, regional/area/global flexibility, and seamless integration into the Azure ecosystem including Fabric, Cosmos DB and Azure AI Search. Companies of all sizes can confidently scale AI solutions to enhance customer experience, automate workflows, and unlock creative potential, driving measurable impact and competitive differentiation.

To help customers in the journey, we offer pricing and cost management solutions to meet your needs. including:
  • Standard (On-Demand): Pay-as-you-go for input and output tokens.
  • Provisioned (PTUs): Allocate throughput with predictable costs, with monthly and annual reservations available to reduce overall spend.
  • Batch API: Language models are also now available in the Batch API for global deployments and three regions, that returns completions within 24 hours for a 50% discount on Global Standard Pricing.
You can choose from the following deployment types for Standard and Provisioned, which enable greater flexibility and control of pricing and performance. This flexibility helps when there is increasingly more restrictive data processing boundaries and need for increased throughput and lower price.
  • Global Deployment – Global SKU
  • Data Zone Deployment – Geographic based (EU or US)
  • Regional Deployment – Local Region (up to 27 regions)

Projděte si cenové možnosti

Využijte filtry a přizpůsobte cenové možnosti vašim potřebám.

Ceny jsou pouze odhadované a nepředstavují skutečné cenové nabídky. Skutečné ceny se můžou lišit v závislosti na typu smlouvy uzavírané se společností Microsoft, datu nákupu a měnovém kurzu. Ceny se vypočítávají na základě amerických dolarů a převádí pomocí londýnských uzavíracích spotových kurzů z posledních dvou pracovních dnů předcházejících poslednímu pracovnímu dni předchozího měsíce. Pokud dva pracovní dny před koncem měsíce spadají na státní svátek na hlavních trzích, den nastavení sazby obvykle představuje den bezprostředně předcházející dvěma pracovním dnům. Tato sazba se vztahuje na všechny transakce během nadcházejícího měsíce. Přihlaste se do cenové kalkulačky Azure a prohlédněte si ceny na základě vašeho aktuálního programu nebo nabídky od společnosti Microsoft. Pokud chcete získat více informací o cenách nebo si vyžádat cenovou nabídku, kontaktujte obchodního specialistu Azure. Další informace najdete v častých otázkách týkající se cen Azure.

o1 Preview

o1 is the new reasoning model series for complex tasks. The model has 128K context and an October 2023 knowledge cutoff.

Model Pricing (1M Tokens)
Global Vstup: $-
Cached Input: $-
Output: $-
US/EU – Data Zones Vstup: $-
Cached Input: $-
Output: $-
Regional Vstup: $-
Cached Input: $-
Output: $-

Plan with the Pricing Calculator

o1 Mini

o1-mini is a fast, cost-efficient reasoning model tailored to coding, math, and science use cases. The model has 128K context and an October 2023 knowledge cutoff.

Model Pricing (1M Tokens)
Global Vstup: $-
Cached Input: $-
Output: $-
US/EU – Data Zones Vstup: $-
Cached Input: $-
Output: $-
Regional Vstup: $-
Cached Input: $-
Output: $-

Plan with the Pricing Calculator

Realtime API

Featured in the new Realtime API, the model GPT-4o-Realtime-Preview supports audio/speech capabilities including multilingual speech-to-speech.

Model Pricing (1M Tokens)
GPT-4o-Realtime-Preview-Global Text
Vstup: $-
Output: $-

Audio
Vstup: $-
Output: $-

Chat Completions API - Coming soon

Featured in the Chat Completions API, the GPT 4o-Audio-Preview model processes and generates audio content. It supports advanced features like speech recognition and audio synthesis, ideal for asynchronous speech interactions and sentiment analysis.

Model Pricing (1M Tokens)
GPT-4o-Audio-Preview-Global Text
Vstup: $-
Cached Input: Není k dispozici
Output: $-

Audio
Vstup: $-
Cached Input: Není k dispozici
Output: $-

GPT-4o

GPT-4o is the most advanced multimodal model that’s faster and cheaper than GPT-4 Turbo with stronger vision capabilities. The model has 128K context and an October 2023 knowledge cutoff.

Model Pricing (1M Tokens) Pricing with Batch API (1M Tokens)
GPT-4o-2024-08-06 Global Vstup: $-
Cached Input: $-
Output: $-
Vstup: $-
Output: $-
US/EU – Data Zones Vstup: $-
Cached Input: $-
Output: $-
Není k dispozici
Regional Vstup: $-
Cached Input: $-
Output: $-
Není k dispozici
GPT-4o-0513 Global Vstup: $-
Output: $-
Vstup: $-
Output: $-
US/EU – Data Zones Vstup: $-
Output: $-
Není k dispozici
Regional Vstup: $-
Output: $-
Není k dispozici

Plan with the Pricing Calculator

GPT-4o mini

GPT-4o mini is the most cost-efficient small model, and has vision capabilities. The model has 128K context and an October 2023 knowledge cutoff.

Model Pricing (1M Tokens) Pricing with Batch API (1M Tokens)
Global Vstup: $-
Cached Input: $-
Output: $-
Vstup: $-
Output: $-
US/EU – Data Zones Vstup: $-
Cached Input: $-
Output: $-
Není k dispozici
Regional Vstup: $-
Cached Input: $-
Output: $-
Není k dispozici

Plan with the Pricing Calculator

Provisioned

You can allocate and manage throughput for deployments, ensuring predictable performance and stable capacity. You are charged an hourly rate per model regardless of usage, but you can also secure additional savings through monthly and annual reservations.

Model Min PTUs PTU Hourly pricing PTU Monthly Reservation Pricing PTU Yearly Reservation Pricing
GPT-4o Regional 50 $- $- $-
GPT-4o Mini Regional 25 $- $- $-

Plan with the Pricing Calculator

Základní modely

Modely Využití na každý 1 000 tokenů
Babbage-002 $-
Davinci-002 $-

Vyladění modelů

Modely Trénování na 1 000 tokenů Hostování za hodinu Využití vstupu na 1 000 tokenů Využití výstupu na každý 1 000 tokenů
Babbage-002 $- $- $- $-
Davinci-002 $- $- $- $-
GPT-3.5-Turbo (4K) $- $- $- $-
GPT-3.5-Turbo (16K) $- $- $- $-
GPT-4 (8K) $- $- $- $-
GPT-4o $- $- $- $-
GPT-4o-mini $- $- $- $-

Rozhraní API asistentů

Rozhraní API asistentů a příslušné nástroje usnadňují vývojářům vytváření asistentů AI v jejich aplikacích.

Tokeny, které se používají pro rozhraní API asistentů, se účtují podle rychlosti vstupu a výstupu zvoleného jazykového modelu, které se používají s každým asistentem. Dále účtujeme následující poplatky za využití nástrojů:

Nástroj Vstup
Hledání souborů* $- za GB vektorového úložiště za den (1 GB zdarma)
Interpret kódu** $- za relaci

*GB představuje binární gigabajty, kde 1 GB znamená 2^30 bajtů.

**Pokud váš asistent volá interpret kódu současně ve dvou různých vláknech, vytvoří se dvě relace interpretu kódu (2 * $-). Každá relace je ve výchozím nastavení aktivní po dobu jedné hodiny, což znamená, že tento poplatek zaplatíte pouze jednou, pokud uživatel bude dál zadávat pokyny interpretu kódu ve stejném vlákně až po dobu jedné hodiny.

Náklady na odvozování (vstup a výstup) se liší v závislosti na modelu GPT použitém u každého asistenta. Pokud váš asistent volá překladač kódu současně ve dvou různých vláknech, vytvoří se dvě relace překladače kódu (2 * $-). Každá relace je ve výchozím nastavení aktivní po dobu jedné hodiny, což znamená, že cena se vztahuje na maximálně jednu hodinu zadávání pokynů překladači kódu ve stejném vlákně.

Modely obrázků

Modely Kvalita Rozlišení Cena (za 100 obrázků)
Dall-E-3 Standardní 1024 * 1024 $-
Standardní 1024 * 1792,
1792 * 1024
$-
Dall-E-3 HD 1024 * 1024 $-
HD 1024 * 1792,
1792 * 1024
$-
Dall-E-2 Standardní 1024 * 1024 $-

Vkládání modelů

Modely Na 1 000 tokenů
Ada $-
text-embedding-3-large $-
text-embedding-3-small $-

Modely řeči

Modely Cena
Whisper $-/hodina
TTS (Převod textu na řeč) $-/1 milion znaků
Převod textu na řeč HD $-/1 milion znaků

Starší jazykové modely

Modely Kontext Input (Per 1M Tokens) Output (Per 1M Tokens)
GPT-3.5-Turbo-0301 4K $- $-
GPT-3.5-Turbo-0613 4K $- $-
GPT-3.5-Turbo-0613 16K $- $-
GPT-3.5-Turbo-1106 16K $- $-
GPT-3.5-Turbo-0125 16K $- $-
GPT-3.5-Turbo-Instruct 4K $- $-
GPT-4-Turbo 128K $- $-
GPT-4-Turbo-Vision 128K $- $-
GPT-4 8K $- $-
GPT-4 32K $- $-

Možnosti nákupu a ceny služeb Azure

Spojte se s námi přímo

Projděte si ceny Azure. Projděte si ceny cloudového řešení, seznamte se s optimalizací nákladů a vyžádejte si vlastní návrh.

Spojte se s prodejním specialistou

Podívejte se na možnosti nákupu

Služby Azure můžete nakoupit prostřednictvím webu Azure, zástupce Microsoftu nebo partnera Azure.

Projít možnosti

Další prostředky

Azure OpenAI Service

Další informace o funkcích a možnostech produktu Azure OpenAI Service

Cenová kalkulačka

Odhadněte očekávané měsíční náklady na používání libovolné kombinace produktů Azure.

Smlouva SLA

Revize smlouvy SLA pro Azure OpenAI Service.

Dokumentace

Projděte si technické výukové programy, videa a další materiály k produktu Azure OpenAI Service

  • Služba Azure OpenAI nabízí ceny na základě modelu průběžných plateb (PAYG) i na základě zřízených jednotek propustnosti (PTU). Průběžné platby (PAYG) umožňují platit za prostředky, které využijete, a díky tomu je flexibilní pro proměnlivé úlohy. Zřízené jednotky propustnosti (PTU) nabízí předvídatelný cenový model, v rámci kterého rezervujete a nasadíte konkrétní kapacitu zpracování modelu. Tento model je ideální pro úlohy s konzistentními nebo předvídatelnými vzory využití a poskytuje stabilitu a řízení nákladů.
  • Další informace o jednotkách PTU a cenách Azure Open AI najdete v dokumentaci k jednotkám PTU. Můžete se také obrátit na našeho specialistu prodeje.

Promluvte si s prodejním specialistou a nechte si ceny Azure vysvětlit podrobně. Seznamte se s principy cen pro cloudová řešení.

Získejte bezplatné cloudové služby a kredit $200, který vám umožní zkoumat Azure po dobu 30 dní.

Přidáno k odhadu. Pro zobrazení v kalkulačce stiskněte klávesu V