Översikt över Azure OpenAI-tjänstens prissättning
För att hjälpa kunderna på resan erbjuder vi lösningar för prissättning och kostnadshantering som uppfyller dina behov. inklusive:
- Standard (på begäran): Betala per användning för indata- och utdatatoken.
- Etablerade (PTU:er): Allokera dataflöde med förutsägbara kostnader, med månatliga och årliga reservationer tillgängliga för att minska de totala utgifterna.
- Batch API: Språkmodeller är nu också tillgängliga iBatch API för globala distributioner och tre regioner, som returnerar slutföranden inom 24 timmar för en rabatt på 50 % på global standardprissättning.
- Global distribution – global SKU-
- Distribution, datazon – Geografiskt baserad (EU eller USA)
- Regiondistribution – lokal region (upp till 27 regioner)
Utforska prisalternativ
Använd filter för att anpassa prisalternativ efter dina behov.
Priserna är endast uppskattningar och är inte avsedda som faktiska priscitat. Den faktiska prissättningen kan variera beroende på vilken typ av avtal som ingås med Microsoft, inköpsdatum och växelkursen. Priserna beräknas baserat på amerikanska dollar och konverteras med London stängningskurs som registreras under de två arbetsdagarna före den sista arbetsdagen i föregående månads slut. Om de två arbetsdagarna före slutet av månaden infaller på en helgdag på större marknader är prisinställningsdagen vanligtvis dagen omedelbart före de två arbetsdagarna. Den här avgiften gäller för alla transaktioner under den kommande månaden. Logga in på priskalkylatorn för Azure för att se priser baserat på ditt aktuella program/erbjudande hos Microsoft. Kontakta en Azure försäljningsspecialist för mer information om prissättning eller för att begära en prisoffert. Se vanliga frågor och svar om Prissättning för Azure.
Amerikanska myndigheter kan köpa Azure Government-tjänster från en licenslösningsleverantör utan finansiellt åtagande eller direkt via en onlineprenumeration med användningsbaserad betalning.
Viktigt – Priset i R$ är bara som referens. Detta är en internationell transaktion och det slutgiltiga priset beror på växelkurser och IOF-skatter. En eNF kommer inte att utfärdas.
Amerikanska myndigheter kan köpa Azure Government-tjänster från en licenslösningsleverantör utan finansiellt åtagande eller direkt via en onlineprenumeration med användningsbaserad betalning.
Viktigt – Priset i R$ är bara som referens. Detta är en internationell transaktion och det slutgiltiga priset beror på växelkurser och IOF-skatter. En eNF kommer inte att utfärdas.
o1
o1 är den nya serien med anledningsmodeller för komplexa uppgifter. Modellen har 200 000 kontexter och en kunskapsgräns för oktober 2023.
Modell | Prissättning (1 miljoner token) | Prissättning med Batch API (1M-token) |
---|---|---|
o1 2024-12-17 Global |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Inte tillämpligt |
o1 2024-12-17 US/EU – Data Zones |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Inte tillämpligt |
o1 2024-12-17 Regional |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Inte tillämpligt |
o1 preview 2024-09-12 Global |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Inte tillämpligt |
o1 preview 2024-09-12 US/EU – Data Zones |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Inte tillämpligt |
o1 preview 2024-09-12 Regional |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Inte tillämpligt |
o3 Mini
The o3 mini is the updated version of o1 mini model. o3-mini is a fast, cost-efficient reasoning model tailored to coding, math, and science use cases.
The o3-mini model now boasts an expanded context input window of 200K tokens and a maximum output of 100K tokens, providing ample space for complex and detailed responses. The o1 mini model has 128K context input. Both o3 and o1 models have a knowledge cutoff of October 2023.
Modell | Prissättning (1 miljoner token) | Prissättning med Batch API (1M-token) |
---|---|---|
o3 mini 2025-01-31 Global |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Indata: $- Utdata: $- |
o3 mini 2025-01-31-US/EU – Data Zones |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Indata: $- Utdata: $- |
o3 mini 2025-01-31 Regional |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Inte tillämpligt |
o1-mini 2024-09-12 Global |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Inte tillämpligt |
o1-mini 2024-09-12 US/EU – Data Zones |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Inte tillämpligt |
o1-mini 2024-09-12 Regional |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Inte tillämpligt |
API i realtid
Featured in the Realtime API, the GPT-4o-Realtime-Preview supports multilingual speech-to-speech capabilities. Optimized for real-time, low-latency conversations, it enables natural interactions with minimal delay, ideal for chatbots and conversational AI. GPT-4o is the comprehensive, more powerful version designed for complex tasks, while GPT-4o Mini is a smaller, more affordable option ideal for simpler applications where cost-efficiency and speed are priorities.
Modell | Prissättning (1 miljoner token) |
---|---|
GPT-4o-Realtime-Preview-2024-12-17-Global |
Text Indata: $- Cachelagrade indata: $- Utdata: $- Ljud Indata: $- Cachelagrade indata: $- Utdata: $- |
GPT-4o-Realtime-Preview-2024-12-17-US/EU – Data Zones |
Text Indata: $- Cachelagrade indata: $- Utdata: $- Ljud Indata: $- Cachelagrade indata: $- Utdata: $- |
GPT-4o-Realtime-Preview-2024-12-17-Regional |
Text Indata: $- Cachelagrade indata: $- Utdata: $- Ljud Indata: $- Cachelagrade indata: $- Utdata: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global |
Text Indata: $- Cachelagrade indata: $- Utdata: $- Ljud Indata: $- Cachelagrade indata: $- Utdata: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU – Data Zones |
Text Indata: $- Cachelagrade indata: $- Utdata: $- Ljud Indata: $- Cachelagrade indata: $- Utdata: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional |
Text Indata: $- Cachelagrade indata: $- Utdata: $- Ljud Indata: $- Cachelagrade indata: $- Utdata: $- |
GPT-4o-Realtime-Preview-2024-10-01-Global |
Text Indata: $- Cachelagrade indata: $- Utdata: $- Ljud Indata: $- Cachelagrade indata: $- Utdata: $- |
GPT-4o-Realtime-Preview-2024-10-01-US/EU – Data Zones |
Text Indata: $- Cachelagrade indata: $- Utdata: $- Ljud Indata: $- Cachelagrade indata: $- Utdata: $- |
GPT-4o-Realtime-Preview-2024-10-01-Regional |
Text Indata: $- Cachelagrade indata: $- Utdata: $- Ljud Indata: $- Cachelagrade indata: $- Utdata: $- |
Chat Completions API
Featured in the Chat Completions API, the GPT 4o-Audio-Preview model processes and generates audio content. It supports advanced features like speech recognition and audio synthesis, ideal for asynchronous speech interactions and sentiment analysis. GPT-4o is the comprehensive, more powerful version designed for complex tasks, while GPT-4o Mini is a smaller, more affordable option ideal for simpler applications where cost-efficiency and speed are priorities.
Modell | Prissättning (1 miljoner token) |
---|---|
GPT-4o-Audio-Preview-2024-12-17-Global |
Text Indata: $- Utdata: $- Ljud Indata: $- Utdata: $- |
GPT-4o-Audio-Preview-2024-12-17-US/EU – Data Zones |
Text Indata: $- Utdata: $- Ljud Indata: $- Utdata: $- |
GPT-4o-Audio-Preview-2024-12-17-Regional |
Text Indata: $- Utdata: $- Ljud Indata: $- Utdata: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Global |
Text Indata: $- Utdata: $- Ljud Indata: $- Utdata: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU – Data Zones |
Text Indata: $- Utdata: $- Ljud Indata: $- Utdata: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional |
Text Indata: $- Utdata: $- Ljud Indata: $- Utdata: $- |
GPT-4o
GPT-4o är den mest avancerade multimodala modellen som är snabbare och billigare än GPT-4 Turbo med starkare synfunktioner. Modellen har 128 000 kontexter och en kunskapsgräns för oktober 2023.
Modell | Prissättning (1 miljoner token) | Prissättning med Batch API (1M-token) |
---|---|---|
GPT-4o-2024-1120 Global |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Indata: $- Utdata: $- |
GPT-4o-2024-11-20 US/EU – Data Zones |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Indata: $- Utdata: $- |
GPT-4o-2024-1120 Regional |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Inte tillämpligt |
GPT-4o-2024-08-06 Global |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Indata: $- Utdata: $- |
GPT-4o-2024-08-06 US/EU – Data Zones |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Indata: $- Utdata: $- |
GPT-4o-2024-08-06 Regional |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Inte tillämpligt |
GPT-4o-2024-0513 Global |
Indata: $- Utdata: $- |
Indata: $- Utdata: $- |
GPT-4o-2024-0513 US/EU – Data Zones |
Indata: $- Utdata: $- |
Inte tillämpligt |
GPT-4o-2024-0513 Regional |
Indata: $- Utdata: $- |
Inte tillämpligt |
GPT-4o-mini
GPT-4o mini är den mest kostnadseffektiva små modellen och har synfunktioner. Modellen har 128 000 kontexter och en kunskapsgräns för oktober 2023.
Modell | Prissättning (1 miljoner token) | Prissättning med Batch API (1M-token) |
---|---|---|
GPT-4o-mini-0718 Global |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Indata: $- Utdata: $- |
GPT-4o-mini-0718 US/EU – Data Zones |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Indata: $- Utdata: $- |
GPT-4o-mini-0718 Regional |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Inte tillämpligt |
Etablerat
Du kan allokera och hantera dataflöde för distributioner, vilket garanterar förutsägbar prestanda och stabil kapacitet. Du debiteras ett timpris per modell oavsett användning, men du kan också skydda ytterligare besparingar via månatliga och årliga reservationer. Upptäck hur du överför dina regionala distributioner och etablerade reservationer till globala och datazoner på den här lässidan.
Modell | Minsta antal PTU:er | Pris per timme för PTU | Pris för månatlig PTU-reservation | Pris för årlig PTU-reservation |
---|---|---|---|---|
GPT-4o Global | 15 | $- | $- | $- |
GPT-4o USA/EU-datazoner | 15 | $- | $- | $- |
GPT-4o Regional | 50 | $- | $- | $- |
Fine-Tuned GPT-4o-Regional | 50 | $- | $- | $- |
GPT-4o Mini Global | 15 | $- | $- | $- |
DATAzoner för GPT-4o Mini USA/EU | 15 | $- | $- | $- |
GPT-4o-Mini Regional | 25 | $- | $- | $- |
Fine-Tuned GPT-4o-Mini Regional | 25 | $- | $- | $- |
Basmodeller
Modeller | Användning per 1 000 token |
---|---|
Babbage 002 | $- |
Davinci 002 | $- |
Finjustera modeller
Modell | Priser | |
---|---|---|
GPT-4o-2024-08-06 | Regionalt |
Indata: $-/1M tokens Cachelagrade indata: $-/1M tokens Utdata: $-/1M tokens Utbildning: $-/1M tokens Hosting: $-/hour |
Globalt |
Indata: $-/1M tokens Cachelagrade indata: $-/1M tokens Utdata: $-/1M tokens Utbildning: använd regional Hosting: $-/hour |
|
GPT-4o-mini | Regionalt |
Indata: $-/1M tokens Cachelagrade indata: $-/1M tokens Utdata: $-/1M tokens Utbildning: $-/1M tokens Hosting: $-/hour |
Globalt |
Indata: $-/1M tokens Cachelagrade indata: $-/1M tokens Utdata: $-/1M tokens Utbildning: använd regional Hosting: $-/hour |
|
GPT-4-0613 (8K) | Regionalt |
Indata: $-/1M tokens Utdata: $-/1M tokens Utbildning: $-/1M tokens Hosting: $-/hour |
GPT-3.5-Turbo (16K) | Regionalt |
Indata: $-/1M tokens Utdata: $-/1M tokens Utbildning: $-/1M tokens Hosting: $-/hour |
GPT-3.5-Turbo (4K) | Regionalt |
Indata: $-/1M tokens Utdata: $-/1M tokens Utbildning: $-/1M tokens Hosting: $-/hour |
Babbage 002 |
Indata: $-/1M tokens Utdata: $-/1M tokens Utbildning: $-/1M tokens Hosting: $-/hour |
|
Davinci 002 |
Indata: $-/1M tokens Utdata: $-/1M tokens Utbildning: $-/1M tokens Hosting: $-/hour |
API för assistenter
Med API:et för assistenter och verktyg kan utvecklare enkelt skapa AI-assistenter i sina program.
De token som används för API:et för assistenter faktureras enligt den valda språkmodellens in-/utdatahastigheter per token som används för varje assistent. Dessutom debiterar vi följande avgifter för verktygsanvändning:
Verktyg | Indata |
---|---|
Filsökning* | $-/GB vektorlagring per dag (1 GB ledigt) |
Kodtolken** | $-/session |
*GB refererar till binära gigabyte, där 1 GB är 2^30 byte.
**Om assistenten anropar kodtolken samtidigt i två olika trådar skulle det skapa två kodtolkssessioner (2 * $-). Varje session är aktiv som standard i en timme, vilket innebär att du bara betalar den här avgiften en gång om användaren fortsätter att ge instruktioner till kodtolken i samma tråd i upp till en timme.
Kostnad för slutsatsdragning (indata och utdata) varierar beroende på vilken GPT-modell som används med varje assistent. Om assistenten anropar kodtolken samtidigt i två olika trådar, skapas två kodtolkningssessioner (2 * $-). Varje session är aktiv som standard i en timme, vilket innebär att priset avser upp till en timme med instruktioner till kodtolken i samma tråd.
Bildmodeller
Modeller | Kvalitet | Upplösning | Pris (per 100 bilder) |
---|---|---|---|
Dall-E-3 | Standard | 1024 * 1024 | $- |
Standard | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-3 | HD | 1024 * 1024 | $- |
HD | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-2 | Standard | 1024 * 1024 | $- |
Bäddar in modeller
Modeller | Per 1 000 tokens |
---|---|
Ada | $- |
text-embedding-3-large | $- |
text-embedding-3-small | $- |
Talmodeller
Modeller | Pris |
---|---|
Whisper | $-/timme |
TTS (Text till tal) | $-/1 miljon tecken |
TTS HD | $-/1 miljon tecken |
Äldre språkmodeller
Modeller | Kontext | Indata (per 1 miljon token) | Outdata (per 1 miljon token) |
---|---|---|---|
GPT-3.5-Turbo-0301 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 16K | $- | $- |
GPT-3.5-Turbo-1106 | 16K | $- | $- |
GPT-3.5-Turbo-0125 | 16K | $- | $- |
GPT-3.5-Turbo-Instruct | 4K | $- | $- |
GPT-4-Turbo | 128K | $- | $- |
GPT-4-Turbo-Vision | 128K | $- | $- |
GPT-4 | 8K | $- | $- |
GPT-4 | 32K | $- | $- |
Priser och köpalternativ för Azure

Kontakta oss direkt
Få en genomgång av priser för Azure. Förstå prissättningen för din molnlösning, läs mer om kostnadsoptimering och begär ett anpassat förslag.
Prata med en säljareSe köpalternativ
Köp Azure-tjänster via Azure-webbplatsen, din Microsoft-representant eller en Azure-partner.
Utforska dina alternativYtterligare resurser
Azure OpenAI Service
Läs mer om funktioner och egenskaper för Azure OpenAI Service.
Priskalkylator
Beräkna din förväntade månadskostnad för användning av valfri kombination av Azure-produkter.
SLA
Granska serviceavtalet för Azure OpenAI Service.
Dokumentation
Ta del av tekniska självstudiekurser, videor och fler resurser för Azure OpenAI Service.
Vanliga frågor och svar
-
Azure OpenAI Service erbjuder priser baserat på både betala per användning och etablerade dataflödesenheter (PTU). Med Betala per användning kan du betala för de resurser du förbrukar, vilket gör det flexibelt för varierande arbetsbelastningar. PTU:er erbjuder en förutsägbar prismodell där du reserverar och distribuerar en viss mängd modellbearbetningskapacitet. Den här modellen är perfekt för arbetsbelastningar med konsekventa eller förutsägbara användningsmönster, vilket ger stabilitet och kostnadskontroll.
-
To learn more about PTUs and Azure OpenAI pricing please read PTU documentation or contact our sales specialist.
Prata med en säljare för att få en genomgång av Azure-priser. Förstå prissättningen av din molnlösning.
Få kostnadsfria molntjänster och en kredit på $200 för att utforska Azure i 30 dagar.