Översikt över Azure OpenAI-tjänstens prissättning
För att hjälpa kunderna på resan erbjuder vi lösningar för prissättning och kostnadshantering som uppfyller dina behov. inklusive:
- Standard (på begäran): Betala per användning för indata- och utdatatoken.
- Etablerade (PTU:er): Allokera dataflöde med förutsägbara kostnader, med månatliga och årliga reservationer tillgängliga för att minska de totala utgifterna.
- Batch API: Språkmodeller är nu också tillgängliga i Batch API för globala distributioner och tre regioner, som returnerar slutföranden inom 24 timmar för en rabatt på 50 % på global standardprissättning.
- Global distribution – global SKU
- Distribution, datazon – Geografiskt baserad (EU eller USA)
- Regiondistribution – lokal region (upp till 27 regioner)
Utforska prisalternativ
Använd filter för att anpassa prisalternativ efter dina behov.
Priserna är endast uppskattningar och är inte avsedda som faktiska priscitat. Den faktiska prissättningen kan variera beroende på vilken typ av avtal som ingås med Microsoft, inköpsdatum och växelkursen. Priserna beräknas baserat på amerikanska dollar och konverteras med London stängningskurs som registreras under de två arbetsdagarna före den sista arbetsdagen i föregående månads slut. Om de två arbetsdagarna före slutet av månaden infaller på en helgdag på större marknader är prisinställningsdagen vanligtvis dagen omedelbart före de två arbetsdagarna. Den här avgiften gäller för alla transaktioner under den kommande månaden. Logga in på priskalkylatorn för Azure för att se priser baserat på ditt aktuella program/erbjudande hos Microsoft. Kontakta en Azure försäljningsspecialist för mer information om prissättning eller för att begära en prisoffert. Se vanliga frågor och svar om Prissättning för Azure.
Amerikanska myndigheter kan köpa Azure Government-tjänster från en licenslösningsleverantör utan finansiellt åtagande eller direkt via en onlineprenumeration med användningsbaserad betalning.
Viktigt – Priset i R$ är bara som referens. Detta är en internationell transaktion och det slutgiltiga priset beror på växelkurser och IOF-skatter. En eNF kommer inte att utfärdas.
Amerikanska myndigheter kan köpa Azure Government-tjänster från en licenslösningsleverantör utan finansiellt åtagande eller direkt via en onlineprenumeration med användningsbaserad betalning.
Viktigt – Priset i R$ är bara som referens. Detta är en internationell transaktion och det slutgiltiga priset beror på växelkurser och IOF-skatter. En eNF kommer inte att utfärdas.
GPT-5 series
Modell | Prissättning (1 miljoner token) |
---|---|
GPT-5 2025-08-07 Global |
Indata: $- Cachelagrade indata: $- Utdata: $- |
GPT-5 Data Zone |
Indata: $- Cachelagrade indata: $- Utdata: $- |
GPT-5-mini Global |
Indata: $- Cachelagrade indata: $- Utdata: $- |
GPT-5-mini Data Zone |
Indata: $- Cachelagrade indata: $- Utdata: $- |
GPT-5-nano Global |
Indata: $- Cachelagrade indata: $- Utdata: $- |
GPT-5-nano Data Zone |
Indata: $- Cachelagrade indata: $- Utdata: $- |
GPT-5 chat Global |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Deep Research
Deep Research enables developers and enterprises to automate complex research tasks with structured, citation-rich answers. It is suitable for building customer support bots, internal knowledge assistants, or market analysis tools. Deep Research delivers transparent, auditable insights grounded in real-time web data. Search context tokens are charged input token prices for the model being used. You’ll separately incur charges for Grounding with Bing Search and the base GPT model being used for clarifying questions.
Modell | Priser |
---|---|
o3-deep research Global |
Indata: $- Cachelagrade indata: $- Utdata: $- |
o3
o3 är en kraftfull motiveringsmodell från o-serien med motiveringsmodeller som flyttar gränsen över kodning, matematik, vetenskap och visuell uppfattning. Den utmärker sig i komplexa frågor som kräver fasetterad analys och fungerar starkt i visuella uppgifter som att analysera bilder, diagram och grafik. Modellen har ett 200 000 tokenkontextfönster och har en kunskapsgräns från juni 2024.
Modell | Prissättning (1 miljoner token) | Prissättning med Batch API (1M-token) |
---|---|---|
o3 2025-04-16 Global |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Indata: $- Utdata: $- |
o3 2025-04-16 Data Zone |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Indata: $- Utdata: $- |
o3 2025-04-16 Regional |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Inte tillämpligt |
o4-mini
o4-mini är en kompakt, effektiv och kostnadseffektiv motiveringsmodell från OpenAI:s o-serie. Den fungerar i matematik, kodning och visuella uppgifter. Modellen har ett 200 000 tokenkontextfönster och har en kunskapsgräns från juni 2024.
Modell | Prissättning (1 miljoner token) | Prissättning med Batch API (1M-token) |
---|---|---|
o4-mini 2025-04-16 Global |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Indata: $- Utdata: $- |
o4-mini 2025-04-16 Data Zone |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Indata: $- Utdata: $- |
o4-mini 2025-04-16 Regional |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Inte tillämpligt |
GPT-4.1-serien
GPT-4.1-serien är en mycket avancerad modell för generell användning med omfattande världskunskaper och en förbättrad förmåga att förstå användarsyften, vilket gör den särskilt bra på kreativa uppgifter och agentisk planering. Serien har ett fönster med 1 miljon tokenkontexter och har kunskapsbegränsningen juni 2024.
Modell | Prissättning (1 miljoner token) | Prissättning med Batch API (1M-token) |
---|---|---|
GPT-4.1-2025-04-14 Global |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Indata: $- Utdata: $- |
GPT-4.1-2025-04-14 Data Zone |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Indata: $- Utdata: $- |
GPT-4.1-2025-04-14 Regional |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Inte tillämpligt |
GPT-4.1-mini-2025-04-14 Global |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Indata: $- Utdata: $- |
GPT-4.1-mini-2025-04-14 Data Zone |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Indata: $- Utdata: $- |
GPT-4.1-mini-2025-04-14 Regional |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Inte tillämpligt |
GPT-4.1-nano-2025-04-14 Global |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Indata: $- Utdata: $- |
GPT-4.1-nano-2025-04-14 Data Zone |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Indata: $- Utdata: $- |
GPT-4.1-nano-2025-04-14 Regional |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Inte tillämpligt |
Sora i Azure OpenAI
Sora är en multimodal generativ AI-modell som nu är tillgänglig i Azure AI Foundry, utformad för att hjälpa kreativa team att förverkliga idéer genom sömlös API-första integrering. Den bygger på Azures infrastruktur i företagsklass och erbjuder säker och skalbar distribution för att omvandla begrepp till visuellt innehåll av hög kvalitet.
Pris per sekund | 2-5s | 6–10 s | 11–15 s | 16–20 s |
---|---|---|---|---|
480 Square Global | $- | $- | $- | $- |
480p Global | $- | $- | $- | $- |
480 Square Regional | $- | $- | $- | $- |
480p Regional | $- | $- | $- | $- |
720 Square Global | $- | $- | $- | $- |
720p Global | $- | $- | $- | $- |
720 Square Regional | $- | $- | $- | $- |
720p Regional | $- | $- | $- | $- |
1080 Square Global | $- | $- | $- | $- |
1080p Global | $- | $- | $- | $- |
1080 Square Regional | $- | $- | $- | $- |
1080p Regional | $- | $- | $- | $- |
GPT-Image-1
GPT-image-1 förbättrar DALL·E med bättre instruktioner, korrekt textåtergivning och stöd för bildinmatning och redigering. Modellen prissätts per token, med olika priser för text- och bildtoken.
Modell | Prissättning (1 miljoner token) | Prissättning med Batch API (1M-token) |
---|---|---|
GPT-Image-1 Global |
Indatatext: $- Indatabild: $- Utdatabild: $- |
Inte tillämpligt |
GPT-Image-1 Regional |
Indatatext: $- Indatabild: $- Utdatabild: $- |
Inte tillämpligt |
GPT-Image-1 Data Zone |
Indatatext: $- Indatabild: $- Utdatabild: $- |
Inte tillämpligt |
GPT-4.5
Förhandsversion av GPT-4.5 är den senaste modellen för generell användning med djup världskunskap och en bättre förståelse för användarens avsikter, vilket gör den bra på kreativa uppgifter och agentisk planering. Modellen har 128 000 sammanhang och en kunskapsgräns för oktober 2023.
Modell | Prissättning (1 miljoner token) | Prissättning med Batch API (1M-token) |
---|---|---|
GPT-4.5-Förhandsversion-2025-02-27 Global |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Inte tillämpligt |
o1
o1 är den nya serien med anledningsmodeller för komplexa uppgifter. Modellen har 200 000 kontexter och en kunskapsgräns för oktober 2023.
Modell | Prissättning (1 miljoner token) | Prissättning med Batch API (1M-token) |
---|---|---|
o1 2024-12-17 Global |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Inte tillämpligt |
o1 2024-12-17 USA/EU – Datazoner |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Inte tillämpligt |
o1 2024-12-17 Regional |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Inte tillämpligt |
o1 preview 2024-09-12 Global |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Inte tillämpligt |
o1 preview 2024-09-12 USA/EU – Datazoner |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Inte tillämpligt |
o1 preview 2024-09-12 Regional |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Inte tillämpligt |
o3 Mini
O3 mini är den uppdaterade versionen av o1 minimodell. o3-mini är en snabb, kostnadseffektiv motiveringsmodell som är skräddarsydd för användningsfall inom kodning, matematik och vetenskap.
O3-mini-modellen har nu ett utökat kontextindatafönster med 200 000 tokens och maximala utdata på 100 000 token, vilket ger gott om utrymme för komplexa och detaljerade svar. Minimodellen o1 har 128 000 kontextindata. Både o3- och o1-modellen har en kunskapsgräns från oktober 2023.
Modell | Prissättning (1 miljoner token) | Prissättning med Batch API (1M-token) |
---|---|---|
o3 mini 2025-01-31 Global |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Indata: $- Utdata: $- |
o3 mini 2025-01-31-USA/EU – Datazoner |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Indata: $- Utdata: $- |
o3 mini 2025-01-31 Regional |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Inte tillämpligt |
o1-mini 2024-09-12 Global |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Inte tillämpligt |
o1-mini 2024-09-12 USA/EU – Datazoner |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Inte tillämpligt |
o1-mini 2024-09-12 Regional |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Inte tillämpligt |
Ljudmodeller
Azure OpenAI-tjänsten innehåller de avancerade ljudmodellerna GPT-4o-Transcribe, GPT-4o-Mini-Transcribe och GPT-4o-Mini-TTS. Dessa modeller förbättrar funktionerna för tal till text och text till tal, vilket ger hög noggrannhet och anpassningsbara talutdata för olika program. De är idealiska för kundtjänster, livetextning och interaktiva röstutdata och utnyttjar omfattande förträning och avancerade destillationstekniker för överlägsen prestanda.
Modell | Prissättning (1 miljoner token) | Prissättning med Batch API (1M-token) |
---|---|---|
GPT-4o-Transcribe |
Text Indata: $- Utdata: $- Ljud Indata: $- Utdata: Inte tillämpligt |
Inte tillämpligt |
GPT-4o-Mini-Transcribe |
Text Indata: $- Utdata: $- Ljud Indata: $- Utdata: Inte tillämpligt |
Inte tillämpligt |
GPT-4o-Mini-TTS |
Text Indata: $- Utdata: Inte tillämpligt Ljud Indata: Inte tillämpligt Utdata: $- |
Inte tillämpligt |
Datoranvändande agent (CUA)
CUA (Computer-Using Agent) är en specialiserad AI-modell som gör att AI kan interagera med grafiska användargränssnitt (GUIs), navigera i program och automatisera uppgifter i flera steg via instruktioner för naturligt språk. CUA-modellen kan användas som ett verktyg i Responses API.
Modell | Priser |
---|---|
Global förhandsversion av datoranvändning |
Indata: $-/1 miljon token Utdata: $-/1 miljon token |
Inbyggda verktyg
Med Responses API och Assistants API får du sömlös interaktion med verktyg som databehandling, kodtolkar, funktionsanrop och filsökningar, vilket gör det enkelt att utveckla AI-agenter.
Verktyg | Indata |
---|---|
Datoranvändning (endast svars-API) |
Indata: $-/1 miljon token Utdata: $-/1 miljon token |
Samtal till filsökningsverktyg (endast svars-API) | $-/1K-verktygsanrop |
Filsökning* | $-/GB vektorlagring per dag (1 GB ledigt) |
Kodtolken** | $-/session |
*GB refererar till binära gigabyte, där 1 GB är 2^30 byte.
**Om assistenten anropar kodtolken samtidigt i två olika trådar skulle det skapa två kodtolkssessioner (2 * $-). Varje session är aktiv som standard i en timme, vilket innebär att du bara betalar den här avgiften en gång om användaren fortsätter att ge instruktioner till kodtolken i samma tråd i upp till en timme.
Kostnad för slutsatsdragning (indata och utdata) varierar beroende på vilken GPT-modell som används med varje assistent. Om assistenten anropar kodtolken samtidigt i två olika trådar, skapas två kodtolkningssessioner (2 * $-). Varje session är aktiv som standard i en timme, vilket innebär att priset avser upp till en timme med instruktioner till kodtolken i samma tråd.
API i realtid
GPT-4o-Realtime-Preview används i Realtids-API:et och har stöd för flerspråkiga tal till tal-funktioner. Den är optimerad för konversationer med låg fördröjning i realtid och möjliggör naturliga interaktioner med minimal fördröjning, perfekt för chattrobotar och konversations-AI. GPT-4o är den omfattande och kraftfullare versionen som är utformad för komplexa uppgifter, medan GPT-4o Mini är ett mindre och mer kostnadseffektivt alternativ som passar enklare program där kostnadseffektivitet och hastighet prioriteras.
Modell | Prissättning (1 miljoner token) |
---|---|
GPT-4o-Realtime-Preview-2024-12-17-Global |
Text Indata: $- Cachelagrade indata: $- Utdata: $- Ljud Indata: $- Cachelagrade indata: $- Utdata: $- |
GPT-4o-Realtime-Preview-2024-12-17-US/EU – Datazoner |
Text Indata: $- Cachelagrade indata: $- Utdata: $- Ljud Indata: $- Cachelagrade indata: $- Utdata: $- |
GPT-4o-Realtime-Preview-2024-12-17-Regional |
Text Indata: $- Cachelagrade indata: $- Utdata: $- Ljud Indata: $- Cachelagrade indata: $- Utdata: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global |
Text Indata: $- Cachelagrade indata: $- Utdata: $- Ljud Indata: $- Cachelagrade indata: $- Utdata: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU – Datazoner |
Text Indata: $- Cachelagrade indata: $- Utdata: $- Ljud Indata: $- Cachelagrade indata: $- Utdata: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional |
Text Indata: $- Cachelagrade indata: $- Utdata: $- Ljud Indata: $- Cachelagrade indata: $- Utdata: $- |
GPT-4o-Realtime-Preview-2024-10-01-Global |
Text Indata: $- Cachelagrade indata: $- Utdata: $- Ljud Indata: $- Cachelagrade indata: $- Utdata: $- |
GPT-4o-Realtime-Preview-2024-10-01-US/EU – Datazoner |
Text Indata: $- Cachelagrade indata: $- Utdata: $- Ljud Indata: $- Cachelagrade indata: $- Utdata: $- |
GPT-4o-Realtime-Preview-2024-10-01-Regional |
Text Indata: $- Cachelagrade indata: $- Utdata: $- Ljud Indata: $- Cachelagrade indata: $- Utdata: $- |
API för chattkomplettering
Modellen för GPT 4o-Audio-Preview används i API:et för chattkomplettering och genererar ljudinnehåll. Den stöder avancerade funktioner som taligenkänning och ljudsyntes, perfekt för asynkrona talinteraktioner och attitydanalys. GPT-4o är den omfattande och kraftfullare versionen som är utformad för komplexa uppgifter, medan GPT-4o Mini är ett mindre och mer kostnadseffektivt alternativ som passar enklare program där kostnadseffektivitet och hastighet prioriteras.
Modell | Prissättning (1 miljoner token) |
---|---|
GPT-4o-Audio-Preview-2024-12-17-Global |
Text Indata: $- Utdata: $- Ljud Indata: $- Utdata: $- |
GPT-4o-Audio-Preview-2024-12-17-US/EU – Datazoner |
Text Indata: $- Utdata: $- Ljud Indata: $- Utdata: $- |
GPT-4o-Audio-Preview-2024-12-17-Regional |
Text Indata: $- Utdata: $- Ljud Indata: $- Utdata: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Global |
Text Indata: $- Utdata: $- Ljud Indata: $- Utdata: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU – Datazoner |
Text Indata: $- Utdata: $- Ljud Indata: $- Utdata: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional |
Text Indata: $- Utdata: $- Ljud Indata: $- Utdata: $- |
GPT-4o
GPT-4o är den mest avancerade multimodala modellen som är snabbare och billigare än GPT-4 Turbo med starkare synfunktioner. Modellen har 128 000 kontexter och en kunskapsgräns för oktober 2023.
Modell | Prissättning (1 miljoner token) | Prissättning med Batch API (1M-token) |
---|---|---|
GPT-4o-2024-1120 Global |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Indata: $- Utdata: $- |
GPT-4o-2024-11-20 US/EU – Data Zones |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Indata: $- Utdata: $- |
GPT-4o-2024-1120 Regional |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Inte tillämpligt |
GPT-4o-2024-08-06 Global |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Indata: $- Utdata: $- |
GPT-4o-2024-08-06 US/EU – Data Zones |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Indata: $- Utdata: $- |
GPT-4o-2024-08-06 Regional |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Inte tillämpligt |
GPT-4o-2024-0513 Global |
Indata: $- Utdata: $- |
Indata: $- Utdata: $- |
GPT-4o-2024-0513 US/EU – Data Zones |
Indata: $- Utdata: $- |
Inte tillämpligt |
GPT-4o-2024-0513 Regional |
Indata: $- Utdata: $- |
Inte tillämpligt |
GPT-4o-mini
GPT-4o mini är den mest kostnadseffektiva små modellen och har synfunktioner. Modellen har 128 000 kontexter och en kunskapsgräns för oktober 2023.
Modell | Prissättning (1 miljoner token) | Prissättning med Batch API (1M-token) |
---|---|---|
GPT-4o-mini-0718 Global |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Indata: $- Utdata: $- |
GPT-4o-mini-0718 USA/EU – Datazoner |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Indata: $- Utdata: $- |
GPT-4o-mini-0718 Regional |
Indata: $- Cachelagrade indata: $- Utdata: $- |
Inte tillämpligt |
Etablerat
You can allocate and manage throughput for deployments, ensuring predictable performance and stable capacity. You are charged an hourly rate per model regardless of usage, but you can also secure additional savings through monthly and annual reservations. Discover how to transition your regional deployments and provisioned reservations to global and data zones on this Learn page.
Modell | Minsta antal PTU:er | Pris per timme för PTU | Pris för månatlig PTU-reservation | Pris för årlig PTU-reservation |
---|---|---|---|---|
GPT-5 Global | 15 | $- | $- | $- |
GPT-5 Data Zones | 15 | $- | $- | $- |
GPT-5 Regional | 50 | $- | $- | $- |
GPT-4.1 Global | 15 | $- | $- | $- |
GPT-4.1 Data Zones | 15 | $- | $- | $- |
GPT-4.1 Regional | 50 | $- | $- | $- |
GPT-4.1-mini Global | 15 | $- | $- | $- |
GPT-4.1-mini US/EU Data Zones | 15 | $- | $- | $- |
GPT-4.1-mini Regional | 25 | $- | $- | $- |
GPT-4.1-nano Global | 15 | $- | $- | $- |
GPT-4.1-nano US/EU Data Zones | 15 | $- | $- | $- |
GPT-4.1-nano Regional | 25 | $- | $- | $- |
o3-mini Global | 15 | $- | $- | $- |
o3-mini US/EU Data Zones | 15 | $- | $- | $- |
o3-mini Regional | 25 | $- | $- | $- |
o3 Global | 15 | $- | $- | $- |
o3 US/EU Data Zones | 15 | $- | $- | $- |
o3 Regional | 50 | $- | $- | $- |
o4-mini Global | 15 | $- | $- | $- |
o4-mini US/EU Data Zones | 15 | $- | $- | $- |
o4-mini Regional | 25 | $- | $- | $- |
GPT-4o Global | 15 | $- | $- | $- |
GPT-4o USA/EU-datazoner | 15 | $- | $- | $- |
GPT-4o Regional | 50 | $- | $- | $- |
Fine-Tuned GPT-4o-Regional | 50 | $- | $- | $- |
GPT-4o Mini Global | 15 | $- | $- | $- |
DATAzoner för GPT-4o Mini USA/EU | 15 | $- | $- | $- |
GPT-4o-Mini Regional | 25 | $- | $- | $- |
Fine-Tuned GPT-4o-Mini Regional | 25 | $- | $- | $- |
Basmodeller
Modeller | Användning per 1 000 token |
---|---|
Babbage 002 | $- |
Davinci 002 | $- |
Finjustera modeller
Modell | Priser | |
---|---|---|
o4-mini (förstärkt finjustering) | Regionalt |
Indata: $-/1 miljon token Utdata: $-/1 miljon token Utbildning: $-/timme Hosting: $-/timme Grader indata: o4-mini: $-/1 miljon token 4.1-mini: $-/1 miljon token 4.1: $-/1 miljon token 4.1-nano: $-/1 miljon token o3: $-/1 miljon token Cachelagrade indata för Grader: o4-mini: $-/1 miljon token 4.1-mini: $-/1 miljon token 4.1: $-/1 miljon token 4.1-nano: $-/1 miljon token o3: $-/1 miljon token Grader utdata: o4-mini: $-/1 miljon token 4.1-mini: $-/1 miljon token 4.1: $-/1 miljon token 4.1-nano: $-/1 miljon token o3: $-/1 miljon token |
Globalt |
Indata: $-/1 miljon token Utdata: $-/1 miljon token Utbildning: $-/timme Hosting: $-/timme Grader indata: o4-mini: $-/1 miljon token 4.1-mini: $-/1 miljon token 4.1: $-/1 miljon token 4.1-nano: $-/1 miljon token o3: $-/1 miljon token Cachelagrade indata för Grader: o4-mini: $-/1 miljon token 4.1-mini: $-/1 miljon token 4.1: $-/1 miljon token 4.1-nano: $-/1 miljon token o3: $-/1 miljon token Grader utdata: o4-mini: $-/1 miljon token 4.1-mini: $-/1 miljon token 4.1: $-/1 miljon token 4.1-nano: $-/1 miljon token o3: $-/1 miljon token |
|
GPT-4.1 | Regionalt |
Indata: $-/1 miljon token Cachelagrade indata: $-/1 miljon token Utdata: $-/1 miljon token Utbildning: $-/1 miljon token Hosting: $-/timme |
Globalt |
Indata: $-/1 miljon token Cachelagrade indata: $-/1 miljon token Utdata: $-/1 miljon token Utbildning: $-/1 miljon token Hosting: $-/timme |
|
Utvecklare |
Indata: $-/1 miljon token Cachelagrade indata: $-/1 miljon token Utdata: $-/1 miljon token |
|
GPT-4.1-mini | Regionalt |
Indata: $-/1 miljon token Cachelagrade indata: $-/1 miljon token Utdata: $-/1 miljon token Utbildning: $-/1 miljon token Hosting: $-/timme |
Globalt |
Indata: $-/1 miljon token Cachelagrade indata: $-/1 miljon token Utdata: $-/1 miljon token Utbildning: $-/1 miljon token Hosting: $-/timme |
|
Utvecklare |
Indata: $-/1 miljon token Cachelagrade indata: $-/1 miljon token Utdata: $-/1 miljon token |
|
GPT-4.1-nano | Regionalt |
Indata: $-/1 miljon token Cachelagrade indata: $-/1 miljon token Utdata: $-/1 miljon token Utbildning: $-/1 miljon token Hosting: $-/timme |
Globalt |
Indata: $-/1 miljon token Cachelagrade indata: $-/1 miljon token Utdata: $-/1 miljon token Utbildning: $-/1 miljon token Hosting: $-/timme |
|
Utvecklare |
Indata: $-/1 miljon token Cachelagrade indata: $-/1 miljon token Utdata: $-/1 miljon token |
|
GPT-4o-2024-08-06 | Regionalt |
Indata: $-/1 miljon token Cachelagrade indata: $-/1 miljon token Utdata: $-/1 miljon token Utbildning: $-/1 miljon token Hosting: $-/timme |
Globalt |
Indata: $-/1 miljon token Cachelagrade indata: $-/1 miljon token Utdata: $-/1 miljon token Utbildning: använd regional Hosting: $-/timme |
|
GPT-4o-mini | Regionalt |
Indata: $-/1 miljon token Cachelagrade indata: $-/1 miljon token Utdata: $-/1 miljon token Utbildning: $-/1 miljon token Hosting: $-/timme |
Globalt |
Indata: $-/1 miljon token Cachelagrade indata: $-/1 miljon token Utdata: $-/1 miljon token Utbildning: använd regional Hosting: $-/timme |
|
GPT-3.5-Turbo (16K) | Regionalt |
Indata: $-/1 miljon token Utdata: $-/1 miljon token Utbildning: $-/1 miljon token Hosting: $-/timme |
Bildmodeller
Modeller | Kvalitet | Upplösning | Pris (per 100 bilder) |
---|---|---|---|
Dall-E-3 | Standard | 1024 * 1024 | $- |
Standard | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-3 | HD | 1024 * 1024 | $- |
HD | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-2 | Standard | 1024 * 1024 | $- |
Bäddar in modeller
Modeller | Per 1 000 tokens |
---|---|
Ada | $- |
text-embedding-3-large | $- |
text-embedding-3-small | $- |
Talmodeller
Modeller | Pris |
---|---|
Whisper | $-/timme |
TTS (Text till tal) | $-/1 miljon tecken |
TTS HD | $-/1 miljon tecken |
Äldre språkmodeller
Modeller | Kontext | Indata (per 1 miljon token) | Outdata (per 1 miljon token) |
---|---|---|---|
GPT-3.5-Turbo-0301 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 16K | $- | $- |
GPT-3.5-Turbo-1106 | 16K | $- | $- |
GPT-3.5-Turbo-0125 | 16K | $- | $- |
GPT-3.5-Turbo-Instruct | 4K | $- | $- |
GPT-4-Turbo | 128K | $- | $- |
GPT-4-Turbo-Vision | 128K | $- | $- |
GPT-4 | 8K | $- | $- |
GPT-4 | 32K | $- | $- |
Priser och köpalternativ för Azure

Kontakta oss direkt
Få en genomgång av priser för Azure. Förstå prissättningen för din molnlösning, läs mer om kostnadsoptimering och begär ett anpassat förslag.
Prata med en säljareSe köpalternativ
Köp Azure-tjänster via Azure-webbplatsen, din Microsoft-representant eller en Azure-partner.
Utforska dina alternativYtterligare resurser
Azure OpenAI Service
Läs mer om funktioner och egenskaper för Azure OpenAI Service.
Priskalkylator
Beräkna din förväntade månadskostnad för användning av valfri kombination av Azure-produkter.
SLA
Granska serviceavtalet för Azure OpenAI Service.
Dokumentation
Ta del av tekniska självstudiekurser, videor och fler resurser för Azure OpenAI Service.
Vanliga frågor och svar
-
Azure OpenAI Service erbjuder priser baserat på både betala per användning och etablerade dataflödesenheter (PTU). Med Betala per användning kan du betala för de resurser du förbrukar, vilket gör det flexibelt för varierande arbetsbelastningar. PTU:er erbjuder en förutsägbar prismodell där du reserverar och distribuerar en viss mängd modellbearbetningskapacitet. Den här modellen är perfekt för arbetsbelastningar med konsekventa eller förutsägbara användningsmönster, vilket ger stabilitet och kostnadskontroll.
-
Mer information om PTU:er och priser för Azure OpenAI finns i PTU-dokumentationen, eller kontakta vår säljspecialist.
Prata med en säljare för att få en genomgång av Azure-priser. Förstå prissättningen av din molnlösning.
Få kostnadsfria molntjänster och en kredit på $200 för att utforska Azure i 30 dagar.