Gå till huvudinnehåll
Azure

Priser för Azure OpenAI Service

Översikt över Azure OpenAI-tjänstens prissättning

Azure OpenAI Service levererar företagsklar generativ AI med kraftfulla modeller från OpenAI, vilket gör det möjligt för organisationer att förnya med text-, ljud- och visionsfunktioner. Utöver de senaste modellerna väljer företag Azure OpenAI-tjänst för inbyggd datasekretess, regional/områdes-/global flexibilitet och sömlös integrering i Azures ekosystem, inklusive Fabric, Cosmos DB och Azure AI Search. Företag i alla storlekar kan tryggt skala AI-lösningar för att förbättra kundupplevelsen, automatisera arbetsflöden och frigöra kreativ potential, vilket ger mätbar effekt och konkurrensmässig differentiering.

För att hjälpa kunderna på resan erbjuder vi lösningar för prissättning och kostnadshantering som uppfyller dina behov. inklusive:
  • Standard (på begäran): Betala per användning för indata- och utdatatoken.
  • Etablerade (PTU:er): Allokera dataflöde med förutsägbara kostnader, med månatliga och årliga reservationer tillgängliga för att minska de totala utgifterna.
  • Batch API: Språkmodeller är nu också tillgängliga i Batch API för globala distributioner och tre regioner, som returnerar slutföranden inom 24 timmar för en rabatt på 50 % på global standardprissättning.
Du kan välja mellan följande distributionstyper för Standard och Etablerat, vilket ger större flexibilitet och kontroll över priser och prestanda. Den här flexibiliteten hjälper dig när det finns allt mer restriktiva databehandlingsgränser och behov av ökat dataflöde och lägre pris.
  • Global distribution – global SKU
  • Distribution, datazon – Geografiskt baserad (EU eller USA)
  • Regiondistribution – lokal region (upp till 27 regioner)

Utforska prisalternativ

Använd filter för att anpassa prisalternativ efter dina behov.

Priserna är endast uppskattningar och är inte avsedda som faktiska priscitat. Den faktiska prissättningen kan variera beroende på vilken typ av avtal som ingås med Microsoft, inköpsdatum och växelkursen. Priserna beräknas baserat på amerikanska dollar och konverteras med London stängningskurs som registreras under de två arbetsdagarna före den sista arbetsdagen i föregående månads slut. Om de två arbetsdagarna före slutet av månaden infaller på en helgdag på större marknader är prisinställningsdagen vanligtvis dagen omedelbart före de två arbetsdagarna. Den här avgiften gäller för alla transaktioner under den kommande månaden. Logga in på priskalkylatorn för Azure för att se priser baserat på ditt aktuella program/erbjudande hos Microsoft. Kontakta en Azure försäljningsspecialist för mer information om prissättning eller för att begära en prisoffert. Se vanliga frågor och svar om Prissättning för Azure.

o3

o3 is a powerful reasoning model from the o-series of reasoning models, pushing the frontier across coding, math, science, and visual perception. It excels in complex queries requiring multi-faceted analysis and performs strongly in visual tasks like analyzing images, charts, and graphics. The model features a 200k token context window and has a knowledge cutoff of June 2024.

Modell Prissättning (1 miljoner token) Prissättning med Batch API (1M-token)
o3 2025-04-16 Indata: $-
Cachelagrade indata: $-
Utdata: $-
Inte tillämpligt

o4-mini

o4-mini is a compact, efficient, and cost-effective reasoning model from OpenAI's o-series. It excels in math, coding, and visual tasks. The model features a 200k token context window and has a knowledge cutoff of June 2024.

Modell Prissättning (1 miljoner token) Prissättning med Batch API (1M-token)
o4-mini 2025-04-16 Indata: $-
Cachelagrade indata: $-
Utdata: $-
Inte tillämpligt

GPT-4.1 series

GPT-4.1 series is a highly advanced general-purpose model with extensive world knowledge and an enhanced ability to understand user intent, making it particularly adept at creative tasks and agentic planning. The series features a 1 million token context window and has a knowledge cutoff of June 2024

Modell Prissättning (1 miljoner token) Prissättning med Batch API (1M-token)
GPT-4.1-2025-04-14 Indata: $-
Cachelagrade indata: $-
Utdata: $-
Inte tillämpligt
GPT-4.1-mini-2025-04-14 Indata: $-
Cachelagrade indata: $-
Utdata: $-
Inte tillämpligt
GPT-4.1-nano-2025-04-14 Indata: $-
Cachelagrade indata: $-
Utdata: $-
Inte tillämpligt

GPT-4.5

Förhandsversion av GPT-4.5 är den senaste modellen för generell användning med djup världskunskap och en bättre förståelse för användarens avsikter, vilket gör den bra på kreativa uppgifter och agentisk planering. Modellen har 128 000 sammanhang och en kunskapsgräns för oktober 2023.

Modell Prissättning (1 miljoner token) Prissättning med Batch API (1M-token)
GPT-4.5-Förhandsversion-2025-02-27 Global Indata: $-
Cachelagrade indata: $-
Utdata: $-
Inte tillämpligt

o1

o1 är den nya serien med anledningsmodeller för komplexa uppgifter. Modellen har 200 000 kontexter och en kunskapsgräns för oktober 2023.

Modell Prissättning (1 miljoner token) Prissättning med Batch API (1M-token)
o1 2024-12-17 Global Indata: $-
Cachelagrade indata: $-
Utdata: $-
Inte tillämpligt
o1 2024-12-17 USA/EU – Datazoner Indata: $-
Cachelagrade indata: $-
Utdata: $-
Inte tillämpligt
o1 2024-12-17 Regional Indata: $-
Cachelagrade indata: $-
Utdata: $-
Inte tillämpligt
o1 preview 2024-09-12 Global Indata: $-
Cachelagrade indata: $-
Utdata: $-
Inte tillämpligt
o1 preview 2024-09-12 USA/EU – Datazoner Indata: $-
Cachelagrade indata: $-
Utdata: $-
Inte tillämpligt
o1 preview 2024-09-12 Regional Indata: $-
Cachelagrade indata: $-
Utdata: $-
Inte tillämpligt

Planera med priskalkylatorn för

o3 Mini

O3 mini är den uppdaterade versionen av o1 minimodell. o3-mini är en snabb, kostnadseffektiv motiveringsmodell som är skräddarsydd för användningsfall inom kodning, matematik och vetenskap.

O3-mini-modellen har nu ett utökat kontextindatafönster med 200 000 tokens och maximala utdata på 100 000 token, vilket ger gott om utrymme för komplexa och detaljerade svar. Minimodellen o1 har 128 000 kontextindata. Både o3- och o1-modellen har en kunskapsgräns från oktober 2023.

Modell Prissättning (1 miljoner token) Prissättning med Batch API (1M-token)
o3 mini 2025-01-31 Global Indata: $-
Cachelagrade indata: $-
Utdata: $-
Indata: $-
Utdata: $-
o3 mini 2025-01-31-USA/EU – Datazoner Indata: $-
Cachelagrade indata: $-
Utdata: $-
Indata: $-
Utdata: $-
o3 mini 2025-01-31 Regional Indata: $-
Cachelagrade indata: $-
Utdata: $-
Inte tillämpligt
o1-mini 2024-09-12 Global Indata: $-
Cachelagrade indata: $-
Utdata: $-
Inte tillämpligt
o1-mini 2024-09-12 USA/EU – Datazoner Indata: $-
Cachelagrade indata: $-
Utdata: $-
Inte tillämpligt
o1-mini 2024-09-12 Regional Indata: $-
Cachelagrade indata: $-
Utdata: $-
Inte tillämpligt

Planera med priskalkylatorn för

Computer-Using Agent (CUA)

The Computer-Using Agent (CUA) is a specialized AI model that allows AI to interact with graphical user interfaces (GUIs), navigate applications, and automate multi-step tasks—all through natural language instructions. The CUA model can be used as a tool in the Responses API.

Modell Priser
computer-use-preview Global Indata: $-/1 miljon token
Utdata: $-/1 miljon token

Built-in tools

The Responses API and the Assistants API enable seamless interaction with tools like computer use, code interpreter, function calling, and file search, making it easy for developers to build AI agents.

Verktyg Indata
Computer Use (Responses API only) Indata: $-/1 miljon token
Utdata: $-/1 miljon token
File Search Tool Call (Responses API only) $-/1K tool calls
Filsökning* $-/GB vektorlagring per dag (1 GB ledigt)
Kodtolken** $-/session

*GB refererar till binära gigabyte, där 1 GB är 2^30 byte.

**Om assistenten anropar kodtolken samtidigt i två olika trådar skulle det skapa två kodtolkssessioner (2 * $-). Varje session är aktiv som standard i en timme, vilket innebär att du bara betalar den här avgiften en gång om användaren fortsätter att ge instruktioner till kodtolken i samma tråd i upp till en timme.

Kostnad för slutsatsdragning (indata och utdata) varierar beroende på vilken GPT-modell som används med varje assistent. Om assistenten anropar kodtolken samtidigt i två olika trådar, skapas två kodtolkningssessioner (2 * $-). Varje session är aktiv som standard i en timme, vilket innebär att priset avser upp till en timme med instruktioner till kodtolken i samma tråd.

API i realtid

GPT-4o-Realtime-Preview används i Realtids-API:et och har stöd för flerspråkiga tal till tal-funktioner. Den är optimerad för konversationer med låg fördröjning i realtid och möjliggör naturliga interaktioner med minimal fördröjning, perfekt för chattrobotar och konversations-AI. GPT-4o är den omfattande och kraftfullare versionen som är utformad för komplexa uppgifter, medan GPT-4o Mini är ett mindre och mer kostnadseffektivt alternativ som passar enklare program där kostnadseffektivitet och hastighet prioriteras.

Modell Prissättning (1 miljoner token)
GPT-4o-Realtime-Preview-2024-12-17-Global Text
Indata: $-
Cachelagrade indata: $-
Utdata: $-

Ljud
Indata: $-
Cachelagrade indata: $-
Utdata: $-
GPT-4o-Realtime-Preview-2024-12-17-US/EU – Datazoner Text
Indata: $-
Cachelagrade indata: $-
Utdata: $-

Ljud
Indata: $-
Cachelagrade indata: $-
Utdata: $-
GPT-4o-Realtime-Preview-2024-12-17-Regional Text
Indata: $-
Cachelagrade indata: $-
Utdata: $-

Ljud
Indata: $-
Cachelagrade indata: $-
Utdata: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global Text
Indata: $-
Cachelagrade indata: $-
Utdata: $-

Ljud
Indata: $-
Cachelagrade indata: $-
Utdata: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU – Datazoner Text
Indata: $-
Cachelagrade indata: $-
Utdata: $-

Ljud
Indata: $-
Cachelagrade indata: $-
Utdata: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional Text
Indata: $-
Cachelagrade indata: $-
Utdata: $-

Ljud
Indata: $-
Cachelagrade indata: $-
Utdata: $-
GPT-4o-Realtime-Preview-2024-10-01-Global Text
Indata: $-
Cachelagrade indata: $-
Utdata: $-

Ljud
Indata: $-
Cachelagrade indata: $-
Utdata: $-
GPT-4o-Realtime-Preview-2024-10-01-US/EU – Datazoner Text
Indata: $-
Cachelagrade indata: $-
Utdata: $-

Ljud
Indata: $-
Cachelagrade indata: $-
Utdata: $-
GPT-4o-Realtime-Preview-2024-10-01-Regional Text
Indata: $-
Cachelagrade indata: $-
Utdata: $-

Ljud
Indata: $-
Cachelagrade indata: $-
Utdata: $-

API för chattkomplettering

Modellen för GPT 4o-Audio-Preview används i API:et för chattkomplettering och genererar ljudinnehåll. Den stöder avancerade funktioner som taligenkänning och ljudsyntes, perfekt för asynkrona talinteraktioner och attitydanalys. GPT-4o är den omfattande och kraftfullare versionen som är utformad för komplexa uppgifter, medan GPT-4o Mini är ett mindre och mer kostnadseffektivt alternativ som passar enklare program där kostnadseffektivitet och hastighet prioriteras.

Modell Prissättning (1 miljoner token)
GPT-4o-Audio-Preview-2024-12-17-Global Text
Indata: $-
Utdata: $-

Ljud
Indata: $-
Utdata: $-
GPT-4o-Audio-Preview-2024-12-17-US/EU – Datazoner Text
Indata: $-
Utdata: $-

Ljud
Indata: $-
Utdata: $-
GPT-4o-Audio-Preview-2024-12-17-Regional Text
Indata: $-
Utdata: $-

Ljud
Indata: $-
Utdata: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Global Text
Indata: $-
Utdata: $-

Ljud
Indata: $-
Utdata: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU – Datazoner Text
Indata: $-
Utdata: $-

Ljud
Indata: $-
Utdata: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional Text
Indata: $-
Utdata: $-

Ljud
Indata: $-
Utdata: $-

GPT-4o

GPT-4o är den mest avancerade multimodala modellen som är snabbare och billigare än GPT-4 Turbo med starkare synfunktioner. Modellen har 128 000 kontexter och en kunskapsgräns för oktober 2023.

Modell Prissättning (1 miljoner token) Prissättning med Batch API (1M-token)
GPT-4o-2024-1120 Global Indata: $-
Cachelagrade indata: $-
Utdata: $-
Indata: $-
Utdata: $-
GPT-4o-2024-11-20 US/EU – Data Zones Indata: $-
Cachelagrade indata: $-
Utdata: $-
Indata: $-
Utdata: $-
GPT-4o-2024-1120 Regional Indata: $-
Cachelagrade indata: $-
Utdata: $-
Inte tillämpligt
GPT-4o-2024-08-06 Global Indata: $-
Cachelagrade indata: $-
Utdata: $-
Indata: $-
Utdata: $-
GPT-4o-2024-08-06 US/EU – Data Zones Indata: $-
Cachelagrade indata: $-
Utdata: $-
Indata: $-
Utdata: $-
GPT-4o-2024-08-06 Regional Indata: $-
Cachelagrade indata: $-
Utdata: $-
Inte tillämpligt
GPT-4o-2024-0513 Global Indata: $-
Utdata: $-
Indata: $-
Utdata: $-
GPT-4o-2024-0513 US/EU – Data Zones Indata: $-
Utdata: $-
Inte tillämpligt
GPT-4o-2024-0513 Regional Indata: $-
Utdata: $-
Inte tillämpligt

Planera med priskalkylatorn för

GPT-4o-mini

GPT-4o mini är den mest kostnadseffektiva små modellen och har synfunktioner. Modellen har 128 000 kontexter och en kunskapsgräns för oktober 2023.

Modell Prissättning (1 miljoner token) Prissättning med Batch API (1M-token)
GPT-4o-mini-0718 Global Indata: $-
Cachelagrade indata: $-
Utdata: $-
Indata: $-
Utdata: $-
GPT-4o-mini-0718 USA/EU – Datazoner Indata: $-
Cachelagrade indata: $-
Utdata: $-
Indata: $-
Utdata: $-
GPT-4o-mini-0718 Regional Indata: $-
Cachelagrade indata: $-
Utdata: $-
Inte tillämpligt

Planera med priskalkylatorn för

Etablerat

Du kan allokera och hantera dataflöde för distributioner, vilket garanterar förutsägbar prestanda och stabil kapacitet. Du debiteras ett timpris per modell oavsett användning, men du kan också skydda ytterligare besparingar via månatliga och årliga reservationer. Upptäck hur du överför dina regionala distributioner och etablerade reservationer till globala och datazoner på den här lässidan.

Modell Minsta antal PTU:er Pris per timme för PTU Pris för månatlig PTU-reservation Pris för årlig PTU-reservation
GPT-4o Global 15 $- $- $-
GPT-4o USA/EU-datazoner 15 $- $- $-
GPT-4o Regional 50 $- $- $-
Fine-Tuned GPT-4o-Regional 50 $- $- $-
GPT-4o Mini Global 15 $- $- $-
DATAzoner för GPT-4o Mini USA/EU 15 $- $- $-
GPT-4o-Mini Regional 25 $- $- $-
Fine-Tuned GPT-4o-Mini Regional 25 $- $- $-

Planera med priskalkylatorn för

Basmodeller

Modeller Användning per 1 000 token
Babbage 002 $-
Davinci 002 $-

Finjustera modeller

Modell Priser
GPT-4.1 Regionalt Indata: $-/1 miljon token
Cachelagrade indata: $-/1 miljon token
Utdata: $-/1 miljon token
Utbildning: $-/1 miljon token
Hosting: $-/timme
Globalt Indata: $-/1 miljon token
Cachelagrade indata: $-/1 miljon token
Utdata: $-/1 miljon token
Utbildning: $-/1 miljon token
Hosting: $-/timme
GPT-4.1-mini Regionalt Indata: $-/1 miljon token
Cachelagrade indata: $-/1 miljon token
Utdata: $-/1 miljon token
Utbildning: $-/1 miljon token
Hosting: $-/timme
Globalt Indata: $-/1 miljon token
Cachelagrade indata: $-/1 miljon token
Utdata: $-/1 miljon token
Utbildning: $-/1 miljon token
Hosting: $-/timme
GPT-4o-2024-08-06 Regionalt Indata: $-/1 miljon token
Cachelagrade indata: $-/1 miljon token
Utdata: $-/1 miljon token
Utbildning: $-/1 miljon token
Hosting: $-/timme
Globalt Indata: $-/1 miljon token
Cachelagrade indata: $-/1 miljon token
Utdata: $-/1 miljon token
Utbildning: använd regional
Hosting: $-/timme
GPT-4o-mini Regionalt Indata: $-/1 miljon token
Cachelagrade indata: $-/1 miljon token
Utdata: $-/1 miljon token
Utbildning: $-/1 miljon token
Hosting: $-/timme
Globalt Indata: $-/1 miljon token
Cachelagrade indata: $-/1 miljon token
Utdata: $-/1 miljon token
Utbildning: använd regional
Hosting: $-/timme
GPT-3.5-Turbo (16K) Regionalt Indata: $-/1 miljon token
Utdata: $-/1 miljon token
Utbildning: $-/1 miljon token
Hosting: $-/timme
GPT-3.5-Turbo (4K) Regionalt Indata: $-/1 miljon token
Utdata: $-/1 miljon token
Utbildning: $-/1 miljon token
Hosting: $-/timme

Bildmodeller

Modeller Kvalitet Upplösning Pris (per 100 bilder)
Dall-E-3 Standard 1024 * 1024 $-
Standard 1024 * 1792,
1792 * 1024
$-
Dall-E-3 HD 1024 * 1024 $-
HD 1024 * 1792,
1792 * 1024
$-
Dall-E-2 Standard 1024 * 1024 $-

Bäddar in modeller

Modeller Per 1 000 tokens
Ada $-
text-embedding-3-large $-
text-embedding-3-small $-

Talmodeller

Modeller Pris
Whisper $-/timme
TTS (Text till tal) $-/1 miljon tecken
TTS HD $-/1 miljon tecken

Äldre språkmodeller

Modeller Kontext Indata (per 1 miljon token) Outdata (per 1 miljon token)
GPT-3.5-Turbo-0301 4K $- $-
GPT-3.5-Turbo-0613 4K $- $-
GPT-3.5-Turbo-0613 16K $- $-
GPT-3.5-Turbo-1106 16K $- $-
GPT-3.5-Turbo-0125 16K $- $-
GPT-3.5-Turbo-Instruct 4K $- $-
GPT-4-Turbo 128K $- $-
GPT-4-Turbo-Vision 128K $- $-
GPT-4 8K $- $-
GPT-4 32K $- $-

Priser och köpalternativ för Azure

Kontakta oss direkt

Få en genomgång av priser för Azure. Förstå prissättningen för din molnlösning, läs mer om kostnadsoptimering och begär ett anpassat förslag.

Prata med en säljare

Se köpalternativ

Köp Azure-tjänster via Azure-webbplatsen, din Microsoft-representant eller en Azure-partner.

Utforska dina alternativ

Ytterligare resurser

Azure OpenAI Service

Läs mer om funktioner och egenskaper för Azure OpenAI Service.

Priskalkylator

Beräkna din förväntade månadskostnad för användning av valfri kombination av Azure-produkter.

SLA

Granska serviceavtalet för Azure OpenAI Service.

Dokumentation

Ta del av tekniska självstudiekurser, videor och fler resurser för Azure OpenAI Service.

Vanliga frågor och svar

  • Azure OpenAI Service erbjuder priser baserat på både betala per användning och etablerade dataflödesenheter (PTU). Med Betala per användning kan du betala för de resurser du förbrukar, vilket gör det flexibelt för varierande arbetsbelastningar. PTU:er erbjuder en förutsägbar prismodell där du reserverar och distribuerar en viss mängd modellbearbetningskapacitet. Den här modellen är perfekt för arbetsbelastningar med konsekventa eller förutsägbara användningsmönster, vilket ger stabilitet och kostnadskontroll.
  • Mer information om PTU:er och priser för Azure OpenAI finns i PTU-dokumentationen, eller kontakta vår säljspecialist.

Prata med en säljare för att få en genomgång av Azure-priser. Förstå prissättningen av din molnlösning.

Få kostnadsfria molntjänster och en kredit på $200 för att utforska Azure i 30 dagar.

Har lagts till i beräkningen. Tryck på ”v” för att visa på kalkylator
Kan vi hjälpa dig?