Oversigt over prisfastsættelse for Azure OpenAI-tjenesten
For at hjælpe kunderne på rejsen tilbyder vi pris- og omkostningsstyringsløsninger, der opfylder dine behov. herunder:
- Standard (On-Demand): Betalt efter forbrug for input- og outputtokens.
- Klargjorte (PTU‘er): Alloker gennemløb med forudsigelige omkostninger med månedlige og årlige reservationer til rådighed for at reducere det samlede forbrug.
- Batch API: Sprogmodeller er nu også tilgængelige iBatch API til globale udrulninger og tre områder, der returnerer fuldførelser inden for 24 timer for en rabat på 50 % på globale standardpriser.
- Global udrulning – Global SKU
- Udrulning af datazone – Geografisk baseret (EU eller USA)
- Udrulning lokalt – Lokalt område (op til 27 områder)
Se prismuligheder
Anvend filtre for at tilpasse prismulighederne efter dine behov.
Priserne er kun estimater og er ikke beregnet som faktiske pristilbud. De faktiske priser kan variere afhængigt af den type aftale, der er indgået med Microsoft, købsdatoen og valutakursen. Priserne beregnes ud fra den amerikanske dollar og konverteres ved hjælp af London børsens slutkurs, der registreres i løbet af de to hverdage før den sidste hverdag i den forrige måned. Hvis de to hverdage før månedens slutning falder på en banklukkedag på større markeder, angives kursen umiddelbart dagen før de to hverdage. Denne kurs gælder for alle transaktioner i løbet af den kommende måned. Log på Azure-prisberegneren for at se priser baseret på dit aktuelle program/tilbud med Microsoft. Kontakt en Azure-salgsspecialist for at få flere oplysninger om priser eller for at anmode om et pristilbud. Se ofte stillede spørgsmål om Azure-priser.
Amerikanske myndigheder kan købe Azure Government-tjenester hos en licensudbyder uden økonomisk forpligtelse eller direkte via et Betalt efter forbrug-onlineabonnement.
Vigtigt – Prisen i R$ er kun vejledende. Det er en international transaktion, og den endelige pris kan ændres, afhængigt af valutakurser og inkludering af IOF-afgifter. Der udstedes ikke en eNF.
Amerikanske myndigheder kan købe Azure Government-tjenester hos en licensudbyder uden økonomisk forpligtelse eller direkte via et Betalt efter forbrug-onlineabonnement.
Vigtigt – Prisen i R$ er kun vejledende. Det er en international transaktion, og den endelige pris kan ændres, afhængigt af valutakurser og inkludering af IOF-afgifter. Der udstedes ikke en eNF.
o3
o3 is a powerful reasoning model from the o-series of reasoning models, pushing the frontier across coding, math, science, and visual perception. It excels in complex queries requiring multi-faceted analysis and performs strongly in visual tasks like analyzing images, charts, and graphics. The model features a 200K token context window and has a knowledge cutoff of June 2024.
Model | Priser (1 mio. tokens) | Priser med Batch API (1 mio. tokens) |
---|---|---|
o3 16-04-2025 |
Input: $- Cachelagret input: $- Output: $- |
I/T |
o4-mini
o4-mini is a compact, efficient, and cost-effective reasoning model from OpenAI's o-series. It excels in math, coding, and visual tasks. The model features a 200K token context window and has a knowledge cutoff of June 2024.
Model | Priser (1 mio. tokens) | Priser med Batch API (1 mio. tokens) |
---|---|---|
o4-mini 16-04-2025 |
Input: $- Cachelagret input: $- Output: $- |
I/T |
GPT-4.1-serien
GPT-4.1 series is a highly advanced general-purpose model with extensive world knowledge and an enhanced ability to understand user intent, making it particularly adept at creative tasks and agentic planning. The series features a 1 million token context window and has a knowledge cutoff of June 2024.
Model | Priser (1 mio. tokens) | Priser med Batch API (1 mio. tokens) |
---|---|---|
GPT-4.1-14-04-2025 |
Input: $- Cachelagret input: $- Output: $- |
I/T |
GPT-4.1-mini-14-04-2025 |
Input: $- Cachelagret input: $- Output: $- |
I/T |
GPT-4.1-nano-14-04-2025 |
Input: $- Cachelagret input: $- Output: $- |
I/T |
GPT-4.5
GPT-4.5-prøveversion er den nyeste generelle model med dyb viden om verden og en bedre forståelse af brugerhensigt, hvilket gør den velegnet til kreative opgaver og agentisk planlægning. Modellen har en 128K kontekst og en oktober 2023-vidensafskæring.
Model | Priser (1 mio. tokens) | Priser med Batch API (1 mio. tokens) |
---|---|---|
GPT-4.5-Preview-2025-02-27 Global |
Input: $- Cachelagret input: $- Output: $- |
I/T |
o1
o1 er den nye serie af ræsonneringsmodel til komplekse opgaver. Modellen har 200.000 kontekster og en skæringsdato for viden fra oktober 2023.
Model | Priser (1 mio. tokens) | Priser med Batch API (1 mio. tokens) |
---|---|---|
o1 17-12-2024 global |
Input: $- Cachelagret input: $- Output: $- |
I/T |
o1 17-12-2024 USA/EU – datazoner |
Input: $- Cachelagret input: $- Output: $- |
I/T |
o1 17-12-2024 område |
Input: $- Cachelagret input: $- Output: $- |
I/T |
o1 prøveversion 12-09-2024 global |
Input: $- Cachelagret input: $- Output: $- |
I/T |
o1 prøveversion 12-09-2024 USA/EU – datazoner |
Input: $- Cachelagret input: $- Output: $- |
I/T |
o1 prøveversion 12-09-2024 område |
Input: $- Cachelagret input: $- Output: $- |
I/T |
Planlæg med prisberegneren
o3 Mini
O3 mini er den opdaterede version af o1-minimodellen. O3-mini er en hurtig, omkostningseffektiv ræsonneringsmodel, der er skræddersyet til brugssager inden for kodning, matematik og videnskab.
O3-minimodellen har nu et udvidet kontekstinputvindue med 200.000 tokens og et maksimalt output på 100.000 tokens, hvilket giver rigeligt med plads til komplekse og detaljerede svar. O1-minimodellen har 128.000 kontekstinput. Både o3- og o1-modellerne har en videnafskæring i oktober 2023.
Model | Priser (1 mio. tokens) | Priser med Batch API (1 mio. tokens) |
---|---|---|
o3 mini 31-01-2025 global |
Input: $- Cachelagret input: $- Output: $- |
Input: $- Output: $- |
o3 mini 31-01-2025 US/EU – datazoner |
Input: $- Cachelagret input: $- Output: $- |
Input: $- Output: $- |
o3 mini 31-01-2025 område |
Input: $- Cachelagret input: $- Output: $- |
I/T |
o1-mini 12-09-2024 global |
Input: $- Cachelagret input: $- Output: $- |
I/T |
o1-mini 12-09-2024 USA/EU – datazoner |
Input: $- Cachelagret input: $- Output: $- |
I/T |
o1-mini 12-09-2024 område |
Input: $- Cachelagret input: $- Output: $- |
I/T |
Planlæg med prisberegneren
Computer-Using Agent (CUA)
CUA (Computer-Using Agent) er en specialiseret AI-model, der gør det muligt for kunstig intelligens at interagere med grafiske brugergrænseflader (GUI'er), navigere i programmer og automatisere opgaver i flere trin – alt sammen via naturlige sproginstruktioner. CUA-modellen kan anvendes som et værktøj i svar-API'en.
Model | Priser |
---|---|
computerbrug-forhåndsvisning – global |
Input: $-/1 mio. tokens Output: $-/1 mio. tokens |
Indbyggede værktøjer
Svar-API'en og Assistent-API'en muliggør en problemfri interaktion med værktøjer som computerbrug, kodefortolker, funktionsopkald og filsøgning, hvilket gør det nemt for udviklere at bygge AI-agenter.
Værktøj | Input |
---|---|
Computerbrug (kun svar-API) |
Input: $-/1 mio. tokens Output: $-/1 mio. tokens |
Kald til filsøgningsværktøj (kun svar-API) | $-/1.000 værktøjskald |
Filsøgning* | $- pr. GB vektorlager pr. dag (1 GB gratis) |
Kodefortolker** | $-/session |
*GB refererer til binære gigabyte, hvor 1 GB er 2^30 byte.
**Hvis din assistent kalder Kodefortolker samtidigt i to forskellige tråde, vil dette oprette to kodefortolkersessioner (2 * $-). Hver session er som standard aktiv i én time, hvilket betyder, at du kun betaler dette gebyr én gang, hvis din bruger bliver ved med at give instruktioner til Kodefortolker i samme tråd i op til en time.
Udledningsomkostningerne (input og output) varierer afhængigt af den GPT-model, der bruges sammen med hver assistent. Hvis din assistent kalder Kodefortolker samtidigt i to forskellige tråde, vil dette oprette to kodefortolkersessioner (2 * $-). Hver session er som standard aktiv i en time, hvilket betyder, at prisen er op til én time med instruktioner til kodefortolkeren i den samme tråd.
API i realtid
GPT-4o-Realtime-Preview er tilgængelig i API'en i realtid og understøtter flersprogede tale-til-tale-funktioner. Den er optimeret til samtaler med lav ventetid i realtid og muliggør naturlige interaktioner med minimal forsinkelse, som er ideelle til chatrobotter og samtalebaseret kunstig intelligens. GPT-4o er den omfattende, mere effektive version, der er udviklet til komplekse opgaver, mens GPT-4o Mini er en mindre og mere prisbillig løsning, der er ideel til enklere programmer, hvor omkostningseffektivitet og hastighed er prioriteter.
Model | Priser (1 mio. tokens) |
---|---|
GPT-4o-Realtime-Preview-2024-12-17-Global |
Tekst Input: $- Cachelagret input: $- Output: $- Lyd Input: $- Cachelagret input: $- Output: $- |
GPT-4o-Realtime-Preview-2024-12-17-USA/EU – datazoner |
Tekst Input: $- Cachelagret input: $- Output: $- Lyd Input: $- Cachelagret input: $- Output: $- |
GPT-4o-Realtime-Preview-2024-12-17-Regional |
Tekst Input: $- Cachelagret input: $- Output: $- Lyd Input: $- Cachelagret input: $- Output: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global |
Tekst Input: $- Cachelagret input: $- Output: $- Lyd Input: $- Cachelagret input: $- Output: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-USA/EU – datazoner |
Tekst Input: $- Cachelagret input: $- Output: $- Lyd Input: $- Cachelagret input: $- Output: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional |
Tekst Input: $- Cachelagret input: $- Output: $- Lyd Input: $- Cachelagret input: $- Output: $- |
GPT-4o-Realtime-Preview-2024-10-01-Global |
Tekst Input: $- Cachelagret input: $- Output: $- Lyd Input: $- Cachelagret input: $- Output: $- |
GPT-4o-Realtime-Preview-2024-10-01-USA/EU – datazoner |
Tekst Input: $- Cachelagret input: $- Output: $- Lyd Input: $- Cachelagret input: $- Output: $- |
GPT-4o-Realtime-Preview-2024-10-01-Regional |
Tekst Input: $- Cachelagret input: $- Output: $- Lyd Input: $- Cachelagret input: $- Output: $- |
Chatfuldførelses-API
GPT 4o-Audio-Preview-modellen, der optræder i chatfuldførelses-API'en, behandler og genererer lydindhold. Den understøtter avancerede funktioner som talegenkendelse og lydsyntese, der er ideelle til asynkrone taleinteraktioner og synspunktsanalyse. GPT-4o er den omfattende, mere effektive version, der er udviklet til komplekse opgaver, mens GPT-4o Mini er en mindre og mere prisbillig løsning, der er ideel til enklere programmer, hvor omkostningseffektivitet og hastighed er prioriteter.
Model | Priser (1 mio. tokens) |
---|---|
GPT-4o-Audio-Preview-2024-12-17-Global |
Tekst Input: $- Output: $- Lyd Input: $- Output: $- |
GPT-4o-Audio-Preview-2024-12-17-USA/EU – datazoner |
Tekst Input: $- Output: $- Lyd Input: $- Output: $- |
GPT-4o-Audio-Preview-2024-12-17-Regional |
Tekst Input: $- Output: $- Lyd Input: $- Output: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Global |
Tekst Input: $- Output: $- Lyd Input: $- Output: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-USA/EU – datazoner |
Tekst Input: $- Output: $- Lyd Input: $- Output: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional |
Tekst Input: $- Output: $- Lyd Input: $- Output: $- |
GPT-4o
GPT-4o er den mest avancerede multimodale model, der er hurtigere og billigere end GPT-4 Turbo med stærkere synsfunktioner. Modellen har en 128K kontekst og en oktober 2023-vidensafskæring.
Model | Priser (1 mio. tokens) | Priser med Batch API (1 mio. tokens) |
---|---|---|
GPT-4o-2024-1120 global |
Input: $- Cachelagret input: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-1120 US/EU – datazoner |
Input: $- Cachelagret input: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-1120 område |
Input: $- Cachelagret input: $- Output: $- |
I/T |
GPT-4o-2024-08-06 Global |
Input: $- Cachelagret input: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-08-06 US/EU – datazoner |
Input: $- Cachelagret input: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-08-06 område |
Input: $- Cachelagret input: $- Output: $- |
I/T |
GPT-4o-2024-0513 global |
Input: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-0513 US/EU – datazoner |
Input: $- Output: $- |
I/T |
GPT-4o-2024-0513 område |
Input: $- Output: $- |
I/T |
Planlæg med prisberegneren
GPT-4o mini
GPT-4o mini er den mest omkostningseffektive lille model og har visionsfunktioner. Modellen har en 128K kontekst og en oktober 2023-vidensafskæring.
Model | Priser (1 mio. tokens) | Priser med Batch API (1 mio. tokens) |
---|---|---|
GPT-4o-mini-0718 Global |
Input: $- Cachelagret input: $- Output: $- |
Input: $- Output: $- |
GPT-4o-mini-0718 USA/EU – datazoner |
Input: $- Cachelagret input: $- Output: $- |
Input: $- Output: $- |
GPT-4o-mini-0718 Regional |
Input: $- Cachelagret input: $- Output: $- |
I/T |
Planlæg med prisberegneren
Klargjort
Du kan allokere og administrere gennemløb for udrulninger, så du sikrer forudsigelig ydeevne og stabil kapacitet. Du opkræves en timepris pr. model uanset forbrug, men du kan også sikre yderligere besparelser via månedlige og årlige reservationer. Se, hvordan du overfører dine regionale udrulninger og klargjorte reservationer til globale zoner og datazoner på denne Learn-side.
Model | Min. PTU'er | Priser på PTU pr. time | Priser på månedlig PTU-reservation | Priser for årlig PTU-reservation |
---|---|---|---|---|
GPT-4o Global | 15 | $- | $- | $- |
GPT-4o datazoner i USA/EU | 15 | $- | $- | $- |
GPT-4o regional | 50 | $- | $- | $- |
Finjusteret GPT-4o-område | 50 | $- | $- | $- |
GPT-4o Mini Global | 15 | $- | $- | $- |
GPT-4o Mini-datazoner i USA/EU | 15 | $- | $- | $- |
GPT-4o Mini område | 25 | $- | $- | $- |
Finjusteret GPT-4o-Mini-område | 25 | $- | $- | $- |
Planlæg med prisberegneren
Basismodeller
Modeller | Forbrug pr. 1.000 tokens |
---|---|
Babbage-002 | $- |
Davinci-002 | $- |
Modeller til finjustering
Model | Priser | |
---|---|---|
GPT-4.1 | Regionalt |
Input: $-/1 mio. tokens Cachelagret input: $-/1 mio. tokens Output: $-/1 mio. tokens Undervisning: $-/1 mio. tokens Hosting: $-/time |
Global |
Input: $-/1 mio. tokens Cachelagret input: $-/1 mio. tokens Output: $-/1 mio. tokens Undervisning: $-/1 mio. tokens Hosting: $-/time |
|
GPT-4.1-mini | Regionalt |
Input: $-/1 mio. tokens Cachelagret input: $-/1 mio. tokens Output: $-/1 mio. tokens Undervisning: $-/1 mio. tokens Hosting: $-/time |
Global |
Input: $-/1 mio. tokens Cachelagret input: $-/1 mio. tokens Output: $-/1 mio. tokens Undervisning: $-/1 mio. tokens Hosting: $-/time |
|
GPT-4o-2024-08-06 | Regionalt |
Input: $-/1 mio. tokens Cachelagret input: $-/1 mio. tokens Output: $-/1 mio. tokens Undervisning: $-/1 mio. tokens Hosting: $-/time |
Global |
Input: $-/1 mio. tokens Cachelagret input: $-/1 mio. tokens Output: $-/1 mio. tokens Undervisning: brug område Hosting: $-/time |
|
GPT-4o-mini | Regionalt |
Input: $-/1 mio. tokens Cachelagret input: $-/1 mio. tokens Output: $-/1 mio. tokens Undervisning: $-/1 mio. tokens Hosting: $-/time |
Global |
Input: $-/1 mio. tokens Cachelagret input: $-/1 mio. tokens Output: $-/1 mio. tokens Undervisning: brug område Hosting: $-/time |
|
GPT-3.5-Turbo (16K) | Regionalt |
Input: $-/1 mio. tokens Output: $-/1 mio. tokens Undervisning: $-/1 mio. tokens Hosting: $-/time |
GPT-3.5-Turbo (4K) | Regionalt |
Input: $-/1 mio. tokens Output: $-/1 mio. tokens Undervisning: $-/1 mio. tokens Hosting: $-/time |
Billedmodeller
Modeller | Kvalitet | Opløsning | Pris (pr. 100 billeder) |
---|---|---|---|
Dall-E-3 | Standard | 1024 * 1024 | $- |
Standard | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-3 | HD | 1024 * 1024 | $- |
HD | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-2 | Standard | 1024 * 1024 | $- |
Integrering af modeller
Modeller | Pr. 1.000 tokens |
---|---|
Ada | $- |
tekstintegrering-3-stor | $- |
tekstintegrering-3-lille | $- |
Talemodeller
Modeller | Pris |
---|---|
Hviske | $- pr. time |
TTS (Tekst-til-tale) | $-/1 mio. tegn |
TTS HD | $-/1 mio. tegn |
Ældre sprogmodeller
Modeller | Kontekst | Input (pr. 1 mio. tokens) | Output (pr. 1 mio. tokens) |
---|---|---|---|
GPT-3.5-Turbo-0301 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 16K | $- | $- |
GPT-3.5-Turbo-1106 | 16K | $- | $- |
GPT-3.5-Turbo-0125 | 16K | $- | $- |
GPT-3.5-Turbo-Instruct | 4K | $- | $- |
GPT-4-Turbo | 128K | $- | $- |
GPT-4-Turbo-Vision | 128K | $- | $- |
GPT-4 | 8K | $- | $- |
GPT-4 | 32K | $- | $- |
Azure-priser og købsmuligheder

Få direkte kontakt til os
Få en gennemgang af Azure-prisfastsættelse. Få en forståelse af prisfastsættelsen på din skyløsning, få mere at vide om omkostningsoptimering, og anmod om et tilpasset tilbud.
Tal med en sælgerSe flere måder at købe på
Køb Azure-tjenester via Azure-webstedet, en Microsoft-repræsentant eller en Azure-partner.
Se nærmere på dine mulighederFlere ressourcer
Azure OpenAI Service
Få mere at vide om funktioner og egenskaber i forbindelse med Azure OpenAI Service.
Prisberegner
Anslå dine forventede månedlige omkostninger ved hjælp af en hvilken som helst kombination af Azure-produkter.
SLA
Gennemse serviceniveauaftalen for Azure OpenAI Service.
Dokumentation
Se tekniske vejledninger, videoer og andet Azure OpenAI Service-materiale.
Ofte stillede spørgsmål
-
Azure OpenAI-tjenesten tilbyder priser, der er baseret på både betal efter forbrug og klargjorte enheder for gennemløb (PTU'er). Betalt efter forbrug giver dig mulighed for at betale for de ressourcer, du bruger, hvilket gør det fleksibelt for variable arbejdsbelastninger. PTU'er tilbyder en forudsigelig prismodel, hvor du reserverer og udruller en bestemt mængde modelbehandlingskapacitet. Denne model er ideel til arbejdsbelastninger med konsekvente eller forudsigelige brugsmønstre, der giver stabilitets- og omkostningsstyring.
-
Hvis du vil vide mere om PTU‘er og priser på Azure OpenAI, kan du læse PTU-dokumentation eller kontakte vores salgsspecialist.
Tal med en sælger, og få en gennemgang af Azure-priserne. Få en forståelse af prisen på din cloudløsning.
Få gratis cloudtjenester og en kredit på $200, så du kan udforske Azure i 30 dage.