Gå til hovedindholdet
Azure

Priser for Azure OpenAI Service

Oversigt over prisfastsættelse for Azure OpenAI-tjenesten

Azure OpenAI Service leverer virksomhedsklar generativ AI med effektive modeller fra OpenAI, så organisationer kan være innovative med tekst-, lyd- og synsfunktioner. Ud over de avancerede modeller vælger virksomheder Azure OpenAI Service til indbygget beskyttelse af personlige oplysninger, regional/områdemæssig/global fleksibilitet og problemfri integration i Azure-økosystemet, herunder Fabric, Cosmos DB og Azure AI Search. Virksomheder i alle størrelser kan trygt skalere løsninger drevet af kunstig intelligens for at forbedre kundeoplevelsen, automatisere arbejdsprocesser og låse op for kreativt potentiale, hvilket skaber målbar effekt og konkurrencemæssig differentiering.

For at hjælpe kunderne på rejsen tilbyder vi pris- og omkostningsstyringsløsninger, der opfylder dine behov. herunder:
  • Standard (On-Demand): Betalt efter forbrug for input- og outputtokens.
  • Klargjorte (PTU‘er): Alloker gennemløb med forudsigelige omkostninger med månedlige og årlige reservationer til rådighed for at reducere det samlede forbrug.
  • Batch API: Sprogmodeller er nu også tilgængelige iBatch API til globale udrulninger og tre områder, der returnerer fuldførelser inden for 24 timer for en rabat på 50 % på globale standardpriser.
Du kan vælge mellem følgende udrulningstyper for standard og klargjort, som giver større fleksibilitet og kontrol over priser og ydeevne. Denne fleksibilitet hjælper, når der er stadig mere restriktive grænser for databehandling og behov for øget dataoverførselshastighed og lavere pris.
  • Global udrulning – Global SKU
  • Udrulning af datazone – Geografisk baseret (EU eller USA)
  • Udrulning lokalt – Lokalt område (op til 27 områder)

Se prismuligheder

Anvend filtre for at tilpasse prismulighederne efter dine behov.

Priserne er kun estimater og er ikke beregnet som faktiske pristilbud. De faktiske priser kan variere afhængigt af den type aftale, der er indgået med Microsoft, købsdatoen og valutakursen. Priserne beregnes ud fra den amerikanske dollar og konverteres ved hjælp af London børsens slutkurs, der registreres i løbet af de to hverdage før den sidste hverdag i den forrige måned. Hvis de to hverdage før månedens slutning falder på en banklukkedag på større markeder, angives kursen umiddelbart dagen før de to hverdage. Denne kurs gælder for alle transaktioner i løbet af den kommende måned. Log på Azure-prisberegneren for at se priser baseret på dit aktuelle program/tilbud med Microsoft. Kontakt en Azure-salgsspecialist for at få flere oplysninger om priser eller for at anmode om et pristilbud. Se ofte stillede spørgsmål om Azure-priser.

o3

o3 is a powerful reasoning model from the o-series of reasoning models, pushing the frontier across coding, math, science, and visual perception. It excels in complex queries requiring multi-faceted analysis and performs strongly in visual tasks like analyzing images, charts, and graphics. The model features a 200K token context window and has a knowledge cutoff of June 2024.

Model Priser (1 mio. tokens) Priser med Batch API (1 mio. tokens)
o3 16-04-2025 Input: $-
Cachelagret input: $-
Output: $-
I/T

o4-mini

o4-mini is a compact, efficient, and cost-effective reasoning model from OpenAI's o-series. It excels in math, coding, and visual tasks. The model features a 200K token context window and has a knowledge cutoff of June 2024.

Model Priser (1 mio. tokens) Priser med Batch API (1 mio. tokens)
o4-mini 16-04-2025 Input: $-
Cachelagret input: $-
Output: $-
I/T

GPT-4.1-serien

GPT-4.1 series is a highly advanced general-purpose model with extensive world knowledge and an enhanced ability to understand user intent, making it particularly adept at creative tasks and agentic planning. The series features a 1 million token context window and has a knowledge cutoff of June 2024.

Model Priser (1 mio. tokens) Priser med Batch API (1 mio. tokens)
GPT-4.1-14-04-2025 Input: $-
Cachelagret input: $-
Output: $-
I/T
GPT-4.1-mini-14-04-2025 Input: $-
Cachelagret input: $-
Output: $-
I/T
GPT-4.1-nano-14-04-2025 Input: $-
Cachelagret input: $-
Output: $-
I/T

GPT-4.5

GPT-4.5-prøveversion er den nyeste generelle model med dyb viden om verden og en bedre forståelse af brugerhensigt, hvilket gør den velegnet til kreative opgaver og agentisk planlægning. Modellen har en 128K kontekst og en oktober 2023-vidensafskæring.

Model Priser (1 mio. tokens) Priser med Batch API (1 mio. tokens)
GPT-4.5-Preview-2025-02-27 Global Input: $-
Cachelagret input: $-
Output: $-
I/T

o1

o1 er den nye serie af ræsonneringsmodel til komplekse opgaver. Modellen har 200.000 kontekster og en skæringsdato for viden fra oktober 2023.

Model Priser (1 mio. tokens) Priser med Batch API (1 mio. tokens)
o1 17-12-2024 global Input: $-
Cachelagret input: $-
Output: $-
I/T
o1 17-12-2024 USA/EU – datazoner Input: $-
Cachelagret input: $-
Output: $-
I/T
o1 17-12-2024 område Input: $-
Cachelagret input: $-
Output: $-
I/T
o1 prøveversion 12-09-2024 global Input: $-
Cachelagret input: $-
Output: $-
I/T
o1 prøveversion 12-09-2024 USA/EU – datazoner Input: $-
Cachelagret input: $-
Output: $-
I/T
o1 prøveversion 12-09-2024 område Input: $-
Cachelagret input: $-
Output: $-
I/T

Planlæg med prisberegneren

o3 Mini

O3 mini er den opdaterede version af o1-minimodellen. O3-mini er en hurtig, omkostningseffektiv ræsonneringsmodel, der er skræddersyet til brugssager inden for kodning, matematik og videnskab.

O3-minimodellen har nu et udvidet kontekstinputvindue med 200.000 tokens og et maksimalt output på 100.000 tokens, hvilket giver rigeligt med plads til komplekse og detaljerede svar. O1-minimodellen har 128.000 kontekstinput. Både o3- og o1-modellerne har en videnafskæring i oktober 2023.

Model Priser (1 mio. tokens) Priser med Batch API (1 mio. tokens)
o3 mini 31-01-2025 global Input: $-
Cachelagret input: $-
Output: $-
Input: $-
Output: $-
o3 mini 31-01-2025 US/EU – datazoner Input: $-
Cachelagret input: $-
Output: $-
Input: $-
Output: $-
o3 mini 31-01-2025 område Input: $-
Cachelagret input: $-
Output: $-
I/T
o1-mini 12-09-2024 global Input: $-
Cachelagret input: $-
Output: $-
I/T
o1-mini 12-09-2024 USA/EU – datazoner Input: $-
Cachelagret input: $-
Output: $-
I/T
o1-mini 12-09-2024 område Input: $-
Cachelagret input: $-
Output: $-
I/T

Planlæg med prisberegneren

Computer-Using Agent (CUA)

CUA (Computer-Using Agent) er en specialiseret AI-model, der gør det muligt for kunstig intelligens at interagere med grafiske brugergrænseflader (GUI'er), navigere i programmer og automatisere opgaver i flere trin – alt sammen via naturlige sproginstruktioner. CUA-modellen kan anvendes som et værktøj i svar-API'en.

Model Priser
computerbrug-forhåndsvisning – global Input: $-/1 mio. tokens
Output: $-/1 mio. tokens

Indbyggede værktøjer

Svar-API'en og Assistent-API'en muliggør en problemfri interaktion med værktøjer som computerbrug, kodefortolker, funktionsopkald og filsøgning, hvilket gør det nemt for udviklere at bygge AI-agenter.

Værktøj Input
Computerbrug (kun svar-API) Input: $-/1 mio. tokens
Output: $-/1 mio. tokens
Kald til filsøgningsværktøj (kun svar-API) $-/1.000 værktøjskald
Filsøgning* $- pr. GB vektorlager pr. dag (1 GB gratis)
Kodefortolker** $-/session

*GB refererer til binære gigabyte, hvor 1 GB er 2^30 byte.

**Hvis din assistent kalder Kodefortolker samtidigt i to forskellige tråde, vil dette oprette to kodefortolkersessioner (2 * $-). Hver session er som standard aktiv i én time, hvilket betyder, at du kun betaler dette gebyr én gang, hvis din bruger bliver ved med at give instruktioner til Kodefortolker i samme tråd i op til en time.

Udledningsomkostningerne (input og output) varierer afhængigt af den GPT-model, der bruges sammen med hver assistent. Hvis din assistent kalder Kodefortolker samtidigt i to forskellige tråde, vil dette oprette to kodefortolkersessioner (2 * $-). Hver session er som standard aktiv i en time, hvilket betyder, at prisen er op til én time med instruktioner til kodefortolkeren i den samme tråd.

API i realtid

GPT-4o-Realtime-Preview er tilgængelig i API'en i realtid og understøtter flersprogede tale-til-tale-funktioner. Den er optimeret til samtaler med lav ventetid i realtid og muliggør naturlige interaktioner med minimal forsinkelse, som er ideelle til chatrobotter og samtalebaseret kunstig intelligens. GPT-4o er den omfattende, mere effektive version, der er udviklet til komplekse opgaver, mens GPT-4o Mini er en mindre og mere prisbillig løsning, der er ideel til enklere programmer, hvor omkostningseffektivitet og hastighed er prioriteter.

Model Priser (1 mio. tokens)
GPT-4o-Realtime-Preview-2024-12-17-Global Tekst
Input: $-
Cachelagret input: $-
Output: $-

Lyd
Input: $-
Cachelagret input: $-
Output: $-
GPT-4o-Realtime-Preview-2024-12-17-USA/EU – datazoner Tekst
Input: $-
Cachelagret input: $-
Output: $-

Lyd
Input: $-
Cachelagret input: $-
Output: $-
GPT-4o-Realtime-Preview-2024-12-17-Regional Tekst
Input: $-
Cachelagret input: $-
Output: $-

Lyd
Input: $-
Cachelagret input: $-
Output: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global Tekst
Input: $-
Cachelagret input: $-
Output: $-

Lyd
Input: $-
Cachelagret input: $-
Output: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-USA/EU – datazoner Tekst
Input: $-
Cachelagret input: $-
Output: $-

Lyd
Input: $-
Cachelagret input: $-
Output: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional Tekst
Input: $-
Cachelagret input: $-
Output: $-

Lyd
Input: $-
Cachelagret input: $-
Output: $-
GPT-4o-Realtime-Preview-2024-10-01-Global Tekst
Input: $-
Cachelagret input: $-
Output: $-

Lyd
Input: $-
Cachelagret input: $-
Output: $-
GPT-4o-Realtime-Preview-2024-10-01-USA/EU – datazoner Tekst
Input: $-
Cachelagret input: $-
Output: $-

Lyd
Input: $-
Cachelagret input: $-
Output: $-
GPT-4o-Realtime-Preview-2024-10-01-Regional Tekst
Input: $-
Cachelagret input: $-
Output: $-

Lyd
Input: $-
Cachelagret input: $-
Output: $-

Chatfuldførelses-API

GPT 4o-Audio-Preview-modellen, der optræder i chatfuldførelses-API'en, behandler og genererer lydindhold. Den understøtter avancerede funktioner som talegenkendelse og lydsyntese, der er ideelle til asynkrone taleinteraktioner og synspunktsanalyse. GPT-4o er den omfattende, mere effektive version, der er udviklet til komplekse opgaver, mens GPT-4o Mini er en mindre og mere prisbillig løsning, der er ideel til enklere programmer, hvor omkostningseffektivitet og hastighed er prioriteter.

Model Priser (1 mio. tokens)
GPT-4o-Audio-Preview-2024-12-17-Global Tekst
Input: $-
Output: $-

Lyd
Input: $-
Output: $-
GPT-4o-Audio-Preview-2024-12-17-USA/EU – datazoner Tekst
Input: $-
Output: $-

Lyd
Input: $-
Output: $-
GPT-4o-Audio-Preview-2024-12-17-Regional Tekst
Input: $-
Output: $-

Lyd
Input: $-
Output: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Global Tekst
Input: $-
Output: $-

Lyd
Input: $-
Output: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-USA/EU – datazoner Tekst
Input: $-
Output: $-

Lyd
Input: $-
Output: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional Tekst
Input: $-
Output: $-

Lyd
Input: $-
Output: $-

GPT-4o

GPT-4o er den mest avancerede multimodale model, der er hurtigere og billigere end GPT-4 Turbo med stærkere synsfunktioner. Modellen har en 128K kontekst og en oktober 2023-vidensafskæring.

Model Priser (1 mio. tokens) Priser med Batch API (1 mio. tokens)
GPT-4o-2024-1120 global Input: $-
Cachelagret input: $-
Output: $-
Input: $-
Output: $-
GPT-4o-2024-1120 US/EU – datazoner Input: $-
Cachelagret input: $-
Output: $-
Input: $-
Output: $-
GPT-4o-2024-1120 område Input: $-
Cachelagret input: $-
Output: $-
I/T
GPT-4o-2024-08-06 Global Input: $-
Cachelagret input: $-
Output: $-
Input: $-
Output: $-
GPT-4o-2024-08-06 US/EU – datazoner Input: $-
Cachelagret input: $-
Output: $-
Input: $-
Output: $-
GPT-4o-2024-08-06 område Input: $-
Cachelagret input: $-
Output: $-
I/T
GPT-4o-2024-0513 global Input: $-
Output: $-
Input: $-
Output: $-
GPT-4o-2024-0513 US/EU – datazoner Input: $-
Output: $-
I/T
GPT-4o-2024-0513 område Input: $-
Output: $-
I/T

Planlæg med prisberegneren

GPT-4o mini

GPT-4o mini er den mest omkostningseffektive lille model og har visionsfunktioner. Modellen har en 128K kontekst og en oktober 2023-vidensafskæring.

Model Priser (1 mio. tokens) Priser med Batch API (1 mio. tokens)
GPT-4o-mini-0718 Global Input: $-
Cachelagret input: $-
Output: $-
Input: $-
Output: $-
GPT-4o-mini-0718 USA/EU – datazoner Input: $-
Cachelagret input: $-
Output: $-
Input: $-
Output: $-
GPT-4o-mini-0718 Regional Input: $-
Cachelagret input: $-
Output: $-
I/T

Planlæg med prisberegneren

Klargjort

Du kan allokere og administrere gennemløb for udrulninger, så du sikrer forudsigelig ydeevne og stabil kapacitet. Du opkræves en timepris pr. model uanset forbrug, men du kan også sikre yderligere besparelser via månedlige og årlige reservationer. Se, hvordan du overfører dine regionale udrulninger og klargjorte reservationer til globale zoner og datazoner på denne Learn-side.

Model Min. PTU'er Priser på PTU pr. time Priser på månedlig PTU-reservation Priser for årlig PTU-reservation
GPT-4o Global 15 $- $- $-
GPT-4o datazoner i USA/EU 15 $- $- $-
GPT-4o regional 50 $- $- $-
Finjusteret GPT-4o-område 50 $- $- $-
GPT-4o Mini Global 15 $- $- $-
GPT-4o Mini-datazoner i USA/EU 15 $- $- $-
GPT-4o Mini område 25 $- $- $-
Finjusteret GPT-4o-Mini-område 25 $- $- $-

Planlæg med prisberegneren

Basismodeller

Modeller Forbrug pr. 1.000 tokens
Babbage-002 $-
Davinci-002 $-

Modeller til finjustering

Model Priser
GPT-4.1 Regionalt Input: $-/1 mio. tokens
Cachelagret input: $-/1 mio. tokens
Output: $-/1 mio. tokens
Undervisning: $-/1 mio. tokens
Hosting: $-/time
Global Input: $-/1 mio. tokens
Cachelagret input: $-/1 mio. tokens
Output: $-/1 mio. tokens
Undervisning: $-/1 mio. tokens
Hosting: $-/time
GPT-4.1-mini Regionalt Input: $-/1 mio. tokens
Cachelagret input: $-/1 mio. tokens
Output: $-/1 mio. tokens
Undervisning: $-/1 mio. tokens
Hosting: $-/time
Global Input: $-/1 mio. tokens
Cachelagret input: $-/1 mio. tokens
Output: $-/1 mio. tokens
Undervisning: $-/1 mio. tokens
Hosting: $-/time
GPT-4o-2024-08-06 Regionalt Input: $-/1 mio. tokens
Cachelagret input: $-/1 mio. tokens
Output: $-/1 mio. tokens
Undervisning: $-/1 mio. tokens
Hosting: $-/time
Global Input: $-/1 mio. tokens
Cachelagret input: $-/1 mio. tokens
Output: $-/1 mio. tokens
Undervisning: brug område
Hosting: $-/time
GPT-4o-mini Regionalt Input: $-/1 mio. tokens
Cachelagret input: $-/1 mio. tokens
Output: $-/1 mio. tokens
Undervisning: $-/1 mio. tokens
Hosting: $-/time
Global Input: $-/1 mio. tokens
Cachelagret input: $-/1 mio. tokens
Output: $-/1 mio. tokens
Undervisning: brug område
Hosting: $-/time
GPT-3.5-Turbo (16K) Regionalt Input: $-/1 mio. tokens
Output: $-/1 mio. tokens
Undervisning: $-/1 mio. tokens
Hosting: $-/time
GPT-3.5-Turbo (4K) Regionalt Input: $-/1 mio. tokens
Output: $-/1 mio. tokens
Undervisning: $-/1 mio. tokens
Hosting: $-/time

Billedmodeller

Modeller Kvalitet Opløsning Pris (pr. 100 billeder)
Dall-E-3 Standard 1024 * 1024 $-
Standard 1024 * 1792,
1792 * 1024
$-
Dall-E-3 HD 1024 * 1024 $-
HD 1024 * 1792,
1792 * 1024
$-
Dall-E-2 Standard 1024 * 1024 $-

Integrering af modeller

Modeller Pr. 1.000 tokens
Ada $-
tekstintegrering-3-stor $-
tekstintegrering-3-lille $-

Talemodeller

Modeller Pris
Hviske $- pr. time
TTS (Tekst-til-tale) $-/1 mio. tegn
TTS HD $-/1 mio. tegn

Ældre sprogmodeller

Modeller Kontekst Input (pr. 1 mio. tokens) Output (pr. 1 mio. tokens)
GPT-3.5-Turbo-0301 4K $- $-
GPT-3.5-Turbo-0613 4K $- $-
GPT-3.5-Turbo-0613 16K $- $-
GPT-3.5-Turbo-1106 16K $- $-
GPT-3.5-Turbo-0125 16K $- $-
GPT-3.5-Turbo-Instruct 4K $- $-
GPT-4-Turbo 128K $- $-
GPT-4-Turbo-Vision 128K $- $-
GPT-4 8K $- $-
GPT-4 32K $- $-

Azure-priser og købsmuligheder

Få direkte kontakt til os

Få en gennemgang af Azure-prisfastsættelse. Få en forståelse af prisfastsættelsen på din skyløsning, få mere at vide om omkostningsoptimering, og anmod om et tilpasset tilbud.

Tal med en sælger

Se flere måder at købe på

Køb Azure-tjenester via Azure-webstedet, en Microsoft-repræsentant eller en Azure-partner.

Se nærmere på dine muligheder

Flere ressourcer

Azure OpenAI Service

Få mere at vide om funktioner og egenskaber i forbindelse med Azure OpenAI Service.

Prisberegner

Anslå dine forventede månedlige omkostninger ved hjælp af en hvilken som helst kombination af Azure-produkter.

SLA

Gennemse serviceniveauaftalen for Azure OpenAI Service.

Dokumentation

Se tekniske vejledninger, videoer og andet Azure OpenAI Service-materiale.

  • Azure OpenAI-tjenesten tilbyder priser, der er baseret på både betal efter forbrug og klargjorte enheder for gennemløb (PTU'er). Betalt efter forbrug giver dig mulighed for at betale for de ressourcer, du bruger, hvilket gør det fleksibelt for variable arbejdsbelastninger. PTU'er tilbyder en forudsigelig prismodel, hvor du reserverer og udruller en bestemt mængde modelbehandlingskapacitet. Denne model er ideel til arbejdsbelastninger med konsekvente eller forudsigelige brugsmønstre, der giver stabilitets- og omkostningsstyring.
  • Hvis du vil vide mere om PTU‘er og priser på Azure OpenAI, kan du læse PTU-dokumentation eller kontakte vores salgsspecialist.

Tal med en sælger, og få en gennemgang af Azure-priserne. Få en forståelse af prisen på din cloudløsning.

Få gratis cloudtjenester og en kredit på $200, så du kan udforske Azure i 30 dage.

Tilføjet for at beregne. Tryk på 'v' for at få vist på beregner
Kan vi hjælpe dig?