Gå til hovedinnhold
Azure

Priser på Azure OpenAI Service

Prisoversikt for Azure OpenAI Service

Azure OpenAI Service leverer organisasjonsklar generativ KI med kraftige modeller fra OpenAI, slik at organisasjoner kan hjelpe deg med tekst-, lyd- og synsfunksjoner. I tillegg til de nyeste modellene velger firmaer Azure OpenAI Service for innebygd datapersonvern, regional/område/global fleksibilitet og sømløs integrasjon i Azure-økosystemet, inkludert Fabric, Cosmos DB og Azure AI Search. Selskaper av alle størrelser kan trygt skalere KI-løsninger for å forbedre kundeopplevelsen, automatisere arbeidsflyter og låse opp kreativt potensial, noe som gir målbar innvirkning og konkurransemessig differensiering.

For å hjelpe kunder på reisen tilbyr vi løsninger for priser og kostnadsadministrasjon for å dekke behovene dine, inkludert:
  • Standard (ved behov): Forbruksbetaling for input- og output-tokener.
  • Klargjort (PTU-er): Tildel gjennomstrømming med forutsigbare kostnader, med månedlige og årlige reservasjoner tilgjengelig for å redusere det totale forbruket.
  • Bunke-API: Språkmodeller er nå også tilgjengelige i den bunke-API-en for globale utrullinger og tre områder. Den returnerer fullføringer innen 24 timer for en rabatt på 50 % på globale standardpriser.
Du kan velge blant følgende utrullingstyper for Standard og Provisioned, som gir større fleksibilitet og kontroll over priser og ytelse. Denne fleksibiliteten hjelper når det blir stadig mer restriktive databehandlingsgrenser og behov for økt gjennomstrømming og lavere pris.
  • Global distribusjon – global SKU
  • Datasonedistribusjon – geografisk basert (EU eller USA)
  • Regional distribusjon – lokalt område (opptil 27 områder)

Se nærmere på prisalternativene

Legg til filtre for å tilpasse prisalternativene til dine behov.

Prisene er bare estimater, og er ikke ment som faktiske pristilbud. De faktiske prisene kan variere avhengig av avtaletypen, som er angitt med Microsoft, kjøpsdatoen og valutakursen. Prisene beregnes basert på amerikanske dollar, og konverteres ved hjelp av London-spotkurser registrert to virkedager før den siste virkedagen i utgangen av forrige måned. Hvis de to virkedagene før slutten av måneden faller på en helligdag i de største markedene, er prissettingsdagen vanligvis dagen umiddelbart før de to virkedagene. Denne satsen gjelder for alle transaksjoner i løpet av den kommende måneden. Logg på priskalkulatoren for Azure for å se priser basert på gjeldende program/tilbud med Microsoft. Kontakt en Azure-salgsspesialist for mer informasjon om priser, eller for å be om et pristilbud. Se vanlige spørsmål om Azure-priser.

o3

o3 is a powerful reasoning model from the o-series of reasoning models, pushing the frontier across coding, math, science, and visual perception. It excels in complex queries requiring multi-faceted analysis and performs strongly in visual tasks like analyzing images, charts, and graphics. The model features a 200K token context window and has a knowledge cutoff of June 2024.

Modell Priser (1 million tokener) Priser med satsvis API (1 million tokener)
o3 2025-04-16 Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
N/A

o4-mini

o4-mini is a compact, efficient, and cost-effective reasoning model from OpenAI's o-series. It excels in math, coding, and visual tasks. The model features a 200K token context window and has a knowledge cutoff of June 2024.

Modell Priser (1 million tokener) Priser med satsvis API (1 million tokener)
o4-mini 2025-04-16 Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
N/A

GPT-4.1-serien

GPT-4.1 series is a highly advanced general-purpose model with extensive world knowledge and an enhanced ability to understand user intent, making it particularly adept at creative tasks and agentic planning. The series features a 1 million token context window and has a knowledge cutoff of June 2024.

Modell Priser (1 million tokener) Priser med satsvis API (1 million tokener)
GPT-4.1-2025-04-14 Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
N/A
GPT-4.1-mini-2025-04-14 Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
N/A
GPT-4.1-nano-2025-04-14 Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
N/A

GPT-4.5

Forhåndsversjon av GPT-4.5 er den nyeste modellen for generell bruk med dyp verdenskunnskap og bedre forståelse av brukerhensikt som gjør den god på kreative oppgaver og agentisk planlegging. Modellen har 128K kontekst og en grense for kunnskap oktober 2023.

Modell Priser (1 million tokener) Priser med satsvis API (1 million tokener)
GPT-4.5-Preview-2025-02-27 Global Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
N/A

o1

o1 er den nye begrunnelsesmodellserien for komplekse oppgaver. Modellen har 200K kontekst og en grense for kunnskap fra oktober 2023.

Modell Priser (1 million tokener) Priser med satsvis API (1 million tokener)
o1 2024-12-17 Global Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
N/A
o1 2024-12-17 US/EU – Data Zones Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
N/A
o1 2024-12-17 Regional Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
N/A
o1 preview 2024-09-12 Global Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
N/A
o1 preview 2024-09-12 US/EU – Data Zones Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
N/A
o1 preview 2024-09-12 Regional Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
N/A

Planlegg med priskalkulatoren

o3 Mini

o3 mini er den oppdaterte versjonen av o1 mini-modellen. o3-mini er en raskt og kostnadseffektiv resonneringsmodell som er skreddersydd for koding, matematikk og vitenskap.

o3-mini-modellen har nå et utvidet kontekstinndatavindu på 200 000 tokener, og et maksimumsresultat på 100 000 tokener, som gir rikelig med plass til komplekse og detaljerte svar. o1 mini-modellen har 128 000 kontekstinndata. Både o3- og o1-modellene har en kunnskapsavskjæring i oktober 2023.

Modell Priser (1 million tokener) Priser med satsvis API (1 million tokener)
o3 mini 2025-01-31 Global Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
Inndata: $-
Utdata: $-
o3 mini 2025-01-31-US/EU – Data Zones Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
Inndata: $-
Utdata: $-
o3 mini 2025-01-31 Regional Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
N/A
o1-mini 2024-09-12 Global Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
N/A
o1-mini 2024-09-12 US/EU – Data Zones Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
N/A
o1-mini 2024-09-12 Regional Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
N/A

Planlegg med priskalkulatoren

Computer-Using Agent (CUA)

Computer-Using Agent (CUA) er en spesialisert AI-modell som gjør det mulig for kunstig intelligens å samhandle med grafiske brukergrensesnitt (GUIer), navigere i programmer og automatisere flertrinnsoppgaver – alt ved hjelp av naturlige språkinstruksjoner. CUA-modellen kan brukes som et verktøy i Responses API.

Modell Priser
global forhåndsvisning av databruk Inndata: $-/1M tokener
Utdata: $-/1M tokener

Innebygde verktøy

Med Responses API og Assistants API får du sømløs samhandling med verktøy som datamaskinbruk, kodetolker, funksjonsanrop og filsøk, noe som gjør det enkelt å utvikle AI-agenter.

Verktøy Inndata
Datamaskinbruk (bare Responses API) Inndata: $-/1M tokener
Utdata: $-/1M tokener
Anrop til filsøkverktøy (bare Responses API) $-/1K verktøyanrop
Filsøk* $-/GB vektorlagring per dag (1 GB gratis)
** $- / økt

*GB refererer til binære gigabyte, der 1 GB er 2^30 byte.

**Hvis assistenten kaller kodetolking samtidig i to forskjellige tråder, vil dette opprette to kodetolkingsøkter (2 * $-). Hver økt er aktiv som standard i én time, noe som betyr at du bare betaler dette gebyret én gang hvis brukeren fortsetter å gi instruksjoner til kodetolkning i samme tråd i opptil én time.

Slutningskostnad (inndata og utdata) varierer basert på GPT-modellen som brukes med hver assistent. Hvis assistenten din kaller Code Interpreter samtidig i to forskjellige tråder, oppretter dette to Code Interpreter-økter (2 * $-). Hver økt er aktiv som standard i én time, noe som betyr at prisen er for opptil én time med instruksjoner til kodetolkning i samme tråd.

Realtime API

GPT-4o-Realtime-Preview er med i Realtime API-en og støtter flerspråklige tale-til-tale-funksjoner. Den er optimalisert for samtaler med lav forsinkelse i sanntid, og dette muliggjør naturlig samhandling med minimal forsinkelse – ideelt for chatroboter og samtalebasert KI. GPT-4o er den omfattende og kraftigere versjonen designet for komplekse oppgaver, mens GPT-4o Mini er et mindre og mer kostnadseffektivt alternativ, ideelt for enklere applikasjoner der kostnadseffektivitet og hastighet er prioriteringer.

Modell Priser (1 million tokener)
GPT-4o-Realtime-Preview-2024-12-17-Global Tekst
Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-

Lyd
Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
GPT-4o-Realtime-Preview-2024-12-17-US/EU – Datasoner Tekst
Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-

Lyd
Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
GPT-4o-Realtime-Preview-2024-12-17-Regional Tekst
Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-

Lyd
Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global Tekst
Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-

Lyd
Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU – Datasoner Tekst
Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-

Lyd
Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional Tekst
Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-

Lyd
Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
GPT-4o-Realtime-Preview-2024-10-01-Global Tekst
Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-

Lyd
Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
GPT-4o-Realtime-Preview-2024-10-01-US/EU – Datasoner Tekst
Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-

Lyd
Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
GPT-4o-Realtime-Preview-2024-10-01-Regional Tekst
Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-

Lyd
Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-

API for chatfullføringer

GPT 4o-Audio-Preview-modellen er tatt med i API-en for chatfullføring og behandler og genererer lydinnhold. Den støtter avanserte funksjoner som talegjenkjenning og lydsyntese – ideelt for asynkron taleinteraksjoner og sentimentanalyse. GPT-4o er den omfattende og kraftigere versjonen designet for komplekse oppgaver, mens GPT-4o Mini er et mindre og mer kostnadseffektivt alternativ, ideelt for enklere applikasjoner der kostnadseffektivitet og hastighet er prioriteringer.

Modell Priser (1 million tokener)
GPT-4o-Audio-Preview-2024-12-17-Global Tekst
Inndata: $-
Utdata: $-

Lyd
Inndata: $-
Utdata: $-
GPT-4o-Audio-Preview-2024-12-17-US/EU – Datasoner Tekst
Inndata: $-
Utdata: $-

Lyd
Inndata: $-
Utdata: $-
GPT-4o-Audio-Preview-2024-12-17-Regional Tekst
Inndata: $-
Utdata: $-

Lyd
Inndata: $-
Utdata: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Global Tekst
Inndata: $-
Utdata: $-

Lyd
Inndata: $-
Utdata: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU – Datasoner Tekst
Inndata: $-
Utdata: $-

Lyd
Inndata: $-
Utdata: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional Tekst
Inndata: $-
Utdata: $-

Lyd
Inndata: $-
Utdata: $-

GPT-4o

GPT-4o er den mest avanserte flermodusmodellen som er raskere og billigere enn GPT-4 Turbo med sterkere synsfunksjoner. Modellen har 128K kontekst og en grense for kunnskap oktober 2023.

Modell Priser (1 million tokener) Priser med satsvis API (1 million tokener)
GPT-4o-2024-1120 Global Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
Inndata: $-
Utdata: $-
GPT-4o-2024-1120 US/EU – datasoner Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
Inndata: $-
Utdata: $-
GPT-4o-2024-1120 Regional Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
N/A
GPT-4o-2024-08-06 Global Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
Inndata: $-
Utdata: $-
GPT-4o-2024-08-06 US/EU – datasoner Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
Inndata: $-
Utdata: $-
GPT-4o-2024-08-06 Regional Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
N/A
GPT-4o-2024-0513 Global Inndata: $-
Utdata: $-
Inndata: $-
Utdata: $-
GPT-4o-2024-0513 US/EU – datasoner Inndata: $-
Utdata: $-
N/A
GPT-4o-2024-0513 Regional Inndata: $-
Utdata: $-
N/A

Planlegg med priskalkulatoren

GPT-4o mini

GPT-4o mini er den mest kostnadseffektive småmodellen og har synsfunksjoner. Modellen har 128K kontekst og en grense for kunnskap oktober 2023.

Modell Priser (1 million tokener) Priser med satsvis API (1 million tokener)
GPT-4o-mini-0718 Global Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
Inndata: $-
Utdata: $-
GPT-4o-mini-0718 US/EU – Datasoner Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
Inndata: $-
Utdata: $-
GPT-4o-mini-0718 Regional Inndata: $-
Hurtigbufrede inndata: $-
Utdata: $-
N/A

Planlegg med priskalkulatoren

Klargjort

Du kan tildele og administrere gjennomstrømming for distribusjoner, noe som sikrer forutsigbar ytelse og stabil kapasitet. Du belastes med en timepris per modell uavhengig av bruk, men du kan også sikre ekstra besparelser gjennom månedlige og årlige reservasjoner. Oppdag hvordan du overfører regionale distribusjoner og klargjorte reservasjoner til globale soner og datasoner på denne læresiden.

Modell Min-PTU-er PTU-timeprising PTU-reservasjonspris for månedlig Priser for årlig reservasjon for PTU
GPT-4o Global 15 $- $- $-
GPT-4o US/EU-datasoner 15 $- $- $-
GPT-4o Regional 50 $- $- $-
Finjustert GPT-4o-regional 50 $- $- $-
GPT-4o Mini Global 15 $- $- $-
GPT-4o Mini US/EU Data Zones 15 $- $- $-
GPT-4o Mini Regional 25 $- $- $-
Finjustert GPT-4o-mini regional 25 $- $- $-

Planlegg med priskalkulatoren

Grunnmodeller

Modeller Bruk per 1000 tokener
Babbage-002 $-
Davinci-002 $-

Finjusteringsmodeller

Modell Priser
GPT-4.1 Regionalt Inndata: $-/1M tokener
Hurtigbufrede inndata: $-/1M tokener
Utdata: $-/1M tokener
Opplæring: $-/1M tokener
Drifting: $- per time
Globalt Inndata: $-/1M tokener
Hurtigbufrede inndata: $-/1M tokener
Utdata: $-/1M tokener
Opplæring: $-/1M tokener
Drifting: $- per time
GPT-4.1-mini Regionalt Inndata: $-/1M tokener
Hurtigbufrede inndata: $-/1M tokener
Utdata: $-/1M tokener
Opplæring: $-/1M tokener
Drifting: $- per time
Globalt Inndata: $-/1M tokener
Hurtigbufrede inndata: $-/1M tokener
Utdata: $-/1M tokener
Opplæring: $-/1M tokener
Drifting: $- per time
GPT-4o-2024-08-06 Regionalt Inndata: $-/1M tokener
Hurtigbufrede inndata: $-/1M tokener
Utdata: $-/1M tokener
Opplæring: $-/1M tokener
Drifting: $- per time
Globalt Inndata: $-/1M tokener
Hurtigbufrede inndata: $-/1M tokener
Utdata: $-/1M tokener
Opplæring: bruk regional
Drifting: $- per time
GPT-4o-mini Regionalt Inndata: $-/1M tokener
Hurtigbufrede inndata: $-/1M tokener
Utdata: $-/1M tokener
Opplæring: $-/1M tokener
Drifting: $- per time
Globalt Inndata: $-/1M tokener
Hurtigbufrede inndata: $-/1M tokener
Utdata: $-/1M tokener
Opplæring: bruk regional
Drifting: $- per time
GPT-3.5-Turbo (16K) Regionalt Inndata: $-/1M tokener
Utdata: $-/1M tokener
Opplæring: $-/1M tokener
Drifting: $- per time
GPT-3.5-Turbo (4K) Regionalt Inndata: $-/1M tokener
Utdata: $-/1M tokener
Opplæring: $-/1M tokener
Drifting: $- per time

Administrere modeller

Modeller Kvalitet Oppløsning Pris (per 100 bilder)
Dall-E-3 Standard 1024 * 1024 $-
Standard 1024 * 1792,
1792 * 1024
$-
Dall-E-3 HD 1024 * 1024 $-
HD 1024 * 1792,
1792 * 1024
$-
Dall-E-2 Standard 1024 * 1024 $-

Bygge inn modeller

Modeller Per 1000 tokener
Ada $-
text-embedding-3-large $-
text-embedding-3-small $-

Talemodeller

Modeller Pris
Hviske $- per time
TTS (tekst-til-tale) $- / 1 million tegn
TTS HD $- / 1 million tegn

Eldre språkmodeller

Modeller Kontekst Inndata (per 1 million tokener) Utdata (per 1 million tokener)
GPT-3.5-Turbo-0301 4K $- $-
GPT-3.5-Turbo-0613 4K $- $-
GPT-3.5-Turbo-0613 16K $- $-
GPT-3.5-Turbo-1106 16K $- $-
GPT-3.5-Turbo-0125 16K $- $-
GPT-3.5-Turbo-Instruct 4K $- $-
GPT-4-Turbo 128K $- $-
GPT-4-Turbo-Vision 128K $- $-
GPT-4 8K $- $-
GPT-4 32K $- $-

Alternativer for Azure-priser og -kjøp

Få direkte kontakt med oss

Få en gjennomgang av Azure-priser. Forstå prisingen for skyløsningen din, lær om kostnadsoptimalisering og be om et egendefinert forslag.

Snakk med en selger

Se måter å kjøpe på

Kjøp Azure-tjenester via Azure-nettstedet, en Microsoft-representant eller en Azure-partner.

Se nærmere på alternativene dine

Flere ressurser

Azure OpenAI Service

Les mer om Azure OpenAI Service funksjoner og evner.

Priskalkulator

Beregn de forventede månedlige kostnadene ved å bruke en hvilken som helst kombinasjon av Azure-produkter.

SLA

Se gjennom serviceavtalen for Azure OpenAI Service.

Dokumentasjon

Se gjennom tekniske opplæringer, videoer og flere Azure OpenAI Service ressurser.

  • Azure OpenAI-tjenesten tilbyr priser basert på både forbruksbaserte og klargjorte gjennomstrømmingsenheter (PTU-er). Med forbruksbetaling kan du betale for ressursene du forbruker, noe som gjør det fleksibelt for variable arbeidsbelastninger. PTU-er tilbyr en forutsigbar prismodell der du reserverer og distribuerer en bestemt mengde modellbehandlingskapasitet. Denne modellen er ideell for arbeidsbelastninger med konsekvente eller forutsigbare bruksmønstre, som gir stabilitets- og kostnadskontroll.
  • Hvis du vil vite mer om PTU-er og Azure OpenAI-priser, kan du lese PTU-dokumentasjon eller kontakte våre salgsspesialister.

Snakk med en selger for å få en gjennomgang av Azure-prisene. Forstå prisene for skyløsningen din.

Få gratis skytjenester og $200 i kredit til å utforske Azure i 30 dager.

Legg til estimat. Trykk «v» for å vise på kalkulator
Kan vi hjelpe deg?