Prisoversikt for Azure OpenAI Service
For å hjelpe kunder på reisen tilbyr vi løsninger for priser og kostnadsadministrasjon for å dekke behovene dine, inkludert:
- Standard (ved behov): Forbruksbetaling for input- og output-tokener.
- Klargjort (PTU-er): Tildel gjennomstrømming med forutsigbare kostnader, med månedlige og årlige reservasjoner tilgjengelig for å redusere det totale forbruket.
- Bunke-API: Språkmodeller er nå også tilgjengelige i den bunke-API-en for globale utrullinger og tre områder. Den returnerer fullføringer innen 24 timer for en rabatt på 50 % på globale standardpriser.
- Global distribusjon – global SKU
- Datasonedistribusjon – geografisk basert (EU eller USA)
- Regional distribusjon – lokalt område (opptil 27 områder)
Se nærmere på prisalternativene
Legg til filtre for å tilpasse prisalternativene til dine behov.
Prisene er bare estimater, og er ikke ment som faktiske pristilbud. De faktiske prisene kan variere avhengig av avtaletypen, som er angitt med Microsoft, kjøpsdatoen og valutakursen. Prisene beregnes basert på amerikanske dollar, og konverteres ved hjelp av London-spotkurser registrert to virkedager før den siste virkedagen i utgangen av forrige måned. Hvis de to virkedagene før slutten av måneden faller på en helligdag i de største markedene, er prissettingsdagen vanligvis dagen umiddelbart før de to virkedagene. Denne satsen gjelder for alle transaksjoner i løpet av den kommende måneden. Logg på priskalkulatoren for Azure for å se priser basert på gjeldende program/tilbud med Microsoft. Kontakt en Azure-salgsspesialist for mer informasjon om priser, eller for å be om et pristilbud. Se vanlige spørsmål om Azure-priser.
Myndighetene i USA er kvalifisert for å kjøpe Azure Government-tjenester fra en lisensløsningsleverandør uten forhåndskostnader, eller direkte via et forbruksbetalt nettabonnement.
Viktig – Prisen i brasilianske real er bare for referanse. Dette er ikke en internasjonal transaksjon, og den endelige prisen avhenger av vekslingskurser og inkludering av IOF-avgifter. Det blir ikke utstedt noen eNF.
Myndighetene i USA er kvalifisert for å kjøpe Azure Government-tjenester fra en lisensløsningsleverandør uten forhåndskostnader, eller direkte via et forbruksbetalt nettabonnement.
Viktig – Prisen i brasilianske real er bare for referanse. Dette er ikke en internasjonal transaksjon, og den endelige prisen avhenger av vekslingskurser og inkludering av IOF-avgifter. Det blir ikke utstedt noen eNF.
o3
o3 is a powerful reasoning model from the o-series of reasoning models, pushing the frontier across coding, math, science, and visual perception. It excels in complex queries requiring multi-faceted analysis and performs strongly in visual tasks like analyzing images, charts, and graphics. The model features a 200K token context window and has a knowledge cutoff of June 2024.
Modell | Priser (1 million tokener) | Priser med satsvis API (1 million tokener) |
---|---|---|
o3 2025-04-16 |
Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
N/A |
o4-mini
o4-mini is a compact, efficient, and cost-effective reasoning model from OpenAI's o-series. It excels in math, coding, and visual tasks. The model features a 200K token context window and has a knowledge cutoff of June 2024.
Modell | Priser (1 million tokener) | Priser med satsvis API (1 million tokener) |
---|---|---|
o4-mini 2025-04-16 |
Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
N/A |
GPT-4.1-serien
GPT-4.1 series is a highly advanced general-purpose model with extensive world knowledge and an enhanced ability to understand user intent, making it particularly adept at creative tasks and agentic planning. The series features a 1 million token context window and has a knowledge cutoff of June 2024.
Modell | Priser (1 million tokener) | Priser med satsvis API (1 million tokener) |
---|---|---|
GPT-4.1-2025-04-14 |
Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
N/A |
GPT-4.1-mini-2025-04-14 |
Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
N/A |
GPT-4.1-nano-2025-04-14 |
Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
N/A |
GPT-4.5
Forhåndsversjon av GPT-4.5 er den nyeste modellen for generell bruk med dyp verdenskunnskap og bedre forståelse av brukerhensikt som gjør den god på kreative oppgaver og agentisk planlegging. Modellen har 128K kontekst og en grense for kunnskap oktober 2023.
Modell | Priser (1 million tokener) | Priser med satsvis API (1 million tokener) |
---|---|---|
GPT-4.5-Preview-2025-02-27 Global |
Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
N/A |
o1
o1 er den nye begrunnelsesmodellserien for komplekse oppgaver. Modellen har 200K kontekst og en grense for kunnskap fra oktober 2023.
Modell | Priser (1 million tokener) | Priser med satsvis API (1 million tokener) |
---|---|---|
o1 2024-12-17 Global |
Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
N/A |
o1 2024-12-17 US/EU – Data Zones |
Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
N/A |
o1 2024-12-17 Regional |
Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
N/A |
o1 preview 2024-09-12 Global |
Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
N/A |
o1 preview 2024-09-12 US/EU – Data Zones |
Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
N/A |
o1 preview 2024-09-12 Regional |
Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
N/A |
Planlegg med priskalkulatoren
o3 Mini
o3 mini er den oppdaterte versjonen av o1 mini-modellen. o3-mini er en raskt og kostnadseffektiv resonneringsmodell som er skreddersydd for koding, matematikk og vitenskap.
o3-mini-modellen har nå et utvidet kontekstinndatavindu på 200 000 tokener, og et maksimumsresultat på 100 000 tokener, som gir rikelig med plass til komplekse og detaljerte svar. o1 mini-modellen har 128 000 kontekstinndata. Både o3- og o1-modellene har en kunnskapsavskjæring i oktober 2023.
Modell | Priser (1 million tokener) | Priser med satsvis API (1 million tokener) |
---|---|---|
o3 mini 2025-01-31 Global |
Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
Inndata: $- Utdata: $- |
o3 mini 2025-01-31-US/EU – Data Zones |
Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
Inndata: $- Utdata: $- |
o3 mini 2025-01-31 Regional |
Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
N/A |
o1-mini 2024-09-12 Global |
Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
N/A |
o1-mini 2024-09-12 US/EU – Data Zones |
Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
N/A |
o1-mini 2024-09-12 Regional |
Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
N/A |
Planlegg med priskalkulatoren
Computer-Using Agent (CUA)
Computer-Using Agent (CUA) er en spesialisert AI-modell som gjør det mulig for kunstig intelligens å samhandle med grafiske brukergrensesnitt (GUIer), navigere i programmer og automatisere flertrinnsoppgaver – alt ved hjelp av naturlige språkinstruksjoner. CUA-modellen kan brukes som et verktøy i Responses API.
Modell | Priser |
---|---|
global forhåndsvisning av databruk |
Inndata: $-/1M tokener Utdata: $-/1M tokener |
Innebygde verktøy
Med Responses API og Assistants API får du sømløs samhandling med verktøy som datamaskinbruk, kodetolker, funksjonsanrop og filsøk, noe som gjør det enkelt å utvikle AI-agenter.
Verktøy | Inndata |
---|---|
Datamaskinbruk (bare Responses API) |
Inndata: $-/1M tokener Utdata: $-/1M tokener |
Anrop til filsøkverktøy (bare Responses API) | $-/1K verktøyanrop |
Filsøk* | $-/GB vektorlagring per dag (1 GB gratis) |
** | $- / økt |
*GB refererer til binære gigabyte, der 1 GB er 2^30 byte.
**Hvis assistenten kaller kodetolking samtidig i to forskjellige tråder, vil dette opprette to kodetolkingsøkter (2 * $-). Hver økt er aktiv som standard i én time, noe som betyr at du bare betaler dette gebyret én gang hvis brukeren fortsetter å gi instruksjoner til kodetolkning i samme tråd i opptil én time.
Slutningskostnad (inndata og utdata) varierer basert på GPT-modellen som brukes med hver assistent. Hvis assistenten din kaller Code Interpreter samtidig i to forskjellige tråder, oppretter dette to Code Interpreter-økter (2 * $-). Hver økt er aktiv som standard i én time, noe som betyr at prisen er for opptil én time med instruksjoner til kodetolkning i samme tråd.
Realtime API
GPT-4o-Realtime-Preview er med i Realtime API-en og støtter flerspråklige tale-til-tale-funksjoner. Den er optimalisert for samtaler med lav forsinkelse i sanntid, og dette muliggjør naturlig samhandling med minimal forsinkelse – ideelt for chatroboter og samtalebasert KI. GPT-4o er den omfattende og kraftigere versjonen designet for komplekse oppgaver, mens GPT-4o Mini er et mindre og mer kostnadseffektivt alternativ, ideelt for enklere applikasjoner der kostnadseffektivitet og hastighet er prioriteringer.
Modell | Priser (1 million tokener) |
---|---|
GPT-4o-Realtime-Preview-2024-12-17-Global |
Tekst Inndata: $- Hurtigbufrede inndata: $- Utdata: $- Lyd Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
GPT-4o-Realtime-Preview-2024-12-17-US/EU – Datasoner |
Tekst Inndata: $- Hurtigbufrede inndata: $- Utdata: $- Lyd Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
GPT-4o-Realtime-Preview-2024-12-17-Regional |
Tekst Inndata: $- Hurtigbufrede inndata: $- Utdata: $- Lyd Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global |
Tekst Inndata: $- Hurtigbufrede inndata: $- Utdata: $- Lyd Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU – Datasoner |
Tekst Inndata: $- Hurtigbufrede inndata: $- Utdata: $- Lyd Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional |
Tekst Inndata: $- Hurtigbufrede inndata: $- Utdata: $- Lyd Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
GPT-4o-Realtime-Preview-2024-10-01-Global |
Tekst Inndata: $- Hurtigbufrede inndata: $- Utdata: $- Lyd Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
GPT-4o-Realtime-Preview-2024-10-01-US/EU – Datasoner |
Tekst Inndata: $- Hurtigbufrede inndata: $- Utdata: $- Lyd Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
GPT-4o-Realtime-Preview-2024-10-01-Regional |
Tekst Inndata: $- Hurtigbufrede inndata: $- Utdata: $- Lyd Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
API for chatfullføringer
GPT 4o-Audio-Preview-modellen er tatt med i API-en for chatfullføring og behandler og genererer lydinnhold. Den støtter avanserte funksjoner som talegjenkjenning og lydsyntese – ideelt for asynkron taleinteraksjoner og sentimentanalyse. GPT-4o er den omfattende og kraftigere versjonen designet for komplekse oppgaver, mens GPT-4o Mini er et mindre og mer kostnadseffektivt alternativ, ideelt for enklere applikasjoner der kostnadseffektivitet og hastighet er prioriteringer.
Modell | Priser (1 million tokener) |
---|---|
GPT-4o-Audio-Preview-2024-12-17-Global |
Tekst Inndata: $- Utdata: $- Lyd Inndata: $- Utdata: $- |
GPT-4o-Audio-Preview-2024-12-17-US/EU – Datasoner |
Tekst Inndata: $- Utdata: $- Lyd Inndata: $- Utdata: $- |
GPT-4o-Audio-Preview-2024-12-17-Regional |
Tekst Inndata: $- Utdata: $- Lyd Inndata: $- Utdata: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Global |
Tekst Inndata: $- Utdata: $- Lyd Inndata: $- Utdata: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU – Datasoner |
Tekst Inndata: $- Utdata: $- Lyd Inndata: $- Utdata: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional |
Tekst Inndata: $- Utdata: $- Lyd Inndata: $- Utdata: $- |
GPT-4o
GPT-4o er den mest avanserte flermodusmodellen som er raskere og billigere enn GPT-4 Turbo med sterkere synsfunksjoner. Modellen har 128K kontekst og en grense for kunnskap oktober 2023.
Modell | Priser (1 million tokener) | Priser med satsvis API (1 million tokener) |
---|---|---|
GPT-4o-2024-1120 Global |
Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
Inndata: $- Utdata: $- |
GPT-4o-2024-1120 US/EU – datasoner |
Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
Inndata: $- Utdata: $- |
GPT-4o-2024-1120 Regional |
Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
N/A |
GPT-4o-2024-08-06 Global |
Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
Inndata: $- Utdata: $- |
GPT-4o-2024-08-06 US/EU – datasoner |
Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
Inndata: $- Utdata: $- |
GPT-4o-2024-08-06 Regional |
Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
N/A |
GPT-4o-2024-0513 Global |
Inndata: $- Utdata: $- |
Inndata: $- Utdata: $- |
GPT-4o-2024-0513 US/EU – datasoner |
Inndata: $- Utdata: $- |
N/A |
GPT-4o-2024-0513 Regional |
Inndata: $- Utdata: $- |
N/A |
Planlegg med priskalkulatoren
GPT-4o mini
GPT-4o mini er den mest kostnadseffektive småmodellen og har synsfunksjoner. Modellen har 128K kontekst og en grense for kunnskap oktober 2023.
Modell | Priser (1 million tokener) | Priser med satsvis API (1 million tokener) |
---|---|---|
GPT-4o-mini-0718 Global |
Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
Inndata: $- Utdata: $- |
GPT-4o-mini-0718 US/EU – Datasoner |
Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
Inndata: $- Utdata: $- |
GPT-4o-mini-0718 Regional |
Inndata: $- Hurtigbufrede inndata: $- Utdata: $- |
N/A |
Planlegg med priskalkulatoren
Klargjort
Du kan tildele og administrere gjennomstrømming for distribusjoner, noe som sikrer forutsigbar ytelse og stabil kapasitet. Du belastes med en timepris per modell uavhengig av bruk, men du kan også sikre ekstra besparelser gjennom månedlige og årlige reservasjoner. Oppdag hvordan du overfører regionale distribusjoner og klargjorte reservasjoner til globale soner og datasoner på denne læresiden.
Modell | Min-PTU-er | PTU-timeprising | PTU-reservasjonspris for månedlig | Priser for årlig reservasjon for PTU |
---|---|---|---|---|
GPT-4o Global | 15 | $- | $- | $- |
GPT-4o US/EU-datasoner | 15 | $- | $- | $- |
GPT-4o Regional | 50 | $- | $- | $- |
Finjustert GPT-4o-regional | 50 | $- | $- | $- |
GPT-4o Mini Global | 15 | $- | $- | $- |
GPT-4o Mini US/EU Data Zones | 15 | $- | $- | $- |
GPT-4o Mini Regional | 25 | $- | $- | $- |
Finjustert GPT-4o-mini regional | 25 | $- | $- | $- |
Planlegg med priskalkulatoren
Grunnmodeller
Modeller | Bruk per 1000 tokener |
---|---|
Babbage-002 | $- |
Davinci-002 | $- |
Finjusteringsmodeller
Modell | Priser | |
---|---|---|
GPT-4.1 | Regionalt |
Inndata: $-/1M tokener Hurtigbufrede inndata: $-/1M tokener Utdata: $-/1M tokener Opplæring: $-/1M tokener Drifting: $- per time |
Globalt |
Inndata: $-/1M tokener Hurtigbufrede inndata: $-/1M tokener Utdata: $-/1M tokener Opplæring: $-/1M tokener Drifting: $- per time |
|
GPT-4.1-mini | Regionalt |
Inndata: $-/1M tokener Hurtigbufrede inndata: $-/1M tokener Utdata: $-/1M tokener Opplæring: $-/1M tokener Drifting: $- per time |
Globalt |
Inndata: $-/1M tokener Hurtigbufrede inndata: $-/1M tokener Utdata: $-/1M tokener Opplæring: $-/1M tokener Drifting: $- per time |
|
GPT-4o-2024-08-06 | Regionalt |
Inndata: $-/1M tokener Hurtigbufrede inndata: $-/1M tokener Utdata: $-/1M tokener Opplæring: $-/1M tokener Drifting: $- per time |
Globalt |
Inndata: $-/1M tokener Hurtigbufrede inndata: $-/1M tokener Utdata: $-/1M tokener Opplæring: bruk regional Drifting: $- per time |
|
GPT-4o-mini | Regionalt |
Inndata: $-/1M tokener Hurtigbufrede inndata: $-/1M tokener Utdata: $-/1M tokener Opplæring: $-/1M tokener Drifting: $- per time |
Globalt |
Inndata: $-/1M tokener Hurtigbufrede inndata: $-/1M tokener Utdata: $-/1M tokener Opplæring: bruk regional Drifting: $- per time |
|
GPT-3.5-Turbo (16K) | Regionalt |
Inndata: $-/1M tokener Utdata: $-/1M tokener Opplæring: $-/1M tokener Drifting: $- per time |
GPT-3.5-Turbo (4K) | Regionalt |
Inndata: $-/1M tokener Utdata: $-/1M tokener Opplæring: $-/1M tokener Drifting: $- per time |
Administrere modeller
Modeller | Kvalitet | Oppløsning | Pris (per 100 bilder) |
---|---|---|---|
Dall-E-3 | Standard | 1024 * 1024 | $- |
Standard | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-3 | HD | 1024 * 1024 | $- |
HD | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-2 | Standard | 1024 * 1024 | $- |
Bygge inn modeller
Modeller | Per 1000 tokener |
---|---|
Ada | $- |
text-embedding-3-large | $- |
text-embedding-3-small | $- |
Talemodeller
Modeller | Pris |
---|---|
Hviske | $- per time |
TTS (tekst-til-tale) | $- / 1 million tegn |
TTS HD | $- / 1 million tegn |
Eldre språkmodeller
Modeller | Kontekst | Inndata (per 1 million tokener) | Utdata (per 1 million tokener) |
---|---|---|---|
GPT-3.5-Turbo-0301 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 16K | $- | $- |
GPT-3.5-Turbo-1106 | 16K | $- | $- |
GPT-3.5-Turbo-0125 | 16K | $- | $- |
GPT-3.5-Turbo-Instruct | 4K | $- | $- |
GPT-4-Turbo | 128K | $- | $- |
GPT-4-Turbo-Vision | 128K | $- | $- |
GPT-4 | 8K | $- | $- |
GPT-4 | 32K | $- | $- |
Alternativer for Azure-priser og -kjøp

Få direkte kontakt med oss
Få en gjennomgang av Azure-priser. Forstå prisingen for skyløsningen din, lær om kostnadsoptimalisering og be om et egendefinert forslag.
Snakk med en selgerSe måter å kjøpe på
Kjøp Azure-tjenester via Azure-nettstedet, en Microsoft-representant eller en Azure-partner.
Se nærmere på alternativene dineFlere ressurser
Azure OpenAI Service
Les mer om Azure OpenAI Service funksjoner og evner.
Priskalkulator
Beregn de forventede månedlige kostnadene ved å bruke en hvilken som helst kombinasjon av Azure-produkter.
SLA
Se gjennom serviceavtalen for Azure OpenAI Service.
Dokumentasjon
Se gjennom tekniske opplæringer, videoer og flere Azure OpenAI Service ressurser.
Vanlige spørsmål
-
Azure OpenAI-tjenesten tilbyr priser basert på både forbruksbaserte og klargjorte gjennomstrømmingsenheter (PTU-er). Med forbruksbetaling kan du betale for ressursene du forbruker, noe som gjør det fleksibelt for variable arbeidsbelastninger. PTU-er tilbyr en forutsigbar prismodell der du reserverer og distribuerer en bestemt mengde modellbehandlingskapasitet. Denne modellen er ideell for arbeidsbelastninger med konsekvente eller forutsigbare bruksmønstre, som gir stabilitets- og kostnadskontroll.
-
Hvis du vil vite mer om PTU-er og Azure OpenAI-priser, kan du lese PTU-dokumentasjon eller kontakte våre salgsspesialister.
Snakk med en selger for å få en gjennomgang av Azure-prisene. Forstå prisene for skyløsningen din.
Få gratis skytjenester og $200 i kredit til å utforske Azure i 30 dager.