Overslaan naar hoofdinhoud
Azure

Prijzen voor Azure OpenAI Service

Overzicht van prijzen van Azure OpenAI Service

Azure OpenAI Service biedt generatieve AI op zakelijke basis met krachtige modellen van OpenAI, waardoor organisaties kunnen innoveren met tekst-, audio- en beeldmogelijkheden. Naast de geavanceerde modellen kiezen bedrijven voor Azure OpenAI Service voor ingebouwde gegevensprivacy, regionale/gebiedsmatige/globale flexibiliteit en naadloze integratie in het Azure-ecosysteem, waaronder Fabric, Cosmos DB en Azure AI Search. Bedrijven van elke omvang kunnen met vertrouwen AI-oplossingen schalen om klantervaring te verbeteren, werkstromen te automatiseren en creatief potentieel te ontgrendelen, wat meetbare impact en concurrentieverschillen stimuleert.

Om klanten te helpen bij het traject, bieden we oplossingen voor prijs- en kostenbeheer om aan uw behoeften te voldoen. Inclusief:
  • Standaard (op aanvraag): betalen per gebruik voor invoer- en uitvoertokens.
  • Ingericht (PTU's): Doorvoer toewijzen met voorspelbare kosten, waarbij maandelijkse en jaarlijkse reserveringen beschikbaar zijn om de totale uitgaven te verminderen.
  • Batch-API: Taalmodellen zijn nu ook beschikbaar in de Batch-API voor globale implementaties en drie regio's, waarmee binnen 24 uur voltooiingen worden geretourneerd met een korting van 50% op de prijzen voor Global Standard.
U kunt kiezen uit de volgende implementatietypen voor Standard en Provisioned, die meer flexibiliteit en controle over prijzen en prestaties mogelijk maken. Deze flexibiliteit helpt in tijden van steeds meer beperkende grenzen voor gegevensverwerking en behoefte aan meer doorvoer en een lagere prijs.
  • Globale implementatie – globale SKU
  • Datazone-implementatie – geografisch gebaseerd (EU of VS)
  • Regionale implementatie – Lokale regio (tot 27 regio's)

Prijsopties verkennen

Pas filters toe om de prijsopties aan te passen aan uw behoeften.

De prijzen zijn slechts schattingen en zijn niet bedoeld als werkelijke prijsopgaven. De werkelijke prijzen kunnen variëren afhankelijk van het type overeenkomst dat is afgesloten met Microsoft, de aankoopdatum en de valutakoers. De prijzen worden berekend op basis van Amerikaanse dollars en worden geconverteerd op basis van de slotspot-tarieven in Londen die zijn vastgelegd in de twee werkdagen voor de laatste werkdag van de vorige maand. Als de twee werkdagen voor het einde van de maand vallen op een feestdag in de voornaamste markten, is de dag direct voorafgaande aan de twee werkdagen de dag van de tariefvaststelling. Dit tarief is van toepassing op alle transacties gedurende de aankomende maand. Meld u zich aan bij de Azure-prijscalculator voor prijzen op basis van uw huidige programma/aanbieding bij Microsoft. Neemt u contact op met een Azure-verkoopspecialist voor meer informatie over prijzen of om een prijsopgave aan te vragen. Zie veelgestelde vragen over Azure-prijzen.

GPT-5 series

Model Prijzen (1 miljoen tokens)
GPT-5 2025-08-07 Global Invoer: $-
Invoer in cache: $-
Uitvoer: $-
GPT-5 Data Zone Invoer: $-
Invoer in cache: $-
Uitvoer: $-
GPT-5-mini Global Invoer: $-
Invoer in cache: $-
Uitvoer: $-
GPT-5-mini Data Zone Invoer: $-
Invoer in cache: $-
Uitvoer: $-
GPT-5-nano Global Invoer: $-
Invoer in cache: $-
Uitvoer: $-
GPT-5-nano Data Zone Invoer: $-
Invoer in cache: $-
Uitvoer: $-
GPT-5 chat Global Invoer: $-
Invoer in cache: $-
Uitvoer: $-

Deep Research

Deep Research enables developers and enterprises to automate complex research tasks with structured, citation-rich answers. It is suitable for building customer support bots, internal knowledge assistants, or market analysis tools. Deep Research delivers transparent, auditable insights grounded in real-time web data. Search context tokens are charged input token prices for the model being used. You’ll separately incur charges for Grounding with Bing Search and the base GPT model being used for clarifying questions.

Model Prijzen
o3-deep research Global Invoer: $-
Invoer in cache: $-
Uitvoer: $-

o3

o3 is een krachtig redeneermodel uit de o-reeks van redeneermodellen, dat de grenzen verlegt op het gebied van codering, wiskunde, wetenschap en visuele waarneming. Het excelleert in complexe vragen die een meervoudige analyse vereisen en presteert sterk in visuele taken zoals het analyseren van afbeeldingen, grafieken en diagrammen. Het model heeft een contextvenster van 200.000 tokens en een kennisafkap van juni 2024.

Model Prijzen (1 miljoen tokens) Prijzen met Batch API (1 miljoen tokens)
o3 2025-04-16 Wereldwijd Invoer: $-
Invoer in cache: $-
Uitvoer: $-
Invoer: $-
Uitvoer: $-
o3 2025-04-16 Gegevenszone Invoer: $-
Invoer in cache: $-
Uitvoer: $-
Invoer: $-
Uitvoer: $-
o3 2025-04-16 Regionaal Invoer: $-
Invoer in cache: $-
Uitvoer: $-
N.v.t.

o4-mini

o4-mini is een compact, efficiënt en kosteneffectief redeneermodel uit de o-serie van OpenAI. Het excelleert in wiskunde, coderen en visuele taken. Het model heeft een contextvenster van 200.000 tokens en een kennisafkap van juni 2024.

Model Prijzen (1 miljoen tokens) Prijzen met Batch API (1 miljoen tokens)
o4-mini 2025-04-16 Wereldwijd Invoer: $-
Invoer in cache: $-
Uitvoer: $-
Invoer: $-
Uitvoer: $-
o4-mini 2025-04-16 Gegevenszone Invoer: $-
Invoer in cache: $-
Uitvoer: $-
Invoer: $-
Uitvoer: $-
o4-mini 2025-04-16 Regionaal Invoer: $-
Invoer in cache: $-
Uitvoer: $-
N.v.t.

GPT-4.1-serie

GPT-4.1-serie is een zeer geavanceerd algemeen model met uitgebreide wereldkennis en een verbeterd vermogen om de gebruikersintentie te begrijpen, waardoor het bijzonder geschikt is voor creatieve taken en agentische planning. De serie heeft een contextvenster van 1 miljoen tokens en een kennisafkap van juni 2024.

Model Prijzen (1 miljoen tokens) Prijzen met Batch API (1 miljoen tokens)
GPT-4.1-2025-04-14 Wereldwijd Invoer: $-
Invoer in cache: $-
Uitvoer: $-
Invoer: $-
Uitvoer: $-
GPT-4.1-2025-04-14 Gegevenszone Invoer: $-
Invoer in cache: $-
Uitvoer: $-
Invoer: $-
Uitvoer: $-
GPT-4.1-2025-04-14 Regionaal Invoer: $-
Invoer in cache: $-
Uitvoer: $-
N.v.t.
GPT-4.1-mini-2025-04-14 Wereldwijd Invoer: $-
Invoer in cache: $-
Uitvoer: $-
Invoer: $-
Uitvoer: $-
GPT-4.1-mini-2025-04-14 Gegevenszone Invoer: $-
Invoer in cache: $-
Uitvoer: $-
Invoer: $-
Uitvoer: $-
GPT-4.1-mini-2025-04-14 Regionaal Invoer: $-
Invoer in cache: $-
Uitvoer: $-
N.v.t.
GPT-4.1-nano-2025-04-14 Wereldwijd Invoer: $-
Invoer in cache: $-
Uitvoer: $-
Invoer: $-
Uitvoer: $-
GPT-4.1-nano-2025-04-14 Gegevenszone Invoer: $-
Invoer in cache: $-
Uitvoer: $-
Invoer: $-
Uitvoer: $-
GPT-4.1-nano-2025-04-14 Regionaal Invoer: $-
Invoer in cache: $-
Uitvoer: $-
N.v.t.

Sora in Azure OpenAI

Sora is een multimodaal generatief AI-model dat nu beschikbaar is in Azure AI Foundry. Het is ontworpen om creatieve teams te helpen ideeën tot leven te brengen via naadloze API-first integratie. Het is gebouwd op basis van de infrastructuur op bedrijfsniveau van Azure en biedt een veilige, schaalbare implementatie voor het omzetten van concepten in visuele inhoud van hoge kwaliteit.

Prijs per seconde 1-5s 6-10s 11-15s 16-20s
480 vierkant $- $- $- $-
480p $- $- $- $-
720 vierkant $- $- $- $-
720p $- $- $- $-
1080 vierkant $- $- $- $-
1080p $- $- $- $-

GPT-Image-1

GPT-image-1 verbetert DALL·E met betere instructies, nauwkeurige tekstweergave en ondersteuning voor het invoeren en bewerken van afbeeldingen. Het model is geprijsd per token, met verschillende prijzen voor tekst- en afbeeldingstokens.

Model Prijzen (1 miljoen tokens) Prijzen met Batch API (1 miljoen tokens)
GPT-Image-1 Global Invoertekst: $-
Invoerafbeelding: $-
Uitvoerafbeelding: $-
N.v.t.
GPT-Image-1 Regional Invoertekst: $-
Invoerafbeelding: $-
Uitvoerafbeelding: $-
N.v.t.
GPT-Image-1 Data Zone Invoertekst: $-
Invoerafbeelding: $-
Uitvoerafbeelding: $-
N.v.t.

GPT-4.5

GPT-4.5-preview is het nieuwste model voor algemeen gebruik met diepgaande wereldkennis en een beter begrip van de gebruikersintentie, waardoor het goed presteert bij creatieve taken en agentieve planning. Het model heeft een context van 128.000 en een kennis-cutoff van oktober 2023.

Model Prijzen (1 miljoen tokens) Prijzen met Batch API (1 miljoen tokens)
GPT-4.5-Preview-2025-02-27 Global Invoer: $-
Invoer in cache: $-
Uitvoer: $-
N.v.t.

o1

o1 is de nieuwe reeks redeneringsmodellen voor complexe taken. Het model heeft een context van 200.000 en een kennis-cutoff van oktober 2023.

Model Prijzen (1 miljoen tokens) Prijzen met Batch API (1 miljoen tokens)
o1 17-12-2024 wereldwijd Invoer: $-
Invoer in cache: $-
Uitvoer: $-
N.v.t.
o1 17-12-2024 VS/EU-gegevenszones Invoer: $-
Invoer in cache: $-
Uitvoer: $-
N.v.t.
o1 17-12-2024 regionaal Invoer: $-
Invoer in cache: $-
Uitvoer: $-
N.v.t.
o1 preview 12-09-2024 wereldwijd Invoer: $-
Invoer in cache: $-
Uitvoer: $-
N.v.t.
o1 preview 12-09-2024 VS/EU-gegevenszones Invoer: $-
Invoer in cache: $-
Uitvoer: $-
N.v.t.
o1 preview 12-09-2024 regionaal Invoer: $-
Invoer in cache: $-
Uitvoer: $-
N.v.t.

Plannen met de -prijscalculator

o3 mini

De o3 mini is de bijgewerkte versie van het o1-minimodel. De o3 mini is een snelle, kosteneffectief redeneermodel dat is afgestemd op gebruikssituaties voor codering, wiskunde en wetenschap.

Het o3 mini-model beschikt nu over een uitgebreid contextinvoervenster van 200K tokens en een maximale uitvoer van 100K tokens, wat voldoende ruimte biedt voor complexe en gedetailleerde antwoorden. Het o1 mini-model heeft een contextinvoer van 128K. Zowel de o3- als de o1-modellen hebben een kennisafkapdatum van oktober 2023.

Model Prijzen (1 miljoen tokens) Prijzen met Batch API (1 miljoen tokens)
o3 mini 31-01-2025 wereldwijd Invoer: $-
Invoer in cache: $-
Uitvoer: $-
Invoer: $-
Uitvoer: $-
o3 mini 31-01-2025 VS/EU-gegevenszones Invoer: $-
Invoer in cache: $-
Uitvoer: $-
Invoer: $-
Uitvoer: $-
o3 mini 31-01-2025 regionaal Invoer: $-
Invoer in cache: $-
Uitvoer: $-
N.v.t.
o1 mini 12-09-2024 wereldwijd Invoer: $-
Invoer in cache: $-
Uitvoer: $-
N.v.t.
o1-mini 12-09-2024 VS/EU-gegevenszones Invoer: $-
Invoer in cache: $-
Uitvoer: $-
N.v.t.
o1 mini 12-09-2024 regionaal Invoer: $-
Invoer in cache: $-
Uitvoer: $-
N.v.t.

Plannen met de -prijscalculator

Audiomodellen

Azure OpenAI Service omvat de geavanceerde audiomodellen GPT-4o-Transcribe, GPT-4o-Mini-Transcribe en GPT-4o-Mini-TTS. Deze modellen verbeteren spraak-naar-tekst- en tekst-naar-spraak-mogelijkheden en bieden hoge nauwkeurigheid en aanpasbare spraakuitvoer voor verschillende toepassingen. Ideaal voor klantcallcenters, liveondertiteling en interactieve spraakuitvoer. Ze maken gebruik van uitgebreide pretraining en geavanceerde distillatie technieken voor superieure prestaties.

Model Prijzen (1 miljoen tokens) Prijzen met Batch API (1 miljoen tokens)
GPT-4o-Transcribe Tekst
Invoer: $-
Uitvoer: $-

Audio
Invoer: $-
Uitvoer: N.v.t.
N.v.t.
GPT-4o-Mini-Transcribe Tekst
Invoer: $-
Uitvoer: $-

Audio
Invoer: $-
Uitvoer: N.v.t.
N.v.t.
GPT-4o-Mini-TTS Tekst
Invoer: $-
Uitvoer: N.v.t.

Audio
Invoer: N.v.t.
Uitvoer: $-
N.v.t.

Gebruikersagent voor agenda's (CUA)

De gebruikersagent voor agenda's (CUA) is een gespecialiseerd AI-model waarmee AI kan communiceren met grafische gebruikersinterfaces (GUIs), toepassingen kan navigeren en taken met meerdere stappen kan automatiseren, allemaal via instructies in natuurlijke taal. Het CUA-model kan worden gebruikt als hulpprogramma in de Antwoorden-API.

Model Prijzen
computergebruik-preview Globaal Invoer: $-/1M-tokens
Uitvoer: $-/1M-tokens

Ingebouwde hulpprogramma's

De Antwoord-API en de Assistent-API maken naadloze interactie mogelijk met hulpprogramma's zoals computergebruik, codetolk, functieoproepen en bestandszoekopdrachten, zodat ontwikkelaars eenvoudig AI-agents kunnen bouwen.

Hulpprogramma Invoer
Computergebruik (alleen antwoorden-API) Invoer: $-/1M-tokens
Uitvoer: $-/1M-tokens
Aanroep van het hulpprogramma Bestandszoekopdrachten (alleen antwoorden-API) $-/1K aanroepen van hulpprogramma's
Bestanden zoeken* $-/GB vectoropslag per dag (1 GB gratis)
Codetolk** $-/sessie

*GB verwijst naar binaire gigabytes, waarbij 1 GB gelijk is aan 2^30 bytes.

**Als uw assistent codetolk tegelijkertijd in twee verschillende threads aanroept, worden er twee codetolksessies gemaakt (2 * $-). Elke sessie is standaard één uur actief, wat betekent dat u deze kosten slechts één keer betaalt als uw gebruiker maximaal één uur instructies blijft geven aan codetolk in dezelfde thread.

De deductiekosten (invoer en uitvoer) variëren op basis van het GPT-model gebruikt met elke assistent. Als uw assistent tegelijkertijd Codetolk aanroept in twee verschillende threads, worden er twee Codetolk-sessies (2 * $-) gemaakt. Elke sessie is standaard voor één uur actief, wat betekent dat de prijs geldt voor het geven van instructies aan Codetolk in dezelfde thread gedurende één uur.

Realtime-API

De GPT-4o-Realtime-Preview wordt aanbevolen in de Realtime-API en biedt ondersteuning voor meertalige spraak-naar-spraakmogelijkheden. Geoptimaliseerd voor realtime gesprekken met lage latentie, maakt het natuurlijke interacties mogelijk met minimale vertraging, ideaal voor chatbots en conversationele AI. GPT-4o is de uitgebreide, krachtigere versie die is ontworpen voor complexe taken, terwijl GPT-4o Mini een kleinere, betaalbare optie is die ideaal is voor eenvoudigere toepassingen waarbij kostenefficiëntie en snelheid prioriteiten zijn.

Model Prijzen (1 miljoen tokens)
GPT-4o-Realtime-Preview-2024-12-17-Globaal Tekst
Invoer: $-
Invoer in cache: $-
Uitvoer: $-

Audio
Invoer: $-
Invoer in cache: $-
Uitvoer: $-
GPT-4o-Realtime-Preview-2024-12-17-US/EU – Gegevenszones Tekst
Invoer: $-
Invoer in cache: $-
Uitvoer: $-

Audio
Invoer: $-
Invoer in cache: $-
Uitvoer: $-
GPT-4o-Realtime-Preview-2024-12-17-Regionaal Tekst
Invoer: $-
Invoer in cache: $-
Uitvoer: $-

Audio
Invoer: $-
Invoer in cache: $-
Uitvoer: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Globaal Tekst
Invoer: $-
Invoer in cache: $-
Uitvoer: $-

Audio
Invoer: $-
Invoer in cache: $-
Uitvoer: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU – Gegevenszones Tekst
Invoer: $-
Invoer in cache: $-
Uitvoer: $-

Audio
Invoer: $-
Invoer in cache: $-
Uitvoer: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regionaal Tekst
Invoer: $-
Invoer in cache: $-
Uitvoer: $-

Audio
Invoer: $-
Invoer in cache: $-
Uitvoer: $-
GPT-4o-Realtime-Preview-2024-10-01-Globaal Tekst
Invoer: $-
Invoer in cache: $-
Uitvoer: $-

Audio
Invoer: $-
Invoer in cache: $-
Uitvoer: $-
GPT-4o-Realtime-Preview-2024-10-01-US/EU – Gegevenszones Tekst
Invoer: $-
Invoer in cache: $-
Uitvoer: $-

Audio
Invoer: $-
Invoer in cache: $-
Uitvoer: $-
GPT-4o-Realtime-Preview-2024-10-01-Regionaal Tekst
Invoer: $-
Invoer in cache: $-
Uitvoer: $-

Audio
Invoer: $-
Invoer in cache: $-
Uitvoer: $-

API voor chatvoltooiingen

Het GPT 4o-Audio-Preview-model, dat is opgenomen in de API voor chatvoltooiingen, verwerkt en genereert audio-inhoud. Het ondersteunt geavanceerde functies zoals spraakherkenning en audiosynthese, ideaal voor asynchrone spraakinteracties en sentimentanalyse. GPT-4o is de uitgebreide, krachtigere versie die is ontworpen voor complexe taken, terwijl GPT-4o Mini een kleinere, betaalbare optie is die ideaal is voor eenvoudigere toepassingen waarbij kostenefficiëntie en snelheid prioriteiten zijn.

Model Prijzen (1 miljoen tokens)
GPT-4o-Audio-Preview-2024-12-17-Globaal Tekst
Invoer: $-
Uitvoer: $-

Audio
Invoer: $-
Uitvoer: $-
GPT-4o-Audio-Preview-2024-12-17-US/EU – Gegevenszones Tekst
Invoer: $-
Uitvoer: $-

Audio
Invoer: $-
Uitvoer: $-
GPT-4o-Audio-Preview-2024-12-17-Regionaal Tekst
Invoer: $-
Uitvoer: $-

Audio
Invoer: $-
Uitvoer: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Globaal Tekst
Invoer: $-
Uitvoer: $-

Audio
Invoer: $-
Uitvoer: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU – Gegevenszones Tekst
Invoer: $-
Uitvoer: $-

Audio
Invoer: $-
Uitvoer: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Regionaal Tekst
Invoer: $-
Uitvoer: $-

Audio
Invoer: $-
Uitvoer: $-

GPT-4o

GPT-4o is het meest geavanceerde multimodaal model dat sneller en voordeliger is dan GPT-4 Turbo met sterkere zichtmogelijkheden. Het model heeft een context van 128.000 en een kennis-cutoff van oktober 2023.

Model Prijzen (1 miljoen tokens) Prijzen met Batch API (1 miljoen tokens)
GPT-4o-2024-1120 Globaal Invoer: $-
Invoer in cache: $-
Uitvoer: $-
Invoer: $-
Uitvoer: $-
GPT-4o-2024-1120 VS/EU - Gegevenszones Invoer: $-
Invoer in cache: $-
Uitvoer: $-
Invoer: $-
Uitvoer: $-
GPT-4o-2024-1120 Regionaal Invoer: $-
Invoer in cache: $-
Uitvoer: $-
N.v.t.
GPT-4o-2024-08-06 Global Invoer: $-
Invoer in cache: $-
Uitvoer: $-
Invoer: $-
Uitvoer: $-
GPT-4o-2024-08-06 VS/EU - Gegevenszones Invoer: $-
Invoer in cache: $-
Uitvoer: $-
Invoer: $-
Uitvoer: $-
GPT-4o-2024-08-06 Regionaal Invoer: $-
Invoer in cache: $-
Uitvoer: $-
N.v.t.
GPT-4o-2024-0513 Globaal Invoer: $-
Uitvoer: $-
Invoer: $-
Uitvoer: $-
GPT-4o-2024-0513 VS/EU - Gegevenszones Invoer: $-
Uitvoer: $-
N.v.t.
GPT-4o-2024-0513 Regionaal Invoer: $-
Uitvoer: $-
N.v.t.

Plannen met de -prijscalculator

GPT-4o-mini

GPT-4o mini is het meest rendabele kleine model en heeft beeldmogelijkheden. Het model heeft een context van 128.000 en een kennis-cutoff van oktober 2023.

Model Prijzen (1 miljoen tokens) Prijzen met Batch API (1 miljoen tokens)
GPT-4o-mini-0718-Globaal Invoer: $-
Invoer in cache: $-
Uitvoer: $-
Invoer: $-
Uitvoer: $-
GPT-4o-mini-0718 US/EU-gegevenszones – Invoer: $-
Invoer in cache: $-
Uitvoer: $-
Invoer: $-
Uitvoer: $-
GPT-4o-mini-0718-Regionaal Invoer: $-
Invoer in cache: $-
Uitvoer: $-
N.v.t.

Plannen met de -prijscalculator

Ingericht

U kunt doorvoer toewijzen en beheren voor implementaties, zodat voorspelbare prestaties en stabiele capaciteit worden gegarandeerd. Er wordt een uurtarief per model in rekening gebracht, ongeacht het gebruik, maar u kunt ook extra besparingen realiseren via maandelijkse en jaarlijkse reserveringen. Ontdek hoe u uw regionale implementaties en ingerichte reserveringen kunt overdragen naar globale en gegevenszones op deze Pagina Leren.

Model Minimum aantal PTU's PTU-prijzen per uur Prijzen voor maandelijkse PTU-reserveringen Prijzen voor jaarlijkse PTU-reserveringen
GPT-4.1 Globaal 15 $- $- $-
GPT-4.1 Gegevenszones 15 $- $- $-
GPT-4.1 Regionaal 50 $- $- $-
GPT-4.1-mini Globaal 15 $- $- $-
GPT-4.1-mini Gegevenszones VS/EU 15 $- $- $-
GPT-4.1-mini Regionaal 25 $- $- $-
GPT-4.1-nano Globaal 15 $- $- $-
GPT-4.1-nano Gegevenszones VS/EU 15 $- $- $-
GPT-4.1-nano Regionaal 25 $- $- $-
o3-mini Global 15 $- $- $-
o3-mini US/EU Data Zones 15 $- $- $-
o3-mini Regional 25 $- $- $-
o3 Globaal 15 $- $- $-
o3 Gegevenszones VS/EU 15 $- $- $-
o3 Regionaal 50 $- $- $-
o4-mini Globaal 15 $- $- $-
o4-mini Gegevenszones VS/EU 15 $- $- $-
o4-mini Regionaal 25 $- $- $-
GPT-4o Global 15 $- $- $-
GPT-4o US/EU-gegevenszones 15 $- $- $-
GPT-4o regionaal 50 $- $- $-
Fine-Tuned GPT-4o-Regional 50 $- $- $-
GPT-4o Mini Global 15 $- $- $-
GPT-4o Mini US/EU-gegevenszones 15 $- $- $-
GPT-4o Mini regionaal 25 $- $- $-
Fine-Tuned GPT-4o-Mini Regional 25 $- $- $-

Plannen met de -prijscalculator

Basismodellen

Modellen Gebruik per 1000 tokens
Babbage-002 $-
Davinci-002 $-

Modellen afstemmen

Model Prijzen
o4-mini (Versterkingsafstemming) Regionaal Invoer: $-/1M-tokens
Uitvoer: $-/1M-tokens
Training: $-/uur
Hosting: $-/uur

Grader-invoer:
o4-mini: $-/1M-tokens
4.1-mini: $-/1M-tokens
4.1: $-/1M-tokens
4.1-nano: $-/1M-tokens
o3: $-/1M-tokens

Invoer in cache van grader:
o4-mini: $-/1M-tokens
4.1-mini: $-/1M-tokens
4.1: $-/1M-tokens
4.1-nano: $-/1M-tokens
o3: $-/1M-tokens

Grader-uitvoer:
o4-mini: $-/1M-tokens
4.1-mini: $-/1M-tokens
4.1: $-/1M-tokens
4.1-nano: $-/1M-tokens
o3: $-/1M-tokens
Wereldwijd Invoer: $-/1M-tokens
Uitvoer: $-/1M-tokens
Training: $-/uur
Hosting: $-/uur

Grader-invoer:
o4-mini: $-/1M-tokens
4.1-mini: $-/1M-tokens
4.1: $-/1M-tokens
4.1-nano: $-/1M-tokens
o3: $-/1M-tokens

Invoer in cache van grader:
o4-mini: $-/1M-tokens
4.1-mini: $-/1M-tokens
4.1: $-/1M-tokens
4.1-nano: $-/1M-tokens
o3: $-/1M-tokens

Grader-uitvoer:
o4-mini: $-/1M-tokens
4.1-mini: $-/1M-tokens
4.1: $-/1M-tokens
4.1-nano: $-/1M-tokens
o3: $-/1M-tokens
GPT-4.1 Regionaal Invoer: $-/1M-tokens
Invoer in cache: $-/1M-tokens
Uitvoer: $-/1M-tokens
Training: $-/1M-tokens
Hosting: $-/uur
Wereldwijd Invoer: $-/1M-tokens
Invoer in cache: $-/1M-tokens
Uitvoer: $-/1M-tokens
Training: $-/1M-tokens
Hosting: $-/uur
Developer Invoer: $-/1M-tokens
Invoer in cache: $-/1M-tokens
Uitvoer: $-/1M-tokens
GPT-4.1-mini Regionaal Invoer: $-/1M-tokens
Invoer in cache: $-/1M-tokens
Uitvoer: $-/1M-tokens
Training: $-/1M-tokens
Hosting: $-/uur
Wereldwijd Invoer: $-/1M-tokens
Invoer in cache: $-/1M-tokens
Uitvoer: $-/1M-tokens
Training: $-/1M-tokens
Hosting: $-/uur
Developer Invoer: $-/1M-tokens
Invoer in cache: $-/1M-tokens
Uitvoer: $-/1M-tokens
GPT-4.1-nano Regionaal Invoer: $-/1M-tokens
Invoer in cache: $-/1M-tokens
Uitvoer: $-/1M-tokens
Training: $-/1M-tokens
Hosting: $-/uur
Wereldwijd Invoer: $-/1M-tokens
Invoer in cache: $-/1M-tokens
Uitvoer: $-/1M-tokens
Training: $-/1M-tokens
Hosting: $-/uur
Developer Invoer: $-/1M-tokens
Invoer in cache: $-/1M-tokens
Uitvoer: $-/1M-tokens
GPT-4o-2024-08-06 Regionaal Invoer: $-/1M-tokens
Invoer in cache: $-/1M-tokens
Uitvoer: $-/1M-tokens
Training: $-/1M-tokens
Hosting: $-/uur
Wereldwijd Invoer: $-/1M-tokens
Invoer in cache: $-/1M-tokens
Uitvoer: $-/1M-tokens
Training: regionaal gebruiken
Hosting: $-/uur
GPT-4o-mini Regionaal Invoer: $-/1M-tokens
Invoer in cache: $-/1M-tokens
Uitvoer: $-/1M-tokens
Training: $-/1M-tokens
Hosting: $-/uur
Wereldwijd Invoer: $-/1M-tokens
Invoer in cache: $-/1M-tokens
Uitvoer: $-/1M-tokens
Training: regionaal gebruiken
Hosting: $-/uur
GPT-3.5-Turbo (16K) Regionaal Invoer: $-/1M-tokens
Uitvoer: $-/1M-tokens
Training: $-/1M-tokens
Hosting: $-/uur

Afbeeldingsmodellen

Modellen Kwaliteit Resolutie Prijs (per 100 afbeeldingen)
Dall-E-3 Standaard 1024 * 1024 $-
Standaard 1024 * 1792,
1792 * 1024
$-
Dall-E-3 HD 1024 * 1024 $-
HD 1024 * 1792,
1792 * 1024
$-
Dall-E-2 Standaard 1024 * 1024 $-

Modellen insluiten

Modellen Per 1000 tokens
Ada $-
tekst-insluiten-3-groot $-
tekst-insluiten-3-klein $-

Spraakmodellen

Modellen Prijs
Whisper $-/uur
TTS (tekst-naar-spraak) $-/1M tekens
TTS HD $-/1M tekens

Verouderde taalmodellen

Modellen Context Invoer (per 1 miljoen tokens) Uitvoer (per 1 miljoen tokens)
GPT-3.5-Turbo-0301 4K $- $-
GPT-3.5-Turbo-0613 4K $- $-
GPT-3.5-Turbo-0613 16K $- $-
GPT-3.5-Turbo-1106 16K $- $-
GPT-3.5-Turbo-0125 16K $- $-
GPT-3.5-Turbo-Instruct 4K $- $-
GPT-4-Turbo 128K $- $-
GPT-4-Turbo-Vision 128K $- $-
GPT-4 8K $- $-
GPT-4 32K $- $-

Azure-prijzen en -aankoopopties

Neem rechtstreeks contact met ons op

Bekijk een overzicht van Azure-prijzen. Krijg inzicht in prijscategorieën voor uw cloudoplossing, leer meer over kostenoptimalisatie en vraag een aangepast voorstel aan.

Praat met een verkoopspecialist

Aanschafmethoden bekijken

Koop Azure-services via de Azure-website, uw Microsoft-vertegenwoordiger of een Azure-partner.

Verken uw opties

Aanvullende bronnen

Azure OpenAI Service

Meer informatie over functies en mogelijkheden van Azure OpenAI Service.

Prijscalculator

Bereken de verwachte maandelijkse kosten voor het gebruik van een willekeurige combinatie van Azure-producten.

SLA

De Service Level Agreement voor Azure OpenAI Service bekijken.

Documentatie

Gebruik technische zelfstudies, video's en andere Azure OpenAI Service-bronnen.

  • Azure OpenAI Service biedt prijzen op basis van zowel Betalen per gebruik als op basis van ingerichte doorvoereenheden (PTU's). Met Betalen per gebruik kunt u betalen voor de resources die u daadwerkelijk gebruikt, waardoor dit een flexibel model is voor variabele workloads. PTU's bieden een voorspelbaar prijsmodel waarbij u een specifieke hoeveelheid verwerkingscapaciteit voor modellen reserveert en implementeert. Dit model is ideaal voor workloads met consistente of voorspelbare gebruikspatronen, die stabiliteit en kostenbeheer bieden.
  • Lees PTU-documentatie of neem contact op met onze verkoopspecialistvoor meer informatie over PTU's en Azure OpenAI-prijzen.

Praat met een verkoopspecialist voor een overzicht van de Azure-prijzen. Krijg inzicht in de prijzen voor uw cloudoplossing.

Maak gratis gebruik van cloudservices en $200 tegoed om Azure gedurende 30 dagen te kunnen verkennen.

Toevoegen aan schatting. Druk op 'v' om weer te geven in Calculator
Kunnen we u helpen?