Overzicht van prijzen van Azure OpenAI Service
To help customers in the journey, we offer pricing and cost management solutions to meet your needs. including:
- Standard (On-Demand): Pay-as-you-go for input and output tokens.
- Provisioned (PTUs): Allocate throughput with predictable costs, with monthly and annual reservations available to reduce overall spend.
- Batch API: Language models are also now available in the Batch API for global deployments and three regions, that returns completions within 24 hours for a 50% discount on Global Standard Pricing.
- Global Deployment – Global SKU
- Data Zone Deployment – Geographic based (EU or US)
- Regional Deployment – Local Region (up to 27 regions)
Prijsopties verkennen
Pas filters toe om de prijsopties aan te passen aan uw behoeften.
De prijzen zijn slechts schattingen en zijn niet bedoeld als werkelijke prijsopgaven. De werkelijke prijzen kunnen variëren afhankelijk van het type overeenkomst dat is afgesloten met Microsoft, de aankoopdatum en de valutakoers. De prijzen worden berekend op basis van Amerikaanse dollars en worden geconverteerd op basis van de slotspot-tarieven in Londen die zijn vastgelegd in de twee werkdagen voor de laatste werkdag van de vorige maand. Als de twee werkdagen voor het einde van de maand vallen op een feestdag in de voornaamste markten, is de dag direct voorafgaande aan de twee werkdagen de dag van de tariefvaststelling. Dit tarief is van toepassing op alle transacties gedurende de aankomende maand. Meld u zich aan bij de Azure-prijscalculator voor prijzen op basis van uw huidige programma/aanbieding bij Microsoft. Neemt u contact op met een Azure-verkoopspecialist voor meer informatie over prijzen of om een prijsopgave aan te vragen. Zie veelgestelde vragen over Azure-prijzen.
Amerikaanse overheidsinstanties komen in aanmerking om Azure Government-services van een LSP aan te schaffen zonder betaling vooraf of rechtstreeks met een onlineabonnement met betalen per gebruik.
Belangrijk: De prijs in R$ geldt slechts als referentie; dit is een internationale transactie en de uiteindelijke prijs is onderhevig aan wisselkoersverschillen en de toepassing van IOF-belastingen. Er wordt geen eNF uitgegeven.
Amerikaanse overheidsinstanties komen in aanmerking om Azure Government-services van een LSP aan te schaffen zonder betaling vooraf of rechtstreeks met een onlineabonnement met betalen per gebruik.
Belangrijk: De prijs in R$ geldt slechts als referentie; dit is een internationale transactie en de uiteindelijke prijs is onderhevig aan wisselkoersverschillen en de toepassing van IOF-belastingen. Er wordt geen eNF uitgegeven.
GPT-4.5
GPT-4.5-preview is the latest general purpose model with deep world knowledge and better understanding of user intent that makes it good at creative tasks and agentic planning. The model has 128K context and an October 2023 knowledge cutoff.
Model | Prijzen (1 miljoen tokens) | Prijzen met Batch API (1 miljoen tokens) |
---|---|---|
GPT-4.5-Preview-2025-02-27 Global |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
N.v.t. |
o1
o1 is de nieuwe reeks redeneringsmodellen voor complexe taken. Het model heeft een context van 200.000 en een kennis-cutoff van oktober 2023.
Model | Prijzen (1 miljoen tokens) | Prijzen met Batch API (1 miljoen tokens) |
---|---|---|
o1 17-12-2024 wereldwijd |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
N.v.t. |
o1 17-12-2024 VS/EU-gegevenszones |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
N.v.t. |
o1 17-12-2024 regionaal |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
N.v.t. |
o1 preview 12-09-2024 wereldwijd |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
N.v.t. |
o1 preview 12-09-2024 VS/EU-gegevenszones |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
N.v.t. |
o1 preview 12-09-2024 regionaal |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
N.v.t. |
Plannen met de -prijscalculator
o3 mini
De o3 mini is de bijgewerkte versie van het o1-minimodel. De o3 mini is een snelle, kosteneffectief redeneermodel dat is afgestemd op gebruikssituaties voor codering, wiskunde en wetenschap.
Het o3 mini-model beschikt nu over een uitgebreid contextinvoervenster van 200K tokens en een maximale uitvoer van 100K tokens, wat voldoende ruimte biedt voor complexe en gedetailleerde antwoorden. Het o1 mini-model heeft een contextinvoer van 128K. Zowel de o3- als de o1-modellen hebben een kennisafkapdatum van oktober 2023.
Model | Prijzen (1 miljoen tokens) | Prijzen met Batch API (1 miljoen tokens) |
---|---|---|
o3 mini 31-01-2025 wereldwijd |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
Invoer: $- Uitvoer: $- |
o3 mini 31-01-2025 VS/EU-gegevenszones |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
Invoer: $- Uitvoer: $- |
o3 mini 31-01-2025 regionaal |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
N.v.t. |
o1 mini 12-09-2024 wereldwijd |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
N.v.t. |
o1-mini 12-09-2024 VS/EU-gegevenszones |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
N.v.t. |
o1 mini 12-09-2024 regionaal |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
N.v.t. |
Plannen met de -prijscalculator
Realtime-API
De GPT-4o-Realtime-Preview wordt aanbevolen in de Realtime-API en biedt ondersteuning voor meertalige spraak-naar-spraakmogelijkheden. Geoptimaliseerd voor realtime gesprekken met lage latentie, maakt het natuurlijke interacties mogelijk met minimale vertraging, ideaal voor chatbots en conversationele AI. GPT-4o is de uitgebreide, krachtigere versie die is ontworpen voor complexe taken, terwijl GPT-4o Mini een kleinere, betaalbare optie is die ideaal is voor eenvoudigere toepassingen waarbij kostenefficiëntie en snelheid prioriteiten zijn.
Model | Prijzen (1 miljoen tokens) |
---|---|
GPT-4o-Realtime-Preview-2024-12-17-Globaal |
Tekst Invoer: $- Invoer in cache: $- Uitvoer: $- Audio Invoer: $- Invoer in cache: $- Uitvoer: $- |
GPT-4o-Realtime-Preview-2024-12-17-US/EU – Gegevenszones |
Tekst Invoer: $- Invoer in cache: $- Uitvoer: $- Audio Invoer: $- Invoer in cache: $- Uitvoer: $- |
GPT-4o-Realtime-Preview-2024-12-17-Regionaal |
Tekst Invoer: $- Invoer in cache: $- Uitvoer: $- Audio Invoer: $- Invoer in cache: $- Uitvoer: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Globaal |
Tekst Invoer: $- Invoer in cache: $- Uitvoer: $- Audio Invoer: $- Invoer in cache: $- Uitvoer: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU – Gegevenszones |
Tekst Invoer: $- Invoer in cache: $- Uitvoer: $- Audio Invoer: $- Invoer in cache: $- Uitvoer: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regionaal |
Tekst Invoer: $- Invoer in cache: $- Uitvoer: $- Audio Invoer: $- Invoer in cache: $- Uitvoer: $- |
GPT-4o-Realtime-Preview-2024-10-01-Globaal |
Tekst Invoer: $- Invoer in cache: $- Uitvoer: $- Audio Invoer: $- Invoer in cache: $- Uitvoer: $- |
GPT-4o-Realtime-Preview-2024-10-01-US/EU – Gegevenszones |
Tekst Invoer: $- Invoer in cache: $- Uitvoer: $- Audio Invoer: $- Invoer in cache: $- Uitvoer: $- |
GPT-4o-Realtime-Preview-2024-10-01-Regionaal |
Tekst Invoer: $- Invoer in cache: $- Uitvoer: $- Audio Invoer: $- Invoer in cache: $- Uitvoer: $- |
API voor chatvoltooiingen
Het GPT 4o-Audio-Preview-model, dat is opgenomen in de API voor chatvoltooiingen, verwerkt en genereert audio-inhoud. Het ondersteunt geavanceerde functies zoals spraakherkenning en audiosynthese, ideaal voor asynchrone spraakinteracties en sentimentanalyse. GPT-4o is de uitgebreide, krachtigere versie die is ontworpen voor complexe taken, terwijl GPT-4o Mini een kleinere, betaalbare optie is die ideaal is voor eenvoudigere toepassingen waarbij kostenefficiëntie en snelheid prioriteiten zijn.
Model | Prijzen (1 miljoen tokens) |
---|---|
GPT-4o-Audio-Preview-2024-12-17-Globaal |
Tekst Invoer: $- Uitvoer: $- Audio Invoer: $- Uitvoer: $- |
GPT-4o-Audio-Preview-2024-12-17-US/EU – Gegevenszones |
Tekst Invoer: $- Uitvoer: $- Audio Invoer: $- Uitvoer: $- |
GPT-4o-Audio-Preview-2024-12-17-Regionaal |
Tekst Invoer: $- Uitvoer: $- Audio Invoer: $- Uitvoer: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Globaal |
Tekst Invoer: $- Uitvoer: $- Audio Invoer: $- Uitvoer: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU – Gegevenszones |
Tekst Invoer: $- Uitvoer: $- Audio Invoer: $- Uitvoer: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Regionaal |
Tekst Invoer: $- Uitvoer: $- Audio Invoer: $- Uitvoer: $- |
GPT-4o
GPT-4o is het meest geavanceerde multimodaal model dat sneller en voordeliger is dan GPT-4 Turbo met sterkere zichtmogelijkheden. Het model heeft een context van 128.000 en een kennis-cutoff van oktober 2023.
Model | Prijzen (1 miljoen tokens) | Prijzen met Batch API (1 miljoen tokens) |
---|---|---|
GPT-4o-2024-1120 Globaal |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
Invoer: $- Uitvoer: $- |
GPT-4o-2024-1120 VS/EU - Gegevenszones |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
Invoer: $- Uitvoer: $- |
GPT-4o-2024-1120 Regionaal |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
N.v.t. |
GPT-4o-2024-08-06 Global |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
Invoer: $- Uitvoer: $- |
GPT-4o-2024-08-06 VS/EU - Gegevenszones |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
Invoer: $- Uitvoer: $- |
GPT-4o-2024-08-06 Regionaal |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
N.v.t. |
GPT-4o-2024-0513 Globaal |
Invoer: $- Uitvoer: $- |
Invoer: $- Uitvoer: $- |
GPT-4o-2024-0513 VS/EU - Gegevenszones |
Invoer: $- Uitvoer: $- |
N.v.t. |
GPT-4o-2024-0513 Regionaal |
Invoer: $- Uitvoer: $- |
N.v.t. |
Plannen met de -prijscalculator
GPT-4o-mini
GPT-4o mini is het meest rendabele kleine model en heeft beeldmogelijkheden. Het model heeft een context van 128.000 en een kennis-cutoff van oktober 2023.
Model | Prijzen (1 miljoen tokens) | Prijzen met Batch API (1 miljoen tokens) |
---|---|---|
GPT-4o-mini-0718-Globaal |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
Invoer: $- Uitvoer: $- |
GPT-4o-mini-0718 US/EU-gegevenszones – |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
Invoer: $- Uitvoer: $- |
GPT-4o-mini-0718-Regionaal |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
N.v.t. |
Plannen met de -prijscalculator
Ingericht
U kunt doorvoer toewijzen en beheren voor implementaties, zodat voorspelbare prestaties en stabiele capaciteit worden gegarandeerd. Er wordt een uurtarief per model in rekening gebracht, ongeacht het gebruik, maar u kunt ook extra besparingen realiseren via maandelijkse en jaarlijkse reserveringen. Ontdek hoe u uw regionale implementaties en ingerichte reserveringen kunt overdragen naar globale en gegevenszones op deze Pagina Leren.
Model | Minimum aantal PTU's | PTU-prijzen per uur | Prijzen voor maandelijkse PTU-reserveringen | Prijzen voor jaarlijkse PTU-reserveringen |
---|---|---|---|---|
GPT-4o Global | 15 | $- | $- | $- |
GPT-4o US/EU-gegevenszones | 15 | $- | $- | $- |
GPT-4o regionaal | 50 | $- | $- | $- |
Fine-Tuned GPT-4o-Regional | 50 | $- | $- | $- |
GPT-4o Mini Global | 15 | $- | $- | $- |
GPT-4o Mini US/EU-gegevenszones | 15 | $- | $- | $- |
GPT-4o Mini regionaal | 25 | $- | $- | $- |
Fine-Tuned GPT-4o-Mini Regional | 25 | $- | $- | $- |
Plannen met de -prijscalculator
Basismodellen
Modellen | Gebruik per 1000 tokens |
---|---|
Babbage-002 | $- |
Davinci-002 | $- |
Modellen afstemmen
Model | Prijzen | |
---|---|---|
GPT-4o-2024-08-06 | Regionaal |
Invoer: $-/1M-tokens Invoer in cache: $-/1M-tokens Uitvoer: $-/1M-tokens Training: $-/1M-tokens Hosting: $-/uur |
Wereldwijd |
Invoer: $-/1M-tokens Invoer in cache: $-/1M-tokens Uitvoer: $-/1M-tokens Training: regionaal gebruiken Hosting: $-/uur |
|
GPT-4o-mini | Regionaal |
Invoer: $-/1M-tokens Invoer in cache: $-/1M-tokens Uitvoer: $-/1M-tokens Training: $-/1M-tokens Hosting: $-/uur |
Wereldwijd |
Invoer: $-/1M-tokens Invoer in cache: $-/1M-tokens Uitvoer: $-/1M-tokens Training: regionaal gebruiken Hosting: $-/uur |
|
GPT-4-0613 (8K) | Regionaal |
Invoer: $-/1M-tokens Uitvoer: $-/1M-tokens Training: $-/1M-tokens Hosting: $-/uur |
GPT-3.5-Turbo (16K) | Regionaal |
Invoer: $-/1M-tokens Uitvoer: $-/1M-tokens Training: $-/1M-tokens Hosting: $-/uur |
GPT-3.5-Turbo (4K) | Regionaal |
Invoer: $-/1M-tokens Uitvoer: $-/1M-tokens Training: $-/1M-tokens Hosting: $-/uur |
Babbage-002 |
Invoer: $-/1M-tokens Uitvoer: $-/1M-tokens Training: $-/1M-tokens Hosting: $-/uur |
|
Davinci-002 |
Invoer: $-/1M-tokens Uitvoer: $-/1M-tokens Training: $-/1M-tokens Hosting: $-/uur |
Assistent-API
Met de Assistent-API en de bijbehorende hulpprogramma's kunnen ontwikkelaars eenvoudig AI-assistenten bouwen in hun toepassingen.
De tokens die worden gebruikt voor de Assistent-API, worden gefactureerd volgens de invoer-/uitvoersnelheden per token van het gekozen taalmodel die worden gebruikt voor elke assistent. Daarnaast brengen we de volgende kosten in rekening voor het gebruik van hulpprogramma's:
Hulpprogramma | Invoer |
---|---|
Bestanden zoeken* | $-/GB vectoropslag per dag (1 GB gratis) |
Codetolk** | $-/sessie |
*GB verwijst naar binaire gigabytes, waarbij 1 GB gelijk is aan 2^30 bytes.
**Als uw assistent codetolk tegelijkertijd in twee verschillende threads aanroept, worden er twee codetolksessies gemaakt (2 * $-). Elke sessie is standaard één uur actief, wat betekent dat u deze kosten slechts één keer betaalt als uw gebruiker maximaal één uur instructies blijft geven aan codetolk in dezelfde thread.
De deductiekosten (invoer en uitvoer) variëren op basis van het GPT-model gebruikt met elke assistent. Als uw assistent tegelijkertijd Codetolk aanroept in twee verschillende threads, worden er twee Codetolk-sessies (2 * $-) gemaakt. Elke sessie is standaard voor één uur actief, wat betekent dat de prijs geldt voor het geven van instructies aan Codetolk in dezelfde thread gedurende één uur.
Afbeeldingsmodellen
Modellen | Kwaliteit | Resolutie | Prijs (per 100 afbeeldingen) |
---|---|---|---|
Dall-E-3 | Standaard | 1024 * 1024 | $- |
Standaard | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-3 | HD | 1024 * 1024 | $- |
HD | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-2 | Standaard | 1024 * 1024 | $- |
Modellen insluiten
Modellen | Per 1000 tokens |
---|---|
Ada | $- |
tekst-insluiten-3-groot | $- |
tekst-insluiten-3-klein | $- |
Spraakmodellen
Modellen | Prijs |
---|---|
Whisper | $-/uur |
TTS (tekst-naar-spraak) | $-/1M tekens |
TTS HD | $-/1M tekens |
Verouderde taalmodellen
Modellen | Context | Invoer (per 1 miljoen tokens) | Uitvoer (per 1 miljoen tokens) |
---|---|---|---|
GPT-3.5-Turbo-0301 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 16K | $- | $- |
GPT-3.5-Turbo-1106 | 16K | $- | $- |
GPT-3.5-Turbo-0125 | 16K | $- | $- |
GPT-3.5-Turbo-Instruct | 4K | $- | $- |
GPT-4-Turbo | 128K | $- | $- |
GPT-4-Turbo-Vision | 128K | $- | $- |
GPT-4 | 8K | $- | $- |
GPT-4 | 32K | $- | $- |
Azure-prijzen en -aankoopopties

Neem rechtstreeks contact met ons op
Bekijk een overzicht van Azure-prijzen. Krijg inzicht in prijscategorieën voor uw cloudoplossing, leer meer over kostenoptimalisatie en vraag een aangepast voorstel aan.
Praat met een verkoopspecialistAanschafmethoden bekijken
Koop Azure-services via de Azure-website, uw Microsoft-vertegenwoordiger of een Azure-partner.
Verken uw optiesAanvullende bronnen
Azure OpenAI Service
Meer informatie over functies en mogelijkheden van Azure OpenAI Service.
Prijscalculator
Bereken de verwachte maandelijkse kosten voor het gebruik van een willekeurige combinatie van Azure-producten.
SLA
De Service Level Agreement voor Azure OpenAI Service bekijken.
Documentatie
Gebruik technische zelfstudies, video's en andere Azure OpenAI Service-bronnen.
Veelgestelde vragen
-
Azure OpenAI Service biedt prijzen op basis van zowel Betalen per gebruik als op basis van ingerichte doorvoereenheden (PTU's). Met Betalen per gebruik kunt u betalen voor de resources die u daadwerkelijk gebruikt, waardoor dit een flexibel model is voor variabele workloads. PTU's bieden een voorspelbaar prijsmodel waarbij u een specifieke hoeveelheid verwerkingscapaciteit voor modellen reserveert en implementeert. Dit model is ideaal voor workloads met consistente of voorspelbare gebruikspatronen, die stabiliteit en kostenbeheer bieden.
-
Lees PTU-documentatie of neem contact op met onze verkoopspecialistvoor meer informatie over PTU's en Azure OpenAI-prijzen.
Praat met een verkoopspecialist voor een overzicht van de Azure-prijzen. Krijg inzicht in de prijzen voor uw cloudoplossing.
Maak gratis gebruik van cloudservices en $200 tegoed om Azure gedurende 30 dagen te kunnen verkennen.