Overzicht van prijzen van Azure OpenAI Service
Om klanten te helpen bij het traject, bieden we oplossingen voor prijs- en kostenbeheer om aan uw behoeften te voldoen. Inclusief:
- Standaard (op aanvraag): betalen per gebruik voor invoer- en uitvoertokens.
- Ingericht (PTU's): Doorvoer toewijzen met voorspelbare kosten, waarbij maandelijkse en jaarlijkse reserveringen beschikbaar zijn om de totale uitgaven te verminderen.
- Batch-API: Taalmodellen zijn nu ook beschikbaar in de Batch-API voor globale implementaties en drie regio's, waarmee binnen 24 uur voltooiingen worden geretourneerd met een korting van 50% op de prijzen voor Global Standard.
- Globale implementatie – globale SKU
- Datazone-implementatie – geografisch gebaseerd (EU of VS)
- Regionale implementatie – Lokale regio (tot 27 regio's)
Prijsopties verkennen
Pas filters toe om de prijsopties aan te passen aan uw behoeften.
De prijzen zijn slechts schattingen en zijn niet bedoeld als werkelijke prijsopgaven. De werkelijke prijzen kunnen variëren afhankelijk van het type overeenkomst dat is afgesloten met Microsoft, de aankoopdatum en de valutakoers. De prijzen worden berekend op basis van Amerikaanse dollars en worden geconverteerd op basis van de slotspot-tarieven in Londen die zijn vastgelegd in de twee werkdagen voor de laatste werkdag van de vorige maand. Als de twee werkdagen voor het einde van de maand vallen op een feestdag in de voornaamste markten, is de dag direct voorafgaande aan de twee werkdagen de dag van de tariefvaststelling. Dit tarief is van toepassing op alle transacties gedurende de aankomende maand. Meld u zich aan bij de Azure-prijscalculator voor prijzen op basis van uw huidige programma/aanbieding bij Microsoft. Neemt u contact op met een Azure-verkoopspecialist voor meer informatie over prijzen of om een prijsopgave aan te vragen. Zie veelgestelde vragen over Azure-prijzen.
Amerikaanse overheidsinstanties komen in aanmerking om Azure Government-services van een LSP aan te schaffen zonder betaling vooraf of rechtstreeks met een onlineabonnement met betalen per gebruik.
Belangrijk: De prijs in R$ geldt slechts als referentie; dit is een internationale transactie en de uiteindelijke prijs is onderhevig aan wisselkoersverschillen en de toepassing van IOF-belastingen. Er wordt geen eNF uitgegeven.
Amerikaanse overheidsinstanties komen in aanmerking om Azure Government-services van een LSP aan te schaffen zonder betaling vooraf of rechtstreeks met een onlineabonnement met betalen per gebruik.
Belangrijk: De prijs in R$ geldt slechts als referentie; dit is een internationale transactie en de uiteindelijke prijs is onderhevig aan wisselkoersverschillen en de toepassing van IOF-belastingen. Er wordt geen eNF uitgegeven.
GPT-5 series
Model | Prijzen (1 miljoen tokens) |
---|---|
GPT-5 2025-08-07 Global |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
GPT-5 Data Zone |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
GPT-5-mini Global |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
GPT-5-mini Data Zone |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
GPT-5-nano Global |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
GPT-5-nano Data Zone |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
GPT-5 chat Global |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
Deep Research
Deep Research enables developers and enterprises to automate complex research tasks with structured, citation-rich answers. It is suitable for building customer support bots, internal knowledge assistants, or market analysis tools. Deep Research delivers transparent, auditable insights grounded in real-time web data. Search context tokens are charged input token prices for the model being used. You’ll separately incur charges for Grounding with Bing Search and the base GPT model being used for clarifying questions.
Model | Prijzen |
---|---|
o3-deep research Global |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
o3
o3 is een krachtig redeneermodel uit de o-reeks van redeneermodellen, dat de grenzen verlegt op het gebied van codering, wiskunde, wetenschap en visuele waarneming. Het excelleert in complexe vragen die een meervoudige analyse vereisen en presteert sterk in visuele taken zoals het analyseren van afbeeldingen, grafieken en diagrammen. Het model heeft een contextvenster van 200.000 tokens en een kennisafkap van juni 2024.
Model | Prijzen (1 miljoen tokens) | Prijzen met Batch API (1 miljoen tokens) |
---|---|---|
o3 2025-04-16 Wereldwijd |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
Invoer: $- Uitvoer: $- |
o3 2025-04-16 Gegevenszone |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
Invoer: $- Uitvoer: $- |
o3 2025-04-16 Regionaal |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
N.v.t. |
o4-mini
o4-mini is een compact, efficiënt en kosteneffectief redeneermodel uit de o-serie van OpenAI. Het excelleert in wiskunde, coderen en visuele taken. Het model heeft een contextvenster van 200.000 tokens en een kennisafkap van juni 2024.
Model | Prijzen (1 miljoen tokens) | Prijzen met Batch API (1 miljoen tokens) |
---|---|---|
o4-mini 2025-04-16 Wereldwijd |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
Invoer: $- Uitvoer: $- |
o4-mini 2025-04-16 Gegevenszone |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
Invoer: $- Uitvoer: $- |
o4-mini 2025-04-16 Regionaal |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
N.v.t. |
GPT-4.1-serie
GPT-4.1-serie is een zeer geavanceerd algemeen model met uitgebreide wereldkennis en een verbeterd vermogen om de gebruikersintentie te begrijpen, waardoor het bijzonder geschikt is voor creatieve taken en agentische planning. De serie heeft een contextvenster van 1 miljoen tokens en een kennisafkap van juni 2024.
Model | Prijzen (1 miljoen tokens) | Prijzen met Batch API (1 miljoen tokens) |
---|---|---|
GPT-4.1-2025-04-14 Wereldwijd |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
Invoer: $- Uitvoer: $- |
GPT-4.1-2025-04-14 Gegevenszone |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
Invoer: $- Uitvoer: $- |
GPT-4.1-2025-04-14 Regionaal |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
N.v.t. |
GPT-4.1-mini-2025-04-14 Wereldwijd |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
Invoer: $- Uitvoer: $- |
GPT-4.1-mini-2025-04-14 Gegevenszone |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
Invoer: $- Uitvoer: $- |
GPT-4.1-mini-2025-04-14 Regionaal |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
N.v.t. |
GPT-4.1-nano-2025-04-14 Wereldwijd |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
Invoer: $- Uitvoer: $- |
GPT-4.1-nano-2025-04-14 Gegevenszone |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
Invoer: $- Uitvoer: $- |
GPT-4.1-nano-2025-04-14 Regionaal |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
N.v.t. |
Sora in Azure OpenAI
Sora is een multimodaal generatief AI-model dat nu beschikbaar is in Azure AI Foundry. Het is ontworpen om creatieve teams te helpen ideeën tot leven te brengen via naadloze API-first integratie. Het is gebouwd op basis van de infrastructuur op bedrijfsniveau van Azure en biedt een veilige, schaalbare implementatie voor het omzetten van concepten in visuele inhoud van hoge kwaliteit.
Prijs per seconde | 1-5s | 6-10s | 11-15s | 16-20s |
---|---|---|---|---|
480 vierkant | $- | $- | $- | $- |
480p | $- | $- | $- | $- |
720 vierkant | $- | $- | $- | $- |
720p | $- | $- | $- | $- |
1080 vierkant | $- | $- | $- | $- |
1080p | $- | $- | $- | $- |
GPT-Image-1
GPT-image-1 verbetert DALL·E met betere instructies, nauwkeurige tekstweergave en ondersteuning voor het invoeren en bewerken van afbeeldingen. Het model is geprijsd per token, met verschillende prijzen voor tekst- en afbeeldingstokens.
Model | Prijzen (1 miljoen tokens) | Prijzen met Batch API (1 miljoen tokens) |
---|---|---|
GPT-Image-1 Global |
Invoertekst: $- Invoerafbeelding: $- Uitvoerafbeelding: $- |
N.v.t. |
GPT-Image-1 Regional |
Invoertekst: $- Invoerafbeelding: $- Uitvoerafbeelding: $- |
N.v.t. |
GPT-Image-1 Data Zone |
Invoertekst: $- Invoerafbeelding: $- Uitvoerafbeelding: $- |
N.v.t. |
GPT-4.5
GPT-4.5-preview is het nieuwste model voor algemeen gebruik met diepgaande wereldkennis en een beter begrip van de gebruikersintentie, waardoor het goed presteert bij creatieve taken en agentieve planning. Het model heeft een context van 128.000 en een kennis-cutoff van oktober 2023.
Model | Prijzen (1 miljoen tokens) | Prijzen met Batch API (1 miljoen tokens) |
---|---|---|
GPT-4.5-Preview-2025-02-27 Global |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
N.v.t. |
o1
o1 is de nieuwe reeks redeneringsmodellen voor complexe taken. Het model heeft een context van 200.000 en een kennis-cutoff van oktober 2023.
Model | Prijzen (1 miljoen tokens) | Prijzen met Batch API (1 miljoen tokens) |
---|---|---|
o1 17-12-2024 wereldwijd |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
N.v.t. |
o1 17-12-2024 VS/EU-gegevenszones |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
N.v.t. |
o1 17-12-2024 regionaal |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
N.v.t. |
o1 preview 12-09-2024 wereldwijd |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
N.v.t. |
o1 preview 12-09-2024 VS/EU-gegevenszones |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
N.v.t. |
o1 preview 12-09-2024 regionaal |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
N.v.t. |
Plannen met de -prijscalculator
o3 mini
De o3 mini is de bijgewerkte versie van het o1-minimodel. De o3 mini is een snelle, kosteneffectief redeneermodel dat is afgestemd op gebruikssituaties voor codering, wiskunde en wetenschap.
Het o3 mini-model beschikt nu over een uitgebreid contextinvoervenster van 200K tokens en een maximale uitvoer van 100K tokens, wat voldoende ruimte biedt voor complexe en gedetailleerde antwoorden. Het o1 mini-model heeft een contextinvoer van 128K. Zowel de o3- als de o1-modellen hebben een kennisafkapdatum van oktober 2023.
Model | Prijzen (1 miljoen tokens) | Prijzen met Batch API (1 miljoen tokens) |
---|---|---|
o3 mini 31-01-2025 wereldwijd |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
Invoer: $- Uitvoer: $- |
o3 mini 31-01-2025 VS/EU-gegevenszones |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
Invoer: $- Uitvoer: $- |
o3 mini 31-01-2025 regionaal |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
N.v.t. |
o1 mini 12-09-2024 wereldwijd |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
N.v.t. |
o1-mini 12-09-2024 VS/EU-gegevenszones |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
N.v.t. |
o1 mini 12-09-2024 regionaal |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
N.v.t. |
Plannen met de -prijscalculator
Audiomodellen
Azure OpenAI Service omvat de geavanceerde audiomodellen GPT-4o-Transcribe, GPT-4o-Mini-Transcribe en GPT-4o-Mini-TTS. Deze modellen verbeteren spraak-naar-tekst- en tekst-naar-spraak-mogelijkheden en bieden hoge nauwkeurigheid en aanpasbare spraakuitvoer voor verschillende toepassingen. Ideaal voor klantcallcenters, liveondertiteling en interactieve spraakuitvoer. Ze maken gebruik van uitgebreide pretraining en geavanceerde distillatie technieken voor superieure prestaties.
Model | Prijzen (1 miljoen tokens) | Prijzen met Batch API (1 miljoen tokens) |
---|---|---|
GPT-4o-Transcribe |
Tekst Invoer: $- Uitvoer: $- Audio Invoer: $- Uitvoer: N.v.t. |
N.v.t. |
GPT-4o-Mini-Transcribe |
Tekst Invoer: $- Uitvoer: $- Audio Invoer: $- Uitvoer: N.v.t. |
N.v.t. |
GPT-4o-Mini-TTS |
Tekst Invoer: $- Uitvoer: N.v.t. Audio Invoer: N.v.t. Uitvoer: $- |
N.v.t. |
Gebruikersagent voor agenda's (CUA)
De gebruikersagent voor agenda's (CUA) is een gespecialiseerd AI-model waarmee AI kan communiceren met grafische gebruikersinterfaces (GUIs), toepassingen kan navigeren en taken met meerdere stappen kan automatiseren, allemaal via instructies in natuurlijke taal. Het CUA-model kan worden gebruikt als hulpprogramma in de Antwoorden-API.
Model | Prijzen |
---|---|
computergebruik-preview Globaal |
Invoer: $-/1M-tokens Uitvoer: $-/1M-tokens |
Ingebouwde hulpprogramma's
De Antwoord-API en de Assistent-API maken naadloze interactie mogelijk met hulpprogramma's zoals computergebruik, codetolk, functieoproepen en bestandszoekopdrachten, zodat ontwikkelaars eenvoudig AI-agents kunnen bouwen.
Hulpprogramma | Invoer |
---|---|
Computergebruik (alleen antwoorden-API) |
Invoer: $-/1M-tokens Uitvoer: $-/1M-tokens |
Aanroep van het hulpprogramma Bestandszoekopdrachten (alleen antwoorden-API) | $-/1K aanroepen van hulpprogramma's |
Bestanden zoeken* | $-/GB vectoropslag per dag (1 GB gratis) |
Codetolk** | $-/sessie |
*GB verwijst naar binaire gigabytes, waarbij 1 GB gelijk is aan 2^30 bytes.
**Als uw assistent codetolk tegelijkertijd in twee verschillende threads aanroept, worden er twee codetolksessies gemaakt (2 * $-). Elke sessie is standaard één uur actief, wat betekent dat u deze kosten slechts één keer betaalt als uw gebruiker maximaal één uur instructies blijft geven aan codetolk in dezelfde thread.
De deductiekosten (invoer en uitvoer) variëren op basis van het GPT-model gebruikt met elke assistent. Als uw assistent tegelijkertijd Codetolk aanroept in twee verschillende threads, worden er twee Codetolk-sessies (2 * $-) gemaakt. Elke sessie is standaard voor één uur actief, wat betekent dat de prijs geldt voor het geven van instructies aan Codetolk in dezelfde thread gedurende één uur.
Realtime-API
De GPT-4o-Realtime-Preview wordt aanbevolen in de Realtime-API en biedt ondersteuning voor meertalige spraak-naar-spraakmogelijkheden. Geoptimaliseerd voor realtime gesprekken met lage latentie, maakt het natuurlijke interacties mogelijk met minimale vertraging, ideaal voor chatbots en conversationele AI. GPT-4o is de uitgebreide, krachtigere versie die is ontworpen voor complexe taken, terwijl GPT-4o Mini een kleinere, betaalbare optie is die ideaal is voor eenvoudigere toepassingen waarbij kostenefficiëntie en snelheid prioriteiten zijn.
Model | Prijzen (1 miljoen tokens) |
---|---|
GPT-4o-Realtime-Preview-2024-12-17-Globaal |
Tekst Invoer: $- Invoer in cache: $- Uitvoer: $- Audio Invoer: $- Invoer in cache: $- Uitvoer: $- |
GPT-4o-Realtime-Preview-2024-12-17-US/EU – Gegevenszones |
Tekst Invoer: $- Invoer in cache: $- Uitvoer: $- Audio Invoer: $- Invoer in cache: $- Uitvoer: $- |
GPT-4o-Realtime-Preview-2024-12-17-Regionaal |
Tekst Invoer: $- Invoer in cache: $- Uitvoer: $- Audio Invoer: $- Invoer in cache: $- Uitvoer: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Globaal |
Tekst Invoer: $- Invoer in cache: $- Uitvoer: $- Audio Invoer: $- Invoer in cache: $- Uitvoer: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU – Gegevenszones |
Tekst Invoer: $- Invoer in cache: $- Uitvoer: $- Audio Invoer: $- Invoer in cache: $- Uitvoer: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regionaal |
Tekst Invoer: $- Invoer in cache: $- Uitvoer: $- Audio Invoer: $- Invoer in cache: $- Uitvoer: $- |
GPT-4o-Realtime-Preview-2024-10-01-Globaal |
Tekst Invoer: $- Invoer in cache: $- Uitvoer: $- Audio Invoer: $- Invoer in cache: $- Uitvoer: $- |
GPT-4o-Realtime-Preview-2024-10-01-US/EU – Gegevenszones |
Tekst Invoer: $- Invoer in cache: $- Uitvoer: $- Audio Invoer: $- Invoer in cache: $- Uitvoer: $- |
GPT-4o-Realtime-Preview-2024-10-01-Regionaal |
Tekst Invoer: $- Invoer in cache: $- Uitvoer: $- Audio Invoer: $- Invoer in cache: $- Uitvoer: $- |
API voor chatvoltooiingen
Het GPT 4o-Audio-Preview-model, dat is opgenomen in de API voor chatvoltooiingen, verwerkt en genereert audio-inhoud. Het ondersteunt geavanceerde functies zoals spraakherkenning en audiosynthese, ideaal voor asynchrone spraakinteracties en sentimentanalyse. GPT-4o is de uitgebreide, krachtigere versie die is ontworpen voor complexe taken, terwijl GPT-4o Mini een kleinere, betaalbare optie is die ideaal is voor eenvoudigere toepassingen waarbij kostenefficiëntie en snelheid prioriteiten zijn.
Model | Prijzen (1 miljoen tokens) |
---|---|
GPT-4o-Audio-Preview-2024-12-17-Globaal |
Tekst Invoer: $- Uitvoer: $- Audio Invoer: $- Uitvoer: $- |
GPT-4o-Audio-Preview-2024-12-17-US/EU – Gegevenszones |
Tekst Invoer: $- Uitvoer: $- Audio Invoer: $- Uitvoer: $- |
GPT-4o-Audio-Preview-2024-12-17-Regionaal |
Tekst Invoer: $- Uitvoer: $- Audio Invoer: $- Uitvoer: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Globaal |
Tekst Invoer: $- Uitvoer: $- Audio Invoer: $- Uitvoer: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU – Gegevenszones |
Tekst Invoer: $- Uitvoer: $- Audio Invoer: $- Uitvoer: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Regionaal |
Tekst Invoer: $- Uitvoer: $- Audio Invoer: $- Uitvoer: $- |
GPT-4o
GPT-4o is het meest geavanceerde multimodaal model dat sneller en voordeliger is dan GPT-4 Turbo met sterkere zichtmogelijkheden. Het model heeft een context van 128.000 en een kennis-cutoff van oktober 2023.
Model | Prijzen (1 miljoen tokens) | Prijzen met Batch API (1 miljoen tokens) |
---|---|---|
GPT-4o-2024-1120 Globaal |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
Invoer: $- Uitvoer: $- |
GPT-4o-2024-1120 VS/EU - Gegevenszones |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
Invoer: $- Uitvoer: $- |
GPT-4o-2024-1120 Regionaal |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
N.v.t. |
GPT-4o-2024-08-06 Global |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
Invoer: $- Uitvoer: $- |
GPT-4o-2024-08-06 VS/EU - Gegevenszones |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
Invoer: $- Uitvoer: $- |
GPT-4o-2024-08-06 Regionaal |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
N.v.t. |
GPT-4o-2024-0513 Globaal |
Invoer: $- Uitvoer: $- |
Invoer: $- Uitvoer: $- |
GPT-4o-2024-0513 VS/EU - Gegevenszones |
Invoer: $- Uitvoer: $- |
N.v.t. |
GPT-4o-2024-0513 Regionaal |
Invoer: $- Uitvoer: $- |
N.v.t. |
Plannen met de -prijscalculator
GPT-4o-mini
GPT-4o mini is het meest rendabele kleine model en heeft beeldmogelijkheden. Het model heeft een context van 128.000 en een kennis-cutoff van oktober 2023.
Model | Prijzen (1 miljoen tokens) | Prijzen met Batch API (1 miljoen tokens) |
---|---|---|
GPT-4o-mini-0718-Globaal |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
Invoer: $- Uitvoer: $- |
GPT-4o-mini-0718 US/EU-gegevenszones – |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
Invoer: $- Uitvoer: $- |
GPT-4o-mini-0718-Regionaal |
Invoer: $- Invoer in cache: $- Uitvoer: $- |
N.v.t. |
Plannen met de -prijscalculator
Ingericht
U kunt doorvoer toewijzen en beheren voor implementaties, zodat voorspelbare prestaties en stabiele capaciteit worden gegarandeerd. Er wordt een uurtarief per model in rekening gebracht, ongeacht het gebruik, maar u kunt ook extra besparingen realiseren via maandelijkse en jaarlijkse reserveringen. Ontdek hoe u uw regionale implementaties en ingerichte reserveringen kunt overdragen naar globale en gegevenszones op deze Pagina Leren.
Model | Minimum aantal PTU's | PTU-prijzen per uur | Prijzen voor maandelijkse PTU-reserveringen | Prijzen voor jaarlijkse PTU-reserveringen |
---|---|---|---|---|
GPT-4.1 Globaal | 15 | $- | $- | $- |
GPT-4.1 Gegevenszones | 15 | $- | $- | $- |
GPT-4.1 Regionaal | 50 | $- | $- | $- |
GPT-4.1-mini Globaal | 15 | $- | $- | $- |
GPT-4.1-mini Gegevenszones VS/EU | 15 | $- | $- | $- |
GPT-4.1-mini Regionaal | 25 | $- | $- | $- |
GPT-4.1-nano Globaal | 15 | $- | $- | $- |
GPT-4.1-nano Gegevenszones VS/EU | 15 | $- | $- | $- |
GPT-4.1-nano Regionaal | 25 | $- | $- | $- |
o3-mini Global | 15 | $- | $- | $- |
o3-mini US/EU Data Zones | 15 | $- | $- | $- |
o3-mini Regional | 25 | $- | $- | $- |
o3 Globaal | 15 | $- | $- | $- |
o3 Gegevenszones VS/EU | 15 | $- | $- | $- |
o3 Regionaal | 50 | $- | $- | $- |
o4-mini Globaal | 15 | $- | $- | $- |
o4-mini Gegevenszones VS/EU | 15 | $- | $- | $- |
o4-mini Regionaal | 25 | $- | $- | $- |
GPT-4o Global | 15 | $- | $- | $- |
GPT-4o US/EU-gegevenszones | 15 | $- | $- | $- |
GPT-4o regionaal | 50 | $- | $- | $- |
Fine-Tuned GPT-4o-Regional | 50 | $- | $- | $- |
GPT-4o Mini Global | 15 | $- | $- | $- |
GPT-4o Mini US/EU-gegevenszones | 15 | $- | $- | $- |
GPT-4o Mini regionaal | 25 | $- | $- | $- |
Fine-Tuned GPT-4o-Mini Regional | 25 | $- | $- | $- |
Plannen met de -prijscalculator
Basismodellen
Modellen | Gebruik per 1000 tokens |
---|---|
Babbage-002 | $- |
Davinci-002 | $- |
Modellen afstemmen
Model | Prijzen | |
---|---|---|
o4-mini (Versterkingsafstemming) | Regionaal |
Invoer: $-/1M-tokens Uitvoer: $-/1M-tokens Training: $-/uur Hosting: $-/uur Grader-invoer: o4-mini: $-/1M-tokens 4.1-mini: $-/1M-tokens 4.1: $-/1M-tokens 4.1-nano: $-/1M-tokens o3: $-/1M-tokens Invoer in cache van grader: o4-mini: $-/1M-tokens 4.1-mini: $-/1M-tokens 4.1: $-/1M-tokens 4.1-nano: $-/1M-tokens o3: $-/1M-tokens Grader-uitvoer: o4-mini: $-/1M-tokens 4.1-mini: $-/1M-tokens 4.1: $-/1M-tokens 4.1-nano: $-/1M-tokens o3: $-/1M-tokens |
Wereldwijd |
Invoer: $-/1M-tokens Uitvoer: $-/1M-tokens Training: $-/uur Hosting: $-/uur Grader-invoer: o4-mini: $-/1M-tokens 4.1-mini: $-/1M-tokens 4.1: $-/1M-tokens 4.1-nano: $-/1M-tokens o3: $-/1M-tokens Invoer in cache van grader: o4-mini: $-/1M-tokens 4.1-mini: $-/1M-tokens 4.1: $-/1M-tokens 4.1-nano: $-/1M-tokens o3: $-/1M-tokens Grader-uitvoer: o4-mini: $-/1M-tokens 4.1-mini: $-/1M-tokens 4.1: $-/1M-tokens 4.1-nano: $-/1M-tokens o3: $-/1M-tokens |
|
GPT-4.1 | Regionaal |
Invoer: $-/1M-tokens Invoer in cache: $-/1M-tokens Uitvoer: $-/1M-tokens Training: $-/1M-tokens Hosting: $-/uur |
Wereldwijd |
Invoer: $-/1M-tokens Invoer in cache: $-/1M-tokens Uitvoer: $-/1M-tokens Training: $-/1M-tokens Hosting: $-/uur |
|
Developer |
Invoer: $-/1M-tokens Invoer in cache: $-/1M-tokens Uitvoer: $-/1M-tokens |
|
GPT-4.1-mini | Regionaal |
Invoer: $-/1M-tokens Invoer in cache: $-/1M-tokens Uitvoer: $-/1M-tokens Training: $-/1M-tokens Hosting: $-/uur |
Wereldwijd |
Invoer: $-/1M-tokens Invoer in cache: $-/1M-tokens Uitvoer: $-/1M-tokens Training: $-/1M-tokens Hosting: $-/uur |
|
Developer |
Invoer: $-/1M-tokens Invoer in cache: $-/1M-tokens Uitvoer: $-/1M-tokens |
|
GPT-4.1-nano | Regionaal |
Invoer: $-/1M-tokens Invoer in cache: $-/1M-tokens Uitvoer: $-/1M-tokens Training: $-/1M-tokens Hosting: $-/uur |
Wereldwijd |
Invoer: $-/1M-tokens Invoer in cache: $-/1M-tokens Uitvoer: $-/1M-tokens Training: $-/1M-tokens Hosting: $-/uur |
|
Developer |
Invoer: $-/1M-tokens Invoer in cache: $-/1M-tokens Uitvoer: $-/1M-tokens |
|
GPT-4o-2024-08-06 | Regionaal |
Invoer: $-/1M-tokens Invoer in cache: $-/1M-tokens Uitvoer: $-/1M-tokens Training: $-/1M-tokens Hosting: $-/uur |
Wereldwijd |
Invoer: $-/1M-tokens Invoer in cache: $-/1M-tokens Uitvoer: $-/1M-tokens Training: regionaal gebruiken Hosting: $-/uur |
|
GPT-4o-mini | Regionaal |
Invoer: $-/1M-tokens Invoer in cache: $-/1M-tokens Uitvoer: $-/1M-tokens Training: $-/1M-tokens Hosting: $-/uur |
Wereldwijd |
Invoer: $-/1M-tokens Invoer in cache: $-/1M-tokens Uitvoer: $-/1M-tokens Training: regionaal gebruiken Hosting: $-/uur |
|
GPT-3.5-Turbo (16K) | Regionaal |
Invoer: $-/1M-tokens Uitvoer: $-/1M-tokens Training: $-/1M-tokens Hosting: $-/uur |
Afbeeldingsmodellen
Modellen | Kwaliteit | Resolutie | Prijs (per 100 afbeeldingen) |
---|---|---|---|
Dall-E-3 | Standaard | 1024 * 1024 | $- |
Standaard | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-3 | HD | 1024 * 1024 | $- |
HD | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-2 | Standaard | 1024 * 1024 | $- |
Modellen insluiten
Modellen | Per 1000 tokens |
---|---|
Ada | $- |
tekst-insluiten-3-groot | $- |
tekst-insluiten-3-klein | $- |
Spraakmodellen
Modellen | Prijs |
---|---|
Whisper | $-/uur |
TTS (tekst-naar-spraak) | $-/1M tekens |
TTS HD | $-/1M tekens |
Verouderde taalmodellen
Modellen | Context | Invoer (per 1 miljoen tokens) | Uitvoer (per 1 miljoen tokens) |
---|---|---|---|
GPT-3.5-Turbo-0301 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 16K | $- | $- |
GPT-3.5-Turbo-1106 | 16K | $- | $- |
GPT-3.5-Turbo-0125 | 16K | $- | $- |
GPT-3.5-Turbo-Instruct | 4K | $- | $- |
GPT-4-Turbo | 128K | $- | $- |
GPT-4-Turbo-Vision | 128K | $- | $- |
GPT-4 | 8K | $- | $- |
GPT-4 | 32K | $- | $- |
Azure-prijzen en -aankoopopties

Neem rechtstreeks contact met ons op
Bekijk een overzicht van Azure-prijzen. Krijg inzicht in prijscategorieën voor uw cloudoplossing, leer meer over kostenoptimalisatie en vraag een aangepast voorstel aan.
Praat met een verkoopspecialistAanschafmethoden bekijken
Koop Azure-services via de Azure-website, uw Microsoft-vertegenwoordiger of een Azure-partner.
Verken uw optiesAanvullende bronnen
Azure OpenAI Service
Meer informatie over functies en mogelijkheden van Azure OpenAI Service.
Prijscalculator
Bereken de verwachte maandelijkse kosten voor het gebruik van een willekeurige combinatie van Azure-producten.
SLA
De Service Level Agreement voor Azure OpenAI Service bekijken.
Documentatie
Gebruik technische zelfstudies, video's en andere Azure OpenAI Service-bronnen.
Veelgestelde vragen
-
Azure OpenAI Service biedt prijzen op basis van zowel Betalen per gebruik als op basis van ingerichte doorvoereenheden (PTU's). Met Betalen per gebruik kunt u betalen voor de resources die u daadwerkelijk gebruikt, waardoor dit een flexibel model is voor variabele workloads. PTU's bieden een voorspelbaar prijsmodel waarbij u een specifieke hoeveelheid verwerkingscapaciteit voor modellen reserveert en implementeert. Dit model is ideaal voor workloads met consistente of voorspelbare gebruikspatronen, die stabiliteit en kostenbeheer bieden.
-
Lees PTU-documentatie of neem contact op met onze verkoopspecialistvoor meer informatie over PTU's en Azure OpenAI-prijzen.
Praat met een verkoopspecialist voor een overzicht van de Azure-prijzen. Krijg inzicht in de prijzen voor uw cloudoplossing.
Maak gratis gebruik van cloudservices en $200 tegoed om Azure gedurende 30 dagen te kunnen verkennen.