Overslaan naar hoofdinhoud
Azure

Prijzen voor Azure OpenAI Service

Overzicht van prijzen van Azure OpenAI Service

Azure OpenAI Service delivers enterprise-ready generative AI featuring powerful models from OpenAI, enabling organizations to innovate with text, audio, and vision capabilities. Beyond the cutting-edge models, companies choose Azure OpenAI Service for built-in data privacy, regional/area/global flexibility, and seamless integration into the Azure ecosystem including Fabric, Cosmos DB and Azure AI Search. Companies of all sizes can confidently scale AI solutions to enhance customer experience, automate workflows, and unlock creative potential, driving measurable impact and competitive differentiation.

To help customers in the journey, we offer pricing and cost management solutions to meet your needs. including:
  • Standard (On-Demand): Pay-as-you-go for input and output tokens.
  • Provisioned (PTUs): Allocate throughput with predictable costs, with monthly and annual reservations available to reduce overall spend.
  • Batch API: Language models are also now available in the Batch API for global deployments and three regions, that returns completions within 24 hours for a 50% discount on Global Standard Pricing.
You can choose from the following deployment types for Standard and Provisioned, which enable greater flexibility and control of pricing and performance. This flexibility helps when there is increasingly more restrictive data processing boundaries and need for increased throughput and lower price.
  • Global Deployment – Global SKU
  • Data Zone Deployment – Geographic based (EU or US)
  • Regional Deployment – Local Region (up to 27 regions)

Prijsopties verkennen

Pas filters toe om de prijsopties aan te passen aan uw behoeften.

De prijzen zijn slechts schattingen en zijn niet bedoeld als werkelijke prijsopgaven. De werkelijke prijzen kunnen variëren afhankelijk van het type overeenkomst dat is afgesloten met Microsoft, de aankoopdatum en de valutakoers. De prijzen worden berekend op basis van Amerikaanse dollars en worden geconverteerd op basis van de slotspot-tarieven in Londen die zijn vastgelegd in de twee werkdagen voor de laatste werkdag van de vorige maand. Als de twee werkdagen voor het einde van de maand vallen op een feestdag in de voornaamste markten, is de dag direct voorafgaande aan de twee werkdagen de dag van de tariefvaststelling. Dit tarief is van toepassing op alle transacties gedurende de aankomende maand. Meld u zich aan bij de Azure-prijscalculator voor prijzen op basis van uw huidige programma/aanbieding bij Microsoft. Neemt u contact op met een Azure-verkoopspecialist voor meer informatie over prijzen of om een prijsopgave aan te vragen. Zie veelgestelde vragen over Azure-prijzen.

GPT-4.5

GPT-4.5-preview is the latest general purpose model with deep world knowledge and better understanding of user intent that makes it good at creative tasks and agentic planning. The model has 128K context and an October 2023 knowledge cutoff.

Model Prijzen (1 miljoen tokens) Prijzen met Batch API (1 miljoen tokens)
GPT-4.5-Preview-2025-02-27 Global Invoer: $-
Invoer in cache: $-
Uitvoer: $-
N.v.t.

o1

o1 is de nieuwe reeks redeneringsmodellen voor complexe taken. Het model heeft een context van 200.000 en een kennis-cutoff van oktober 2023.

Model Prijzen (1 miljoen tokens) Prijzen met Batch API (1 miljoen tokens)
o1 17-12-2024 wereldwijd Invoer: $-
Invoer in cache: $-
Uitvoer: $-
N.v.t.
o1 17-12-2024 VS/EU-gegevenszones Invoer: $-
Invoer in cache: $-
Uitvoer: $-
N.v.t.
o1 17-12-2024 regionaal Invoer: $-
Invoer in cache: $-
Uitvoer: $-
N.v.t.
o1 preview 12-09-2024 wereldwijd Invoer: $-
Invoer in cache: $-
Uitvoer: $-
N.v.t.
o1 preview 12-09-2024 VS/EU-gegevenszones Invoer: $-
Invoer in cache: $-
Uitvoer: $-
N.v.t.
o1 preview 12-09-2024 regionaal Invoer: $-
Invoer in cache: $-
Uitvoer: $-
N.v.t.

Plannen met de -prijscalculator

o3 mini

De o3 mini is de bijgewerkte versie van het o1-minimodel. De o3 mini is een snelle, kosteneffectief redeneermodel dat is afgestemd op gebruikssituaties voor codering, wiskunde en wetenschap.

Het o3 mini-model beschikt nu over een uitgebreid contextinvoervenster van 200K tokens en een maximale uitvoer van 100K tokens, wat voldoende ruimte biedt voor complexe en gedetailleerde antwoorden. Het o1 mini-model heeft een contextinvoer van 128K. Zowel de o3- als de o1-modellen hebben een kennisafkapdatum van oktober 2023.

Model Prijzen (1 miljoen tokens) Prijzen met Batch API (1 miljoen tokens)
o3 mini 31-01-2025 wereldwijd Invoer: $-
Invoer in cache: $-
Uitvoer: $-
Invoer: $-
Uitvoer: $-
o3 mini 31-01-2025 VS/EU-gegevenszones Invoer: $-
Invoer in cache: $-
Uitvoer: $-
Invoer: $-
Uitvoer: $-
o3 mini 31-01-2025 regionaal Invoer: $-
Invoer in cache: $-
Uitvoer: $-
N.v.t.
o1 mini 12-09-2024 wereldwijd Invoer: $-
Invoer in cache: $-
Uitvoer: $-
N.v.t.
o1-mini 12-09-2024 VS/EU-gegevenszones Invoer: $-
Invoer in cache: $-
Uitvoer: $-
N.v.t.
o1 mini 12-09-2024 regionaal Invoer: $-
Invoer in cache: $-
Uitvoer: $-
N.v.t.

Plannen met de -prijscalculator

Realtime-API

De GPT-4o-Realtime-Preview wordt aanbevolen in de Realtime-API en biedt ondersteuning voor meertalige spraak-naar-spraakmogelijkheden. Geoptimaliseerd voor realtime gesprekken met lage latentie, maakt het natuurlijke interacties mogelijk met minimale vertraging, ideaal voor chatbots en conversationele AI. GPT-4o is de uitgebreide, krachtigere versie die is ontworpen voor complexe taken, terwijl GPT-4o Mini een kleinere, betaalbare optie is die ideaal is voor eenvoudigere toepassingen waarbij kostenefficiëntie en snelheid prioriteiten zijn.

Model Prijzen (1 miljoen tokens)
GPT-4o-Realtime-Preview-2024-12-17-Globaal Tekst
Invoer: $-
Invoer in cache: $-
Uitvoer: $-

Audio
Invoer: $-
Invoer in cache: $-
Uitvoer: $-
GPT-4o-Realtime-Preview-2024-12-17-US/EU – Gegevenszones Tekst
Invoer: $-
Invoer in cache: $-
Uitvoer: $-

Audio
Invoer: $-
Invoer in cache: $-
Uitvoer: $-
GPT-4o-Realtime-Preview-2024-12-17-Regionaal Tekst
Invoer: $-
Invoer in cache: $-
Uitvoer: $-

Audio
Invoer: $-
Invoer in cache: $-
Uitvoer: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Globaal Tekst
Invoer: $-
Invoer in cache: $-
Uitvoer: $-

Audio
Invoer: $-
Invoer in cache: $-
Uitvoer: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU – Gegevenszones Tekst
Invoer: $-
Invoer in cache: $-
Uitvoer: $-

Audio
Invoer: $-
Invoer in cache: $-
Uitvoer: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regionaal Tekst
Invoer: $-
Invoer in cache: $-
Uitvoer: $-

Audio
Invoer: $-
Invoer in cache: $-
Uitvoer: $-
GPT-4o-Realtime-Preview-2024-10-01-Globaal Tekst
Invoer: $-
Invoer in cache: $-
Uitvoer: $-

Audio
Invoer: $-
Invoer in cache: $-
Uitvoer: $-
GPT-4o-Realtime-Preview-2024-10-01-US/EU – Gegevenszones Tekst
Invoer: $-
Invoer in cache: $-
Uitvoer: $-

Audio
Invoer: $-
Invoer in cache: $-
Uitvoer: $-
GPT-4o-Realtime-Preview-2024-10-01-Regionaal Tekst
Invoer: $-
Invoer in cache: $-
Uitvoer: $-

Audio
Invoer: $-
Invoer in cache: $-
Uitvoer: $-

API voor chatvoltooiingen

Het GPT 4o-Audio-Preview-model, dat is opgenomen in de API voor chatvoltooiingen, verwerkt en genereert audio-inhoud. Het ondersteunt geavanceerde functies zoals spraakherkenning en audiosynthese, ideaal voor asynchrone spraakinteracties en sentimentanalyse. GPT-4o is de uitgebreide, krachtigere versie die is ontworpen voor complexe taken, terwijl GPT-4o Mini een kleinere, betaalbare optie is die ideaal is voor eenvoudigere toepassingen waarbij kostenefficiëntie en snelheid prioriteiten zijn.

Model Prijzen (1 miljoen tokens)
GPT-4o-Audio-Preview-2024-12-17-Globaal Tekst
Invoer: $-
Uitvoer: $-

Audio
Invoer: $-
Uitvoer: $-
GPT-4o-Audio-Preview-2024-12-17-US/EU – Gegevenszones Tekst
Invoer: $-
Uitvoer: $-

Audio
Invoer: $-
Uitvoer: $-
GPT-4o-Audio-Preview-2024-12-17-Regionaal Tekst
Invoer: $-
Uitvoer: $-

Audio
Invoer: $-
Uitvoer: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Globaal Tekst
Invoer: $-
Uitvoer: $-

Audio
Invoer: $-
Uitvoer: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU – Gegevenszones Tekst
Invoer: $-
Uitvoer: $-

Audio
Invoer: $-
Uitvoer: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Regionaal Tekst
Invoer: $-
Uitvoer: $-

Audio
Invoer: $-
Uitvoer: $-

GPT-4o

GPT-4o is het meest geavanceerde multimodaal model dat sneller en voordeliger is dan GPT-4 Turbo met sterkere zichtmogelijkheden. Het model heeft een context van 128.000 en een kennis-cutoff van oktober 2023.

Model Prijzen (1 miljoen tokens) Prijzen met Batch API (1 miljoen tokens)
GPT-4o-2024-1120 Globaal Invoer: $-
Invoer in cache: $-
Uitvoer: $-
Invoer: $-
Uitvoer: $-
GPT-4o-2024-1120 VS/EU - Gegevenszones Invoer: $-
Invoer in cache: $-
Uitvoer: $-
Invoer: $-
Uitvoer: $-
GPT-4o-2024-1120 Regionaal Invoer: $-
Invoer in cache: $-
Uitvoer: $-
N.v.t.
GPT-4o-2024-08-06 Global Invoer: $-
Invoer in cache: $-
Uitvoer: $-
Invoer: $-
Uitvoer: $-
GPT-4o-2024-08-06 VS/EU - Gegevenszones Invoer: $-
Invoer in cache: $-
Uitvoer: $-
Invoer: $-
Uitvoer: $-
GPT-4o-2024-08-06 Regionaal Invoer: $-
Invoer in cache: $-
Uitvoer: $-
N.v.t.
GPT-4o-2024-0513 Globaal Invoer: $-
Uitvoer: $-
Invoer: $-
Uitvoer: $-
GPT-4o-2024-0513 VS/EU - Gegevenszones Invoer: $-
Uitvoer: $-
N.v.t.
GPT-4o-2024-0513 Regionaal Invoer: $-
Uitvoer: $-
N.v.t.

Plannen met de -prijscalculator

GPT-4o-mini

GPT-4o mini is het meest rendabele kleine model en heeft beeldmogelijkheden. Het model heeft een context van 128.000 en een kennis-cutoff van oktober 2023.

Model Prijzen (1 miljoen tokens) Prijzen met Batch API (1 miljoen tokens)
GPT-4o-mini-0718-Globaal Invoer: $-
Invoer in cache: $-
Uitvoer: $-
Invoer: $-
Uitvoer: $-
GPT-4o-mini-0718 US/EU-gegevenszones – Invoer: $-
Invoer in cache: $-
Uitvoer: $-
Invoer: $-
Uitvoer: $-
GPT-4o-mini-0718-Regionaal Invoer: $-
Invoer in cache: $-
Uitvoer: $-
N.v.t.

Plannen met de -prijscalculator

Ingericht

U kunt doorvoer toewijzen en beheren voor implementaties, zodat voorspelbare prestaties en stabiele capaciteit worden gegarandeerd. Er wordt een uurtarief per model in rekening gebracht, ongeacht het gebruik, maar u kunt ook extra besparingen realiseren via maandelijkse en jaarlijkse reserveringen. Ontdek hoe u uw regionale implementaties en ingerichte reserveringen kunt overdragen naar globale en gegevenszones op deze Pagina Leren.

Model Minimum aantal PTU's PTU-prijzen per uur Prijzen voor maandelijkse PTU-reserveringen Prijzen voor jaarlijkse PTU-reserveringen
GPT-4o Global 15 $- $- $-
GPT-4o US/EU-gegevenszones 15 $- $- $-
GPT-4o regionaal 50 $- $- $-
Fine-Tuned GPT-4o-Regional 50 $- $- $-
GPT-4o Mini Global 15 $- $- $-
GPT-4o Mini US/EU-gegevenszones 15 $- $- $-
GPT-4o Mini regionaal 25 $- $- $-
Fine-Tuned GPT-4o-Mini Regional 25 $- $- $-

Plannen met de -prijscalculator

Basismodellen

Modellen Gebruik per 1000 tokens
Babbage-002 $-
Davinci-002 $-

Modellen afstemmen

Model Prijzen
GPT-4o-2024-08-06 Regionaal Invoer: $-/1M-tokens
Invoer in cache: $-/1M-tokens
Uitvoer: $-/1M-tokens
Training: $-/1M-tokens
Hosting: $-/uur
Wereldwijd Invoer: $-/1M-tokens
Invoer in cache: $-/1M-tokens
Uitvoer: $-/1M-tokens
Training: regionaal gebruiken
Hosting: $-/uur
GPT-4o-mini Regionaal Invoer: $-/1M-tokens
Invoer in cache: $-/1M-tokens
Uitvoer: $-/1M-tokens
Training: $-/1M-tokens
Hosting: $-/uur
Wereldwijd Invoer: $-/1M-tokens
Invoer in cache: $-/1M-tokens
Uitvoer: $-/1M-tokens
Training: regionaal gebruiken
Hosting: $-/uur
GPT-4-0613 (8K) Regionaal Invoer: $-/1M-tokens
Uitvoer: $-/1M-tokens
Training: $-/1M-tokens
Hosting: $-/uur
GPT-3.5-Turbo (16K) Regionaal Invoer: $-/1M-tokens
Uitvoer: $-/1M-tokens
Training: $-/1M-tokens
Hosting: $-/uur
GPT-3.5-Turbo (4K) Regionaal Invoer: $-/1M-tokens
Uitvoer: $-/1M-tokens
Training: $-/1M-tokens
Hosting: $-/uur
Babbage-002 Invoer: $-/1M-tokens
Uitvoer: $-/1M-tokens
Training: $-/1M-tokens
Hosting: $-/uur
Davinci-002 Invoer: $-/1M-tokens
Uitvoer: $-/1M-tokens
Training: $-/1M-tokens
Hosting: $-/uur

Assistent-API

Met de Assistent-API en de bijbehorende hulpprogramma's kunnen ontwikkelaars eenvoudig AI-assistenten bouwen in hun toepassingen.

De tokens die worden gebruikt voor de Assistent-API, worden gefactureerd volgens de invoer-/uitvoersnelheden per token van het gekozen taalmodel die worden gebruikt voor elke assistent. Daarnaast brengen we de volgende kosten in rekening voor het gebruik van hulpprogramma's:

Hulpprogramma Invoer
Bestanden zoeken* $-/GB vectoropslag per dag (1 GB gratis)
Codetolk** $-/sessie

*GB verwijst naar binaire gigabytes, waarbij 1 GB gelijk is aan 2^30 bytes.

**Als uw assistent codetolk tegelijkertijd in twee verschillende threads aanroept, worden er twee codetolksessies gemaakt (2 * $-). Elke sessie is standaard één uur actief, wat betekent dat u deze kosten slechts één keer betaalt als uw gebruiker maximaal één uur instructies blijft geven aan codetolk in dezelfde thread.

De deductiekosten (invoer en uitvoer) variëren op basis van het GPT-model gebruikt met elke assistent. Als uw assistent tegelijkertijd Codetolk aanroept in twee verschillende threads, worden er twee Codetolk-sessies (2 * $-) gemaakt. Elke sessie is standaard voor één uur actief, wat betekent dat de prijs geldt voor het geven van instructies aan Codetolk in dezelfde thread gedurende één uur.

Afbeeldingsmodellen

Modellen Kwaliteit Resolutie Prijs (per 100 afbeeldingen)
Dall-E-3 Standaard 1024 * 1024 $-
Standaard 1024 * 1792,
1792 * 1024
$-
Dall-E-3 HD 1024 * 1024 $-
HD 1024 * 1792,
1792 * 1024
$-
Dall-E-2 Standaard 1024 * 1024 $-

Modellen insluiten

Modellen Per 1000 tokens
Ada $-
tekst-insluiten-3-groot $-
tekst-insluiten-3-klein $-

Spraakmodellen

Modellen Prijs
Whisper $-/uur
TTS (tekst-naar-spraak) $-/1M tekens
TTS HD $-/1M tekens

Verouderde taalmodellen

Modellen Context Invoer (per 1 miljoen tokens) Uitvoer (per 1 miljoen tokens)
GPT-3.5-Turbo-0301 4K $- $-
GPT-3.5-Turbo-0613 4K $- $-
GPT-3.5-Turbo-0613 16K $- $-
GPT-3.5-Turbo-1106 16K $- $-
GPT-3.5-Turbo-0125 16K $- $-
GPT-3.5-Turbo-Instruct 4K $- $-
GPT-4-Turbo 128K $- $-
GPT-4-Turbo-Vision 128K $- $-
GPT-4 8K $- $-
GPT-4 32K $- $-

Azure-prijzen en -aankoopopties

Neem rechtstreeks contact met ons op

Bekijk een overzicht van Azure-prijzen. Krijg inzicht in prijscategorieën voor uw cloudoplossing, leer meer over kostenoptimalisatie en vraag een aangepast voorstel aan.

Praat met een verkoopspecialist

Aanschafmethoden bekijken

Koop Azure-services via de Azure-website, uw Microsoft-vertegenwoordiger of een Azure-partner.

Verken uw opties

Aanvullende bronnen

Azure OpenAI Service

Meer informatie over functies en mogelijkheden van Azure OpenAI Service.

Prijscalculator

Bereken de verwachte maandelijkse kosten voor het gebruik van een willekeurige combinatie van Azure-producten.

SLA

De Service Level Agreement voor Azure OpenAI Service bekijken.

Documentatie

Gebruik technische zelfstudies, video's en andere Azure OpenAI Service-bronnen.

  • Azure OpenAI Service biedt prijzen op basis van zowel Betalen per gebruik als op basis van ingerichte doorvoereenheden (PTU's). Met Betalen per gebruik kunt u betalen voor de resources die u daadwerkelijk gebruikt, waardoor dit een flexibel model is voor variabele workloads. PTU's bieden een voorspelbaar prijsmodel waarbij u een specifieke hoeveelheid verwerkingscapaciteit voor modellen reserveert en implementeert. Dit model is ideaal voor workloads met consistente of voorspelbare gebruikspatronen, die stabiliteit en kostenbeheer bieden.
  • Lees PTU-documentatie of neem contact op met onze verkoopspecialistvoor meer informatie over PTU's en Azure OpenAI-prijzen.

Praat met een verkoopspecialist voor een overzicht van de Azure-prijzen. Krijg inzicht in de prijzen voor uw cloudoplossing.

Maak gratis gebruik van cloudservices en $200 tegoed om Azure gedurende 30 dagen te kunnen verkennen.

Toevoegen aan schatting. Druk op 'v' om weer te geven in Calculator
Kunnen we u helpen?