Oversigt over prisfastsættelse for Azure OpenAI-tjenesten
For at hjælpe kunderne på rejsen tilbyder vi pris- og omkostningsstyringsløsninger, der opfylder dine behov. herunder:
- Standard (On-Demand): Betalt efter forbrug for input- og outputtokens.
- Klargjorte (PTU‘er): Alloker gennemløb med forudsigelige omkostninger med månedlige og årlige reservationer til rådighed for at reducere det samlede forbrug.
- Batch API: Sprogmodeller er nu også tilgængelige iBatch API til globale udrulninger og tre områder, der returnerer fuldførelser inden for 24 timer for en rabat på 50 % på globale standardpriser.
- Global udrulning – Global SKU
- Udrulning af datazone – Geografisk baseret (EU eller USA)
- Udrulning lokalt – Lokalt område (op til 27 områder)
Se prismuligheder
Anvend filtre for at tilpasse prismulighederne efter dine behov.
Priserne er kun estimater og er ikke beregnet som faktiske pristilbud. De faktiske priser kan variere afhængigt af den type aftale, der er indgået med Microsoft, købsdatoen og valutakursen. Priserne beregnes ud fra den amerikanske dollar og konverteres ved hjælp af London børsens slutkurs, der registreres i løbet af de to hverdage før den sidste hverdag i den forrige måned. Hvis de to hverdage før månedens slutning falder på en banklukkedag på større markeder, angives kursen umiddelbart dagen før de to hverdage. Denne kurs gælder for alle transaktioner i løbet af den kommende måned. Log på Azure-prisberegneren for at se priser baseret på dit aktuelle program/tilbud med Microsoft. Kontakt en Azure-salgsspecialist for at få flere oplysninger om priser eller for at anmode om et pristilbud. Se ofte stillede spørgsmål om Azure-priser.
Amerikanske myndigheder kan købe Azure Government-tjenester hos en licensudbyder uden økonomisk forpligtelse eller direkte via et Betalt efter forbrug-onlineabonnement.
Vigtigt – Prisen i R$ er kun vejledende. Det er en international transaktion, og den endelige pris kan ændres, afhængigt af valutakurser og inkludering af IOF-afgifter. Der udstedes ikke en eNF.
Amerikanske myndigheder kan købe Azure Government-tjenester hos en licensudbyder uden økonomisk forpligtelse eller direkte via et Betalt efter forbrug-onlineabonnement.
Vigtigt – Prisen i R$ er kun vejledende. Det er en international transaktion, og den endelige pris kan ændres, afhængigt af valutakurser og inkludering af IOF-afgifter. Der udstedes ikke en eNF.
o1
o1 er den nye serie af ræsonneringsmodel til komplekse opgaver. Modellen har 200.000 kontekster og en skæringsdato for viden fra oktober 2023.
Model | Priser (1 mio. tokens) |
---|---|
o1 1217 global |
Input: $- Cachelagret input: $- Output: $- |
o1 1217 USA/EU – datazoner |
Input: $- Cachelagret input: $- Output: $- |
o1 1217 område |
Input: $- Cachelagret input: $- Output: $- |
o1 global prøveversion |
Input: $- Cachelagret input: $- Output: $- |
o1 prøveversion i datazonerne USA/EU |
Input: $- Cachelagret input: $- Output: $- |
o1 prøveversion efter område |
Input: $- Cachelagret input: $- Output: $- |
Planlæg med prisberegneren
o1 Mini
o1-mini er en hurtig og omkostningseffektiv ræsonnerende model, der er skræddersyet til brugscases til kodning, matematik og videnskab. Modellen har en 128K kontekst og en oktober 2023-vidensafskæring.
Model | Priser (1 mio. tokens) |
---|---|
Global |
Input: $- Cachelagret input: $- Output: $- |
Datazoner i USA/EU |
Input: $- Cachelagret input: $- Output: $- |
Regionalt |
Input: $- Cachelagret input: $- Output: $- |
Planlæg med prisberegneren
API i realtid
Featured in the Realtime API, the GPT-4o-Realtime-Preview supports multilingual speech-to-speech capabilities. Optimized for real-time, low-latency conversations, it enables natural interactions with minimal delay, ideal for chatbots and conversational AI. GPT-4o is the comprehensive, more powerful version designed for complex tasks, while GPT-4o Mini is a smaller, more affordable option ideal for simpler applications where cost-efficiency and speed are priorities.
Model | Priser (1 mio. tokens) |
---|---|
GPT-4o-Realtime-Preview-2024-12-17-Global |
Tekst Input: $- Cachelagret input: $- Output: $- Lyd Input: $- Cachelagret input: $- Output: $- |
GPT-4o-Realtime-Preview-2024-12-17-US/EU – Data Zones |
Tekst Input: $- Cachelagret input: $- Output: $- Lyd Input: $- Cachelagret input: $- Output: $- |
GPT-4o-Realtime-Preview-2024-12-17-Regional |
Tekst Input: $- Cachelagret input: $- Output: $- Lyd Input: $- Cachelagret input: $- Output: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global |
Tekst Input: $- Cachelagret input: $- Output: $- Lyd Input: $- Cachelagret input: $- Output: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU – Data Zones |
Tekst Input: $- Cachelagret input: $- Output: $- Lyd Input: $- Cachelagret input: $- Output: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional |
Tekst Input: $- Cachelagret input: $- Output: $- Lyd Input: $- Cachelagret input: $- Output: $- |
GPT-4o-Realtime-Preview-2024-10-01-Global |
Tekst Input: $- Cachelagret input: $- Output: $- Lyd Input: $- Cachelagret input: $- Output: $- |
GPT-4o-Realtime-Preview-2024-10-01-US/EU – Data Zones |
Tekst Input: $- Cachelagret input: $- Output: $- Lyd Input: $- Cachelagret input: $- Output: $- |
GPT-4o-Realtime-Preview-2024-10-01-Regional |
Tekst Input: $- Cachelagret input: $- Output: $- Lyd Input: $- Cachelagret input: $- Output: $- |
Chat Completions API
Featured in the Chat Completions API, the GPT 4o-Audio-Preview model processes and generates audio content. It supports advanced features like speech recognition and audio synthesis, ideal for asynchronous speech interactions and sentiment analysis. GPT-4o is the comprehensive, more powerful version designed for complex tasks, while GPT-4o Mini is a smaller, more affordable option ideal for simpler applications where cost-efficiency and speed are priorities.
Model | Priser (1 mio. tokens) |
---|---|
GPT-4o-Audio-Preview-2024-12-17-Global |
Tekst Input: $- Output: $- Lyd Input: $- Output: $- |
GPT-4o-Audio-Preview-2024-12-17-US/EU – Data Zones |
Tekst Input: $- Output: $- Lyd Input: $- Output: $- |
GPT-4o-Audio-Preview-2024-12-17-Regional |
Tekst Input: $- Output: $- Lyd Input: $- Output: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Global |
Tekst Input: $- Output: $- Lyd Input: $- Output: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU – Data Zones |
Tekst Input: $- Output: $- Lyd Input: $- Output: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional |
Tekst Input: $- Output: $- Lyd Input: $- Output: $- |
GPT-4o
GPT-4o er den mest avancerede multimodale model, der er hurtigere og billigere end GPT-4 Turbo med stærkere synsfunktioner. Modellen har en 128K kontekst og en oktober 2023-vidensafskæring.
Model | Priser (1 mio. tokens) | Priser med Batch API (1 mio. tokens) |
---|---|---|
GPT-4o-2024-1120 global |
Input: $- Cachelagret input: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-1120 US/EU – datazoner |
Input: $- Cachelagret input: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-1120 område |
Input: $- Cachelagret input: $- Output: $- |
I/T |
GPT-4o-2024-08-06 Global |
Input: $- Cachelagret input: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-08-06 US/EU – datazoner |
Input: $- Cachelagret input: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-08-06 område |
Input: $- Cachelagret input: $- Output: $- |
I/T |
GPT-4o-2024-0513 global |
Input: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-0513 US/EU – datazoner |
Input: $- Output: $- |
I/T |
GPT-4o-2024-0513 område |
Input: $- Output: $- |
I/T |
Planlæg med prisberegneren
GPT-4o mini
GPT-4o mini er den mest omkostningseffektive lille model og har visionsfunktioner. Modellen har en 128K kontekst og en oktober 2023-vidensafskæring.
Model | Priser (1 mio. tokens) | Priser med Batch API (1 mio. tokens) |
---|---|---|
GPT-4o-mini-0718 Global |
Input: $- Cachelagret input: $- Output: $- |
Input: $- Output: $- |
GPT-4o-mini-0718 US/EU – Data Zones |
Input: $- Cachelagret input: $- Output: $- |
Input: $- Output: $- |
GPT-4o-mini-0718 Regional |
Input: $- Cachelagret input: $- Output: $- |
I/T |
Planlæg med prisberegneren
Klargjort
Du kan allokere og administrere gennemløb for udrulninger, så du sikrer forudsigelig ydeevne og stabil kapacitet. Du opkræves en timepris pr. model uanset forbrug, men du kan også sikre yderligere besparelser via månedlige og årlige reservationer. Se, hvordan du overfører dine regionale udrulninger og klargjorte reservationer til globale zoner og datazoner på denne Learn-side.
Model | Min. PTU'er | Priser på PTU pr. time | Priser på månedlig PTU-reservation | Priser for årlig PTU-reservation |
---|---|---|---|---|
GPT-4o Global | 15 | $- | $- | $- |
GPT-4o datazoner i USA/EU | 15 | $- | $- | $- |
GPT-4o regional | 50 | $- | $- | $- |
Fine-Tuned GPT-4o-Regional | 50 | $- | $- | $- |
GPT-4o Mini Global | 15 | $- | $- | $- |
GPT-4o Mini-datazoner i USA/EU | 15 | $- | $- | $- |
GPT-4o Mini område | 25 | $- | $- | $- |
Fine-Tuned GPT-4o-Mini Regional | 25 | $- | $- | $- |
Planlæg med prisberegneren
Basismodeller
Modeller | Forbrug pr. 1.000 tokens |
---|---|
Babbage-002 | $- |
Davinci-002 | $- |
Modeller til finjustering
Model | Priser | |
---|---|---|
GPT-4o-2024-08-06 | Regionalt |
Input: $-/1 mio. tokens Cachelagret input: $-/1 mio. tokens Output: $-/1 mio. tokens Undervisning: $-/1 mio. tokens Hosting: $- pr. time |
Global |
Input: $-/1 mio. tokens Cachelagret input: $-/1 mio. tokens Output: $-/1 mio. tokens Undervisning: brug område Hosting: $- pr. time |
|
GPT-4o-mini | Regionalt |
Input: $-/1 mio. tokens Cachelagret input: $-/1 mio. tokens Output: $-/1 mio. tokens Undervisning: $-/1 mio. tokens Hosting: $- pr. time |
Global |
Input: $-/1 mio. tokens Cachelagret input: $-/1 mio. tokens Output: $-/1 mio. tokens Undervisning: brug område Hosting: $- pr. time |
|
GPT-4-0613 (8K) | Regionalt |
Input: $-/1 mio. tokens Output: $-/1 mio. tokens Undervisning: $-/1 mio. tokens Hosting: $- pr. time |
GPT-3.5-Turbo (16K) | Regionalt |
Input: $-/1 mio. tokens Output: $-/1 mio. tokens Undervisning: $-/1 mio. tokens Hosting: $- pr. time |
GPT-3.5-Turbo (4K) | Regionalt |
Input: $-/1 mio. tokens Output: $-/1 mio. tokens Undervisning: $-/1 mio. tokens Hosting: $- pr. time |
Babbage-002 |
Input: $-/1 mio. tokens Output: $-/1 mio. tokens Undervisning: $-/1 mio. tokens Hosting: $- pr. time |
|
Davinci-002 |
Input: $-/1 mio. tokens Output: $-/1 mio. tokens Undervisning: $-/1 mio. tokens Hosting: $- pr. time |
Assistent-API
Assistent-API'en og dens værktøjer gør det nemt for udviklere at bygge assistenter med kunstig intelligens i deres programmer.
De tokens, der bruges til assistent-API'en, faktureres til den valgte sprogmodels input-/outputpriser pr. token, der bruges med hver assistent. Derudover opkræver vi følgende gebyrer for brug af værktøjer:
Værktøj | Input |
---|---|
Filsøgning* | $- pr. GB vektorlager pr. dag (1 GB gratis) |
Kodefortolker** | $-/session |
*GB refererer til binære gigabyte, hvor 1 GB er 2^30 byte.
**Hvis din assistent kalder Kodefortolker samtidigt i to forskellige tråde, vil dette oprette to kodefortolkersessioner (2 * $-). Hver session er som standard aktiv i én time, hvilket betyder, at du kun betaler dette gebyr én gang, hvis din bruger bliver ved med at give instruktioner til Kodefortolker i samme tråd i op til en time.
Udledningsomkostningerne (input og output) varierer afhængigt af den GPT-model, der bruges sammen med hver assistent. Hvis din assistent kalder Kodefortolker samtidigt i to forskellige tråde, vil dette oprette to kodefortolkersessioner (2 * $-). Hver session er som standard aktiv i en time, hvilket betyder, at prisen er op til én time med instruktioner til kodefortolkeren i den samme tråd.
Billedmodeller
Modeller | Kvalitet | Opløsning | Pris (pr. 100 billeder) |
---|---|---|---|
Dall-E-3 | Standard | 1024 * 1024 | $- |
Standard | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-3 | HD | 1024 * 1024 | $- |
HD | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-2 | Standard | 1024 * 1024 | $- |
Integrering af modeller
Modeller | Pr. 1.000 tokens |
---|---|
Ada | $- |
tekstintegrering-3-stor | $- |
tekstintegrering-3-lille | $- |
Talemodeller
Modeller | Pris |
---|---|
Hviske | $- pr. time |
TTS (Tekst-til-tale) | $-/1 mio. tegn |
TTS HD | $-/1 mio. tegn |
Ældre sprogmodeller
Modeller | Kontekst | Input (pr. 1 mio. tokens) | Output (pr. 1 mio. tokens) |
---|---|---|---|
GPT-3.5-Turbo-0301 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 16K | $- | $- |
GPT-3.5-Turbo-1106 | 16K | $- | $- |
GPT-3.5-Turbo-0125 | 16K | $- | $- |
GPT-3.5-Turbo-Instruct | 4K | $- | $- |
GPT-4-Turbo | 128K | $- | $- |
GPT-4-Turbo-Vision | 128K | $- | $- |
GPT-4 | 8K | $- | $- |
GPT-4 | 32K | $- | $- |
Azure-priser og købsmuligheder

Få direkte kontakt til os
Få en gennemgang af Azure-prisfastsættelse. Få en forståelse af prisfastsættelsen på din skyløsning, få mere at vide om omkostningsoptimering, og anmod om et tilpasset tilbud.
Tal med en sælgerSe flere måder at købe på
Køb Azure-tjenester via Azure-webstedet, en Microsoft-repræsentant eller en Azure-partner.
Se nærmere på dine mulighederFlere ressourcer
Azure OpenAI Service
Få mere at vide om funktioner og egenskaber i forbindelse med Azure OpenAI Service.
Prisberegner
Anslå dine forventede månedlige omkostninger ved hjælp af en hvilken som helst kombination af Azure-produkter.
SLA
Gennemse serviceniveauaftalen for Azure OpenAI Service.
Dokumentation
Se tekniske vejledninger, videoer og andet Azure OpenAI Service-materiale.
Ofte stillede spørgsmål
-
Azure OpenAI-tjenesten tilbyder priser, der er baseret på både betal efter forbrug og klargjorte enheder for gennemløb (PTU'er). Betalt efter forbrug giver dig mulighed for at betale for de ressourcer, du bruger, hvilket gør det fleksibelt for variable arbejdsbelastninger. PTU'er tilbyder en forudsigelig prismodel, hvor du reserverer og udruller en bestemt mængde modelbehandlingskapacitet. Denne model er ideel til arbejdsbelastninger med konsekvente eller forudsigelige brugsmønstre, der giver stabilitets- og omkostningsstyring.
-
Hvis du vil vide mere om PTUs- og Azure Open AI-priser, kan du læse PTU-dokumentation eller kontakte vores salgsspecialist
Tal med en sælger, og få en gennemgang af Azure-priserne. Få en forståelse af prisen på din cloudløsning.
Få gratis cloudtjenester og en kredit på $200, så du kan udforske Azure i 30 dage.