Gå til hovedindholdet
Azure

Priser for Azure OpenAI Service

Oversigt over prisfastsættelse for Azure OpenAI-tjenesten

Azure OpenAI Service leverer virksomhedsklar genereret kunstig intelligens med effektive modeller fra OpenAI, så organisationer kan være innovative med tekst-, lyd- og synsfunktioner. Ud over de avancerede modeller vælger virksomheder Azure OpenAI Service til indbygget beskyttelse af personlige oplysninger, regional/områdemæssig/global fleksibilitet og problemfri integration i Azure-økosystemet, herunder Fabric, Cosmos DB og Azure AI Search. Virksomheder i alle størrelser kan trygt skalere AI-løsninger for at forbedre kundeoplevelsen, automatisere arbejdsprocesser og låse op for kreativt potentiale, hvilket skaber målbar effekt og konkurrencemæssig differentiering.

For at hjælpe kunderne på rejsen tilbyder vi pris- og omkostningsstyringsløsninger, der opfylder dine behov. herunder:
  • Standard (On-Demand): Betalt efter forbrug for input- og outputtokens.
  • Klargjorte (PTU‘er): Alloker gennemløb med forudsigelige omkostninger med månedlige og årlige reservationer til rådighed for at reducere det samlede forbrug.
  • Batch API: Sprogmodeller er nu også tilgængelige iBatch API til globale udrulninger og tre områder, der returnerer fuldførelser inden for 24 timer for en rabat på 50 % på globale standardpriser.
Du kan vælge mellem følgende udrulningstyper for standard og klargjort, som giver større fleksibilitet og kontrol over priser og ydeevne. Denne fleksibilitet hjælper, når der er stadig mere restriktive grænser for databehandling og behov for øget dataoverførselshastighed og lavere pris.
  • Global udrulning – Global SKU
  • Udrulning af datazone – Geografisk baseret (EU eller USA)
  • Udrulning lokalt – Lokalt område (op til 27 områder)

Se prismuligheder

Anvend filtre for at tilpasse prismulighederne efter dine behov.

Priserne er kun estimater og er ikke beregnet som faktiske pristilbud. De faktiske priser kan variere afhængigt af den type aftale, der er indgået med Microsoft, købsdatoen og valutakursen. Priserne beregnes ud fra den amerikanske dollar og konverteres ved hjælp af London børsens slutkurs, der registreres i løbet af de to hverdage før den sidste hverdag i den forrige måned. Hvis de to hverdage før månedens slutning falder på en banklukkedag på større markeder, angives kursen umiddelbart dagen før de to hverdage. Denne kurs gælder for alle transaktioner i løbet af den kommende måned. Log på Azure-prisberegneren for at se priser baseret på dit aktuelle program/tilbud med Microsoft. Kontakt en Azure-salgsspecialist for at få flere oplysninger om priser eller for at anmode om et pristilbud. Se ofte stillede spørgsmål om Azure-priser.

o1

o1 er den nye serie af ræsonneringsmodel til komplekse opgaver. Modellen har 200.000 kontekster og en skæringsdato for viden fra oktober 2023.

Model Priser (1 mio. tokens)
o1 1217 global Input: $-
Cachelagret input: $-
Output: $-
o1 1217 USA/EU – datazoner Input: $-
Cachelagret input: $-
Output: $-
o1 1217 område Input: $-
Cachelagret input: $-
Output: $-
o1 global prøveversion Input: $-
Cachelagret input: $-
Output: $-
o1 prøveversion i datazonerne USA/EU Input: $-
Cachelagret input: $-
Output: $-
o1 prøveversion efter område Input: $-
Cachelagret input: $-
Output: $-

Planlæg med prisberegneren

o1 Mini

o1-mini er en hurtig og omkostningseffektiv ræsonnerende model, der er skræddersyet til brugscases til kodning, matematik og videnskab. Modellen har en 128K kontekst og en oktober 2023-vidensafskæring.

Model Priser (1 mio. tokens)
Global Input: $-
Cachelagret input: $-
Output: $-
Datazoner i USA/EU Input: $-
Cachelagret input: $-
Output: $-
Regionalt Input: $-
Cachelagret input: $-
Output: $-

Planlæg med prisberegneren

API i realtid

Featured in the Realtime API, the GPT-4o-Realtime-Preview supports multilingual speech-to-speech capabilities. Optimized for real-time, low-latency conversations, it enables natural interactions with minimal delay, ideal for chatbots and conversational AI. GPT-4o is the comprehensive, more powerful version designed for complex tasks, while GPT-4o Mini is a smaller, more affordable option ideal for simpler applications where cost-efficiency and speed are priorities.

Model Priser (1 mio. tokens)
GPT-4o-Realtime-Preview-2024-12-17-Global Tekst
Input: $-
Cachelagret input: $-
Output: $-

Lyd
Input: $-
Cachelagret input: $-
Output: $-
GPT-4o-Realtime-Preview-2024-12-17-US/EU – Data Zones Tekst
Input: $-
Cachelagret input: $-
Output: $-

Lyd
Input: $-
Cachelagret input: $-
Output: $-
GPT-4o-Realtime-Preview-2024-12-17-Regional Tekst
Input: $-
Cachelagret input: $-
Output: $-

Lyd
Input: $-
Cachelagret input: $-
Output: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global Tekst
Input: $-
Cachelagret input: $-
Output: $-

Lyd
Input: $-
Cachelagret input: $-
Output: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU – Data Zones Tekst
Input: $-
Cachelagret input: $-
Output: $-

Lyd
Input: $-
Cachelagret input: $-
Output: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional Tekst
Input: $-
Cachelagret input: $-
Output: $-

Lyd
Input: $-
Cachelagret input: $-
Output: $-
GPT-4o-Realtime-Preview-2024-10-01-Global Tekst
Input: $-
Cachelagret input: $-
Output: $-

Lyd
Input: $-
Cachelagret input: $-
Output: $-
GPT-4o-Realtime-Preview-2024-10-01-US/EU – Data Zones Tekst
Input: $-
Cachelagret input: $-
Output: $-

Lyd
Input: $-
Cachelagret input: $-
Output: $-
GPT-4o-Realtime-Preview-2024-10-01-Regional Tekst
Input: $-
Cachelagret input: $-
Output: $-

Lyd
Input: $-
Cachelagret input: $-
Output: $-

Chat Completions API

Featured in the Chat Completions API, the GPT 4o-Audio-Preview model processes and generates audio content. It supports advanced features like speech recognition and audio synthesis, ideal for asynchronous speech interactions and sentiment analysis. GPT-4o is the comprehensive, more powerful version designed for complex tasks, while GPT-4o Mini is a smaller, more affordable option ideal for simpler applications where cost-efficiency and speed are priorities.

Model Priser (1 mio. tokens)
GPT-4o-Audio-Preview-2024-12-17-Global Tekst
Input: $-
Output: $-

Lyd
Input: $-
Output: $-
GPT-4o-Audio-Preview-2024-12-17-US/EU – Data Zones Tekst
Input: $-
Output: $-

Lyd
Input: $-
Output: $-
GPT-4o-Audio-Preview-2024-12-17-Regional Tekst
Input: $-
Output: $-

Lyd
Input: $-
Output: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Global Tekst
Input: $-
Output: $-

Lyd
Input: $-
Output: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU – Data Zones Tekst
Input: $-
Output: $-

Lyd
Input: $-
Output: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional Tekst
Input: $-
Output: $-

Lyd
Input: $-
Output: $-

GPT-4o

GPT-4o er den mest avancerede multimodale model, der er hurtigere og billigere end GPT-4 Turbo med stærkere synsfunktioner. Modellen har en 128K kontekst og en oktober 2023-vidensafskæring.

Model Priser (1 mio. tokens) Priser med Batch API (1 mio. tokens)
GPT-4o-2024-1120 global Input: $-
Cachelagret input: $-
Output: $-
Input: $-
Output: $-
GPT-4o-2024-1120 US/EU – datazoner Input: $-
Cachelagret input: $-
Output: $-
Input: $-
Output: $-
GPT-4o-2024-1120 område Input: $-
Cachelagret input: $-
Output: $-
I/T
GPT-4o-2024-08-06 Global Input: $-
Cachelagret input: $-
Output: $-
Input: $-
Output: $-
GPT-4o-2024-08-06 US/EU – datazoner Input: $-
Cachelagret input: $-
Output: $-
Input: $-
Output: $-
GPT-4o-2024-08-06 område Input: $-
Cachelagret input: $-
Output: $-
I/T
GPT-4o-2024-0513 global Input: $-
Output: $-
Input: $-
Output: $-
GPT-4o-2024-0513 US/EU – datazoner Input: $-
Output: $-
I/T
GPT-4o-2024-0513 område Input: $-
Output: $-
I/T

Planlæg med prisberegneren

GPT-4o mini

GPT-4o mini er den mest omkostningseffektive lille model og har visionsfunktioner. Modellen har en 128K kontekst og en oktober 2023-vidensafskæring.

Model Priser (1 mio. tokens) Priser med Batch API (1 mio. tokens)
GPT-4o-mini-0718 Global Input: $-
Cachelagret input: $-
Output: $-
Input: $-
Output: $-
GPT-4o-mini-0718 US/EU – Data Zones Input: $-
Cachelagret input: $-
Output: $-
Input: $-
Output: $-
GPT-4o-mini-0718 Regional Input: $-
Cachelagret input: $-
Output: $-
I/T

Planlæg med prisberegneren

Klargjort

Du kan allokere og administrere gennemløb for udrulninger, så du sikrer forudsigelig ydeevne og stabil kapacitet. Du opkræves en timepris pr. model uanset forbrug, men du kan også sikre yderligere besparelser via månedlige og årlige reservationer. Se, hvordan du overfører dine regionale udrulninger og klargjorte reservationer til globale zoner og datazoner på denne Learn-side.

Model Min. PTU'er Priser på PTU pr. time Priser på månedlig PTU-reservation Priser for årlig PTU-reservation
GPT-4o Global 15 $- $- $-
GPT-4o datazoner i USA/EU 15 $- $- $-
GPT-4o regional 50 $- $- $-
Fine-Tuned GPT-4o-Regional 50 $- $- $-
GPT-4o Mini Global 15 $- $- $-
GPT-4o Mini-datazoner i USA/EU 15 $- $- $-
GPT-4o Mini område 25 $- $- $-
Fine-Tuned GPT-4o-Mini Regional 25 $- $- $-

Planlæg med prisberegneren

Basismodeller

Modeller Forbrug pr. 1.000 tokens
Babbage-002 $-
Davinci-002 $-

Modeller til finjustering

Model Priser
GPT-4o-2024-08-06 Regionalt Input: $-/1 mio. tokens
Cachelagret input: $-/1 mio. tokens
Output: $-/1 mio. tokens
Undervisning: $-/1 mio. tokens
Hosting: $- pr. time
Global Input: $-/1 mio. tokens
Cachelagret input: $-/1 mio. tokens
Output: $-/1 mio. tokens
Undervisning: brug område
Hosting: $- pr. time
GPT-4o-mini Regionalt Input: $-/1 mio. tokens
Cachelagret input: $-/1 mio. tokens
Output: $-/1 mio. tokens
Undervisning: $-/1 mio. tokens
Hosting: $- pr. time
Global Input: $-/1 mio. tokens
Cachelagret input: $-/1 mio. tokens
Output: $-/1 mio. tokens
Undervisning: brug område
Hosting: $- pr. time
GPT-4-0613 (8K) Regionalt Input: $-/1 mio. tokens
Output: $-/1 mio. tokens
Undervisning: $-/1 mio. tokens
Hosting: $- pr. time
GPT-3.5-Turbo (16K) Regionalt Input: $-/1 mio. tokens
Output: $-/1 mio. tokens
Undervisning: $-/1 mio. tokens
Hosting: $- pr. time
GPT-3.5-Turbo (4K) Regionalt Input: $-/1 mio. tokens
Output: $-/1 mio. tokens
Undervisning: $-/1 mio. tokens
Hosting: $- pr. time
Babbage-002 Input: $-/1 mio. tokens
Output: $-/1 mio. tokens
Undervisning: $-/1 mio. tokens
Hosting: $- pr. time
Davinci-002 Input: $-/1 mio. tokens
Output: $-/1 mio. tokens
Undervisning: $-/1 mio. tokens
Hosting: $- pr. time

Assistent-API

Assistent-API'en og dens værktøjer gør det nemt for udviklere at bygge assistenter med kunstig intelligens i deres programmer.

De tokens, der bruges til assistent-API'en, faktureres til den valgte sprogmodels input-/outputpriser pr. token, der bruges med hver assistent. Derudover opkræver vi følgende gebyrer for brug af værktøjer:

Værktøj Input
Filsøgning* $- pr. GB vektorlager pr. dag (1 GB gratis)
Kodefortolker** $-/session

*GB refererer til binære gigabyte, hvor 1 GB er 2^30 byte.

**Hvis din assistent kalder Kodefortolker samtidigt i to forskellige tråde, vil dette oprette to kodefortolkersessioner (2 * $-). Hver session er som standard aktiv i én time, hvilket betyder, at du kun betaler dette gebyr én gang, hvis din bruger bliver ved med at give instruktioner til Kodefortolker i samme tråd i op til en time.

Udledningsomkostningerne (input og output) varierer afhængigt af den GPT-model, der bruges sammen med hver assistent. Hvis din assistent kalder Kodefortolker samtidigt i to forskellige tråde, vil dette oprette to kodefortolkersessioner (2 * $-). Hver session er som standard aktiv i en time, hvilket betyder, at prisen er op til én time med instruktioner til kodefortolkeren i den samme tråd.

Billedmodeller

Modeller Kvalitet Opløsning Pris (pr. 100 billeder)
Dall-E-3 Standard 1024 * 1024 $-
Standard 1024 * 1792,
1792 * 1024
$-
Dall-E-3 HD 1024 * 1024 $-
HD 1024 * 1792,
1792 * 1024
$-
Dall-E-2 Standard 1024 * 1024 $-

Integrering af modeller

Modeller Pr. 1.000 tokens
Ada $-
tekstintegrering-3-stor $-
tekstintegrering-3-lille $-

Talemodeller

Modeller Pris
Hviske $- pr. time
TTS (Tekst-til-tale) $-/1 mio. tegn
TTS HD $-/1 mio. tegn

Ældre sprogmodeller

Modeller Kontekst Input (pr. 1 mio. tokens) Output (pr. 1 mio. tokens)
GPT-3.5-Turbo-0301 4K $- $-
GPT-3.5-Turbo-0613 4K $- $-
GPT-3.5-Turbo-0613 16K $- $-
GPT-3.5-Turbo-1106 16K $- $-
GPT-3.5-Turbo-0125 16K $- $-
GPT-3.5-Turbo-Instruct 4K $- $-
GPT-4-Turbo 128K $- $-
GPT-4-Turbo-Vision 128K $- $-
GPT-4 8K $- $-
GPT-4 32K $- $-

Azure-priser og købsmuligheder

Få direkte kontakt til os

Få en gennemgang af Azure-prisfastsættelse. Få en forståelse af prisfastsættelsen på din skyløsning, få mere at vide om omkostningsoptimering, og anmod om et tilpasset tilbud.

Tal med en sælger

Se flere måder at købe på

Køb Azure-tjenester via Azure-webstedet, en Microsoft-repræsentant eller en Azure-partner.

Se nærmere på dine muligheder

Flere ressourcer

Azure OpenAI Service

Få mere at vide om funktioner og egenskaber i forbindelse med Azure OpenAI Service.

Prisberegner

Anslå dine forventede månedlige omkostninger ved hjælp af en hvilken som helst kombination af Azure-produkter.

SLA

Gennemse serviceniveauaftalen for Azure OpenAI Service.

Dokumentation

Se tekniske vejledninger, videoer og andet Azure OpenAI Service-materiale.

  • Azure OpenAI-tjenesten tilbyder priser, der er baseret på både betal efter forbrug og klargjorte enheder for gennemløb (PTU'er). Betalt efter forbrug giver dig mulighed for at betale for de ressourcer, du bruger, hvilket gør det fleksibelt for variable arbejdsbelastninger. PTU'er tilbyder en forudsigelig prismodel, hvor du reserverer og udruller en bestemt mængde modelbehandlingskapacitet. Denne model er ideel til arbejdsbelastninger med konsekvente eller forudsigelige brugsmønstre, der giver stabilitets- og omkostningsstyring.
  • Hvis du vil vide mere om PTUs- og Azure Open AI-priser, kan du læse PTU-dokumentation eller kontakte vores salgsspecialist

Tal med en sælger, og få en gennemgang af Azure-priserne. Få en forståelse af prisen på din cloudløsning.

Få gratis cloudtjenester og en kredit på $200, så du kan udforske Azure i 30 dage.

Tilføjet for at beregne. Tryk på 'v' for at få vist på beregner
Kan vi hjælpe dig?