Gå till huvudinnehåll
Azure

Priser för Azure OpenAI Service

Översikt över Azure OpenAI-tjänstens prissättning

Unlock the power of Azure OpenAI Service's generative AI models with flexible Standard (On-Demand) and Provisioned Throughput Units (PTUs). The Standard model lets you pay only for tokens processed, while PTUs ensure consistent throughput and minimal latency variance for scalable solutions. Pricing includes costs per 1,000 tokens, and PTU rates provide a predictable cost structure. Language models are also now available in the Batch API that returns completions within 24 hours for a 50% discount on Global Standard Pricing. Azure OpenAI Service offers advanced capabilities like GPT-4o, fine-tuning for customization, DALL-E for image generation, and Whisper for speech-to-text. For personalized guidance on optimizing AI deployments, contact a sales specialist.

Utforska prisalternativ

Använd filter för att anpassa prisalternativ efter dina behov.

Priserna är endast uppskattningar och är inte avsedda som faktiska priscitat. Den faktiska prissättningen kan variera beroende på vilken typ av avtal som ingås med Microsoft, inköpsdatum och växelkursen. Priserna beräknas baserat på amerikanska dollar och konverteras med London stängningskurs som registreras under de två arbetsdagarna före den sista arbetsdagen i föregående månads slut. Om de två arbetsdagarna före slutet av månaden infaller på en helgdag på större marknader är prisinställningsdagen vanligtvis dagen omedelbart före de två arbetsdagarna. Den här avgiften gäller för alla transaktioner under den kommande månaden. Logga in på priskalkylatorn för Azure för att se priser baserat på ditt aktuella program/erbjudande hos Microsoft. Kontakta en Azure försäljningsspecialist för mer information om prissättning eller för att begära en prisoffert. Se vanliga frågor och svar om Prissättning för Azure.

Prisinformation:

Språkmodeller

Modeller Kontext Input (Per 1,000,000 tokens) Output (Per 1,000,000 tokens) Pris per PTU och timme Minsta skalningssteg Månatlig reservation per PTU Årlig reservation per PTU
o1 preview Global Deployment 128K $- $- Inte tillämpligt Inte tillämpligt Inte tillämpligt Inte tillämpligt
o1 preview Regional API 128K $- $- Inte tillämpligt Inte tillämpligt Inte tillämpligt Inte tillämpligt
o1 mini Global Deployment 128K $- $- Inte tillämpligt Inte tillämpligt Inte tillämpligt Inte tillämpligt
o1 mini Regional API 128K $- $- Inte tillämpligt Inte tillämpligt Inte tillämpligt Inte tillämpligt
gpt-4o-2024-08-06 Global Deployment 128K $- $- Inte tillämpligt Inte tillämpligt Inte tillämpligt Inte tillämpligt
gpt-4o-2024-08-06 Regional API 128K $- $- Inte tillämpligt Inte tillämpligt Inte tillämpligt Inte tillämpligt
Global GPT-4o-distribution 128K $- $- $- 50 PTU:er $- $-
GPT-4o Regional API 128K $- $- $- 50 PTU:er $- $-
Global distribution av GPT-4o-mini 128K $- $- $- 25 PTU:er $- $-
Regionalt API för GPT-4o-mini 128K $- $- $- 25 PTU:er $- $-

I den här tabellen visas en detaljerad jämförelse av standardpriser (på begäran) jämfört med prissättning med alternativet med Etablerat (PTU) för olika språkmodeller. I kolumnen Kontext anges det maximala antalet token som varje modell kan hantera per svar. Prisinformation för in- och utdatatoken visas i listan och avser kostnaden per 1 000 token. PTU-prissättningsmodellen innehåller ett timpris och en minsta skalningsökning, vilket avser det minsta antalet PTU:er som krävs för varje modell. Kolumnerna Månatlig reservation per PTU och Årlig reservation per PTU anger reservationskostnaderna per PTU. Jämförelsen hjälper användarna att förstå hur kostnaderna påverkas av användningen av de olika modellerna under faktureringsalternativen Standard (på begäran) och Etablerat (PTU) så att de kan fatta välgrundade beslut baserat på de specifika användningsbehoven.

Language models are also now available in the Batch API that returns completions within 24 hours for a 50% discount on Global Standard Pricing.

Äldre språkmodeller

Modeller Kontext Input (Per 1,000,000 tokens) Output (Per 1,000,000 tokens)
GPT-3.5-Turbo-0301 4K $- $-
GPT-3.5-Turbo-0613 4K $- $-
GPT-3.5-Turbo-0613 16K $- $-
GPT-3.5-Turbo-1106 16K $- $-
GPT-3.5-Turbo-0125 16K $- $-
GPT-3.5-Turbo-Instruct 4K $- $-
GPT-4-Turbo 128K $- $-
GPT-4-Turbo-Vision 128K $- $-
GPT-4 8K $- $-
GPT-4 32K $- $-

API för assistenter

Med API:et för assistenter och verktyg kan utvecklare enkelt skapa AI-assistenter i sina program.

De token som används för API:et för assistenter faktureras enligt den valda språkmodellens in-/utdatahastigheter per token som används för varje assistent. Dessutom debiterar vi följande avgifter för verktygsanvändning:

Verktyg Indata
Filsökning* $-/GB vektorlagring per dag (1 GB ledigt)
Kodtolken** $-/session

*GB refererar till binära gigabyte, där 1 GB är 2^30 byte.

**Om assistenten anropar kodtolken samtidigt i två olika trådar skulle det skapa två kodtolkssessioner (2 * $-). Varje session är aktiv som standard i en timme, vilket innebär att du bara betalar den här avgiften en gång om användaren fortsätter att ge instruktioner till kodtolken i samma tråd i upp till en timme.

Kostnad för slutsatsdragning (indata och utdata) varierar beroende på vilken GPT-modell som används med varje assistent. Om assistenten anropar kodtolken samtidigt i två olika trådar, skapas två kodtolkningssessioner (2 * $-). Varje session är aktiv som standard i en timme, vilket innebär att priset avser upp till en timme med instruktioner till kodtolken i samma tråd.

Basmodeller

Modeller Användning per 1 000 token
Babbage 002 $-
Davinci 002 $-

Finjustera modeller

Modeller Träning per 1 000 tokens Värd per timme Indataanvändning per 1 000 token Utdataanvändning per 1 000 token
Babbage 002 $- $- $- $-
Davinci 002 $- $- $- $-
GPT-3.5-Turbo (4K) $- $- $- $-
GPT-3.5-Turbo (16K) $- $- $- $-
GPT-4 (8K) $- $- $- $-
GPT-4o $- $- $- $-
GPT-4o-mini $- $- $- $-

Bildmodeller

Modeller Kvalitet Upplösning Pris (per 100 bilder)
Dall-E-3 Standard 1024 * 1024 $-
Standard 1024 * 1792,
1792 * 1024
$-
Dall-E-3 HD 1024 * 1024 $-
HD 1024 * 1792,
1792 * 1024
$-
Dall-E-2 Standard 1024 * 1024 $-

Bäddar in modeller

Modeller Per 1 000 tokens
Ada $-
text-embedding-3-large $-
text-embedding-3-small $-

Talmodeller

Modeller Pris
Whisper $-/timme
TTS (Text till tal) $-/1 miljon tecken
TTS HD $-/1 miljon tecken

Priser och köpalternativ för Azure

Kontakta oss direkt

Få en genomgång av priser för Azure. Förstå prissättningen för din molnlösning, läs mer om kostnadsoptimering och begär ett anpassat förslag.

Prata med en säljare

Se köpalternativ

Köp Azure-tjänster via Azure-webbplatsen, din Microsoft-representant eller en Azure-partner.

Utforska dina alternativ

Ytterligare resurser

Azure OpenAI Service

Läs mer om funktioner och egenskaper för Azure OpenAI Service.

Priskalkylator

Beräkna din förväntade månadskostnad för användning av valfri kombination av Azure-produkter.

SLA

Granska serviceavtalet för Azure OpenAI Service.

Dokumentation

Ta del av tekniska självstudiekurser, videor och fler resurser för Azure OpenAI Service.

Vanliga frågor och svar

  • Azure OpenAI Service erbjuder priser baserat på både betala per användning och etablerade dataflödesenheter (PTU). Med Betala per användning kan du betala för de resurser du förbrukar, vilket gör det flexibelt för varierande arbetsbelastningar. PTU:er erbjuder en förutsägbar prismodell där du reserverar och distribuerar en viss mängd modellbearbetningskapacitet. Den här modellen är perfekt för arbetsbelastningar med konsekventa eller förutsägbara användningsmönster, vilket ger stabilitet och kostnadskontroll.
  • Mer information om PTU:er och priser för Azure Open AI finns i PTU-dokumentationen eller kontakta vår säljspecialist

Prata med en säljare för att få en genomgång av Azure-priser. Förstå prissättningen av din molnlösning.

Få kostnadsfria molntjänster och en kredit på $200 för att utforska Azure i 30 dagar.

Har lagts till i beräkningen. Tryck på ”v” för att visa på kalkylator
Kan vi hjälpa dig?