Azure OpenAI Service – Preisübersicht
To help customers in the journey, we offer pricing and cost management solutions to meet your needs. including:
- Standard (On-Demand): Pay-as-you-go for input and output tokens.
- Provisioned (PTUs): Allocate throughput with predictable costs, with monthly and annual reservations available to reduce overall spend.
- Batch API: Language models are also now available in the Batch API for global deployments and three regions, that returns completions within 24 hours for a 50% discount on Global Standard Pricing.
- Global Deployment – Global SKU
- Data Zone Deployment – Geographic based (EU or US)
- Regional Deployment – Local Region (up to 27 regions)
Preisoptionen entdecken
Sie können die Preisoptionen mit Filtern anpassen.
Preise sind nur Schätzungen und nicht als tatsächliche Preisangebote vorgesehen. Die tatsächlichen Preise können je nach Art des mit Microsoft eingegangenen Vertrags, dem Kaufdatum und dem Wechselkurs variieren. Die Preise werden auf der Grundlage des US-Dollars berechnet und anhand der Londoner Schlusskassakurse umgerechnet, die an den beiden Geschäftstagen vor dem letzten Geschäftstag des vorangegangenen Monatsendes erfasst werden. Wenn die beiden Geschäftstage vor dem Monatsende auf einen Bankfeiertag in wichtigen Märkten fallen, ist der Tag der Kursfeststellung in der Regel der Tag, der den beiden Geschäftstagen unmittelbar vorausgeht. Dieser Kurs gilt für alle Transaktionen im kommenden Monat. Melden Sie sich beim Azure-Preisrechner an, um die Preise basierend auf Ihrem aktuellen Programm/Angebot mit Microsoft anzuzeigen. Wenden Sie sich an einen Azure-Vertriebsspezialisten, um weitere Informationen zu den Preisen zu erhalten oder ein Preisangebot anzufordern. Siehe häufig gestellte Fragen zu Azure-Preisen.
US-amerikanische Regierungsbehörden sind für den Erwerb von Azure Government-Diensten von einem Lizenzlösungsanbieter qualifiziert, ohne dass vorab eine finanzielle Verpflichtung eingegangen werden muss. Alternativ kann Azure Government auch direkt über ein Onlineabonnement mit nutzungsbasierter Bezahlung bezogen werden.
Wichtig: Der Preis in R$ dient lediglich als Referenz; hierbei handelt es sich um eine internationale Transaktion; der Endpreis unterliegt Wechselkursen und der Berücksichtigung von IOF-Steuern. eNF wird nicht ausgegeben.
US-amerikanische Regierungsbehörden sind für den Erwerb von Azure Government-Diensten von einem Lizenzlösungsanbieter qualifiziert, ohne dass vorab eine finanzielle Verpflichtung eingegangen werden muss. Alternativ kann Azure Government auch direkt über ein Onlineabonnement mit nutzungsbasierter Bezahlung bezogen werden.
Wichtig: Der Preis in R$ dient lediglich als Referenz; hierbei handelt es sich um eine internationale Transaktion; der Endpreis unterliegt Wechselkursen und der Berücksichtigung von IOF-Steuern. eNF wird nicht ausgegeben.
o1 Preview
o1 is the new reasoning model series for complex tasks. The model has 128K context and an October 2023 knowledge cutoff.
Model | Pricing (1M Tokens) |
---|---|
Global |
Eingabe: $- Cached Input: $- Output: $- |
US/EU – Data Zones |
Eingabe: $- Cached Input: $- Output: $- |
Regional |
Eingabe: $- Cached Input: $- Output: $- |
Plan with the Pricing Calculator
o1 Mini
o1-mini is a fast, cost-efficient reasoning model tailored to coding, math, and science use cases. The model has 128K context and an October 2023 knowledge cutoff.
Model | Pricing (1M Tokens) |
---|---|
Global |
Eingabe: $- Cached Input: $- Output: $- |
US/EU – Data Zones |
Eingabe: $- Cached Input: $- Output: $- |
Regional |
Eingabe: $- Cached Input: $- Output: $- |
Plan with the Pricing Calculator
Realtime API
Featured in the Realtime API, the GPT-4o-Realtime-Preview supports multilingual speech-to-speech capabilities. Optimized for real-time, low-latency conversations, it enables natural interactions with minimal delay, ideal for chatbots and conversational AI.
Model | Pricing (1M Tokens) |
---|---|
GPT-4o-Realtime-Preview-Global |
Text Eingabe: $- Cached Input: $- Output: $- Audio Eingabe: $- Cached Input: $- Output: $- |
GPT-4o-Realtime-Preview-US/EU – Data Zones |
Text Eingabe: $- Cached Input: $- Output: $- Audio Eingabe: $- Cached Input: $- Output: $- |
GPT-4o-Realtime-Preview-Regional |
Text Eingabe: $- Cached Input: $- Output: $- Audio Eingabe: $- Cached Input: $- Output: $- |
Chat Completions API - Coming soon
Featured in the Chat Completions API, the GPT 4o-Audio-Preview model processes and generates audio content. It supports advanced features like speech recognition and audio synthesis, ideal for asynchronous speech interactions and sentiment analysis.
Model | Pricing (1M Tokens) |
---|---|
GPT-4o-Audio-Preview-Global |
Text Eingabe: $- Cached Input: Nicht verfügbar Output: $- Audio Eingabe: $- Cached Input: Nicht verfügbar Output: $- |
GPT-4o
GPT-4o is the most advanced multimodal model that’s faster and cheaper than GPT-4 Turbo with stronger vision capabilities. The model has 128K context and an October 2023 knowledge cutoff.
Model | Pricing (1M Tokens) | Pricing with Batch API (1M Tokens) |
---|---|---|
GPT-4o-2024-08-06 Global |
Eingabe: $- Cached Input: $- Output: $- |
Eingabe: $- Output: $- |
US/EU – Data Zones |
Eingabe: $- Cached Input: $- Output: $- |
Nicht verfügbar |
Regional |
Eingabe: $- Cached Input: $- Output: $- |
Nicht verfügbar |
GPT-4o-0513 Global |
Eingabe: $- Output: $- |
Eingabe: $- Output: $- |
US/EU – Data Zones |
Eingabe: $- Output: $- |
Nicht verfügbar |
Regional |
Eingabe: $- Output: $- |
Nicht verfügbar |
Plan with the Pricing Calculator
GPT-4o mini
GPT-4o mini is the most cost-efficient small model, and has vision capabilities. The model has 128K context and an October 2023 knowledge cutoff.
Model | Pricing (1M Tokens) | Pricing with Batch API (1M Tokens) |
---|---|---|
Global |
Eingabe: $- Cached Input: $- Output: $- |
Eingabe: $- Output: $- |
US/EU – Data Zones |
Eingabe: $- Cached Input: $- Output: $- |
Nicht verfügbar |
Regional |
Eingabe: $- Cached Input: $- Output: $- |
Nicht verfügbar |
Plan with the Pricing Calculator
Provisioned
You can allocate and manage throughput for deployments, ensuring predictable performance and stable capacity. You are charged an hourly rate per model regardless of usage, but you can also secure additional savings through monthly and annual reservations. Discover how to transition your regional deployments and provisioned reservations to global and data zones on this Learn page.
Model | Min PTUs | PTU Hourly pricing | PTU Monthly Reservation Pricing | PTU Yearly Reservation Pricing |
---|---|---|---|---|
GPT-4o Global | 50 | $- | $- | $- |
GPT-4o US/EU Data Zones | 50 | $- | $- | $- |
GPT-4o Regional | 50 | $- | $- | $- |
GPT-4o Mini Global | 25 | $- | $- | $- |
GPT-4o Mini US/EU Data Zones | 25 | $- | $- | $- |
GPT-4o Mini Regional | 25 | $- | $- | $- |
Plan with the Pricing Calculator
Basismodelle
Modelle | Nutzung pro 1 000 Token |
---|---|
Babbage-002 | $- |
Davinci-002 | $- |
Optimieren von Modellen
Modelle | Training pro 1.000 Token | Hosting pro Stunde | Eingabenutzung pro 1 000 Token | Ausgabenutzung pro 1 000 Token | Cached Input per 1,000 tokens |
---|---|---|---|---|---|
Babbage-002 | $- | $- | $- | $- | Nicht verfügbar |
Davinci-002 | $- | $- | $- | $- | Nicht verfügbar |
GPT-3.5-Turbo (4K) | $- | $- | $- | $- | Nicht verfügbar |
GPT-3.5-Turbo (16K) | $- | $- | $- | $- | Nicht verfügbar |
GPT-4 (8K) | $- | $- | $- | $- | Nicht verfügbar |
GPT-4o | $- | $- | $- | $- | Nicht verfügbar |
GPT-4o-mini | $- | $- | $- | $- | $- |
GPT-4o-0806 | Nicht verfügbar | Nicht verfügbar | Nicht verfügbar | Nicht verfügbar | $- |
Assistenten-API
Die Assistants-API und die zugehörigen Tools erleichtern Entwicklern das Erstellen von KI-Assistenten in ihren Anwendungen.
Die für die Assistenten-API verwendeten Token werden gemäß den für jeden Assistenten verwendeten Tokeneingabe-/Ausgaberaten des ausgewählten Sprachmodells abgerechnet. Darüber hinaus berechnen wir die folgenden Gebühren für die Toolnutzung:
Tool | Eingabe |
---|---|
Dateisuche* | $-/GB Vektorspeicher pro Tag (1 GB frei) |
Codeinterpreter** | $-/Session |
*GB bezieht sich auf binäre Gigabytes, wobei 1 GB 2^30 Bytes beträgt.
**Wenn Ihr Assistent den Codeinterpreter gleichzeitig in zwei verschiedenen Threads aufruft, werden zwei Codeinterpretersitzungen erstellt (2 * $-). Jede Sitzung ist standardmäßig eine Stunde lang aktiv. Dies bedeutet, dass Sie diese Gebühr nur einmal bezahlen würden, wenn Ihr Benutzer bis zu einer Stunde lang Anweisungen an den Code Interpreter im selben Thread weitergibt.
Die Rückschlusskosten (Eingabe und Ausgabe) variieren je nach GPT-Modell, das mit den einzelnen Assistenten verwendet wird. Wenn Ihr Assistent den Code Interpreter gleichzeitig in zwei verschiedenen Threads aufruft, werden zwei Code Interpreter-Sitzungen erstellt (2 * $-). Jede Sitzung ist standardmäßig eine Stunde lang aktiv. Dies bedeutet, dass der Preis für bis zu einer Stunde gilt, in der Sie Code-Interpreter im selben Thread Anweisungen geben.
Bildmodelle
Modelle | Qualität | Auflösung | Preis (pro 100 Bilder) |
---|---|---|---|
Dall-E-3 | Standard | 1024 * 1024 | $- |
Standard | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-3 | HD | 1024 * 1024 | $- |
HD | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-2 | Standard | 1024 * 1024 | $- |
Modelle einbetten
Modelle | Pro 1000 Token |
---|---|
Ada | $- |
text-embedding-3-large | $- |
text-embedding-3-small | $- |
Sprachmodelle
Modelle | Preis |
---|---|
Flüstern | $-/Stunde |
TTS (Text-zu-Sprache) | $-/1 Mio. Zeichen |
TTS HD | $-/1 Mio. Zeichen |
Legacy-Sprachmodelle
Modelle | Kontext | Input (Per 1M Tokens) | Output (Per 1M Tokens) |
---|---|---|---|
GPT-3.5-Turbo-0301 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 16K | $- | $- |
GPT-3.5-Turbo-1106 | 16K | $- | $- |
GPT-3.5-Turbo-0125 | 16K | $- | $- |
GPT-3.5-Turbo-Instruct | 4K | $- | $- |
GPT-4-Turbo | 128K | $- | $- |
GPT-4-Turbo-Vision | 128K | $- | $- |
GPT-4 | 8K | $- | $- |
GPT-4 | 32K | $- | $- |
Azure-Preise und -Kaufoptionen
Direkten Kontakt aufnehmen
Erhalten Sie eine Übersicht über die Azure-Preise. Informieren Sie sich über die Preise für Ihre Cloudlösung und die Möglichkeiten zur Kostenoptimierung, und fordern Sie ein individuelles Angebot an.
Sprechen Sie mit einem VertriebsspezialistenKaufoptionen
Erwerben Sie Azure-Dienste über die Azure-Website, einen Microsoft-Vertreter oder einen Azure-Partner.
Optionen kennenlernenZusätzliche Ressourcen
Azure OpenAI-Dienst
Hier erhalten Sie weitere Informationen zu den Features und Funktionen von Azure OpenAI-Dienst.
Preisrechner
Kalkulieren Sie Ihre erwarteten monatlichen Kosten für eine beliebige Kombination von Azure-Produkten.
SLA
Lesen Sie die Vereinbarung zum Servicelevel für Azure OpenAI-Dienst.
Dokumentation
Hier finden Sie technische Tutorials, Videos und weitere Ressourcen zu Azure OpenAI-Dienst.
Häufig gestellte Fragen
-
Azure OpenAI Service bietet Preise, die sowohl auf nutzungsbasierter Zahlung als auch auf PTUs (Provisioned Throughput Units) basieren. Mit der nutzungsbasierten Zahlung zahlen Sie für die Ressourcen, die Sie nutzen, sodass sie für variable Workloads flexibel sind. PTUs bieten ein vorhersagbares Preismodell, bei dem Sie eine bestimmte Menge an Modellverarbeitungskapazität reservieren und bereitstellen. Dieses Modell eignet sich ideal für Workloads mit konsistenten oder vorhersagbaren Nutzungsmustern und bietet Stabilität und Kostenkontrolle.
-
Weitere Informationen zu PTUs und Azure OpenAI-Preisen finden Sie in der PTU-Dokumentation, oder wenden Sie sich an unseren Vertriebsexperten.
Sprechen Sie für eine detaillierte Erläuterung der Azure-Preise mit einem Vertriebsspezialisten. Lernen Sie, die Berechnung der Preise für Ihre Cloudlösung zu verstehen.
Sichern Sie sich kostenlose Cloud-Dienste und ein Guthaben in Höhe von $200, mit dem Sie Azure 30 Tage lang erkunden können.