Azure OpenAI Service – Preisübersicht
Um unsere Kunden auf diesem Weg zu unterstützen, bieten wir Lösungen für die Preisgestaltung und das Kostenmanagement an, die Ihren Anforderungen gerecht werden, darunter:
- Standard (bedarfsgesteuert): Nutzungsbasierte Bezahlung für Eingabe- und Ausgabetoken.
- Bereitgestellt (PTUs): Weisen Sie Durchsatz mit vorhersehbaren Kosten zu, wobei monatliche und jährliche Reservierungen verfügbar sind, um die Gesamtausgaben zu reduzieren.
- Batch-API: Sprachmodelle sind jetzt auch in derBatch-API für globale Bereitstellungen und drei Regionen verfügbar, die innerhalb von 24 Stunden zu einem Rabatt von 50 % auf den globalen Standardpreis abgeschlossen wird.
- Globale Bereitstellung – Globale SKU
- Datenzonenbereitstellung – Geografisch (EU oder USA)
- Regionale Bereitstellung – Lokale Region (bis zu 27 Regionen)
Preisoptionen entdecken
Sie können die Preisoptionen mit Filtern anpassen.
Preise sind nur Schätzungen und nicht als tatsächliche Preisangebote vorgesehen. Die tatsächlichen Preise können je nach Art des mit Microsoft eingegangenen Vertrags, dem Kaufdatum und dem Wechselkurs variieren. Die Preise werden auf der Grundlage des US-Dollars berechnet und anhand der Londoner Schlusskassakurse umgerechnet, die an den beiden Geschäftstagen vor dem letzten Geschäftstag des vorangegangenen Monatsendes erfasst werden. Wenn die beiden Geschäftstage vor dem Monatsende auf einen Bankfeiertag in wichtigen Märkten fallen, ist der Tag der Kursfeststellung in der Regel der Tag, der den beiden Geschäftstagen unmittelbar vorausgeht. Dieser Kurs gilt für alle Transaktionen im kommenden Monat. Melden Sie sich beim Azure-Preisrechner an, um die Preise basierend auf Ihrem aktuellen Programm/Angebot mit Microsoft anzuzeigen. Wenden Sie sich an einen Azure-Vertriebsspezialisten, um weitere Informationen zu den Preisen zu erhalten oder ein Preisangebot anzufordern. Siehe häufig gestellte Fragen zu Azure-Preisen.
US-amerikanische Regierungsbehörden sind für den Erwerb von Azure Government-Diensten von einem Lizenzlösungsanbieter qualifiziert, ohne dass vorab eine finanzielle Verpflichtung eingegangen werden muss. Alternativ kann Azure Government auch direkt über ein Onlineabonnement mit nutzungsbasierter Bezahlung bezogen werden.
Wichtig: Der Preis in R$ dient lediglich als Referenz; hierbei handelt es sich um eine internationale Transaktion; der Endpreis unterliegt Wechselkursen und der Berücksichtigung von IOF-Steuern. eNF wird nicht ausgegeben.
US-amerikanische Regierungsbehörden sind für den Erwerb von Azure Government-Diensten von einem Lizenzlösungsanbieter qualifiziert, ohne dass vorab eine finanzielle Verpflichtung eingegangen werden muss. Alternativ kann Azure Government auch direkt über ein Onlineabonnement mit nutzungsbasierter Bezahlung bezogen werden.
Wichtig: Der Preis in R$ dient lediglich als Referenz; hierbei handelt es sich um eine internationale Transaktion; der Endpreis unterliegt Wechselkursen und der Berücksichtigung von IOF-Steuern. eNF wird nicht ausgegeben.
o1
o1 is the new reasoning model series for complex tasks. The model has 200K context and an October 2023 knowledge cutoff.
Modell | Preise (1 Mio. Token) |
---|---|
o1 1217 Global |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
o1 1217 US/EU – Data Zones |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
o1 1217 Regional |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
o1 preview Global |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
o1 preview US/EU – Data Zones |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
o1 preview Regional |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Planen mit dem Preisrechner
o1 Mini
o1-mini ist ein schnelles, kostengünstiges Schlussfolgerungsmodell, das auf Anwendungsfälle in den Bereichen Programmierung, Mathematik und Naturwissenschaften zugeschnitten ist. Das Modell verfügt über 128 KB Kontext und einen Wissensstand vom Oktober 2023.
Modell | Preise (1 Mio. Token) |
---|---|
Weltweit |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
USA/EU – Datenzonen |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Regional |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Planen mit dem Preisrechner
Realtime API
Featured in the Realtime API, the GPT-4o-Realtime-Preview supports multilingual speech-to-speech capabilities. Optimized for real-time, low-latency conversations, it enables natural interactions with minimal delay, ideal for chatbots and conversational AI.
Modell | Preise (1 Mio. Token) |
---|---|
GPT-4o-Realtime-Preview-Global |
Text Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- Audio Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
GPT-4o-Realtime-Preview-US/EU – Data Zones |
Text Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- Audio Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
GPT-4o-Realtime-Preview-Regional |
Text Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- Audio Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Chatvervollständigungs-API – Bald verfügbar
Featured in the Chat Completions API, the GPT 4o-Audio-Preview model processes and generates audio content. It supports advanced features like speech recognition and audio synthesis, ideal for asynchronous speech interactions and sentiment analysis. Cached input is coming soon.
Modell | Preise (1 Mio. Token) |
---|---|
GPT-4o-Audio-Preview-Global |
Text Eingabe: $- Zwischengespeicherte Eingabe: Nicht verfügbar Ausgabe: $- Audio Eingabe: $- Zwischengespeicherte Eingabe: Nicht verfügbar Ausgabe: $- |
GPT-4o
GPT-4o ist das fortschrittlichste multimodale Modell, das schneller und kostengünstiger als GPT-4 Turbo ist und stärkere Visionfunktionen bietet. Das Modell verfügt über 128 KB Kontext und einen Wissensstand vom Oktober 2023.
Modell | Preise (1 Mio. Token) | Preise mit Batch-API (1 Mio. Token) |
---|---|---|
GPT-4o-2024-1120 Global |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Eingabe: $- Ausgabe: $- |
GPT-4o-2024-1120 US/EU – Data Zones |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Eingabe: $- Ausgabe: $- |
GPT-4o-2024-1120 Regional |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Nicht verfügbar |
GPT-4o-2024-08-06 Global |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Eingabe: $- Ausgabe: $- |
GPT-4o-2024-08-06 US/EU – Data Zones |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Nicht verfügbar |
GPT-4o-2024-08-06 Regional |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Nicht verfügbar |
GPT-4o-2024-0513 Global |
Eingabe: $- Ausgabe: $- |
Eingabe: $- Ausgabe: $- |
GPT-4o-2024-0513 US/EU – Data Zones |
Eingabe: $- Ausgabe: $- |
Nicht verfügbar |
GPT-4o-2024-0513 Regional |
Eingabe: $- Ausgabe: $- |
Nicht verfügbar |
Planen mit dem Preisrechner
GPT-4o mini
GPT-4o mini ist das kostengünstigste kleine Modell und verfügt über Visionfunktionen. Das Modell verfügt über 128 KB Kontext und einen Wissensstand vom Oktober 2023.
Modell | Preise (1 Mio. Token) | Preise mit Batch-API (1 Mio. Token) |
---|---|---|
Weltweit |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Eingabe: $- Ausgabe: $- |
USA/EU – Datenzonen |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Nicht verfügbar |
Regional |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Nicht verfügbar |
Planen mit dem Preisrechner
Bereitgestellt
You can allocate and manage throughput for deployments, ensuring predictable performance and stable capacity. You are charged an hourly rate per model regardless of usage, but you can also secure additional savings through monthly and annual reservations. Discover how to transition your regional deployments and provisioned reservations to global and data zones on this Learn page.
Modell | Min. PTUs | Stündliche Preise für PTU | PTU – Preise für monatliche Reservierung | PTU – Preise für jährliche Reservierung |
---|---|---|---|---|
GPT-4o Global | 15 | $- | $- | $- |
GPT-4o US/EU-Datenzonen | 15 | $- | $- | $- |
GPT-4o Regional | 50 | $- | $- | $- |
GPT-4o Mini Global | 15 | $- | $- | $- |
GPT-4o Mini US/EU-Datenzonen | 15 | $- | $- | $- |
GPT-4o Mini Regional | 25 | $- | $- | $- |
Planen mit dem Preisrechner
Basismodelle
Modelle | Nutzung pro 1 000 Token |
---|---|
Babbage-002 | $- |
Davinci-002 | $- |
Optimieren von Modellen
Modell | Pricing | |
---|---|---|
GPT-4o-2024-08-06 | Regional |
Eingabe: $- / 1M tokens Zwischengespeicherte Eingabe: $- / 1M tokens Ausgabe: $- / 1M tokens Training: $- / 1M tokens Hosting: $- / hour |
Weltweit |
Eingabe: $- / 1M tokens Zwischengespeicherte Eingabe: $- / 1M tokens Ausgabe: $- / 1M tokens Training: use regional Hosting: $- / hour |
|
GPT-4o-mini | Regional |
Eingabe: $- / 1M tokens Zwischengespeicherte Eingabe: $- / 1M tokens Ausgabe: $- / 1M tokens Training: $- / 1M tokens Hosting: $- / hour |
Weltweit |
Eingabe: $- / 1M tokens Zwischengespeicherte Eingabe: $- / 1M tokens Ausgabe: $- / 1M tokens Training: use regional Hosting: $- / hour |
|
GPT-4-0613 (8K) | Regional |
Eingabe: $- / 1M tokens Ausgabe: $- / 1M tokens Training: $- / 1M tokens Hosting: $- / hour |
GPT-3.5-Turbo (16K) | Regional |
Eingabe: $- / 1M tokens Ausgabe: $- / 1M tokens Training: $- / 1M tokens Hosting: $- / hour |
GPT-3.5-Turbo (4K) | Regional |
Eingabe: $- / 1M tokens Ausgabe: $- / 1M tokens Training: $- / 1M tokens Hosting: $- / hour |
Babbage-002 |
Eingabe: $- / 1M tokens Ausgabe: $- / 1M tokens Training: $- / 1M tokens Hosting: $- / hour |
|
Davinci-002 |
Eingabe: $- / 1M tokens Ausgabe: $- / 1M tokens Training: $- / 1M tokens Hosting: $- / hour |
Assistenten-API
Die Assistants-API und die zugehörigen Tools erleichtern Entwicklern das Erstellen von KI-Assistenten in ihren Anwendungen.
Die für die Assistenten-API verwendeten Token werden gemäß den für jeden Assistenten verwendeten Tokeneingabe-/Ausgaberaten des ausgewählten Sprachmodells abgerechnet. Darüber hinaus berechnen wir die folgenden Gebühren für die Toolnutzung:
Tool | Eingabe |
---|---|
Dateisuche* | $-/GB Vektorspeicher pro Tag (1 GB frei) |
Codeinterpreter** | $-/Session |
*GB bezieht sich auf binäre Gigabytes, wobei 1 GB 2^30 Bytes beträgt.
**Wenn Ihr Assistent den Codeinterpreter gleichzeitig in zwei verschiedenen Threads aufruft, werden zwei Codeinterpretersitzungen erstellt (2 * $-). Jede Sitzung ist standardmäßig eine Stunde lang aktiv. Dies bedeutet, dass Sie diese Gebühr nur einmal bezahlen würden, wenn Ihr Benutzer bis zu einer Stunde lang Anweisungen an den Code Interpreter im selben Thread weitergibt.
Die Rückschlusskosten (Eingabe und Ausgabe) variieren je nach GPT-Modell, das mit den einzelnen Assistenten verwendet wird. Wenn Ihr Assistent den Code Interpreter gleichzeitig in zwei verschiedenen Threads aufruft, werden zwei Code Interpreter-Sitzungen erstellt (2 * $-). Jede Sitzung ist standardmäßig eine Stunde lang aktiv. Dies bedeutet, dass der Preis für bis zu einer Stunde gilt, in der Sie Code-Interpreter im selben Thread Anweisungen geben.
Bildmodelle
Modelle | Qualität | Auflösung | Preis (pro 100 Bilder) |
---|---|---|---|
Dall-E-3 | Standard | 1024 * 1024 | $- |
Standard | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-3 | HD | 1024 * 1024 | $- |
HD | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-2 | Standard | 1024 * 1024 | $- |
Modelle einbetten
Modelle | Pro 1000 Token |
---|---|
Ada | $- |
text-embedding-3-large | $- |
text-embedding-3-small | $- |
Sprachmodelle
Modelle | Preis |
---|---|
Flüstern | $-/Stunde |
TTS (Text-zu-Sprache) | $-/1 Mio. Zeichen |
TTS HD | $-/1 Mio. Zeichen |
Legacy-Sprachmodelle
Modelle | Kontext | Eingabe (pro 1 Mio. Token) | Ausgabe (pro 1 Mio. Token) |
---|---|---|---|
GPT-3.5-Turbo-0301 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 16K | $- | $- |
GPT-3.5-Turbo-1106 | 16K | $- | $- |
GPT-3.5-Turbo-0125 | 16K | $- | $- |
GPT-3.5-Turbo-Instruct | 4K | $- | $- |
GPT-4-Turbo | 128K | $- | $- |
GPT-4-Turbo-Vision | 128K | $- | $- |
GPT-4 | 8K | $- | $- |
GPT-4 | 32K | $- | $- |
Azure-Preise und -Kaufoptionen
Direkten Kontakt aufnehmen
Erhalten Sie eine Übersicht über die Azure-Preise. Informieren Sie sich über die Preise für Ihre Cloudlösung und die Möglichkeiten zur Kostenoptimierung, und fordern Sie ein individuelles Angebot an.
Sprechen Sie mit einem VertriebsspezialistenKaufoptionen
Erwerben Sie Azure-Dienste über die Azure-Website, einen Microsoft-Vertreter oder einen Azure-Partner.
Optionen kennenlernenZusätzliche Ressourcen
Azure OpenAI-Dienst
Hier erhalten Sie weitere Informationen zu den Features und Funktionen von Azure OpenAI-Dienst.
Preisrechner
Kalkulieren Sie Ihre erwarteten monatlichen Kosten für eine beliebige Kombination von Azure-Produkten.
SLA
Lesen Sie die Vereinbarung zum Servicelevel für Azure OpenAI-Dienst.
Dokumentation
Hier finden Sie technische Tutorials, Videos und weitere Ressourcen zu Azure OpenAI-Dienst.
Häufig gestellte Fragen
-
Azure OpenAI Service bietet Preise, die sowohl auf nutzungsbasierter Zahlung als auch auf PTUs (Provisioned Throughput Units) basieren. Mit der nutzungsbasierten Zahlung zahlen Sie für die Ressourcen, die Sie nutzen, sodass sie für variable Workloads flexibel sind. PTUs bieten ein vorhersagbares Preismodell, bei dem Sie eine bestimmte Menge an Modellverarbeitungskapazität reservieren und bereitstellen. Dieses Modell eignet sich ideal für Workloads mit konsistenten oder vorhersagbaren Nutzungsmustern und bietet Stabilität und Kostenkontrolle.
-
Weitere Informationen zu PTUs und Azure OpenAI-Preisen finden Sie in der PTU-Dokumentation, oder wenden Sie sich an unseren Vertriebsexperten.
Sprechen Sie für eine detaillierte Erläuterung der Azure-Preise mit einem Vertriebsspezialisten. Lernen Sie, die Berechnung der Preise für Ihre Cloudlösung zu verstehen.
Sichern Sie sich kostenlose Cloud-Dienste und ein Guthaben in Höhe von $200, mit dem Sie Azure 30 Tage lang erkunden können.