Azure OpenAI Service – Preisübersicht
Um unsere Kunden auf diesem Weg zu unterstützen, bieten wir Lösungen für die Preisgestaltung und das Kostenmanagement an, die Ihren Anforderungen gerecht werden, darunter:
- Standard (bedarfsgesteuert): Nutzungsbasierte Bezahlung für Eingabe- und Ausgabetoken.
- Bereitgestellt (PTUs): Weisen Sie Durchsatz mit vorhersehbaren Kosten zu, wobei monatliche und jährliche Reservierungen verfügbar sind, um die Gesamtausgaben zu reduzieren.
- Batch-API: Sprachmodelle sind jetzt auch in der Batch-API für globale Bereitstellungen und drei Regionen verfügbar, die innerhalb von 24 Stunden zu einem Rabatt von 50 % auf den globalen Standardpreis abgeschlossen wird.
- Globale Bereitstellung – Globale SKU
- Datenzonenbereitstellung – Geografisch (EU oder USA)
- Regionale Bereitstellung – Lokale Region (bis zu 27 Regionen)
Preisoptionen entdecken
Sie können die Preisoptionen mit Filtern anpassen.
Preise sind nur Schätzungen und nicht als tatsächliche Preisangebote vorgesehen. Die tatsächlichen Preise können je nach Art des mit Microsoft eingegangenen Vertrags, dem Kaufdatum und dem Wechselkurs variieren. Die Preise werden auf der Grundlage des US-Dollars berechnet und anhand der Londoner Schlusskassakurse umgerechnet, die an den beiden Geschäftstagen vor dem letzten Geschäftstag des vorangegangenen Monatsendes erfasst werden. Wenn die beiden Geschäftstage vor dem Monatsende auf einen Bankfeiertag in wichtigen Märkten fallen, ist der Tag der Kursfeststellung in der Regel der Tag, der den beiden Geschäftstagen unmittelbar vorausgeht. Dieser Kurs gilt für alle Transaktionen im kommenden Monat. Melden Sie sich beim Azure-Preisrechner an, um die Preise basierend auf Ihrem aktuellen Programm/Angebot mit Microsoft anzuzeigen. Wenden Sie sich an einen Azure-Vertriebsspezialisten, um weitere Informationen zu den Preisen zu erhalten oder ein Preisangebot anzufordern. Siehe häufig gestellte Fragen zu Azure-Preisen.
US-amerikanische Regierungsbehörden sind für den Erwerb von Azure Government-Diensten von einem Lizenzlösungsanbieter qualifiziert, ohne dass vorab eine finanzielle Verpflichtung eingegangen werden muss. Alternativ kann Azure Government auch direkt über ein Onlineabonnement mit nutzungsbasierter Bezahlung bezogen werden.
Wichtig: Der Preis in R$ dient lediglich als Referenz; hierbei handelt es sich um eine internationale Transaktion; der Endpreis unterliegt Wechselkursen und der Berücksichtigung von IOF-Steuern. eNF wird nicht ausgegeben.
US-amerikanische Regierungsbehörden sind für den Erwerb von Azure Government-Diensten von einem Lizenzlösungsanbieter qualifiziert, ohne dass vorab eine finanzielle Verpflichtung eingegangen werden muss. Alternativ kann Azure Government auch direkt über ein Onlineabonnement mit nutzungsbasierter Bezahlung bezogen werden.
Wichtig: Der Preis in R$ dient lediglich als Referenz; hierbei handelt es sich um eine internationale Transaktion; der Endpreis unterliegt Wechselkursen und der Berücksichtigung von IOF-Steuern. eNF wird nicht ausgegeben.
GPT-4.5
GPT-4.5-preview ist das neueste universelle Modell mit umfassendem Wissen und einem besseren Verständnis der Benutzerabsicht, sodass es sich gut für kreative Aufgaben und agentische Planung eignet. Das Modell verfügt über 128 KB Kontext und einen Wissensstand vom Oktober 2023.
Modell | Preise (1 Mio. Token) | Preise mit Batch-API (1 Mio. Token) |
---|---|---|
GPT-4.5-Preview-2025-02-27 Global |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Nicht verfügbar |
o1
o1 ist die neue Schlussfolgerungsmodellreihe für komplexe Aufgaben. Das Modell verfügt über 200 KB Kontext und einen Wissensstand vom Oktober 2023.
Modell | Preise (1 Mio. Token) | Preise mit Batch-API (1 Mio. Token) |
---|---|---|
o1 2024-12-17 Global |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Nicht verfügbar |
o1 2024-12-17 US/EU – Datenzonen |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Nicht verfügbar |
o1 2024-12-17 Regional |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Nicht verfügbar |
o1 preview 2024-09-12 Global |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Nicht verfügbar |
o1 preview 2024-09-12 US/EU – Datenzonen |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Nicht verfügbar |
o1 preview 2024-09-12 Regional |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Nicht verfügbar |
Planen mit dem Preisrechner
o3 mini
Das o3-mini-Modell ist die aktualisierte Version des o1-mini-Modells. Das o3-mini ist ein schnelles, kosteneffizientes Schlussfolgerungsmodell, das auf Anwendungsfälle in den Bereichen Programmierung, Mathematik und Wissenschaft zugeschnitten ist.
Das o3-mini-Modell bietet jetzt ein erweitertes Kontexteingabefenster von 200.000 Token und eine maximale Ausgabe von 100.000 Token, was ausreichend Platz für komplexe und detaillierte Antworten bietet. Das o1-mini-Modell bietet eine Kontexteingabe von 128.000 Token. Sowohl das o3-Modell als auch das o1-Modell verfügt über einen Wissensstand vom Oktober 2023.
Modell | Preise (1 Mio. Token) | Preise mit Batch-API (1 Mio. Token) |
---|---|---|
o3 mini 2025-01-31 Global |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Eingabe: $- Ausgabe: $- |
o3 mini 2025-01-31-US/EU – Datenzonen |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Eingabe: $- Ausgabe: $- |
o3 mini 2025-01-31 Regional |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Nicht verfügbar |
o1-mini 2024-09-12 Global |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Nicht verfügbar |
o1-mini 2024-09-12 US/EU – Datenzonen |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Nicht verfügbar |
o1-mini 2024-09-12 Regional |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Nicht verfügbar |
Planen mit dem Preisrechner
Computer-Using Agent (CUA)
The Computer-Using Agent (CUA) is a specialized AI model that allows AI to interact with graphical user interfaces (GUIs), navigate applications, and automate multi-step tasks—all through natural language instructions. The CUA model can be used as a tool in the Responses API.
Modell | Preise |
---|---|
computer-use-preview Global |
Eingabe: $-/1 Mio. Token Ausgabe: $-/1 Mio. Token |
Built-in tools
The Responses API and the Assistants API enable seamless interaction with tools like computer use, code interpreter, function calling, and file search, making it easy for developers to build AI agents.
Tool | Eingabe |
---|---|
Computer Use (Responses API only) |
Eingabe: $-/1 Mio. Token Ausgabe: $-/1 Mio. Token |
File Search Tool Call (Responses API only) | $-/1K tool calls |
Dateisuche* | $-/GB Vektorspeicher pro Tag (1 GB frei) |
Codeinterpreter** | $-/Session |
*GB bezieht sich auf binäre Gigabytes, wobei 1 GB 2^30 Bytes beträgt.
**Wenn Ihr Assistent den Codeinterpreter gleichzeitig in zwei verschiedenen Threads aufruft, werden zwei Codeinterpretersitzungen erstellt (2 * $-). Jede Sitzung ist standardmäßig eine Stunde lang aktiv. Dies bedeutet, dass Sie diese Gebühr nur einmal bezahlen würden, wenn Ihr Benutzer bis zu einer Stunde lang Anweisungen an den Code Interpreter im selben Thread weitergibt.
Die Rückschlusskosten (Eingabe und Ausgabe) variieren je nach GPT-Modell, das mit den einzelnen Assistenten verwendet wird. Wenn Ihr Assistent den Code Interpreter gleichzeitig in zwei verschiedenen Threads aufruft, werden zwei Code Interpreter-Sitzungen erstellt (2 * $-). Jede Sitzung ist standardmäßig eine Stunde lang aktiv. Dies bedeutet, dass der Preis für bis zu einer Stunde gilt, in der Sie Code-Interpreter im selben Thread Anweisungen geben.
Echtzeit-API
Die GPT-4o-Realtime-Preview ist in der Echtzeit-API enthalten und unterstützt mehrsprachige Sprache-zu-Sprache-Funktionen. Optimiert für latenzarme Unterhaltungen in Echtzeit. Ermöglicht natürliche Interaktionen mit minimaler Verzögerung und eignet sich ideal für Chatbots und Unterhaltungs-KI. GPT-4o ist die umfassende, leistungsstärkere Version für komplexe Aufgaben, während GPT-4o Mini eine kleinere, erschwinglichere Option ist, die sich ideal für einfachere Anwendungen eignet, bei denen Kosteneffizienz und Geschwindigkeit im Vordergrund stehen.
Modell | Preise (1 Mio. Token) |
---|---|
GPT-4o-Realtime-Preview-2024-12-17-Global |
Text Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- Audio Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
GPT-4o-Realtime-Preview-2024-12-17-US/EU – Datenzonen |
Text Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- Audio Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
GPT-4o-Realtime-Preview-2024-12-17-Regional |
Text Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- Audio Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global |
Text Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- Audio Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU – Datenzonen |
Text Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- Audio Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional |
Text Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- Audio Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
GPT-4o-Realtime-Preview-2024-10-01-Global |
Text Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- Audio Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
GPT-4o-Realtime-Preview-2024-10-01-US/EU – Datenzonen |
Text Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- Audio Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
GPT-4o-Realtime-Preview-2024-10-01-Regional |
Text Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- Audio Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Chat-Vervollständigungs-API
Das GPT 4o-Audio-Preview-Modell ist in der Chat-Vervollständigungs-API enthalten und verarbeitet und generiert Audioinhalte. Es unterstützt fortgeschrittene Funktionen wie Spracherkennung und Audiosynthese und ist ideal für asynchrone Sprachinteraktionen und Stimmungsanalysen. GPT-4o ist die umfassende, leistungsstärkere Version für komplexe Aufgaben, während GPT-4o Mini eine kleinere, erschwinglichere Option ist, die sich ideal für einfachere Anwendungen eignet, bei denen Kosteneffizienz und Geschwindigkeit im Vordergrund stehen.
Modell | Preise (1 Mio. Token) |
---|---|
GPT-4o-Audio-Preview-2024-12-17-Global |
Text Eingabe: $- Ausgabe: $- Audio Eingabe: $- Ausgabe: $- |
GPT-4o-Audio-Preview-2024-12-17-US/EU – Datenzonen |
Text Eingabe: $- Ausgabe: $- Audio Eingabe: $- Ausgabe: $- |
GPT-4o-Audio-Preview-2024-12-17-Regional |
Text Eingabe: $- Ausgabe: $- Audio Eingabe: $- Ausgabe: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Global |
Text Eingabe: $- Ausgabe: $- Audio Eingabe: $- Ausgabe: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU – Datenzonen |
Text Eingabe: $- Ausgabe: $- Audio Eingabe: $- Ausgabe: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional |
Text Eingabe: $- Ausgabe: $- Audio Eingabe: $- Ausgabe: $- |
GPT-4o
GPT-4o ist das fortschrittlichste multimodale Modell, das schneller und kostengünstiger als GPT-4 Turbo ist und stärkere Visionfunktionen bietet. Das Modell verfügt über 128 KB Kontext und einen Wissensstand vom Oktober 2023.
Modell | Preise (1 Mio. Token) | Preise mit Batch-API (1 Mio. Token) |
---|---|---|
GPT-4o-2024-1120 Global |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Eingabe: $- Ausgabe: $- |
GPT-4o-2024-1120 US/EU – Datenzonen |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Eingabe: $- Ausgabe: $- |
GPT-4o-2024-1120 Regional |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Nicht verfügbar |
GPT-4o-2024-08-06 Global |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Eingabe: $- Ausgabe: $- |
GPT-4o-2024-08-06 US/EU – Datenzonen |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Eingabe: $- Ausgabe: $- |
GPT-4o-2024-08-06 Regional |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Nicht verfügbar |
GPT-4o-2024-0513 Global |
Eingabe: $- Ausgabe: $- |
Eingabe: $- Ausgabe: $- |
GPT-4o-2024-0513 US/EU – Datenzonen |
Eingabe: $- Ausgabe: $- |
Nicht verfügbar |
GPT-4o-2024-0513 Regional |
Eingabe: $- Ausgabe: $- |
Nicht verfügbar |
Planen mit dem Preisrechner
GPT-4o mini
GPT-4o mini ist das kostengünstigste kleine Modell und verfügt über Visionfunktionen. Das Modell verfügt über 128 KB Kontext und einen Wissensstand vom Oktober 2023.
Modell | Preise (1 Mio. Token) | Preise mit Batch-API (1 Mio. Token) |
---|---|---|
GPT-4o-mini-0718 Global |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Eingabe: $- Ausgabe: $- |
GPT-4o-mini-0718 US/EU – Datenzonen |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Eingabe: $- Ausgabe: $- |
GPT-4o-mini-0718 Regional |
Eingabe: $- Zwischengespeicherte Eingabe: $- Ausgabe: $- |
Nicht verfügbar |
Planen mit dem Preisrechner
Bereitgestellt
Sie können den Durchsatz für Bereitstellungen zuweisen und verwalten, um eine vorhersagbare Leistung und stabile Kapazität sicherzustellen. Unabhängig vom Verbrauch wird ein Stundensatz pro Modell berechnet, aber Sie können sich auch zusätzliche Einsparungen durch monatliche und jährliche Reservierungen sichern. Erfahren Sie auf dieserInformationsseite, wie Sie Ihre regionalen Bereitstellungen und bereitgestellten Reservierungen auf globale und Datenzonen umstellen.
Modell | Min. PTUs | Stündliche Preise für PTU | PTU – Preise für monatliche Reservierung | PTU – Preise für jährliche Reservierung |
---|---|---|---|---|
GPT-4o Global | 15 | $- | $- | $- |
GPT-4o US/EU-Datenzonen | 15 | $- | $- | $- |
GPT-4o Regional | 50 | $- | $- | $- |
Feinabgestimmtes GPT-4o-Regional | 50 | $- | $- | $- |
GPT-4o Mini Global | 15 | $- | $- | $- |
GPT-4o Mini US/EU-Datenzonen | 15 | $- | $- | $- |
GPT-4o Mini Regional | 25 | $- | $- | $- |
Feinabgestimmtes GPT-4o-Mini Regional | 25 | $- | $- | $- |
Planen mit dem Preisrechner
Basismodelle
Modelle | Nutzung pro 1 000 Token |
---|---|
Babbage-002 | $- |
Davinci-002 | $- |
Optimieren von Modellen
Modell | Preise | |
---|---|---|
GPT-4o-2024-08-06 | Regional |
Eingabe: $-/1 Mio. Token Zwischengespeicherte Eingabe: $-/1 Mio. Token Ausgabe: $-/1 Mio. Token Schulungen: $-/1 Mio. Token Hosting: $-/Stunde |
Weltweit |
Eingabe: $-/1 Mio. Token Zwischengespeicherte Eingabe: $-/1 Mio. Token Ausgabe: $-/1 Mio. Token Schulungen: Regionale Nutzung Hosting: $-/Stunde |
|
GPT-4o-mini | Regional |
Eingabe: $-/1 Mio. Token Zwischengespeicherte Eingabe: $-/1 Mio. Token Ausgabe: $-/1 Mio. Token Schulungen: $-/1 Mio. Token Hosting: $-/Stunde |
Weltweit |
Eingabe: $-/1 Mio. Token Zwischengespeicherte Eingabe: $-/1 Mio. Token Ausgabe: $-/1 Mio. Token Schulungen: Regionale Nutzung Hosting: $-/Stunde |
|
GPT-4-0613 (8K) | Regional |
Eingabe: $-/1 Mio. Token Ausgabe: $-/1 Mio. Token Schulungen: $-/1 Mio. Token Hosting: $-/Stunde |
GPT-3.5-Turbo (16K) | Regional |
Eingabe: $-/1 Mio. Token Ausgabe: $-/1 Mio. Token Schulungen: $-/1 Mio. Token Hosting: $-/Stunde |
GPT-3.5-Turbo (4K) | Regional |
Eingabe: $-/1 Mio. Token Ausgabe: $-/1 Mio. Token Schulungen: $-/1 Mio. Token Hosting: $-/Stunde |
Babbage-002 |
Eingabe: $-/1 Mio. Token Ausgabe: $-/1 Mio. Token Schulungen: $-/1 Mio. Token Hosting: $-/Stunde |
|
Davinci-002 |
Eingabe: $-/1 Mio. Token Ausgabe: $-/1 Mio. Token Schulungen: $-/1 Mio. Token Hosting: $-/Stunde |
Bildmodelle
Modelle | Qualität | Auflösung | Preis (pro 100 Bilder) |
---|---|---|---|
Dall-E-3 | Standard | 1024 * 1024 | $- |
Standard | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-3 | HD | 1024 * 1024 | $- |
HD | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-2 | Standard | 1024 * 1024 | $- |
Modelle einbetten
Modelle | Pro 1000 Token |
---|---|
Ada | $- |
text-embedding-3-large | $- |
text-embedding-3-small | $- |
Sprachmodelle
Modelle | Preis |
---|---|
Flüstern | $-/Stunde |
TTS (Text-zu-Sprache) | $-/1 Mio. Zeichen |
TTS HD | $-/1 Mio. Zeichen |
Legacy-Sprachmodelle
Modelle | Kontext | Eingabe (pro 1 Mio. Token) | Ausgabe (pro 1 Mio. Token) |
---|---|---|---|
GPT-3.5-Turbo-0301 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 16K | $- | $- |
GPT-3.5-Turbo-1106 | 16K | $- | $- |
GPT-3.5-Turbo-0125 | 16K | $- | $- |
GPT-3.5-Turbo-Instruct | 4K | $- | $- |
GPT-4-Turbo | 128K | $- | $- |
GPT-4-Turbo-Vision | 128K | $- | $- |
GPT-4 | 8K | $- | $- |
GPT-4 | 32K | $- | $- |
Azure-Preise und -Kaufoptionen

Direkten Kontakt aufnehmen
Erhalten Sie eine Übersicht über die Azure-Preise. Informieren Sie sich über die Preise für Ihre Cloudlösung und die Möglichkeiten zur Kostenoptimierung, und fordern Sie ein individuelles Angebot an.
Sprechen Sie mit einem VertriebsspezialistenKaufoptionen
Erwerben Sie Azure-Dienste über die Azure-Website, einen Microsoft-Vertreter oder einen Azure-Partner.
Optionen kennenlernenZusätzliche Ressourcen
Azure OpenAI-Dienst
Hier erhalten Sie weitere Informationen zu den Features und Funktionen von Azure OpenAI-Dienst.
Preisrechner
Kalkulieren Sie Ihre erwarteten monatlichen Kosten für eine beliebige Kombination von Azure-Produkten.
SLA
Lesen Sie die Vereinbarung zum Servicelevel für Azure OpenAI-Dienst.
Dokumentation
Hier finden Sie technische Tutorials, Videos und weitere Ressourcen zu Azure OpenAI-Dienst.
Häufig gestellte Fragen
-
Azure OpenAI Service bietet Preise, die sowohl auf nutzungsbasierter Zahlung als auch auf PTUs (Provisioned Throughput Units) basieren. Mit der nutzungsbasierten Zahlung zahlen Sie für die Ressourcen, die Sie nutzen, sodass sie für variable Workloads flexibel sind. PTUs bieten ein vorhersagbares Preismodell, bei dem Sie eine bestimmte Menge an Modellverarbeitungskapazität reservieren und bereitstellen. Dieses Modell eignet sich ideal für Workloads mit konsistenten oder vorhersagbaren Nutzungsmustern und bietet Stabilität und Kostenkontrolle.
-
Weitere Informationen zu PTUs und Azure OpenAI-Preisen finden Sie in der PTU-Dokumentation, oder wenden Sie sich an unseren Vertriebsexperten.
Sprechen Sie für eine detaillierte Erläuterung der Azure-Preise mit einem Vertriebsspezialisten. Lernen Sie, die Berechnung der Preise für Ihre Cloudlösung zu verstehen.
Sichern Sie sich kostenlose Cloud-Dienste und ein Guthaben in Höhe von $200, mit dem Sie Azure 30 Tage lang erkunden können.