Zu Hauptinhalt springen
Azure

Azure OpenAI-Dienst – Preise

Azure OpenAI Service – Preisübersicht

Azure OpenAI Service bietet unternehmensfähige generative KI mit leistungsstarken Modellen von OpenAI, die es Unternehmen ermöglichen, mit Text-, Audio- und Visionfunktionen innovativ zu sein. Abgesehen von den neuesten Modellen entscheiden sich Unternehmen wegen des integrierten Datenschutzes, der regionale/regionale/globale Flexibilität und der nahtlosen Integration in das Azure-Ökosystem, einschließlich Fabric, Cosmos DB und Azure KI-Suche, für Azure OpenAI Service. Unternehmen jeder Größe können KI-Lösungen zuverlässig skalieren, um die Kundenerfahrung zu verbessern, Workflows zu automatisieren und u automatisieren und kreatives Potenzial freizusetzen, um messbare Erfolge zu erzielen und sich vom Wettbewerb abzuheben.

Um unsere Kunden auf diesem Weg zu unterstützen, bieten wir Lösungen für die Preisgestaltung und das Kostenmanagement an, die Ihren Anforderungen gerecht werden, darunter:
  • Standard (bedarfsgesteuert): Nutzungsbasierte Bezahlung für Eingabe- und Ausgabetoken.
  • Bereitgestellt (PTUs): Weisen Sie Durchsatz mit vorhersehbaren Kosten zu, wobei monatliche und jährliche Reservierungen verfügbar sind, um die Gesamtausgaben zu reduzieren.
  • Batch-API: Sprachmodelle sind jetzt auch in der Batch-API für globale Bereitstellungen und drei Regionen verfügbar, die innerhalb von 24 Stunden zu einem Rabatt von 50 % auf den globalen Standardpreis abgeschlossen wird.
Sie können zwischen den folgenden Bereitstellungstypen für „Standard“ und „Bereitgestellt“ wählen, die mehr Flexibilität und Kontrolle über Preise und Leistung bieten. Diese Flexibilität ist hilfreich, wenn die Datenverarbeitungsgrenzen immer enger werden und ein höherer Durchsatz bei niedrigeren Kosten erforderlich ist.
  • Globale Bereitstellung – Globale SKU
  • Datenzonenbereitstellung – Geografisch (EU oder USA)
  • Regionale Bereitstellung – Lokale Region (bis zu 27 Regionen)

Preisoptionen entdecken

Sie können die Preisoptionen mit Filtern anpassen.

Preise sind nur Schätzungen und nicht als tatsächliche Preisangebote vorgesehen. Die tatsächlichen Preise können je nach Art des mit Microsoft eingegangenen Vertrags, dem Kaufdatum und dem Wechselkurs variieren. Die Preise werden auf der Grundlage des US-Dollars berechnet und anhand der Londoner Schlusskassakurse umgerechnet, die an den beiden Geschäftstagen vor dem letzten Geschäftstag des vorangegangenen Monatsendes erfasst werden. Wenn die beiden Geschäftstage vor dem Monatsende auf einen Bankfeiertag in wichtigen Märkten fallen, ist der Tag der Kursfeststellung in der Regel der Tag, der den beiden Geschäftstagen unmittelbar vorausgeht. Dieser Kurs gilt für alle Transaktionen im kommenden Monat. Melden Sie sich beim Azure-Preisrechner an, um die Preise basierend auf Ihrem aktuellen Programm/Angebot mit Microsoft anzuzeigen. Wenden Sie sich an einen Azure-Vertriebsspezialisten, um weitere Informationen zu den Preisen zu erhalten oder ein Preisangebot anzufordern. Siehe häufig gestellte Fragen zu Azure-Preisen.

GPT-4.5

GPT-4.5-preview ist das neueste universelle Modell mit umfassendem Wissen und einem besseren Verständnis der Benutzerabsicht, sodass es sich gut für kreative Aufgaben und agentische Planung eignet. Das Modell verfügt über 128 KB Kontext und einen Wissensstand vom Oktober 2023.

Modell Preise (1 Mio. Token) Preise mit Batch-API (1 Mio. Token)
GPT-4.5-Preview-2025-02-27 Global Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar

o1

o1 ist die neue Schlussfolgerungsmodellreihe für komplexe Aufgaben. Das Modell verfügt über 200 KB Kontext und einen Wissensstand vom Oktober 2023.

Modell Preise (1 Mio. Token) Preise mit Batch-API (1 Mio. Token)
o1 2024-12-17 Global Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar
o1 2024-12-17 US/EU – Datenzonen Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar
o1 2024-12-17 Regional Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar
o1 preview 2024-09-12 Global Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar
o1 preview 2024-09-12 US/EU – Datenzonen Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar
o1 preview 2024-09-12 Regional Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar

Planen mit dem Preisrechner

o3 mini

Das o3-mini-Modell ist die aktualisierte Version des o1-mini-Modells. Das o3-mini ist ein schnelles, kosteneffizientes Schlussfolgerungsmodell, das auf Anwendungsfälle in den Bereichen Programmierung, Mathematik und Wissenschaft zugeschnitten ist.

Das o3-mini-Modell bietet jetzt ein erweitertes Kontexteingabefenster von 200.000 Token und eine maximale Ausgabe von 100.000 Token, was ausreichend Platz für komplexe und detaillierte Antworten bietet. Das o1-mini-Modell bietet eine Kontexteingabe von 128.000 Token. Sowohl das o3-Modell als auch das o1-Modell verfügt über einen Wissensstand vom Oktober 2023.

Modell Preise (1 Mio. Token) Preise mit Batch-API (1 Mio. Token)
o3 mini 2025-01-31 Global Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Eingabe: $-
Ausgabe: $-
o3 mini 2025-01-31-US/EU – Datenzonen Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Eingabe: $-
Ausgabe: $-
o3 mini 2025-01-31 Regional Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar
o1-mini 2024-09-12 Global Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar
o1-mini 2024-09-12 US/EU – Datenzonen Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar
o1-mini 2024-09-12 Regional Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar

Planen mit dem Preisrechner

Computer-Using Agent (CUA)

The Computer-Using Agent (CUA) is a specialized AI model that allows AI to interact with graphical user interfaces (GUIs), navigate applications, and automate multi-step tasks—all through natural language instructions. The CUA model can be used as a tool in the Responses API.

Modell Preise
computer-use-preview Global Eingabe: $-/1 Mio. Token
Ausgabe: $-/1 Mio. Token

Built-in tools

The Responses API and the Assistants API enable seamless interaction with tools like computer use, code interpreter, function calling, and file search, making it easy for developers to build AI agents.

Tool Eingabe
Computer Use (Responses API only) Eingabe: $-/1 Mio. Token
Ausgabe: $-/1 Mio. Token
File Search Tool Call (Responses API only) $-/1K tool calls
Dateisuche* $-/GB Vektorspeicher pro Tag (1 GB frei)
Codeinterpreter** $-/Session

*GB bezieht sich auf binäre Gigabytes, wobei 1 GB 2^30 Bytes beträgt.

**Wenn Ihr Assistent den Codeinterpreter gleichzeitig in zwei verschiedenen Threads aufruft, werden zwei Codeinterpretersitzungen erstellt (2 * $-). Jede Sitzung ist standardmäßig eine Stunde lang aktiv. Dies bedeutet, dass Sie diese Gebühr nur einmal bezahlen würden, wenn Ihr Benutzer bis zu einer Stunde lang Anweisungen an den Code Interpreter im selben Thread weitergibt.

Die Rückschlusskosten (Eingabe und Ausgabe) variieren je nach GPT-Modell, das mit den einzelnen Assistenten verwendet wird. Wenn Ihr Assistent den Code Interpreter gleichzeitig in zwei verschiedenen Threads aufruft, werden zwei Code Interpreter-Sitzungen erstellt (2 * $-). Jede Sitzung ist standardmäßig eine Stunde lang aktiv. Dies bedeutet, dass der Preis für bis zu einer Stunde gilt, in der Sie Code-Interpreter im selben Thread Anweisungen geben.

Echtzeit-API

Die GPT-4o-Realtime-Preview ist in der Echtzeit-API enthalten und unterstützt mehrsprachige Sprache-zu-Sprache-Funktionen. Optimiert für latenzarme Unterhaltungen in Echtzeit. Ermöglicht natürliche Interaktionen mit minimaler Verzögerung und eignet sich ideal für Chatbots und Unterhaltungs-KI. GPT-4o ist die umfassende, leistungsstärkere Version für komplexe Aufgaben, während GPT-4o Mini eine kleinere, erschwinglichere Option ist, die sich ideal für einfachere Anwendungen eignet, bei denen Kosteneffizienz und Geschwindigkeit im Vordergrund stehen.

Modell Preise (1 Mio. Token)
GPT-4o-Realtime-Preview-2024-12-17-Global Text
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
GPT-4o-Realtime-Preview-2024-12-17-US/EU – Datenzonen Text
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
GPT-4o-Realtime-Preview-2024-12-17-Regional Text
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global Text
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU – Datenzonen Text
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional Text
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
GPT-4o-Realtime-Preview-2024-10-01-Global Text
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
GPT-4o-Realtime-Preview-2024-10-01-US/EU – Datenzonen Text
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
GPT-4o-Realtime-Preview-2024-10-01-Regional Text
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-

Chat-Vervollständigungs-API

Das GPT 4o-Audio-Preview-Modell ist in der Chat-Vervollständigungs-API enthalten und verarbeitet und generiert Audioinhalte. Es unterstützt fortgeschrittene Funktionen wie Spracherkennung und Audiosynthese und ist ideal für asynchrone Sprachinteraktionen und Stimmungsanalysen. GPT-4o ist die umfassende, leistungsstärkere Version für komplexe Aufgaben, während GPT-4o Mini eine kleinere, erschwinglichere Option ist, die sich ideal für einfachere Anwendungen eignet, bei denen Kosteneffizienz und Geschwindigkeit im Vordergrund stehen.

Modell Preise (1 Mio. Token)
GPT-4o-Audio-Preview-2024-12-17-Global Text
Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Ausgabe: $-
GPT-4o-Audio-Preview-2024-12-17-US/EU – Datenzonen Text
Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Ausgabe: $-
GPT-4o-Audio-Preview-2024-12-17-Regional Text
Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Ausgabe: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Global Text
Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Ausgabe: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU – Datenzonen Text
Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Ausgabe: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional Text
Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Ausgabe: $-

GPT-4o

GPT-4o ist das fortschrittlichste multimodale Modell, das schneller und kostengünstiger als GPT-4 Turbo ist und stärkere Visionfunktionen bietet. Das Modell verfügt über 128 KB Kontext und einen Wissensstand vom Oktober 2023.

Modell Preise (1 Mio. Token) Preise mit Batch-API (1 Mio. Token)
GPT-4o-2024-1120 Global Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Eingabe: $-
Ausgabe: $-
GPT-4o-2024-1120 US/EU – Datenzonen Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Eingabe: $-
Ausgabe: $-
GPT-4o-2024-1120 Regional Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar
GPT-4o-2024-08-06 Global Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Eingabe: $-
Ausgabe: $-
GPT-4o-2024-08-06 US/EU – Datenzonen Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Eingabe: $-
Ausgabe: $-
GPT-4o-2024-08-06 Regional Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar
GPT-4o-2024-0513 Global Eingabe: $-
Ausgabe: $-
Eingabe: $-
Ausgabe: $-
GPT-4o-2024-0513 US/EU – Datenzonen Eingabe: $-
Ausgabe: $-
Nicht verfügbar
GPT-4o-2024-0513 Regional Eingabe: $-
Ausgabe: $-
Nicht verfügbar

Planen mit dem Preisrechner

GPT-4o mini

GPT-4o mini ist das kostengünstigste kleine Modell und verfügt über Visionfunktionen. Das Modell verfügt über 128 KB Kontext und einen Wissensstand vom Oktober 2023.

Modell Preise (1 Mio. Token) Preise mit Batch-API (1 Mio. Token)
GPT-4o-mini-0718 Global Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Eingabe: $-
Ausgabe: $-
GPT-4o-mini-0718 US/EU – Datenzonen Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Eingabe: $-
Ausgabe: $-
GPT-4o-mini-0718 Regional Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar

Planen mit dem Preisrechner

Bereitgestellt

Sie können den Durchsatz für Bereitstellungen zuweisen und verwalten, um eine vorhersagbare Leistung und stabile Kapazität sicherzustellen. Unabhängig vom Verbrauch wird ein Stundensatz pro Modell berechnet, aber Sie können sich auch zusätzliche Einsparungen durch monatliche und jährliche Reservierungen sichern. Erfahren Sie auf dieserInformationsseite, wie Sie Ihre regionalen Bereitstellungen und bereitgestellten Reservierungen auf globale und Datenzonen umstellen.

Modell Min. PTUs Stündliche Preise für PTU PTU – Preise für monatliche Reservierung PTU – Preise für jährliche Reservierung
GPT-4o Global 15 $- $- $-
GPT-4o US/EU-Datenzonen 15 $- $- $-
GPT-4o Regional 50 $- $- $-
Feinabgestimmtes GPT-4o-Regional 50 $- $- $-
GPT-4o Mini Global 15 $- $- $-
GPT-4o Mini US/EU-Datenzonen 15 $- $- $-
GPT-4o Mini Regional 25 $- $- $-
Feinabgestimmtes GPT-4o-Mini Regional 25 $- $- $-

Planen mit dem Preisrechner

Basismodelle

Modelle Nutzung pro 1 000 Token
Babbage-002 $-
Davinci-002 $-

Optimieren von Modellen

Modell Preise
GPT-4o-2024-08-06 Regional Eingabe: $-/1 Mio. Token
Zwischengespeicherte Eingabe: $-/1 Mio. Token
Ausgabe: $-/1 Mio. Token
Schulungen: $-/1 Mio. Token
Hosting: $-/Stunde
Weltweit Eingabe: $-/1 Mio. Token
Zwischengespeicherte Eingabe: $-/1 Mio. Token
Ausgabe: $-/1 Mio. Token
Schulungen: Regionale Nutzung
Hosting: $-/Stunde
GPT-4o-mini Regional Eingabe: $-/1 Mio. Token
Zwischengespeicherte Eingabe: $-/1 Mio. Token
Ausgabe: $-/1 Mio. Token
Schulungen: $-/1 Mio. Token
Hosting: $-/Stunde
Weltweit Eingabe: $-/1 Mio. Token
Zwischengespeicherte Eingabe: $-/1 Mio. Token
Ausgabe: $-/1 Mio. Token
Schulungen: Regionale Nutzung
Hosting: $-/Stunde
GPT-4-0613 (8K) Regional Eingabe: $-/1 Mio. Token
Ausgabe: $-/1 Mio. Token
Schulungen: $-/1 Mio. Token
Hosting: $-/Stunde
GPT-3.5-Turbo (16K) Regional Eingabe: $-/1 Mio. Token
Ausgabe: $-/1 Mio. Token
Schulungen: $-/1 Mio. Token
Hosting: $-/Stunde
GPT-3.5-Turbo (4K) Regional Eingabe: $-/1 Mio. Token
Ausgabe: $-/1 Mio. Token
Schulungen: $-/1 Mio. Token
Hosting: $-/Stunde
Babbage-002 Eingabe: $-/1 Mio. Token
Ausgabe: $-/1 Mio. Token
Schulungen: $-/1 Mio. Token
Hosting: $-/Stunde
Davinci-002 Eingabe: $-/1 Mio. Token
Ausgabe: $-/1 Mio. Token
Schulungen: $-/1 Mio. Token
Hosting: $-/Stunde

Bildmodelle

Modelle Qualität Auflösung Preis (pro 100 Bilder)
Dall-E-3 Standard 1024 * 1024 $-
Standard 1024 * 1792,
1792 * 1024
$-
Dall-E-3 HD 1024 * 1024 $-
HD 1024 * 1792,
1792 * 1024
$-
Dall-E-2 Standard 1024 * 1024 $-

Modelle einbetten

Modelle Pro 1000 Token
Ada $-
text-embedding-3-large $-
text-embedding-3-small $-

Sprachmodelle

Modelle Preis
Flüstern $-/Stunde
TTS (Text-zu-Sprache) $-/1 Mio. Zeichen
TTS HD $-/1 Mio. Zeichen

Legacy-Sprachmodelle

Modelle Kontext Eingabe (pro 1 Mio. Token) Ausgabe (pro 1 Mio. Token)
GPT-3.5-Turbo-0301 4K $- $-
GPT-3.5-Turbo-0613 4K $- $-
GPT-3.5-Turbo-0613 16K $- $-
GPT-3.5-Turbo-1106 16K $- $-
GPT-3.5-Turbo-0125 16K $- $-
GPT-3.5-Turbo-Instruct 4K $- $-
GPT-4-Turbo 128K $- $-
GPT-4-Turbo-Vision 128K $- $-
GPT-4 8K $- $-
GPT-4 32K $- $-

Azure-Preise und -Kaufoptionen

Direkten Kontakt aufnehmen

Erhalten Sie eine Übersicht über die Azure-Preise. Informieren Sie sich über die Preise für Ihre Cloudlösung und die Möglichkeiten zur Kostenoptimierung, und fordern Sie ein individuelles Angebot an.

Sprechen Sie mit einem Vertriebsspezialisten

Kaufoptionen

Erwerben Sie Azure-Dienste über die Azure-Website, einen Microsoft-Vertreter oder einen Azure-Partner.

Optionen kennenlernen

Zusätzliche Ressourcen

Azure OpenAI-Dienst

Hier erhalten Sie weitere Informationen zu den Features und Funktionen von Azure OpenAI-Dienst.

Preisrechner

Kalkulieren Sie Ihre erwarteten monatlichen Kosten für eine beliebige Kombination von Azure-Produkten.

SLA

Lesen Sie die Vereinbarung zum Servicelevel für Azure OpenAI-Dienst.

Dokumentation

Hier finden Sie technische Tutorials, Videos und weitere Ressourcen zu Azure OpenAI-Dienst.

  • Azure OpenAI Service bietet Preise, die sowohl auf nutzungsbasierter Zahlung als auch auf PTUs (Provisioned Throughput Units) basieren. Mit der nutzungsbasierten Zahlung zahlen Sie für die Ressourcen, die Sie nutzen, sodass sie für variable Workloads flexibel sind. PTUs bieten ein vorhersagbares Preismodell, bei dem Sie eine bestimmte Menge an Modellverarbeitungskapazität reservieren und bereitstellen. Dieses Modell eignet sich ideal für Workloads mit konsistenten oder vorhersagbaren Nutzungsmustern und bietet Stabilität und Kostenkontrolle.
  • Weitere Informationen zu PTUs und Azure OpenAI-Preisen finden Sie in der PTU-Dokumentation, oder wenden Sie sich an unseren Vertriebsexperten.

Sprechen Sie für eine detaillierte Erläuterung der Azure-Preise mit einem Vertriebsspezialisten. Lernen Sie, die Berechnung der Preise für Ihre Cloudlösung zu verstehen.

Sichern Sie sich kostenlose Cloud-Dienste und ein Guthaben in Höhe von $200, mit dem Sie Azure 30 Tage lang erkunden können.

Zur Schätzung hinzufügen Für die Anzeige im Rechner „v“ drücken
Können wir Ihnen helfen?