Startseite
Azure-Preise
Azure OpenAI-Dienst – Preise

Azure OpenAI-Dienst – Preise

Azure OpenAI Service – Preisübersicht

Azure OpenAI Service delivers enterprise-ready generative AI featuring powerful models from OpenAI, enabling organizations to innovate with text, audio, and vision capabilities. Beyond the cutting-edge models, companies choose Azure OpenAI Service for built-in data privacy, regional/area/global flexibility, and seamless integration into the Azure ecosystem including Fabric, Cosmos DB and Azure AI Search. Companies of all sizes can confidently scale AI solutions to enhance customer experience, automate workflows, and unlock creative potential, driving measurable impact and competitive differentiation.

To help customers in the journey, we offer pricing and cost management solutions to meet your needs. including:

Standard (On-Demand): Pay-as-you-go for input and output tokens.
Provisioned (PTUs): Allocate throughput with predictable costs, with monthly and annual reservations available to reduce overall spend.
Batch API: Language models are also now available in the Batch API for global deployments and three regions, that returns completions within 24 hours for a 50% discount on Global Standard Pricing.

You can choose from the following deployment types for Standard and Provisioned, which enable greater flexibility and control of pricing and performance. This flexibility helps when there is increasingly more restrictive data processing boundaries and need for increased throughput and lower price.

Global Deployment – Global SKU
Data Zone Deployment – Geographic based (EU or US)
Regional Deployment – Local Region (up to 27 regions)

Preisoptionen entdecken

Sie können die Preisoptionen mit Filtern anpassen.

Preise sind nur Schätzungen und nicht als tatsächliche Preisangebote vorgesehen. Die tatsächlichen Preise können je nach Art des mit Microsoft eingegangenen Vertrags, dem Kaufdatum und dem Wechselkurs variieren. Die Preise werden auf der Grundlage des US-Dollars berechnet und anhand der Londoner Schlusskassakurse umgerechnet, die an den beiden Geschäftstagen vor dem letzten Geschäftstag des vorangegangenen Monatsendes erfasst werden. Wenn die beiden Geschäftstage vor dem Monatsende auf einen Bankfeiertag in wichtigen Märkten fallen, ist der Tag der Kursfeststellung in der Regel der Tag, der den beiden Geschäftstagen unmittelbar vorausgeht. Dieser Kurs gilt für alle Transaktionen im kommenden Monat. Melden Sie sich beim Azure-Preisrechner an, um die Preise basierend auf Ihrem aktuellen Programm/Angebot mit Microsoft anzuzeigen. Wenden Sie sich an einen Azure-Vertriebsspezialisten, um weitere Informationen zu den Preisen zu erhalten oder ein Preisangebot anzufordern. Siehe häufig gestellte Fragen zu Azure-Preisen.

Region:

Währung:

US-amerikanische Regierungsbehörden sind für den Erwerb von Azure Government-Diensten von einem Lizenzlösungsanbieter qualifiziert, ohne dass vorab eine finanzielle Verpflichtung eingegangen werden muss. Alternativ kann Azure Government auch direkt über ein Onlineabonnement mit nutzungsbasierter Bezahlung bezogen werden.

Weitere Informationen

Wichtig: Der Preis in R$ dient lediglich als Referenz; hierbei handelt es sich um eine internationale Transaktion; der Endpreis unterliegt Wechselkursen und der Berücksichtigung von IOF-Steuern. eNF wird nicht ausgegeben.

Weitere Informationen

o1 Preview

o1 is the new reasoning model series for complex tasks. The model has 128K context and an October 2023 knowledge cutoff.

Model	Pricing (1M Tokens)
Global	Eingabe: $- Cached Input: $- Output: $-
US/EU – Data Zones	Eingabe: $- Cached Input: $- Output: $-
Regional	Eingabe: $- Cached Input: $- Output: $-

Plan with the Pricing Calculator

o1 Mini

o1-mini is a fast, cost-efficient reasoning model tailored to coding, math, and science use cases. The model has 128K context and an October 2023 knowledge cutoff.

Model	Pricing (1M Tokens)
Global	Eingabe: $- Cached Input: $- Output: $-
US/EU – Data Zones	Eingabe: $- Cached Input: $- Output: $-
Regional	Eingabe: $- Cached Input: $- Output: $-

Plan with the Pricing Calculator

Realtime API

Featured in the new Realtime API, the model GPT-4o-Realtime-Preview supports audio/speech capabilities including multilingual speech-to-speech.

Model	Pricing (1M Tokens)
GPT-4o-Realtime-Preview-Global	Text Eingabe: $- Output: $- Audio Eingabe: $- Output: $-

GPT-4o

GPT-4o is the most advanced multimodal model that’s faster and cheaper than GPT-4 Turbo with stronger vision capabilities. The model has 128K context and an October 2023 knowledge cutoff.

Model	Pricing (1M Tokens)	Pricing with Batch API (1M Tokens)
GPT-4o-2024-08-06 Global	Eingabe: $- Cached Input: $- Output: $-	Eingabe: $- Output: $-
US/EU – Data Zones	Eingabe: $- Cached Input: $- Output: $-	Nicht verfügbar
Regional	Eingabe: $- Cached Input: $- Output: $-	Nicht verfügbar
GPT-4o-0513 Global	Eingabe: $- Output: $-	Eingabe: $- Output: $-
US/EU – Data Zones	Eingabe: $- Output: $-	Nicht verfügbar
Regional	Eingabe: $- Output: $-	Nicht verfügbar

Plan with the Pricing Calculator

GPT-4o mini

GPT-4o mini is the most cost-efficient small model, and has vision capabilities. The model has 128K context and an October 2023 knowledge cutoff.

Model	Pricing (1M Tokens)	Pricing with Batch API (1M Tokens)
Global	Eingabe: $- Cached Input: $- Output: $-	Eingabe: $- Output: $-
US/EU – Data Zones	Eingabe: $- Cached Input: $- Output: $-	Nicht verfügbar
Regional	Eingabe: $- Cached Input: $- Output: $-	Nicht verfügbar

Plan with the Pricing Calculator

Provisioned

You can allocate and manage throughput for deployments, ensuring predictable performance and stable capacity. You are charged an hourly rate per model regardless of usage, but you can also secure additional savings through monthly and annual reservations.

Model	Min PTUs	PTU Hourly pricing	PTU Monthly Reservation Pricing	PTU Yearly Reservation Pricing
GPT-4o Global	50	$-	$-	$-
GPT-4o US/EU Data Zones	50	$-	$-	$-
GPT-4o Regional	50	$-	$-	$-
GPT-4o Mini Global	25	$-	$-	$-
GPT-4o Mini US/EU Data Zones	25	$-	$-	$-
GPT-4o Mini Regional	25	$-	$-	$-

Plan with the Pricing Calculator

Basismodelle

Modelle	Nutzung pro 1 000 Token
Babbage-002	$-
Davinci-002	$-

Optimieren von Modellen

Modelle	Training pro 1.000 Token	Hosting pro Stunde	Eingabenutzung pro 1 000 Token	Ausgabenutzung pro 1 000 Token
Babbage-002	$-	$-	$-	$-
Davinci-002	$-	$-	$-	$-
GPT-3.5-Turbo (4K)	$-	$-	$-	$-
GPT-3.5-Turbo (16K)	$-	$-	$-	$-
GPT-4 (8K)	$-	$-	$-	$-
GPT-4o	$-	$-	$-	$-
GPT-4o-mini	$-	$-	$-	$-

Assistenten-API

Die Assistants-API und die zugehörigen Tools erleichtern Entwicklern das Erstellen von KI-Assistenten in ihren Anwendungen.

Die für die Assistenten-API verwendeten Token werden gemäß den für jeden Assistenten verwendeten Tokeneingabe-/Ausgaberaten des ausgewählten Sprachmodells abgerechnet. Darüber hinaus berechnen wir die folgenden Gebühren für die Toolnutzung:

Tool	Eingabe
Dateisuche^*	$-/GB Vektorspeicher pro Tag (1 GB frei)
Codeinterpreter^**	$-/Session

^*GB bezieht sich auf binäre Gigabytes, wobei 1 GB 2^30 Bytes beträgt.

^**Wenn Ihr Assistent den Codeinterpreter gleichzeitig in zwei verschiedenen Threads aufruft, werden zwei Codeinterpretersitzungen erstellt (2 * $-). Jede Sitzung ist standardmäßig eine Stunde lang aktiv. Dies bedeutet, dass Sie diese Gebühr nur einmal bezahlen würden, wenn Ihr Benutzer bis zu einer Stunde lang Anweisungen an den Code Interpreter im selben Thread weitergibt.

Die Rückschlusskosten (Eingabe und Ausgabe) variieren je nach GPT-Modell, das mit den einzelnen Assistenten verwendet wird. Wenn Ihr Assistent den Code Interpreter gleichzeitig in zwei verschiedenen Threads aufruft, werden zwei Code Interpreter-Sitzungen erstellt (2 * $-). Jede Sitzung ist standardmäßig eine Stunde lang aktiv. Dies bedeutet, dass der Preis für bis zu einer Stunde gilt, in der Sie Code-Interpreter im selben Thread Anweisungen geben.

Bildmodelle

Modelle	Qualität	Auflösung	Preis (pro 100 Bilder)
Dall-E-3	Standard	1024 * 1024	$-
	Standard	1024 * 1792, 1792 * 1024	$-
Dall-E-3	HD	1024 * 1024	$-
	HD	1024 * 1792, 1792 * 1024	$-
Dall-E-2	Standard	1024 * 1024	$-

Modelle einbetten

Modelle	Pro 1000 Token
Ada	$-
text-embedding-3-large	$-
text-embedding-3-small	$-

Sprachmodelle

Modelle	Preis
Modelle	Flüstern	$-/Stunde
TTS (Text-zu-Sprache)	$-/1 Mio. Zeichen
TTS HD	$-/1 Mio. Zeichen

Legacy-Sprachmodelle

Modelle	Kontext	Input (Per 1M Tokens)	Output (Per 1M Tokens)
GPT-3.5-Turbo-0301	4K	$-	$-
GPT-3.5-Turbo-0613	4K	$-	$-
GPT-3.5-Turbo-0613	16K	$-	$-
GPT-3.5-Turbo-1106	16K	$-	$-
GPT-3.5-Turbo-0125	16K	$-	$-
GPT-3.5-Turbo-Instruct	4K	$-	$-
GPT-4-Turbo	128K	$-	$-
GPT-4-Turbo-Vision	128K	$-	$-
GPT-4	8K	$-	$-
GPT-4	32K	$-	$-

Azure-Preise und -Kaufoptionen

Direkten Kontakt aufnehmen

Erhalten Sie eine Übersicht über die Azure-Preise. Informieren Sie sich über die Preise für Ihre Cloudlösung und die Möglichkeiten zur Kostenoptimierung, und fordern Sie ein individuelles Angebot an.

Sprechen Sie mit einem Vertriebsspezialisten

Kaufoptionen

Erwerben Sie Azure-Dienste über die Azure-Website, einen Microsoft-Vertreter oder einen Azure-Partner.

Optionen kennenlernen

Zusätzliche Ressourcen

Azure OpenAI-Dienst

Hier erhalten Sie weitere Informationen zu den Features und Funktionen von Azure OpenAI-Dienst.

Preisrechner

Kalkulieren Sie Ihre erwarteten monatlichen Kosten für eine beliebige Kombination von Azure-Produkten.

SLA

Lesen Sie die Vereinbarung zum Servicelevel für Azure OpenAI-Dienst.

Dokumentation

Hier finden Sie technische Tutorials, Videos und weitere Ressourcen zu Azure OpenAI-Dienst.

Häufig gestellte Fragen

Häufig gestellte Fragen zur Azure-Preisgestaltung

Azure OpenAI Service bietet Preise, die sowohl auf nutzungsbasierter Zahlung als auch auf PTUs (Provisioned Throughput Units) basieren. Mit der nutzungsbasierten Zahlung zahlen Sie für die Ressourcen, die Sie nutzen, sodass sie für variable Workloads flexibel sind. PTUs bieten ein vorhersagbares Preismodell, bei dem Sie eine bestimmte Menge an Modellverarbeitungskapazität reservieren und bereitstellen. Dieses Modell eignet sich ideal für Workloads mit konsistenten oder vorhersagbaren Nutzungsmustern und bietet Stabilität und Kostenkontrolle.
Azure-Produkte nach Region | Microsoft Azure
SLA für Azure KI Services | Microsoft Azure
Weitere Informationen zu PTUs und Azure OpenAI-Preisen finden Sie in der PTU-Dokumentation, oder wenden Sie sich an unseren Vertriebsexperten.

Sprechen Sie für eine detaillierte Erläuterung der Azure-Preise mit einem Vertriebsspezialisten. Lernen Sie, die Berechnung der Preise für Ihre Cloudlösung zu verstehen.

Preisangebot anfordern

Sichern Sie sich kostenlose Cloud-Dienste und ein Guthaben in Höhe von $200, mit dem Sie Azure 30 Tage lang erkunden können.

Azure kostenlos testen

Zur Schätzung hinzufügen Für die Anzeige im Rechner „v“ drücken