Zu Hauptinhalt springen
Azure

Azure OpenAI-Dienst – Preise

Azure OpenAI Service – Preisübersicht

Azure OpenAI Service delivers enterprise-ready generative AI featuring powerful models from OpenAI, enabling organizations to innovate with text, audio, and vision capabilities. Beyond the cutting-edge models, companies choose Azure OpenAI Service for built-in data privacy, regional/area/global flexibility, and seamless integration into the Azure ecosystem including Fabric, Cosmos DB and Azure AI Search. Companies of all sizes can confidently scale AI solutions to enhance customer experience, automate workflows, and unlock creative potential, driving measurable impact and competitive differentiation.

To help customers in the journey, we offer pricing and cost management solutions to meet your needs. including:
  • Standard (On-Demand): Pay-as-you-go for input and output tokens.
  • Provisioned (PTUs): Allocate throughput with predictable costs, with monthly and annual reservations available to reduce overall spend.
  • Batch API: Language models are also now available in the Batch API for global deployments and three regions, that returns completions within 24 hours for a 50% discount on Global Standard Pricing.
You can choose from the following deployment types for Standard and Provisioned, which enable greater flexibility and control of pricing and performance. This flexibility helps when there is increasingly more restrictive data processing boundaries and need for increased throughput and lower price.
  • Global Deployment – Global SKU
  • Data Zone Deployment – Geographic based (EU or US)
  • Regional Deployment – Local Region (up to 27 regions)

Preisoptionen entdecken

Sie können die Preisoptionen mit Filtern anpassen.

Preise sind nur Schätzungen und nicht als tatsächliche Preisangebote vorgesehen. Die tatsächlichen Preise können je nach Art des mit Microsoft eingegangenen Vertrags, dem Kaufdatum und dem Wechselkurs variieren. Die Preise werden auf der Grundlage des US-Dollars berechnet und anhand der Londoner Schlusskassakurse umgerechnet, die an den beiden Geschäftstagen vor dem letzten Geschäftstag des vorangegangenen Monatsendes erfasst werden. Wenn die beiden Geschäftstage vor dem Monatsende auf einen Bankfeiertag in wichtigen Märkten fallen, ist der Tag der Kursfeststellung in der Regel der Tag, der den beiden Geschäftstagen unmittelbar vorausgeht. Dieser Kurs gilt für alle Transaktionen im kommenden Monat. Melden Sie sich beim Azure-Preisrechner an, um die Preise basierend auf Ihrem aktuellen Programm/Angebot mit Microsoft anzuzeigen. Wenden Sie sich an einen Azure-Vertriebsspezialisten, um weitere Informationen zu den Preisen zu erhalten oder ein Preisangebot anzufordern. Siehe häufig gestellte Fragen zu Azure-Preisen.

o1 Preview

o1 is the new reasoning model series for complex tasks. The model has 128K context and an October 2023 knowledge cutoff.

Model Pricing (1M Tokens)
Global Eingabe: $-
Cached Input: $-
Output: $-
US/EU – Data Zones Eingabe: $-
Cached Input: $-
Output: $-
Regional Eingabe: $-
Cached Input: $-
Output: $-

Plan with the Pricing Calculator

o1 Mini

o1-mini is a fast, cost-efficient reasoning model tailored to coding, math, and science use cases. The model has 128K context and an October 2023 knowledge cutoff.

Model Pricing (1M Tokens)
Global Eingabe: $-
Cached Input: $-
Output: $-
US/EU – Data Zones Eingabe: $-
Cached Input: $-
Output: $-
Regional Eingabe: $-
Cached Input: $-
Output: $-

Plan with the Pricing Calculator

Realtime API

Featured in the Realtime API, the GPT-4o-Realtime-Preview supports multilingual speech-to-speech capabilities. Optimized for real-time, low-latency conversations, it enables natural interactions with minimal delay, ideal for chatbots and conversational AI.

Model Pricing (1M Tokens)
GPT-4o-Realtime-Preview-Global Text
Eingabe: $-
Cached Input: $-
Output: $-

Audio
Eingabe: $-
Cached Input: $-
Output: $-
GPT-4o-Realtime-Preview-US/EU – Data Zones Text
Eingabe: $-
Cached Input: $-
Output: $-

Audio
Eingabe: $-
Cached Input: $-
Output: $-
GPT-4o-Realtime-Preview-Regional Text
Eingabe: $-
Cached Input: $-
Output: $-

Audio
Eingabe: $-
Cached Input: $-
Output: $-

Chat Completions API - Coming soon

Featured in the Chat Completions API, the GPT 4o-Audio-Preview model processes and generates audio content. It supports advanced features like speech recognition and audio synthesis, ideal for asynchronous speech interactions and sentiment analysis.

Model Pricing (1M Tokens)
GPT-4o-Audio-Preview-Global Text
Eingabe: $-
Cached Input: Nicht verfügbar
Output: $-

Audio
Eingabe: $-
Cached Input: Nicht verfügbar
Output: $-

GPT-4o

GPT-4o is the most advanced multimodal model that’s faster and cheaper than GPT-4 Turbo with stronger vision capabilities. The model has 128K context and an October 2023 knowledge cutoff.

Model Pricing (1M Tokens) Pricing with Batch API (1M Tokens)
GPT-4o-2024-08-06 Global Eingabe: $-
Cached Input: $-
Output: $-
Eingabe: $-
Output: $-
US/EU – Data Zones Eingabe: $-
Cached Input: $-
Output: $-
Nicht verfügbar
Regional Eingabe: $-
Cached Input: $-
Output: $-
Nicht verfügbar
GPT-4o-0513 Global Eingabe: $-
Output: $-
Eingabe: $-
Output: $-
US/EU – Data Zones Eingabe: $-
Output: $-
Nicht verfügbar
Regional Eingabe: $-
Output: $-
Nicht verfügbar

Plan with the Pricing Calculator

GPT-4o mini

GPT-4o mini is the most cost-efficient small model, and has vision capabilities. The model has 128K context and an October 2023 knowledge cutoff.

Model Pricing (1M Tokens) Pricing with Batch API (1M Tokens)
Global Eingabe: $-
Cached Input: $-
Output: $-
Eingabe: $-
Output: $-
US/EU – Data Zones Eingabe: $-
Cached Input: $-
Output: $-
Nicht verfügbar
Regional Eingabe: $-
Cached Input: $-
Output: $-
Nicht verfügbar

Plan with the Pricing Calculator

Provisioned

You can allocate and manage throughput for deployments, ensuring predictable performance and stable capacity. You are charged an hourly rate per model regardless of usage, but you can also secure additional savings through monthly and annual reservations. Discover how to transition your regional deployments and provisioned reservations to global and data zones on this Learn page.

Model Min PTUs PTU Hourly pricing PTU Monthly Reservation Pricing PTU Yearly Reservation Pricing
GPT-4o Global 50 $- $- $-
GPT-4o US/EU Data Zones 50 $- $- $-
GPT-4o Regional 50 $- $- $-
GPT-4o Mini Global 25 $- $- $-
GPT-4o Mini US/EU Data Zones 25 $- $- $-
GPT-4o Mini Regional 25 $- $- $-

Plan with the Pricing Calculator

Basismodelle

Modelle Nutzung pro 1 000 Token
Babbage-002 $-
Davinci-002 $-

Optimieren von Modellen

Modelle Training pro 1.000 Token Hosting pro Stunde Eingabenutzung pro 1 000 Token Ausgabenutzung pro 1 000 Token Cached Input per 1,000 tokens
Babbage-002 $- $- $- $- Nicht verfügbar
Davinci-002 $- $- $- $- Nicht verfügbar
GPT-3.5-Turbo (4K) $- $- $- $- Nicht verfügbar
GPT-3.5-Turbo (16K) $- $- $- $- Nicht verfügbar
GPT-4 (8K) $- $- $- $- Nicht verfügbar
GPT-4o $- $- $- $- Nicht verfügbar
GPT-4o-mini $- $- $- $- $-
GPT-4o-0806 Nicht verfügbar Nicht verfügbar Nicht verfügbar Nicht verfügbar $-

Assistenten-API

Die Assistants-API und die zugehörigen Tools erleichtern Entwicklern das Erstellen von KI-Assistenten in ihren Anwendungen.

Die für die Assistenten-API verwendeten Token werden gemäß den für jeden Assistenten verwendeten Tokeneingabe-/Ausgaberaten des ausgewählten Sprachmodells abgerechnet. Darüber hinaus berechnen wir die folgenden Gebühren für die Toolnutzung:

Tool Eingabe
Dateisuche* $-/GB Vektorspeicher pro Tag (1 GB frei)
Codeinterpreter** $-/Session

*GB bezieht sich auf binäre Gigabytes, wobei 1 GB 2^30 Bytes beträgt.

**Wenn Ihr Assistent den Codeinterpreter gleichzeitig in zwei verschiedenen Threads aufruft, werden zwei Codeinterpretersitzungen erstellt (2 * $-). Jede Sitzung ist standardmäßig eine Stunde lang aktiv. Dies bedeutet, dass Sie diese Gebühr nur einmal bezahlen würden, wenn Ihr Benutzer bis zu einer Stunde lang Anweisungen an den Code Interpreter im selben Thread weitergibt.

Die Rückschlusskosten (Eingabe und Ausgabe) variieren je nach GPT-Modell, das mit den einzelnen Assistenten verwendet wird. Wenn Ihr Assistent den Code Interpreter gleichzeitig in zwei verschiedenen Threads aufruft, werden zwei Code Interpreter-Sitzungen erstellt (2 * $-). Jede Sitzung ist standardmäßig eine Stunde lang aktiv. Dies bedeutet, dass der Preis für bis zu einer Stunde gilt, in der Sie Code-Interpreter im selben Thread Anweisungen geben.

Bildmodelle

Modelle Qualität Auflösung Preis (pro 100 Bilder)
Dall-E-3 Standard 1024 * 1024 $-
Standard 1024 * 1792,
1792 * 1024
$-
Dall-E-3 HD 1024 * 1024 $-
HD 1024 * 1792,
1792 * 1024
$-
Dall-E-2 Standard 1024 * 1024 $-

Modelle einbetten

Modelle Pro 1000 Token
Ada $-
text-embedding-3-large $-
text-embedding-3-small $-

Sprachmodelle

Modelle Preis
Flüstern $-/Stunde
TTS (Text-zu-Sprache) $-/1 Mio. Zeichen
TTS HD $-/1 Mio. Zeichen

Legacy-Sprachmodelle

Modelle Kontext Input (Per 1M Tokens) Output (Per 1M Tokens)
GPT-3.5-Turbo-0301 4K $- $-
GPT-3.5-Turbo-0613 4K $- $-
GPT-3.5-Turbo-0613 16K $- $-
GPT-3.5-Turbo-1106 16K $- $-
GPT-3.5-Turbo-0125 16K $- $-
GPT-3.5-Turbo-Instruct 4K $- $-
GPT-4-Turbo 128K $- $-
GPT-4-Turbo-Vision 128K $- $-
GPT-4 8K $- $-
GPT-4 32K $- $-

Azure-Preise und -Kaufoptionen

Direkten Kontakt aufnehmen

Erhalten Sie eine Übersicht über die Azure-Preise. Informieren Sie sich über die Preise für Ihre Cloudlösung und die Möglichkeiten zur Kostenoptimierung, und fordern Sie ein individuelles Angebot an.

Sprechen Sie mit einem Vertriebsspezialisten

Kaufoptionen

Erwerben Sie Azure-Dienste über die Azure-Website, einen Microsoft-Vertreter oder einen Azure-Partner.

Optionen kennenlernen

Zusätzliche Ressourcen

Azure OpenAI-Dienst

Hier erhalten Sie weitere Informationen zu den Features und Funktionen von Azure OpenAI-Dienst.

Preisrechner

Kalkulieren Sie Ihre erwarteten monatlichen Kosten für eine beliebige Kombination von Azure-Produkten.

SLA

Lesen Sie die Vereinbarung zum Servicelevel für Azure OpenAI-Dienst.

Dokumentation

Hier finden Sie technische Tutorials, Videos und weitere Ressourcen zu Azure OpenAI-Dienst.

  • Azure OpenAI Service bietet Preise, die sowohl auf nutzungsbasierter Zahlung als auch auf PTUs (Provisioned Throughput Units) basieren. Mit der nutzungsbasierten Zahlung zahlen Sie für die Ressourcen, die Sie nutzen, sodass sie für variable Workloads flexibel sind. PTUs bieten ein vorhersagbares Preismodell, bei dem Sie eine bestimmte Menge an Modellverarbeitungskapazität reservieren und bereitstellen. Dieses Modell eignet sich ideal für Workloads mit konsistenten oder vorhersagbaren Nutzungsmustern und bietet Stabilität und Kostenkontrolle.
  • Weitere Informationen zu PTUs und Azure OpenAI-Preisen finden Sie in der PTU-Dokumentation, oder wenden Sie sich an unseren Vertriebsexperten.

Sprechen Sie für eine detaillierte Erläuterung der Azure-Preise mit einem Vertriebsspezialisten. Lernen Sie, die Berechnung der Preise für Ihre Cloudlösung zu verstehen.

Sichern Sie sich kostenlose Cloud-Dienste und ein Guthaben in Höhe von $200, mit dem Sie Azure 30 Tage lang erkunden können.

Zur Schätzung hinzufügen Für die Anzeige im Rechner „v“ drücken
Können wir Ihnen helfen?