Zu Hauptinhalt springen
Azure

Azure OpenAI-Dienst – Preise

Azure OpenAI Service – Preisübersicht

Azure OpenAI Service bietet unternehmensfähige generative KI mit leistungsstarken Modellen von OpenAI, die es Unternehmen ermöglichen, mit Text-, Audio- und Visionfunktionen innovativ zu sein. Abgesehen von den neuesten Modellen entscheiden sich Unternehmen wegen des integrierten Datenschutzes, der regionale/regionale/globale Flexibilität und der nahtlosen Integration in das Azure-Ökosystem, einschließlich Fabric, Cosmos DB und Azure KI-Suche, für Azure OpenAI Service. Unternehmen jeder Größe können KI-Lösungen zuverlässig skalieren, um die Kundenerfahrung zu verbessern, Workflows zu automatisieren und u automatisieren und kreatives Potenzial freizusetzen, um messbare Erfolge zu erzielen und sich vom Wettbewerb abzuheben.

Um unsere Kunden auf diesem Weg zu unterstützen, bieten wir Lösungen für die Preisgestaltung und das Kostenmanagement an, die Ihren Anforderungen gerecht werden, darunter:
  • Standard (bedarfsgesteuert): Nutzungsbasierte Bezahlung für Eingabe- und Ausgabetoken.
  • Bereitgestellt (PTUs): Weisen Sie Durchsatz mit vorhersehbaren Kosten zu, wobei monatliche und jährliche Reservierungen verfügbar sind, um die Gesamtausgaben zu reduzieren.
  • Batch-API: Sprachmodelle sind jetzt auch in derBatch-API für globale Bereitstellungen und drei Regionen verfügbar, die innerhalb von 24 Stunden zu einem Rabatt von 50 % auf den globalen Standardpreis abgeschlossen wird.
Sie können zwischen den folgenden Bereitstellungstypen für „Standard“ und „Bereitgestellt“ wählen, die mehr Flexibilität und Kontrolle über Preise und Leistung bieten. Diese Flexibilität ist hilfreich, wenn die Datenverarbeitungsgrenzen immer enger werden und ein höherer Durchsatz bei niedrigeren Kosten erforderlich ist.
  • Globale Bereitstellung – Globale SKU
  • Datenzonenbereitstellung – Geografisch (EU oder USA)
  • Regionale Bereitstellung – Lokale Region (bis zu 27 Regionen)

Preisoptionen entdecken

Sie können die Preisoptionen mit Filtern anpassen.

Preise sind nur Schätzungen und nicht als tatsächliche Preisangebote vorgesehen. Die tatsächlichen Preise können je nach Art des mit Microsoft eingegangenen Vertrags, dem Kaufdatum und dem Wechselkurs variieren. Die Preise werden auf der Grundlage des US-Dollars berechnet und anhand der Londoner Schlusskassakurse umgerechnet, die an den beiden Geschäftstagen vor dem letzten Geschäftstag des vorangegangenen Monatsendes erfasst werden. Wenn die beiden Geschäftstage vor dem Monatsende auf einen Bankfeiertag in wichtigen Märkten fallen, ist der Tag der Kursfeststellung in der Regel der Tag, der den beiden Geschäftstagen unmittelbar vorausgeht. Dieser Kurs gilt für alle Transaktionen im kommenden Monat. Melden Sie sich beim Azure-Preisrechner an, um die Preise basierend auf Ihrem aktuellen Programm/Angebot mit Microsoft anzuzeigen. Wenden Sie sich an einen Azure-Vertriebsspezialisten, um weitere Informationen zu den Preisen zu erhalten oder ein Preisangebot anzufordern. Siehe häufig gestellte Fragen zu Azure-Preisen.

o1

o1 is the new reasoning model series for complex tasks. The model has 200K context and an October 2023 knowledge cutoff.

Modell Preise (1 Mio. Token)
o1 1217 Global Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
o1 1217 US/EU – Data Zones Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
o1 1217 Regional Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
o1 preview Global Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
o1 preview US/EU – Data Zones Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
o1 preview Regional Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-

Planen mit dem Preisrechner

o1 Mini

o1-mini ist ein schnelles, kostengünstiges Schlussfolgerungsmodell, das auf Anwendungsfälle in den Bereichen Programmierung, Mathematik und Naturwissenschaften zugeschnitten ist. Das Modell verfügt über 128 KB Kontext und einen Wissensstand vom Oktober 2023.

Modell Preise (1 Mio. Token)
Weltweit Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
USA/EU – Datenzonen Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Regional Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-

Planen mit dem Preisrechner

Realtime API

Featured in the Realtime API, the GPT-4o-Realtime-Preview supports multilingual speech-to-speech capabilities. Optimized for real-time, low-latency conversations, it enables natural interactions with minimal delay, ideal for chatbots and conversational AI.

Modell Preise (1 Mio. Token)
GPT-4o-Realtime-Preview-Global Text
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
GPT-4o-Realtime-Preview-US/EU – Data Zones Text
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
GPT-4o-Realtime-Preview-Regional Text
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-

Chatvervollständigungs-API – Bald verfügbar

Featured in the Chat Completions API, the GPT 4o-Audio-Preview model processes and generates audio content. It supports advanced features like speech recognition and audio synthesis, ideal for asynchronous speech interactions and sentiment analysis. Cached input is coming soon.

Modell Preise (1 Mio. Token)
GPT-4o-Audio-Preview-Global Text
Eingabe: $-
Zwischengespeicherte Eingabe: Nicht verfügbar
Ausgabe: $-

Audio
Eingabe: $-
Zwischengespeicherte Eingabe: Nicht verfügbar
Ausgabe: $-

GPT-4o

GPT-4o ist das fortschrittlichste multimodale Modell, das schneller und kostengünstiger als GPT-4 Turbo ist und stärkere Visionfunktionen bietet. Das Modell verfügt über 128 KB Kontext und einen Wissensstand vom Oktober 2023.

Modell Preise (1 Mio. Token) Preise mit Batch-API (1 Mio. Token)
GPT-4o-2024-1120 Global Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Eingabe: $-
Ausgabe: $-
GPT-4o-2024-1120 US/EU – Data Zones Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Eingabe: $-
Ausgabe: $-
GPT-4o-2024-1120 Regional Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar
GPT-4o-2024-08-06 Global Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Eingabe: $-
Ausgabe: $-
GPT-4o-2024-08-06 US/EU – Data Zones Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar
GPT-4o-2024-08-06 Regional Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar
GPT-4o-2024-0513 Global Eingabe: $-
Ausgabe: $-
Eingabe: $-
Ausgabe: $-
GPT-4o-2024-0513 US/EU – Data Zones Eingabe: $-
Ausgabe: $-
Nicht verfügbar
GPT-4o-2024-0513 Regional Eingabe: $-
Ausgabe: $-
Nicht verfügbar

Planen mit dem Preisrechner

GPT-4o mini

GPT-4o mini ist das kostengünstigste kleine Modell und verfügt über Visionfunktionen. Das Modell verfügt über 128 KB Kontext und einen Wissensstand vom Oktober 2023.

Modell Preise (1 Mio. Token) Preise mit Batch-API (1 Mio. Token)
Weltweit Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Eingabe: $-
Ausgabe: $-
USA/EU – Datenzonen Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar
Regional Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar

Planen mit dem Preisrechner

Bereitgestellt

You can allocate and manage throughput for deployments, ensuring predictable performance and stable capacity. You are charged an hourly rate per model regardless of usage, but you can also secure additional savings through monthly and annual reservations. Discover how to transition your regional deployments and provisioned reservations to global and data zones on this Learn page.

Modell Min. PTUs Stündliche Preise für PTU PTU – Preise für monatliche Reservierung PTU – Preise für jährliche Reservierung
GPT-4o Global 15 $- $- $-
GPT-4o US/EU-Datenzonen 15 $- $- $-
GPT-4o Regional 50 $- $- $-
GPT-4o Mini Global 15 $- $- $-
GPT-4o Mini US/EU-Datenzonen 15 $- $- $-
GPT-4o Mini Regional 25 $- $- $-

Planen mit dem Preisrechner

Basismodelle

Modelle Nutzung pro 1 000 Token
Babbage-002 $-
Davinci-002 $-

Optimieren von Modellen

Modell Pricing
GPT-4o-2024-08-06 Regional Eingabe: $- / 1M tokens
Zwischengespeicherte Eingabe: $- / 1M tokens
Ausgabe: $- / 1M tokens
Training: $- / 1M tokens
Hosting: $- / hour
Weltweit Eingabe: $- / 1M tokens
Zwischengespeicherte Eingabe: $- / 1M tokens
Ausgabe: $- / 1M tokens
Training: use regional
Hosting: $- / hour
GPT-4o-mini Regional Eingabe: $- / 1M tokens
Zwischengespeicherte Eingabe: $- / 1M tokens
Ausgabe: $- / 1M tokens
Training: $- / 1M tokens
Hosting: $- / hour
Weltweit Eingabe: $- / 1M tokens
Zwischengespeicherte Eingabe: $- / 1M tokens
Ausgabe: $- / 1M tokens
Training: use regional
Hosting: $- / hour
GPT-4-0613 (8K) Regional Eingabe: $- / 1M tokens
Ausgabe: $- / 1M tokens
Training: $- / 1M tokens
Hosting: $- / hour
GPT-3.5-Turbo (16K) Regional Eingabe: $- / 1M tokens
Ausgabe: $- / 1M tokens
Training: $- / 1M tokens
Hosting: $- / hour
GPT-3.5-Turbo (4K) Regional Eingabe: $- / 1M tokens
Ausgabe: $- / 1M tokens
Training: $- / 1M tokens
Hosting: $- / hour
Babbage-002 Eingabe: $- / 1M tokens
Ausgabe: $- / 1M tokens
Training: $- / 1M tokens
Hosting: $- / hour
Davinci-002 Eingabe: $- / 1M tokens
Ausgabe: $- / 1M tokens
Training: $- / 1M tokens
Hosting: $- / hour

Assistenten-API

Die Assistants-API und die zugehörigen Tools erleichtern Entwicklern das Erstellen von KI-Assistenten in ihren Anwendungen.

Die für die Assistenten-API verwendeten Token werden gemäß den für jeden Assistenten verwendeten Tokeneingabe-/Ausgaberaten des ausgewählten Sprachmodells abgerechnet. Darüber hinaus berechnen wir die folgenden Gebühren für die Toolnutzung:

Tool Eingabe
Dateisuche* $-/GB Vektorspeicher pro Tag (1 GB frei)
Codeinterpreter** $-/Session

*GB bezieht sich auf binäre Gigabytes, wobei 1 GB 2^30 Bytes beträgt.

**Wenn Ihr Assistent den Codeinterpreter gleichzeitig in zwei verschiedenen Threads aufruft, werden zwei Codeinterpretersitzungen erstellt (2 * $-). Jede Sitzung ist standardmäßig eine Stunde lang aktiv. Dies bedeutet, dass Sie diese Gebühr nur einmal bezahlen würden, wenn Ihr Benutzer bis zu einer Stunde lang Anweisungen an den Code Interpreter im selben Thread weitergibt.

Die Rückschlusskosten (Eingabe und Ausgabe) variieren je nach GPT-Modell, das mit den einzelnen Assistenten verwendet wird. Wenn Ihr Assistent den Code Interpreter gleichzeitig in zwei verschiedenen Threads aufruft, werden zwei Code Interpreter-Sitzungen erstellt (2 * $-). Jede Sitzung ist standardmäßig eine Stunde lang aktiv. Dies bedeutet, dass der Preis für bis zu einer Stunde gilt, in der Sie Code-Interpreter im selben Thread Anweisungen geben.

Bildmodelle

Modelle Qualität Auflösung Preis (pro 100 Bilder)
Dall-E-3 Standard 1024 * 1024 $-
Standard 1024 * 1792,
1792 * 1024
$-
Dall-E-3 HD 1024 * 1024 $-
HD 1024 * 1792,
1792 * 1024
$-
Dall-E-2 Standard 1024 * 1024 $-

Modelle einbetten

Modelle Pro 1000 Token
Ada $-
text-embedding-3-large $-
text-embedding-3-small $-

Sprachmodelle

Modelle Preis
Flüstern $-/Stunde
TTS (Text-zu-Sprache) $-/1 Mio. Zeichen
TTS HD $-/1 Mio. Zeichen

Legacy-Sprachmodelle

Modelle Kontext Eingabe (pro 1 Mio. Token) Ausgabe (pro 1 Mio. Token)
GPT-3.5-Turbo-0301 4K $- $-
GPT-3.5-Turbo-0613 4K $- $-
GPT-3.5-Turbo-0613 16K $- $-
GPT-3.5-Turbo-1106 16K $- $-
GPT-3.5-Turbo-0125 16K $- $-
GPT-3.5-Turbo-Instruct 4K $- $-
GPT-4-Turbo 128K $- $-
GPT-4-Turbo-Vision 128K $- $-
GPT-4 8K $- $-
GPT-4 32K $- $-

Azure-Preise und -Kaufoptionen

Direkten Kontakt aufnehmen

Erhalten Sie eine Übersicht über die Azure-Preise. Informieren Sie sich über die Preise für Ihre Cloudlösung und die Möglichkeiten zur Kostenoptimierung, und fordern Sie ein individuelles Angebot an.

Sprechen Sie mit einem Vertriebsspezialisten

Kaufoptionen

Erwerben Sie Azure-Dienste über die Azure-Website, einen Microsoft-Vertreter oder einen Azure-Partner.

Optionen kennenlernen

Zusätzliche Ressourcen

Azure OpenAI-Dienst

Hier erhalten Sie weitere Informationen zu den Features und Funktionen von Azure OpenAI-Dienst.

Preisrechner

Kalkulieren Sie Ihre erwarteten monatlichen Kosten für eine beliebige Kombination von Azure-Produkten.

SLA

Lesen Sie die Vereinbarung zum Servicelevel für Azure OpenAI-Dienst.

Dokumentation

Hier finden Sie technische Tutorials, Videos und weitere Ressourcen zu Azure OpenAI-Dienst.

  • Azure OpenAI Service bietet Preise, die sowohl auf nutzungsbasierter Zahlung als auch auf PTUs (Provisioned Throughput Units) basieren. Mit der nutzungsbasierten Zahlung zahlen Sie für die Ressourcen, die Sie nutzen, sodass sie für variable Workloads flexibel sind. PTUs bieten ein vorhersagbares Preismodell, bei dem Sie eine bestimmte Menge an Modellverarbeitungskapazität reservieren und bereitstellen. Dieses Modell eignet sich ideal für Workloads mit konsistenten oder vorhersagbaren Nutzungsmustern und bietet Stabilität und Kostenkontrolle.
  • Weitere Informationen zu PTUs und Azure OpenAI-Preisen finden Sie in der PTU-Dokumentation, oder wenden Sie sich an unseren Vertriebsexperten.

Sprechen Sie für eine detaillierte Erläuterung der Azure-Preise mit einem Vertriebsspezialisten. Lernen Sie, die Berechnung der Preise für Ihre Cloudlösung zu verstehen.

Sichern Sie sich kostenlose Cloud-Dienste und ein Guthaben in Höhe von $200, mit dem Sie Azure 30 Tage lang erkunden können.

Zur Schätzung hinzufügen Für die Anzeige im Rechner „v“ drücken
Können wir Ihnen helfen?