Zu Hauptinhalt springen
Azure

Azure OpenAI-Dienst – Preise

Azure OpenAI Service – Preisübersicht

Nutzen Sie die Leistungsfähigkeit der generativen KI-Modelle von Azure OpenAI Service mit flexiblen Standard (On-Demand) und Provisioned Throughput Units (PTUs). Mit dem Standardmodell können Sie nur für verarbeitete Token bezahlen, während PTUs einen konsistenten Durchsatz und eine minimale Latenzabweichung für skalierbare Lösungen sicherstellen. Die Preise umfassen Kosten pro 1.000 Token, und PTU-Tarife bieten eine vorhersagbare Kostenstruktur. Sprachmodelle sind jetzt auch in der Batch-API verfügbar, die innerhalb von 24 Stunden Abschlüsse für einen Rabatt von 50 % auf die globalen Standardpreise zurückgibt. Azure OpenAI Service bietet erweiterte Funktionen wie GPT-4o, Optimierung zur Anpassung, DALL-E für die Bildgenerierung und Flüstern für Sprache-zu-Text. Wenden Sie sich an einen Vertriebsexperten, um personalisierte Anleitungen zum Optimieren von KI-Bereitstellungen zu erhalten.

Preisoptionen entdecken

Sie können die Preisoptionen mit Filtern anpassen.

Preise sind nur Schätzungen und nicht als tatsächliche Preisangebote vorgesehen. Die tatsächlichen Preise können je nach Art des mit Microsoft eingegangenen Vertrags, dem Kaufdatum und dem Wechselkurs variieren. Die Preise werden auf der Grundlage des US-Dollars berechnet und anhand der Londoner Schlusskassakurse umgerechnet, die an den beiden Geschäftstagen vor dem letzten Geschäftstag des vorangegangenen Monatsendes erfasst werden. Wenn die beiden Geschäftstage vor dem Monatsende auf einen Bankfeiertag in wichtigen Märkten fallen, ist der Tag der Kursfeststellung in der Regel der Tag, der den beiden Geschäftstagen unmittelbar vorausgeht. Dieser Kurs gilt für alle Transaktionen im kommenden Monat. Melden Sie sich beim Azure-Preisrechner an, um die Preise basierend auf Ihrem aktuellen Programm/Angebot mit Microsoft anzuzeigen. Wenden Sie sich an einen Azure-Vertriebsspezialisten, um weitere Informationen zu den Preisen zu erhalten oder ein Preisangebot anzufordern. Siehe häufig gestellte Fragen zu Azure-Preisen.

Preisdetails:

Sprachmodelle

Modelle Kontext Eingabe (pro 1.000 Token) Ausgabe (pro 1.000 Token) Preis pro PTU pro Stunde Minimale Skalierungsinkrementierung Monatliche Reservierung pro PTU Jährliche Reservierung pro PTU
gpt-4o-2024-08-06 Global Deployment 128K $- $- Nicht verfügbar Nicht verfügbar Nicht verfügbar Nicht verfügbar
gpt-4o-2024-08-06 Regional API 128K $- $- Nicht verfügbar Nicht verfügbar Nicht verfügbar Nicht verfügbar
Globale GPT-4o-Bereitstellung 128K $- $- Nicht verfügbar Nicht verfügbar Nicht verfügbar Nicht verfügbar
Regionale GPT-4o-API 128K $- $- $- 50 PTUs $- $-
GPT-4o-mini – globale Bereitstellung 128K $- $- Nicht verfügbar Nicht verfügbar Nicht verfügbar Nicht verfügbar
GPT-4o-mini – regionale API 128K $- $- $- 25 PTUs $- $-
GPT-3.5-Turbo-0125 16K $- $- $- 100 PTUs $- $-
GPT-3.5-Turbo-Instruct 4K $- $- Nicht verfügbar Nicht verfügbar Nicht verfügbar Nicht verfügbar
GPT-4-Turbo 128K $- $- $- 100 PTUs $- $-
GPT-4-Turbo-Vision 128K $- $- Nicht verfügbar Nicht verfügbar Nicht verfügbar Nicht verfügbar
GPT-4 8K $- $- $- 50 PTUs $- $-
GPT-4 32K $- $- $- 200 PTUs $- $-

Diese Tabelle enthält einen detaillierten Vergleich der Preise von "Standard" (On-Demand) und "Provisioned" (PTU) für verschiedene Sprachmodelle. Die Spalte "Context" gibt die maximale Anzahl von Token an, die jedes Modell pro Antwort verarbeiten kann. Preisdetails für Eingabe- und Ausgabetoken werden aufgeführt, die die Kosten pro 1.000 Token widerspiegeln. Das PTU-Preismodell umfasst einen Stundensatz und eine minimale Skalierungsinkrementierung, die die Mindestanzahl der für jedes Modell erforderlichen PTUs darstellt. Die Spalten "Monatliche Reservierung pro PTU" und "Jährliche Reservierung pro PTU" geben die Reservierungskosten pro PTU an. Dieser Vergleich hilft Benutzern dabei, die Kosten zu verstehen, die sich aus der Verwendung jedes Modells sowohl im Rahmen der Abrechnungsoptionen "Standard" (On-Demand) als auch "Provisioned" (PTU) ergeben, sodass auf Grundlage ihrer spezifischen Nutzungsanforderungen fundierte Entscheidungen getroffen werden können.

Sprachmodelle sind jetzt auch in der Batch-API verfügbar, die innerhalb von 24 Stunden Abschlüsse für einen Rabatt von 50 % auf die globalen Standardpreise zurückgibt.

Legacy-Sprachmodelle

Modelle Kontext Eingabe (pro 1.000 Token) Ausgabe (pro 1.000 Token)
GPT-3.5-Turbo-0301 4K $- $-
GPT-3.5-Turbo-0613 4K $- $-
GPT-3.5-Turbo-0613 16K $- $-
GPT-3.5-Turbo-1106 16K $- $-

Assistenten-API

Die Assistants-API und die zugehörigen Tools erleichtern Entwicklern das Erstellen von KI-Assistenten in ihren Anwendungen.

Die für die Assistenten-API verwendeten Token werden gemäß den für jeden Assistenten verwendeten Tokeneingabe-/Ausgaberaten des ausgewählten Sprachmodells abgerechnet. Darüber hinaus berechnen wir die folgenden Gebühren für die Toolnutzung:

Tool Eingabe
Dateisuche* $-/GB Vektorspeicher pro Tag (1 GB frei)
Codeinterpreter** $-/Session

*GB bezieht sich auf binäre Gigabytes, wobei 1 GB 2^30 Bytes beträgt.

**Wenn Ihr Assistent den Codeinterpreter gleichzeitig in zwei verschiedenen Threads aufruft, werden zwei Codeinterpretersitzungen erstellt (2 * $-). Jede Sitzung ist standardmäßig eine Stunde lang aktiv. Dies bedeutet, dass Sie diese Gebühr nur einmal bezahlen würden, wenn Ihr Benutzer bis zu einer Stunde lang Anweisungen an den Code Interpreter im selben Thread weitergibt.

Die Rückschlusskosten (Eingabe und Ausgabe) variieren je nach GPT-Modell, das mit den einzelnen Assistenten verwendet wird. Wenn Ihr Assistent den Code Interpreter gleichzeitig in zwei verschiedenen Threads aufruft, werden zwei Code Interpreter-Sitzungen erstellt (2 * $-). Jede Sitzung ist standardmäßig eine Stunde lang aktiv. Dies bedeutet, dass der Preis für bis zu einer Stunde gilt, in der Sie Code-Interpreter im selben Thread Anweisungen geben.

Basismodelle

Modelle Nutzung pro 1 000 Token
Babbage-002 $-
Davinci-002 $-

Optimieren von Modellen

Modelle Training pro 1.000 Token Hosting pro Stunde Eingabenutzung pro 1 000 Token Ausgabenutzung pro 1 000 Token
Babbage-002 $- $- $- $-
Davinci-002 $- $- $- $-
GPT-3.5-Turbo (4K) $- $- $- $-
GPT-3.5-Turbo (16K) $- $- $- $-
GPT-4 (8K) $- $- $- $-
GPT-4o $- $- $- $-
GPT-4o-mini $- $- $- $-

Bildmodelle

Modelle Qualität Auflösung Preis (pro 100 Bilder)
Dall-E-3 Standard 1024 * 1024 $-
Standard 1024 * 1792,
1792 * 1024
$-
Dall-E-3 HD 1024 * 1024 $-
HD 1024 * 1792,
1792 * 1024
$-
Dall-E-2 Standard 1024 * 1024 $-

Modelle einbetten

Modelle Pro 1000 Token
Ada $-
text-embedding-3-large $-
text-embedding-3-small $-

Sprachmodelle

Modelle Preis
Flüstern $-/Stunde
TTS (Text-zu-Sprache) $-/1 Mio. Zeichen
TTS HD $-/1 Mio. Zeichen

Azure-Preise und -Kaufoptionen

Direkten Kontakt aufnehmen

Erhalten Sie eine Übersicht über die Azure-Preise. Informieren Sie sich über die Preise für Ihre Cloudlösung und die Möglichkeiten zur Kostenoptimierung, und fordern Sie ein individuelles Angebot an.

Sprechen Sie mit einem Vertriebsspezialisten

Kaufoptionen

Erwerben Sie Azure-Dienste über die Azure-Website, einen Microsoft-Vertreter oder einen Azure-Partner.

Optionen kennenlernen

Zusätzliche Ressourcen

Azure OpenAI-Dienst

Hier erhalten Sie weitere Informationen zu den Features und Funktionen von Azure OpenAI-Dienst.

Preisrechner

Kalkulieren Sie Ihre erwarteten monatlichen Kosten für eine beliebige Kombination von Azure-Produkten.

SLA

Lesen Sie die Vereinbarung zum Servicelevel für Azure OpenAI-Dienst.

Dokumentation

Hier finden Sie technische Tutorials, Videos und weitere Ressourcen zu Azure OpenAI-Dienst.

  • Azure OpenAI Service bietet Preise, die sowohl auf nutzungsbasierter Zahlung als auch auf PTUs (Provisioned Throughput Units) basieren. Mit der nutzungsbasierten Zahlung zahlen Sie für die Ressourcen, die Sie nutzen, sodass sie für variable Workloads flexibel sind. PTUs bieten ein vorhersagbares Preismodell, bei dem Sie eine bestimmte Menge an Modellverarbeitungskapazität reservieren und bereitstellen. Dieses Modell eignet sich ideal für Workloads mit konsistenten oder vorhersagbaren Nutzungsmustern und bietet Stabilität und Kostenkontrolle.
  • Weitere Informationen zu PTUs und Azure OpenAI-Preisen finden Sie in der PTU-Dokumentation, oder wenden Sie sich an unseren Vertriebsexperten.

Sprechen Sie für eine detaillierte Erläuterung der Azure-Preise mit einem Vertriebsspezialisten. Lernen Sie, die Berechnung der Preise für Ihre Cloudlösung zu verstehen.

Sichern Sie sich kostenlose Cloud-Dienste und ein Guthaben in Höhe von $200, mit dem Sie Azure 30 Tage lang erkunden können.

Zur Schätzung hinzufügen Für die Anzeige im Rechner „v“ drücken
Können wir Ihnen helfen?