Azure OpenAI Service – Preisübersicht
Nutzen Sie die Leistungsfähigkeit der generativen KI-Modelle von Azure OpenAI Service mit flexiblen Standard (On-Demand) und Provisioned Throughput Units (PTUs). Mit dem Standardmodell können Sie nur für verarbeitete Token bezahlen, während PTUs einen konsistenten Durchsatz und eine minimale Latenzabweichung für skalierbare Lösungen sicherstellen. Die Preise umfassen Kosten pro 1.000 Token, und PTU-Tarife bieten eine vorhersagbare Kostenstruktur. Sprachmodelle sind jetzt auch in der Batch-API verfügbar, die innerhalb von 24 Stunden Abschlüsse für einen Rabatt von 50 % auf die globalen Standardpreise zurückgibt. Azure OpenAI Service bietet erweiterte Funktionen wie GPT-4o, Optimierung zur Anpassung, DALL-E für die Bildgenerierung und Flüstern für Sprache-zu-Text. Wenden Sie sich an einen Vertriebsexperten, um personalisierte Anleitungen zum Optimieren von KI-Bereitstellungen zu erhalten.
Preisoptionen entdecken
Sie können die Preisoptionen mit Filtern anpassen.
Preise sind nur Schätzungen und nicht als tatsächliche Preisangebote vorgesehen. Die tatsächlichen Preise können je nach Art des mit Microsoft eingegangenen Vertrags, dem Kaufdatum und dem Wechselkurs variieren. Die Preise werden auf der Grundlage des US-Dollars berechnet und anhand der Londoner Schlusskassakurse umgerechnet, die an den beiden Geschäftstagen vor dem letzten Geschäftstag des vorangegangenen Monatsendes erfasst werden. Wenn die beiden Geschäftstage vor dem Monatsende auf einen Bankfeiertag in wichtigen Märkten fallen, ist der Tag der Kursfeststellung in der Regel der Tag, der den beiden Geschäftstagen unmittelbar vorausgeht. Dieser Kurs gilt für alle Transaktionen im kommenden Monat. Melden Sie sich beim Azure-Preisrechner an, um die Preise basierend auf Ihrem aktuellen Programm/Angebot mit Microsoft anzuzeigen. Wenden Sie sich an einen Azure-Vertriebsspezialisten, um weitere Informationen zu den Preisen zu erhalten oder ein Preisangebot anzufordern. Siehe häufig gestellte Fragen zu Azure-Preisen.
US-amerikanische Regierungsbehörden sind für den Erwerb von Azure Government-Diensten von einem Lizenzlösungsanbieter qualifiziert, ohne dass vorab eine finanzielle Verpflichtung eingegangen werden muss. Alternativ kann Azure Government auch direkt über ein Onlineabonnement mit nutzungsbasierter Bezahlung bezogen werden.
Wichtig: Der Preis in R$ dient lediglich als Referenz; hierbei handelt es sich um eine internationale Transaktion; der Endpreis unterliegt Wechselkursen und der Berücksichtigung von IOF-Steuern. eNF wird nicht ausgegeben.
US-amerikanische Regierungsbehörden sind für den Erwerb von Azure Government-Diensten von einem Lizenzlösungsanbieter qualifiziert, ohne dass vorab eine finanzielle Verpflichtung eingegangen werden muss. Alternativ kann Azure Government auch direkt über ein Onlineabonnement mit nutzungsbasierter Bezahlung bezogen werden.
Wichtig: Der Preis in R$ dient lediglich als Referenz; hierbei handelt es sich um eine internationale Transaktion; der Endpreis unterliegt Wechselkursen und der Berücksichtigung von IOF-Steuern. eNF wird nicht ausgegeben.
Preisdetails:
Sprachmodelle
Modelle | Kontext | Eingabe (pro 1.000 Token) | Ausgabe (pro 1.000 Token) | Preis pro PTU pro Stunde | Minimale Skalierungsinkrementierung | Monatliche Reservierung pro PTU | Jährliche Reservierung pro PTU |
---|---|---|---|---|---|---|---|
gpt-4o-2024-08-06 Global Deployment | 128K | $- | $- | Nicht verfügbar | Nicht verfügbar | Nicht verfügbar | Nicht verfügbar |
gpt-4o-2024-08-06 Regional API | 128K | $- | $- | Nicht verfügbar | Nicht verfügbar | Nicht verfügbar | Nicht verfügbar |
Globale GPT-4o-Bereitstellung | 128K | $- | $- | Nicht verfügbar | Nicht verfügbar | Nicht verfügbar | Nicht verfügbar |
Regionale GPT-4o-API | 128K | $- | $- | $- | 50 PTUs | $- | $- |
GPT-4o-mini – globale Bereitstellung | 128K | $- | $- | Nicht verfügbar | Nicht verfügbar | Nicht verfügbar | Nicht verfügbar |
GPT-4o-mini – regionale API | 128K | $- | $- | $- | 25 PTUs | $- | $- |
GPT-3.5-Turbo-0125 | 16K | $- | $- | $- | 100 PTUs | $- | $- |
GPT-3.5-Turbo-Instruct | 4K | $- | $- | Nicht verfügbar | Nicht verfügbar | Nicht verfügbar | Nicht verfügbar |
GPT-4-Turbo | 128K | $- | $- | $- | 100 PTUs | $- | $- |
GPT-4-Turbo-Vision | 128K | $- | $- | Nicht verfügbar | Nicht verfügbar | Nicht verfügbar | Nicht verfügbar |
GPT-4 | 8K | $- | $- | $- | 50 PTUs | $- | $- |
GPT-4 | 32K | $- | $- | $- | 200 PTUs | $- | $- |
Diese Tabelle enthält einen detaillierten Vergleich der Preise von "Standard" (On-Demand) und "Provisioned" (PTU) für verschiedene Sprachmodelle. Die Spalte "Context" gibt die maximale Anzahl von Token an, die jedes Modell pro Antwort verarbeiten kann. Preisdetails für Eingabe- und Ausgabetoken werden aufgeführt, die die Kosten pro 1.000 Token widerspiegeln. Das PTU-Preismodell umfasst einen Stundensatz und eine minimale Skalierungsinkrementierung, die die Mindestanzahl der für jedes Modell erforderlichen PTUs darstellt. Die Spalten "Monatliche Reservierung pro PTU" und "Jährliche Reservierung pro PTU" geben die Reservierungskosten pro PTU an. Dieser Vergleich hilft Benutzern dabei, die Kosten zu verstehen, die sich aus der Verwendung jedes Modells sowohl im Rahmen der Abrechnungsoptionen "Standard" (On-Demand) als auch "Provisioned" (PTU) ergeben, sodass auf Grundlage ihrer spezifischen Nutzungsanforderungen fundierte Entscheidungen getroffen werden können.
Sprachmodelle sind jetzt auch in der Batch-API verfügbar, die innerhalb von 24 Stunden Abschlüsse für einen Rabatt von 50 % auf die globalen Standardpreise zurückgibt.
Legacy-Sprachmodelle
Modelle | Kontext | Eingabe (pro 1.000 Token) | Ausgabe (pro 1.000 Token) |
---|---|---|---|
GPT-3.5-Turbo-0301 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 16K | $- | $- |
GPT-3.5-Turbo-1106 | 16K | $- | $- |
Assistenten-API
Die Assistants-API und die zugehörigen Tools erleichtern Entwicklern das Erstellen von KI-Assistenten in ihren Anwendungen.
Die für die Assistenten-API verwendeten Token werden gemäß den für jeden Assistenten verwendeten Tokeneingabe-/Ausgaberaten des ausgewählten Sprachmodells abgerechnet. Darüber hinaus berechnen wir die folgenden Gebühren für die Toolnutzung:
Tool | Eingabe |
---|---|
Dateisuche* | $-/GB Vektorspeicher pro Tag (1 GB frei) |
Codeinterpreter** | $-/Session |
*GB bezieht sich auf binäre Gigabytes, wobei 1 GB 2^30 Bytes beträgt.
**Wenn Ihr Assistent den Codeinterpreter gleichzeitig in zwei verschiedenen Threads aufruft, werden zwei Codeinterpretersitzungen erstellt (2 * $-). Jede Sitzung ist standardmäßig eine Stunde lang aktiv. Dies bedeutet, dass Sie diese Gebühr nur einmal bezahlen würden, wenn Ihr Benutzer bis zu einer Stunde lang Anweisungen an den Code Interpreter im selben Thread weitergibt.
Die Rückschlusskosten (Eingabe und Ausgabe) variieren je nach GPT-Modell, das mit den einzelnen Assistenten verwendet wird. Wenn Ihr Assistent den Code Interpreter gleichzeitig in zwei verschiedenen Threads aufruft, werden zwei Code Interpreter-Sitzungen erstellt (2 * $-). Jede Sitzung ist standardmäßig eine Stunde lang aktiv. Dies bedeutet, dass der Preis für bis zu einer Stunde gilt, in der Sie Code-Interpreter im selben Thread Anweisungen geben.
Basismodelle
Modelle | Nutzung pro 1 000 Token |
---|---|
Babbage-002 | $- |
Davinci-002 | $- |
Optimieren von Modellen
Modelle | Training pro 1.000 Token | Hosting pro Stunde | Eingabenutzung pro 1 000 Token | Ausgabenutzung pro 1 000 Token |
---|---|---|---|---|
Babbage-002 | $- | $- | $- | $- |
Davinci-002 | $- | $- | $- | $- |
GPT-3.5-Turbo (4K) | $- | $- | $- | $- |
GPT-3.5-Turbo (16K) | $- | $- | $- | $- |
GPT-4 (8K) | $- | $- | $- | $- |
GPT-4o | $- | $- | $- | $- |
GPT-4o-mini | $- | $- | $- | $- |
Bildmodelle
Modelle | Qualität | Auflösung | Preis (pro 100 Bilder) |
---|---|---|---|
Dall-E-3 | Standard | 1024 * 1024 | $- |
Standard | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-3 | HD | 1024 * 1024 | $- |
HD | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-2 | Standard | 1024 * 1024 | $- |
Modelle einbetten
Modelle | Pro 1000 Token |
---|---|
Ada | $- |
text-embedding-3-large | $- |
text-embedding-3-small | $- |
Sprachmodelle
Modelle | Preis |
---|---|
Flüstern | $-/Stunde |
TTS (Text-zu-Sprache) | $-/1 Mio. Zeichen |
TTS HD | $-/1 Mio. Zeichen |
Azure-Preise und -Kaufoptionen
Direkten Kontakt aufnehmen
Erhalten Sie eine Übersicht über die Azure-Preise. Informieren Sie sich über die Preise für Ihre Cloudlösung und die Möglichkeiten zur Kostenoptimierung, und fordern Sie ein individuelles Angebot an.
Sprechen Sie mit einem VertriebsspezialistenKaufoptionen
Erwerben Sie Azure-Dienste über die Azure-Website, einen Microsoft-Vertreter oder einen Azure-Partner.
Optionen kennenlernenZusätzliche Ressourcen
Azure OpenAI-Dienst
Hier erhalten Sie weitere Informationen zu den Features und Funktionen von Azure OpenAI-Dienst.
Preisrechner
Kalkulieren Sie Ihre erwarteten monatlichen Kosten für eine beliebige Kombination von Azure-Produkten.
SLA
Lesen Sie die Vereinbarung zum Servicelevel für Azure OpenAI-Dienst.
Dokumentation
Hier finden Sie technische Tutorials, Videos und weitere Ressourcen zu Azure OpenAI-Dienst.
Häufig gestellte Fragen
-
Azure OpenAI Service bietet Preise, die sowohl auf nutzungsbasierter Zahlung als auch auf PTUs (Provisioned Throughput Units) basieren. Mit der nutzungsbasierten Zahlung zahlen Sie für die Ressourcen, die Sie nutzen, sodass sie für variable Workloads flexibel sind. PTUs bieten ein vorhersagbares Preismodell, bei dem Sie eine bestimmte Menge an Modellverarbeitungskapazität reservieren und bereitstellen. Dieses Modell eignet sich ideal für Workloads mit konsistenten oder vorhersagbaren Nutzungsmustern und bietet Stabilität und Kostenkontrolle.
-
Weitere Informationen zu PTUs und Azure OpenAI-Preisen finden Sie in der PTU-Dokumentation, oder wenden Sie sich an unseren Vertriebsexperten.
Sprechen Sie für eine detaillierte Erläuterung der Azure-Preise mit einem Vertriebsspezialisten. Lernen Sie, die Berechnung der Preise für Ihre Cloudlösung zu verstehen.
Sichern Sie sich kostenlose Cloud-Dienste und ein Guthaben in Höhe von $200, mit dem Sie Azure 30 Tage lang erkunden können.