Zu Hauptinhalt springen
Azure

Azure OpenAI-Dienst – Preise

Azure OpenAI Service – Preisübersicht

Azure OpenAI Service bietet unternehmensfähige generative KI mit leistungsstarken Modellen von OpenAI, die es Unternehmen ermöglichen, mit Text-, Audio- und Visionfunktionen innovativ zu sein. Abgesehen von den neuesten Modellen entscheiden sich Unternehmen wegen des integrierten Datenschutzes, der regionale/regionale/globale Flexibilität und der nahtlosen Integration in das Azure-Ökosystem, einschließlich Fabric, Cosmos DB und Azure KI-Suche, für Azure OpenAI Service. Unternehmen jeder Größe können KI-Lösungen zuverlässig skalieren, um die Kundenerfahrung zu verbessern, Workflows zu automatisieren und u automatisieren und kreatives Potenzial freizusetzen, um messbare Erfolge zu erzielen und sich vom Wettbewerb abzuheben.

Um unsere Kunden auf diesem Weg zu unterstützen, bieten wir Lösungen für die Preisgestaltung und das Kostenmanagement an, die Ihren Anforderungen gerecht werden, darunter:
  • Standard (bedarfsgesteuert): Nutzungsbasierte Bezahlung für Eingabe- und Ausgabetoken.
  • Bereitgestellt (PTUs): Weisen Sie Durchsatz mit vorhersehbaren Kosten zu, wobei monatliche und jährliche Reservierungen verfügbar sind, um die Gesamtausgaben zu reduzieren.
  • Batch-API: Sprachmodelle sind jetzt auch in der Batch-API für globale Bereitstellungen und drei Regionen verfügbar, die innerhalb von 24 Stunden zu einem Rabatt von 50 % auf den globalen Standardpreis abgeschlossen wird.
Sie können zwischen den folgenden Bereitstellungstypen für „Standard“ und „Bereitgestellt“ wählen, die mehr Flexibilität und Kontrolle über Preise und Leistung bieten. Diese Flexibilität ist hilfreich, wenn die Datenverarbeitungsgrenzen immer enger werden und ein höherer Durchsatz bei niedrigeren Kosten erforderlich ist.
  • Globale Bereitstellung – Globale SKU
  • Datenzonenbereitstellung – Geografisch (EU oder USA)
  • Regionale Bereitstellung – Lokale Region (bis zu 27 Regionen)

Preisoptionen entdecken

Sie können die Preisoptionen mit Filtern anpassen.

Preise sind nur Schätzungen und nicht als tatsächliche Preisangebote vorgesehen. Die tatsächlichen Preise können je nach Art des mit Microsoft eingegangenen Vertrags, dem Kaufdatum und dem Wechselkurs variieren. Die Preise werden auf der Grundlage des US-Dollars berechnet und anhand der Londoner Schlusskassakurse umgerechnet, die an den beiden Geschäftstagen vor dem letzten Geschäftstag des vorangegangenen Monatsendes erfasst werden. Wenn die beiden Geschäftstage vor dem Monatsende auf einen Bankfeiertag in wichtigen Märkten fallen, ist der Tag der Kursfeststellung in der Regel der Tag, der den beiden Geschäftstagen unmittelbar vorausgeht. Dieser Kurs gilt für alle Transaktionen im kommenden Monat. Melden Sie sich beim Azure-Preisrechner an, um die Preise basierend auf Ihrem aktuellen Programm/Angebot mit Microsoft anzuzeigen. Wenden Sie sich an einen Azure-Vertriebsspezialisten, um weitere Informationen zu den Preisen zu erhalten oder ein Preisangebot anzufordern. Siehe häufig gestellte Fragen zu Azure-Preisen.

GPT-5 series

Modell Preise (1 Mio. Token)
GPT-5 2025-08-07 Global Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
GPT-5 Data Zone Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
GPT-5-mini Global Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
GPT-5-mini Data Zone Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
GPT-5-nano Global Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
GPT-5-nano Data Zone Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
GPT-5 chat Global Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-

Deep Research

Deep Research enables developers and enterprises to automate complex research tasks with structured, citation-rich answers. It is suitable for building customer support bots, internal knowledge assistants, or market analysis tools. Deep Research delivers transparent, auditable insights grounded in real-time web data. Search context tokens are charged input token prices for the model being used. You’ll separately incur charges for Grounding with Bing Search and the base GPT model being used for clarifying questions.

Modell Preise
o3-deep research Global Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-

o3

o3 ist ein leistungsstarkes Begründungsmodell aus der o-Serie von Begründungsmodellen, das die Grenzen in den Bereichen Codeerstellung, Mathematik, Wissenschaft und visueller Wahrnehmung erweitert. Es bietet eine äußerst hohe Leistung bei komplexen Abfragen, die eine facettenreiche Analyse erfordern, und zeigt eine starke Leistung bei visuellen Aufgaben wie der Analyse von Bildern, Diagrammen und Grafiken. Das Modell bietet ein Kontextfenster von 200.000 Token und hat einen Wissensstand bis Juni 2024.

Modell Preise (1 Mio. Token) Preise mit Batch-API (1 Mio. Token)
o3 2025-04-16 Global Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Eingabe: $-
Ausgabe: $-
o3 2025-04-16 Data Zone Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Eingabe: $-
Ausgabe: $-
o3 2025-04-16 Regional Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar

o4-mini

o4-mini ist ein kompaktes, effizientes und kostengünstiges Begründungsmodell aus der o-Serie von OpenAI. Es bietet bei mathematischen und visuellen Aufgaben sowie bei der Codeerstellung eine äußerst gute Leistung. Das Modell bietet ein Kontextfenster von 200.000 Token und hat einen Wissensstand bis Juni 2024.

Modell Preise (1 Mio. Token) Preise mit Batch-API (1 Mio. Token)
o4-mini 2025-04-16 Global Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Eingabe: $-
Ausgabe: $-
o4-mini 2025-04-16 Data Zone Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Eingabe: $-
Ausgabe: $-
o4-mini 2025-04-16 Regional Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar

GPT-4.1-Serie

Die GPT-4.1-Serie ist ein äußerst fortschrittliches universelles Modell mit umfangreichem Weltwissen und einer verbesserten Fähigkeit, die Benutzerabsichten zu verstehen, wodurch es besonders gut für kreative Aufgaben und die Agentplanung geeignet ist. Die Serie bietet ein Kontextfenster von 1 Million Token und hat einen Wissensstand bis Juni 2024.

Modell Preise (1 Mio. Token) Preise mit Batch-API (1 Mio. Token)
GPT-4.1-2025-04-14 Global Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Eingabe: $-
Ausgabe: $-
GPT-4.1-2025-04-14 Data Zone Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Eingabe: $-
Ausgabe: $-
GPT-4.1-2025-04-14 Regional Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar
GPT-4.1-mini-2025-04-14 Global Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Eingabe: $-
Ausgabe: $-
GPT-4.1-mini-2025-04-14 Data Zone Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Eingabe: $-
Ausgabe: $-
GPT-4.1-mini-2025-04-14 Regional Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar
GPT-4.1-nano-2025-04-14 Global Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Eingabe: $-
Ausgabe: $-
GPT-4.1-nano-2025-04-14 Data Zone Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Eingabe: $-
Ausgabe: $-
GPT-4.1-nano-2025-04-14 Regional Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar

Sora in Azure OpenAI

Sora ist ein multimodales generatives KI-Modell, das jetzt in Azure AI Foundry verfügbar ist und kreativen Teams dabei hilft, Ideen durch nahtlose API-First-Integration zum Leben zu erwecken. Basierend auf der Infrastruktur in der Enterprise-Klasse von Azure bietet es eine sichere und skalierbare Bereitstellung zur Umwandlung von Konzepten in hochwertige visuelle Inhalte.

Preis pro Sekunde 1–5s 6–10s 11–15s 16–20s
480 Quadrat $- $- $- $-
480p $- $- $- $-
720 Quadrat $- $- $- $-
720p $- $- $- $-
1080 Quadrat $- $- $- $-
1080p $- $- $- $-

GPT-Image-1

GPT-image-1 verbessert DALL·E durch eine bessere Befolgung von Anweisungen, präzises Textrendering sowie Unterstützung für Bildeingabe und -bearbeitung. Das Modell wird pro Token abgerechnet, wobei für Text- und Bildtoken unterschiedliche Preise gelten.

Modell Preise (1 Mio. Token) Preise mit Batch-API (1 Mio. Token)
GPT-Image-1 Global Eingabetext: $-
Eingabebild: $-
Ausgabebild: $-
Nicht verfügbar
GPT-Image-1 Regional Eingabetext: $-
Eingabebild: $-
Ausgabebild: $-
Nicht verfügbar
GPT-Image-1 Datenzone Eingabetext: $-
Eingabebild: $-
Ausgabebild: $-
Nicht verfügbar

GPT-4.5

GPT-4.5-preview ist das neueste universelle Modell mit umfassendem Wissen und einem besseren Verständnis der Benutzerabsicht, sodass es sich gut für kreative Aufgaben und agentische Planung eignet. Das Modell verfügt über 128 KB Kontext und einen Wissensstand vom Oktober 2023.

Modell Preise (1 Mio. Token) Preise mit Batch-API (1 Mio. Token)
GPT-4.5-Preview-2025-02-27 Global Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar

o1

o1 ist die neue Schlussfolgerungsmodellreihe für komplexe Aufgaben. Das Modell verfügt über 200 KB Kontext und einen Wissensstand vom Oktober 2023.

Modell Preise (1 Mio. Token) Preise mit Batch-API (1 Mio. Token)
o1 2024-12-17 Global Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar
o1 2024-12-17 US/EU – Datenzonen Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar
o1 2024-12-17 Regional Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar
o1 preview 2024-09-12 Global Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar
o1 preview 2024-09-12 US/EU – Datenzonen Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar
o1 preview 2024-09-12 Regional Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar

Planen mit dem Preisrechner

o3 mini

Das o3-mini-Modell ist die aktualisierte Version des o1-mini-Modells. Das o3-mini ist ein schnelles, kosteneffizientes Schlussfolgerungsmodell, das auf Anwendungsfälle in den Bereichen Programmierung, Mathematik und Wissenschaft zugeschnitten ist.

Das o3-mini-Modell bietet jetzt ein erweitertes Kontexteingabefenster von 200.000 Token und eine maximale Ausgabe von 100.000 Token, was ausreichend Platz für komplexe und detaillierte Antworten bietet. Das o1-mini-Modell bietet eine Kontexteingabe von 128.000 Token. Sowohl das o3-Modell als auch das o1-Modell verfügt über einen Wissensstand vom Oktober 2023.

Modell Preise (1 Mio. Token) Preise mit Batch-API (1 Mio. Token)
o3 mini 2025-01-31 Global Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Eingabe: $-
Ausgabe: $-
o3 mini 2025-01-31-US/EU – Datenzonen Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Eingabe: $-
Ausgabe: $-
o3 mini 2025-01-31 Regional Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar
o1-mini 2024-09-12 Global Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar
o1-mini 2024-09-12 US/EU – Datenzonen Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar
o1-mini 2024-09-12 Regional Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar

Planen mit dem Preisrechner

Audiomodelle

Der Azure OpenAI Service umfasst die erweiterten Audiomodelle GPT-4o-Transcribe, GPT-4o-Mini-Transcribe und GPT-4o-Mini-TTS. Diese Modelle verbessern die Spracherkennungs- und Sprachsynthesefunktionen und bieten eine hohe Genauigkeit und anpassbare Sprachausgaben für verschiedene Anwendungen. Sie sind ideal für Kunden-Callcenter, Live-Untertitelung und interaktive Sprachausgaben, und nutzen umfangreiches Vortraining und fortschrittliche Destillationsmethoden für überlegene Leistung.

Modell Preise (1 Mio. Token) Preise mit Batch-API (1 Mio. Token)
GPT-4o-Transcribe Text
Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Ausgabe: Nicht verfügbar
Nicht verfügbar
GPT-4o-Mini-Transcribe Text
Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Ausgabe: Nicht verfügbar
Nicht verfügbar
GPT-4o-Mini-TTS Text
Eingabe: $-
Ausgabe: Nicht verfügbar

Audio
Eingabe: Nicht verfügbar
Ausgabe: $-
Nicht verfügbar

Computerbenutzer-Agent (CUA)

Der Computerbenutzer-Agent (CUA) ist ein spezielles KI-Modell, mit dem KI mit grafischen Benutzeroberflächen (GUIs) interagieren, in Anwendungen navigieren und mehrstufige Aufgaben automatisieren kann – alles über Anweisungen in natürlicher Sprache. Das CUA-Modell kann als Tool in der Antwort-API verwendet werden.

Modell Preise
computer-use-preview Global Eingabe: $-/1 Mio. Token
Ausgabe: $-/1 Mio. Token

Integrierte Tools

Die Antwort-API und die Assistenten-API ermöglichen eine nahtlose Interaktion mit Tools wie Computerverwendung, Code-Interpreter, Funktionsaufrufe und Dateisuche, sodass Fachkräfte in der Entwicklung KI-Agents einfach erstellen können.

Tool Eingabe
Computerverwendung (nur Antwort-API) Eingabe: $-/1 Mio. Token
Ausgabe: $-/1 Mio. Token
Aufruf des Dateisuchtools (nur Antwort-API) $-/1K-Toolaufrufe
Dateisuche* $-/GB Vektorspeicher pro Tag (1 GB frei)
Codeinterpreter** $-/Session

*GB bezieht sich auf binäre Gigabytes, wobei 1 GB 2^30 Bytes beträgt.

**Wenn Ihr Assistent den Codeinterpreter gleichzeitig in zwei verschiedenen Threads aufruft, werden zwei Codeinterpretersitzungen erstellt (2 * $-). Jede Sitzung ist standardmäßig eine Stunde lang aktiv. Dies bedeutet, dass Sie diese Gebühr nur einmal bezahlen würden, wenn Ihr Benutzer bis zu einer Stunde lang Anweisungen an den Code Interpreter im selben Thread weitergibt.

Die Rückschlusskosten (Eingabe und Ausgabe) variieren je nach GPT-Modell, das mit den einzelnen Assistenten verwendet wird. Wenn Ihr Assistent den Code Interpreter gleichzeitig in zwei verschiedenen Threads aufruft, werden zwei Code Interpreter-Sitzungen erstellt (2 * $-). Jede Sitzung ist standardmäßig eine Stunde lang aktiv. Dies bedeutet, dass der Preis für bis zu einer Stunde gilt, in der Sie Code-Interpreter im selben Thread Anweisungen geben.

Echtzeit-API

Die GPT-4o-Realtime-Preview ist in der Echtzeit-API enthalten und unterstützt mehrsprachige Sprache-zu-Sprache-Funktionen. Optimiert für latenzarme Unterhaltungen in Echtzeit. Ermöglicht natürliche Interaktionen mit minimaler Verzögerung und eignet sich ideal für Chatbots und Unterhaltungs-KI. GPT-4o ist die umfassende, leistungsstärkere Version für komplexe Aufgaben, während GPT-4o Mini eine kleinere, erschwinglichere Option ist, die sich ideal für einfachere Anwendungen eignet, bei denen Kosteneffizienz und Geschwindigkeit im Vordergrund stehen.

Modell Preise (1 Mio. Token)
GPT-4o-Realtime-Preview-2024-12-17-Global Text
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
GPT-4o-Realtime-Preview-2024-12-17-US/EU – Datenzonen Text
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
GPT-4o-Realtime-Preview-2024-12-17-Regional Text
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global Text
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU – Datenzonen Text
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional Text
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
GPT-4o-Realtime-Preview-2024-10-01-Global Text
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
GPT-4o-Realtime-Preview-2024-10-01-US/EU – Datenzonen Text
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
GPT-4o-Realtime-Preview-2024-10-01-Regional Text
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-

Chat-Vervollständigungs-API

Das GPT 4o-Audio-Preview-Modell ist in der Chat-Vervollständigungs-API enthalten und verarbeitet und generiert Audioinhalte. Es unterstützt fortgeschrittene Funktionen wie Spracherkennung und Audiosynthese und ist ideal für asynchrone Sprachinteraktionen und Stimmungsanalysen. GPT-4o ist die umfassende, leistungsstärkere Version für komplexe Aufgaben, während GPT-4o Mini eine kleinere, erschwinglichere Option ist, die sich ideal für einfachere Anwendungen eignet, bei denen Kosteneffizienz und Geschwindigkeit im Vordergrund stehen.

Modell Preise (1 Mio. Token)
GPT-4o-Audio-Preview-2024-12-17-Global Text
Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Ausgabe: $-
GPT-4o-Audio-Preview-2024-12-17-US/EU – Datenzonen Text
Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Ausgabe: $-
GPT-4o-Audio-Preview-2024-12-17-Regional Text
Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Ausgabe: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Global Text
Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Ausgabe: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU – Datenzonen Text
Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Ausgabe: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional Text
Eingabe: $-
Ausgabe: $-

Audio
Eingabe: $-
Ausgabe: $-

GPT-4o

GPT-4o ist das fortschrittlichste multimodale Modell, das schneller und kostengünstiger als GPT-4 Turbo ist und stärkere Visionfunktionen bietet. Das Modell verfügt über 128 KB Kontext und einen Wissensstand vom Oktober 2023.

Modell Preise (1 Mio. Token) Preise mit Batch-API (1 Mio. Token)
GPT-4o-2024-1120 Global Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Eingabe: $-
Ausgabe: $-
GPT-4o-2024-1120 US/EU – Datenzonen Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Eingabe: $-
Ausgabe: $-
GPT-4o-2024-1120 Regional Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar
GPT-4o-2024-08-06 Global Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Eingabe: $-
Ausgabe: $-
GPT-4o-2024-08-06 US/EU – Datenzonen Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Eingabe: $-
Ausgabe: $-
GPT-4o-2024-08-06 Regional Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar
GPT-4o-2024-0513 Global Eingabe: $-
Ausgabe: $-
Eingabe: $-
Ausgabe: $-
GPT-4o-2024-0513 US/EU – Datenzonen Eingabe: $-
Ausgabe: $-
Nicht verfügbar
GPT-4o-2024-0513 Regional Eingabe: $-
Ausgabe: $-
Nicht verfügbar

Planen mit dem Preisrechner

GPT-4o mini

GPT-4o mini ist das kostengünstigste kleine Modell und verfügt über Visionfunktionen. Das Modell verfügt über 128 KB Kontext und einen Wissensstand vom Oktober 2023.

Modell Preise (1 Mio. Token) Preise mit Batch-API (1 Mio. Token)
GPT-4o-mini-0718 Global Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Eingabe: $-
Ausgabe: $-
GPT-4o-mini-0718 US/EU – Datenzonen Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Eingabe: $-
Ausgabe: $-
GPT-4o-mini-0718 Regional Eingabe: $-
Zwischengespeicherte Eingabe: $-
Ausgabe: $-
Nicht verfügbar

Planen mit dem Preisrechner

Bereitgestellt

Sie können den Durchsatz für Bereitstellungen zuweisen und verwalten, um eine vorhersagbare Leistung und stabile Kapazität sicherzustellen. Unabhängig vom Verbrauch wird ein Stundensatz pro Modell berechnet, aber Sie können sich auch zusätzliche Einsparungen durch monatliche und jährliche Reservierungen sichern. Erfahren Sie auf dieserInformationsseite, wie Sie Ihre regionalen Bereitstellungen und bereitgestellten Reservierungen auf globale und Datenzonen umstellen.

Modell Min. PTUs Stündliche Preise für PTU PTU – Preise für monatliche Reservierung PTU – Preise für jährliche Reservierung
GPT-4.1 Global 15 $- $- $-
GPT-4.1-Datenzonen 15 $- $- $-
GPT-4.1 Regional 50 $- $- $-
GPT-4.1-mini Global 15 $- $- $-
GPT-4.1-mini US/EU-Datenzonen 15 $- $- $-
GPT-4.1-mini Regional 25 $- $- $-
GPT-4.1-nano Global 15 $- $- $-
GPT-4.1-Nano-Us/EU-Datenzonen 15 $- $- $-
GPT-4.1-nano Regional 25 $- $- $-
o3-mini Global 15 $- $- $-
o3-mini US/EU Data Zones 15 $- $- $-
o3-mini Regional 25 $- $- $-
o3 Global 15 $- $- $-
o3 US/EU-Datenzonen 15 $- $- $-
o3 Regional 50 $- $- $-
o4-mini Global 15 $- $- $-
o4-mini US/EU-Datenzonen 15 $- $- $-
o4-mini Regional 25 $- $- $-
GPT-4o Global 15 $- $- $-
GPT-4o US/EU-Datenzonen 15 $- $- $-
GPT-4o Regional 50 $- $- $-
Feinabgestimmtes GPT-4o-Regional 50 $- $- $-
GPT-4o Mini Global 15 $- $- $-
GPT-4o Mini US/EU-Datenzonen 15 $- $- $-
GPT-4o Mini Regional 25 $- $- $-
Feinabgestimmtes GPT-4o-Mini Regional 25 $- $- $-

Planen mit dem Preisrechner

Basismodelle

Modelle Nutzung pro 1 000 Token
Babbage-002 $-
Davinci-002 $-

Optimieren von Modellen

Modell Preise
o4-mini (Optimierung der Verstärkung) Regional Eingabe: $-/1 Mio. Token
Ausgabe: $-/1 Mio. Token
Schulungen: $-/Stunde
Hosting: $-/Stunde

Gradereingabe:
o4-mini: $-/1 Mio. Token
4,1-Mini: $-/1 Mio. Token
4.1: $-/1 Mio. Token
4.1-nano: $-/1 Mio. Token
o3: $-/1 Mio. Token

Zwischengespeicherte Gradereingabe:
o4-mini: $-/1 Mio. Token
4,1-Mini: $-/1 Mio. Token
4.1: $-/1 Mio. Token
4.1-nano: $-/1 Mio. Token
o3: $-/1 Mio. Token

Graderausgabe:
o4-mini: $-/1 Mio. Token
4,1-Mini: $-/1 Mio. Token
4.1: $-/1 Mio. Token
4.1-nano: $-/1 Mio. Token
o3: $-/1 Mio. Token
Weltweit Eingabe: $-/1 Mio. Token
Ausgabe: $-/1 Mio. Token
Schulungen: $-/Stunde
Hosting: $-/Stunde

Gradereingabe:
o4-mini: $-/1 Mio. Token
4,1-Mini: $-/1 Mio. Token
4.1: $-/1 Mio. Token
4.1-nano: $-/1 Mio. Token
o3: $-/1 Mio. Token

Zwischengespeicherte Gradereingabe:
o4-mini: $-/1 Mio. Token
4,1-Mini: $-/1 Mio. Token
4.1: $-/1 Mio. Token
4.1-nano: $-/1 Mio. Token
o3: $-/1 Mio. Token

Graderausgabe:
o4-mini: $-/1 Mio. Token
4,1-Mini: $-/1 Mio. Token
4.1: $-/1 Mio. Token
4.1-nano: $-/1 Mio. Token
o3: $-/1 Mio. Token
GPT-4.1 Regional Eingabe: $-/1 Mio. Token
Zwischengespeicherte Eingabe: $-/1 Mio. Token
Ausgabe: $-/1 Mio. Token
Schulungen: $-/1 Mio. Token
Hosting: $-/Stunde
Weltweit Eingabe: $-/1 Mio. Token
Zwischengespeicherte Eingabe: $-/1 Mio. Token
Ausgabe: $-/1 Mio. Token
Schulungen: $-/1 Mio. Token
Hosting: $-/Stunde
Developer Eingabe: $-/1 Mio. Token
Zwischengespeicherte Eingabe: $-/1 Mio. Token
Ausgabe: $-/1 Mio. Token
GPT-4.1-mini Regional Eingabe: $-/1 Mio. Token
Zwischengespeicherte Eingabe: $-/1 Mio. Token
Ausgabe: $-/1 Mio. Token
Schulungen: $-/1 Mio. Token
Hosting: $-/Stunde
Weltweit Eingabe: $-/1 Mio. Token
Zwischengespeicherte Eingabe: $-/1 Mio. Token
Ausgabe: $-/1 Mio. Token
Schulungen: $-/1 Mio. Token
Hosting: $-/Stunde
Developer Eingabe: $-/1 Mio. Token
Zwischengespeicherte Eingabe: $-/1 Mio. Token
Ausgabe: $-/1 Mio. Token
GPT-4.1-nano Regional Eingabe: $-/1 Mio. Token
Zwischengespeicherte Eingabe: $-/1 Mio. Token
Ausgabe: $-/1 Mio. Token
Schulungen: $-/1 Mio. Token
Hosting: $-/Stunde
Weltweit Eingabe: $-/1 Mio. Token
Zwischengespeicherte Eingabe: $-/1 Mio. Token
Ausgabe: $-/1 Mio. Token
Schulungen: $-/1 Mio. Token
Hosting: $-/Stunde
Developer Eingabe: $-/1 Mio. Token
Zwischengespeicherte Eingabe: $-/1 Mio. Token
Ausgabe: $-/1 Mio. Token
GPT-4o-2024-08-06 Regional Eingabe: $-/1 Mio. Token
Zwischengespeicherte Eingabe: $-/1 Mio. Token
Ausgabe: $-/1 Mio. Token
Schulungen: $-/1 Mio. Token
Hosting: $-/Stunde
Weltweit Eingabe: $-/1 Mio. Token
Zwischengespeicherte Eingabe: $-/1 Mio. Token
Ausgabe: $-/1 Mio. Token
Schulungen: Regionale Nutzung
Hosting: $-/Stunde
GPT-4o-mini Regional Eingabe: $-/1 Mio. Token
Zwischengespeicherte Eingabe: $-/1 Mio. Token
Ausgabe: $-/1 Mio. Token
Schulungen: $-/1 Mio. Token
Hosting: $-/Stunde
Weltweit Eingabe: $-/1 Mio. Token
Zwischengespeicherte Eingabe: $-/1 Mio. Token
Ausgabe: $-/1 Mio. Token
Schulungen: Regionale Nutzung
Hosting: $-/Stunde
GPT-3.5-Turbo (16K) Regional Eingabe: $-/1 Mio. Token
Ausgabe: $-/1 Mio. Token
Schulungen: $-/1 Mio. Token
Hosting: $-/Stunde

Bildmodelle

Modelle Qualität Auflösung Preis (pro 100 Bilder)
Dall-E-3 Standard 1024 * 1024 $-
Standard 1024 * 1792,
1792 * 1024
$-
Dall-E-3 HD 1024 * 1024 $-
HD 1024 * 1792,
1792 * 1024
$-
Dall-E-2 Standard 1024 * 1024 $-

Modelle einbetten

Modelle Pro 1000 Token
Ada $-
text-embedding-3-large $-
text-embedding-3-small $-

Sprachmodelle

Modelle Preis
Flüstern $-/Stunde
TTS (Text-zu-Sprache) $-/1 Mio. Zeichen
TTS HD $-/1 Mio. Zeichen

Legacy-Sprachmodelle

Modelle Kontext Eingabe (pro 1 Mio. Token) Ausgabe (pro 1 Mio. Token)
GPT-3.5-Turbo-0301 4K $- $-
GPT-3.5-Turbo-0613 4K $- $-
GPT-3.5-Turbo-0613 16K $- $-
GPT-3.5-Turbo-1106 16K $- $-
GPT-3.5-Turbo-0125 16K $- $-
GPT-3.5-Turbo-Instruct 4K $- $-
GPT-4-Turbo 128K $- $-
GPT-4-Turbo-Vision 128K $- $-
GPT-4 8K $- $-
GPT-4 32K $- $-

Azure-Preise und -Kaufoptionen

Direkten Kontakt aufnehmen

Erhalten Sie eine Übersicht über die Azure-Preise. Informieren Sie sich über die Preise für Ihre Cloudlösung und die Möglichkeiten zur Kostenoptimierung, und fordern Sie ein individuelles Angebot an.

Sprechen Sie mit einem Vertriebsspezialisten

Kaufoptionen

Erwerben Sie Azure-Dienste über die Azure-Website, einen Microsoft-Vertreter oder einen Azure-Partner.

Optionen kennenlernen

Zusätzliche Ressourcen

Azure OpenAI-Dienst

Hier erhalten Sie weitere Informationen zu den Features und Funktionen von Azure OpenAI-Dienst.

Preisrechner

Kalkulieren Sie Ihre erwarteten monatlichen Kosten für eine beliebige Kombination von Azure-Produkten.

SLA

Lesen Sie die Vereinbarung zum Servicelevel für Azure OpenAI-Dienst.

Dokumentation

Hier finden Sie technische Tutorials, Videos und weitere Ressourcen zu Azure OpenAI-Dienst.

  • Azure OpenAI Service bietet Preise, die sowohl auf nutzungsbasierter Zahlung als auch auf PTUs (Provisioned Throughput Units) basieren. Mit der nutzungsbasierten Zahlung zahlen Sie für die Ressourcen, die Sie nutzen, sodass sie für variable Workloads flexibel sind. PTUs bieten ein vorhersagbares Preismodell, bei dem Sie eine bestimmte Menge an Modellverarbeitungskapazität reservieren und bereitstellen. Dieses Modell eignet sich ideal für Workloads mit konsistenten oder vorhersagbaren Nutzungsmustern und bietet Stabilität und Kostenkontrolle.
  • Weitere Informationen zu PTUs und Azure OpenAI-Preisen finden Sie in der PTU-Dokumentation, oder wenden Sie sich an unseren Vertriebsexperten.

Sprechen Sie für eine detaillierte Erläuterung der Azure-Preise mit einem Vertriebsspezialisten. Lernen Sie, die Berechnung der Preise für Ihre Cloudlösung zu verstehen.

Sichern Sie sich kostenlose Cloud-Dienste und ein Guthaben in Höhe von $200, mit dem Sie Azure 30 Tage lang erkunden können.

Zur Schätzung hinzufügen Für die Anzeige im Rechner „v“ drücken
Können wir Ihnen helfen?