Panoramica dei prezzi del Servizio OpenAI di Azure
To help customers in the journey, we offer pricing and cost management solutions to meet your needs. including:
- Standard (On-Demand): Pay-as-you-go for input and output tokens.
- Provisioned (PTUs): Allocate throughput with predictable costs, with monthly and annual reservations available to reduce overall spend.
- Batch API: Language models are also now available in the Batch API for global deployments and three regions, that returns completions within 24 hours for a 50% discount on Global Standard Pricing.
- Global Deployment – Global SKU
- Data Zone Deployment – Geographic based (EU or US)
- Regional Deployment – Local Region (up to 27 regions)
Esplora le opzioni per i prezzi
Applica i filtri per personalizzare le opzioni per i prezzi in base alle tue esigenze.
I prezzi sono solo stime e non sono da intendersi come quotazioni effettive. I prezzi effettivi possono variare a seconda del tipo di contratto stipulato con Microsoft, della data di acquisto e del tasso di cambio. I prezzi sono calcolati in dollari USA e convertiti in base ai tassi degli spot di chiusura di Londra acquisiti nei due giorni lavorativi precedenti l'ultimo giorno lavorativo della fine del mese precedente. Se i due giorni lavorativi precedenti la fine del mese cadono in un giorno festivo nei principali mercati, il giorno di riferimento del tasso è in genere il giorno immediatamente precedente ai due giorni lavorativi. Il tasso viene applicato a tutte le transazioni del mese successivo. Accedi al Calcolatore dei prezzi di Azure per visualizzare i prezzi in base al programma o all'offerta corrente con Microsoft. Contatta uno Specialista vendite di Azure per altre informazioni sui prezzi o per richiedere un preventivo. Vedi le domande frequenti sui prezzi di Azure.
Gli enti del Governo degli Stati Uniti sono idonei per l'acquisto di servizi di Azure per enti pubblici da un provider LSP (Licensing Solution Provider) senza alcun impegno finanziario iniziale oppure direttamente tramite una sottoscrizione online con pagamento in base al consumo.
Importante: il prezzo R$ è semplicemente un riferimento. Si tratta di una transazione interna e il prezzo finale è soggetto ai tassi di cambio e all'aggiunta delle imposte sulle transazioni finanziarie. Non sarà rilasciato alcun documento eNF.
Gli enti del Governo degli Stati Uniti sono idonei per l'acquisto di servizi di Azure per enti pubblici da un provider LSP (Licensing Solution Provider) senza alcun impegno finanziario iniziale oppure direttamente tramite una sottoscrizione online con pagamento in base al consumo.
Importante: il prezzo R$ è semplicemente un riferimento. Si tratta di una transazione interna e il prezzo finale è soggetto ai tassi di cambio e all'aggiunta delle imposte sulle transazioni finanziarie. Non sarà rilasciato alcun documento eNF.
o1
o1 is the new reasoning model series for complex tasks. The model has 200K context and an October 2023 knowledge cutoff.
Model | Pricing (1M Tokens) |
---|---|
o1 1217 Global |
Input: $- Cached Input: $- Output: $- |
o1 1217 US/EU – Data Zones |
Input: $- Cached Input: $- Output: $- |
o1 1217 Regional |
Input: $- Cached Input: $- Output: $- |
o1 preview Global |
Input: $- Cached Input: $- Output: $- |
o1 preview US/EU – Data Zones |
Input: $- Cached Input: $- Output: $- |
o1 preview Regional |
Input: $- Cached Input: $- Output: $- |
Plan with the Pricing Calculator
o1 Mini
o1-mini is a fast, cost-efficient reasoning model tailored to coding, math, and science use cases. The model has 128K context and an October 2023 knowledge cutoff.
Model | Pricing (1M Tokens) |
---|---|
Global |
Input: $- Cached Input: $- Output: $- |
US/EU – Data Zones |
Input: $- Cached Input: $- Output: $- |
Regional |
Input: $- Cached Input: $- Output: $- |
Plan with the Pricing Calculator
Realtime API
Featured in the Realtime API, the GPT-4o-Realtime-Preview supports multilingual speech-to-speech capabilities. Optimized for real-time, low-latency conversations, it enables natural interactions with minimal delay, ideal for chatbots and conversational AI.
Model | Pricing (1M Tokens) |
---|---|
GPT-4o-Realtime-Preview-Global |
Text Input: $- Cached Input: $- Output: $- Audio Input: $- Cached Input: $- Output: $- |
GPT-4o-Realtime-Preview-US/EU – Data Zones |
Text Input: $- Cached Input: $- Output: $- Audio Input: $- Cached Input: $- Output: $- |
GPT-4o-Realtime-Preview-Regional |
Text Input: $- Cached Input: $- Output: $- Audio Input: $- Cached Input: $- Output: $- |
Chat Completions API - Coming soon
Featured in the Chat Completions API, the GPT 4o-Audio-Preview model processes and generates audio content. It supports advanced features like speech recognition and audio synthesis, ideal for asynchronous speech interactions and sentiment analysis. Cached input is coming soon.
Model | Pricing (1M Tokens) |
---|---|
GPT-4o-Audio-Preview-Global |
Text Input: $- Cached Input: N/D Output: $- Audio Input: $- Cached Input: N/D Output: $- |
GPT-4o
GPT-4o is the most advanced multimodal model that’s faster and cheaper than GPT-4 Turbo with stronger vision capabilities. The model has 128K context and an October 2023 knowledge cutoff.
Model | Pricing (1M Tokens) | Pricing with Batch API (1M Tokens) |
---|---|---|
GPT-4o-2024-1120 Global |
Input: $- Cached Input: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-1120 US/EU – Data Zones |
Input: $- Cached Input: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-1120 Regional |
Input: $- Cached Input: $- Output: $- |
N/D |
GPT-4o-2024-08-06 Global |
Input: $- Cached Input: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-08-06 US/EU – Data Zones |
Input: $- Cached Input: $- Output: $- |
N/D |
GPT-4o-2024-08-06 Regional |
Input: $- Cached Input: $- Output: $- |
N/D |
GPT-4o-2024-0513 Global |
Input: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-0513 US/EU – Data Zones |
Input: $- Output: $- |
N/D |
GPT-4o-2024-0513 Regional |
Input: $- Output: $- |
N/D |
Plan with the Pricing Calculator
GPT-4o mini
GPT-4o mini is the most cost-efficient small model, and has vision capabilities. The model has 128K context and an October 2023 knowledge cutoff.
Model | Pricing (1M Tokens) | Pricing with Batch API (1M Tokens) |
---|---|---|
Global |
Input: $- Cached Input: $- Output: $- |
Input: $- Output: $- |
US/EU – Data Zones |
Input: $- Cached Input: $- Output: $- |
N/D |
Regional |
Input: $- Cached Input: $- Output: $- |
N/D |
Plan with the Pricing Calculator
Provisioned
You can allocate and manage throughput for deployments, ensuring predictable performance and stable capacity. You are charged an hourly rate per model regardless of usage, but you can also secure additional savings through monthly and annual reservations. Discover how to transition your regional deployments and provisioned reservations to global and data zones on this Learn page.
Model | Min PTUs | PTU Hourly pricing | PTU Monthly Reservation Pricing | PTU Yearly Reservation Pricing |
---|---|---|---|---|
GPT-4o Global | 15 | $- | $- | $- |
GPT-4o US/EU Data Zones | 15 | $- | $- | $- |
GPT-4o Regional | 50 | $- | $- | $- |
GPT-4o Mini Global | 15 | $- | $- | $- |
GPT-4o Mini US/EU Data Zones | 15 | $- | $- | $- |
GPT-4o Mini Regional | 25 | $- | $- | $- |
Plan with the Pricing Calculator
Modelli base
Modelli | Utilizzo per 1.000 token |
---|---|
Babbage-002 | $- |
Davinci-002 | $- |
Ottimizzazione dei modelli
Model | Pricing | |
---|---|---|
GPT-4o-2024-08-06 | Regional |
Input: $- / 1M tokens Cached Input: $- / 1M tokens Output: $- / 1M tokens Training: $- / 1M tokens Hosting: $- / hour |
Global |
Input: $- / 1M tokens Cached Input: $- / 1M tokens Output: $- / 1M tokens Training: use regional Hosting: $- / hour |
|
GPT-4o-mini | Regional |
Input: $- / 1M tokens Cached Input: $- / 1M tokens Output: $- / 1M tokens Training: $- / 1M tokens Hosting: $- / hour |
Global |
Input: $- / 1M tokens Cached Input: $- / 1M tokens Output: $- / 1M tokens Training: use regional Hosting: $- / hour |
|
GPT-4-0613 (8K) | Regional |
Input: $- / 1M tokens Output: $- / 1M tokens Training: $- / 1M tokens Hosting: $- / hour |
GPT-3.5-Turbo (16 KB) | Regional |
Input: $- / 1M tokens Output: $- / 1M tokens Training: $- / 1M tokens Hosting: $- / hour |
GPT-3.5-Turbo (4K) | Regional |
Input: $- / 1M tokens Output: $- / 1M tokens Training: $- / 1M tokens Hosting: $- / hour |
Babbage-002 |
Input: $- / 1M tokens Output: $- / 1M tokens Training: $- / 1M tokens Hosting: $- / hour |
|
Davinci-002 |
Input: $- / 1M tokens Output: $- / 1M tokens Training: $- / 1M tokens Hosting: $- / hour |
Assistenti API
L'API Assistants e i relativi strumenti semplificano la creazione di assistenti per l'intelligenza artificiale nelle applicazioni.
I token usati per l'API Assistants vengono fatturati in base alle tariffe di input/output per token usate con ogni assistente. Inoltre, per l'utilizzo degli strumenti vengono addebitate le seguenti tariffe:
Strumento | Input |
---|---|
Ricerca file* | $-/GB di spazio di archiviazione vettoriale al giorno (1 GB gratuito) |
Interprete di codice** | $-/sessione |
*GB fa riferimento a gigabyte binari, dove 1 GB è 2^30 byte.
**Se l'assistente chiama l'Interprete di codice contemporaneamente in due thread diversi, verranno create due sessioni dell'Interprete di codice (2 * $-). Ogni sessione è attiva per impostazione predefinita per un'ora, per cui se l'utente dà istruzioni all'interprete di codice nello stesso thread per un massimo di un'ora verrà effettuato un solo addebito.
Il costo di inferenza (input e output) varia in base al modello GPT usato con ogni assistente. Se l'assistente chiama l'interprete di codice contemporaneamente in due thread diversi, verranno create due sessioni dell'interprete di codice (2 * $-). Ogni sessione è attiva per un'ora per impostazione predefinita, quindi il prezzo si riferisce a un massimo di un'ora di istruzioni fornite all'interprete di codice nello stesso thread.
Modelli di immagine
Modelli | Qualità | Risoluzione | Prezzo (per 100 immagini) |
---|---|---|---|
Dall-E-3 | Standard | 1024 * 1024 | $- |
Standard | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-3 | HD | 1024 * 1024 | $- |
HD | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-2 | Standard | 1024 * 1024 | $- |
Modelli di incorporazione
Modelli | Per 1.000 token |
---|---|
Ada | $- |
text-embedding-3-large | $- |
text-embedding-3-small | $- |
Modelli conversione voce/testo
Modelli | Prezzo |
---|---|
Whisper | $-/ora |
TTS (Sintesi vocale) | $-/1 milione di caratteri |
TTS HD | $-/1 milione di caratteri |
Modelli linguistici legacy
Modelli | Contesto | Input (Per 1M Tokens) | Output (Per 1M Tokens) |
---|---|---|---|
GPT-3.5-Turbo-0301 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 16K | $- | $- |
GPT-3.5-Turbo-1106 | 16K | $- | $- |
GPT-3.5-Turbo-0125 | 16K | $- | $- |
GPT-3.5-Turbo-Instruct | 4K | $- | $- |
GPT-4 Turbo | 128K | $- | $- |
GPT-4-Turbo-Vision | 128K | $- | $- |
GPT-4 | 8K | $- | $- |
GPT-4 | 32K | $- | $- |
Prezzi e opzioni di acquisto di Azure
Contattaci direttamente
Informazioni dettagliate sui prezzi di Azure. È possibile ottenere informazioni sui prezzi per la soluzione cloud e sull'ottimizzazione dei costi e richiedere una proposta personalizzata.
Comunica con uno specialista venditeScopri le modalità di acquisto
Acquista servizi di Azure tramite il sito Web di Azure, un rappresentante Microsoft o un partner di Azure.
Esplora le opzioni disponibiliRisorse aggiuntive
Servizio OpenAI di Azure
Scopri di più sulle funzionalità e sulle capacità di Servizio OpenAI di Azure.
Calcolatore prezzi
Stima i costi mensili previsti per qualsiasi combinazione dei prodotti di Azure.
Contratto di servizio
Esamina il Contratto di servizio per Servizio OpenAI di Azure.
Documentazione
Vedi esercitazioni tecniche, video e altre risorse di Servizio OpenAI di Azure.
Domande frequenti
-
Servizio OpenAI di Azure offre prezzi basati sia con pagamento in base al consumo che su unità elaborate con provisioning (PTU). Con pagamento in base al consumo consente di pagare per le risorse utilizzate, offrendo flessibilità per i carichi di lavoro variabili. PTU offre un modello di prezzo prevedibile in cui si riserva e si distribuisce una quantità specifica di capacità di elaborazione del modello. Questo modello è ideale per i carichi di lavoro con modelli di utilizzo costanti o prevedibili, garantendo stabilità e controllo dei costi.
-
Per altre informazioni sulle PTU e sui prezzi di Azure Open AI, leggi la documentazione PTU o contatta il nostro specialista delle vendite
Contatta uno specialista delle vendite per ottenere informazioni dettagliate sui prezzi di Azure. Verifica i prezzi per la tua soluzione cloud.
Ottieni servizi cloud gratuiti e $200 di credito per esplorare Azure per 30 giorni.