Panoramica dei prezzi del Servizio OpenAI di Azure
Per aiutare i clienti nel proprio percorso, vengono offerte soluzioni di gestione dei prezzi e dei costi per soddisfare le varie esigenze. tra cui:
- Standard (su richiesta): con pagamento in base al consumo per token di input e output.
- Con provisioning (PTUs): velocità effettiva allocata con costi prevedibili e prenotazioni mensili e annuali disponibili per ridurre la spesa complessiva.
- API batch: i modelli di linguaggio sono ora disponibili anche nell’API batch per le distribuzioni globali e tre regioni che restituiscono i completamenti entro 24 ore con uno sconto del 50% sui prezzi standard globali.
- Distribuzione globale: SKU globale
- Distribuzione della zona dati: su base geografica (EU o Stati Uniti d’America)
- Distribuzione a livello di area: area locale (fino a 27 regioni)
Esplora le opzioni per i prezzi
Applica i filtri per personalizzare le opzioni per i prezzi in base alle tue esigenze.
I prezzi sono solo stime e non sono da intendersi come quotazioni effettive. I prezzi effettivi possono variare a seconda del tipo di contratto stipulato con Microsoft, della data di acquisto e del tasso di cambio. I prezzi sono calcolati in dollari USA e convertiti in base ai tassi degli spot di chiusura di Londra acquisiti nei due giorni lavorativi precedenti l'ultimo giorno lavorativo della fine del mese precedente. Se i due giorni lavorativi precedenti la fine del mese cadono in un giorno festivo nei principali mercati, il giorno di riferimento del tasso è in genere il giorno immediatamente precedente ai due giorni lavorativi. Il tasso viene applicato a tutte le transazioni del mese successivo. Accedi al Calcolatore dei prezzi di Azure per visualizzare i prezzi in base al programma o all'offerta corrente con Microsoft. Contatta uno Specialista vendite di Azure per altre informazioni sui prezzi o per richiedere un preventivo. Vedi le domande frequenti sui prezzi di Azure.
Gli enti del Governo degli Stati Uniti sono idonei per l'acquisto di servizi di Azure per enti pubblici da un provider LSP (Licensing Solution Provider) senza alcun impegno finanziario iniziale oppure direttamente tramite una sottoscrizione online con pagamento in base al consumo.
Importante: il prezzo R$ è semplicemente un riferimento. Si tratta di una transazione interna e il prezzo finale è soggetto ai tassi di cambio e all'aggiunta delle imposte sulle transazioni finanziarie. Non sarà rilasciato alcun documento eNF.
Gli enti del Governo degli Stati Uniti sono idonei per l'acquisto di servizi di Azure per enti pubblici da un provider LSP (Licensing Solution Provider) senza alcun impegno finanziario iniziale oppure direttamente tramite una sottoscrizione online con pagamento in base al consumo.
Importante: il prezzo R$ è semplicemente un riferimento. Si tratta di una transazione interna e il prezzo finale è soggetto ai tassi di cambio e all'aggiunta delle imposte sulle transazioni finanziarie. Non sarà rilasciato alcun documento eNF.
GPT-4.5
GPT-4.5-preview è il modello per utilizzo generico più recente con una conoscenza approfondita del mondo e una migliore comprensione degli intenti dell’utente che lo rendono efficace in attività creative e pianificazione agentic. Il modello ha un contesto di 128 KB e un limite di conoscenza datato ad ottobre 2023.
Modello | Prezzi (1.000.000 di token) | Prezzi con l'API Batch (1 milione di token) |
---|---|---|
GPT-4.5-Preview-2025-02-27 globale |
Input: $- Input memorizzato nella cache: $- Output: $- |
N/D |
o1
o1 è la nuova serie di modelli di motivazione per attività complesse. Il modello ha un contesto di 200.000 e un limite di knowledge base di ottobre 2023.
Modello | Prezzi (1.000.000 di token) | Prezzi con l'API Batch (1 milione di token) |
---|---|---|
o1 2024-12-17 Globale |
Input: $- Input memorizzato nella cache: $- Output: $- |
N/D |
o1 2024-12-17 US/EU – Zone dati |
Input: $- Input memorizzato nella cache: $- Output: $- |
N/D |
o1 2024-12-17 Regionale |
Input: $- Input memorizzato nella cache: $- Output: $- |
N/D |
o1 anteprima 2024-09-12 Globale |
Input: $- Input memorizzato nella cache: $- Output: $- |
N/D |
o1 anteprima 2024-09-12 US/EU – Zone dati |
Input: $- Input memorizzato nella cache: $- Output: $- |
N/D |
o1 anteprima 2024-09-12 Regionale |
Input: $- Input memorizzato nella cache: $- Output: $- |
N/D |
Prova il calcolatore dei prezzi
o3 Mini
O3 mini è la versione aggiornata del modello o1 mini. o3-mini è un modello di ragionamento rapido ed efficiente in termini di costi, progettato per casi d'uso di codifica, matematica e scienze.
Il modello o3-mini presenta ora una finestra di input del contesto espansa di 200.000 token e un output massimo di 100.000 token, così da fornire ampio spazio per risposte complesse e dettagliate. Il modello o1 mini ha una finestra di input del contesto di 128.000 token. Entrambi i modelli o3 e o1 hanno un limite sulle conoscenze fissato per ottobre 2023.
Modello | Prezzi (1.000.000 di token) | Prezzi con l'API Batch (1 milione di token) |
---|---|---|
o3 mini 2025-01-31 Globale |
Input: $- Input memorizzato nella cache: $- Output: $- |
Input: $- Output: $- |
o3 mini 2025-01-31-US/EU – Zone dati |
Input: $- Input memorizzato nella cache: $- Output: $- |
Input: $- Output: $- |
GPT-o3-mini-2025-01-31 Regionale |
Input: $- Input memorizzato nella cache: $- Output: $- |
N/D |
o1-mini 2024-09-12 Globale |
Input: $- Input memorizzato nella cache: $- Output: $- |
N/D |
o1-mini 2024-09-12 US/EU – Zone dati |
Input: $- Input memorizzato nella cache: $- Output: $- |
N/D |
o1-mini 2024-09-12 Regionale |
Input: $- Input memorizzato nella cache: $- Output: $- |
N/D |
Prova il calcolatore dei prezzi
Computer-Using Agent (CUA)
The Computer-Using Agent (CUA) is a specialized AI model that allows AI to interact with graphical user interfaces (GUIs), navigate applications, and automate multi-step tasks—all through natural language instructions. The CUA model can be used as a tool in the Responses API.
Modello | Prezzi |
---|---|
computer-use-preview Global |
Input: $-/1 milione di token Output: $-/1 milione di token |
Built-in tools
The Responses API and the Assistants API enable seamless interaction with tools like computer use, code interpreter, function calling, and file search, making it easy for developers to build AI agents.
Strumento | Input |
---|---|
Computer Use (Responses API only) |
Input: $-/1 milione di token Output: $-/1 milione di token |
File Search Tool Call (Responses API only) | $-/1K tool calls |
Ricerca file* | $-/GB di spazio di archiviazione vettoriale al giorno (1 GB gratuito) |
Interprete di codice** | $-/sessione |
*GB fa riferimento a gigabyte binari, dove 1 GB è 2^30 byte.
**Se l'assistente chiama l'Interprete di codice contemporaneamente in due thread diversi, verranno create due sessioni dell'Interprete di codice (2 * $-). Ogni sessione è attiva per impostazione predefinita per un'ora, per cui se l'utente dà istruzioni all'interprete di codice nello stesso thread per un massimo di un'ora verrà effettuato un solo addebito.
Il costo di inferenza (input e output) varia in base al modello GPT usato con ogni assistente. Se l'assistente chiama l'interprete di codice contemporaneamente in due thread diversi, verranno create due sessioni dell'interprete di codice (2 * $-). Ogni sessione è attiva per un'ora per impostazione predefinita, quindi il prezzo si riferisce a un massimo di un'ora di istruzioni fornite all'interprete di codice nello stesso thread.
API in tempo reale
In primo piano nell'API Realtime, GPT-4o-Realtime-Preview supporta funzionalità di sintesi vocale multilingue. Ottimizzato per conversazioni in tempo reale e a bassa latenza, consente interazioni naturali con un ritardo minimo, ideale per chatbot e intelligenza artificiale conversazionale. GPT-4o è la versione completa e più potente progettata per attività complesse, mentre GPT-4o Mini rappresenta un'opzione più piccola e più conveniente, ideale per applicazioni più semplici in cui l'efficienza dei costi e la velocità sono la priorità.
Modello | Prezzi (1.000.000 di token) |
---|---|
GPT-4o-Realtime-Preview-2024-12-17-Global |
Testo Input: $- Input memorizzato nella cache: $- Output: $- Audio Input: $- Input memorizzato nella cache: $- Output: $- |
GPT-4o-Realtime-Preview-2024-12-17-US/EU – Zone dati |
Testo Input: $- Input memorizzato nella cache: $- Output: $- Audio Input: $- Input memorizzato nella cache: $- Output: $- |
GPT-4o-Realtime-Preview-2024-12-17-Regional |
Testo Input: $- Input memorizzato nella cache: $- Output: $- Audio Input: $- Input memorizzato nella cache: $- Output: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global |
Testo Input: $- Input memorizzato nella cache: $- Output: $- Audio Input: $- Input memorizzato nella cache: $- Output: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU – Zone dati |
Testo Input: $- Input memorizzato nella cache: $- Output: $- Audio Input: $- Input memorizzato nella cache: $- Output: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional |
Testo Input: $- Input memorizzato nella cache: $- Output: $- Audio Input: $- Input memorizzato nella cache: $- Output: $- |
GPT-4o-Realtime-Preview-2024-10-01-Global |
Testo Input: $- Input memorizzato nella cache: $- Output: $- Audio Input: $- Input memorizzato nella cache: $- Output: $- |
GPT-4o-Realtime-Preview-2024-10-01-US/EU – Zone dati |
Testo Input: $- Input memorizzato nella cache: $- Output: $- Audio Input: $- Input memorizzato nella cache: $- Output: $- |
GPT-4o-Realtime-Preview-2024-10-01-Regional |
Testo Input: $- Input memorizzato nella cache: $- Output: $- Audio Input: $- Input memorizzato nella cache: $- Output: $- |
API di completamento della chat
Incluso nell'API di completamento della chat, il modello GPT 4o-Audio-Preview elabora e genera contenuti audio. Supporta funzionalità avanzate come il riconoscimento vocale e la sintesi audio, ideale per le interazioni vocali asincrone e l'analisi del sentiment. GPT-4o è la versione completa e più potente progettata per attività complesse, mentre GPT-4o Mini rappresenta un'opzione più piccola e più conveniente, ideale per applicazioni più semplici in cui l'efficienza dei costi e la velocità sono la priorità.
Modello | Prezzi (1.000.000 di token) |
---|---|
GPT-4o-Audio-Preview-2024-12-17-Global |
Testo Input: $- Output: $- Audio Input: $- Output: $- |
GPT-4o-Audio-Preview-2024-12-17-US/EU – Zone dati |
Testo Input: $- Output: $- Audio Input: $- Output: $- |
GPT-4o-Audio-Preview-2024-12-17-Regional |
Testo Input: $- Output: $- Audio Input: $- Output: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Global |
Testo Input: $- Output: $- Audio Input: $- Output: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU – Zone dati |
Testo Input: $- Output: $- Audio Input: $- Output: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional |
Testo Input: $- Output: $- Audio Input: $- Output: $- |
GPT-4o
GPT-4o è il modello multimodali più avanzato, veloce e conveniente rispetto a GPT-4 Turbo con funzionalità di visione più avanzate. Il modello ha un contesto di 128 KB e un limite di knowledge base di ottobre 2023.
Modello | Prezzi (1.000.000 di token) | Prezzi con l'API Batch (1 milione di token) |
---|---|---|
GPT-4o-2024-1120 - Globale |
Input: $- Input memorizzato nella cache: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-1120 US/EU – Zone dati |
Input: $- Input memorizzato nella cache: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-1120 - A livello di area |
Input: $- Input memorizzato nella cache: $- Output: $- |
N/D |
GPT-4o-06-08-2024-08 Globale |
Input: $- Input memorizzato nella cache: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-08-06 US/EU – Zone dati |
Input: $- Input memorizzato nella cache: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-08-06 - A livello di area |
Input: $- Input memorizzato nella cache: $- Output: $- |
N/D |
GPT-4o-2024-0513 - Globale |
Input: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-0513 US/EU – Zone dati |
Input: $- Output: $- |
N/D |
GPT-4o-2024-0513 - A livello di area |
Input: $- Output: $- |
N/D |
Prova il calcolatore dei prezzi
GPT-4o-mini
GPT-4o mini è il modello di piccole dimensioni più conveniente e dispone di funzionalità visive. Il modello ha un contesto di 128 KB e un limite di knowledge base di ottobre 2023.
Modello | Prezzi (1.000.000 di token) | Prezzi con l'API Batch (1 milione di token) |
---|---|---|
GPT-4o-mini-0718 Global |
Input: $- Input memorizzato nella cache: $- Output: $- |
Input: $- Output: $- |
GPT-4o-mini-0718 US/EU - Zone dati |
Input: $- Input memorizzato nella cache: $- Output: $- |
Input: $- Output: $- |
GPT-4o-mini-0718 Regional |
Input: $- Input memorizzato nella cache: $- Output: $- |
N/D |
Prova il calcolatore dei prezzi
Provisioning effettuato
È possibile allocare e gestire la velocità effettiva per le distribuzioni, garantendo prestazioni prevedibili e capacità stabile. La tariffa oraria viene addebitata per ogni modello, indipendentemente dall'utilizzo, ma è possibile ottenere ulteriori risparmi con prenotazioni mensili e annuali. Scopri come eseguire la transizione delle distribuzioni a livello di area e delle prenotazioni di cui è stato effettuato il provisioning alle aree dati e globali in questa pagina di Learn.
Modello | Numero minimo di PTU | Prezzi PTU orari | Prezzi delle prenotazioni mensili PTU | Prezzi delle prenotazioni annuali PTU |
---|---|---|---|---|
GPT-4o Globale | 15 | $- | $- | $- |
Zone dati GPT-4o USA/UE | 15 | $- | $- | $- |
GPT-4o Regionale | 50 | $- | $- | $- |
GPT-4o-Regional ottimizzato | 50 | $- | $- | $- |
GPT-4o Mini Globale | 15 | $- | $- | $- |
Zone dati GPT-4o Mini US/EU | 15 | $- | $- | $- |
GPT-4o-mini a livello di area | 25 | $- | $- | $- |
GPT-4o-Mini Regional ottimizzato | 25 | $- | $- | $- |
Prova il calcolatore dei prezzi
Modelli base
Modelli | Utilizzo per 1.000 token |
---|---|
Babbage-002 | $- |
Davinci-002 | $- |
Ottimizzazione dei modelli
Modello | Prezzi | |
---|---|---|
GPT-4o-2024-08-06 | A livello di area |
Input: $-/1 milione di token Input memorizzato nella cache: $-/1 milione di token Output: $-/1 milione di token Formazione: $-/1 milione di token Hosting: $-/ora |
Globale |
Input: $-/1 milione di token Input memorizzato nella cache: $-/1 milione di token Output: $-/1 milione di token Formazione: usare a livello di area Hosting: $-/ora |
|
GPT-4o-mini | A livello di area |
Input: $-/1 milione di token Input memorizzato nella cache: $-/1 milione di token Output: $-/1 milione di token Formazione: $-/1 milione di token Hosting: $-/ora |
Globale |
Input: $-/1 milione di token Input memorizzato nella cache: $-/1 milione di token Output: $-/1 milione di token Formazione: usare a livello di area Hosting: $-/ora |
|
GPT-4-0613 (8 K) | A livello di area |
Input: $-/1 milione di token Output: $-/1 milione di token Formazione: $-/1 milione di token Hosting: $-/ora |
GPT-3.5-Turbo (16 KB) | A livello di area |
Input: $-/1 milione di token Output: $-/1 milione di token Formazione: $-/1 milione di token Hosting: $-/ora |
GPT-3.5-Turbo (4K) | A livello di area |
Input: $-/1 milione di token Output: $-/1 milione di token Formazione: $-/1 milione di token Hosting: $-/ora |
Babbage-002 |
Input: $-/1 milione di token Output: $-/1 milione di token Formazione: $-/1 milione di token Hosting: $-/ora |
|
Davinci-002 |
Input: $-/1 milione di token Output: $-/1 milione di token Formazione: $-/1 milione di token Hosting: $-/ora |
Modelli di immagine
Modelli | Qualità | Risoluzione | Prezzo (per 100 immagini) |
---|---|---|---|
Dall-E-3 | Standard | 1024 * 1024 | $- |
Standard | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-3 | HD | 1024 * 1024 | $- |
HD | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-2 | Standard | 1024 * 1024 | $- |
Modelli di incorporazione
Modelli | Per 1.000 token |
---|---|
Ada | $- |
text-embedding-3-large | $- |
text-embedding-3-small | $- |
Modelli conversione voce/testo
Modelli | Prezzo |
---|---|
Whisper | $-/ora |
TTS (Sintesi vocale) | $-/1 milione di caratteri |
TTS HD | $-/1 milione di caratteri |
Modelli linguistici legacy
Modelli | Contesto | Input (token per 1 milione) | Output (token per 1 milione) |
---|---|---|---|
GPT-3.5-Turbo-0301 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 16K | $- | $- |
GPT-3.5-Turbo-1106 | 16K | $- | $- |
GPT-3.5-Turbo-0125 | 16K | $- | $- |
GPT-3.5-Turbo-Instruct | 4K | $- | $- |
GPT-4 Turbo | 128K | $- | $- |
GPT-4-Turbo-Vision | 128K | $- | $- |
GPT-4 | 8K | $- | $- |
GPT-4 | 32K | $- | $- |
Prezzi e opzioni di acquisto di Azure

Contattaci direttamente
Informazioni dettagliate sui prezzi di Azure. È possibile ottenere informazioni sui prezzi per la soluzione cloud e sull'ottimizzazione dei costi e richiedere una proposta personalizzata.
Comunica con uno specialista venditeScopri le modalità di acquisto
Acquista servizi di Azure tramite il sito Web di Azure, un rappresentante Microsoft o un partner di Azure.
Esplora le opzioni disponibiliRisorse aggiuntive
Servizio OpenAI di Azure
Scopri di più sulle funzionalità e sulle capacità di Servizio OpenAI di Azure.
Calcolatore prezzi
Stima i costi mensili previsti per qualsiasi combinazione dei prodotti di Azure.
Contratto di servizio
Esamina il Contratto di servizio per Servizio OpenAI di Azure.
Documentazione
Vedi esercitazioni tecniche, video e altre risorse di Servizio OpenAI di Azure.
Domande frequenti
-
Servizio OpenAI di Azure offre prezzi basati sia con pagamento in base al consumo che su unità elaborate con provisioning (PTU). Con pagamento in base al consumo consente di pagare per le risorse utilizzate, offrendo flessibilità per i carichi di lavoro variabili. PTU offre un modello di prezzo prevedibile in cui si riserva e si distribuisce una quantità specifica di capacità di elaborazione del modello. Questo modello è ideale per i carichi di lavoro con modelli di utilizzo costanti o prevedibili, garantendo stabilità e controllo dei costi.
-
Per altre informazioni sulle PTU e sui prezzi di Azure OpenAI, leggi la documentazione PTU o contatta il nostro specialista delle vendite.
Contatta uno specialista delle vendite per ottenere informazioni dettagliate sui prezzi di Azure. Verifica i prezzi per la tua soluzione cloud.
Ottieni servizi cloud gratuiti e $200 di credito per esplorare Azure per 30 giorni.