Panoramica dei prezzi del Servizio Azure OpenAI
Per aiutare i clienti nel proprio percorso, vengono offerte soluzioni di gestione dei prezzi e dei costi per soddisfare le varie esigenze. tra cui:
- Standard (su richiesta): con pagamento in base al consumo per token di input e output.
- Con provisioning (PTUs): velocità effettiva allocata con costi prevedibili e prenotazioni mensili e annuali disponibili per ridurre la spesa complessiva.
- API batch: i modelli di linguaggio sono ora disponibili anche nell'API batch per le distribuzioni globali e tre regioni che restituiscono i completamenti entro 24 ore con uno sconto del 50% sui prezzi standard globali.
- Distribuzione globale: SKU globale
- Distribuzione della zona dati: su base geografica (EU o Stati Uniti d'America)
- Distribuzione a livello di area: area locale (fino a 27 regioni)
Esplora le opzioni per i prezzi
Applica i filtri per personalizzare le opzioni per i prezzi in base alle tue esigenze.
I prezzi sono solo stime e non sono da intendersi come quotazioni effettive. I prezzi effettivi possono variare a seconda del tipo di contratto stipulato con Microsoft, della data di acquisto e del tasso di cambio. I prezzi sono calcolati in dollari USA e convertiti in base ai tassi degli spot di chiusura di Londra acquisiti nei due giorni lavorativi precedenti l'ultimo giorno lavorativo della fine del mese precedente. Se i due giorni lavorativi precedenti la fine del mese cadono in un giorno festivo nei principali mercati, il giorno di riferimento del tasso è in genere il giorno immediatamente precedente ai due giorni lavorativi. Il tasso viene applicato a tutte le transazioni del mese successivo. Accedi al Calcolatore dei prezzi di Azure per visualizzare i prezzi in base al programma o all'offerta corrente con Microsoft. Contatta uno Specialista vendite di Azure per altre informazioni sui prezzi o per richiedere un preventivo. Vedi le domande frequenti sui prezzi di Azure.
Gli enti del Governo degli Stati Uniti sono idonei per l'acquisto di servizi di Azure per enti pubblici da un provider LSP (Licensing Solution Provider) senza alcun impegno finanziario iniziale oppure direttamente tramite una sottoscrizione online con pagamento in base al consumo.
Importante: il prezzo R$ è semplicemente un riferimento. Si tratta di una transazione interna e il prezzo finale è soggetto ai tassi di cambio e all'aggiunta delle imposte sulle transazioni finanziarie. Non sarà rilasciato alcun documento eNF.
Gli enti del Governo degli Stati Uniti sono idonei per l'acquisto di servizi di Azure per enti pubblici da un provider LSP (Licensing Solution Provider) senza alcun impegno finanziario iniziale oppure direttamente tramite una sottoscrizione online con pagamento in base al consumo.
Importante: il prezzo R$ è semplicemente un riferimento. Si tratta di una transazione interna e il prezzo finale è soggetto ai tassi di cambio e all'aggiunta delle imposte sulle transazioni finanziarie. Non sarà rilasciato alcun documento eNF.
GPT-5 series
Modello | Prezzi (1.000.000 di token) |
---|---|
GPT-5 2025-08-07 Global |
Input: $- Input memorizzato nella cache: $- Output: $- |
GPT-5 Data Zone |
Input: $- Input memorizzato nella cache: $- Output: $- |
GPT-5-mini Global |
Input: $- Input memorizzato nella cache: $- Output: $- |
GPT-5-mini Data Zone |
Input: $- Input memorizzato nella cache: $- Output: $- |
GPT-5-nano Global |
Input: $- Input memorizzato nella cache: $- Output: $- |
GPT-5-nano Data Zone |
Input: $- Input memorizzato nella cache: $- Output: $- |
GPT-5 chat Global |
Input: $- Input memorizzato nella cache: $- Output: $- |
Deep Research
Deep Research enables developers and enterprises to automate complex research tasks with structured, citation-rich answers. It is suitable for building customer support bots, internal knowledge assistants, or market analysis tools. Deep Research delivers transparent, auditable insights grounded in real-time web data. Search context tokens are charged input token prices for the model being used. You’ll separately incur charges for Grounding with Bing Search and the base GPT model being used for clarifying questions.
Modello | Prezzi |
---|---|
o3-deep research Global |
Input: $- Input memorizzato nella cache: $- Output: $- |
o3
o3 è un potente modello di ragionamento della serie o di modelli di ragionamento, che spinge i confini in ambiti come la scrittura di codice, la matematica, la scienza e la percezione visiva. Eccelle nelle query complesse che richiedono un'analisi articolata e si distingue nettamente nelle attività visive come l'analisi di immagini, grafici e illustrazioni. Il modello presenta una finestra di contesto di 200.000 token e ha un limite di conoscenza fissato a giugno 2024.
Modello | Prezzi (1.000.000 di token) | Prezzi con l'API Batch (1 milione di token) |
---|---|---|
o3 2025-04-16 Globale |
Input: $- Input memorizzato nella cache: $- Output: $- |
Input: $- Output: $- |
o3 2025-04-16 Zona dati |
Input: $- Input memorizzato nella cache: $- Output: $- |
Input: $- Output: $- |
o3 2025-04-16 A livello di area |
Input: $- Input memorizzato nella cache: $- Output: $- |
N/D |
o4-mini
o4-mini è un modello di ragionamento compatto, efficiente e conveniente della serie o di OpenAI. Eccelle nelle attività matematiche, nella codifica e in attività visive. Il modello presenta una finestra di contesto di 200.000 token e ha un limite di conoscenza fissato a giugno 2024.
Modello | Prezzi (1.000.000 di token) | Prezzi con l'API Batch (1 milione di token) |
---|---|---|
o4-mini 2025-04-16 Globale |
Input: $- Input memorizzato nella cache: $- Output: $- |
Input: $- Output: $- |
o4-mini 2025-04-16 Zona dati |
Input: $- Input memorizzato nella cache: $- Output: $- |
Input: $- Output: $- |
o4-mini 2025-04-16 A livello di area |
Input: $- Input memorizzato nella cache: $- Output: $- |
N/D |
Serie GPT-4.1
La serie GPT-4.1 è un modello per utilizzo generico altamente avanzato con una vasta conoscenza del mondo e una capacità potenziata di comprendere le finalità dell'utente, per cui è particolarmente abile nelle attività creative e nella pianificazione Agentic. La serie presenta una finestra di contesto di 1 milione di token e ha un limite di conoscenza fissato a giugno 2024.
Modello | Prezzi (1.000.000 di token) | Prezzi con l'API Batch (1 milione di token) |
---|---|---|
GPT-4.1-2025-04-14 Globale |
Input: $- Input memorizzato nella cache: $- Output: $- |
Input: $- Output: $- |
GPT-4.1-2025-04-14 Zone dati |
Input: $- Input memorizzato nella cache: $- Output: $- |
Input: $- Output: $- |
GPT-4.1-2025-04-14 A livello di area |
Input: $- Input memorizzato nella cache: $- Output: $- |
N/D |
GPT-4.1-mini-2025-04-14 Globale |
Input: $- Input memorizzato nella cache: $- Output: $- |
Input: $- Output: $- |
GPT-4.1-mini-2025-04-14 Area dati |
Input: $- Input memorizzato nella cache: $- Output: $- |
Input: $- Output: $- |
GPT-4.1-mini-2025-04-14 A livello di area |
Input: $- Input memorizzato nella cache: $- Output: $- |
N/D |
GPT-4.1-nano-2025-04-14 Globale |
Input: $- Input memorizzato nella cache: $- Output: $- |
Input: $- Output: $- |
GPT-4.1-nano-2025-04-14 Area dati |
Input: $- Input memorizzato nella cache: $- Output: $- |
Input: $- Output: $- |
GPT-4.1-nano-2025-04-14 A livello di area |
Input: $- Input memorizzato nella cache: $- Output: $- |
N/D |
Sora in Azure OpenAI
Sora è un modello di intelligenza artificiale generativa multimodale ora disponibile in Fonderia Azure AI, progettato per aiutare i team creativi a realizzare le proprie idee grazie a un'integrazione semplice e basata su API. Basato sull'infrastruttura di livello aziendale di Azure, offre una distribuzione sicura e scalabile per trasformare i concetti in contenuti visivi di alta qualità.
Prezzo al secondo | 1-5s | 6-10s | 11-15s | 16-20s |
---|---|---|---|---|
480 quadrati | $- | $- | $- | $- |
480p | $- | $- | $- | $- |
720 quadrati | $- | $- | $- | $- |
720p | $- | $- | $- | $- |
1080 quadrati | $- | $- | $- | $- |
1080p | $- | $- | $- | $- |
GPT-Image-1
GPT-image-1 migliora DALL·E con migliori istruzioni, un rendering accurato del testo e supporto per l'input e la modifica delle immagini. Il prezzo del modello viene calcolato per token, con prezzi differenti per i token di testo e di immagine.
Modello | Prezzi (1.000.000 di token) | Prezzi con l'API Batch (1 milione di token) |
---|---|---|
GPT-Image-1 Global |
Testo di input: $- Immagine di input: $- Immagine di output: $- |
N/D |
GPT-Image-1 A livello di area |
Testo di input: $- Immagine di input: $- Immagine di output: $- |
N/D |
GPT-Image-1 Data Zone |
Testo di input: $- Immagine di input: $- Immagine di output: $- |
N/D |
GPT-4.5
GPT-4.5-preview è il modello per utilizzo generico più recente con una conoscenza approfondita del mondo e una migliore comprensione degli intenti dell’utente che lo rendono efficace in attività creative e pianificazione agentic. Il modello ha un contesto di 128 KB e un limite di conoscenza datato ad ottobre 2023.
Modello | Prezzi (1.000.000 di token) | Prezzi con l'API Batch (1 milione di token) |
---|---|---|
GPT-4.5-Preview-2025-02-27 globale |
Input: $- Input memorizzato nella cache: $- Output: $- |
N/D |
o1
o1 è la nuova serie di modelli di motivazione per attività complesse. Il modello ha un contesto di 200.000 e un limite di knowledge base di ottobre 2023.
Modello | Prezzi (1.000.000 di token) | Prezzi con l'API Batch (1 milione di token) |
---|---|---|
o1 2024-12-17 Globale |
Input: $- Input memorizzato nella cache: $- Output: $- |
N/D |
o1 2024-12-17 US/EU – Zone dati |
Input: $- Input memorizzato nella cache: $- Output: $- |
N/D |
o1 2024-12-17 Regionale |
Input: $- Input memorizzato nella cache: $- Output: $- |
N/D |
o1 anteprima 2024-09-12 Globale |
Input: $- Input memorizzato nella cache: $- Output: $- |
N/D |
o1 anteprima 2024-09-12 US/EU – Zone dati |
Input: $- Input memorizzato nella cache: $- Output: $- |
N/D |
o1 anteprima 2024-09-12 Regionale |
Input: $- Input memorizzato nella cache: $- Output: $- |
N/D |
Prova il calcolatore dei prezzi
o3 Mini
O3 mini è la versione aggiornata del modello o1 mini. o3-mini è un modello di ragionamento rapido ed efficiente in termini di costi, progettato per casi d'uso di codifica, matematica e scienze.
Il modello o3-mini presenta ora una finestra di input del contesto espansa di 200.000 token e un output massimo di 100.000 token, così da fornire ampio spazio per risposte complesse e dettagliate. Il modello o1 mini ha una finestra di input del contesto di 128.000 token. Entrambi i modelli o3 e o1 hanno un limite sulle conoscenze fissato per ottobre 2023.
Modello | Prezzi (1.000.000 di token) | Prezzi con l'API Batch (1 milione di token) |
---|---|---|
o3 mini 2025-01-31 Globale |
Input: $- Input memorizzato nella cache: $- Output: $- |
Input: $- Output: $- |
o3 mini 2025-01-31-US/EU – Zone dati |
Input: $- Input memorizzato nella cache: $- Output: $- |
Input: $- Output: $- |
GPT-o3-mini-2025-01-31 Regionale |
Input: $- Input memorizzato nella cache: $- Output: $- |
N/D |
o1-mini 2024-09-12 Globale |
Input: $- Input memorizzato nella cache: $- Output: $- |
N/D |
o1-mini 2024-09-12 US/EU – Zone dati |
Input: $- Input memorizzato nella cache: $- Output: $- |
N/D |
o1-mini 2024-09-12 Regionale |
Input: $- Input memorizzato nella cache: $- Output: $- |
N/D |
Prova il calcolatore dei prezzi
Modelli audio
Il Servizio Azure OpenAI include i modelli audio avanzati GPT-4o-Transcribe, GPT-4o-Mini-Transcribe e GPT-4o-Mini-TTS. Questi modelli migliorano le funzionalità di sintesi vocale e riconoscimento vocale, offrendo un'accuratezza elevata e output vocali personalizzabili per diverse applicazioni. Ideali per call center dedicati ai clienti, i sottotitoli in tempo reale e gli output vocali interattivi, sfruttano un ampio pre-training e tecniche avanzate di distillazione per prestazioni superiori.
Modello | Prezzi (1.000.000 di token) | Prezzi con l'API Batch (1 milione di token) |
---|---|---|
GPT-4o-Transcribe |
Testo Input: $- Output: $- Audio Input: $- Output: N/D |
N/D |
GPT-4o-Mini-Transcribe |
Testo Input: $- Output: $- Audio Input: $- Output: N/D |
N/D |
GPT-4o-Mini-TTS |
Testo Input: $- Output: N/D Audio Input: N/D Output: $- |
N/D |
Computer-Using Agent (CUA)
Il Computer-Using Agent (CUA) è un modello di intelligenza artificiale specializzato che consente all'intelligenza artificiale di interagire con interfacce utente grafiche (GUI), navigare tra le applicazioni e automatizzare attività in più passaggi, tutto tramite istruzioni in linguaggio naturale. Il modello CUA può essere usato come strumento nell'API Risposte.
Modello | Prezzi |
---|---|
computer-use-preview globale |
Input: $-/1 milione di token Output: $-/1 milione di token |
Strumenti predefiniti
L'API Risposte e l'API Assistenti consentono di interagire facilmente con strumenti come l'uso del computer, l'interprete del codice, la chiamata di funzioni e la ricerca di file, semplificando per gli sviluppatori la creazione di agenti di intelligenza artificiale.
Strumento | Input |
---|---|
Computer User (solo API Risposte) |
Input: $-/1 milione di token Output: $-/1 milione di token |
Chiamata dello strumento di ricerca file (solo API Risposte) | $-/1K chiamate strumento |
Ricerca file* | $-/GB di spazio di archiviazione vettoriale al giorno (1 GB gratuito) |
Interprete di codice** | $-/sessione |
*GB fa riferimento a gigabyte binari, dove 1 GB è 2^30 byte.
**Se l'assistente chiama l'Interprete di codice contemporaneamente in due thread diversi, verranno create due sessioni dell'Interprete di codice (2 * $-). Ogni sessione è attiva per impostazione predefinita per un'ora, per cui se l'utente dà istruzioni all'interprete di codice nello stesso thread per un massimo di un'ora verrà effettuato un solo addebito.
Il costo di inferenza (input e output) varia in base al modello GPT usato con ogni assistente. Se l'assistente chiama l'interprete di codice contemporaneamente in due thread diversi, verranno create due sessioni dell'interprete di codice (2 * $-). Ogni sessione è attiva per un'ora per impostazione predefinita, quindi il prezzo si riferisce a un massimo di un'ora di istruzioni fornite all'interprete di codice nello stesso thread.
API in tempo reale
In primo piano nell'API Realtime, GPT-4o-Realtime-Preview supporta funzionalità di sintesi vocale multilingue. Ottimizzato per conversazioni in tempo reale e a bassa latenza, consente interazioni naturali con un ritardo minimo, ideale per chatbot e intelligenza artificiale conversazionale. GPT-4o è la versione completa e più potente progettata per attività complesse, mentre GPT-4o Mini rappresenta un'opzione più piccola e più conveniente, ideale per applicazioni più semplici in cui l'efficienza dei costi e la velocità sono la priorità.
Modello | Prezzi (1.000.000 di token) |
---|---|
GPT-4o-Realtime-Preview-2024-12-17-Global |
Testo Input: $- Input memorizzato nella cache: $- Output: $- Audio Input: $- Input memorizzato nella cache: $- Output: $- |
GPT-4o-Realtime-Preview-2024-12-17-US/EU – Zone dati |
Testo Input: $- Input memorizzato nella cache: $- Output: $- Audio Input: $- Input memorizzato nella cache: $- Output: $- |
GPT-4o-Realtime-Preview-2024-12-17-Regional |
Testo Input: $- Input memorizzato nella cache: $- Output: $- Audio Input: $- Input memorizzato nella cache: $- Output: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global |
Testo Input: $- Input memorizzato nella cache: $- Output: $- Audio Input: $- Input memorizzato nella cache: $- Output: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU – Zone dati |
Testo Input: $- Input memorizzato nella cache: $- Output: $- Audio Input: $- Input memorizzato nella cache: $- Output: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional |
Testo Input: $- Input memorizzato nella cache: $- Output: $- Audio Input: $- Input memorizzato nella cache: $- Output: $- |
GPT-4o-Realtime-Preview-2024-10-01-Global |
Testo Input: $- Input memorizzato nella cache: $- Output: $- Audio Input: $- Input memorizzato nella cache: $- Output: $- |
GPT-4o-Realtime-Preview-2024-10-01-US/EU – Zone dati |
Testo Input: $- Input memorizzato nella cache: $- Output: $- Audio Input: $- Input memorizzato nella cache: $- Output: $- |
GPT-4o-Realtime-Preview-2024-10-01-Regional |
Testo Input: $- Input memorizzato nella cache: $- Output: $- Audio Input: $- Input memorizzato nella cache: $- Output: $- |
API di completamento della chat
Incluso nell'API di completamento della chat, il modello GPT 4o-Audio-Preview elabora e genera contenuti audio. Supporta funzionalità avanzate come il riconoscimento vocale e la sintesi audio, ideale per le interazioni vocali asincrone e l'analisi del sentiment. GPT-4o è la versione completa e più potente progettata per attività complesse, mentre GPT-4o Mini rappresenta un'opzione più piccola e più conveniente, ideale per applicazioni più semplici in cui l'efficienza dei costi e la velocità sono la priorità.
Modello | Prezzi (1.000.000 di token) |
---|---|
GPT-4o-Audio-Preview-2024-12-17-Global |
Testo Input: $- Output: $- Audio Input: $- Output: $- |
GPT-4o-Audio-Preview-2024-12-17-US/EU – Zone dati |
Testo Input: $- Output: $- Audio Input: $- Output: $- |
GPT-4o-Audio-Preview-2024-12-17-Regional |
Testo Input: $- Output: $- Audio Input: $- Output: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Global |
Testo Input: $- Output: $- Audio Input: $- Output: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU – Zone dati |
Testo Input: $- Output: $- Audio Input: $- Output: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional |
Testo Input: $- Output: $- Audio Input: $- Output: $- |
GPT-4o
GPT-4o è il modello multimodali più avanzato, veloce e conveniente rispetto a GPT-4 Turbo con funzionalità di visione più avanzate. Il modello ha un contesto di 128 KB e un limite di knowledge base di ottobre 2023.
Modello | Prezzi (1.000.000 di token) | Prezzi con l'API Batch (1 milione di token) |
---|---|---|
GPT-4o-2024-1120 - Globale |
Input: $- Input memorizzato nella cache: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-1120 US/EU – Zone dati |
Input: $- Input memorizzato nella cache: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-1120 - A livello di area |
Input: $- Input memorizzato nella cache: $- Output: $- |
N/D |
GPT-4o-06-08-2024-08 Globale |
Input: $- Input memorizzato nella cache: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-08-06 US/EU – Zone dati |
Input: $- Input memorizzato nella cache: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-08-06 - A livello di area |
Input: $- Input memorizzato nella cache: $- Output: $- |
N/D |
GPT-4o-2024-0513 - Globale |
Input: $- Output: $- |
Input: $- Output: $- |
GPT-4o-2024-0513 US/EU – Zone dati |
Input: $- Output: $- |
N/D |
GPT-4o-2024-0513 - A livello di area |
Input: $- Output: $- |
N/D |
Prova il calcolatore dei prezzi
GPT-4o-mini
GPT-4o mini è il modello di piccole dimensioni più conveniente e dispone di funzionalità visive. Il modello ha un contesto di 128 KB e un limite di knowledge base di ottobre 2023.
Modello | Prezzi (1.000.000 di token) | Prezzi con l'API Batch (1 milione di token) |
---|---|---|
GPT-4o-mini-0718 Global |
Input: $- Input memorizzato nella cache: $- Output: $- |
Input: $- Output: $- |
GPT-4o-mini-0718 US/EU - Zone dati |
Input: $- Input memorizzato nella cache: $- Output: $- |
Input: $- Output: $- |
GPT-4o-mini-0718 Regional |
Input: $- Input memorizzato nella cache: $- Output: $- |
N/D |
Prova il calcolatore dei prezzi
Provisioning effettuato
È possibile allocare e gestire la velocità effettiva per le distribuzioni, garantendo prestazioni prevedibili e capacità stabile. La tariffa oraria viene addebitata per ogni modello, indipendentemente dall'utilizzo, ma è possibile ottenere ulteriori risparmi con prenotazioni mensili e annuali. Scopri come eseguire la transizione delle distribuzioni a livello di area e delle prenotazioni di cui è stato effettuato il provisioning alle aree dati e globali in questa pagina di Learn.
Modello | Numero minimo di PTU | Prezzi PTU orari | Prezzi delle prenotazioni mensili PTU | Prezzi delle prenotazioni annuali PTU |
---|---|---|---|---|
GPT-4.1 Global | 15 | $- | $- | $- |
Zone dati GPT-4.1 | 15 | $- | $- | $- |
GPT-4.1 - A livello di area | 50 | $- | $- | $- |
GPT-4.1-mini Global | 15 | $- | $- | $- |
GPT-4.1-mini - Zone dati USA/UE | 15 | $- | $- | $- |
GPT-4.1-mini - A livello di area | 25 | $- | $- | $- |
GPT-4.1-nano Global | 15 | $- | $- | $- |
GPT-4.1-nano - Zone dati USA/UE | 15 | $- | $- | $- |
GPT-4.1-nano - A livello di area | 25 | $- | $- | $- |
o3-mini Global | 15 | $- | $- | $- |
o3-mini US/EU Data Zones | 15 | $- | $- | $- |
o3-mini Regional | 25 | $- | $- | $- |
o3 - Globale | 15 | $- | $- | $- |
o3 - Zone dati USA/UE | 15 | $- | $- | $- |
o3 - A livello di area | 50 | $- | $- | $- |
o4-mini Global | 15 | $- | $- | $- |
o4-mini - Zone dati USA/UE | 15 | $- | $- | $- |
o4-mini - A livello di area | 25 | $- | $- | $- |
GPT-4o Globale | 15 | $- | $- | $- |
Zone dati GPT-4o USA/UE | 15 | $- | $- | $- |
GPT-4o Regionale | 50 | $- | $- | $- |
GPT-4o-Regional ottimizzato | 50 | $- | $- | $- |
GPT-4o Mini Globale | 15 | $- | $- | $- |
Zone dati GPT-4o Mini US/EU | 15 | $- | $- | $- |
GPT-4o-mini a livello di area | 25 | $- | $- | $- |
GPT-4o-Mini Regional ottimizzato | 25 | $- | $- | $- |
Prova il calcolatore dei prezzi
Modelli base
Modelli | Utilizzo per 1.000 token |
---|---|
Babbage-002 | $- |
Davinci-002 | $- |
Ottimizzazione dei modelli
Modello | Prezzi | |
---|---|---|
o4-mini (ottimizzazione rinforzo) | A livello di area |
Input: $-/1 milione di token Output: $-/1 milione di token Formazione: $-/ora Hosting: $-/ora Input classificatore: o4-mini: $-/1 milione di token 4.1-mini: $-/1 milione di token 4.1: $-/1 milione di token 4.1-nano: $-/1 milione di token o3: $-/1 milione di token Input classificatore memorizzato nella cache: o4-mini: $-/1 milione di token 4.1-mini: $-/1 milione di token 4.1: $-/1 milione di token 4.1-nano: $-/1 milione di token o3: $-/1 milione di token Output classificatore: o4-mini: $-/1 milione di token 4.1-mini: $-/1 milione di token 4.1: $-/1 milione di token 4.1-nano: $-/1 milione di token o3: $-/1 milione di token |
Globale |
Input: $-/1 milione di token Output: $-/1 milione di token Formazione: $-/ora Hosting: $-/ora Input classificatore: o4-mini: $-/1 milione di token 4.1-mini: $-/1 milione di token 4.1: $-/1 milione di token 4.1-nano: $-/1 milione di token o3: $-/1 milione di token Input classificatore memorizzato nella cache: o4-mini: $-/1 milione di token 4.1-mini: $-/1 milione di token 4.1: $-/1 milione di token 4.1-nano: $-/1 milione di token o3: $-/1 milione di token Output classificatore: o4-mini: $-/1 milione di token 4.1-mini: $-/1 milione di token 4.1: $-/1 milione di token 4.1-nano: $-/1 milione di token o3: $-/1 milione di token |
|
GPT-4.1 | A livello di area |
Input: $-/1 milione di token Input memorizzato nella cache: $-/1 milione di token Output: $-/1 milione di token Formazione: $-/1 milione di token Hosting: $-/ora |
Globale |
Input: $-/1 milione di token Input memorizzato nella cache: $-/1 milione di token Output: $-/1 milione di token Formazione: $-/1 milione di token Hosting: $-/ora |
|
Developer |
Input: $-/1 milione di token Input memorizzato nella cache: $-/1 milione di token Output: $-/1 milione di token |
|
GPT-4.1-mini | A livello di area |
Input: $-/1 milione di token Input memorizzato nella cache: $-/1 milione di token Output: $-/1 milione di token Formazione: $-/1 milione di token Hosting: $-/ora |
Globale |
Input: $-/1 milione di token Input memorizzato nella cache: $-/1 milione di token Output: $-/1 milione di token Formazione: $-/1 milione di token Hosting: $-/ora |
|
Developer |
Input: $-/1 milione di token Input memorizzato nella cache: $-/1 milione di token Output: $-/1 milione di token |
|
GPT-4.1-nano | A livello di area |
Input: $-/1 milione di token Input memorizzato nella cache: $-/1 milione di token Output: $-/1 milione di token Formazione: $-/1 milione di token Hosting: $-/ora |
Globale |
Input: $-/1 milione di token Input memorizzato nella cache: $-/1 milione di token Output: $-/1 milione di token Formazione: $-/1 milione di token Hosting: $-/ora |
|
Developer |
Input: $-/1 milione di token Input memorizzato nella cache: $-/1 milione di token Output: $-/1 milione di token |
|
GPT-4o-2024-08-06 | A livello di area |
Input: $-/1 milione di token Input memorizzato nella cache: $-/1 milione di token Output: $-/1 milione di token Formazione: $-/1 milione di token Hosting: $-/ora |
Globale |
Input: $-/1 milione di token Input memorizzato nella cache: $-/1 milione di token Output: $-/1 milione di token Formazione: usare a livello di area Hosting: $-/ora |
|
GPT-4o-mini | A livello di area |
Input: $-/1 milione di token Input memorizzato nella cache: $-/1 milione di token Output: $-/1 milione di token Formazione: $-/1 milione di token Hosting: $-/ora |
Globale |
Input: $-/1 milione di token Input memorizzato nella cache: $-/1 milione di token Output: $-/1 milione di token Formazione: usare a livello di area Hosting: $-/ora |
|
GPT-3.5-Turbo (16 KB) | A livello di area |
Input: $-/1 milione di token Output: $-/1 milione di token Formazione: $-/1 milione di token Hosting: $-/ora |
Modelli di immagine
Modelli | Qualità | Risoluzione | Prezzo (per 100 immagini) |
---|---|---|---|
Dall-E-3 | Standard | 1024 * 1024 | $- |
Standard | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-3 | HD | 1024 * 1024 | $- |
HD | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-2 | Standard | 1024 * 1024 | $- |
Modelli di incorporazione
Modelli | Per 1.000 token |
---|---|
Ada | $- |
text-embedding-3-large | $- |
text-embedding-3-small | $- |
Modelli conversione voce/testo
Modelli | Prezzo |
---|---|
Whisper | $-/ora |
TTS (Sintesi vocale) | $-/1 milione di caratteri |
TTS HD | $-/1 milione di caratteri |
Modelli linguistici legacy
Modelli | Contesto | Input (token per 1 milione) | Output (token per 1 milione) |
---|---|---|---|
GPT-3.5-Turbo-0301 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 16K | $- | $- |
GPT-3.5-Turbo-1106 | 16K | $- | $- |
GPT-3.5-Turbo-0125 | 16K | $- | $- |
GPT-3.5-Turbo-Instruct | 4K | $- | $- |
GPT-4 Turbo | 128K | $- | $- |
GPT-4-Turbo-Vision | 128K | $- | $- |
GPT-4 | 8K | $- | $- |
GPT-4 | 32K | $- | $- |
Prezzi e opzioni di acquisto di Azure

Contattaci direttamente
Informazioni dettagliate sui prezzi di Azure. È possibile ottenere informazioni sui prezzi per la soluzione cloud e sull'ottimizzazione dei costi e richiedere una proposta personalizzata.
Comunica con uno specialista venditeScopri le modalità di acquisto
Acquista servizi di Azure tramite il sito Web di Azure, un rappresentante Microsoft o un partner di Azure.
Esplora le opzioni disponibiliRisorse aggiuntive
Servizio OpenAI di Azure
Scopri di più sulle funzionalità e sulle capacità di Servizio OpenAI di Azure.
Calcolatore prezzi
Stima i costi mensili previsti per qualsiasi combinazione dei prodotti di Azure.
Contratto di servizio
Esamina il Contratto di servizio per Servizio OpenAI di Azure.
Documentazione
Vedi esercitazioni tecniche, video e altre risorse di Servizio OpenAI di Azure.
Domande frequenti
-
Servizio Azure OpenAI offre prezzi basati sia con pagamento in base al consumo che su unità elaborate con provisioning (PTU). Con pagamento in base al consumo consente di pagare per le risorse utilizzate, offrendo flessibilità per i carichi di lavoro variabili. PTU offre un modello di prezzo prevedibile in cui si riserva e si distribuisce una quantità specifica di capacità di elaborazione del modello. Questo modello è ideale per i carichi di lavoro con modelli di utilizzo costanti o prevedibili, garantendo stabilità e controllo dei costi.
-
Per altre informazioni sulle PTU e sui prezzi di Azure OpenAI, leggi la documentazione PTU o contatta il nostro specialista delle vendite.
Contatta uno specialista delle vendite per ottenere informazioni dettagliate sui prezzi di Azure. Verifica i prezzi per la tua soluzione cloud.
Ottieni servizi cloud gratuiti e $200 di credito per esplorare Azure per 30 giorni.