Passa a contenuti principali
Azure

Prezzi di Servizio OpenAI di Azure

Panoramica dei prezzi del Servizio OpenAI di Azure

Servizio OpenAI di Azure offre un’intelligenza artificiale generativa pronta per l’azienda con modelli potenti di OpenAI, che consentono alle organizzazioni di innovare con funzionalità di testo, audio e visione. Oltre ai modelli all’avanguardia, le aziende scelgono Servizio OpenAI di Azure per la privacy dei dati predefinita, la flessibilità a livello di regione/area/globale e l’integrazione perfetta nell’ecosistema di Azure, tra cui Fabric, Cosmos DB e Azure AI Search. Le aziende di tutte le dimensioni possono ridimensionare in tutta sicurezza le soluzioni di intelligenza artificiale per migliorare l’esperienza dei clienti, automatizzare flussi di lavoro e sbloccare potenziale creativo, creando un impatto misurabile e una differenziazione competitiva.

Per aiutare i clienti nel proprio percorso, vengono offerte soluzioni di gestione dei prezzi e dei costi per soddisfare le varie esigenze. tra cui:
  • Standard (su richiesta): con pagamento in base al consumo per token di input e output.
  • Con provisioning (PTUs): velocità effettiva allocata con costi prevedibili e prenotazioni mensili e annuali disponibili per ridurre la spesa complessiva.
  • API batch: i modelli di linguaggio sono ora disponibili anche nell’API batch per le distribuzioni globali e tre regioni che restituiscono i completamenti entro 24 ore con uno sconto del 50% sui prezzi standard globali.
È possibile scegliere tra i tipi di distribuzioni seguenti per Standard e Con provisioning che consentono maggiore flessibilità e controllo dei prezzi e delle prestazioni. Questa flessibilità è utile quando sono presenti limiti di elaborazione dati sempre più restrittivi e la necessità di aumentare la velocità effettiva e ridurre i prezzi.
  • Distribuzione globale: SKU globale
  • Distribuzione della zona dati: su base geografica (EU o Stati Uniti d’America)
  • Distribuzione a livello di area: area locale (fino a 27 regioni)

Esplora le opzioni per i prezzi

Applica i filtri per personalizzare le opzioni per i prezzi in base alle tue esigenze.

I prezzi sono solo stime e non sono da intendersi come quotazioni effettive. I prezzi effettivi possono variare a seconda del tipo di contratto stipulato con Microsoft, della data di acquisto e del tasso di cambio. I prezzi sono calcolati in dollari USA e convertiti in base ai tassi degli spot di chiusura di Londra acquisiti nei due giorni lavorativi precedenti l'ultimo giorno lavorativo della fine del mese precedente. Se i due giorni lavorativi precedenti la fine del mese cadono in un giorno festivo nei principali mercati, il giorno di riferimento del tasso è in genere il giorno immediatamente precedente ai due giorni lavorativi. Il tasso viene applicato a tutte le transazioni del mese successivo. Accedi al Calcolatore dei prezzi di Azure per visualizzare i prezzi in base al programma o all'offerta corrente con Microsoft. Contatta uno Specialista vendite di Azure per altre informazioni sui prezzi o per richiedere un preventivo. Vedi le domande frequenti sui prezzi di Azure.

GPT-4.5

GPT-4.5-preview è il modello per utilizzo generico più recente con una conoscenza approfondita del mondo e una migliore comprensione degli intenti dell’utente che lo rendono efficace in attività creative e pianificazione agentic. Il modello ha un contesto di 128 KB e un limite di conoscenza datato ad ottobre 2023.

Modello Prezzi (1.000.000 di token) Prezzi con l'API Batch (1 milione di token)
GPT-4.5-Preview-2025-02-27 globale Input: $-
Input memorizzato nella cache: $-
Output: $-
N/D

o1

o1 è la nuova serie di modelli di motivazione per attività complesse. Il modello ha un contesto di 200.000 e un limite di knowledge base di ottobre 2023.

Modello Prezzi (1.000.000 di token) Prezzi con l'API Batch (1 milione di token)
o1 2024-12-17 Globale Input: $-
Input memorizzato nella cache: $-
Output: $-
N/D
o1 2024-12-17 US/EU – Zone dati Input: $-
Input memorizzato nella cache: $-
Output: $-
N/D
o1 2024-12-17 Regionale Input: $-
Input memorizzato nella cache: $-
Output: $-
N/D
o1 anteprima 2024-09-12 Globale Input: $-
Input memorizzato nella cache: $-
Output: $-
N/D
o1 anteprima 2024-09-12 US/EU – Zone dati Input: $-
Input memorizzato nella cache: $-
Output: $-
N/D
o1 anteprima 2024-09-12 Regionale Input: $-
Input memorizzato nella cache: $-
Output: $-
N/D

Prova il calcolatore dei prezzi

o3 Mini

O3 mini è la versione aggiornata del modello o1 mini. o3-mini è un modello di ragionamento rapido ed efficiente in termini di costi, progettato per casi d'uso di codifica, matematica e scienze.

Il modello o3-mini presenta ora una finestra di input del contesto espansa di 200.000 token e un output massimo di 100.000 token, così da fornire ampio spazio per risposte complesse e dettagliate. Il modello o1 mini ha una finestra di input del contesto di 128.000 token. Entrambi i modelli o3 e o1 hanno un limite sulle conoscenze fissato per ottobre 2023.

Modello Prezzi (1.000.000 di token) Prezzi con l'API Batch (1 milione di token)
o3 mini 2025-01-31 Globale Input: $-
Input memorizzato nella cache: $-
Output: $-
Input: $-
Output: $-
o3 mini 2025-01-31-US/EU – Zone dati Input: $-
Input memorizzato nella cache: $-
Output: $-
Input: $-
Output: $-
GPT-o3-mini-2025-01-31 Regionale Input: $-
Input memorizzato nella cache: $-
Output: $-
N/D
o1-mini 2024-09-12 Globale Input: $-
Input memorizzato nella cache: $-
Output: $-
N/D
o1-mini 2024-09-12 US/EU – Zone dati Input: $-
Input memorizzato nella cache: $-
Output: $-
N/D
o1-mini 2024-09-12 Regionale Input: $-
Input memorizzato nella cache: $-
Output: $-
N/D

Prova il calcolatore dei prezzi

Computer-Using Agent (CUA)

The Computer-Using Agent (CUA) is a specialized AI model that allows AI to interact with graphical user interfaces (GUIs), navigate applications, and automate multi-step tasks—all through natural language instructions. The CUA model can be used as a tool in the Responses API.

Modello Prezzi
computer-use-preview Global Input: $-/1 milione di token
Output: $-/1 milione di token

Built-in tools

The Responses API and the Assistants API enable seamless interaction with tools like computer use, code interpreter, function calling, and file search, making it easy for developers to build AI agents.

Strumento Input
Computer Use (Responses API only) Input: $-/1 milione di token
Output: $-/1 milione di token
File Search Tool Call (Responses API only) $-/1K tool calls
Ricerca file* $-/GB di spazio di archiviazione vettoriale al giorno (1 GB gratuito)
Interprete di codice** $-/sessione

*GB fa riferimento a gigabyte binari, dove 1 GB è 2^30 byte.

**Se l'assistente chiama l'Interprete di codice contemporaneamente in due thread diversi, verranno create due sessioni dell'Interprete di codice (2 * $-). Ogni sessione è attiva per impostazione predefinita per un'ora, per cui se l'utente dà istruzioni all'interprete di codice nello stesso thread per un massimo di un'ora verrà effettuato un solo addebito.

Il costo di inferenza (input e output) varia in base al modello GPT usato con ogni assistente. Se l'assistente chiama l'interprete di codice contemporaneamente in due thread diversi, verranno create due sessioni dell'interprete di codice (2 * $-). Ogni sessione è attiva per un'ora per impostazione predefinita, quindi il prezzo si riferisce a un massimo di un'ora di istruzioni fornite all'interprete di codice nello stesso thread.

API in tempo reale

In primo piano nell'API Realtime, GPT-4o-Realtime-Preview supporta funzionalità di sintesi vocale multilingue. Ottimizzato per conversazioni in tempo reale e a bassa latenza, consente interazioni naturali con un ritardo minimo, ideale per chatbot e intelligenza artificiale conversazionale. GPT-4o è la versione completa e più potente progettata per attività complesse, mentre GPT-4o Mini rappresenta un'opzione più piccola e più conveniente, ideale per applicazioni più semplici in cui l'efficienza dei costi e la velocità sono la priorità.

Modello Prezzi (1.000.000 di token)
GPT-4o-Realtime-Preview-2024-12-17-Global Testo
Input: $-
Input memorizzato nella cache: $-
Output: $-

Audio
Input: $-
Input memorizzato nella cache: $-
Output: $-
GPT-4o-Realtime-Preview-2024-12-17-US/EU – Zone dati Testo
Input: $-
Input memorizzato nella cache: $-
Output: $-

Audio
Input: $-
Input memorizzato nella cache: $-
Output: $-
GPT-4o-Realtime-Preview-2024-12-17-Regional Testo
Input: $-
Input memorizzato nella cache: $-
Output: $-

Audio
Input: $-
Input memorizzato nella cache: $-
Output: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global Testo
Input: $-
Input memorizzato nella cache: $-
Output: $-

Audio
Input: $-
Input memorizzato nella cache: $-
Output: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU – Zone dati Testo
Input: $-
Input memorizzato nella cache: $-
Output: $-

Audio
Input: $-
Input memorizzato nella cache: $-
Output: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional Testo
Input: $-
Input memorizzato nella cache: $-
Output: $-

Audio
Input: $-
Input memorizzato nella cache: $-
Output: $-
GPT-4o-Realtime-Preview-2024-10-01-Global Testo
Input: $-
Input memorizzato nella cache: $-
Output: $-

Audio
Input: $-
Input memorizzato nella cache: $-
Output: $-
GPT-4o-Realtime-Preview-2024-10-01-US/EU – Zone dati Testo
Input: $-
Input memorizzato nella cache: $-
Output: $-

Audio
Input: $-
Input memorizzato nella cache: $-
Output: $-
GPT-4o-Realtime-Preview-2024-10-01-Regional Testo
Input: $-
Input memorizzato nella cache: $-
Output: $-

Audio
Input: $-
Input memorizzato nella cache: $-
Output: $-

API di completamento della chat

Incluso nell'API di completamento della chat, il modello GPT 4o-Audio-Preview elabora e genera contenuti audio. Supporta funzionalità avanzate come il riconoscimento vocale e la sintesi audio, ideale per le interazioni vocali asincrone e l'analisi del sentiment. GPT-4o è la versione completa e più potente progettata per attività complesse, mentre GPT-4o Mini rappresenta un'opzione più piccola e più conveniente, ideale per applicazioni più semplici in cui l'efficienza dei costi e la velocità sono la priorità.

Modello Prezzi (1.000.000 di token)
GPT-4o-Audio-Preview-2024-12-17-Global Testo
Input: $-
Output: $-

Audio
Input: $-
Output: $-
GPT-4o-Audio-Preview-2024-12-17-US/EU – Zone dati Testo
Input: $-
Output: $-

Audio
Input: $-
Output: $-
GPT-4o-Audio-Preview-2024-12-17-Regional Testo
Input: $-
Output: $-

Audio
Input: $-
Output: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Global Testo
Input: $-
Output: $-

Audio
Input: $-
Output: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU – Zone dati Testo
Input: $-
Output: $-

Audio
Input: $-
Output: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional Testo
Input: $-
Output: $-

Audio
Input: $-
Output: $-

GPT-4o

GPT-4o è il modello multimodali più avanzato, veloce e conveniente rispetto a GPT-4 Turbo con funzionalità di visione più avanzate. Il modello ha un contesto di 128 KB e un limite di knowledge base di ottobre 2023.

Modello Prezzi (1.000.000 di token) Prezzi con l'API Batch (1 milione di token)
GPT-4o-2024-1120 - Globale Input: $-
Input memorizzato nella cache: $-
Output: $-
Input: $-
Output: $-
GPT-4o-2024-1120 US/EU – Zone dati Input: $-
Input memorizzato nella cache: $-
Output: $-
Input: $-
Output: $-
GPT-4o-2024-1120 - A livello di area Input: $-
Input memorizzato nella cache: $-
Output: $-
N/D
GPT-4o-06-08-2024-08 Globale Input: $-
Input memorizzato nella cache: $-
Output: $-
Input: $-
Output: $-
GPT-4o-2024-08-06 US/EU – Zone dati Input: $-
Input memorizzato nella cache: $-
Output: $-
Input: $-
Output: $-
GPT-4o-2024-08-06 - A livello di area Input: $-
Input memorizzato nella cache: $-
Output: $-
N/D
GPT-4o-2024-0513 - Globale Input: $-
Output: $-
Input: $-
Output: $-
GPT-4o-2024-0513 US/EU – Zone dati Input: $-
Output: $-
N/D
GPT-4o-2024-0513 - A livello di area Input: $-
Output: $-
N/D

Prova il calcolatore dei prezzi

GPT-4o-mini

GPT-4o mini è il modello di piccole dimensioni più conveniente e dispone di funzionalità visive. Il modello ha un contesto di 128 KB e un limite di knowledge base di ottobre 2023.

Modello Prezzi (1.000.000 di token) Prezzi con l'API Batch (1 milione di token)
GPT-4o-mini-0718 Global Input: $-
Input memorizzato nella cache: $-
Output: $-
Input: $-
Output: $-
GPT-4o-mini-0718 US/EU - Zone dati Input: $-
Input memorizzato nella cache: $-
Output: $-
Input: $-
Output: $-
GPT-4o-mini-0718 Regional Input: $-
Input memorizzato nella cache: $-
Output: $-
N/D

Prova il calcolatore dei prezzi

Provisioning effettuato

È possibile allocare e gestire la velocità effettiva per le distribuzioni, garantendo prestazioni prevedibili e capacità stabile. La tariffa oraria viene addebitata per ogni modello, indipendentemente dall'utilizzo, ma è possibile ottenere ulteriori risparmi con prenotazioni mensili e annuali. Scopri come eseguire la transizione delle distribuzioni a livello di area e delle prenotazioni di cui è stato effettuato il provisioning alle aree dati e globali in questa pagina di Learn.

Modello Numero minimo di PTU Prezzi PTU orari Prezzi delle prenotazioni mensili PTU Prezzi delle prenotazioni annuali PTU
GPT-4o Globale 15 $- $- $-
Zone dati GPT-4o USA/UE 15 $- $- $-
GPT-4o Regionale 50 $- $- $-
GPT-4o-Regional ottimizzato 50 $- $- $-
GPT-4o Mini Globale 15 $- $- $-
Zone dati GPT-4o Mini US/EU 15 $- $- $-
GPT-4o-mini a livello di area 25 $- $- $-
GPT-4o-Mini Regional ottimizzato 25 $- $- $-

Prova il calcolatore dei prezzi

Modelli base

Modelli Utilizzo per 1.000 token
Babbage-002 $-
Davinci-002 $-

Ottimizzazione dei modelli

Modello Prezzi
GPT-4o-2024-08-06 A livello di area Input: $-/1 milione di token
Input memorizzato nella cache: $-/1 milione di token
Output: $-/1 milione di token
Formazione: $-/1 milione di token
Hosting: $-/ora
Globale Input: $-/1 milione di token
Input memorizzato nella cache: $-/1 milione di token
Output: $-/1 milione di token
Formazione: usare a livello di area
Hosting: $-/ora
GPT-4o-mini A livello di area Input: $-/1 milione di token
Input memorizzato nella cache: $-/1 milione di token
Output: $-/1 milione di token
Formazione: $-/1 milione di token
Hosting: $-/ora
Globale Input: $-/1 milione di token
Input memorizzato nella cache: $-/1 milione di token
Output: $-/1 milione di token
Formazione: usare a livello di area
Hosting: $-/ora
GPT-4-0613 (8 K) A livello di area Input: $-/1 milione di token
Output: $-/1 milione di token
Formazione: $-/1 milione di token
Hosting: $-/ora
GPT-3.5-Turbo (16 KB) A livello di area Input: $-/1 milione di token
Output: $-/1 milione di token
Formazione: $-/1 milione di token
Hosting: $-/ora
GPT-3.5-Turbo (4K) A livello di area Input: $-/1 milione di token
Output: $-/1 milione di token
Formazione: $-/1 milione di token
Hosting: $-/ora
Babbage-002 Input: $-/1 milione di token
Output: $-/1 milione di token
Formazione: $-/1 milione di token
Hosting: $-/ora
Davinci-002 Input: $-/1 milione di token
Output: $-/1 milione di token
Formazione: $-/1 milione di token
Hosting: $-/ora

Modelli di immagine

Modelli Qualità Risoluzione Prezzo (per 100 immagini)
Dall-E-3 Standard 1024 * 1024 $-
Standard 1024 * 1792,
1792 * 1024
$-
Dall-E-3 HD 1024 * 1024 $-
HD 1024 * 1792,
1792 * 1024
$-
Dall-E-2 Standard 1024 * 1024 $-

Modelli di incorporazione

Modelli Per 1.000 token
Ada $-
text-embedding-3-large $-
text-embedding-3-small $-

Modelli conversione voce/testo

Modelli Prezzo
Whisper $-/ora
TTS (Sintesi vocale) $-/1 milione di caratteri
TTS HD $-/1 milione di caratteri

Modelli linguistici legacy

Modelli Contesto Input (token per 1 milione) Output (token per 1 milione)
GPT-3.5-Turbo-0301 4K $- $-
GPT-3.5-Turbo-0613 4K $- $-
GPT-3.5-Turbo-0613 16K $- $-
GPT-3.5-Turbo-1106 16K $- $-
GPT-3.5-Turbo-0125 16K $- $-
GPT-3.5-Turbo-Instruct 4K $- $-
GPT-4 Turbo 128K $- $-
GPT-4-Turbo-Vision 128K $- $-
GPT-4 8K $- $-
GPT-4 32K $- $-

Prezzi e opzioni di acquisto di Azure

Contattaci direttamente

Informazioni dettagliate sui prezzi di Azure. È possibile ottenere informazioni sui prezzi per la soluzione cloud e sull'ottimizzazione dei costi e richiedere una proposta personalizzata.

Comunica con uno specialista vendite

Scopri le modalità di acquisto

Acquista servizi di Azure tramite il sito Web di Azure, un rappresentante Microsoft o un partner di Azure.

Esplora le opzioni disponibili

Risorse aggiuntive

Servizio OpenAI di Azure

Scopri di più sulle funzionalità e sulle capacità di Servizio OpenAI di Azure.

Calcolatore prezzi

Stima i costi mensili previsti per qualsiasi combinazione dei prodotti di Azure.

Contratto di servizio

Esamina il Contratto di servizio per Servizio OpenAI di Azure.

Documentazione

Vedi esercitazioni tecniche, video e altre risorse di Servizio OpenAI di Azure.

  • Servizio OpenAI di Azure offre prezzi basati sia con pagamento in base al consumo che su unità elaborate con provisioning (PTU). Con pagamento in base al consumo consente di pagare per le risorse utilizzate, offrendo flessibilità per i carichi di lavoro variabili. PTU offre un modello di prezzo prevedibile in cui si riserva e si distribuisce una quantità specifica di capacità di elaborazione del modello. Questo modello è ideale per i carichi di lavoro con modelli di utilizzo costanti o prevedibili, garantendo stabilità e controllo dei costi.
  • Per altre informazioni sulle PTU e sui prezzi di Azure OpenAI, leggi la documentazione PTU o contatta il nostro specialista delle vendite.

Contatta uno specialista delle vendite per ottenere informazioni dettagliate sui prezzi di Azure. Verifica i prezzi per la tua soluzione cloud.

Ottieni servizi cloud gratuiti e $200 di credito per esplorare Azure per 30 giorni.

Aggiunto alla stima. Premi 'v' per visualizzare nel calcolatore
Serve aiuto?