Passa a contenuti principali

Prezzi di Servizio OpenAI di Azure

Panoramica dei prezzi del Servizio OpenAI di Azure

Azure OpenAI Service delivers enterprise-ready generative AI featuring powerful models from OpenAI, enabling organizations to innovate with text, audio, and vision capabilities. Beyond the cutting-edge models, companies choose Azure OpenAI Service for built-in data privacy, regional/area/global flexibility, and seamless integration into the Azure ecosystem including Fabric, Cosmos DB and Azure AI Search. Companies of all sizes can confidently scale AI solutions to enhance customer experience, automate workflows, and unlock creative potential, driving measurable impact and competitive differentiation.

To help customers in the journey, we offer pricing and cost management solutions to meet your needs. including:
  • Standard (On-Demand): Pay-as-you-go for input and output tokens.
  • Provisioned (PTUs): Allocate throughput with predictable costs, with monthly and annual reservations available to reduce overall spend.
  • Batch API: Language models are also now available in the Batch API for global deployments and three regions, that returns completions within 24 hours for a 50% discount on Global Standard Pricing.
You can choose from the following deployment types for Standard and Provisioned, which enable greater flexibility and control of pricing and performance. This flexibility helps when there is increasingly more restrictive data processing boundaries and need for increased throughput and lower price.
  • Global Deployment – Global SKU
  • Data Zone Deployment – Geographic based (EU or US)
  • Regional Deployment – Local Region (up to 27 regions)

Esplora le opzioni per i prezzi

Applica i filtri per personalizzare le opzioni per i prezzi in base alle tue esigenze.

I prezzi sono solo stime e non sono da intendersi come quotazioni effettive. I prezzi effettivi possono variare a seconda del tipo di contratto stipulato con Microsoft, della data di acquisto e del tasso di cambio. I prezzi sono calcolati in dollari USA e convertiti in base ai tassi degli spot di chiusura di Londra acquisiti nei due giorni lavorativi precedenti l'ultimo giorno lavorativo della fine del mese precedente. Se i due giorni lavorativi precedenti la fine del mese cadono in un giorno festivo nei principali mercati, il giorno di riferimento del tasso è in genere il giorno immediatamente precedente ai due giorni lavorativi. Il tasso viene applicato a tutte le transazioni del mese successivo. Accedi al Calcolatore dei prezzi di Azure per visualizzare i prezzi in base al programma o all'offerta corrente con Microsoft. Contatta uno Specialista vendite di Azure per altre informazioni sui prezzi o per richiedere un preventivo. Vedi le domande frequenti sui prezzi di Azure.


o1 is the new reasoning model series for complex tasks. The model has 200K context and an October 2023 knowledge cutoff.

Model Pricing (1M Tokens)
o1 1217 Global Input: $-
Cached Input: $-
Output: $-
o1 1217 US/EU – Data Zones Input: $-
Cached Input: $-
Output: $-
o1 1217 Regional Input: $-
Cached Input: $-
Output: $-
o1 preview Global Input: $-
Cached Input: $-
Output: $-
o1 preview US/EU – Data Zones Input: $-
Cached Input: $-
Output: $-
o1 preview Regional Input: $-
Cached Input: $-
Output: $-

Plan with the Pricing Calculator

o1 Mini

o1-mini is a fast, cost-efficient reasoning model tailored to coding, math, and science use cases. The model has 128K context and an October 2023 knowledge cutoff.

Model Pricing (1M Tokens)
Global Input: $-
Cached Input: $-
Output: $-
US/EU – Data Zones Input: $-
Cached Input: $-
Output: $-
Regional Input: $-
Cached Input: $-
Output: $-

Plan with the Pricing Calculator

Realtime API

Featured in the Realtime API, the GPT-4o-Realtime-Preview supports multilingual speech-to-speech capabilities. Optimized for real-time, low-latency conversations, it enables natural interactions with minimal delay, ideal for chatbots and conversational AI.

Model Pricing (1M Tokens)
GPT-4o-Realtime-Preview-Global Text
Input: $-
Cached Input: $-
Output: $-

Input: $-
Cached Input: $-
Output: $-
GPT-4o-Realtime-Preview-US/EU – Data Zones Text
Input: $-
Cached Input: $-
Output: $-

Input: $-
Cached Input: $-
Output: $-
GPT-4o-Realtime-Preview-Regional Text
Input: $-
Cached Input: $-
Output: $-

Input: $-
Cached Input: $-
Output: $-

Chat Completions API - Coming soon

Featured in the Chat Completions API, the GPT 4o-Audio-Preview model processes and generates audio content. It supports advanced features like speech recognition and audio synthesis, ideal for asynchronous speech interactions and sentiment analysis. Cached input is coming soon.

Model Pricing (1M Tokens)
GPT-4o-Audio-Preview-Global Text
Input: $-
Cached Input: N/D
Output: $-

Input: $-
Cached Input: N/D
Output: $-


GPT-4o is the most advanced multimodal model that’s faster and cheaper than GPT-4 Turbo with stronger vision capabilities. The model has 128K context and an October 2023 knowledge cutoff.

Model Pricing (1M Tokens) Pricing with Batch API (1M Tokens)
GPT-4o-2024-1120 Global Input: $-
Cached Input: $-
Output: $-
Input: $-
Output: $-
GPT-4o-2024-1120 US/EU – Data Zones Input: $-
Cached Input: $-
Output: $-
Input: $-
Output: $-
GPT-4o-2024-1120 Regional Input: $-
Cached Input: $-
Output: $-
GPT-4o-2024-08-06 Global Input: $-
Cached Input: $-
Output: $-
Input: $-
Output: $-
GPT-4o-2024-08-06 US/EU – Data Zones Input: $-
Cached Input: $-
Output: $-
GPT-4o-2024-08-06 Regional Input: $-
Cached Input: $-
Output: $-
GPT-4o-2024-0513 Global Input: $-
Output: $-
Input: $-
Output: $-
GPT-4o-2024-0513 US/EU – Data Zones Input: $-
Output: $-
GPT-4o-2024-0513 Regional Input: $-
Output: $-

Plan with the Pricing Calculator

GPT-4o mini

GPT-4o mini is the most cost-efficient small model, and has vision capabilities. The model has 128K context and an October 2023 knowledge cutoff.

Model Pricing (1M Tokens) Pricing with Batch API (1M Tokens)
Global Input: $-
Cached Input: $-
Output: $-
Input: $-
Output: $-
US/EU – Data Zones Input: $-
Cached Input: $-
Output: $-
Regional Input: $-
Cached Input: $-
Output: $-

Plan with the Pricing Calculator


You can allocate and manage throughput for deployments, ensuring predictable performance and stable capacity. You are charged an hourly rate per model regardless of usage, but you can also secure additional savings through monthly and annual reservations. Discover how to transition your regional deployments and provisioned reservations to global and data zones on this Learn page.

Model Min PTUs PTU Hourly pricing PTU Monthly Reservation Pricing PTU Yearly Reservation Pricing
GPT-4o Global 15 $- $- $-
GPT-4o US/EU Data Zones 15 $- $- $-
GPT-4o Regional 50 $- $- $-
GPT-4o Mini Global 15 $- $- $-
GPT-4o Mini US/EU Data Zones 15 $- $- $-
GPT-4o Mini Regional 25 $- $- $-

Plan with the Pricing Calculator

Modelli base

Modelli Utilizzo per 1.000 token
Babbage-002 $-
Davinci-002 $-

Ottimizzazione dei modelli

Model Pricing
GPT-4o-2024-08-06 Regional Input: $- / 1M tokens
Cached Input: $- / 1M tokens
Output: $- / 1M tokens
Training: $- / 1M tokens
Hosting: $- / hour
Global Input: $- / 1M tokens
Cached Input: $- / 1M tokens
Output: $- / 1M tokens
Training: use regional
Hosting: $- / hour
GPT-4o-mini Regional Input: $- / 1M tokens
Cached Input: $- / 1M tokens
Output: $- / 1M tokens
Training: $- / 1M tokens
Hosting: $- / hour
Global Input: $- / 1M tokens
Cached Input: $- / 1M tokens
Output: $- / 1M tokens
Training: use regional
Hosting: $- / hour
GPT-4-0613 (8K) Regional Input: $- / 1M tokens
Output: $- / 1M tokens
Training: $- / 1M tokens
Hosting: $- / hour
GPT-3.5-Turbo (16 KB) Regional Input: $- / 1M tokens
Output: $- / 1M tokens
Training: $- / 1M tokens
Hosting: $- / hour
GPT-3.5-Turbo (4K) Regional Input: $- / 1M tokens
Output: $- / 1M tokens
Training: $- / 1M tokens
Hosting: $- / hour
Babbage-002 Input: $- / 1M tokens
Output: $- / 1M tokens
Training: $- / 1M tokens
Hosting: $- / hour
Davinci-002 Input: $- / 1M tokens
Output: $- / 1M tokens
Training: $- / 1M tokens
Hosting: $- / hour

Assistenti API

L'API Assistants e i relativi strumenti semplificano la creazione di assistenti per l'intelligenza artificiale nelle applicazioni.

I token usati per l'API Assistants vengono fatturati in base alle tariffe di input/output per token usate con ogni assistente. Inoltre, per l'utilizzo degli strumenti vengono addebitate le seguenti tariffe:

Strumento Input
Ricerca file* $-/GB di spazio di archiviazione vettoriale al giorno (1 GB gratuito)
Interprete di codice** $-/sessione

*GB fa riferimento a gigabyte binari, dove 1 GB è 2^30 byte.

**Se l'assistente chiama l'Interprete di codice contemporaneamente in due thread diversi, verranno create due sessioni dell'Interprete di codice (2 * $-). Ogni sessione è attiva per impostazione predefinita per un'ora, per cui se l'utente dà istruzioni all'interprete di codice nello stesso thread per un massimo di un'ora verrà effettuato un solo addebito.

Il costo di inferenza (input e output) varia in base al modello GPT usato con ogni assistente. Se l'assistente chiama l'interprete di codice contemporaneamente in due thread diversi, verranno create due sessioni dell'interprete di codice (2 * $-). Ogni sessione è attiva per un'ora per impostazione predefinita, quindi il prezzo si riferisce a un massimo di un'ora di istruzioni fornite all'interprete di codice nello stesso thread.

Modelli di immagine

Modelli Qualità Risoluzione Prezzo (per 100 immagini)
Dall-E-3 Standard 1024 * 1024 $-
Standard 1024 * 1792,
1792 * 1024
Dall-E-3 HD 1024 * 1024 $-
HD 1024 * 1792,
1792 * 1024
Dall-E-2 Standard 1024 * 1024 $-

Modelli di incorporazione

Modelli Per 1.000 token
Ada $-
text-embedding-3-large $-
text-embedding-3-small $-

Modelli conversione voce/testo

Modelli Prezzo
Whisper $-/ora
TTS (Sintesi vocale) $-/1 milione di caratteri
TTS HD $-/1 milione di caratteri

Modelli linguistici legacy

Modelli Contesto Input (Per 1M Tokens) Output (Per 1M Tokens)
GPT-3.5-Turbo-0301 4K $- $-
GPT-3.5-Turbo-0613 4K $- $-
GPT-3.5-Turbo-0613 16K $- $-
GPT-3.5-Turbo-1106 16K $- $-
GPT-3.5-Turbo-0125 16K $- $-
GPT-3.5-Turbo-Instruct 4K $- $-
GPT-4 Turbo 128K $- $-
GPT-4-Turbo-Vision 128K $- $-
GPT-4 8K $- $-
GPT-4 32K $- $-

Prezzi e opzioni di acquisto di Azure

Contattaci direttamente

Informazioni dettagliate sui prezzi di Azure. È possibile ottenere informazioni sui prezzi per la soluzione cloud e sull'ottimizzazione dei costi e richiedere una proposta personalizzata.

Comunica con uno specialista vendite

Scopri le modalità di acquisto

Acquista servizi di Azure tramite il sito Web di Azure, un rappresentante Microsoft o un partner di Azure.

Esplora le opzioni disponibili

Risorse aggiuntive

Servizio OpenAI di Azure

Scopri di più sulle funzionalità e sulle capacità di Servizio OpenAI di Azure.

Calcolatore prezzi

Stima i costi mensili previsti per qualsiasi combinazione dei prodotti di Azure.

Contratto di servizio

Esamina il Contratto di servizio per Servizio OpenAI di Azure.


Vedi esercitazioni tecniche, video e altre risorse di Servizio OpenAI di Azure.

  • Servizio OpenAI di Azure offre prezzi basati sia con pagamento in base al consumo che su unità elaborate con provisioning (PTU). Con pagamento in base al consumo consente di pagare per le risorse utilizzate, offrendo flessibilità per i carichi di lavoro variabili. PTU offre un modello di prezzo prevedibile in cui si riserva e si distribuisce una quantità specifica di capacità di elaborazione del modello. Questo modello è ideale per i carichi di lavoro con modelli di utilizzo costanti o prevedibili, garantendo stabilità e controllo dei costi.
  • Per altre informazioni sulle PTU e sui prezzi di Azure Open AI, leggi la documentazione PTU o contatta il nostro specialista delle vendite

Contatta uno specialista delle vendite per ottenere informazioni dettagliate sui prezzi di Azure. Verifica i prezzi per la tua soluzione cloud.

Ottieni servizi cloud gratuiti e $200 di credito per esplorare Azure per 30 giorni.

Aggiunto alla stima. Premi 'v' per visualizzare nel calcolatore
Serve aiuto?