Panoramica dei prezzi del Servizio OpenAI di Azure
Unlock the power of Azure OpenAI Service's generative AI models with flexible Standard (On-Demand) and Provisioned Throughput Units (PTUs). The Standard model lets you pay only for tokens processed, while PTUs ensure consistent throughput and minimal latency variance for scalable solutions. Pricing includes costs per 1,000 tokens, and PTU rates provide a predictable cost structure. Language models are also now available in the Batch API that returns completions within 24 hours for a 50% discount on Global Standard Pricing. Azure OpenAI Service offers advanced capabilities like GPT-4o, fine-tuning for customization, DALL-E for image generation, and Whisper for speech-to-text. For personalized guidance on optimizing AI deployments, contact a sales specialist.
Esplora le opzioni per i prezzi
Applica i filtri per personalizzare le opzioni per i prezzi in base alle tue esigenze.
I prezzi sono solo stime e non sono da intendersi come quotazioni effettive. I prezzi effettivi possono variare a seconda del tipo di contratto stipulato con Microsoft, della data di acquisto e del tasso di cambio. I prezzi sono calcolati in dollari USA e convertiti in base ai tassi degli spot di chiusura di Londra acquisiti nei due giorni lavorativi precedenti l'ultimo giorno lavorativo della fine del mese precedente. Se i due giorni lavorativi precedenti la fine del mese cadono in un giorno festivo nei principali mercati, il giorno di riferimento del tasso è in genere il giorno immediatamente precedente ai due giorni lavorativi. Il tasso viene applicato a tutte le transazioni del mese successivo. Accedi al Calcolatore dei prezzi di Azure per visualizzare i prezzi in base al programma o all'offerta corrente con Microsoft. Contatta uno Specialista vendite di Azure per altre informazioni sui prezzi o per richiedere un preventivo. Vedi le domande frequenti sui prezzi di Azure.
Gli enti del Governo degli Stati Uniti sono idonei per l'acquisto di servizi di Azure per enti pubblici da un provider LSP (Licensing Solution Provider) senza alcun impegno finanziario iniziale oppure direttamente tramite una sottoscrizione online con pagamento in base al consumo.
Importante: il prezzo R$ è semplicemente un riferimento. Si tratta di una transazione interna e il prezzo finale è soggetto ai tassi di cambio e all'aggiunta delle imposte sulle transazioni finanziarie. Non sarà rilasciato alcun documento eNF.
Gli enti del Governo degli Stati Uniti sono idonei per l'acquisto di servizi di Azure per enti pubblici da un provider LSP (Licensing Solution Provider) senza alcun impegno finanziario iniziale oppure direttamente tramite una sottoscrizione online con pagamento in base al consumo.
Importante: il prezzo R$ è semplicemente un riferimento. Si tratta di una transazione interna e il prezzo finale è soggetto ai tassi di cambio e all'aggiunta delle imposte sulle transazioni finanziarie. Non sarà rilasciato alcun documento eNF.
Dettagli sui prezzi:
Modelli linguistici
Modelli | Contesto | Input (Per 1,000,000 tokens) | Output (Per 1,000,000 tokens) | Prezzo per PTU all'ora | Incremento di ridimensionamento minimo | Prenotazione mensile per PTU | Prenotazione annuale per PTU |
---|---|---|---|---|---|---|---|
o1 preview Global Deployment | 128K | $- | $- | N/D | N/D | N/D | N/D |
o1 preview Regional API | 128K | $- | $- | N/D | N/D | N/D | N/D |
o1 mini Global Deployment | 128K | $- | $- | N/D | N/D | N/D | N/D |
o1 mini Regional API | 128K | $- | $- | N/D | N/D | N/D | N/D |
gpt-4o-2024-08-06 Global Deployment | 128K | $- | $- | N/D | N/D | N/D | N/D |
gpt-4o-2024-08-06 Regional API | 128K | $- | $- | N/D | N/D | N/D | N/D |
Distribuzione globale GPT-4o | 128K | $- | $- | $- | 50 PTU | $- | $- |
API di area GPT-4o | 128K | $- | $- | $- | 50 PTU | $- | $- |
Distribuzione globale GPT-4o-mini | 128K | $- | $- | $- | 25 PTU | $- | $- |
API GPT-4o-mini a livello di area | 128K | $- | $- | $- | 25 PTU | $- | $- |
Questa tabella fornisce un confronto dettagliato dei prezzi delle unità standard (su richiesta) e con provisioning (PTU) per diversi modelli linguistici. La colonna "Contesto" specifica il numero massimo di token che ogni modello può gestire per ogni risposta. Sono elencati i dettagli dei prezzi dei token di input e output, che rispecchiano il costo per 1.000 token. Il modello di prezzi delle PTU include una tariffa oraria e un incremento di ridimensionamento minimo, che rappresenta il numero minimo di PTU necessarie per ogni modello. Le colonne "Prenotazione mensile per PTU" e "Prenotazione annuale per PTU" indicano i costi di prenotazione per PTU. Questo confronto consente agli utenti di comprendere le implicazioni in termini di costo dell'uso di ogni modello in entrambe le opzioni di fatturazione standard (su richiesta) e con provisioning (PTU), in modo da prendere decisioni basate sulle specifiche esigenze di utilizzo.
Language models are also now available in the Batch API that returns completions within 24 hours for a 50% discount on Global Standard Pricing.
Modelli linguistici legacy
Modelli | Contesto | Input (Per 1,000,000 tokens) | Output (Per 1,000,000 tokens) |
---|---|---|---|
GPT-3.5-Turbo-0301 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 16K | $- | $- |
GPT-3.5-Turbo-1106 | 16K | $- | $- |
GPT-3.5-Turbo-0125 | 16K | $- | $- |
GPT-3.5-Turbo-Instruct | 4K | $- | $- |
GPT-4 Turbo | 128K | $- | $- |
GPT-4-Turbo-Vision | 128K | $- | $- |
GPT-4 | 8K | $- | $- |
GPT-4 | 32K | $- | $- |
Assistenti API
L'API Assistants e i relativi strumenti semplificano la creazione di assistenti per l'intelligenza artificiale nelle applicazioni.
I token usati per l'API Assistants vengono fatturati in base alle tariffe di input/output per token usate con ogni assistente. Inoltre, per l'utilizzo degli strumenti vengono addebitate le seguenti tariffe:
Strumento | Input |
---|---|
Ricerca file* | $-/GB di spazio di archiviazione vettoriale al giorno (1 GB gratuito) |
Interprete di codice** | $-/sessione |
*GB fa riferimento a gigabyte binari, dove 1 GB è 2^30 byte.
**Se l'assistente chiama l'Interprete di codice contemporaneamente in due thread diversi, verranno create due sessioni dell'Interprete di codice (2 * $-). Ogni sessione è attiva per impostazione predefinita per un'ora, per cui se l'utente dà istruzioni all'interprete di codice nello stesso thread per un massimo di un'ora verrà effettuato un solo addebito.
Il costo di inferenza (input e output) varia in base al modello GPT usato con ogni assistente. Se l'assistente chiama l'interprete di codice contemporaneamente in due thread diversi, verranno create due sessioni dell'interprete di codice (2 * $-). Ogni sessione è attiva per un'ora per impostazione predefinita, quindi il prezzo si riferisce a un massimo di un'ora di istruzioni fornite all'interprete di codice nello stesso thread.
Modelli base
Modelli | Utilizzo per 1.000 token |
---|---|
Babbage-002 | $- |
Davinci-002 | $- |
Ottimizzazione dei modelli
Modelli | Training per 1.000 token | Hosting all'ora | Utilizzo input per 1.000 token | Utilizzo output per 1.000 token |
---|---|---|---|---|
Babbage-002 | $- | $- | $- | $- |
Davinci-002 | $- | $- | $- | $- |
GPT-3.5-Turbo (4K) | $- | $- | $- | $- |
GPT-3.5-Turbo (16 KB) | $- | $- | $- | $- |
GPT-4 (8K) | $- | $- | $- | $- |
GPT-4o | $- | $- | $- | $- |
GPT-4o-mini | $- | $- | $- | $- |
Modelli di immagine
Modelli | Qualità | Risoluzione | Prezzo (per 100 immagini) |
---|---|---|---|
Dall-E-3 | Standard | 1024 * 1024 | $- |
Standard | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-3 | HD | 1024 * 1024 | $- |
HD | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-2 | Standard | 1024 * 1024 | $- |
Modelli di incorporazione
Modelli | Per 1.000 token |
---|---|
Ada | $- |
text-embedding-3-large | $- |
text-embedding-3-small | $- |
Modelli conversione voce/testo
Modelli | Prezzo |
---|---|
Whisper | $-/ora |
TTS (Sintesi vocale) | $-/1 milione di caratteri |
TTS HD | $-/1 milione di caratteri |
Prezzi e opzioni di acquisto di Azure
Contattaci direttamente
Informazioni dettagliate sui prezzi di Azure. È possibile ottenere informazioni sui prezzi per la soluzione cloud e sull'ottimizzazione dei costi e richiedere una proposta personalizzata.
Comunica con uno specialista venditeScopri le modalità di acquisto
Acquista servizi di Azure tramite il sito Web di Azure, un rappresentante Microsoft o un partner di Azure.
Esplora le opzioni disponibiliRisorse aggiuntive
Servizio OpenAI di Azure
Scopri di più sulle funzionalità e sulle capacità di Servizio OpenAI di Azure.
Calcolatore prezzi
Stima i costi mensili previsti per qualsiasi combinazione dei prodotti di Azure.
Contratto di servizio
Esamina il Contratto di servizio per Servizio OpenAI di Azure.
Documentazione
Vedi esercitazioni tecniche, video e altre risorse di Servizio OpenAI di Azure.
Domande frequenti
-
Servizio OpenAI di Azure offre prezzi basati sia con pagamento in base al consumo che su unità elaborate con provisioning (PTU). Con pagamento in base al consumo consente di pagare per le risorse utilizzate, offrendo flessibilità per i carichi di lavoro variabili. PTU offre un modello di prezzo prevedibile in cui si riserva e si distribuisce una quantità specifica di capacità di elaborazione del modello. Questo modello è ideale per i carichi di lavoro con modelli di utilizzo costanti o prevedibili, garantendo stabilità e controllo dei costi.
-
Per altre informazioni sulle PTU e sui prezzi di Azure Open AI, leggi la documentazione PTU o contatta il nostro specialista delle vendite
Contatta uno specialista delle vendite per ottenere informazioni dettagliate sui prezzi di Azure. Verifica i prezzi per la tua soluzione cloud.
Ottieni servizi cloud gratuiti e $200 di credito per esplorare Azure per 30 giorni.