Descrição geral dos preços do Azure OpenAI Service
Para ajudar os clientes nesta viagem, oferecemos soluções de gestão de preços e custos para satisfazer as suas necessidades, incluindo:
- Standard (A Pedido): Pague conforme o uso para tokens de entrada e saída.
- Aprovisionado (PTUs): Atribuir o rendimento com custos previsíveis, com reservas mensais e anuais disponíveis para reduzir os gastos gerais.
- API em lote: Os modelos de idiomas também estão agora disponíveis na API em lote para implantações globais e três regiões, que retorna conclusões dentro de 24 horas com um desconto de 50% no preço padrão global.
- Implementação Global – SKU Global
- Implementação da zona de dados – Geographic based (EU or US)
- Implementação Regional – Região Local (até 27 regiões)
Explorar opções de preços
Aplique filtros para personalizar as opções de preços à medida das suas necessidades.
Os preços são apenas estimativas e não propostas de preços reais. Os preços reais podem variar dependendo do tipo de contrato que foi estipulado com a Microsoft, da data de compra e da taxa de câmbio. Os preços são calculados com base em dólares americanos e convertidos com as taxas de encerramento de Londres que são capturadas nos dois dias úteis anteriores ao último dia útil do fim do mês anterior. Se os dois dias úteis anteriores ao fim do mês calharem num feriado nos principais mercados, o dia de definição da taxa é geralmente o dia imediatamente anterior aos dois dias úteis. Esta taxa aplica-se a todas as transações durante o mês seguinte. Inicie sessão na calculadora de preços do Azure para ver os preços com base no seu programa/oferta atual com a Microsoft. Contacte um especialista de vendas do Azure para obter mais informações sobre preços ou para pedir um orçamento de preço. Consulte as perguntas mais frequentes sobre os preços do Azure.
As entidades públicas dos E.U.A. são elegíveis para comprar serviços do Azure Government junto de um fornecedor de soluções de licenciamento sem compromisso financeiro inicial ou diretamente através de uma subscrição online pay as you go.
Importante — o preço em € é meramente uma referência; esta é uma transação internacional, pelo que o preço final está sujeito a taxas de câmbio e à inclusão de impostos sobre operações financeiras. Não será emitido um eNF.
As entidades públicas dos E.U.A. são elegíveis para comprar serviços do Azure Government junto de um fornecedor de soluções de licenciamento sem compromisso financeiro inicial ou diretamente através de uma subscrição online pay as you go.
Importante — o preço em € é meramente uma referência; esta é uma transação internacional, pelo que o preço final está sujeito a taxas de câmbio e à inclusão de impostos sobre operações financeiras. Não será emitido um eNF.
o1
o1 é a nova série de modelos de raciocínio para tarefas complexas. O modelo tem contexto 200 mil tokens e um horizonte de conhecimento até outubro de 2023.
Modelo | Preços (1 milhão de Tokens) | Preços com a API do Batch (1 milhão de Tokens) |
---|---|---|
o1 2024-12-17 Global |
Entrada: $- Entrada em Cache: $- Saída: $- |
N/A |
o1 2024-12-17 US/EU – Data Zones |
Entrada: $- Entrada em Cache: $- Saída: $- |
N/A |
o1 2024-12-17 Regional |
Entrada: $- Entrada em Cache: $- Saída: $- |
N/A |
o1 preview 2024-09-12 Global |
Entrada: $- Entrada em Cache: $- Saída: $- |
N/A |
o1 preview 2024-09-12 US/EU – Data Zones |
Entrada: $- Entrada em Cache: $- Saída: $- |
N/A |
o1 preview 2024-09-12 Regional |
Entrada: $- Entrada em Cache: $- Saída: $- |
N/A |
Planeie com a Calculadora de Preços
o3 Mini
The o3 mini is the updated version of o1 mini model. o3-mini is a fast, cost-efficient reasoning model tailored to coding, math, and science use cases.
The o3-mini model now boasts an expanded context input window of 200K tokens and a maximum output of 100K tokens, providing ample space for complex and detailed responses. The o1 mini model has 128K context input. Both o3 and o1 models have a knowledge cutoff of October 2023.
Modelo | Preços (1 milhão de Tokens) | Preços com a API do Batch (1 milhão de Tokens) |
---|---|---|
o3 mini 2025-01-31 Global |
Entrada: $- Entrada em Cache: $- Saída: $- |
Entrada: $- Saída: $- |
o3 mini 2025-01-31-US/EU – Data Zones |
Entrada: $- Entrada em Cache: $- Saída: $- |
Entrada: $- Saída: $- |
o3 mini 2025-01-31 Regional |
Entrada: $- Entrada em Cache: $- Saída: $- |
N/A |
o1-mini 2024-09-12 Global |
Entrada: $- Entrada em Cache: $- Saída: $- |
N/A |
o1-mini 2024-09-12 US/EU – Data Zones |
Entrada: $- Entrada em Cache: $- Saída: $- |
N/A |
o1-mini 2024-09-12 Regional |
Entrada: $- Entrada em Cache: $- Saída: $- |
N/A |
Planeie com a Calculadora de Preços
API em tempo real
Featured in the Realtime API, the GPT-4o-Realtime-Preview supports multilingual speech-to-speech capabilities. Optimized for real-time, low-latency conversations, it enables natural interactions with minimal delay, ideal for chatbots and conversational AI. GPT-4o is the comprehensive, more powerful version designed for complex tasks, while GPT-4o Mini is a smaller, more affordable option ideal for simpler applications where cost-efficiency and speed are priorities.
Modelo | Preços (1 milhão de Tokens) |
---|---|
GPT-4o-Realtime-Preview-2024-12-17-Global |
Texto Entrada: $- Entrada em Cache: $- Saída: $- Áudio Entrada: $- Entrada em Cache: $- Saída: $- |
GPT-4o-Realtime-Preview-2024-12-17-US/EU – Data Zones |
Texto Entrada: $- Entrada em Cache: $- Saída: $- Áudio Entrada: $- Entrada em Cache: $- Saída: $- |
GPT-4o-Realtime-Preview-2024-12-17-Regional |
Texto Entrada: $- Entrada em Cache: $- Saída: $- Áudio Entrada: $- Entrada em Cache: $- Saída: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global |
Texto Entrada: $- Entrada em Cache: $- Saída: $- Áudio Entrada: $- Entrada em Cache: $- Saída: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU – Data Zones |
Texto Entrada: $- Entrada em Cache: $- Saída: $- Áudio Entrada: $- Entrada em Cache: $- Saída: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional |
Texto Entrada: $- Entrada em Cache: $- Saída: $- Áudio Entrada: $- Entrada em Cache: $- Saída: $- |
GPT-4o-Realtime-Preview-2024-10-01-Global |
Texto Entrada: $- Entrada em Cache: $- Saída: $- Áudio Entrada: $- Entrada em Cache: $- Saída: $- |
GPT-4o-Realtime-Preview-2024-10-01-US/EU – Data Zones |
Texto Entrada: $- Entrada em Cache: $- Saída: $- Áudio Entrada: $- Entrada em Cache: $- Saída: $- |
GPT-4o-Realtime-Preview-2024-10-01-Regional |
Texto Entrada: $- Entrada em Cache: $- Saída: $- Áudio Entrada: $- Entrada em Cache: $- Saída: $- |
Chat Completions API
Featured in the Chat Completions API, the GPT 4o-Audio-Preview model processes and generates audio content. It supports advanced features like speech recognition and audio synthesis, ideal for asynchronous speech interactions and sentiment analysis. GPT-4o is the comprehensive, more powerful version designed for complex tasks, while GPT-4o Mini is a smaller, more affordable option ideal for simpler applications where cost-efficiency and speed are priorities.
Modelo | Preços (1 milhão de Tokens) |
---|---|
GPT-4o-Audio-Preview-2024-12-17-Global |
Texto Entrada: $- Saída: $- Áudio Entrada: $- Saída: $- |
GPT-4o-Audio-Preview-2024-12-17-US/EU – Data Zones |
Texto Entrada: $- Saída: $- Áudio Entrada: $- Saída: $- |
GPT-4o-Audio-Preview-2024-12-17-Regional |
Texto Entrada: $- Saída: $- Áudio Entrada: $- Saída: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Global |
Texto Entrada: $- Saída: $- Áudio Entrada: $- Saída: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU – Data Zones |
Texto Entrada: $- Saída: $- Áudio Entrada: $- Saída: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional |
Texto Entrada: $- Saída: $- Áudio Entrada: $- Saída: $- |
GPT-4o
O GPT-4o é o modelo multimodal mais avançado, mais rápido e mais barato do que o GPT-4 Turbo, com capacidades de visão mais fortes. O modelo tem contexto 128K e um limite de conhecimento de outubro de 2023.
Modelo | Preços (1 milhão de Tokens) | Preços com a API do Batch (1 milhão de Tokens) |
---|---|---|
GPT-4o-2024-1120 Global |
Entrada: $- Entrada em Cache: $- Saída: $- |
Entrada: $- Saída: $- |
GPT-4o-2024-1120 EUA/UE – Zonas de Dados |
Entrada: $- Entrada em Cache: $- Saída: $- |
Entrada: $- Saída: $- |
GPT-4o-2024-1120 Regional |
Entrada: $- Entrada em Cache: $- Saída: $- |
N/A |
GPT-4o-2024-08-06 Global |
Entrada: $- Entrada em Cache: $- Saída: $- |
Entrada: $- Saída: $- |
GPT-4o-2024-08-06 EUA/UE – Zonas de Dados |
Entrada: $- Entrada em Cache: $- Saída: $- |
Entrada: $- Saída: $- |
GPT-4o-2024-08-06 Regional |
Entrada: $- Entrada em Cache: $- Saída: $- |
N/A |
GPT-4o-2024-0513 Global |
Entrada: $- Saída: $- |
Entrada: $- Saída: $- |
GPT-4o-2024-0513 EUA/UE – Zonas de Dados |
Entrada: $- Saída: $- |
N/A |
GPT-4o-2024-0513 Regional |
Entrada: $- Saída: $- |
N/A |
Planeie com a Calculadora de Preços
GPT-4o-mini
O GPT-4o mini é o modelo pequeno mais económico e tem capacidades de visão. O modelo tem contexto 128K e um limite de conhecimento de outubro de 2023.
Modelo | Preços (1 milhão de Tokens) | Preços com a API do Batch (1 milhão de Tokens) |
---|---|---|
GPT-4o-mini-0718 Global |
Entrada: $- Entrada em Cache: $- Saída: $- |
Entrada: $- Saída: $- |
GPT-4o-mini-0718 US/EU – Data Zones |
Entrada: $- Entrada em Cache: $- Saída: $- |
Entrada: $- Saída: $- |
GPT-4o-mini-0718 Regional |
Entrada: $- Entrada em Cache: $- Saída: $- |
N/A |
Planeie com a Calculadora de Preços
Aprovisionado
Pode alocar e gerir o débito para implementações, garantindo um desempenho previsível e uma capacidade estável. É-lhe cobrada uma taxa horária por modelo, independentemente da utilização, mas também pode garantir poupanças adicionais através de reservas mensais e anuais. Descubra como fazer a transição das suas implementações regionais e reservas aprovisionadas para zonas globais e de dados nesta página do Learn.
Modelo | PTUs mín. | Preços da PTU por hora | Preços de Reserva Mensal ptu | Preços de Reserva Anual PTU |
---|---|---|---|---|
GPT-4o Global | 15 | $- | $- | $- |
GPT-4o Zonas de dados dos EUA/UE | 15 | $- | $- | $- |
GPT-4o Regional | 50 | $- | $- | $- |
Fine-Tuned GPT-4o-Regional | 50 | $- | $- | $- |
GPT-4o Mini Global | 15 | $- | $- | $- |
Zonas de Dados GPT-4o Mini EUA/UE | 15 | $- | $- | $- |
GPT-4o Mini Regional | 25 | $- | $- | $- |
Fine-Tuned GPT-4o-Mini Regional | 25 | $- | $- | $- |
Planeie com a Calculadora de Preços
Modelos base
Modelos | Utilização por 1000 tokens |
---|---|
Babbage-002 | $- |
Davinci-002 | $- |
Modelos de ajuste
Modelo | Preços | |
---|---|---|
GPT-4o-2024-08-06 | Regional |
Entrada: $-/1M tokens Entrada em Cache: $-/1M tokens Saída: $-/1M tokens Formação: $-/1M tokens Alojamento: $-/hour |
Global |
Entrada: $-/1M tokens Entrada em Cache: $-/1M tokens Saída: $-/1M tokens Formação: utilizar regional Alojamento: $-/hour |
|
GPT-4o-mini | Regional |
Entrada: $-/1M tokens Entrada em Cache: $-/1M tokens Saída: $-/1M tokens Formação: $-/1M tokens Alojamento: $-/hour |
Global |
Entrada: $-/1M tokens Entrada em Cache: $-/1M tokens Saída: $-/1M tokens Formação: utilizar regional Alojamento: $-/hour |
|
GPT-4-0613 (8K) | Regional |
Entrada: $-/1M tokens Saída: $-/1M tokens Formação: $-/1M tokens Alojamento: $-/hour |
GPT-3.5-Turbo (16K) | Regional |
Entrada: $-/1M tokens Saída: $-/1M tokens Formação: $-/1M tokens Alojamento: $-/hour |
GPT-3.5-Turbo (4K) | Regional |
Entrada: $-/1M tokens Saída: $-/1M tokens Formação: $-/1M tokens Alojamento: $-/hour |
Babbage-002 |
Entrada: $-/1M tokens Saída: $-/1M tokens Formação: $-/1M tokens Alojamento: $-/hour |
|
Davinci-002 |
Entrada: $-/1M tokens Saída: $-/1M tokens Formação: $-/1M tokens Alojamento: $-/hour |
API de Assistentes
A API de Assistentes e as suas ferramentas facilitam aos programadores a criação de assistentes de IA nas suas aplicações.
Os tokens utilizados para a API dos Assistentes são de acordo com as taxas de entrada/saída de tokens do modelo linguístico escolhido utilizado com cada Assistente. Além disso, cobramos as seguintes taxas pela utilização da ferramenta:
Ferramenta | Entrada |
---|---|
Pesquisa de Ficheiros* | $-/GB de armazenamento de vetores por dia (1 GB gratuito) |
Intérprete de código** | $-/sessão |
*GB refere-se a gigabytes binários, em que 1 gb é 2^30 bytes.
**Se o seu assistente chamar o Intérprete de Código simultaneamente em dois threads diferentes, isto criaria duas sessões de Intérprete de Código (2 * $-). Cada sessão está ativa por predefinição durante uma hora, o que significa que só pagaria esta taxa uma vez, se o seu utilizador continuar a dar instruções ao Intérprete de Código no mesmo thread até uma hora.
O custo de inferência (entrada e saída) varia com base no modelo GPT utilizado com cada Assistente. Se o seu assistente efetuar chamadas ao Intérprete de Código simultaneamente em dois threads diferentes, tal criaria duas sessões de Intérprete de Código (2 * $-). Por predefinição, cada sessão está ativa durante uma hora, o que significa que o preço é para uma hora de instruções ao Intérprete de Código na mesma thread.
Modelos de imagem
Modelos | Qualidade | Resolução | Preço (por 100 imagens) |
---|---|---|---|
Dall-E-3 | Standard | 1024 * 1024 | $- |
Standard | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-3 | HD | 1024 * 1024 | $- |
HD | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-2 | Standard | 1024 * 1024 | $- |
Modelos de incorporação
Modelos | Por 1000 tokens |
---|---|
Ada | $- |
text-embedding-3-large | $- |
text-embedding-3-small | $- |
Modelos de Voz
Modelos | Preço |
---|---|
Whisper | $-/hora |
TTS (Conversão de Texto em Voz) | $-/1 milhão de carateres |
TTS HD | $-/1 milhão de carateres |
Modelos de Linguagem Legados
Modelos | Contexto | Entrada (Por 1 milhão de Tokens) | Saída (Por 1 milhão de Tokens) |
---|---|---|---|
GPT-3.5-Turbo-0301 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 16K | $- | $- |
GPT-3.5-Turbo-1106 | 16K | $- | $- |
GPT-3.5-Turbo-0125 | 16K | $- | $- |
GPT-3.5-Turbo-Instruct | 4K | $- | $- |
GPT-4-Turbo | 128K | $- | $- |
GPT-4-Turbo-Vision | 128K | $- | $- |
GPT-4 | 8K | $- | $- |
GPT-4 | 32K | $- | $- |
Preços e opções de compra do Azure

Entre em contacto direto connosco
Obtenha uma orientação dos preços do Azure. Compreenda os preços da sua solução cloud, saiba mais sobre a otimização de custos e solicite uma proposta personalizada.
Fale com um especialista em vendasVeja as formas de compra
Compre serviços do Azure através do site do Azure, de um representante da Microsoft ou de um parceiro do Azure.
Explore as suas opçõesRecursos adicionais
Serviço OpenAI do Azure
Saiba mais sobre as funcionalidades e capacidades do Serviço OpenAI do Azure.
Calculadora de preços
Faça uma estimativa dos seus custos mensais para utilizar qualquer combinação de produtos do Azure.
SLA
Reveja o Contrato de Nível de Serviço para Serviço OpenAI do Azure.
Documentação
Reveja tutoriais técnicos, vídeos e mais Serviço OpenAI do Azure recursos.
Perguntas mais frequentes
-
O Azure OpenAI Service oferece preços baseados em Unidades de Débito Aprovisionadas (PTUs) e Pay As You Go. O Pay As You Go permite-lhe pagar os recursos que consome, sendo assim mais flexível para cargas de trabalho variáveis. As PTUs oferecem um modelo de preços previsível onde reserva e implementa uma quantidade específica de capacidade de processamento de modelos. Este modelo é ideal para cargas de trabalho com padrões de utilização consistentes ou previsíveis, proporcionando estabilidade e controlo de custos.
-
To learn more about PTUs and Azure OpenAI pricing please read PTU documentation or contact our sales specialist.
Fale com um especialista em vendas para obter uma descrição detalhada dos preços do Azure. Compreenda os preços da sua solução cloud.
Obtenha serviços cloud gratuitos e um crédito de $200 para explorar o Azure durante 30 dias.