Avançar para o conteúdo principal
Azure

Preços de Serviço OpenAI do Azure

Descrição geral dos preços do Azure OpenAI Service

O Azure OpenAI Service fornece IA generativa pronta para empresas com modelos poderosos da OpenAI, o que permite às organizações inovar com capacidades de texto, áudio e visão. Para além dos modelos de ponta, as empresas escolhem o Azure OpenAI Service para assegurar a privacidade de dados incorporada, flexibilidade de área/regional/global e integração totalmente integrada no ecossistema do Azure, incluindo o Fabric, Cosmos DB e Pesquisa de IA do Azure. Empresas de todos os tamanhos podem dimensionar com confiança as soluções de IA para melhorar a experiência do cliente, automatizar fluxos de trabalho e desbloquear o potencial criativo, gerando um impacto mensurável e uma diferenciação competitiva.

Para ajudar os clientes nesta viagem, oferecemos soluções de gestão de preços e custos para satisfazer as suas necessidades, incluindo:
  • Standard (A Pedido): modelo pay as you go para tokens de entrada e saída.
  • Aprovisionado (PTUs): atribua débito com custos previsíveis, com reservas mensais e anuais disponíveis para reduzir os gastos gerais.
  • API em Lote: os modelos de linguagem também estão agora disponíveis na API em Lote para implementações globais e três regiões, que devolve conclusões no prazo de 24 horas por um desconto de 50% no Preço Standard Global.
Pode escolher de entre os seguintes tipos de implementação para Standard e Aprovisionado, que permitem uma maior flexibilidade e controlo dos preços e do desempenho. Esta flexibilidade é útil quando os limites do processamento de dados são cada vez mais restritivos e é necessário aumentar o débito e baixar o preço.
  • Implementação Global – SKU Global
  • Implementação da Zona de Dados – Base Geográfica (Europa ou Estados Unidos)
  • Implementação Regional – Região Local (até 27 regiões)

Explorar opções de preços

Aplique filtros para personalizar as opções de preços à medida das suas necessidades.

Os preços são apenas estimativas e não propostas de preços reais. Os preços reais podem variar dependendo do tipo de contrato que foi estipulado com a Microsoft, da data de compra e da taxa de câmbio. Os preços são calculados com base em dólares americanos e convertidos com as taxas de encerramento de Londres que são capturadas nos dois dias úteis anteriores ao último dia útil do fim do mês anterior. Se os dois dias úteis anteriores ao fim do mês calharem num feriado nos principais mercados, o dia de definição da taxa é geralmente o dia imediatamente anterior aos dois dias úteis. Esta taxa aplica-se a todas as transações durante o mês seguinte. Inicie sessão na calculadora de preços do Azure para ver os preços com base no seu programa/oferta atual com a Microsoft. Contacte um especialista de vendas do Azure para obter mais informações sobre preços ou para pedir um orçamento de preço. Consulte as perguntas mais frequentes sobre os preços do Azure.

o3

o3 is a powerful reasoning model from the o-series of reasoning models, pushing the frontier across coding, math, science, and visual perception. It excels in complex queries requiring multi-faceted analysis and performs strongly in visual tasks like analyzing images, charts, and graphics. The model features a 200K token context window and has a knowledge cutoff of June 2024.

Modelo Preços (1 milhão de Tokens) Preços com a API do Batch (1 milhão de Tokens)
o3 2025-04-16 Entrada: $-
Entrada em Cache: $-
Saída: $-
N/A

o4-mini

o4-mini is a compact, efficient, and cost-effective reasoning model from OpenAI's o-series. It excels in math, coding, and visual tasks. The model features a 200K token context window and has a knowledge cutoff of June 2024.

Modelo Preços (1 milhão de Tokens) Preços com a API do Batch (1 milhão de Tokens)
o4-mini 2025-04-16 Entrada: $-
Entrada em Cache: $-
Saída: $-
N/A

GPT-4.1 series

GPT-4.1 series is a highly advanced general-purpose model with extensive world knowledge and an enhanced ability to understand user intent, making it particularly adept at creative tasks and agentic planning. The series features a 1 million token context window and has a knowledge cutoff of June 2024.

Modelo Preços (1 milhão de Tokens) Preços com a API do Batch (1 milhão de Tokens)
GPT-4.1-2025-04-14 Entrada: $-
Entrada em Cache: $-
Saída: $-
N/A
GPT-4.1-mini-2025-04-14 Entrada: $-
Entrada em Cache: $-
Saída: $-
N/A
GPT-4.1-nano-2025-04-14 Entrada: $-
Entrada em Cache: $-
Saída: $-
N/A

GPT-4.5

O GPT-4.5-preview é o mais recente modelo para fins gerais com um profundo conhecimento do mundo e uma melhor compreensão da intenção do utilizador, o que o torna eficaz em tarefas criativas e planeamento autónomo. O modelo tem um contexto 128K e um limite de conhecimento até outubro de 2023.

Modelo Preços (1 milhão de Tokens) Preços com a API do Batch (1 milhão de Tokens)
GPT-4.5-Preview-2025-02-27 Global Entrada: $-
Entrada em Cache: $-
Saída: $-
N/A

o1

o1 é a nova série de modelos de raciocínio para tarefas complexas. O modelo tem contexto 200 mil tokens e um horizonte de conhecimento até outubro de 2023.

Modelo Preços (1 milhão de Tokens) Preços com a API do Batch (1 milhão de Tokens)
o1 2024-12-17 Global Entrada: $-
Entrada em Cache: $-
Saída: $-
N/A
o1 2024-12-17 US/EU – Zonas de Dados Entrada: $-
Entrada em Cache: $-
Saída: $-
N/A
o1 2024-12-17 Regional Entrada: $-
Entrada em Cache: $-
Saída: $-
N/A
o1 preview 2024-09-12 Global Entrada: $-
Entrada em Cache: $-
Saída: $-
N/A
o1 preview 2024-09-12 US/EU – Zonas de Dados Entrada: $-
Entrada em Cache: $-
Saída: $-
N/A
o1 preview 2024-09-12 Regional Entrada: $-
Entrada em Cache: $-
Saída: $-
N/A

Planeie com a Calculadora de Preços

o3 Mini

O o3 mini é a versão atualizada do modelo o1 mini. O o3-mini é um modelo de raciocínio rápido e eficiente em termos de custos, adaptado a casos de uso de programação, matemática e ciência.

O modelo o3-mini dispõe agora de uma janela de entrada de contexto expandida para 200 mil tokens e uma saída máxima de 100 mil tokens, proporcionando espaço amplo para respostas complexas e detalhadas. O modelo o1 mini tem uma entrada de contexto de 128 mil tokens. Os modelos o3 e o1 têm um limite de conhecimento até outubro de 2023.

Modelo Preços (1 milhão de Tokens) Preços com a API do Batch (1 milhão de Tokens)
o3 mini 2025-01-31 Global Entrada: $-
Entrada em Cache: $-
Saída: $-
Entrada: $-
Saída: $-
o3 mini 2025-01-31-US/EU – Zonas de Dados Entrada: $-
Entrada em Cache: $-
Saída: $-
Entrada: $-
Saída: $-
o3 mini 2025-01-31 Regional Entrada: $-
Entrada em Cache: $-
Saída: $-
N/A
o1-mini 2024-09-12 Global Entrada: $-
Entrada em Cache: $-
Saída: $-
N/A
o1-mini 2024-09-12 US/EU – Zonas de Dados Entrada: $-
Entrada em Cache: $-
Saída: $-
N/A
o1-mini 2024-09-12 Regional Entrada: $-
Entrada em Cache: $-
Saída: $-
N/A

Planeie com a Calculadora de Preços

Agente de Utilização de Computador (CUA)

O Agente de Utilização de Computador (CUA) é um modelo de IA especializado que permite à IA interagir com interfaces gráficas de utilizador (GUIs), navegar em aplicações e automatizar tarefas de múltiplos passos, tudo através de instruções em linguagem natural. O modelo CUA pode ser utilizado como uma ferramenta na API de Respostas.

Modelo Preços
pré-visualização de utilização de computador Global Entrada: $-/1 milhão de tokens
Saída: $-/1 milhão de tokens

Ferramentas integradas

A API de Respostas e a API de Assistentes permitem uma interação fluida com ferramentas como a utilização do computador, o intérprete de código, a chamada de funções e a pesquisa de ficheiros, facilitando a criação de agentes de IA pelos programadores.

Ferramenta Entrada
Utilização do Computador (apenas API de Respostas) Entrada: $-/1 milhão de tokens
Saída: $-/1 milhão de tokens
Chamada da Ferramenta de Pesquisa de Ficheiros (apenas API de Respostas) $-/1000 chamadas de ferramentas
Pesquisa de Ficheiros* $-/GB de armazenamento de vetores por dia (1 GB gratuito)
Intérprete de código** $-/sessão

*GB refere-se a gigabytes binários, em que 1 gb é 2^30 bytes.

**Se o seu assistente chamar o Intérprete de Código simultaneamente em dois threads diferentes, isto criaria duas sessões de Intérprete de Código (2 * $-). Cada sessão está ativa por predefinição durante uma hora, o que significa que só pagaria esta taxa uma vez, se o seu utilizador continuar a dar instruções ao Intérprete de Código no mesmo thread até uma hora.

O custo de inferência (entrada e saída) varia com base no modelo GPT utilizado com cada Assistente. Se o seu assistente efetuar chamadas ao Intérprete de Código simultaneamente em dois threads diferentes, tal criaria duas sessões de Intérprete de Código (2 * $-). Por predefinição, cada sessão está ativa durante uma hora, o que significa que o preço é para uma hora de instruções ao Intérprete de Código na mesma thread.

API em tempo real

Em destaque na API em Tempo Real, o GPT-4o-Realtime-Preview suporta capacidades multilingues de conversão de voz em voz. Otimizado para conversas em tempo real e de baixa latência, permite interações naturais com um atraso mínimo, ideal para chatbots e IA de conversação. O GPT-4o é a versão abrangente e mais poderosa, concebida para tarefas complexas, enquanto o GPT-4o Mini é uma opção mais compacta e acessível, ideal para aplicações mais simples onde a eficiência de custos e a velocidade são prioridades.

Modelo Preços (1 milhão de Tokens)
GPT-4o-Realtime-Preview-2024-12-17-Global Texto
Entrada: $-
Entrada em Cache: $-
Saída: $-

Áudio
Entrada: $-
Entrada em Cache: $-
Saída: $-
GPT-4o-Realtime-Preview-2024-12-17-USA/UE – Zonas de Dados Texto
Entrada: $-
Entrada em Cache: $-
Saída: $-

Áudio
Entrada: $-
Entrada em Cache: $-
Saída: $-
GPT-4o-Realtime-Preview-2024-12-17-Regional Texto
Entrada: $-
Entrada em Cache: $-
Saída: $-

Áudio
Entrada: $-
Entrada em Cache: $-
Saída: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global Texto
Entrada: $-
Entrada em Cache: $-
Saída: $-

Áudio
Entrada: $-
Entrada em Cache: $-
Saída: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-USA/UE – Zonas de Dados Texto
Entrada: $-
Entrada em Cache: $-
Saída: $-

Áudio
Entrada: $-
Entrada em Cache: $-
Saída: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional Texto
Entrada: $-
Entrada em Cache: $-
Saída: $-

Áudio
Entrada: $-
Entrada em Cache: $-
Saída: $-
GPT-4o-Realtime-Preview-2024-10-01-Global Texto
Entrada: $-
Entrada em Cache: $-
Saída: $-

Áudio
Entrada: $-
Entrada em Cache: $-
Saída: $-
GPT-4o-Realtime-Preview-2024-10-01-USA/UE – Zonas de Dados Texto
Entrada: $-
Entrada em Cache: $-
Saída: $-

Áudio
Entrada: $-
Entrada em Cache: $-
Saída: $-
GPT-4o-Realtime-Preview-2024-10-01-Regional Texto
Entrada: $-
Entrada em Cache: $-
Saída: $-

Áudio
Entrada: $-
Entrada em Cache: $-
Saída: $-

API de Conclusão de Conversas

Em destaque na API de Conclusões de Conversas, o modelo GPT 4o-Audio-Preview processa e gera conteúdo áudio. Suporta funcionalidades avançadas como reconhecimento de voz e síntese de áudio, ideais para interações de voz assíncronas e análise de sentimentos. O GPT-4o é a versão abrangente e mais poderosa, concebida para tarefas complexas, enquanto o GPT-4o Mini é uma opção mais compacta e acessível, ideal para aplicações mais simples onde a eficiência de custos e a velocidade são prioridades.

Modelo Preços (1 milhão de Tokens)
GPT-4o-Audio-Preview-2024-12-17-Global Texto
Entrada: $-
Saída: $-

Áudio
Entrada: $-
Saída: $-
GPT-4o-Audio-Preview-2024-12-17-USA/UE – Zonas de Dados Texto
Entrada: $-
Saída: $-

Áudio
Entrada: $-
Saída: $-
GPT-4o-Audio-Preview-2024-12-17-Regional Texto
Entrada: $-
Saída: $-

Áudio
Entrada: $-
Saída: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Global Texto
Entrada: $-
Saída: $-

Áudio
Entrada: $-
Saída: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-USA/UE – Zonas de Dados Texto
Entrada: $-
Saída: $-

Áudio
Entrada: $-
Saída: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional Texto
Entrada: $-
Saída: $-

Áudio
Entrada: $-
Saída: $-

GPT-4o

O GPT-4o é o modelo multimodal mais avançado, mais rápido e mais barato do que o GPT-4 Turbo, com capacidades de visão mais fortes. O modelo tem contexto 128K e um limite de conhecimento de outubro de 2023.

Modelo Preços (1 milhão de Tokens) Preços com a API do Batch (1 milhão de Tokens)
GPT-4o-2024-1120 Global Entrada: $-
Entrada em Cache: $-
Saída: $-
Entrada: $-
Saída: $-
GPT-4o-2024-1120 EUA/UE – Zonas de Dados Entrada: $-
Entrada em Cache: $-
Saída: $-
Entrada: $-
Saída: $-
GPT-4o-2024-1120 Regional Entrada: $-
Entrada em Cache: $-
Saída: $-
N/A
GPT-4o-2024-08-06 Global Entrada: $-
Entrada em Cache: $-
Saída: $-
Entrada: $-
Saída: $-
GPT-4o-2024-08-06 EUA/UE – Zonas de Dados Entrada: $-
Entrada em Cache: $-
Saída: $-
Entrada: $-
Saída: $-
GPT-4o-2024-08-06 Regional Entrada: $-
Entrada em Cache: $-
Saída: $-
N/A
GPT-4o-2024-0513 Global Entrada: $-
Saída: $-
Entrada: $-
Saída: $-
GPT-4o-2024-0513 EUA/UE – Zonas de Dados Entrada: $-
Saída: $-
N/A
GPT-4o-2024-0513 Regional Entrada: $-
Saída: $-
N/A

Planeie com a Calculadora de Preços

GPT-4o-mini

O GPT-4o mini é o modelo pequeno mais económico e tem capacidades de visão. O modelo tem contexto 128K e um limite de conhecimento de outubro de 2023.

Modelo Preços (1 milhão de Tokens) Preços com a API do Batch (1 milhão de Tokens)
GPT-4o-mini-0718 Global Entrada: $-
Entrada em Cache: $-
Saída: $-
Entrada: $-
Saída: $-
GPT-4o-mini-0718 EUA/UE – Zonas de Dados Entrada: $-
Entrada em Cache: $-
Saída: $-
Entrada: $-
Saída: $-
GPT-4o-mini-0718 Regional Entrada: $-
Entrada em Cache: $-
Saída: $-
N/A

Planeie com a Calculadora de Preços

Aprovisionado

Pode alocar e gerir o débito para implementações, garantindo um desempenho previsível e uma capacidade estável. É-lhe cobrada uma taxa horária por modelo, independentemente da utilização, mas também pode garantir poupanças adicionais através de reservas mensais e anuais. Descubra como fazer a transição das suas implementações regionais e reservas aprovisionadas para zonas globais e de dados nesta página do Learn.

Modelo PTUs mín. Preços da PTU por hora Preços de Reserva Mensal ptu Preços de Reserva Anual PTU
GPT-4o Global 15 $- $- $-
GPT-4o Zonas de dados dos EUA/UE 15 $- $- $-
GPT-4o Regional 50 $- $- $-
GPT-4o-Regional Ajustado 50 $- $- $-
GPT-4o Mini Global 15 $- $- $-
Zonas de Dados GPT-4o Mini EUA/UE 15 $- $- $-
GPT-4o Mini Regional 25 $- $- $-
GPT-4o-Mini Regional Ajustado 25 $- $- $-

Planeie com a Calculadora de Preços

Modelos base

Modelos Utilização por 1000 tokens
Babbage-002 $-
Davinci-002 $-

Modelos de ajuste

Modelo Preços
GPT-4.1 Regional Entrada: $-/1 milhão de tokens
Entrada em Cache: $-/1 milhão de tokens
Saída: $-/1 milhão de tokens
Formação: $-/1 milhão de tokens
Alojamento: $-/hora
Global Entrada: $-/1 milhão de tokens
Entrada em Cache: $-/1 milhão de tokens
Saída: $-/1 milhão de tokens
Formação: $-/1 milhão de tokens
Alojamento: $-/hora
GPT-4.1-mini Regional Entrada: $-/1 milhão de tokens
Entrada em Cache: $-/1 milhão de tokens
Saída: $-/1 milhão de tokens
Formação: $-/1 milhão de tokens
Alojamento: $-/hora
Global Entrada: $-/1 milhão de tokens
Entrada em Cache: $-/1 milhão de tokens
Saída: $-/1 milhão de tokens
Formação: $-/1 milhão de tokens
Alojamento: $-/hora
GPT-4o-2024-08-06 Regional Entrada: $-/1 milhão de tokens
Entrada em Cache: $-/1 milhão de tokens
Saída: $-/1 milhão de tokens
Formação: $-/1 milhão de tokens
Alojamento: $-/hora
Global Entrada: $-/1 milhão de tokens
Entrada em Cache: $-/1 milhão de tokens
Saída: $-/1 milhão de tokens
Formação: utilizar regional
Alojamento: $-/hora
GPT-4o-mini Regional Entrada: $-/1 milhão de tokens
Entrada em Cache: $-/1 milhão de tokens
Saída: $-/1 milhão de tokens
Formação: $-/1 milhão de tokens
Alojamento: $-/hora
Global Entrada: $-/1 milhão de tokens
Entrada em Cache: $-/1 milhão de tokens
Saída: $-/1 milhão de tokens
Formação: utilizar regional
Alojamento: $-/hora
GPT-3.5-Turbo (16K) Regional Entrada: $-/1 milhão de tokens
Saída: $-/1 milhão de tokens
Formação: $-/1 milhão de tokens
Alojamento: $-/hora
GPT-3.5-Turbo (4K) Regional Entrada: $-/1 milhão de tokens
Saída: $-/1 milhão de tokens
Formação: $-/1 milhão de tokens
Alojamento: $-/hora

Modelos de imagem

Modelos Qualidade Resolução Preço (por 100 imagens)
Dall-E-3 Standard 1024 * 1024 $-
Standard 1024 * 1792,
1792 * 1024
$-
Dall-E-3 HD 1024 * 1024 $-
HD 1024 * 1792,
1792 * 1024
$-
Dall-E-2 Standard 1024 * 1024 $-

Modelos de incorporação

Modelos Por 1000 tokens
Ada $-
text-embedding-3-large $-
text-embedding-3-small $-

Modelos de Voz

Modelos Preço
Whisper $-/hora
TTS (Conversão de Texto em Voz) $-/1 milhão de carateres
TTS HD $-/1 milhão de carateres

Modelos de Linguagem Legados

Modelos Contexto Entrada (Por 1 milhão de Tokens) Saída (Por 1 milhão de Tokens)
GPT-3.5-Turbo-0301 4K $- $-
GPT-3.5-Turbo-0613 4K $- $-
GPT-3.5-Turbo-0613 16K $- $-
GPT-3.5-Turbo-1106 16K $- $-
GPT-3.5-Turbo-0125 16K $- $-
GPT-3.5-Turbo-Instruct 4K $- $-
GPT-4-Turbo 128K $- $-
GPT-4-Turbo-Vision 128K $- $-
GPT-4 8K $- $-
GPT-4 32K $- $-

Preços e opções de compra do Azure

Entre em contacto direto connosco

Obtenha uma orientação dos preços do Azure. Compreenda os preços da sua solução cloud, saiba mais sobre a otimização de custos e solicite uma proposta personalizada.

Fale com um especialista em vendas

Veja as formas de compra

Compre serviços do Azure através do site do Azure, de um representante da Microsoft ou de um parceiro do Azure.

Explore as suas opções

Recursos adicionais

Serviço OpenAI do Azure

Saiba mais sobre as funcionalidades e capacidades do Serviço OpenAI do Azure.

Calculadora de preços

Faça uma estimativa dos seus custos mensais para utilizar qualquer combinação de produtos do Azure.

SLA

Reveja o Contrato de Nível de Serviço para Serviço OpenAI do Azure.

Documentação

Reveja tutoriais técnicos, vídeos e mais Serviço OpenAI do Azure recursos.

  • O Azure OpenAI Service oferece preços baseados em Unidades de Débito Aprovisionadas (PTUs) e Pay As You Go. O Pay As You Go permite-lhe pagar os recursos que consome, sendo assim mais flexível para cargas de trabalho variáveis. As PTUs oferecem um modelo de preços previsível onde reserva e implementa uma quantidade específica de capacidade de processamento de modelos. Este modelo é ideal para cargas de trabalho com padrões de utilização consistentes ou previsíveis, proporcionando estabilidade e controlo de custos.
  • Para saber mais sobre as PTUs e os preços do Azure OpenAI, leia a documentação da PTU ou contacte o nosso especialista em vendas.

Fale com um especialista em vendas para obter uma descrição detalhada dos preços do Azure. Compreenda os preços da sua solução cloud.

Obtenha serviços cloud gratuitos e um crédito de $200 para explorar o Azure durante 30 dias.

Adicionar à estimativa. Prima \"v\" para ver na calculadora
Como podemos ajudá-lo?