Descrição geral dos preços do Azure OpenAI Service
Para ajudar os clientes nesta viagem, oferecemos soluções de gestão de preços e custos para satisfazer as suas necessidades, incluindo:
- Standard (A Pedido): modelo pay as you go para tokens de entrada e saída.
- Aprovisionado (PTUs): atribua débito com custos previsíveis, com reservas mensais e anuais disponíveis para reduzir os gastos gerais.
- API em Lote: os modelos de linguagem também estão agora disponíveis na API em Lote para implementações globais e três regiões, que devolve conclusões no prazo de 24 horas por um desconto de 50% no Preço Standard Global.
- Implementação Global – SKU Global
- Implementação da Zona de Dados – Base Geográfica (Europa ou Estados Unidos)
- Implementação Regional – Região Local (até 27 regiões)
Explorar opções de preços
Aplique filtros para personalizar as opções de preços à medida das suas necessidades.
Os preços são apenas estimativas e não propostas de preços reais. Os preços reais podem variar dependendo do tipo de contrato que foi estipulado com a Microsoft, da data de compra e da taxa de câmbio. Os preços são calculados com base em dólares americanos e convertidos com as taxas de encerramento de Londres que são capturadas nos dois dias úteis anteriores ao último dia útil do fim do mês anterior. Se os dois dias úteis anteriores ao fim do mês calharem num feriado nos principais mercados, o dia de definição da taxa é geralmente o dia imediatamente anterior aos dois dias úteis. Esta taxa aplica-se a todas as transações durante o mês seguinte. Inicie sessão na calculadora de preços do Azure para ver os preços com base no seu programa/oferta atual com a Microsoft. Contacte um especialista de vendas do Azure para obter mais informações sobre preços ou para pedir um orçamento de preço. Consulte as perguntas mais frequentes sobre os preços do Azure.
As entidades públicas dos E.U.A. são elegíveis para comprar serviços do Azure Government junto de um fornecedor de soluções de licenciamento sem compromisso financeiro inicial ou diretamente através de uma subscrição online pay as you go.
Importante — o preço em € é meramente uma referência; esta é uma transação internacional, pelo que o preço final está sujeito a taxas de câmbio e à inclusão de impostos sobre operações financeiras. Não será emitido um eNF.
As entidades públicas dos E.U.A. são elegíveis para comprar serviços do Azure Government junto de um fornecedor de soluções de licenciamento sem compromisso financeiro inicial ou diretamente através de uma subscrição online pay as you go.
Importante — o preço em € é meramente uma referência; esta é uma transação internacional, pelo que o preço final está sujeito a taxas de câmbio e à inclusão de impostos sobre operações financeiras. Não será emitido um eNF.
GPT-5 series
Modelo | Preços (1 milhão de Tokens) |
---|---|
GPT-5 2025-08-07 Global |
Entrada: $- Entrada em Cache: $- Saída: $- |
GPT-5 Data Zone |
Entrada: $- Entrada em Cache: $- Saída: $- |
GPT-5-mini Global |
Entrada: $- Entrada em Cache: $- Saída: $- |
GPT-5-mini Data Zone |
Entrada: $- Entrada em Cache: $- Saída: $- |
GPT-5-nano Global |
Entrada: $- Entrada em Cache: $- Saída: $- |
GPT-5-nano Data Zone |
Entrada: $- Entrada em Cache: $- Saída: $- |
GPT-5 chat Global |
Entrada: $- Entrada em Cache: $- Saída: $- |
Deep Research
Deep Research enables developers and enterprises to automate complex research tasks with structured, citation-rich answers. It is suitable for building customer support bots, internal knowledge assistants, or market analysis tools. Deep Research delivers transparent, auditable insights grounded in real-time web data. Search context tokens are charged input token prices for the model being used. You’ll separately incur charges for Grounding with Bing Search and the base GPT model being used for clarifying questions.
Modelo | Preços |
---|---|
o3-deep research Global |
Entrada: $- Entrada em Cache: $- Saída: $- |
o3
o3 é um poderoso modelo de raciocínio da série o de modelos de raciocínio, expandindo as fronteiras na codificação, matemática, ciência e perceção visual. Destaca-se em consultas complexas que requerem análises multifacetadas e apresenta um desempenho robusto em tarefas visuais, como a análise de imagens e de gráficos. O modelo possui uma janela de contexto de 200 mil tokens e tem um limite de conhecimento até junho de 2024.
Modelo | Preços (1 milhão de Tokens) | Preços com a API do Batch (1 milhão de Tokens) |
---|---|---|
o3 2025-04-16 Global |
Entrada: $- Entrada em Cache: $- Saída: $- |
Entrada: $- Saída: $- |
Zona de Dados o3 2025-04-16 |
Entrada: $- Entrada em Cache: $- Saída: $- |
Entrada: $- Saída: $- |
o3 2025-04-16 Regional |
Entrada: $- Entrada em Cache: $- Saída: $- |
N/A |
o4-mini
o4-mini é um modelo de raciocínio compacto, eficiente e rentável da série o da OpenAI. Destaca-se em tarefas de matemática, codificação e visuais. O modelo possui uma janela de contexto de 200 mil tokens e tem um limite de conhecimento até junho de 2024.
Modelo | Preços (1 milhão de Tokens) | Preços com a API do Batch (1 milhão de Tokens) |
---|---|---|
o4-mini 2025-04-16 Global |
Entrada: $- Entrada em Cache: $- Saída: $- |
Entrada: $- Saída: $- |
Zona de Dados o4-mini 2025-04-16 |
Entrada: $- Entrada em Cache: $- Saída: $- |
Entrada: $- Saída: $- |
o4-mini 2025-04-16 Regional |
Entrada: $- Entrada em Cache: $- Saída: $- |
N/A |
série GPT-4.1
A série GPT-4.1 é um modelo altamente avançado de propósito geral, com um vasto conhecimento mundial e uma capacidade melhorada de compreender a intenção dos utilizadores, tornando-o particularmente apto para tarefas criativas e planeamento de agente. A série possui uma janela de contexto de 1 milhão de tokens e tem um limite de conhecimento até junho de 2024.
Modelo | Preços (1 milhão de Tokens) | Preços com a API do Batch (1 milhão de Tokens) |
---|---|---|
GPT-4.1-2025-04-14 Global |
Entrada: $- Entrada em Cache: $- Saída: $- |
Entrada: $- Saída: $- |
Zona de Dados GPT-4.1-2025-04-14 |
Entrada: $- Entrada em Cache: $- Saída: $- |
Entrada: $- Saída: $- |
GPT-4.1-2025-04-14 Regional |
Entrada: $- Entrada em Cache: $- Saída: $- |
N/A |
GPT-4.1-mini-2025-04-14 Global |
Entrada: $- Entrada em Cache: $- Saída: $- |
Entrada: $- Saída: $- |
Zona de Dados GPT-4.1-mini-2025-04-14 |
Entrada: $- Entrada em Cache: $- Saída: $- |
Entrada: $- Saída: $- |
GPT-4.1-mini-2025-04-14 Regional |
Entrada: $- Entrada em Cache: $- Saída: $- |
N/A |
GPT-4.1-nano-2025-04-14 Global |
Entrada: $- Entrada em Cache: $- Saída: $- |
Entrada: $- Saída: $- |
Zona de Dados GPT-4.1-nano-2025-04-14 |
Entrada: $- Entrada em Cache: $- Saída: $- |
Entrada: $- Saída: $- |
GPT-4.1-nano-2025-04-14 Regional |
Entrada: $- Entrada em Cache: $- Saída: $- |
N/A |
Sora no Azure OpenAI
O Sora é um modelo de IA generativa multimodal agora disponível no Azure AI Foundry, concebido para ajudar as equipas criativas a dar vida às ideias através da integração total com a API em primeiro lugar. Criado com base na infraestrutura de nível empresarial do Azure, oferece uma implementação segura e dimensionável para transformar conceitos em conteúdos visuais de alta qualidade.
Preço por segundo | 2-5s | 6-10s | 11-15s | 16-20s |
---|---|---|---|---|
480 Square Global | $- | $- | $- | $- |
480p Global | $- | $- | $- | $- |
480 Square Regional | $- | $- | $- | $- |
480p Regional | $- | $- | $- | $- |
720 Square Global | $- | $- | $- | $- |
720p Global | $- | $- | $- | $- |
720 Square Regional | $- | $- | $- | $- |
720p Regional | $- | $- | $- | $- |
1080 Square Global | $- | $- | $- | $- |
1080p Global | $- | $- | $- | $- |
1080 Square Regional | $- | $- | $- | $- |
1080p Regional | $- | $- | $- | $- |
GPT-Image-1
O GPT-image-1 aprimora o DALL-E com melhor acompanhamento de instruções, renderização precisa de texto e suporte para entrada e edição de imagens. O modelo tem um preço por token, com preços diferentes para tokens de texto e de imagem.
Modelo | Preços (1 milhão de Tokens) | Preços com a API do Batch (1 milhão de Tokens) |
---|---|---|
GPT-Image-1 Global |
Introduzir texto: $- Imagem de entrada: $- Imagem de saída: $- |
N/A |
GPT-Image-1 Regional |
Introduzir texto: $- Imagem de entrada: $- Imagem de saída: $- |
N/A |
Zona de Dados GPT-Image-1 |
Introduzir texto: $- Imagem de entrada: $- Imagem de saída: $- |
N/A |
GPT-4.5
O GPT-4.5-preview é o mais recente modelo para fins gerais com um profundo conhecimento do mundo e uma melhor compreensão da intenção do utilizador, o que o torna eficaz em tarefas criativas e planeamento autónomo. O modelo tem um contexto 128K e um limite de conhecimento até outubro de 2023.
Modelo | Preços (1 milhão de Tokens) | Preços com a API do Batch (1 milhão de Tokens) |
---|---|---|
GPT-4.5-Preview-2025-02-27 Global |
Entrada: $- Entrada em Cache: $- Saída: $- |
N/A |
o1
o1 é a nova série de modelos de raciocínio para tarefas complexas. O modelo tem contexto 200 mil tokens e um horizonte de conhecimento até outubro de 2023.
Modelo | Preços (1 milhão de Tokens) | Preços com a API do Batch (1 milhão de Tokens) |
---|---|---|
o1 2024-12-17 Global |
Entrada: $- Entrada em Cache: $- Saída: $- |
N/A |
o1 2024-12-17 US/EU – Zonas de Dados |
Entrada: $- Entrada em Cache: $- Saída: $- |
N/A |
o1 2024-12-17 Regional |
Entrada: $- Entrada em Cache: $- Saída: $- |
N/A |
o1 preview 2024-09-12 Global |
Entrada: $- Entrada em Cache: $- Saída: $- |
N/A |
o1 preview 2024-09-12 US/EU – Zonas de Dados |
Entrada: $- Entrada em Cache: $- Saída: $- |
N/A |
o1 preview 2024-09-12 Regional |
Entrada: $- Entrada em Cache: $- Saída: $- |
N/A |
Planeie com a Calculadora de Preços
o3 Mini
O o3 mini é a versão atualizada do modelo o1 mini. O o3-mini é um modelo de raciocínio rápido e eficiente em termos de custos, adaptado a casos de uso de programação, matemática e ciência.
O modelo o3-mini dispõe agora de uma janela de entrada de contexto expandida para 200 mil tokens e uma saída máxima de 100 mil tokens, proporcionando espaço amplo para respostas complexas e detalhadas. O modelo o1 mini tem uma entrada de contexto de 128 mil tokens. Os modelos o3 e o1 têm um limite de conhecimento até outubro de 2023.
Modelo | Preços (1 milhão de Tokens) | Preços com a API do Batch (1 milhão de Tokens) |
---|---|---|
o3 mini 2025-01-31 Global |
Entrada: $- Entrada em Cache: $- Saída: $- |
Entrada: $- Saída: $- |
o3 mini 2025-01-31-US/EU – Zonas de Dados |
Entrada: $- Entrada em Cache: $- Saída: $- |
Entrada: $- Saída: $- |
o3 mini 2025-01-31 Regional |
Entrada: $- Entrada em Cache: $- Saída: $- |
N/A |
o1-mini 2024-09-12 Global |
Entrada: $- Entrada em Cache: $- Saída: $- |
N/A |
o1-mini 2024-09-12 US/EU – Zonas de Dados |
Entrada: $- Entrada em Cache: $- Saída: $- |
N/A |
o1-mini 2024-09-12 Regional |
Entrada: $- Entrada em Cache: $- Saída: $- |
N/A |
Planeie com a Calculadora de Preços
Modelos de Áudio
O Azure OpenAI Service inclui os modelos de áudio avançados GPT-4o-Transcribe, GPT-4o-Mini-Transcribe e GPT-4o-Mini-TTS. Estes modelos melhoram as capacidades de conversão de voz em texto e de texto em voz, oferecendo alta precisão e saídas de voz personalizáveis para várias aplicações. Ideal para centros de atendimento ao cliente, legendagem em direto e saídas de voz interativas, utilizam técnicas extensas de pré-preparação e de destilação avançada para um desempenho superior.
Modelo | Preços (1 milhão de Tokens) | Preços com a API do Batch (1 milhão de Tokens) |
---|---|---|
GPT-4o-Transcribe |
Texto Entrada: $- Saída: $- Áudio Entrada: $- Saída: N/A |
N/A |
GPT-4o-Mini-Transcribe |
Texto Entrada: $- Saída: $- Áudio Entrada: $- Saída: N/A |
N/A |
GPT-4o-Mini-TTS |
Texto Entrada: $- Saída: N/A Áudio Entrada: N/A Saída: $- |
N/A |
Agente de Utilização de Computador (CUA)
O Agente de Utilização de Computador (CUA) é um modelo de IA especializado que permite à IA interagir com interfaces gráficas de utilizador (GUIs), navegar em aplicações e automatizar tarefas de múltiplos passos, tudo através de instruções em linguagem natural. O modelo CUA pode ser utilizado como uma ferramenta na API de Respostas.
Modelo | Preços |
---|---|
pré-visualização de utilização de computador Global |
Entrada: $-/1 milhão de tokens Saída: $-/1 milhão de tokens |
Ferramentas integradas
A API de Respostas e a API de Assistentes permitem uma interação fluida com ferramentas como a utilização do computador, o intérprete de código, a chamada de funções e a pesquisa de ficheiros, facilitando a criação de agentes de IA pelos programadores.
Ferramenta | Entrada |
---|---|
Utilização do Computador (apenas API de Respostas) |
Entrada: $-/1 milhão de tokens Saída: $-/1 milhão de tokens |
Chamada da Ferramenta de Pesquisa de Ficheiros (apenas API de Respostas) | $-/1000 chamadas de ferramentas |
Pesquisa de Ficheiros* | $-/GB de armazenamento de vetores por dia (1 GB gratuito) |
Intérprete de código** | $-/sessão |
*GB refere-se a gigabytes binários, em que 1 gb é 2^30 bytes.
**Se o seu assistente chamar o Intérprete de Código simultaneamente em dois threads diferentes, isto criaria duas sessões de Intérprete de Código (2 * $-). Cada sessão está ativa por predefinição durante uma hora, o que significa que só pagaria esta taxa uma vez, se o seu utilizador continuar a dar instruções ao Intérprete de Código no mesmo thread até uma hora.
O custo de inferência (entrada e saída) varia com base no modelo GPT utilizado com cada Assistente. Se o seu assistente efetuar chamadas ao Intérprete de Código simultaneamente em dois threads diferentes, tal criaria duas sessões de Intérprete de Código (2 * $-). Por predefinição, cada sessão está ativa durante uma hora, o que significa que o preço é para uma hora de instruções ao Intérprete de Código na mesma thread.
API em tempo real
Em destaque na API em Tempo Real, o GPT-4o-Realtime-Preview suporta capacidades multilingues de conversão de voz em voz. Otimizado para conversas em tempo real e de baixa latência, permite interações naturais com um atraso mínimo, ideal para chatbots e IA de conversação. O GPT-4o é a versão abrangente e mais poderosa, concebida para tarefas complexas, enquanto o GPT-4o Mini é uma opção mais compacta e acessível, ideal para aplicações mais simples onde a eficiência de custos e a velocidade são prioridades.
Modelo | Preços (1 milhão de Tokens) |
---|---|
GPT-4o-Realtime-Preview-2024-12-17-Global |
Texto Entrada: $- Entrada em Cache: $- Saída: $- Áudio Entrada: $- Entrada em Cache: $- Saída: $- |
GPT-4o-Realtime-Preview-2024-12-17-USA/UE – Zonas de Dados |
Texto Entrada: $- Entrada em Cache: $- Saída: $- Áudio Entrada: $- Entrada em Cache: $- Saída: $- |
GPT-4o-Realtime-Preview-2024-12-17-Regional |
Texto Entrada: $- Entrada em Cache: $- Saída: $- Áudio Entrada: $- Entrada em Cache: $- Saída: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global |
Texto Entrada: $- Entrada em Cache: $- Saída: $- Áudio Entrada: $- Entrada em Cache: $- Saída: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-USA/UE – Zonas de Dados |
Texto Entrada: $- Entrada em Cache: $- Saída: $- Áudio Entrada: $- Entrada em Cache: $- Saída: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional |
Texto Entrada: $- Entrada em Cache: $- Saída: $- Áudio Entrada: $- Entrada em Cache: $- Saída: $- |
GPT-4o-Realtime-Preview-2024-10-01-Global |
Texto Entrada: $- Entrada em Cache: $- Saída: $- Áudio Entrada: $- Entrada em Cache: $- Saída: $- |
GPT-4o-Realtime-Preview-2024-10-01-USA/UE – Zonas de Dados |
Texto Entrada: $- Entrada em Cache: $- Saída: $- Áudio Entrada: $- Entrada em Cache: $- Saída: $- |
GPT-4o-Realtime-Preview-2024-10-01-Regional |
Texto Entrada: $- Entrada em Cache: $- Saída: $- Áudio Entrada: $- Entrada em Cache: $- Saída: $- |
API de Conclusão de Conversas
Em destaque na API de Conclusões de Conversas, o modelo GPT 4o-Audio-Preview processa e gera conteúdo áudio. Suporta funcionalidades avançadas como reconhecimento de voz e síntese de áudio, ideais para interações de voz assíncronas e análise de sentimentos. O GPT-4o é a versão abrangente e mais poderosa, concebida para tarefas complexas, enquanto o GPT-4o Mini é uma opção mais compacta e acessível, ideal para aplicações mais simples onde a eficiência de custos e a velocidade são prioridades.
Modelo | Preços (1 milhão de Tokens) |
---|---|
GPT-4o-Audio-Preview-2024-12-17-Global |
Texto Entrada: $- Saída: $- Áudio Entrada: $- Saída: $- |
GPT-4o-Audio-Preview-2024-12-17-USA/UE – Zonas de Dados |
Texto Entrada: $- Saída: $- Áudio Entrada: $- Saída: $- |
GPT-4o-Audio-Preview-2024-12-17-Regional |
Texto Entrada: $- Saída: $- Áudio Entrada: $- Saída: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Global |
Texto Entrada: $- Saída: $- Áudio Entrada: $- Saída: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-USA/UE – Zonas de Dados |
Texto Entrada: $- Saída: $- Áudio Entrada: $- Saída: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional |
Texto Entrada: $- Saída: $- Áudio Entrada: $- Saída: $- |
GPT-4o
O GPT-4o é o modelo multimodal mais avançado, mais rápido e mais barato do que o GPT-4 Turbo, com capacidades de visão mais fortes. O modelo tem contexto 128K e um limite de conhecimento de outubro de 2023.
Modelo | Preços (1 milhão de Tokens) | Preços com a API do Batch (1 milhão de Tokens) |
---|---|---|
GPT-4o-2024-1120 Global |
Entrada: $- Entrada em Cache: $- Saída: $- |
Entrada: $- Saída: $- |
GPT-4o-2024-1120 EUA/UE – Zonas de Dados |
Entrada: $- Entrada em Cache: $- Saída: $- |
Entrada: $- Saída: $- |
GPT-4o-2024-1120 Regional |
Entrada: $- Entrada em Cache: $- Saída: $- |
N/A |
GPT-4o-2024-08-06 Global |
Entrada: $- Entrada em Cache: $- Saída: $- |
Entrada: $- Saída: $- |
GPT-4o-2024-08-06 EUA/UE – Zonas de Dados |
Entrada: $- Entrada em Cache: $- Saída: $- |
Entrada: $- Saída: $- |
GPT-4o-2024-08-06 Regional |
Entrada: $- Entrada em Cache: $- Saída: $- |
N/A |
GPT-4o-2024-0513 Global |
Entrada: $- Saída: $- |
Entrada: $- Saída: $- |
GPT-4o-2024-0513 EUA/UE – Zonas de Dados |
Entrada: $- Saída: $- |
N/A |
GPT-4o-2024-0513 Regional |
Entrada: $- Saída: $- |
N/A |
Planeie com a Calculadora de Preços
GPT-4o-mini
O GPT-4o mini é o modelo pequeno mais económico e tem capacidades de visão. O modelo tem contexto 128K e um limite de conhecimento de outubro de 2023.
Modelo | Preços (1 milhão de Tokens) | Preços com a API do Batch (1 milhão de Tokens) |
---|---|---|
GPT-4o-mini-0718 Global |
Entrada: $- Entrada em Cache: $- Saída: $- |
Entrada: $- Saída: $- |
GPT-4o-mini-0718 EUA/UE – Zonas de Dados |
Entrada: $- Entrada em Cache: $- Saída: $- |
Entrada: $- Saída: $- |
GPT-4o-mini-0718 Regional |
Entrada: $- Entrada em Cache: $- Saída: $- |
N/A |
Planeie com a Calculadora de Preços
Aprovisionado
You can allocate and manage throughput for deployments, ensuring predictable performance and stable capacity. You are charged an hourly rate per model regardless of usage, but you can also secure additional savings through monthly and annual reservations. Discover how to transition your regional deployments and provisioned reservations to global and data zones on this Learn page.
Modelo | PTUs mín. | Preços da PTU por hora | Preços de Reserva Mensal ptu | Preços de Reserva Anual PTU |
---|---|---|---|---|
GPT-5 Global | 15 | $- | $- | $- |
GPT-5 Data Zones | 15 | $- | $- | $- |
GPT-5 Regional | 50 | $- | $- | $- |
GPT-4.1 Global | 15 | $- | $- | $- |
Zonas de Dados GPT-4.1 | 15 | $- | $- | $- |
GPT-4.1 Regional | 50 | $- | $- | $- |
GPT-4.1-mini Global | 15 | $- | $- | $- |
Zonas de Dados GPT-4.1-mini EUA/UE | 15 | $- | $- | $- |
GPT-4.1-mini Regional | 25 | $- | $- | $- |
GPT-4.1-nano Global | 15 | $- | $- | $- |
Zonas de Dados GPT-4.1-nano EUA/UE | 15 | $- | $- | $- |
GPT-4.1-nano Regional | 25 | $- | $- | $- |
o3-mini Global | 15 | $- | $- | $- |
o3-mini US/EU Data Zones | 15 | $- | $- | $- |
o3-mini Regional | 25 | $- | $- | $- |
o3 Global | 15 | $- | $- | $- |
Zonas de Dados o3 EUA/UE | 15 | $- | $- | $- |
o3 Regional | 50 | $- | $- | $- |
o4-mini Global | 15 | $- | $- | $- |
Zonas de Dados o4-mini EUA/UE | 15 | $- | $- | $- |
o4-mini Regional | 25 | $- | $- | $- |
GPT-4o Global | 15 | $- | $- | $- |
GPT-4o Zonas de dados dos EUA/UE | 15 | $- | $- | $- |
GPT-4o Regional | 50 | $- | $- | $- |
GPT-4o-Regional Ajustado | 50 | $- | $- | $- |
GPT-4o Mini Global | 15 | $- | $- | $- |
Zonas de Dados GPT-4o Mini EUA/UE | 15 | $- | $- | $- |
GPT-4o Mini Regional | 25 | $- | $- | $- |
GPT-4o-Mini Regional Ajustado | 25 | $- | $- | $- |
Planeie com a Calculadora de Preços
Modelos base
Modelos | Utilização por 1000 tokens |
---|---|
Babbage-002 | $- |
Davinci-002 | $- |
Modelos de ajuste
Modelo | Preços | |
---|---|---|
o4-mini (Ajuste por reforço) | Regional |
Entrada: $-/1 milhão de tokens Saída: $-/1 milhão de tokens Formação: $-/hora Alojamento: $-/hora Entrada do avaliador: o4-mini: $-/1 milhão de tokens 4.1-mini: $-/1 milhão de tokens 4.1: $-/1 milhão de tokens 4.1-nano: $-/1 milhão de tokens o3: $-/1 milhão de tokens Entrada em cache do avaliador: o4-mini: $-/1 milhão de tokens 4.1-mini: $-/1 milhão de tokens 4.1: $-/1 milhão de tokens 4.1-nano: $-/1 milhão de tokens o3: $-/1 milhão de tokens Saída do avaliador: o4-mini: $-/1 milhão de tokens 4.1-mini: $-/1 milhão de tokens 4.1: $-/1 milhão de tokens 4.1-nano: $-/1 milhão de tokens o3: $-/1 milhão de tokens |
Global |
Entrada: $-/1 milhão de tokens Saída: $-/1 milhão de tokens Formação: $-/hora Alojamento: $-/hora Entrada do avaliador: o4-mini: $-/1 milhão de tokens 4.1-mini: $-/1 milhão de tokens 4.1: $-/1 milhão de tokens 4.1-nano: $-/1 milhão de tokens o3: $-/1 milhão de tokens Entrada em cache do avaliador: o4-mini: $-/1 milhão de tokens 4.1-mini: $-/1 milhão de tokens 4.1: $-/1 milhão de tokens 4.1-nano: $-/1 milhão de tokens o3: $-/1 milhão de tokens Saída do avaliador: o4-mini: $-/1 milhão de tokens 4.1-mini: $-/1 milhão de tokens 4.1: $-/1 milhão de tokens 4.1-nano: $-/1 milhão de tokens o3: $-/1 milhão de tokens |
|
GPT-4.1 | Regional |
Entrada: $-/1 milhão de tokens Entrada em Cache: $-/1 milhão de tokens Saída: $-/1 milhão de tokens Formação: $-/1 milhão de tokens Alojamento: $-/hora |
Global |
Entrada: $-/1 milhão de tokens Entrada em Cache: $-/1 milhão de tokens Saída: $-/1 milhão de tokens Formação: $-/1 milhão de tokens Alojamento: $-/hora |
|
Programador |
Entrada: $-/1 milhão de tokens Entrada em Cache: $-/1 milhão de tokens Saída: $-/1 milhão de tokens |
|
GPT-4.1-mini | Regional |
Entrada: $-/1 milhão de tokens Entrada em Cache: $-/1 milhão de tokens Saída: $-/1 milhão de tokens Formação: $-/1 milhão de tokens Alojamento: $-/hora |
Global |
Entrada: $-/1 milhão de tokens Entrada em Cache: $-/1 milhão de tokens Saída: $-/1 milhão de tokens Formação: $-/1 milhão de tokens Alojamento: $-/hora |
|
Programador |
Entrada: $-/1 milhão de tokens Entrada em Cache: $-/1 milhão de tokens Saída: $-/1 milhão de tokens |
|
GPT-4.1-nano | Regional |
Entrada: $-/1 milhão de tokens Entrada em Cache: $-/1 milhão de tokens Saída: $-/1 milhão de tokens Formação: $-/1 milhão de tokens Alojamento: $-/hora |
Global |
Entrada: $-/1 milhão de tokens Entrada em Cache: $-/1 milhão de tokens Saída: $-/1 milhão de tokens Formação: $-/1 milhão de tokens Alojamento: $-/hora |
|
Programador |
Entrada: $-/1 milhão de tokens Entrada em Cache: $-/1 milhão de tokens Saída: $-/1 milhão de tokens |
|
GPT-4o-2024-08-06 | Regional |
Entrada: $-/1 milhão de tokens Entrada em Cache: $-/1 milhão de tokens Saída: $-/1 milhão de tokens Formação: $-/1 milhão de tokens Alojamento: $-/hora |
Global |
Entrada: $-/1 milhão de tokens Entrada em Cache: $-/1 milhão de tokens Saída: $-/1 milhão de tokens Formação: utilizar regional Alojamento: $-/hora |
|
GPT-4o-mini | Regional |
Entrada: $-/1 milhão de tokens Entrada em Cache: $-/1 milhão de tokens Saída: $-/1 milhão de tokens Formação: $-/1 milhão de tokens Alojamento: $-/hora |
Global |
Entrada: $-/1 milhão de tokens Entrada em Cache: $-/1 milhão de tokens Saída: $-/1 milhão de tokens Formação: utilizar regional Alojamento: $-/hora |
|
GPT-3.5-Turbo (16K) | Regional |
Entrada: $-/1 milhão de tokens Saída: $-/1 milhão de tokens Formação: $-/1 milhão de tokens Alojamento: $-/hora |
Modelos de imagem
Modelos | Qualidade | Resolução | Preço (por 100 imagens) |
---|---|---|---|
Dall-E-3 | Standard | 1024 * 1024 | $- |
Standard | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-3 | HD | 1024 * 1024 | $- |
HD | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-2 | Standard | 1024 * 1024 | $- |
Modelos de incorporação
Modelos | Por 1000 tokens |
---|---|
Ada | $- |
text-embedding-3-large | $- |
text-embedding-3-small | $- |
Modelos de Voz
Modelos | Preço |
---|---|
Whisper | $-/hora |
TTS (Conversão de Texto em Voz) | $-/1 milhão de carateres |
TTS HD | $-/1 milhão de carateres |
Modelos de Linguagem Legados
Modelos | Contexto | Entrada (Por 1 milhão de Tokens) | Saída (Por 1 milhão de Tokens) |
---|---|---|---|
GPT-3.5-Turbo-0301 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 4K | $- | $- |
GPT-3.5-Turbo-0613 | 16K | $- | $- |
GPT-3.5-Turbo-1106 | 16K | $- | $- |
GPT-3.5-Turbo-0125 | 16K | $- | $- |
GPT-3.5-Turbo-Instruct | 4K | $- | $- |
GPT-4-Turbo | 128K | $- | $- |
GPT-4-Turbo-Vision | 128K | $- | $- |
GPT-4 | 8K | $- | $- |
GPT-4 | 32K | $- | $- |
Preços e opções de compra do Azure

Entre em contacto direto connosco
Obtenha uma orientação dos preços do Azure. Compreenda os preços da sua solução cloud, saiba mais sobre a otimização de custos e solicite uma proposta personalizada.
Fale com um especialista em vendasVeja as formas de compra
Compre serviços do Azure através do site do Azure, de um representante da Microsoft ou de um parceiro do Azure.
Explore as suas opçõesRecursos adicionais
Serviço OpenAI do Azure
Saiba mais sobre as funcionalidades e capacidades do Serviço OpenAI do Azure.
Calculadora de preços
Faça uma estimativa dos seus custos mensais para utilizar qualquer combinação de produtos do Azure.
SLA
Reveja o Contrato de Nível de Serviço para Serviço OpenAI do Azure.
Documentação
Reveja tutoriais técnicos, vídeos e mais Serviço OpenAI do Azure recursos.
Perguntas mais frequentes
-
O Azure OpenAI Service oferece preços baseados em Unidades de Débito Aprovisionadas (PTUs) e Pay As You Go. O Pay As You Go permite-lhe pagar os recursos que consome, sendo assim mais flexível para cargas de trabalho variáveis. As PTUs oferecem um modelo de preços previsível onde reserva e implementa uma quantidade específica de capacidade de processamento de modelos. Este modelo é ideal para cargas de trabalho com padrões de utilização consistentes ou previsíveis, proporcionando estabilidade e controlo de custos.
-
Para saber mais sobre as PTUs e os preços do Azure OpenAI, leia a documentação da PTU ou contacte o nosso especialista em vendas.
Fale com um especialista em vendas para obter uma descrição detalhada dos preços do Azure. Compreenda os preços da sua solução cloud.
Obtenha serviços cloud gratuitos e um crédito de $200 para explorar o Azure durante 30 dias.