Saltar al contenido principal
Azure

Precios de Servicio Azure OpenAI

Información general sobre los precios del servicio Azure OpenAI

Azure OpenAI Service ofrece inteligencia artificial generativa lista para la empresa con modelos eficaces de OpenAI, lo que permite a las organizaciones innovar con funcionalidades de texto, audio y visión. Más allá de los modelos de vanguardia, las empresas eligen Azure OpenAI Service para ofrecer privacidad de datos integrada, flexibilidad regional, de área o global, e integración perfecta en el ecosistema de Azure, como Fabric, Cosmos DB y Búsqueda de Azure AI. Empresas de todos los tamaños pueden escalar con confianza soluciones de inteligencia artificial para mejorar la experiencia del cliente, automatizar flujos de trabajo y desbloquear el potencial creativo, lo que impulsa un impacto medible y una diferenciación competitiva.

Para ayudar a los clientes en el recorrido, ofrecemos soluciones de precios y administración de costos para satisfacer sus necesidades, incluidos:
  • Estándar (a petición): Pago por uso para tokens de entrada y salida.
  • Aprovisionado (PTU): Asigne el rendimiento con costos predecibles y reservas mensuales y anuales disponibles para reducir el gasto general.
  • API de Batch: Los modelos de lenguaje también están ahora disponibles en la API de Batch para implementaciones globales y en tres regiones que devuelve las finalizaciones en 24 horas con un descuento del 50 % sobre el precio estándar global.
Puede elegir entre los siguientes tipos de implementación para Estándar y Aprovisionado, lo que permite una mayor flexibilidad y control de los precios y el rendimiento. Esta flexibilidad ayuda cuando hay límites de procesamiento de datos cada vez más restrictivos y se necesita un mayor rendimiento a un precio más bajo.
  • Implementación global: SKU Global
  • Implementación de zona de datos: basada en ubicación (Europa o EE. UU.)
  • Implementación regional: región local (hasta 27 regiones)

Explore las opciones de precios

Aplique filtros para adaptar las opciones de precios a sus necesidades.

Los precios son solo estimaciones y no están pensados como cotizaciones de precios reales. Los precios reales pueden variar en función del tipo de contrato especificado con Microsoft, la fecha de compra y el tipo de cambio de moneda. Los precios se calculan en dólares estadounidenses y se convierten con las tarifas al contado de cierre de Londres que se capturan en los dos días laborables anteriores al último día laborable del mes anterior. Si los dos días laborables anteriores al final del mes se encuentran en un día festivo en los principales mercados, el día de configuración de tarifas suele ser el día inmediatamente anterior a los dos días laborables. Esta tarifa se aplica a todas las transacciones durante el próximo mes. Inicie sesión en la calculadora de precios de Azure para ver los precios basados en su programa u oferta actuales con Microsoft. Póngase en contacto con un especialista en ventas de Azure para obtener más información sobre precios o para solicitar una oferta de precios. Vea preguntas poco frecuentes sobre los precios de Azure.

GPT-4.5

GPT-4.5-preview es el modelo de uso general más reciente con un conocimiento profundo del mundo y una mejor comprensión de la intención del usuario, lo que hace que sea bueno en tareas creativas y planeamiento agente. El modelo tiene un contexto de 128 KB y un límite de conocimiento de octubre de 2023.

Modelo Precios (1M de tokens) Precios con la API de Batch (1M de tokens)
GPT-4.5-Preview-2025-02-27 Global Entrada: $-
Entrada en caché: $-
Salida: $-
N/D

o1

o1 es la nueva serie de modelos de razonamiento para tareas complejas. El modelo tiene un contexto de 200 000 y un límite de conocimiento de octubre de 2023.

Modelo Precios (1M de tokens) Precios con la API de Batch (1M de tokens)
o1 2024-12-17 Global Entrada: $-
Entrada en caché: $-
Salida: $-
N/D
o1 2024-12-17 Estados Unidos/Europa: Zonas de datos Entrada: $-
Entrada en caché: $-
Salida: $-
N/D
o1 2024-12-17 Regional Entrada: $-
Entrada en caché: $-
Salida: $-
N/D
Versión preliminar 2024-09-12 global de o1 Entrada: $-
Entrada en caché: $-
Salida: $-
N/D
o1 versión preliminar 2024-09-12 Estados Unidos/Europa: Zonas de datos Entrada: $-
Entrada en caché: $-
Salida: $-
N/D
o1 versión preliminar 2024-09-12 Regional Entrada: $-
Entrada en caché: $-
Salida: $-
N/D

Planear con la calculadora de precios

o3 Mini

O3 mini es la versión actualizada del modelo o1 mini. o3-mini es un modelo de razonamiento rápido y rentable adaptado a los casos de uso de codificación, matemáticas y ciencia.

El modelo o3-mini ahora ofrece una ventana de entrada de contexto expandida de 200 000 tokens y una salida máxima de 100 000 tokens, lo que proporciona espacio suficiente para respuestas complejas y detalladas. El minimodelo o1 tiene una entrada de contexto de 128 000. Los modelos o3 y o1 tienen un límite de conocimientos de octubre de 2023.

Modelo Precios (1M de tokens) Precios con la API de Batch (1M de tokens)
o3 mini 2025-01-31 Global Entrada: $-
Entrada en caché: $-
Salida: $-
Entrada: $-
Salida: $-
o3 mini 2025-01-31-Estados Unidos/Europa: Zonas de datos Entrada: $-
Entrada en caché: $-
Salida: $-
Entrada: $-
Salida: $-
o3 mini 2025-01-31 Regional Entrada: $-
Entrada en caché: $-
Salida: $-
N/D
o1-mini 2024-09-12 Global Entrada: $-
Entrada en caché: $-
Salida: $-
N/D
o1-mini 2024-09-12 Estados Unidos/UE: Zonas de datos Entrada: $-
Entrada en caché: $-
Salida: $-
N/D
o1-mini 2024-09-12 Regional Entrada: $-
Entrada en caché: $-
Salida: $-
N/D

Planear con la calculadora de precios

Computer-Using Agent (CUA)

The Computer-Using Agent (CUA) is a specialized AI model that allows AI to interact with graphical user interfaces (GUIs), navigate applications, and automate multi-step tasks—all through natural language instructions. The CUA model can be used as a tool in the Responses API.

Modelo Precios
computer-use-preview Global Entrada: $-/1M de tokens
Salida: $-/1M de tokens

Built-in tools

The Responses API and the Assistants API enable seamless interaction with tools like computer use, code interpreter, function calling, and file search, making it easy for developers to build AI agents.

Herramienta Entrada
Computer Use (Responses API only) Entrada: $-/1M de tokens
Salida: $-/1M de tokens
File Search Tool Call (Responses API only) $-/1K tool calls
Búsqueda de archivos* $-/GB de almacenamiento vectorial al día (1 GB gratis)
Intérprete de código** $-/sesión

*GB hace referencia a gigabytes binarios, donde 1 GB es 2^30 bytes.

**Si el asistente llama al intérprete de código simultáneamente en dos subprocesos diferentes, se crearían dos sesiones de intérprete de código (2 * $-). Cada sesión está activa de forma predeterminada durante una hora, lo que significa que solo pagará estos honorarios una vez si el usuario sigue dando instrucciones al intérprete de código en el mismo hilo durante un máximo de una hora.

El coste de inferencia (entrada y salida) varía en función del modelo GPT usado con cada asistente. Si el asistente llama al intérprete de código simultáneamente en dos subprocesos diferentes, se crearían dos sesiones de intérprete de código (2 * $-). Cada sesión está activa de forma predeterminada durante una hora, lo que significa que el precio es de hasta una hora de dar instrucciones al intérprete de código en el mismo subproceso.

API en tiempo real

La GPT-4o-Realtime-Preview, que se incluye en la API en tiempo real, admite funcionalidades multilingües de conversión de voz a voz. Optimizado para conversaciones en tiempo real de baja latencia, permite interacciones naturales con un retraso mínimo, ideal para bots de chat e inteligencia artificial conversacional. GPT-4o es la versión completa y más eficaz diseñada para tareas complejas, mientras que GPT-4o Mini es una opción más pequeña y asequible ideal para aplicaciones más sencillas donde la rentabilidad y la velocidad son prioridades.

Modelo Precios (1M de tokens)
GPT-4o-Realtime-Preview-2024-12-17-Global Texto
Entrada: $-
Entrada en caché: $-
Salida: $-

Audio
Entrada: $-
Entrada en caché: $-
Salida: $-
GPT-4o-Realtime-Preview-2024-12-17-US/EU: Zonas de datos Texto
Entrada: $-
Entrada en caché: $-
Salida: $-

Audio
Entrada: $-
Entrada en caché: $-
Salida: $-
GPT-4o-Realtime-Preview-2024-12-17-Regional Texto
Entrada: $-
Entrada en caché: $-
Salida: $-

Audio
Entrada: $-
Entrada en caché: $-
Salida: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global Texto
Entrada: $-
Entrada en caché: $-
Salida: $-

Audio
Entrada: $-
Entrada en caché: $-
Salida: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU: Zonas de datos Texto
Entrada: $-
Entrada en caché: $-
Salida: $-

Audio
Entrada: $-
Entrada en caché: $-
Salida: $-
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional Texto
Entrada: $-
Entrada en caché: $-
Salida: $-

Audio
Entrada: $-
Entrada en caché: $-
Salida: $-
GPT-4o-Realtime-Preview-2024-10-01-Global Texto
Entrada: $-
Entrada en caché: $-
Salida: $-

Audio
Entrada: $-
Entrada en caché: $-
Salida: $-
GPT-4o-Realtime-Preview-2024-10-01-US/EU: Zonas de datos Texto
Entrada: $-
Entrada en caché: $-
Salida: $-

Audio
Entrada: $-
Entrada en caché: $-
Salida: $-
GPT-4o-Realtime-Preview-2024-10-01-Regional Texto
Entrada: $-
Entrada en caché: $-
Salida: $-

Audio
Entrada: $-
Entrada en caché: $-
Salida: $-

API de finalizaciones de chat

Destacado en la API de finalizaciones de chat, el modelo GPT 4o-Audio-Preview procesa y genera contenido de audio. Admite características avanzadas como el reconocimiento de voz y la síntesis de audio, ideal para interacciones de voz asincrónicas y análisis de sentimiento. GPT-4o es la versión completa y más eficaz diseñada para tareas complejas, mientras que GPT-4o Mini es una opción más pequeña y asequible ideal para aplicaciones más sencillas donde la rentabilidad y la velocidad son prioridades.

Modelo Precios (1M de tokens)
GPT-4o-Audio-Preview-2024-12-17-Global Texto
Entrada: $-
Salida: $-

Audio
Entrada: $-
Salida: $-
GPT-4o-Audio-Preview-2024-12-17-US/EU: Zonas de datos Texto
Entrada: $-
Salida: $-

Audio
Entrada: $-
Salida: $-
GPT-4o-Audio-Preview-2024-12-17-Regional Texto
Entrada: $-
Salida: $-

Audio
Entrada: $-
Salida: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Global Texto
Entrada: $-
Salida: $-

Audio
Entrada: $-
Salida: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU: Zonas de datos Texto
Entrada: $-
Salida: $-

Audio
Entrada: $-
Salida: $-
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional Texto
Entrada: $-
Salida: $-

Audio
Entrada: $-
Salida: $-

GPT-4o

GPT-4o es el modelo multimodal más avanzado que es más rápido y económica que GPT-4 Turbo con mejores capacidades de visión. El modelo tiene un contexto de 128 KB y un límite de conocimiento de octubre de 2023.

Modelo Precios (1M de tokens) Precios con la API de Batch (1M de tokens)
GPT-4o-2024-1120 Global Entrada: $-
Entrada en caché: $-
Salida: $-
Entrada: $-
Salida: $-
GPT-4o-2024-1120 US/EU: zonas de datos Entrada: $-
Entrada en caché: $-
Salida: $-
Entrada: $-
Salida: $-
GPT-4o-2024-1120 Regional Entrada: $-
Entrada en caché: $-
Salida: $-
N/D
GPT-4o-2024-08-06 Global Entrada: $-
Entrada en caché: $-
Salida: $-
Entrada: $-
Salida: $-
GPT-4o-2024-08-06 US/EU : zonas de datos Entrada: $-
Entrada en caché: $-
Salida: $-
Entrada: $-
Salida: $-
GPT-4o-2024-08-06 Regional Entrada: $-
Entrada en caché: $-
Salida: $-
N/D
GPT-4o-2024-0513 Global Entrada: $-
Salida: $-
Entrada: $-
Salida: $-
GPT-4o-2024-0513 US/EU: zonas de datos Entrada: $-
Salida: $-
N/D
GPT-4o-2024-0513 Regional Entrada: $-
Salida: $-
N/D

Planear con la calculadora de precios

GPT-4o-mini

GPT-4o mini es el modelo pequeño más rentable y tiene capacidades de visión. El modelo tiene un contexto de 128 KB y un límite de conocimiento de octubre de 2023.

Modelo Precios (1M de tokens) Precios con la API de Batch (1M de tokens)
GPT-4o-mini-0718 Global Entrada: $-
Entrada en caché: $-
Salida: $-
Entrada: $-
Salida: $-
GPT-4o-mini-0718 US/EU: Zonas de datos Entrada: $-
Entrada en caché: $-
Salida: $-
Entrada: $-
Salida: $-
GPT-4o-mini-0718 Regional Entrada: $-
Entrada en caché: $-
Salida: $-
N/D

Planear con la calculadora de precios

Aprovisionado

Puede asignar y administrar el rendimiento de las implementaciones, lo que garantiza un rendimiento predecible y una capacidad estable. Se le cobrará una tarifa por hora por modelo, independientemente del uso, pero también puede proteger los ahorros adicionales mediante reservas mensuales y anuales. Descubra cómo realizar la transición de sus implementaciones regionales y reservas provisionadas a zonas globales y de datos en esta Página de Learn.

Modelo PTU mínimas Precios por hora de PTU Precios de reserva mensual de PTU Precios de reserva anual de PTU
GPT-4o Global 15 $- $- $-
Zonas de datos de EE. UU./Europa de GPT-4o 15 $- $- $-
GPT-4o Regional 50 $- $- $-
GPT-4o-Regional optimizado 50 $- $- $-
GPT-4o Mini Global 15 $- $- $-
Zona de datos EE. UU. o Europa de GPT-4o Mini 15 $- $- $-
GPT-4o Mini Regional 25 $- $- $-
GPT-4o-Mini regional optimizado 25 $- $- $-

Planear con la calculadora de precios

Modelos base

Modelos Uso por 1000 tokens
Babbage-002 $-
Davinci-002 $-

Modelos de ajuste

Modelo Precios
GPT-4o-2024-08-06 Regional Entrada: $-/1M de tokens
Entrada en caché: $-/1M de tokens
Salida: $-/1M de tokens
Formación: $-/1M de tokens
Hosting: $-/hora
Global Entrada: $-/1M de tokens
Entrada en caché: $-/1M de tokens
Salida: $-/1M de tokens
Formación: usar regional
Hosting: $-/hora
GPT-4o-mini Regional Entrada: $-/1M de tokens
Entrada en caché: $-/1M de tokens
Salida: $-/1M de tokens
Formación: $-/1M de tokens
Hosting: $-/hora
Global Entrada: $-/1M de tokens
Entrada en caché: $-/1M de tokens
Salida: $-/1M de tokens
Formación: usar regional
Hosting: $-/hora
GPT-4-0613 (8K) Regional Entrada: $-/1M de tokens
Salida: $-/1M de tokens
Formación: $-/1M de tokens
Hosting: $-/hora
GPT-3.5-Turbo (16K) Regional Entrada: $-/1M de tokens
Salida: $-/1M de tokens
Formación: $-/1M de tokens
Hosting: $-/hora
GPT-3.5-Turbo (4K) Regional Entrada: $-/1M de tokens
Salida: $-/1M de tokens
Formación: $-/1M de tokens
Hosting: $-/hora
Babbage-002 Entrada: $-/1M de tokens
Salida: $-/1M de tokens
Formación: $-/1M de tokens
Hosting: $-/hora
Davinci-002 Entrada: $-/1M de tokens
Salida: $-/1M de tokens
Formación: $-/1M de tokens
Hosting: $-/hora

Modelos de imagen

Modelos Calidad Resolución Precio (por 100 imágenes)
Dall-E-3 Estándar 1024 * 1024 $-
Estándar 1024 * 1792,
1792 * 1024
$-
Dall-E-3 HD 1024 * 1024 $-
HD 1024 * 1792,
1792 * 1024
$-
Dall-E-2 Estándar 1024 * 1024 $-

Inserción de modelos

Modelos Por 1 000 tokens
Ada $-
text-embedding-3-large $-
text-embedding-3-small $-

Modelos de voz

Modelos Precio
Susurro $-/hora
TTS (Texto a voz) $-/1 millón de caracteres
TTS HD $-/1 millón de caracteres

Modelos de lenguaje heredados

Modelos Contexto Entrada (por cada 1M de tokens) Salida (por cada 1M de tokens)
GPT-3.5-Turbo-0301 4 000 $- $-
GPT-3.5-Turbo-0613 4 000 $- $-
GPT-3.5-Turbo-0613 16 000 $- $-
GPT-3.5-Turbo-1106 16 000 $- $-
GPT-3.5-Turbo-0125 16 000 $- $-
GPT-3.5-Turbo-Instruct 4 000 $- $-
GPT-4-Turbo 128K $- $-
GPT-4-Turbo-Vision 128K $- $-
GPT-4 8 000 $- $-
GPT-4 32 000 $- $-

Precios y opciones de compra de Azure

Póngase en contacto con nosotros directamente

Obtenga un tutorial sobre los precios de Azure. Averigüe cómo funcionan los precios para su solución en la nube, descubra cómo se pueden optimizar los costos y solicite una propuesta personalizada.

Hable con un especialista de ventas

Conozca las opciones de compra

Puede adquirir servicios de Azure en el sitio web de la plataforma y a través de un representante de Microsoft o de un asociado de Azure.

Explore sus opciones

Recursos adicionales

Servicio Azure OpenAI

Obtenga más información sobre las características y funcionalidades de Servicio Azure OpenAI.

Calculadora de precios

Haga una estimación de los costos mensuales que le supondría el uso de cualquier combinación de productos de Azure.

Contrato de nivel de servicio

Revise el Acuerdo de Nivel de Servicio de Servicio Azure OpenAI.

Documentación

Consulte tutoriales técnicos, vídeos y más recursos de Servicio Azure OpenAI.

  • Azure OpenAI Service ofrece precios basados en las unidades de procesamiento de pago por uso y aprovisionadas (PTU). El pago por uso permite pagar por los recursos que consume, lo que lo hace flexible para cargas de trabajo variables. Las PTU ofrecen un modelo de precios predecible en el que se reserva e implementa una cantidad específica de capacidad de procesamiento del modelo. Este modelo es ideal para cargas de trabajo con patrones de uso coherentes o predecibles, lo que proporciona estabilidad y control de costes.
  • Para obtener más información sobre las PTU y los precios de Azure OpenAI, lea documentación de PTU o póngase en contacto con nuestro especialista en ventas.

Hable con un especialista de ventas para que le explique en detalle los precios de Azure. Conozca el precio de su solución en la nube.

Obtenga servicios en la nube gratuitos y un crédito de $200 para explorar Azure durante 30 días.

Agregado al presupuesto. Presione 'v' para verlo en la calculadora
¿Podemos ayudarle?