Información general sobre los precios del servicio Azure OpenAI
Para ayudar a los clientes en el recorrido, ofrecemos soluciones de precios y administración de costos para satisfacer sus necesidades, incluidos:
- Estándar (a petición): Pago por uso para tokens de entrada y salida.
- Aprovisionado (PTU): Asigne el rendimiento con costos predecibles y reservas mensuales y anuales disponibles para reducir el gasto general.
- API de Batch: Los modelos de lenguaje también están ahora disponibles en la API de Batch para implementaciones globales y en tres regiones que devuelve las finalizaciones en 24 horas con un descuento del 50 % sobre el precio estándar global.
- Implementación global: SKU Global
- Implementación de zona de datos: basada en ubicación (Europa o EE. UU.)
- Implementación regional: región local (hasta 27 regiones)
Explore las opciones de precios
Aplique filtros para adaptar las opciones de precios a sus necesidades.
Los precios son solo estimaciones y no están pensados como cotizaciones de precios reales. Los precios reales pueden variar en función del tipo de contrato especificado con Microsoft, la fecha de compra y el tipo de cambio de moneda. Los precios se calculan en dólares estadounidenses y se convierten con las tarifas al contado de cierre de Londres que se capturan en los dos días laborables anteriores al último día laborable del mes anterior. Si los dos días laborables anteriores al final del mes se encuentran en un día festivo en los principales mercados, el día de configuración de tarifas suele ser el día inmediatamente anterior a los dos días laborables. Esta tarifa se aplica a todas las transacciones durante el próximo mes. Inicie sesión en la calculadora de precios de Azure para ver los precios basados en su programa u oferta actuales con Microsoft. Póngase en contacto con un especialista en ventas de Azure para obtener más información sobre precios o para solicitar una oferta de precios. Vea preguntas poco frecuentes sobre los precios de Azure.
Las entidades gubernamentales de EE. UU. pueden comprar servicios de Azure Government a un proveedor de soluciones de licencia sin ningún compromiso financiero por adelantado, o bien directamente a través de una suscripción en línea de pago por uso.
Importante: el precio en R$ es solo una referencia. Se trata de transacciones internacionales y el precio final está sujeto a tipos de cambio y a la inclusión de impuestos sobre operaciones financieras. No se emitirá ningún eNF.
Las entidades gubernamentales de EE. UU. pueden comprar servicios de Azure Government a un proveedor de soluciones de licencia sin ningún compromiso financiero por adelantado, o bien directamente a través de una suscripción en línea de pago por uso.
Importante: el precio en R$ es solo una referencia. Se trata de transacciones internacionales y el precio final está sujeto a tipos de cambio y a la inclusión de impuestos sobre operaciones financieras. No se emitirá ningún eNF.
GPT-5 series
Modelo | Precios (1M de tokens) |
---|---|
GPT-5 2025-08-07 Global |
Entrada: $- Entrada en caché: $- Salida: $- |
GPT-5 Data Zone |
Entrada: $- Entrada en caché: $- Salida: $- |
GPT-5-mini Global |
Entrada: $- Entrada en caché: $- Salida: $- |
GPT-5-mini Data Zone |
Entrada: $- Entrada en caché: $- Salida: $- |
GPT-5-nano Global |
Entrada: $- Entrada en caché: $- Salida: $- |
GPT-5-nano Data Zone |
Entrada: $- Entrada en caché: $- Salida: $- |
GPT-5 chat Global |
Entrada: $- Entrada en caché: $- Salida: $- |
Deep Research
Deep Research enables developers and enterprises to automate complex research tasks with structured, citation-rich answers. It is suitable for building customer support bots, internal knowledge assistants, or market analysis tools. Deep Research delivers transparent, auditable insights grounded in real-time web data. Search context tokens are charged input token prices for the model being used. You’ll separately incur charges for Grounding with Bing Search and the base GPT model being used for clarifying questions.
Modelo | Precios |
---|---|
o3-deep research Global |
Entrada: $- Entrada en caché: $- Salida: $- |
o3
o3 es un modelo de razonamiento eficaz de la serie O de modelos de razonamiento, que amplía las fronteras entre la codificación, las matemáticas, la ciencia y la percepción visual. Destaca en consultas complejas que requieren análisis de varias facetas y realiza un gran trabajo en tareas visuales como el análisis de imágenes y gráficos. El modelo presenta una ventana de contexto de 200 000 tokens y tiene un límite de conocimiento de junio de 2024.
Modelo | Precios (1M de tokens) | Precios con la API de Batch (1M de tokens) |
---|---|---|
o3 16-04-2025 Global |
Entrada: $- Entrada en caché: $- Salida: $- |
Entrada: $- Salida: $- |
o3 16-04-2025 Zona de datos |
Entrada: $- Entrada en caché: $- Salida: $- |
Entrada: $- Salida: $- |
o3 16-04-2025 Regional |
Entrada: $- Entrada en caché: $- Salida: $- |
N/D |
o4-mini
o4-mini es un modelo de razonamiento compacto, eficaz y rentable de la serie O de OpenAI. Destaca en tareas matemáticas, de codificación y visuales. El modelo presenta una ventana de contexto de 200 000 tokens y tiene un límite de conocimiento de junio de 2024.
Modelo | Precios (1M de tokens) | Precios con la API de Batch (1M de tokens) |
---|---|---|
o4 mini 16-04-2025 Global |
Entrada: $- Entrada en caché: $- Salida: $- |
Entrada: $- Salida: $- |
o4-mini 16-04-2025 Zona de datos |
Entrada: $- Entrada en caché: $- Salida: $- |
Entrada: $- Salida: $- |
o4-mini 16-04-2025 Regional |
Entrada: $- Entrada en caché: $- Salida: $- |
N/D |
Serie GPT-4.1
La serie GPT-4.1 es un modelo de uso general muy avanzado con un amplio conocimiento del mundo y una capacidad mejorada para comprender la intención del usuario, lo que lo hace especialmente experto en tareas creativas y planeamiento de agente. La serie presenta una ventana de contexto de 1 millón de tokens y tiene un límite de conocimiento de junio de 2024.
Modelo | Precios (1M de tokens) | Precios con la API de Batch (1M de tokens) |
---|---|---|
GPT-4.1-14-04-2025 Global |
Entrada: $- Entrada en caché: $- Salida: $- |
Entrada: $- Salida: $- |
GPT-4.1-14-04-2025 Zonas de datos |
Entrada: $- Entrada en caché: $- Salida: $- |
Entrada: $- Salida: $- |
GPT-4.1-14-04-2025 Regional |
Entrada: $- Entrada en caché: $- Salida: $- |
N/D |
GPT-4.1-mini-14-04-2025 Global |
Entrada: $- Entrada en caché: $- Salida: $- |
Entrada: $- Salida: $- |
GPT-4.1-mini-14-04-2025 Zona de datos |
Entrada: $- Entrada en caché: $- Salida: $- |
Entrada: $- Salida: $- |
GPT-4.1-mini-14-04-2025 Regional |
Entrada: $- Entrada en caché: $- Salida: $- |
N/D |
GPT-4.1-nano-14-04-2025 Global |
Entrada: $- Entrada en caché: $- Salida: $- |
Entrada: $- Salida: $- |
GPT-4.1-nano-14-04-2025 Zona de datos |
Entrada: $- Entrada en caché: $- Salida: $- |
Entrada: $- Salida: $- |
GPT-4.1-nano-14-04-2025 Regional |
Entrada: $- Entrada en caché: $- Salida: $- |
N/D |
Sora en Azure OpenAI
Sora es un modelo de IA generativa multimodal que ya está disponible en la Fundición de IA de Azure y está diseñado para ayudar a los equipos creativos a dar vida a las ideas mediante una integración fluida basada en API. Desarrollado en la infraestructura de grado empresarial de Azure, ofrece una implementación segura y escalable para transformar conceptos en contenido visual de alta calidad.
Precio por segundo | 2-5s | De 6 a10 s | De 11 a 15 s | De 16 a 20 s |
---|---|---|---|---|
480 Square Global | $- | $- | $- | $- |
480p Global | $- | $- | $- | $- |
480 Square Regional | $- | $- | $- | $- |
480p Regional | $- | $- | $- | $- |
720 Square Global | $- | $- | $- | $- |
720p Global | $- | $- | $- | $- |
720 Square Regional | $- | $- | $- | $- |
720p Regional | $- | $- | $- | $- |
1080 Square Global | $- | $- | $- | $- |
1080p Global | $- | $- | $- | $- |
1080 Square Regional | $- | $- | $- | $- |
1080p Regional | $- | $- | $- | $- |
GPT-Imagen-1
GPT-image-1 mejora DALL·E con mejores instrucciones de seguimiento, representación de texto precisa y compatibilidad con la entrada y edición de imágenes. El modelo tiene un precio por token, con precios diferentes para tokens de texto e imagen.
Modelo | Precios (1M de tokens) | Precios con la API de Batch (1M de tokens) |
---|---|---|
GPT-Image-1 Global |
Texto de entrada: $- Imagen de entrada: $- Imagen de salida: $- |
N/D |
GPT-Image-1 Regional |
Texto de entrada: $- Imagen de entrada: $- Imagen de salida: $- |
N/D |
GPT-Image-1 Zona de datos |
Texto de entrada: $- Imagen de entrada: $- Imagen de salida: $- |
N/D |
GPT-4.5
GPT-4.5-preview es el modelo de uso general más reciente con un conocimiento profundo del mundo y una mejor comprensión de la intención del usuario, lo que hace que sea bueno en tareas creativas y planeamiento agente. El modelo tiene un contexto de 128 KB y un límite de conocimiento de octubre de 2023.
Modelo | Precios (1M de tokens) | Precios con la API de Batch (1M de tokens) |
---|---|---|
GPT-4.5-Preview-2025-02-27 Global |
Entrada: $- Entrada en caché: $- Salida: $- |
N/D |
o1
o1 es la nueva serie de modelos de razonamiento para tareas complejas. El modelo tiene un contexto de 200 000 y un límite de conocimiento de octubre de 2023.
Modelo | Precios (1M de tokens) | Precios con la API de Batch (1M de tokens) |
---|---|---|
o1 2024-12-17 Global |
Entrada: $- Entrada en caché: $- Salida: $- |
N/D |
o1 2024-12-17 Estados Unidos/Europa: Zonas de datos |
Entrada: $- Entrada en caché: $- Salida: $- |
N/D |
o1 2024-12-17 Regional |
Entrada: $- Entrada en caché: $- Salida: $- |
N/D |
Versión preliminar 2024-09-12 global de o1 |
Entrada: $- Entrada en caché: $- Salida: $- |
N/D |
o1 versión preliminar 2024-09-12 Estados Unidos/Europa: Zonas de datos |
Entrada: $- Entrada en caché: $- Salida: $- |
N/D |
o1 versión preliminar 2024-09-12 Regional |
Entrada: $- Entrada en caché: $- Salida: $- |
N/D |
Planear con la calculadora de precios
o3 Mini
O3 mini es la versión actualizada del modelo o1 mini. o3-mini es un modelo de razonamiento rápido y rentable adaptado a los casos de uso de codificación, matemáticas y ciencia.
El modelo o3-mini ahora ofrece una ventana de entrada de contexto expandida de 200 000 tokens y una salida máxima de 100 000 tokens, lo que proporciona espacio suficiente para respuestas complejas y detalladas. El minimodelo o1 tiene una entrada de contexto de 128 000. Los modelos o3 y o1 tienen un límite de conocimientos de octubre de 2023.
Modelo | Precios (1M de tokens) | Precios con la API de Batch (1M de tokens) |
---|---|---|
o3 mini 2025-01-31 Global |
Entrada: $- Entrada en caché: $- Salida: $- |
Entrada: $- Salida: $- |
o3 mini 2025-01-31-Estados Unidos/Europa: Zonas de datos |
Entrada: $- Entrada en caché: $- Salida: $- |
Entrada: $- Salida: $- |
o3 mini 2025-01-31 Regional |
Entrada: $- Entrada en caché: $- Salida: $- |
N/D |
o1-mini 2024-09-12 Global |
Entrada: $- Entrada en caché: $- Salida: $- |
N/D |
o1-mini 2024-09-12 Estados Unidos/UE: Zonas de datos |
Entrada: $- Entrada en caché: $- Salida: $- |
N/D |
o1-mini 2024-09-12 Regional |
Entrada: $- Entrada en caché: $- Salida: $- |
N/D |
Planear con la calculadora de precios
Modelos de audio
Azure OpenAI Service incluye los modelos de audio avanzados GPT-4o Transcribe, GPT-4o mini Transcribe y GPT-4o mini TTS. Estos modelos mejoran las capacidades de conversión de voz en texto y de texto a voz, ofreciendo alta precisión y salidas de voz personalizables para diversas aplicaciones. Son ideales para centros de llamadas, subtitulación en vivo y salidas de voz interactivas, aprovechando un extenso entrenamiento previo y técnicas de destilación avanzadas para un rendimiento superior.
Modelo | Precios (1M de tokens) | Precios con la API de Batch (1M de tokens) |
---|---|---|
GPT-4o Transcribe |
Texto Entrada: $- Salida: $- Audio Entrada: $- Salida: N/D |
N/D |
GPT-4o mini Transcribe |
Texto Entrada: $- Salida: $- Audio Entrada: $- Salida: N/D |
N/D |
GPT-4o mini TTS |
Texto Entrada: $- Salida: N/D Audio Entrada: N/D Salida: $- |
N/D |
Agente que utiliza computadoras (CUA)
El agente que utiliza computadoras (CUA) es un modelo de inteligencia artificial especializado que permite a la IA interactuar con interfaces gráficas de usuario (GUI), navegar por las aplicaciones y automatizar tareas de varios pasos, todo ello mediante instrucciones en lenguaje natural. El modelo CUA se puede usar como herramienta en Responses API.
Modelo | Precios |
---|---|
computer-use-preview Global |
Entrada: $-/1M de tokens Salida: $-/1M de tokens |
Herramientas integradas
Responses API y Assistants API permiten una interacción fluida con herramientas como el uso de equipo, el intérprete de código, las llamadas a funciones y la búsqueda de archivos, lo que facilita a los desarrolladores la creación de agentes de inteligencia artificial.
Herramienta | Entrada |
---|---|
Uso de equipo (solo Responses API) |
Entrada: $-/1M de tokens Salida: $-/1M de tokens |
Llamada a la herramienta de búsqueda de archivos (solo Responses API) | $-/1000 llamadas a herramientas |
Búsqueda de archivos* | $-/GB de almacenamiento vectorial al día (1 GB gratis) |
Intérprete de código** | $-/sesión |
*GB hace referencia a gigabytes binarios, donde 1 GB es 2^30 bytes.
**Si el asistente llama al intérprete de código simultáneamente en dos subprocesos diferentes, se crearían dos sesiones de intérprete de código (2 * $-). Cada sesión está activa de forma predeterminada durante una hora, lo que significa que solo pagará estos honorarios una vez si el usuario sigue dando instrucciones al intérprete de código en el mismo hilo durante un máximo de una hora.
El coste de inferencia (entrada y salida) varía en función del modelo GPT usado con cada asistente. Si el asistente llama al intérprete de código simultáneamente en dos subprocesos diferentes, se crearían dos sesiones de intérprete de código (2 * $-). Cada sesión está activa de forma predeterminada durante una hora, lo que significa que el precio es de hasta una hora de dar instrucciones al intérprete de código en el mismo subproceso.
API en tiempo real
La GPT-4o-Realtime-Preview, que se incluye en la API en tiempo real, admite funcionalidades multilingües de conversión de voz a voz. Optimizado para conversaciones en tiempo real de baja latencia, permite interacciones naturales con un retraso mínimo, ideal para bots de chat e inteligencia artificial conversacional. GPT-4o es la versión completa y más eficaz diseñada para tareas complejas, mientras que GPT-4o Mini es una opción más pequeña y asequible ideal para aplicaciones más sencillas donde la rentabilidad y la velocidad son prioridades.
Modelo | Precios (1M de tokens) |
---|---|
GPT-4o-Realtime-Preview-2024-12-17-Global |
Texto Entrada: $- Entrada en caché: $- Salida: $- Audio Entrada: $- Entrada en caché: $- Salida: $- |
GPT-4o-Realtime-Preview-2024-12-17-US/EU: Zonas de datos |
Texto Entrada: $- Entrada en caché: $- Salida: $- Audio Entrada: $- Entrada en caché: $- Salida: $- |
GPT-4o-Realtime-Preview-2024-12-17-Regional |
Texto Entrada: $- Entrada en caché: $- Salida: $- Audio Entrada: $- Entrada en caché: $- Salida: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Global |
Texto Entrada: $- Entrada en caché: $- Salida: $- Audio Entrada: $- Entrada en caché: $- Salida: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-US/EU: Zonas de datos |
Texto Entrada: $- Entrada en caché: $- Salida: $- Audio Entrada: $- Entrada en caché: $- Salida: $- |
GPT-4o-Mini-Realtime-Preview-2024-12-17-Regional |
Texto Entrada: $- Entrada en caché: $- Salida: $- Audio Entrada: $- Entrada en caché: $- Salida: $- |
GPT-4o-Realtime-Preview-2024-10-01-Global |
Texto Entrada: $- Entrada en caché: $- Salida: $- Audio Entrada: $- Entrada en caché: $- Salida: $- |
GPT-4o-Realtime-Preview-2024-10-01-US/EU: Zonas de datos |
Texto Entrada: $- Entrada en caché: $- Salida: $- Audio Entrada: $- Entrada en caché: $- Salida: $- |
GPT-4o-Realtime-Preview-2024-10-01-Regional |
Texto Entrada: $- Entrada en caché: $- Salida: $- Audio Entrada: $- Entrada en caché: $- Salida: $- |
API de finalizaciones de chat
Destacado en la API de finalizaciones de chat, el modelo GPT 4o-Audio-Preview procesa y genera contenido de audio. Admite características avanzadas como el reconocimiento de voz y la síntesis de audio, ideal para interacciones de voz asincrónicas y análisis de sentimiento. GPT-4o es la versión completa y más eficaz diseñada para tareas complejas, mientras que GPT-4o Mini es una opción más pequeña y asequible ideal para aplicaciones más sencillas donde la rentabilidad y la velocidad son prioridades.
Modelo | Precios (1M de tokens) |
---|---|
GPT-4o-Audio-Preview-2024-12-17-Global |
Texto Entrada: $- Salida: $- Audio Entrada: $- Salida: $- |
GPT-4o-Audio-Preview-2024-12-17-US/EU: Zonas de datos |
Texto Entrada: $- Salida: $- Audio Entrada: $- Salida: $- |
GPT-4o-Audio-Preview-2024-12-17-Regional |
Texto Entrada: $- Salida: $- Audio Entrada: $- Salida: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Global |
Texto Entrada: $- Salida: $- Audio Entrada: $- Salida: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-US/EU: Zonas de datos |
Texto Entrada: $- Salida: $- Audio Entrada: $- Salida: $- |
GPT-4o-Mini-Audio-Preview-2024-12-17-Regional |
Texto Entrada: $- Salida: $- Audio Entrada: $- Salida: $- |
GPT-4o
GPT-4o es el modelo multimodal más avanzado que es más rápido y económica que GPT-4 Turbo con mejores capacidades de visión. El modelo tiene un contexto de 128 KB y un límite de conocimiento de octubre de 2023.
Modelo | Precios (1M de tokens) | Precios con la API de Batch (1M de tokens) |
---|---|---|
GPT-4o-2024-1120 Global |
Entrada: $- Entrada en caché: $- Salida: $- |
Entrada: $- Salida: $- |
GPT-4o-2024-1120 US/EU: zonas de datos |
Entrada: $- Entrada en caché: $- Salida: $- |
Entrada: $- Salida: $- |
GPT-4o-2024-1120 Regional |
Entrada: $- Entrada en caché: $- Salida: $- |
N/D |
GPT-4o-2024-08-06 Global |
Entrada: $- Entrada en caché: $- Salida: $- |
Entrada: $- Salida: $- |
GPT-4o-2024-08-06 US/EU : zonas de datos |
Entrada: $- Entrada en caché: $- Salida: $- |
Entrada: $- Salida: $- |
GPT-4o-2024-08-06 Regional |
Entrada: $- Entrada en caché: $- Salida: $- |
N/D |
GPT-4o-2024-0513 Global |
Entrada: $- Salida: $- |
Entrada: $- Salida: $- |
GPT-4o-2024-0513 US/EU: zonas de datos |
Entrada: $- Salida: $- |
N/D |
GPT-4o-2024-0513 Regional |
Entrada: $- Salida: $- |
N/D |
Planear con la calculadora de precios
GPT-4o-mini
GPT-4o mini es el modelo pequeño más rentable y tiene capacidades de visión. El modelo tiene un contexto de 128 KB y un límite de conocimiento de octubre de 2023.
Modelo | Precios (1M de tokens) | Precios con la API de Batch (1M de tokens) |
---|---|---|
GPT-4o-mini-0718 Global |
Entrada: $- Entrada en caché: $- Salida: $- |
Entrada: $- Salida: $- |
GPT-4o-mini-0718 US/EU: Zonas de datos |
Entrada: $- Entrada en caché: $- Salida: $- |
Entrada: $- Salida: $- |
GPT-4o-mini-0718 Regional |
Entrada: $- Entrada en caché: $- Salida: $- |
N/D |
Planear con la calculadora de precios
Aprovisionado
You can allocate and manage throughput for deployments, ensuring predictable performance and stable capacity. You are charged an hourly rate per model regardless of usage, but you can also secure additional savings through monthly and annual reservations. Discover how to transition your regional deployments and provisioned reservations to global and data zones on this Learn page.
Modelo | PTU mínimas | Precios por hora de PTU | Precios de reserva mensual de PTU | Precios de reserva anual de PTU |
---|---|---|---|---|
GPT-5 Global | 15 | $- | $- | $- |
GPT-5 Data Zones | 15 | $- | $- | $- |
GPT-5 Regional | 50 | $- | $- | $- |
GPT-4.1 Global | 15 | $- | $- | $- |
Zonas de datos GPT-4.1 | 15 | $- | $- | $- |
GPT-4.1 Regional | 50 | $- | $- | $- |
GPT-4.1-mini Global | 15 | $- | $- | $- |
GPT-4.1-mini zonas de datos de EE. UU./UE | 15 | $- | $- | $- |
GPT-4.1-mini Regional | 25 | $- | $- | $- |
GPT-4.1-nano Global | 15 | $- | $- | $- |
GPT-4.1-nano zonas de datos de EE. UU./UE | 15 | $- | $- | $- |
GPT-4.1-nano Regional | 25 | $- | $- | $- |
o3-mini Global | 15 | $- | $- | $- |
o3-mini US/EU Data Zones | 15 | $- | $- | $- |
o3-mini Regional | 25 | $- | $- | $- |
o3 Global | 15 | $- | $- | $- |
o3 Zonas de datos de EE. UU./UE | 15 | $- | $- | $- |
o3 Regional | 50 | $- | $- | $- |
o4-mini Global | 15 | $- | $- | $- |
o4 mini zonas de datos de EE. UU./UE | 15 | $- | $- | $- |
o4-mini Regional | 25 | $- | $- | $- |
GPT-4o Global | 15 | $- | $- | $- |
Zonas de datos de EE. UU./Europa de GPT-4o | 15 | $- | $- | $- |
GPT-4o Regional | 50 | $- | $- | $- |
GPT-4o-Regional optimizado | 50 | $- | $- | $- |
GPT-4o Mini Global | 15 | $- | $- | $- |
Zona de datos EE. UU. o Europa de GPT-4o Mini | 15 | $- | $- | $- |
GPT-4o Mini Regional | 25 | $- | $- | $- |
GPT-4o-Mini regional optimizado | 25 | $- | $- | $- |
Planear con la calculadora de precios
Modelos base
Modelos | Uso por 1000 tokens |
---|---|
Babbage-002 | $- |
Davinci-002 | $- |
Modelos de ajuste
Modelo | Precios | |
---|---|---|
o4-mini (ajuste preciso de refuerzo) | Regional |
Entrada: $-/1M de tokens Salida: $-/1M de tokens Formación: $-/hora Hosting: $-/hora Entrada del calificador: o4-mini: $-/1M de tokens 4.1-mini: $-/1M de tokens 4.1: $-/1M de tokens 4.1-nano: $-/1M de tokens o3: $-/1M de tokens Entrada almacenada en caché del calificador: o4-mini: $-/1M de tokens 4.1-mini: $-/1M de tokens 4.1: $-/1M de tokens 4.1-nano: $-/1M de tokens o3: $-/1M de tokens Salida del calificador: o4-mini: $-/1M de tokens 4.1-mini: $-/1M de tokens 4.1: $-/1M de tokens 4.1-nano: $-/1M de tokens o3: $-/1M de tokens |
Global |
Entrada: $-/1M de tokens Salida: $-/1M de tokens Formación: $-/hora Hosting: $-/hora Entrada del calificador: o4-mini: $-/1M de tokens 4.1-mini: $-/1M de tokens 4.1: $-/1M de tokens 4.1-nano: $-/1M de tokens o3: $-/1M de tokens Entrada almacenada en caché del calificador: o4-mini: $-/1M de tokens 4.1-mini: $-/1M de tokens 4.1: $-/1M de tokens 4.1-nano: $-/1M de tokens o3: $-/1M de tokens Salida del calificador: o4-mini: $-/1M de tokens 4.1-mini: $-/1M de tokens 4.1: $-/1M de tokens 4.1-nano: $-/1M de tokens o3: $-/1M de tokens |
|
GPT-4.1 | Regional |
Entrada: $-/1M de tokens Entrada en caché: $-/1M de tokens Salida: $-/1M de tokens Formación: $-/1M de tokens Hosting: $-/hora |
Global |
Entrada: $-/1M de tokens Entrada en caché: $-/1M de tokens Salida: $-/1M de tokens Formación: $-/1M de tokens Hosting: $-/hora |
|
Desarrollador |
Entrada: $-/1M de tokens Entrada en caché: $-/1M de tokens Salida: $-/1M de tokens |
|
GPT-4.1-mini | Regional |
Entrada: $-/1M de tokens Entrada en caché: $-/1M de tokens Salida: $-/1M de tokens Formación: $-/1M de tokens Hosting: $-/hora |
Global |
Entrada: $-/1M de tokens Entrada en caché: $-/1M de tokens Salida: $-/1M de tokens Formación: $-/1M de tokens Hosting: $-/hora |
|
Desarrollador |
Entrada: $-/1M de tokens Entrada en caché: $-/1M de tokens Salida: $-/1M de tokens |
|
GPT-4.1-nano | Regional |
Entrada: $-/1M de tokens Entrada en caché: $-/1M de tokens Salida: $-/1M de tokens Formación: $-/1M de tokens Hosting: $-/hora |
Global |
Entrada: $-/1M de tokens Entrada en caché: $-/1M de tokens Salida: $-/1M de tokens Formación: $-/1M de tokens Hosting: $-/hora |
|
Desarrollador |
Entrada: $-/1M de tokens Entrada en caché: $-/1M de tokens Salida: $-/1M de tokens |
|
GPT-4o-2024-08-06 | Regional |
Entrada: $-/1M de tokens Entrada en caché: $-/1M de tokens Salida: $-/1M de tokens Formación: $-/1M de tokens Hosting: $-/hora |
Global |
Entrada: $-/1M de tokens Entrada en caché: $-/1M de tokens Salida: $-/1M de tokens Formación: usar regional Hosting: $-/hora |
|
GPT-4o-mini | Regional |
Entrada: $-/1M de tokens Entrada en caché: $-/1M de tokens Salida: $-/1M de tokens Formación: $-/1M de tokens Hosting: $-/hora |
Global |
Entrada: $-/1M de tokens Entrada en caché: $-/1M de tokens Salida: $-/1M de tokens Formación: usar regional Hosting: $-/hora |
|
GPT-3.5-Turbo (16K) | Regional |
Entrada: $-/1M de tokens Salida: $-/1M de tokens Formación: $-/1M de tokens Hosting: $-/hora |
Modelos de imagen
Modelos | Calidad | Resolución | Precio (por 100 imágenes) |
---|---|---|---|
Dall-E-3 | Estándar | 1024 * 1024 | $- |
Estándar | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-3 | HD | 1024 * 1024 | $- |
HD | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-2 | Estándar | 1024 * 1024 | $- |
Inserción de modelos
Modelos | Por 1 000 tokens |
---|---|
Ada | $- |
text-embedding-3-large | $- |
text-embedding-3-small | $- |
Modelos de voz
Modelos | Precio |
---|---|
Susurro | $-/hora |
TTS (Texto a voz) | $-/1 millón de caracteres |
TTS HD | $-/1 millón de caracteres |
Modelos de lenguaje heredados
Modelos | Contexto | Entrada (por cada 1M de tokens) | Salida (por cada 1M de tokens) |
---|---|---|---|
GPT-3.5-Turbo-0301 | 4 000 | $- | $- |
GPT-3.5-Turbo-0613 | 4 000 | $- | $- |
GPT-3.5-Turbo-0613 | 16 000 | $- | $- |
GPT-3.5-Turbo-1106 | 16 000 | $- | $- |
GPT-3.5-Turbo-0125 | 16 000 | $- | $- |
GPT-3.5-Turbo-Instruct | 4 000 | $- | $- |
GPT-4-Turbo | 128K | $- | $- |
GPT-4-Turbo-Vision | 128K | $- | $- |
GPT-4 | 8 000 | $- | $- |
GPT-4 | 32 000 | $- | $- |
Precios y opciones de compra de Azure

Póngase en contacto con nosotros directamente
Obtenga un tutorial sobre los precios de Azure. Averigüe cómo funcionan los precios para su solución en la nube, descubra cómo se pueden optimizar los costos y solicite una propuesta personalizada.
Hable con un especialista de ventasConozca las opciones de compra
Puede adquirir servicios de Azure en el sitio web de la plataforma y a través de un representante de Microsoft o de un asociado de Azure.
Explore sus opcionesRecursos adicionales
Servicio Azure OpenAI
Obtenga más información sobre las características y funcionalidades de Servicio Azure OpenAI.
Calculadora de precios
Haga una estimación de los costos mensuales que le supondría el uso de cualquier combinación de productos de Azure.
Contrato de nivel de servicio
Revise el Acuerdo de Nivel de Servicio de Servicio Azure OpenAI.
Documentación
Consulte tutoriales técnicos, vídeos y más recursos de Servicio Azure OpenAI.
Preguntas frecuentes
-
Azure OpenAI Service ofrece precios basados en las unidades de procesamiento de pago por uso y aprovisionadas (PTU). El pago por uso permite pagar por los recursos que consume, lo que lo hace flexible para cargas de trabajo variables. Las PTU ofrecen un modelo de precios predecible en el que se reserva e implementa una cantidad específica de capacidad de procesamiento del modelo. Este modelo es ideal para cargas de trabajo con patrones de uso coherentes o predecibles, lo que proporciona estabilidad y control de costes.
-
Para obtener más información sobre las PTU y los precios de Azure OpenAI, lea documentación de PTU o póngase en contacto con nuestro especialista en ventas.
Hable con un especialista de ventas para que le explique en detalle los precios de Azure. Conozca el precio de su solución en la nube.
Obtenga servicios en la nube gratuitos y un crédito de $200 para explorar Azure durante 30 días.