Información general sobre los precios del servicio Azure OpenAI
Desbloquee la potencia de los modelos de IA generativos de Azure OpenAI Service con unidades de procesamiento aprovisionadas (PTU) y estándar flexibles (a petición). El modelo Estándar le permite pagar solo por los tokens procesados, mientras que las PTU garantizan un rendimiento coherente y una varianza de latencia mínima para soluciones escalables. Los precios incluyen costos por cada 1 000 tokens y las tarifas de PTU proporcionan una estructura de costos predecible. Los modelos de lenguaje también están ahora disponibles en la API de Batch que devuelve las finalizaciones en 24 horas con un descuento del 50 % sobre el precio estándar global. Azure OpenAI Service ofrece funcionalidades avanzadas como GPT-4o, ajuste para la personalización, DALL-E para la generación de imágenes y Whisper para voz a texto. Para obtener instrucciones personalizadas sobre cómo optimizar las implementaciones de IA, póngase en contacto con un especialista de ventas.
Explore las opciones de precios
Aplique filtros para adaptar las opciones de precios a sus necesidades.
Los precios son solo estimaciones y no están pensados como cotizaciones de precios reales. Los precios reales pueden variar en función del tipo de contrato especificado con Microsoft, la fecha de compra y el tipo de cambio de moneda. Los precios se calculan en dólares estadounidenses y se convierten con las tarifas al contado de cierre de Londres que se capturan en los dos días laborables anteriores al último día laborable del mes anterior. Si los dos días laborables anteriores al final del mes se encuentran en un día festivo en los principales mercados, el día de configuración de tarifas suele ser el día inmediatamente anterior a los dos días laborables. Esta tarifa se aplica a todas las transacciones durante el próximo mes. Inicie sesión en la calculadora de precios de Azure para ver los precios basados en su programa u oferta actuales con Microsoft. Póngase en contacto con un especialista en ventas de Azure para obtener más información sobre precios o para solicitar una oferta de precios. Vea preguntas poco frecuentes sobre los precios de Azure.
Las entidades gubernamentales de EE. UU. pueden comprar servicios de Azure Government a un proveedor de soluciones de licencia sin ningún compromiso financiero por adelantado, o bien directamente a través de una suscripción en línea de pago por uso.
Importante: el precio en R$ es solo una referencia. Se trata de transacciones internacionales y el precio final está sujeto a tipos de cambio y a la inclusión de impuestos sobre operaciones financieras. No se emitirá ningún eNF.
Las entidades gubernamentales de EE. UU. pueden comprar servicios de Azure Government a un proveedor de soluciones de licencia sin ningún compromiso financiero por adelantado, o bien directamente a través de una suscripción en línea de pago por uso.
Importante: el precio en R$ es solo una referencia. Se trata de transacciones internacionales y el precio final está sujeto a tipos de cambio y a la inclusión de impuestos sobre operaciones financieras. No se emitirá ningún eNF.
Detalles de precios
Modelos de idioma
Modelos | Contexto | Input (Per 1,000,000 tokens) | Output (Per 1,000,000 tokens) | Precio por PTU por hora | Incremento de escalado mínimo | Reserva mensual por PTU | Reserva anual por PTU |
---|---|---|---|---|---|---|---|
o1 preview Global Deployment | 128K | $- | $- | N/D | N/D | N/D | N/D |
o1 preview Regional API | 128K | $- | $- | N/D | N/D | N/D | N/D |
o1 mini Global Deployment | 128K | $- | $- | N/D | N/D | N/D | N/D |
o1 mini Regional API | 128K | $- | $- | N/D | N/D | N/D | N/D |
gpt-4o-2024-08-06 Global Deployment | 128K | $- | $- | N/D | N/D | N/D | N/D |
gpt-4o-2024-08-06 Regional API | 128K | $- | $- | N/D | N/D | N/D | N/D |
Implementación global de GPT-4o | 128K | $- | $- | $- | 50 PTU | $- | $- |
GPT-4o Regional API | 128K | $- | $- | $- | 50 PTU | $- | $- |
Implementación global GPT-4o-mini | 128K | $- | $- | $- | 25 PTU | $- | $- |
API regional de GPT-4o-mini | 128K | $- | $- | $- | 25 PTU | $- | $- |
En esta tabla se proporciona una comparación detallada de los precios estándar (a petición) frente a los aprovisionados (PTU) para varios modelos de lenguaje. La columna "Contexto" especifica el número máximo de tokens que cada modelo puede controlar por respuesta. Se muestran los detalles de precios de los tokens de entrada y salida, que reflejan el coste por cada 1 000 tokens. El modelo de precios de PTU incluye una tarifa por hora y un incremento de escalado mínimo, que representa el número mínimo de PTU necesarias para cada modelo. Las columnas "Reserva mensual por PTU" y "Reserva anual por PTU" indican los costes de reserva por PTU. Esta comparación ayuda a los usuarios a comprender las implicaciones de coste del uso de cada modelo en las opciones de facturación estándar (a petición) y aprovisionada (PTU), lo que permite tomar decisiones informadas en función de sus necesidades de uso específicas.
Los modelos de lenguaje también están ahora disponibles en la API de Batch que devuelve las finalizaciones en 24 horas con un descuento del 50 % sobre el precio estándar global.
Modelos de lenguaje heredados
Modelos | Contexto | Input (Per 1,000,000 tokens) | Output (Per 1,000,000 tokens) |
---|---|---|---|
GPT-3.5-Turbo-0301 | 4 000 | $- | $- |
GPT-3.5-Turbo-0613 | 4 000 | $- | $- |
GPT-3.5-Turbo-0613 | 16 000 | $- | $- |
GPT-3.5-Turbo-1106 | 16 000 | $- | $- |
GPT-3.5-Turbo-0125 | 16 000 | $- | $- |
GPT-3.5-Turbo-Instruct | 4 000 | $- | $- |
GPT-4-Turbo | 128K | $- | $- |
GPT-4-Turbo-Vision | 128K | $- | $- |
GPT-4 | 8 000 | $- | $- |
GPT-4 | 32 000 | $- | $- |
API de asistentes
La API de Asistentes y sus herramientas facilitan a los desarrolladores la creación de asistentes de IA en sus aplicaciones.
Los tokens usados para la API de Asistentes se facturan según las tarifas de entrada/salida por token del modelo de lenguaje elegido usado con cada Asistente. Además, cobramos las siguientes tarifas por el uso de herramientas:
Herramienta | Entrada |
---|---|
Búsqueda de archivos* | $-/GB de almacenamiento vectorial al día (1 GB gratis) |
Intérprete de código** | $-/sesión |
*GB hace referencia a gigabytes binarios, donde 1 GB es 2^30 bytes.
**Si el asistente llama al intérprete de código simultáneamente en dos subprocesos diferentes, se crearían dos sesiones de intérprete de código (2 * $-). Cada sesión está activa de forma predeterminada durante una hora, lo que significa que solo pagará estos honorarios una vez si el usuario sigue dando instrucciones al intérprete de código en el mismo hilo durante un máximo de una hora.
El coste de inferencia (entrada y salida) varía en función del modelo GPT usado con cada asistente. Si el asistente llama al intérprete de código simultáneamente en dos subprocesos diferentes, se crearían dos sesiones de intérprete de código (2 * $-). Cada sesión está activa de forma predeterminada durante una hora, lo que significa que el precio es de hasta una hora de dar instrucciones al intérprete de código en el mismo subproceso.
Modelos base
Modelos | Uso por 1000 tokens |
---|---|
Babbage-002 | $- |
Davinci-002 | $- |
Modelos de ajuste
Modelos | Entrenamiento por 1000 tokens | Hospedaje por hora | Uso de entrada por 1000 tokens | Uso de salida por 1000 tokens |
---|---|---|---|---|
Babbage-002 | $- | $- | $- | $- |
Davinci-002 | $- | $- | $- | $- |
GPT-3.5-Turbo (4K) | $- | $- | $- | $- |
GPT-3.5-Turbo (16K) | $- | $- | $- | $- |
GPT-4 (8K) | $- | $- | $- | $- |
GPT-4o | $- | $- | $- | $- |
GPT-4o-mini | $- | $- | $- | $- |
Modelos de imagen
Modelos | Calidad | Resolución | Precio (por 100 imágenes) |
---|---|---|---|
Dall-E-3 | Estándar | 1024 * 1024 | $- |
Estándar | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-3 | HD | 1024 * 1024 | $- |
HD | 1024 * 1792, 1792 * 1024 |
$- | |
Dall-E-2 | Estándar | 1024 * 1024 | $- |
Inserción de modelos
Modelos | Por 1 000 tokens |
---|---|
Ada | $- |
text-embedding-3-large | $- |
text-embedding-3-small | $- |
Modelos de voz
Modelos | Precio |
---|---|
Susurro | $-/hora |
TTS (Texto a voz) | $-/1 millón de caracteres |
TTS HD | $-/1 millón de caracteres |
Precios y opciones de compra de Azure
Póngase en contacto con nosotros directamente
Obtenga un tutorial sobre los precios de Azure. Averigüe cómo funcionan los precios para su solución en la nube, descubra cómo se pueden optimizar los costos y solicite una propuesta personalizada.
Hable con un especialista de ventasConozca las opciones de compra
Puede adquirir servicios de Azure en el sitio web de la plataforma y a través de un representante de Microsoft o de un asociado de Azure.
Explore sus opcionesRecursos adicionales
Servicio Azure OpenAI
Obtenga más información sobre las características y funcionalidades de Servicio Azure OpenAI.
Calculadora de precios
Haga una estimación de los costos mensuales que le supondría el uso de cualquier combinación de productos de Azure.
Contrato de nivel de servicio
Revise el Acuerdo de Nivel de Servicio de Servicio Azure OpenAI.
Documentación
Consulte tutoriales técnicos, vídeos y más recursos de Servicio Azure OpenAI.
Preguntas frecuentes
-
Azure OpenAI Service ofrece precios basados en las unidades de procesamiento de pago por uso y aprovisionadas (PTU). El pago por uso permite pagar por los recursos que consume, lo que lo hace flexible para cargas de trabajo variables. Las PTU ofrecen un modelo de precios predecible en el que se reserva e implementa una cantidad específica de capacidad de procesamiento del modelo. Este modelo es ideal para cargas de trabajo con patrones de uso coherentes o predecibles, lo que proporciona estabilidad y control de costes.
-
Para obtener más información sobre los precios de Azure Open AI y las PTU, lea la documentación de PTU o póngase en contacto con nuestro especialista en ventas
Hable con un especialista de ventas para que le explique en detalle los precios de Azure. Conozca el precio de su solución en la nube.
Obtenga servicios en la nube gratuitos y un crédito de $200 para explorar Azure durante 30 días.