Precios de Cognitive Services

Use API de inteligencia para habilitar funcionalidades de visión, lenguaje y búsqueda.

Precios

Para obtener más opciones sobre las ofertas de API individuales, seleccione una oferta en el menú desplegable anterior.

QnA Maker, Speech Services y Custom Vision actualmente solo están disponibles como API individuales.

Producto Características Precio
Computer Vision S1
hasta 10 solicitudes por segundo
Etiqueta
Face
GetThumbnail
Color
Tipo de imagen
GetAreaOfInterest
De 0 a 1M de transacciones — $- por 1000 transacciones
De 1M a 5M de transacciones — $- por 1000 transacciones
De 5M a 10M de transacciones — $- por 1000 transacciones
De 10M a 100M de transacciones — $- por 1000 transacciones
Más de 100M de transacciones — $- por 1000 transacciones
OCR
Adultos
Celebridad
Lugar de interés
Detectar, objetos
Marca
De 0 a 1M de transacciones — $- por 1000 transacciones
De 1M a 5M de transacciones — $- por 1000 transacciones
De 5M a 10M de transacciones — $- por 1000 transacciones
De 10M a 100M de transacciones — $- por 1000 transacciones
Más de 100M de transacciones — $- por 1000 transacciones
Describir+
Reconocer texto*
Lectura
$- por 1000 transacciones
Content Moderator S0
hasta 10 solicitudes por segundo
Moderado, Revisar De 0 a 1 millón de transacciones - $- por 1.000 transacciones
De 1 a 5 millones de transacciones - $- por 1.000 transacciones
5 a 10 millones de transacciones - $- por 1.000 transacciones
Más de 10 millones de transacciones - $- por 1.000 transacciones
Face Estándar
hasta 10 solicitudes por segundo
Detección de caras
Comprobación de caras
Identificación de caras
Agrupación de caras
Búsqueda de caras parecidas
De 0 a 1 millón de transacciones - $- por 1000 transacciones
De 1 a 5 millones de transacciones - $- por 1000 transacciones
De 5 a 100 millones de transacciones - $- por 1000 transacciones
Más de 100 millones de transacciones - $- por 1000 transacciones
Almacenamiento de caras $- por 1000 caras al mes

Computer Vision S1: A los clientes se les cobra por transacción, no por llamada API. Obtenga más información sobre las transacciones a continuación.

* Productos en versión preliminar

+ Los idiomas distintos del inglés están en versión preliminar

** TPS se aplica solo a puntos de conexión web

Producto Características Precio
Language Understanding Estándar
hasta 50 solicitudes por segundo
Solicitudes de texto $- por 1000 transacciones
Solicitudes de voz $- por 1000 transacciones
Análisis de texto Estándar
hasta 100 solicitudes por segundo y 1.000 solicitudes por minuto
Análisis de sentimiento
Extracción de frases clave
Detección de idioma
Reconocimiento de entidades con nombre (sin disponibilidad en el contenedor)
0-500.000 registros de texto — $- por 1.000 registros de texto
De 0,5 M a 2,5 M de registros de texto — $- por 1.000 registros de texto
De 2,5 M a 10,0 M de registros de texto — $- por 1.000 registros de texto
Más de 10 M de registros de texto — $- por 1.000 registros de texto
Translator Text S1 Traducción de texto
Personalización
Detección de idioma
Diccionario bilingüe
Transliteración
$- por millón de caracteres (Pago por uso)
Producto Características Precio
Bing Search S1
hasta 250 solicitudes por segundo
Bing Web Search
Bing Image Search
Bing News Search
Bing Video Search
Bing Entity Search
Bing Autosuggest*
Bing Spell Check*
$7 por 1.000 transacciones
$7 por 25.000 transacciones*
Complemento opcional de Estadísticas de Bing $1 por 1.000 transacciones
Bing Search S9
hasta 30 solicitudes por segundo
Bing Visual Search $3 por 1.000 transacciones
Complemento opcional de Estadísticas de Bing $1 por 1.000 transacciones
Bing Custom Search S3
hasta 150 solicitudes por segundo
Bing Custom Search con las características Image Search, Video Search y Estadísticas $6 por 1.000 transacciones

Bing Search S1:

Las respuestas de Web Search incorporarán y clasificarán respuestas sobre resultados web, imágenes, noticias, vídeos, entidades y búsquedas relacionadas apropiadas para las consultas. Se incluirá la corrección ortográfica en la respuesta de la consulta. Este conjunto incluye también respuestas adicionales tales como la zona horaria, las unidades de conversión, la traducción y la calculadora cuando corresponda y la posibilidad de llamar a las Auto Suggest API* y Spell Check API*.

Bing Search S9:

La oferta de Bing Visual Search proporcionará información contextual a partir de imágenes o URL de imágenes.

Bing Custom Search S3:

Este nivel clasificará las páginas web relevantes para una consulta determinada que satisfaga la configuración de instancias de Custom Search. Características como agregar sitios, bloquear sitios, anclar sitios, almacenar provisionalmente instancias y compartir instancias se configuran fácilmente y se admiten a través del portal de creación.

Con este conjunto de productos, también puede buscar imágenes y vídeos en los dominios seleccionados e incorporarlos en las páginas de búsqueda además de las páginas web para una experiencia de usuario más completa. Con un punto de conexión independiente, puede seleccionar entre seguir solo imágenes o vídeos, o bien páginas web, imágenes y vídeos de manera conjunta. Este conjunto de productos también incluye la característica Estadísticas, que se puede usar para analizar el uso de la instancia de Custom Search. Puede recopilar métricas tales como volumen de llamadas, consultas principales, distribución de código de respuesta de API y distribución del mercado, etc.

Soporte técnico y contrato de nivel de servicio 

  • Se incluye soporte técnico gratis de facturación y administración de suscripciones
  • Se garantiza una disponibilidad del 99,9 por ciento del tiempo para Cognitive Services en el nivel Estándar. No se ofrece ningún contrato de nivel de servicio con la versión de evaluación gratuita. Lea el Acuerdo de Nivel de Servicio (SLA).

Preguntas más frecuentes

Computer Vision API

  • Consulte la documentación para obtener una descripción más detallada de estas operaciones.

    • Tag: Computer Vision API devuelve etiquetas basadas en más de 2,000 objetos reconocibles, seres vivos, paisajes y acciones. En los casos en que las etiquetas puedan resultar ambiguas o sean poco conocidas, la respuesta de la API ofrece "sugerencias" para aclarar el significado de la etiqueta.
    • Face: detecta rostros humanos dentro de una imagen.
    • GetThumbnail: después de cargar una imagen, GetThumbnail genera una miniatura de alta calidad. El algoritmo de Computer Vision API analiza los objetos dentro de la imagen y después la recorta para ajustarla a los requisitos de la región de interés.
    • Color: el algoritmo de Computer Vision extrae los colores de una imagen. Los colores se analizan en tres contextos diferentes: primer plano, segundo plano y completo. Los colores se agrupan en 12 colores de énfasis dominantes.
    • Tipo de imagen: Computer Vision API puede establecer una marca booleana para indicar si una imagen está en blanco y negro o en color, así como usar el mismo método para indicar si una imagen es un dibujo de línea o no. El tipo de imagen también indica si se trata de una imagen prediseñada o no y cuál es la calidad.
    • OCR: la tecnología del reconocimiento óptico de caracteres (OCR) detecta el contenido de texto de una imagen. El texto identificado se extrae en un flujo de caracteres de lectura mecánica para fines de búsqueda y muchos otros propósitos, que abarcan desde historias clínicas hasta seguridad y banca. Detecta automáticamente el idioma. OCR ahorra tiempo y proporciona comodidad a los usuarios, ya que les permite simplemente realizar fotos del texto en lugar de tener que transcribirlo. Consulte la documentación para conocer los idiomas compatibles.
    • Adulto: aplique la configuración para adultos para habilitar la restricción automatizada de contenido para adultos en imágenes.
    • Celebridad: el modelo de reconocimiento de celebridades de Azure reconoce 200,000 celebridades de los negocios, la política, el deporte y el espectáculo de todo el mundo.
    • Analizar: invoque varias operaciones al mismo tiempo. Especifique qué funciones desea ejecutar, y la API las ejecutará todas juntas. Cada operación incluida en la operación de "análisis" se contará como una transacción independiente.
  • Para el reconocimiento de texto, cada llamada POST cuenta como una transacción. Todas las llamadas GET para ver los resultados del servicio asincrónico se cuentan como una transacción, pero son gratuitas. Para todas las demás operaciones, cada llamada de característica cuenta como una transacción, ya sea que se llame independientemente o se agrupe a través de la llamada Analizar. Las llamadas Analizar se utilizan para facilitar la llamada a la API, pero cada característica utilizada cuenta como una transacción. Por ejemplo, una llamada Analizar que contenga Etiqueta, Cara y Adulto contará como tres transacciones.

    Consulte la documentación para una lista completa y descripciones detalladas de las operaciones.

  • Cada operación invocada (de forma individual o a través de operaciones de "análisis") se contará como una transacción. La factura total se basará en el número de transacciones de cada tipo de operación durante un período de facturación mensual.

    Para concretar un ejemplo, supongamos que realiza las siguientes llamadas durante un período de facturación mensual específico:

    • 1,500,000 Operaciones de análisis; cada una invoca operaciones de etiquetas y descripción
    • 500,000 Operaciones de OCR
    • 4,000,000 Operaciones de Reconocimiento de texto

    La factura total se basará en lo siguiente:

    Operaciones Recurso Cálculos Subtotal
    1,500,000 Operaciones de etiquetas y 1,500,000 rostros: S1 transacciones 1,000,000 primeras transacciones: $-/1000 * 1,000,000 = $-
    2,000,000 transacciones restantes: $-/1000 * 2,000,000 = $-
    $-
    500,000 Operaciones de OCR: S2 transacciones $-/1000 * 500,000 = $- $-
    1,500,000 operaciones de descripción y 4,000,000 de reconocimiento de texto: S3 transacciones $-/1000 * 5,500,000 = $- $-
    Total $- $-

Content Moderator

  • Cuando utilice la API, las imágenes necesitan tener un mínimo de 128 píxeles y un tamaño máximo de archivo de 4MB. El texto puede tener 1024 caracteres como máximo.

  • La API de texto devolverá un código de error que informa que el texto es más largo del permitido. La API de imágenes también devolverá un código de error que informa que la imagen no cumple los requisitos de tamaño.

  • La herramienta de revisión humana se incluye en su suscripción.

API de reconocimiento facial

  • Para las operaciones que permiten un aprendizaje con una escala de millones (disponible a partir del 1 de marzo de 2018), se cuenta una transacción por cada 1.000 imágenes entrenadas. "LargePersonGroup - Train" y “LargeFaceList - Train” pertenecen a esta categoría. Cada operación de esta categoría se redondea al incremento más próximo a 1.000 imágenes. Por ejemplo, una operación "LargeFaceList - Train" que incluye 849.500 imágenes se contará como 850 transacciones.

    Para todas las demás operaciones, cada llamada API se contará como una transacción.

    Consulte la documentación para obtener una lista completa y descripciones detalladas de las operaciones.

  • El almacenamiento de caras permite que una suscripción almacene más caras persistentes cuando se utilizan objetos Person y listas de caras para la identificación o la comparación de similitud con Face API.

  • Las caras almacenadas se cobran a $- por 1.000 caras y esta tarifa se prorratea por días.

    Por ejemplo, si la cuenta usó 10.000 caras almacenadas cada día durante la primera mitad del mes y ninguna la segunda mitad, se le cobraría solo por las 10.000 caras durante los días de almacenamiento. Por tanto, el cálculo es ($-/1.000) * (10.000*15 + 0*16)/31 = $-

    Otro ejemplo: si cada día del mes almacena 1.000 caras durante unas horas y luego las elimina por la noche, se le facturarán 1.000 caras almacenadas cada día.

  • La cuota para el número de grupos de personas almacenados es ahora de 1 millón, con un máximo de 1 millones de personas por grupo de personas o lista de caras.

LUIS

  • Para las solicitudes de texto, una transacción es una llamada API con una longitud de consulta de hasta 500 caracteres.

    Para las solicitudes de voz, una transacción es una expresión con una longitud de consulta de hasta 15 segundos.

  • No, el nivel Gratis solo incluye solicitudes de texto con una longitud máxima de 500 caracteres.

  • Dispatch es una característica que permite procesar dos modelos o aplicaciones con una sola llamada API.

Análisis de texto

  • Text Analytics API se puede adquirir en unidades de los niveles S0-S4 a un precio fijo. Cada unidad de un nivel incluye determinadas cantidades de transacciones de API. Si el usuario supera las cantidades incluidas, el uso por encima del límite se factura a la tarifa que se especifica en la tabla de precios anterior. Este uso por encima del límite se prorratea y el servicio se factura mensualmente. Las cantidades incluidas en un nivel se restablecen cada mes. En el nivel S, únicamente se factura la cantidad de registros de texto enviados al servicio.
  • En el nivel Gratis, el uso está sujeto al límite de transacciones. Los clientes no pueden acumular uso por encima del límite en el nivel Gratis.
  • Cualquier anotación en un documento cuenta como una transacción. Las llamadas de puntuación por lotes tienen también en cuenta el número de documentos que deben puntuarse en esa transacción. Por ejemplo, si se envían 1.000 documentos para análisis de sentimiento en una única llamada API, contarán como 1.000 transacciones. Si una API admite más de una operación de anotación, también se tendrá en cuenta. Imaginemos que una llamada API lleva a cabo un análisis de sentimiento y una extracción de frases clave en 1.000 documentos. Esto contará como 2.000 transacciones (2 anotaciones × 1.000 documentos).
  • Si se supera el uso en el nivel S0-S4, la cuenta comienza a acumular uso por encima del límite. Este uso por encima del límite se factura mensualmente y se calcula a la tarifa especificada para cada nivel.
  • Puede actualizar a un nivel superior en cualquier momento. La tarifa de facturación y las cantidades incluidas correspondientes al nivel superior empezarán a aplicarse de inmediato.
  • En el nivel S, un registro de texto contiene hasta 1.000 caracteres medidos por StringInfo.LengthInTextElements. Si un documento de entrada enviado a Text Analytics API tiene más de 1.000 caracteres, cuenta como un registro de texto por cada unidad de 1.000 caracteres. Por ejemplo, si un documento de entrada enviado a la API contiene 7.500 caracteres, contará como 8 registros de texto. Si un documento de entrada enviado a la API contiene 500 caracteres, contará como 1 registro de texto. Si se envían dos documentos, uno de 500 caracteres y otro de 1.200 caracteres, se facturarán tres registros de texto en total: un registro para el documento de 500 caracteres y dos registros de texto para el documento de 1.200 caracteres.

Bing Custom Search

  • No, Bing Custom Search está diseñada para satisfacer las ofertas específicas de cada nivel. Por ejemplo, el nivel S3 está pensado para clientes que solo quieren usar resultados web personalizados y resultados de imágenes personalizados en el conjunto seleccionado de dominios. El nivel S3 ofrece también funcionalidades estadísticas. La respuesta de la API variará en función del punto de conexión al que se llame en un nivel concreto. Cada punto de conexión tiene su propio esquema de respuesta.

  • Estos son los distintos puntos de conexión:

    • Bing Custom Search (punto de conexión de Custom Web Search)
    • Bing Custom Search con la característica Image Search (punto de conexión de Custom Image Search)
  • El precio de los niveles se basa en el número de transacciones. Por ejemplo, en el nivel S3, el precio por 1.000 transacciones es $6 y en el nivel S4, el precio por 10.000 transacciones es $4. Al final del período de facturación, si se registran 20.000 transacciones en el nivel S3 y 40.000 transacciones en el nivel S4, el total será $136, calculado de la siguiente manera: $6*(20.000/1.000) + $4*(40.000/10.000).

  • Estadísticas se ofrece como parte de los niveles S2 y S3. En las 24 horas siguientes a la realización de una llamada a la API Web o Image de Bing Custom Search con la clave del nivel S2 o el nivel S3, empezarán a rellenarse las estadísticas de los gráficos del portal de creación. Puede recopilar métricas tales como volumen de llamadas, consultas principales, distribución de código de respuesta de API y distribución del mercado, etc.

  • La característica Autosuggest personalizada se ofrece como nivel independiente del nivel S4. La característica Autosuggest personalizada puede comprarse por separado e incorporarse para obtener sugerencias automáticas en los niveles S1, S2 o S3. Por ejemplo, si un cliente quiere utilizar el nivel S1 y el nivel S4, tendrá que comprar los dos niveles por separado y la facturación funcionará de la siguiente manera:

    Si un cliente ha usado un total de 3.000 transacciones en el nivel S1 y un total de 40.000 transacciones en el nivel S4, el total de facturación será $28, calculado de la siguiente manera: $4*(3.000/1.000) + $4*(40.000/10.000).

  • La traducción estándar es un proceso sencillo de un solo paso en el que se proporciona una oración de entrada y los modelos ya entrenados de Azure la traducen a un idioma de destino. Por el contrario, la traducción personalizada es un proceso de dos pasos en el que primero entrena sus propios modelos con los datos de entrenamiento que usted carga en el servicio de traducción. Una vez entrenado su modelo, puede traducir igual que haría con la traducción estándar.

  • Hay tres actividades facturables que se llevan a cabo durante la traducción personalizada:

    1. Hospedaje de modelos: hospedar un modelo significa que esté disponible para la traducción personalizada. Se cobra una tarifa plana por cada modelo hospedado durante un período de facturación. Esta tarifa NO se prorratea si el modelo se hospeda durante un período inferior a un mes completo.
    2. Entrenamiento: cada vez que entrena un modelo, se le cobra una tarifa por cada carácter de los datos de entrenamiento. Se cobran los caracteres tanto del idioma de origen como del idioma de destino del conjunto de entrenamiento, pero hay un límite para la cantidad que se puede cobrar por cada ejecución de entrenamiento, independientemente de los caracteres que haya en los datos de entrenamiento. Este límite se aplica a cada ejecución de entrenamiento, es decir, sí se le cobrará si vuelve a ejecutar el mismo conjunto.
    3. Traducción: se cobran todos los caracteres del texto traducido por su modelo de traducción personalizada.
  • Los niveles S1-S4 están diseñados para ofrecer descuentos a los usuarios que requieren volúmenes elevados de traducción estándar (no traducción personalizada) cada mes. Si bien se ofrece un descuento sobre la tarifa de la traducción estándar, los niveles S1-S4 no incluyen ningún descuento para la traducción personalizada. Los niveles C2-C4 están pensados para ofrecer descuentos a los clientes que ejecutan grandes volúmenes de traducción personalizada con regularidad. Si bien se ofrece un descuento sobre la tarifa de la traducción personalizada, los niveles C2-C4 no incluyen ningún descuento para la traducción estándar.

  • Para obtener descuentos por volumen tanto en la traducción estándar como en la traducción personalizada, debe asignar una instancia S1-S4 Y una instancia C2-C4, dirigiendo la traducción estándar a la instancia S y la traducción personalizada a la instancia C.

Recursos

Calcule el costo mensual de los servicios de Azure

Consulte las preguntas más frecuentes sobre los precios de Azure

Más información acerca de Cognitive Services

Consulte tutoriales técnicos, vídeos y más recursos

Agregado al presupuesto. Presione 'v' para verlo en la calculadora Véalo en la calculadora

Aprenda y cree soluciones con un crédito de $200 y continúe gratis