Precios de las canalizaciones de datos

Detalles de precios

Azure Data Factory: Precios de las canalizaciones de datos

Los precios de las canalizaciones de datos se basan en:

  • Orquestación y ejecución de canalizaciones
  • Ejecución y depuración de flujos de datos.
  • Número de operaciones de Data Factory, como la creación y supervisión de canalizaciones.

Orquestación y ejecución de canalizaciones de Data Factory

Las canalizaciones son flujos de control con pasos bien diferenciados que se denominan actividades. La orquestación de las canalizaciones de datos se paga por ejecución de actividad y las ejecuciones de actividad se pagan por horas de entorno de ejecución de integración. El entorno de ejecución de integración, que es sin servidor en Azure y autohospedado en escenarios híbridos, proporciona los recursos de proceso usados para ejecutar las actividades en una canalización. Los cargos de Integration Runtime se prorratean por minuto y se redondean al alza.

Por ejemplo, la actividad de copia de Azure Data Factory puede mover datos entre varios almacenes de datos de un modo seguro, confiable, rentable y escalable. Conforme aumenta el volumen de datos o la necesidad de rendimiento, el entorno de ejecución de integración se puede escalar horizontalmente para satisfacer esa necesidad.

Tipo Precio Descripción
Orquestación

$- por 1.000 ejecuciones

Actividad, desencadenador y ejecuciones de depuración

Integration Runtime autohospedado

$- por 1.000 ejecuciones

Ejecución

Azure Integration Runtime

Actividades de movimiento de datos: $-/DIU/hora*

Actividades de canalizaciones: $-/hora**

Externa: $-/hora

Costo de la ejecución de una actividad de Azure Data Factory en la instancia de Azure Integration Runtime

Integration Runtime autohospedado

Actividades de movimiento de datos: $-/hora*

Actividades de canalizaciones: $-/hora**

Externa: $-/hora

Costo de la ejecución de una actividad de Azure Data Factory en un entorno de ejecución de integración autohospedado

* El uso de la actividad de copia para extraer datos de un centro de datos de Azure conlleva cargos adicionales por ancho de banda de red, que aparecerá en la factura como una línea de transferencia de datos de salida aparte. Más información sobre los precios de las transferencias de datos de salida.

** Las actividades de canalización se ejecutan en el entorno de ejecución de integración. Entre las actividades de canalización, se encuentran las de búsqueda, obtención de metadatos, eliminación y las operaciones de esquema durante la creación (probar la conexión, examinar la lista de carpetas y la lista de tablas, obtener el esquema y ver una vista previa de los datos).

*** Las actividades de canalización externas se administran en el entorno de ejecución de integración, pero se ejecutan en servicios vinculados. Entre las numerosas actividades externas, se incluyen las de Databricks, procedimientos almacenados y HDInsight. Consulte aquí para obtener una lista completa de las actividades externas. Para conocer las actividades de Mapping Data Flow, consulte la sección “Ejecución y depuración de Data Factory Data Flow” que se incluye a continuación.

Ejecución y depuración de Data Flow

Las instancias de Data Flow son componentes diseñados visualmente dentro de Data Factory que permiten transformar los datos a escala. Se paga el tiempo de ejecución y depuración del clúster de Data Flow por hora de núcleo virtual. El tamaño mínimo de clúster para ejecutar una instancia de Data Flow es de 8 núcleos virtuales. Los cargos por ejecución y depuración se prorratean por minuto y se redondean al alza. Los descuentos en los precios de la versión preliminar continuarán hasta el 30 de noviembre de 2019.

Tipo Precio Descripción
Proceso optimizado $- por hora de núcleo virtual Flujo de datos basado en proceso optimizado para proceso
Uso general $- por hora de núcleo virtual Flujo de datos basado en proceso de uso general
Memoria optimizada $- por hora de núcleo virtual Flujo de datos basado en proceso optimizado para memoria

Nota: Las instancias de Data Flow en Data Factory también facturarán el almacenamiento administrado, de disco y de blobs necesario para la ejecución y depuración de Data Flow.

Operaciones de Data Factory

Tipo Precio Ejemplos
Lectura o escritura* $- por 50.000 entidades modificadas o a las que se hace referencia Entidades de lectura o escritura en Azure Data Factory*
Supervisión $- por 50.000 registros de ejecución recuperados Supervisión de la canalización, la actividad, el desencadenador y las ejecuciones de depuración**

* Entre las operaciones de lectura o escritura para entidades de Azure Data Factory, se encuentran las de creación, lectura, actualización y eliminación. Las entidades pueden ser conjuntos de datos, servicios vinculados, canalizaciones, entornos de ejecución de integración y desencadenadores.

** Entre las operaciones de supervisión, se encuentran las de obtención y enumeración para canalizaciones, actividad, desencadenadores y ejecuciones de depuración.

Canalizaciones inactivas

Una canalización se considera inactiva si no tiene asociado ningún desencadenador o no se ejecuta durante un mes. Una canalización inactiva se cobra a $- al mes.

Preguntas más frecuentes

  • Entre las operaciones de lectura o escritura, se encuentran las de creación, lectura, actualización y eliminación de entidades de Azure Data Factory. Las entidades pueden ser conjuntos de datos, servicios vinculados, canalizaciones, entornos de ejecución de integración y desencadenadores.
  • Entre las operaciones de supervisión, se encuentran las de obtención y enumeración para canalizaciones, actividad, desencadenadores y ejecuciones de depuración.
  • Una actividad es un paso en una canalización. Cada vez que se ejecuta una actividad, se denomina una ejecución.
  • Un entorno de ejecución de integración es la infraestructura de proceso que usa Azure Data Factory para proporcionar las siguientes características de integración de datos en distintos entornos de red:

    • Movimiento de datos: transferencia de datos entre almacenes de datos en redes públicas y privadas (locales o virtuales), proporcionando compatibilidad con conectores integrados, conversión de formato, asignación de columnas y transferencia de datos eficaz y escalable.
    • Distribución de actividades: distribución y supervisión de actividades de transformación que se ejecutan en una gran variedad de servicios de proceso, como Azure HDInsight, Azure Machine Learning, Azure SQL Database, SQL Server, etc.
    • Ejecución de paquetes de SQL Server Integration Services: ejecución de paquetes de SQL Server Integration Services de forma nativa en un entorno administrado de Azure Compute.
  • Un desencadenador es una unidad de procesamiento que determina cuándo debe iniciarse la ejecución de una canalización. La ejecución de un desencadenador puede producir una ejecución de actividad si se cumplen determinadas condiciones.
  • Una ejecución de depuración es una serie de pruebas que puede realizar un usuario durante una experiencia de desarrollo iterativo para asegurarse de que los pasos de una canalización funcionan correctamente antes de publicar los cambios en Data Factory.
  • Una canalización inactiva es la que no está asociada a ningún desencadenador y tiene cero ejecuciones en un mes. Después de un mes con cero ejecuciones, se generan cargos.
  • Las actividades de ejecución de canalizaciones (movimiento de datos de Azure Integration Runtime, actividades de canalizaciones, movimiento de datos de Integration Runtime externo y autohospedado, y externas) se facturan a la tarifa por hora indicada. Los cargos por ejecución de canalizaciones se prorratean por minuto y se redondean al alza.

    Por ejemplo: Si ejecuta una operación que dura 2 minutos y 20 segundos, se le facturarán 3 minutos.

  • Puede ver ejemplos de precios según la situación en la página de la documentación de Azure Data Factory.

Detalles de precios

El precio del uso de Data Factory se calcula teniendo en cuenta los siguientes factores:

  • La frecuencia de las actividades (alta o baja). Una actividad de baja frecuencia no se ejecuta más que una vez al día (por ejemplo, a diario, semanalmente, mensualmente); una actividad de frecuencia alta se ejecuta más de una vez al día (por ejemplo, cada hora, cada 15 minutos). Vea la sección Orquestación de actividades siguiente para más información.
  • Dónde se ejecutan las actividades (en la nube o local). Vea la sección Movimiento de datos a continuación.
  • Si una canalización está activa o no. Vea la sección Canalizaciones inactivas a continuación.
  • Si está ejecutando de nuevo una actividad. Vea la sección Ejecución de nuevo de actividades a continuación.

Orquestación de actividades

Baja frecuencia Alta frecuencia
Actividades que se ejecutan en la nube

Ejemplos: Actividad de copia que mueve datos de un blob de Azure a una instancia de Azure SQL Database; actividad que ejecuta un script de Hive en un clúster de Azure HDInsight.
$- por actividad por mes $- por actividad por mes
Actividades que se ejecutan en el entorno local y usan un entorno de ejecución de integración autohospedado

Ejemplos: Actividad de copia que mueve datos de una base de datos de SQL Server local a un blob de Azure; actividad que ejecuta un procedimiento almacenado en una base de datos de SQL Server local.
$- por actividad por mes $- por actividad por mes

Notas:

  • Si el uso sobrepasa las 100 actividades al mes, se obtendrá un descuento del 20% en ambos escenarios, de baja y de alta frecuencia.
  • Las primeras 5 actividades de baja frecuencia de un mes son gratis, tanto para las variantes en la nube como locales.

Movimiento de datos

Azure Data Factory puede copiar datos entre diferentes almacenes de datos de una forma segura, confiable, eficaz y escalable. A medida que el volumen de datos o las necesidades de rendimiento del movimiento de datos crecen, Azure Data Factory se puede escalar horizontalmente para satisfacer esas necesidades. Consulte la Guía de rendimiento de la actividad de copia para obtener información sobre el aprovechamiento de las unidades de movimiento de datos para aumentar el rendimiento del movimiento de datos.

Movimiento de datos entre almacenes de datos en la nube $- por hora
Movimiento de datos cuando afecta a un almacén local $- por hora
Nota:
Puede incurrir en gastos de transferencia de datos que se mostrarán como un elemento de la línea de transferencia de datos de salida independiente en la factura. Se aplican cuotas de transferencia de datos de salida cuando los datos salen de los centros de datos de Azure. Vea Información sobre precios de Transferencias de datos para obtener más información.

Canalizaciones inactivas

Debe especificar un período de procesamiento de datos activo mediante un intervalo de fecha y hora (hora de inicio y finalización) para cada canalización que implemente en Azure Data Factory. La canalización se considera activa dentro del período especificado, incluso si sus actividades no se están ejecutando realmente. Se considera inactiva durante las demás horas.

Una canalización inactiva se cobra $- por mes.

Las canalizaciones que permanecen inactivas durante todo un mes se facturan según la tarifa de "canalización inactiva" aplicable para ese mes. Las canalizaciones que permanecen inactivas durante parte de un mes se facturan por sus períodos inactivos de forma prorrateada según el número de horas que están inactivas en ese mes. Por ejemplo, si una canalización tiene una fecha y hora de inicio de 1/01/2016 a las 12:00 a.m. y una fecha y hora de finalización de 20/01/2016 a las 12:00 a.m., se considera que la canalización está activa durante esos 20 días e inactiva durante 11 días. El gasto de una canalización inactiva ($-) se prorratea para 11 días.

Si una canalización no tiene un período de procesamiento de datos activo (una hora de inicio y finalización) especificado, se considera inactiva.

Ejecución de nuevo de actividades

Las actividades pueden ejecutarse de nuevo si es necesario (por ejemplo, si el origen de datos no estaba disponible durante la ejecución planificada). El costo de ejecutar de nuevo actividades varía en función de la ubicación donde se ejecuta la actividad. El costo de la ejecución de nuevo de las actividades en la nube es de $- por 1.000 ejecuciones de nuevo. El costo de la ejecución de nuevo de las actividades locales es de $- por 1.000 ejecuciones de nuevo.

Ejemplo

Suponga que dispone de una canalización de datos con las siguientes dos actividades que se ejecutan una vez al día (frecuencia baja):

  1. Una actividad de copia que copia datos de una base de datos de SQL Server local a un blob de Azure.
  2. Una actividad de Hive que ejecuta un script de Hive en un clúster de Azure HDInsight.

Presuponga que tarda 2 horas al día en mover datos de Base de datos de SQL Server local a Almacenamiento de blobs de Azure. La siguiente tabla muestra los costos asociados a la canalización:

Primera actividad (copia de datos de local a Azure)
Costo de movimiento de datos (al mes) 30 días al mes
2 horas al día
$-
$-
Coste de la orquestación de actividades (al mes) $-
Subtotal (al mes) $-
Segunda actividad (un script de Hive que se ejecuta en Azure HDInsight)
Costo de movimiento de datos (al mes) $-
Coste de la orquestación de actividades (al mes) $-
Subtotal (al mes) $-
Actividades totales (al mes) $-

También puede usar la Calculadora de precios de Data Factory para calcular los gastos de este escenario.

Notas:

  • No se cobra nada por las primeras cinco actividades locales y en la nube. Los gastos mencionados anteriormente se aplican teniendo en cuenta que ya ha usado las cinco actividades locales y en la nube al mes (en otras canalizaciones).
  • Los servicios HDInsight y Azure Storage se cobran por separado según las tarifas de servicio.

Soporte técnico y contrato de nivel de servicio 

  • Soporte de facturación y administración de suscripciones gratuito.
  • Planes de soporte flexibles desde $29/mes. Comprar un plan
  • Garantizamos que, al menos el 99,9 % del tiempo, se procesarán correctamente las solicitudes para realizar operaciones con recursos de Factoría de datos.
  • Garantizamos que, al menos el 99,9 % del tiempo, todas las actividades se iniciarán dentro de los 4 minutos siguientes a su hora de ejecución programada.
  • Para obtener más información sobre el acuerdo de nivel de servicio, visite la página del acuerdo de nivel de servicio.

Preguntas más frecuentes

  • Las actividades definen las acciones que realizar en los datos. Cada actividad toma cero o más conjuntos de datos como entradas y produce uno o más conjuntos de datos como salida. Una actividad es una unidad de orquestación en Azure Data Factory.

    Por ejemplo, puede usar una actividad de copia para orquestar los datos de copia de un conjunto de datos a otro. De forma similar, puede usar una actividad de Hive para ejecutar una consulta de Hive en un clúster de Azure HDInsight para transformar o analizar los datos. Azure Data Factory proporciona una amplia gama de actividades de transformación de datos y movimiento de datos. Puede elegir crear una actividad .NET personalizada para ejecutar su propio código.

  • Una canalización es una agrupación lógica de actividades. Las canalizaciones pueden estar activas durante un período especificado por el usuario (hora de inicio y finalización). Las canalizaciones están inactivas durante las demás horas.
  • Sí. Si la actividad utiliza servicios de Azure como HDInsight, estos servicios se facturan por separado en función de sus tarifas por servicio.

  • Hay dos conjuntos de costos en los que se incurre al realizar una copia de datos. Primero, los recursos de proceso que se usan para realizar la copia están representados por el medidor de movimiento de datos. Hay versiones en la nube y locales del medidor de movimiento de datos y el movimiento de datos local es menos caro, porque una parte del proceso asociada a la copia la realizan sus propios recursos locales. Los gastos de movimiento de datos se prorratean por minuto y se redondean. (Por ejemplo, se cobrarán 42 minutos para una copia de datos con un tiempo de proceso de 41 minutos y 23 segundos ).

    En segundo lugar, puede incurrir en gastos de transferencia de datos que se mostrarán como un elemento de la línea de transferencia de datos de salida independiente en la factura. Se aplican cuotas de transferencia de datos de salida cuando los datos salen de los centros de datos de Azure. Vea Información sobre precios de Transferencias de datos para obtener más información.