Omitir navegación

Azure simplifica el análisis en la nube

Publicado el 27 junio, 2018

Corporate Vice President, Microsoft Azure for Operators
Desde el 7 de febrero de 2019, Azure Data Lake Gen 2 está disponible con carácter general. Si desea obtener más información, consulte la entrada de blog “Geniales por separado, sin parangón en conjunto: anuncio de actualizaciones en tres magníficos servicios de Azure Data Services”.

El panorama empresarial actual se rige por los datos. El análisis y la inteligencia artificial son ahora fundamentales para hacer posible la transformación. Nuestros clientes se han beneficiado enormemente del rendimiento, la flexibilidad y el bajo costo que ofrece Azure para las cargas de trabajo de inteligencia artificial (IA) y análisis. Hoy presentamos nuevas características de Azure que facilitan la entrega, la creación y la administración de soluciones de IA y análisis muy eficaces.

En primer lugar, estamos encantados de anunciar la versión preliminar de Azure Data Lake Storage Gen2, el único lago de datos a escala de nube diseñado específicamente para cargas de trabajo críticas de IA y análisis. Azure Data Lake Storage Gen2 combina las ventajas de escalabilidad y costo del almacenamiento de objetos con la confiabilidad y el rendimiento que ofrecen las características de sistema de archivos de Hadoop.

Nos complace también anunciar la disponibilidad general de nuevas características en Azure Data Factory. Ahora se ha simplificado muchísimo la integración de datos de varios orígenes para validarlos, enriquecerlos y transformarlos con el fin de obtener conclusiones.

Esta evolución de la cartera de soluciones de análisis de Microsoft facilita a los clientes la integración de orígenes de datos diferentes, así como el almacenamiento y el procesamiento posterior de grandes cantidades de datos a menor costo para agilizar su transformación digital.

Azure Data Lake Storage avanza un paso más

Algunas soluciones de análisis, como Hadoop, se han diseñado suponiendo que se ejecutarán en sistemas de archivos con escalabilidad horizontal. Otros proveedores integran estas soluciones con dificultad combinando una emulación de un sistema de archivos en el lado cliente y almacenes de objetos con escasas características. Esto da lugar a un rendimiento pobre y una confiabilidad incoherente, lo que, en definitiva, compromete la calidad.

Azure Data Lake Storage Gen2 ofrece un lago de datos sin comprometer nada. Unifica las capacidades básicas de la primera generación de Azure Data Lake Storage con un punto de conexión de un sistema de archivos compatible con Hadoop que se integra directamente en Azure Blob Storage. Esta mejora combina las ventajas de escala y costo del almacenamiento de objetos con la confiabilidad y el rendimiento que, normalmente, solo se asocian a sistemas de archivos locales. Este nuevo sistema de archivos incluye un espacio de nombres jerárquico completo que convierte los archivos y las carpetas en ciudadanos de primera, lo que se traduce en una ejecución más rápida y confiable de los trabajos analíticos.

Azure Data Lake Storage Gen2 incluye también almacenamiento ilimitado, de modo que puede satisfacer las necesidades de las cargas de trabajo más grandes y complejas. Además, Azure Data Lake Storage Gen2 se integra de forma nativa con Azure Active Directory y admite listas ACL compatibles con POSIX para habilitar la asignación pormenorizada de permisos de acceso a archivos y carpetas.

Puesto que Azure Data Lake Storage Gen2 se integra totalmente con Blob Storage, los clientes pueden acceder a los datos a través de las nuevas API orientadas a un sistema de archivos o las API de almacén de objetos de Blob Storage. Los clientes tienen también todas las ventajas de Azure Blob Storage, como el cifrado en reposo, el almacenamiento por niveles de objeto y las directivas de ciclo de via, además de las características de alta disponibilidad y recuperación ante desastres, como ZRS y GRS. Todo esto se ofrecerá con un costo inferior y un TCO global más bajo para los proyectos de análisis de los clientes. Azure Data Lake Storage Gen2 es el lago de datos más completo disponible en cualquier parte. Cuando Azure Data Lake Storage Gen2 esté disponible con carácter general, lo estará en todas las regiones de Azure.

Con el fin de permitir una experiencia homogénea con los proveedores de código abierto más destacados de los motores de análisis Hadoop y Spark, estamos colaborando estrechamente con nuestros asociados para que Azure Data Lake Storage Gen2 sea la solución de lago de datos más optimizada para los clientes.

“Como asociado fundamental, Cloudera ha colaborado estrechamente con Microsoft desde nuestra integración de CDH con la primera generación de Azure Data Lake. Estamos seguros de que Azure Data Lake Storage Gen2 ofrecerá una experiencia superior para nuestros clientes de CDH, especialmente desde el punto de vista del rendimiento y la estabilidad. Estamos encantados de anunciar nuestro compromiso de proporcionar compatibilidad total de la plataforma con Azure Data Lake Storage Gen2”.

- Vikram Makhija, director general para la nube, Cloudera

Integración de datos simplificada con Azure Data Factory

Con la proliferación de los macrodatos, las organizaciones ya no quieren verse agobiadas con la complejidad que supone la integración de sus datos para obtener las conclusiones analíticas que sus negocios requieren. Las nuevas características de Azure Data Factory, que ya están disponibles con carácter general, el servicio de integración y la ingesta de datos basada en la nube de Azure facilitan más que nunca la obtención de conclusiones que permitan tomar medidas a partir de datos sin procesar.

Con una interfaz gráfica de usuario que permite arrastrar y colocar, los ingenieros de datos y los desarrolladores pueden crear, programar y administrar la integración de datos a escala de forma rápida y sencilla. Ahora Azure Data Factory admite la ingesta de datos sin código de más de 70 conectores de orígenes de datos para agilizar el movimiento de los datos entre el entorno local, la nube y las aplicaciones. Hemos creado también una versión preliminar de un conector nativo de Azure Data Factory disponible para Azure Data Lake Storage Gen2, de modo que los clientes pueden aprovechar Azure Data Lake Storage Gen2 y migrar datos fácilmente desde otros orígenes, incluida la primera generación de Azure Data Lake.

Los ingenieros de datos y los desarrolladores también pueden migrar fácilmente paquetes de SQL Server Integration Services (SSIS) a Azure y dejar que Azure Data Factory administre sus recursos. De este modo, consiguen alta escalabilidad y disponibilidad al tiempo que reducen los costos operativos. La consultora de análisis de datos con sede en Londres Concentra Analytics ha logrado una reducción del 80 % en el tiempo de desarrollo de almacenamiento de datos automatizado al mover sus paquetes SSIS a Azure.

“No tenemos problemas para trabajar con clientes que tienen datos distribuidos en orígenes que están en el entorno local y en la nube, incluso los que tienen conjuntos de datos de gran tamaño. Con Azure Data Factory, nuestros clientes utilizan los paquetes SSIS generados automáticamente de DataPlus publicados en Azure para obtener escalabilidad”.

- Weelin Lim, director de Inteligencia empresarial, Concentra Analytics

Azure es donde mejor estarán los análisis

Tenemos el compromiso de hacer que Azure sea el mejor lugar para que las organizaciones obtengan conclusiones que estaban ocultas en sus datos con el fin de agilizar la innovación. Los clientes se pueden beneficiar de la perfecta integración con otros servicios de Azure para crear soluciones analíticas integrales a escala de nube y muy eficaces para sustentar almacenes de datos modernos, análisis avanzado y análisis en tiempo real de un modo fácil y más económico.

Macrodatos y análisis avanzado

Si desea saber más sobre Azure Data Lake Storage, puede hacer lo siguiente:

Si desea saber más sobre Azure Data Factory, puede hacer lo siguiente: