EN VERSIÓN PRELIMINAR

La velocidad de los trabajos de Apache Spark es hasta nueve veces superior con Caché de E/S de HDInsight

Fecha de publicación: 31 octubre, 2018

Caché de E/S de HDInsight está disponible en versión preliminar en los últimos clústeres de Apache Spark en Azure HDInsight. Una vez habilitada, esta característica mejora el rendimiento de los trabajos de Spark de un modo totalmente transparente, sin necesidad de realizar cambios en los trabajos. Además, el tiempo de ejecución de las consultas puede ser hasta nueve veces mejor. Esto proporciona una relación costo-rendimiento excelente de las implementaciones de Spark basadas en la nube. Caché de E/S de HDInsight es una nueva características de almacenamiento transparente de datos en caché. Está basada en RubiX, que utiliza los últimos avances en la tecnología SSD para evitar la administración de memoria explícita y permite hacer un uso óptimo de los recursos con el fin de mejorar el rendimiento. 

Más información

  • Services