La explosión de la toma de decisiones basada en datos está motivando a las empresas a tener una estrategia de datos para proporcionar una experiencia mejor al cliente, mejorar la eficacia operativa y tomar decisiones en tiempo real basadas en datos. A medida que las empresas se rigen por los datos, vemos más y más clientes que crean lagos de datos en Azure. También oímos que la optimización de los costos y el aumento del rendimiento son dos de las características más importantes de la arquitectura de los lagos de datos en Azure. Normalmente, estas dos características se contrarrestan entre sí, es decir, si desea obtener más rendimiento, deberá pagar más; si desea ahorrar dinero, lo normal es que la curva de rendimiento baje.
Este es el motivo por el que hoy anunciamos la versión preliminar de Aceleración de consultas para Azure Data Lake Storage, una nueva característica de Azure Data Lake Storage que mejora el rendimiento y el costo. La característica ya está disponible para que los clientes puedan comenzar a disfrutar de estas ventajas y mejorar la implementación de sus lagos de datos en Azure.
Por qué Aceleración de consultas para Azure Data Lake mejora el rendimiento y el costo
Los marcos de análisis de macrodatos, como Spark, Hive y las aplicaciones de procesamiento de datos a gran escala, funcionan leyendo todos los datos usando una plataforma informática distribuida que se puede escalar horizontalmente con técnicas como MapReduce. Sin embargo, una consulta o transformación determinada no suele necesitar todos los datos para alcanzar su objetivo. Por tanto, las aplicaciones suelen incurrir en costos de lectura, transferencia a través de la red, análisis en la memoria y, por último, filtrado de la mayoría de los datos que no son necesarios. Dada la escala de estas implementaciones de lagos de datos, los costos se convierten en un factor importante que afecta al diseño y a lo ambicioso que se puede ser. La mejora del costo y el rendimiento al mismo tiempo aumenta la cantidad de información útil que puede extraer de sus datos.
Aceleración de consultas para Azure Data Lake Storage permite a las aplicaciones y marcos pasar predicados y proyecciones de columnas para que se apliquen en el momento en el que se leen los datos por primera vez, lo que significa que, en el procesamiento del resto de los datos, se ahorra el costo de filtrar y procesar los datos innecesarios.
En el diagrama siguiente se muestra cómo una aplicación típica utiliza Aceleración de consultas para procesar datos:
- La aplicación cliente solicita datos de archivo especificando los predicados y las proyecciones de columnas.
- Aceleración de consultas analiza la consulta especificada y distribuye el trabajo para analizar y filtrar los datos.
- Los procesadores leen los datos del disco, los analizan con el formato adecuado y los filtran aplicando los predicados y las proyecciones de columna especificados.
- Aceleración de consultas combina las particiones de respuesta para devolver el flujo a la aplicación cliente.
- La aplicación cliente recibe y analiza la respuesta transmitida. La aplicación no necesita filtrar ningún dato más y puede aplicar directamente la transformación o el cálculo deseado.
Azure ofrece servicios de análisis muy eficaces
Aceleración de consultas para Azure Data Lake Storage es un ejemplo más de nuestro compromiso por hacer que Azure sea el mejor lugar para que las organizaciones obtengan información transformadora de todos sus datos. Los clientes pueden beneficiarse de la estrecha integración con otros servicios de Azure para crear soluciones de análisis integrales a escala de nube. Estas soluciones ofrecen un almacenamiento de datos moderno, análisis avanzados y análisis en tiempo real de forma sencilla y más económica.
También tenemos el compromiso de seguir siendo una plataforma abierta donde las mejores soluciones de código abierto se beneficien también de las innovaciones que se producen en todas las áreas de la plataforma. Con Azure Data Lake Storage como base de un ecosistema completo de servicios de análisis muy eficaces, los clientes puedan extraer información transformadora de todos sus recursos de datos.
Más información
Para obtener más información sobre Aceleración de consultas para Azure Data Lake Storage:
- Regístrese para participar en la versión preliminar de Azure Data Lake Storage.
- Consulte la documentación de Azure Data Lake Storage.
- Aprenda a usar Aceleración de consultas para Java y .NET.
- Conozca el modelo de precios de Aceleración de consultas.
- Obtenga más información acerca de Azure Data Lake Storage.