Questions? Feedback? powered by Olark live chat software
Omitir navegación

HDInsight

Utilice fácilmente un servicio en la nube administrado de Apache Hadoop, Spark, R, HBase y Storm administrados

Conjunto completo de proyectos de macrodatos de Apache administrados

Escale con total flexibilidad a petición

Azure HDInsight es una distribución de Apache Hadoop basada en la nube. Esto significa que puede controlar cualquier cantidad de datos por su capacidad para escalar de terabytes a petabytes a petición. Ponga en marcha cualquier número de nodos y en cualquier momento. Solo se le cobrará por el proceso y el almacenamiento que utilice.

Beth Israel Deaconess Medical Center
Como parte de nuestros requisitos de auditoría, conservamos los datos durante siete años. Además, determinada información debe conservarse hasta 30 años. Con HDInsight, podemos almacenar más datos y consultarlos según sea necesario.

–Don Wood, Beth Israel Deaconess Medical Center

Azure HDInsight ofrece servicios en la nube para administrar cualquier cantidad de datos
Los servicios en la nube de Hadoop permiten analizar fácilmente grandes cantidades de datos

Procese todos los datos: estructurados, semiestructurados y no estructurados

Puesto que es 100 % Apache Hadoop, HDInsight puede procesar datos no estructurados o semiestructurados de secuencias de clics en la Web, medios sociales, registros de servidor, dispositivos y sensores, etc. Esto permite analizar nuevos conjuntos de datos y descubrir nuevas posibilidades de negocio que ayuden a su organización a seguir creciendo.

Ascribe
Con una solución basada en SQL Server y el servicio HDInsight de Azure, podemos capturar datos escritos en lenguaje natural y usarlos para mejorar nuestros servicios�Esto nos permitirá reinventar en un futuro la forma en la que trabajamos con las historias clínicas.

–Paul Henderson, Ascribe

Desarrolle en su lenguaje favorito

HDInsight cuenta con extensiones de programación muy eficaces para lenguajes como C#, Java y .NET. Utilice el lenguaje de programación que desee en Hadoop para crear, configurar, enviar y supervisar trabajos de Hadoop. Ver más
Use el lenguaje de programación que desee con el servicio en la nube de Hadoop
Los servicios en la nube de Azure HDInsight Hadoop están disponibles en la nube sin necesidad de otros costos iniciales

Evite comprar y mantener hardware

Con HDInsight, implemente Hadoop en la nube sin necesidad de comprar hardware ni incurrir en otros costos iniciales. Además, la instalación y configuración se realizan de forma rápida. Azure se encarga de todo. Ponga en marcha su primer clúster en cuestión de minutos.

McKesson
Puesto que con Azure nos encontramos en una nube elástica, ya no es necesario preocuparse por la configuración de infraestructura o la posibilidad de ampliar la capacidad actual de nuestros centros de datos.

–Sujatha Bayyapureddy, McKesson

Utilice Excel o su herramienta de BI favorita para visualizar datos de Hadoop

Dado que se integra con Excel, HDInsight le permite visualizar y analizar los datos de Hadoop de nuevas y convincentes formas mediante una herramienta conocida para sus usuarios finales. Desde Excel, los usuarios pueden seleccionar HDInsight como origen de datos.

Black Ball
He buscado otras soluciones de BI en el mercado, pero la mayoría resultaban muy complejas, sobre todo desde el punto de vista del usuario final.

–Andrew Cheong, BlackBall

Use Excel para visualizar todos los datos de Hadoop
Use la nube para conectar los clústeres de Hadoop locales

Conecte los clústeres de Hadoop locales con la nube

HDInsight se integra también con Hortonworks Data Platform, lo que permite mover datos de Hadoop de un centro de datos local a la nube de Azure con fines de copia de seguridad, desarrollo y pruebas o ampliación en la nube. Con Microsoft Analytics Platform System, puede incluso realizar consultas a sus clústeres de Hadoop locales y en la nube simultáneamente.

Personalizar clústeres para ejecutar otros proyectos Hadoop

El ecosistema Apache Hadoop es un abanico de proyectos de código abierto rápidos que están evolucionando rápidamente. HDInsight aporta la flexibilidad de implementar proyectos de Hadoop arbitrarios mediante scripts personalizados. Incluye proyectos populares como Spark, R, Giraph y Solr.

Use las funcionalidades transaccionales de NoSQL que ofrece Azure

Usar capacidades transaccionales NoSQL

HDInsight incluye también Apache HBase, una base de datos NoSQL en columnas que se ejecuta en el Sistema de archivos distribuido de Hadoop (HDFS). Esto permite llevar a cabo procesamiento de transacciones (OLTP) de gran envergadura de datos no relacionales, lo que hace posible el uso para sitios web interactivos o escritura de datos de sensores en el Almacenamiento de blobs de Azure.

Proporcione procesado de transmisiones en tiempo real

HDInsight incluye Apache Storm, una plataforma de análisis de transmisiones de código abierto que puede procesar eventos en tiempo real a gran escala. Esto permite procesar millones de eventos conforme se generan, lo que hace posibles casos de uso como Internet de las cosas (IoT) y la obtención de información privilegiada de sus dispositivos conectados o de eventos desencadenados en la Web. Facilitamos la implementación de Storm. Más información acerca de Storm

Utilice Spark para hacer análisis interactivos

HDInsight incluye Apache Spark, un proyecto de código abierto en el ecosistema Apache que puede ejecutar aplicaciones de análisis de datos a gran escala en memoria. Spark entrega consultas hasta 100 veces más rápidas que las consultas tradicionales de macrodatos. Proporciona un modelo de ejecución común para tareas como ETL, consultas por lotes, consultas interactivas, streaming en directo, aprendizaje automático y procesamiento de gráficos con datos guardados en Almacenamiento de Azure. Más información acerca de Spark

Use R para aprovechar el modelado predictivo y el aprendizaje automático

HDInsight incorpora R Server para Hadoop, una implementación con escalado horizontal de uno de los más populares lenguajes de programación para computación estadística y el aprendizaje automático. R Server en HDInsight es una implementación en la nube con una integración al 100 % de R de código abierto con los clústeres Hadoop y Spark. Ofrece la familiaridad de R con la escalabilidad y el rendimiento de Hadoop. Más información sobre R Server para HDInsight

Implementar en Windows y Linux

Seleccione clústeres de Linux o Windows cuando implemente cargas de trabajo de Big Data en Azure. Con Windows, utilice código actual basado en Windows, incluido .NET, para ampliarlo a todos sus datos en Azure. Con Linux, puede trasladar más fácilmente cargas de trabajo de Hadoop a la nube e incorporar componentes adicionales para Big Data que pueden ejecutarse en el servicio. Al ofrecer clústeres basados en Windows y en Linux, Microsoft le da la flexibilidad de utilizar el sistema operativo que prefiera y obtener así información privilegiada de las enormes cantidades de datos que se crean en la nube.

*Hadoop y el logotipo del elefante de Hadoop son marcas comerciales de Apache Software Foundation.

Clientes que integran Hadoop en Azure