Apache Storm para HDInsight

Fácil procesamiento de transmisiones en tiempo real para macrodatos

¿Qué es Apache Storm?

Apache Storm es una solución distribuida de procesamiento de eventos en tiempo real, de código abierto tolerante a errores para flujos de datos grandes y rápidos. Conocido en primer lugar gracias a Twitter, donde se utilizó la tecnología en sus masivos flujos de tweets, Storm es un proyecto de The Apache Software Foundation. Azure hace que la implementación de Apache Storm sea muy fácil y rentable, sin necesidad de comprar hardware ni de configurar software. Ofrece una gama de herramientas de desarrollo (Java o C#) y una profunda integración con Visual Studio.

Ver una descripción general rápida >

Los datos proceden de diversas fuentes (aplicaciones, dispositivos, sensores, la Web, redes sociales) y se recopilan en la nube a través de API web o puertas de enlace de campo. Los datos se incluyen en un servicio de cola como Event Hubs, Kafka, RabbitMQ o ActiveMQ para el procesamiento de datos en tiempo real con Apache Storm de HDInsight. Los datos se mueven al almacenamiento a largo plazo con Apache HBase de HDInsight, donde puede ejecutar los paneles, consultas y análisis en tiempo real.

Procesamiento en tiempo real para desafíos en tiempo real

El mundo conectado de hoy día se define por Big Data que llega justo a tiempo. Storm es perfecto para situaciones complicadas en tiempo real, como detección de fraudes, análisis clickstream, alertas financieras, telemetría de sensores y dispositivos de Internet de las cosas (IoT), análisis social, canalizaciones ETL siempre activadas y supervisión de redes. Sus clientes pueden obtener estos eventos en tiempo real desde dispositivos, sensores, infraestructuras, aplicaciones, sitios web y datos.

Fácil instalación y resultados rápidos

Con Storm para HDInsight no es necesario realizar tareas de instalación o configuración que requieran mucho tiempo. Azure se encarga de todo. Póngase en marcha en cuestión de minutos e implemente Storm sin necesidad de comprar nuevo hardware ni de hacer frente a otras inversiones iniciales.

Entorno de desarrollo integrado para conseguir resultados con mayor facilidad y rapidez

Storm es sencillo de usar y admite cualquier lenguaje de programación, incluidos Java y .NET. La integración con Visual Studio IDE supone que puede desarrollar, implementar y depurar topologías de Storm de forma rápida y fácil. Puede mezclar Spouts escritos en otros lenguajes, lo que significa que puede aprovechar el universo existente de Spouts y Bolts como parte de su topología.

Capacidad elástica para macrodatos

Storm para HDInsight se beneficia de la versatilidad de Azure, que facilita la creación de clústeres de todos los tamaños para procesar cualquier cantidad de datos a petición. Solamente se cobra por los recursos de proceso y almacenamiento que realmente usa.

Alta disponibilidad para continuidad empresarial

Storm es tolerante a errores y reinicia automáticamente a los trabajadores en otros nodos en caso de error. Storm para HDInsight lleva esto un paso más allá con un tiempo de actividad del 99,9 % para los clústeres de Storm. Azure proporciona también supervisión de clústeres y soporte técnico empresarial ininterrumpidos.

Implementación de la primera canalización analítica de Apache Storm

Tareas como implementar un clúster de Apache Storm y ejecutar la primera canalización analítica en tiempo real se pueden llevar a cabo en cuestión de minutos.

Use una suscripción de Azure o cree una cuenta de prueba para iniciar sesión en el Portal de Azure.

Asigne un nombre al clúster de Storm y elija el número de nodos para determinar el tamaño del clúster. Puede implementar clústeres de Storm que tengan un solo nodo o cientos de nodos. También puede escalar o reducir verticalmente un clúster de Storm en ejecución.

Normalmente, se tardan 15 minutos en implementar un clúster de Storm. Una vez que esté implementado, haga clic en el PANEL DE STORM, en la parte inferior de la página para implementar su primera topología de Storm.

Especifique el nombre de usuario y la contraseña que eligió al crear el clúster.

En el menú desplegable, elija una de las topologías de ejemplo o cargue una topología nueva, que se deberá compilar como un archivo JAR.

Haga clic en Enviar para implementar la topología de WorkCount. Esta topología permite contar el número de palabras de una serie de sentencias que se utilizan como entrada.

Una vez que se ha realizado el envío, puede hacer clic en la interfaz de usuario de Storm para supervisar la topología en ejecución.

Es fácil crear, implementar y administrar las topologías de Storm desde el entorno de Visual Studio. El SDK de Azure también incluye plantillas fáciles de usar para Storm en HDInsight. La experiencia integrada de Visual Studio aumenta la productividad y permite administrar proyectos enteros desde el entorno de Visual Studio.

Pruebe HDInsight gratis