Apache Storm para HDInsight

Fácil procesamiento de transmisiones en tiempo real para macrodatos

  • Transmita millones de eventos por segundo
  • Sistema de computación en tiempo real
  • Basado en una plataforma de código abierto líder del sector
  • Alta disponibilidad y tolerancia a errores
  • Elasticidad en la nube
  • Integración con Visual Studio
  • Sin necesidad de comprar hardware
  • Implementación con solo unos clics

¿Qué es Apache Storm?

Apache Storm es una solución distribuida de procesamiento de eventos en tiempo real, de código abierto tolerante a errores para flujos de datos grandes y rápidos. Conocido en primer lugar gracias a Twitter, donde se utilizó la tecnología en sus masivos flujos de tweets, Storm es ahora un proyecto de Apache Software Foundation. La nube de Azure hace que la implementación de Apache Storm sea muy fácil y rentable, sin necesidad de comprar hardware ni de configurar software. Ofrece una gama de herramientas de desarrollo (Java o C#) y una profunda integración con Visual Studio. Vea esta rápida descripción general
Los datos proceden de diversas fuentes (aplicaciones, dispositivos, sensores, la Web, redes sociales) y se recopilan en la nube a través de API web o puertas de enlace de campo. Los datos se incluyen en un servicio de cola como Event Hubs, Kafka, RabbitMQ o ActiveMQ para el procesamiento de datos en tiempo real con Apache Storm de HDInsight. Los datos se mueven al almacenamiento a largo plazo con Apache HBase de HDInsight, donde puede ejecutar los paneles, consultas y análisis en tiempo real.

Procesamiento en tiempo real para desafíos en tiempo real

El mundo conectado de hoy día se define por Big Data que llega justo a tiempo. Storm es perfecto para situaciones complicadas en tiempo real, como detección de fraudes, análisis clickstream, alertas financieras, telemetría de sensores y dispositivos conectados (IoT), análisis social, canalizaciones ETL "siempre activadas" y supervisión de redes. Los clientes pueden obtener estos eventos en tiempo real desde dispositivos, sensores, infraestructuras, aplicaciones, sitios web y datos.

Fácil instalación y resultados rápidos

Storm para HDInsight no precisa tareas de instalación o configuración que requieran mucho tiempo. Azure se encarga de todo. Storm se pone en marcha en cuestión de minutos y se puede implementar sin necesidad de comprar hardware ni de hacer otras inversiones iniciales.

Entorno de desarrollo integrado para conseguir resultados con mayor facilidad y rapidez

Storm es sencillo de usar y admite cualquier lenguaje de programación, incluidos Java y .NET. La integración con Visual Studio IDE supone que puede desarrollar, implementar y depurar topologías de Storm de forma rápida y fácil. Incluso puede mezclar Spouts escritos en otros lenguajes, lo que significa que puede aprovechar el amplio universo existente de Spouts y Bolts como parte de su topología.

Capacidad elástica para macrodatos

Storm para HDInsight aprovecha el potencial de la nube de Azure y facilita la creación de clústeres de cualquier tamaño para procesar cualquier cantidad de datos a petición. Solamente se cobra por los recursos de proceso y almacenamiento que realmente usa.

Alta disponibilidad que garantiza la continuidad empresarial

Storm es tolerante a errores y reinicia automáticamente a los trabajadores en otros nodos en caso de error. Storm para HDInsight lleva esto un paso más allá al garantizar un tiempo de actividad del 99,9 % para los clústeres de Storm. Azure ofrece también supervisión de clústeres y soporte técnico empresarial ininterrumpidos.

Implementación de la primera canalización analítica de Apache Storm

Tareas como implementar un clúster de Apache Storm y ejecutar la primera canalización analítica en tiempo real se pueden llevar a cabo en cuestión de minutos.

Use una suscripción de Azure o cree una cuenta de prueba para iniciar sesión en el Portal de Azure.

Asigne un nombre al clúster de Storm y elija el número de nodos para determinar el tamaño del clúster. Puede implementar clústeres de Storm que tengan un solo nodo o cientos de nodos. También puede escalar o reducir verticalmente un clúster de Storm en ejecución.

Normalmente, se tardan 15 minutos en implementar un clúster de Storm. Una vez que esté implementado, haga clic en el PANEL DE STORM, en la parte inferior de la página para implementar su primera topología de Storm.

Especifique el nombre de usuario y la contraseña que eligió al crear el clúster.

En el menú desplegable, elija una de las topologías de ejemplo o cargue una topología nueva, que se deberá compilar como un archivo JAR.

Haga clic en Enviar para implementar la topología de WorkCount. Esta topología permite contar el número de palabras de una serie de sentencias que se utilizan como entrada.

Una vez que se ha realizado el envío, puede hacer clic en la interfaz de usuario de Storm para supervisar la topología en ejecución.

Es fácil crear, implementar y administrar las topologías de Storm desde el entorno de Visual Studio. El SDK de Azure también incluye plantillas fáciles de usar para Storm en HDInsight. La experiencia integrada de Visual Studio aumenta la productividad y permite administrar proyectos enteros desde el entorno de Visual Studio.

Pruebe HDInsight gratis