Apache Storm for HDInsight

实时流式处理容易用于处理大数据

  • 每秒对数百万事件进行流式处理
  • 实时计算系统
  • 构建在行业领导的开放源平台上
  • 高度可用和容错
  • 云灵活性
  • 与 Visual Studio 的集成
  • 无需购买硬件
  • 只需几次点击即可完成部署

Apache Storm 是什么?

Apache Storm 是一个用于大量、快速的数据流的分布式、容错性、开放源、实时的事件处理解决方案。Storm 最初因 Twitter 广为人知,Twitter 在其大量的推文流中使用该科技,现在 Storm 是 Apache Software Foundation 的一个项目。Azure 云让 Apache Storm 可以容易且经济高效地进行部署,无需购买任何硬件和配置任何软件,你可以选择开发工具(Java 或 C#)并与 Visual Studio 深入集成。观看快速概述。
数据从各种数据源(应用程序、设备、传感器、Web、社交)传入,并且通过 Web API 或域网关收集到云。该数据置于事件中心、Kafka、RabbitMQ 或 ActiveMQ 等队列服务中,以便使用 Apache Storm on HDInsight 进行实时数据处理。数据通过 Apache HBase on HDInsight 移到长期存储中,用户可以在其中运行实时仪表板、查询和分析。

用于实时挑战的实时处理

大数据是当今互连世界的直接体现。Storm 十分适合用于挑战实时方案,如欺诈检测、点击流分析、财务预警、从连接的传感器和设备 (IoT) 遥测、社交分析、“始终可用”ETL 管道和网络监视。客户可以从设备、传感器、基础结构、应用程序、网站和数据中获得这些实时事件。

轻松安装,快速获得结果

使用 Storm for HDInsight,无需花时间进行安装或设置。Azure 替你完成操作。只需几分钟即可启动并运行,并且无需购买新硬件和产生其他前期成本即可部署 Storm。

集成开发环境带来更简便更快捷的结果

Storm 使用简便,并支持所有程序语言,包括 Java 和 .NET。与 Visual Studio IDE 的嵌入式集成意味着你可以快捷轻松地开发、部署、调试 Storm 拓扑。你甚至可以混合使用其他语言编写的 spout,这意味着你可以利用广泛大量的现有 spout 和 bolt 作为拓扑中的一部分。

针对大数据的灵活容量

借助 Azure 云的强大功能,Storm for HDInsight 可更轻松地创建任意大小的群集来按需处理任意数量的数据。我们只对你实际使用的计算和存储收取费用。

高可用性可保证业务连续性

Storm 具有容错性,故障情况下将自动重新启动另一节点上的工作器。HDInsight 的 Storm 对此更进一步 — 可为 Storm 群集确保 99.9% 以上的时间。Azure 还提供 24x7 全天候企业支持和群集监视。

部署你的第一个 Apache Storm 分析管道

部署 Apache Storm 群集和运行第一个实时分析管道可在几分钟内完成。

使用你的 Azure 订阅或创建一个试用帐户以登录 Azure 门户。

为 Storm 群集指定一个名称,并选取用于定义群集大小的节点数量。只需通过一个节点即可将 Storm 群集部署到数百个节点。我们还将允许你增加或减少运行中的 Storm 群集。

部署 Storm 群集通常需要 15 分钟。部署后,点击页面底部的“STORM 仪表板”,以部署你的第一个 Storm 拓扑。

请提供创建群集时所选择的用户名和密码。

在下拉菜单中,选取一个示例拓扑,或者你可以上载一个新的拓扑(该拓扑应编译为一个 JAR 文件)。

单击“提交”以部署 WorkCount 拓扑。此拓扑统计作为输入内容的语句的 Storm 中存在的字数。

提交完成后,你可以单击“Storm UI”来监视运行的拓扑。

全部从 Visual Studio 环境中构建、部署和管理 Storm 拓扑十分容易。Azure SDK 还装载有容易入门模板用于 HDInsight 上的 Storm。Visual Studio 集成体验提高了工作效率,让你可以从 Visual Studio 环境中完成所有项目管理。

免费试用 HDInsight