Apache Storm for HDInsight

巨量資料的即時串流處理變得更容易

何謂 Apache Storm?

Apache Storm 是分散式、容錯且開放原始碼的即時事件處理解決方案,適用於大型且快速的串流。Twitter 將 Storm 技術運用在大量的推文串流上,使 Storm 一舉成名,更是 The Apache Software Foundation 的專案。Azure 讓部署 Apache Storm 變得簡單又符合經濟效益,您無須購買硬體或設定軟體、可以自行選擇開發工具 (Java 或 C#),而且其與 Visual Studio 緊密整合。

觀看快速概觀 >

資料來自不同來源 (應用程式、裝置、感應器、網頁、社群),並透過 Web API 或本地閘道收集到雲端。資料會放入事件中樞、Kafka、RabbitMQ 或 ActiveMQ 這類佇列服務,以透過 HDInsight 上的 Apache Storm 進行即時資料處理。資料會透過 HDInsight 上的 Apache HBase 移到長期儲存空間,您可以在該處執行即時儀表板、查詢及分析。

即時挑戰所需的即時處理

在網路無所不在的現代社會中,一切都以巨量資料能否即時抵達來定勝負。Storm 適合用於充滿挑戰性的即時案例,像是詐欺偵測、點選流分析、財務警示、來自物聯網 (IoT) 感應器與裝置的遙測、社交分析、永遠可用的 ETL 管線以及網路監控。您的客戶可以從裝置、感應器、基礎結構、應用程式、網站及資料獲得這些即時事件。

架設簡易、收效快速

Storm for HDInsight 沒有耗時煩人的安裝或設定工作。Azure 為您代勞。一切在幾分鐘內即可啟動並執行,而且部署 Storm 無須購買新硬體,也無須支付其他預付成本。

整合式開發環境讓取得結果變得更簡單快速

Storm 容易使用且支援任何程式設計語言,包括 Java 與 .NET。內建與 Visual Studio IDE 的整合,意味著可快速且輕易地開發、部署及進行 Storm 拓撲偵錯。您可以混用以其他語言撰寫的 Spout,意味著您可以利用大量現有的 Spout 與 Bolt 作為拓撲的一部分。

可容納巨量資料的彈性容量

Storm for HDInsight 運用 Azure 的威力,讓您更輕鬆地視需要建立任何大小的叢集來處理任何數量的資料。我們只會對您實際使用的計算及儲存體收費。

為商務持續性提供的高可用性

Storm 能夠容錯,而且會在發生錯誤時自動重新啟動其他節點上的背景工作角色。Storm for HDInsight 更以正常運作時間達 99.9% 的 Storm 叢集,讓一切臻於完善。Azure 還提供全年無休的企業支援與叢集監控服務。

部署您第一個 Apache Storm 分析管線

可在幾分鐘內將 Apache Storm 叢集部署好,並執行您第一個即時分析管線。

首先,使用 Azure 訂用帳戶,或是建立試用帳戶來登入 Azure 入口網站。

替 Storm 叢集命名,並挑選節點數來定義叢集大小。所部署的 Storm 叢集可以包含最少 1 個節點、最多數百個節點。我們同時也讓您能夠相應增加或減少正在執行的 Storm 叢集。

部署 Storm 叢集通常需要花上 15 分鐘。部署完成後,按一下頁面底部的 [STORM 儀表板] 來部署您的第一個 Storm 拓撲。

提供您在建立叢集時所選的使用者名稱與密碼。

從下拉式選單中挑選範例拓撲或是您所上傳的新拓撲 (需編譯為 JAR 檔案)。

按一下 [送出] 來部署 WorkCount 拓撲。此拓撲會計算 Storm 中,作為輸入之句子的字數。

提交完成後,您便可按一下 [Storm UI] 來監視正在執行的拓撲。

在 Visual Studio 環境中便可輕鬆包辦建置、部署及管理 Storm 拓撲的作業。Azure SDK 同時隨附 Storm on HDInsight 的輕易入門範本。Visual Studio 整合的經驗能提升生產力,且能讓您在 Visual Studio 環境中執行完整專案管理。

免費試用 HDInsight