適用於 HDInsight 的 R 伺服器

適用於巨量資料的預測性分析、機器學習服務與統計模型

適用於 HDInsight 的 R 伺服器

什麼是適用於 HDInsight 的 R 伺服器?

適用於 HDInsight 的 Microsoft R 伺服器結合企業級 R 分析軟體與 Apache Hadoop 和 Apache Spark 的功能,藉此提供您需要的規模與效能。R 伺服器中的多執行緒數學程式庫與透明的並行作業,最多可處理比開放原始碼 R 多 1000 倍的資料,且速度快 50 倍,有助於您定型更準確的模型,讓預測更精準。R 伺服器可搭配開放原始碼 R 語言運作,因此所有 R 指令碼都能直接執行而不需要變更。

善用威力強大且好上手的 R

R 程式語言是資料科學家的首選,其全球社群擁有逾兩百萬來自世界各地的使用者,開放原始碼分析套件的總數也年年成長。適用於 HDInsight 的 R 伺服器,讓您與在 Hadoop 和 Spark 大規模執行的 R 語言擁有完整相容性。

R 的使用越來越廣泛。從 2007 年到 2013 年,有使用 R 的資料擷取器數目從 20% 增加到了 70%。從 2008 年到 2013 年,使用 R 作為主要工具的資料擷取器則從不到 5% 增加到 24%。
發行的 CRAN 套件數目在過去幾年內已顯著增加。在 2005 年還非常少。2012 年增加到 1000,2014 年增加到 3000,2016 年則增加到 8000 以上。
R 分析與機器學習程式庫

大型可攜式 R 平行分析與機器學習程式庫

利用專為搭配開放原始碼 R 語言使用的大型平行分析與機器學習程式庫,該語言可在包括決策樹和集成、迴歸模型、叢集、資料準備、視覺效果及統計函數在內的熱門資料平台間移植。

搭配適用於 HDInsight 的 R 伺服器使用 TB 級的資料

TB 規模的機器學習,可處理多上 1,000 倍的資料

適用於 HDInsight 的 R 伺服器能對 Hadoop 與 Spark 進行透明的並行作業,讓您能處理 TB 規模的資料,與單用開放原始碼 R 語言相比多上 1,000 倍。在任何數量的資料上訓練羅吉斯迴歸模型、樹狀結構與整體項目。您僅受限於 Spark 叢集的大小。

使用適用於 HDInsight 的 R 伺服器取得高效能

獲得最多快上 50 倍的效能

結合 Spark、多執行緒向量與矩陣數學程式庫,以及適用於 HDInsight 的 R 伺服器,體驗與之前的開放原始碼 R 相比最多快上 50 倍的效能。

執行開放原始碼 R 函數

使用現有 R 函數執行分散式參數整理及模擬

對上百個節點執行任何開放原始碼 R 函數,取得平行參數整理與模擬。探索並精簡您的模型,更快速、輕鬆、準確地進行預測。

透過 Spark SQL 存取 Spark 資料來源

將 Apache Spark SQL 用作 R 伺服器的資料來源,即可在 Hadoop 和 Spark 中分析資料。將針對 Apache Hive 和 Apache Parquet 等來源進行 Spark SQL 查詢的結果載入 Spark Data Frame 中,並使用任何 R 伺服器分散式運算演算法直接加以分析。

選擇您的開發工具

HDInsight 上的 R 伺服器包括 R Studio Server Community Edition,可讓您輕鬆開始使用。下載 R Tools for Visual Studio,或免費取得方便的本機開發環境。

企業級安全性,用來保護適用於 HDInsight 的 R 伺服器

企業級安全性與支援

仰賴 Azure 的企業級安全性與支援,包括版本封裝、修補、安全性更新以及持續的叢集監視,正常連線時間至少達 99.9% 的 Microsoft 服務等級協定 (SLA),可協助針對重大事件為 HDInsight 叢集的 R 伺服器提供保護。

快速設定且無前期成本

架設簡易、收效快速

適用於 HDInsight 的 R 伺服器沒有耗時的安裝或設定工作。Azure 為您代勞。您在幾分鐘內就可以啟動並執行,準備開始定型統計和機器學習模型,而無須再購買新的硬體或預付其他費用。您只需要為所使用的計算及儲存空間收費。

Apache Hadoop® 與相關聯的開放原始碼專案名稱皆為 Apache Software Foundation 的商標。

試用適用於 HDInsight 的 R 伺服器