R Server for HDInsight

予測分析、機械学習、ビッグ データの統計モデリング

R Server for HDInsight

R Server for HDInsight とは?

Microsoft R Server for HDInsight では、エンタープライズ規模の R 分析ソフトウェアに Apache Hadoop と Apache Spark の機能を組み合わせることで、必要なスケールとパフォーマンスを実現できます。R Server のマルチスレッドの数式ライブラリと透過的な並列処理では、処理可能なデータ サイズがオープンソース R 言語の最大 1,000 倍、処理スピードは最大 50 倍になります。このため、より正確なモデルをトレーニングして予測の精度を高めることができます。R Server はオープンソース R 言語に対応しているため、既存のすべての R スクリプトを一切変更せずに実行できます。

慣れ親しんだ R の能力を活用

データ科学者の第一の選択肢である R プログラミング言語には、世界中の 200 万人を超えるユーザーが参加するグローバルなコミュニティがあり、オープンソースの分析パッケージの総数は年々増加しています。R Server for HDInsight は、Hadoop および Spark で大規模に実行される R 言語との完全な互換性を備えています。

R の使用は拡大しています。2007 年から 2013 年にかけて、R を使用していると報告したデータ マイナーの数は 20% から 70% に増加しました。2008 年から 2013 年にかけて、R をプライマリ ツールとして使用しているデータ マイナーの数は 5% 未満から 24% に増加しました。
CRAN パッケージのリリース数はこの数年で大幅に増加しています。2005 年には、その数はごく僅かでした。2012 年までにその数は 1000 に増加し、2014 年には 3000、2016 年には 8000 を超えました。
R の分析および機械学習ライブラリ

大規模かつ移植可能な R 並列分析と機械学習ライブラリ

オープン ソースの R 言語に対応した大規模な並列分析と機械学習ビルトイン ライブラリを活用しましょう。このライブラリは一般的なデータ プラットフォーム間で移植可能であり、デシジョン ツリー、アンサンブル、回帰モデル、クラスタリング、データ準備、視覚化、統計関数などが含まれています。

R Server for HDInsight で TB (テラバイト) 規模のデータを使用

TB (テラバイト) 規模の機械学習で 1,000 倍多くのデータを処理

Hadoop と Spark に加えて透過的な並列化により、R Server for HDInsight では、オープン ソース R 言語単独の 1,000 倍の量である TB (テラバイト) 規模のデータを処理することができます。どんな量のデータでも、論理的回帰モデル、ツリー、アンサンブルをトレーニングできます。制限があるのは、Spark クラスターのサイズだけです。

R Server for HDInsight による高速パフォーマンス

最大 50 倍高速のパフォーマンスを実現

マルチスレッドのベクトルおよびマトリックス数式ライブラリと R Server for HDInsight を、Spark と組み合わせることで、従来のオープン ソース R の最大 50 倍高速なパフォーマンスを実現します。

オープン ソース R 関数を実行する

既存の R 関数で分散パラメーターの一括処理やシミュレーションを実行

任意のオープン ソース R 関数を数百のノードで実行し、並列でパラメーターの一括処理やシミュレーションを行うことができます。より高速で簡単、正確な予測に対応できる独自のモデルを探求しましょう。

Spark SQL から Spark データ ソースにアクセス

Apache Spark SQL を R Server のデータ ソースとして使用することで、Hadoop と Spark のデータを分析できます。Apache Hive と Apache Parquet などのソースに対する Spark SQL クエリの結果を Spark Data Frame に読み込み、R Server の分散計算アルゴリズムを使って直接分析できます。

開発ツールを選択可能

R Server on HDInsight には、作業を簡単に開始できる R Studio Server Community Edition が含まれています。また、R Tools for Visual Studio を無料でダウンロードして、便利なローカル開発環境を手に入れることもできます。

R Server for HDInsight を保護するエンタープライズ グレードのセキュリティ

エンタープライズグレードのセキュリティとサポート

バージョン パッケージ、パッチ、セキュリティ更新、継続的なクラスター監視を含む、Azure のエンタープライズグレードのセキュリティとサポートを活用できます。99.9% の接続性を備えた Microsoft のサービス レベル アグリーメント (SLA) により、災害が発生した場合も R Server for HDInsight クラスターが保護されます。

先行投資不要のクイック セットアップ

セットアップは簡単、結果はすぐに

R Server for HDInsight なら、時間のかかるインストールやセットアップは不要です。Azure により自動的に処理されます。新たにハードウェアを購入したり、先行投資を行うことなく、数分で準備を完了して統計モデルと機械学習モデルのトレーニングをすぐに開始できます。お支払いは、コンピューティングやストレージを使用した分に対してのみ発生します。

Apache Hadoop® および関連するオープンソース プロジェクトの名前は、The Apache Software Foundation の商標です。

R Server for HDInsight を試す