Data Lake Store

インテリジェントなアクションを実現する無制限のデータ レイク

エンタープライズ向けに構築された初のクラウド データ レイクにより、非構造化データ、半構造化データ、構造化データのすべてから、データ サイズの制限なしに最大限の価値を引き出しましょう。Azure Data Lake Store は安全であり拡張性が極めて高く、HDFS オープン スタンダードに合わせて構築されているため、大規模な並列分析を行うことができます。

ファイル サイズはペタバイト、オブジェクトは数十億個まで

Azure Data Lake Store では、人為的な制限を受けずにデータすべてを 1 か所で分析できます。Data Lake Store では数十億個のファイルを保存できます。1 つあたりのサイズが 1 ペタバイトを超えるファイルも保存可能であり、これは他のクラウド ストアの 200 倍です。このため、高解像度の動画、遺伝子や地震のデータセット、医療データ、幅広い業界のデータなど、大規模データセットが含まれるあらゆる種類のデータの保管に最適です。

超並列分析に対応したスケーラブルなスループット

Data Lake Store では、アプリケーションを再設計したり高スケールでデータを再分割することなく、あらゆる種類の分析ワークロードに合わせてスループットを拡張できます。スループットは非常に大きくすることも可能であり、数百 TB のデータを効率的に読み込みおよび書き込みする同時実行子を数千個使用して分析ジョブを実行可能です。

常時暗号化、ロールベースのセキュリティ、監査

Data Lake Store では、データ資産を保護するとともに、お客様のオンプレミスのセキュリティとガバナンス管理をクラウドへ拡張することができます。お客様のデータは、転送中は SSL を使用して、保存時には Azure Key Vault で HSM に保管されたサービス管理型キーまたはユーザー管理型キーにより、常に暗号化されます。Azure Active Directory を通じて、シングル サインオン (SSO)、多要素認証、数百万の ID のシームレス管理などの機能が組み込まれています。ストア内のすべてのデータについて POSIX ベースの ACL によりユーザーとグループをきめ細かく認証するとともに、ロールベースのアクセス制御も可能です。システムへのアクセスと構成変更をすべて監査して、セキュリティおよび規制上のコンプライアンス要件に対応することもできます。

クラウド用の HDFS

Microsoft Azure Data Lake Store では、Apache Hadoop 分散ファイルシステム (HDFS) オープン スタンダードを使用するすべてのアプリケーションがサポートされます。HDFS への対応により、HDFS のディレクトリ構造を作り直すことなく、既存の Hadoop や Spark のデータをクラウドへ簡単に移行することができます。


Apache Hadoop® および関連するオープン ソース プロジェクトの名称は、Apache Software Foundation の商標です。

エンタープライズ級のサポート

Data Lake Store では、お使いのビッグ データ ソリューションに対して 99.9% のエンタープライズグレード SLA と 365 日 24 時間体制のサポートを受けられます。

関連製品およびサービス

Data Lake Analytics

ビッグ データを簡単にする分散分析サービス

HDInsight

クラウド Hadoop 、Spark、R Server、HBase、および Storm クラスターのプロビジョニング

Data Lake Store を試してみる