Data Lake Store

インテリジェントなアクションを実現する無制限のデータ レイク

エンタープライズ向けに構築された初のクラウド データ レイクにより、非構造化データ、半構造化データ、構造化データのすべてから、データ サイズの制限なしに最大限の価値を引き出しましょう。Azure Data Lake Store は安全であり拡張性が極めて高く、HDFS オープン スタンダードに合わせて構築されているため、大規模な並列分析を行うことができます。

ファイルはペタバイト サイズ、オブジェクトは数十億個まで

Azure Data Lake Store では、人工的な制限を受けずに組織のデータすべてを単一の場所で分析できます。Data Lake Store では数十億個のファイルを保存でき、サイズ上限は他のクラウド ストアの 200 倍以上であり 1 ペタバイトを超えるファイルも保存可能です。このため、高解像度の動画、遺伝子や地震のデータセット、医療データ、幅広い業界のデータなど、大規模データセットが含まれるあらゆる種類のデータの保管に最適です。

超並列分析に対応したスケーラブルなスループット

Data Lake Store では、アプリケーションを再設計したり高スケールでデータを再分割することなく、あらゆる種類の分析ワークロードに合わせてスループットを拡張できます。これによりスループットが非常に大きくなり、数百 TB のデータを効率的に読み込みおよび書き込みする同時実行子を数千個使用して分析ジョブを実行可能です。

常時暗号化、ロールベースのセキュリティ、監査

Data Lake Store では、データ アセットが保護され、お客様のオンプレミスのセキュリティとガバナンス管理を簡単にクラウドへ拡張することができます。データは、転送中は SSL を使用して、保存時には Azure Key Vault で HSM に保管されたサービス管理型キーまたはユーザー管理型キーにより、常に暗号化されます。Azure Active Directory を通じて、シングル サインオン (SSO)、多要素認証、数百万の ID のシームレス管理などの機能が組み込まれています。ストア内のすべてのデータについて、POSIX ベースの ACL によりユーザーとグループをきめ細かく認証し、ロールベースのアクセス制御を実現できます。最後に、システムへのアクセスと構成変更をすべて監査することにより、セキュリティおよび規制上のコンプライアンス要件に対応できます。

クラウド用の HDFS

Microsoft Azure Data Lake Store では、Apache Hadoop 分散ファイルシステム (HDFS) オープン スタンダードを使用するすべてのアプリケーションがサポートされます。HDFS への対応により、HDFS のディレクトリ構造を作り直すことなく、既存の Hadoop や Spark のデータをクラウドへ簡単に移行することができます。


Apache Hadoop® および関連するオープン ソース プロジェクトの名称は、Apache Software Foundation の商標です。

エンタープライズグレードのサポート

ビッグ データ ソリューションに関して、Microsoft は 99.9% のエンタープライズグレード SLA と 365 日 24 時間体制のサポートを保証します。

関連製品およびサービス

Data Lake Analytics

ビッグ データを簡単にする分散分析サービス

HDInsight

クラウド Hadoop 、Spark、R Server、HBase、および Storm クラスターのプロビジョニング

Data Lake Store を試してみる