Azure Data Lake Storage
高パフォーマンス分析ワークロードのための非常にスケーラブルで安全なデータ レイク。
高パフォーマンス分析の基盤を構築する
単一のストレージ プラットフォームでデータ サイロを解消します。階層型ストレージとポリシー管理でてコストを最適化します。 Microsoft Entra ID (旧称 Azure Active Directory) とロールベースのアクセス制御 (RBAC) を使用してデータを認証します。また、保存時の暗号化や高度な脅威対策などのセキュリティ機能を使用してデータを保護します。
自動 geo レプリケーションによる無制限のスケールと 16 9s のデータ持続性
データ アクセス、暗号化、ネットワークレベルの制御に柔軟に対応した保護メカニズムにより、高い安全性を実現します
最も一般的な分析フレームワークをサポートするインジェスト、プロセス、視覚化のための単一のストレージ プラットフォーム
ストレージとコンピューティングの独立したスケーリング、ライフサイクル ポリシー管理、オブジェクトレベルの階層化によるコスト最適化
最も要求の厳しい分析ワークロードに合わせてスケーリング
Azure グローバル インフラストラクチャを使用して、容量要件を満たし、データを簡単に管理できます。大規模な分析クエリを一貫した高パフォーマンスで実行します。
柔軟なセキュリティ メカニズムを活用
暗号化、データ アクセス、ネットワーク レベルの制御にまたがる機能でデータ レイクを保護します。これは、分析情報をより安全に把握できるように設計されています。
分析のスケーラブルな基盤を構築
さまざまなデータ インジェスト ツールを使用して、大規模にデータを取り込みます。Azure Databricks、Azure Synapse Analytics、またはAzure HDInsight を使用してデータを処理します。また、Microsoft Power BI を使用してデータを視覚化し、変革をもたらす分析情報を得ることができます。
コスト効率の高いクラウド データ レイクを構築する
ストレージとコンピューティングを個別にスケーリングしてコストを最適化します—これは、オンプレミスのデータ レイクでは実行できません。使用量に応じて階層を増減し、自動化されたライフサイクル管理ポリシーを活用してストレージ コストを最適化します。
包括的なセキュリティとコンプライアンスの組み込み
-
Microsoft では、サイバーセキュリティの研究と開発に年間 USD10 億を超える投資を行っています。
-
Microsoft には、データ セキュリティとプライバシーを専門とする 3,500 人を超えるセキュリティ エキスパートがいます。
Azure 無料アカウントで作業を開始する
1
2
クレジットがなくなった後に、同じ無料サービスでビルドを続けるには、従量課金制に移行してください。月々の無料使用分を超えた場合にのみ、お支払いいただきます。
3
あらゆる規模の企業から寄せられる信頼
"Azure では、データから迅速に価値を引き出す機能が追加されました。作成しているデータ モデルからの実用的な分析情報は、収益の増加、コストの削減、リスクの最小化に役立ちます。"
Ahmed Adnani 氏、アプリケーションおよび分析担当ディレクター、Smith Group
"Microsoft Azure で優れた価値が得られています。あるジョブを実行するための巨大なクラスターを数日だけ必要なとき、それが終われば破棄して節約できますが、データセンターではほぼ実現不可能です。私たちにとって、ほんとうに大きなゲームチェンジャーでした。"
Marks & Spencer、プロダクト マネージャー、James Ferguson 氏
Data Lake Storage についてよく寄せられる質問
-
BLOB の上に階層型名前空間を追加すると、ビッグ データ分析フレームワークが設計されたファイル システム インターフェイスを損なうことなく、クラウド ストレージのコスト面での利点を維持できます。
簡単な例として、分析ジョブが出力データを一時ディレクトリに書き込み、そのディレクトリの名前をコミット フェーズ中に最終的な名前に変更するパターンが頻繁に発生します。オブジェクト ストア (仕様ではディレクトリの概念をサポートしていません) では、これらの名前変更は、N 回のコピーと削除操作を伴う長時間の操作になる可能性があります。ここで N はディレクトリ内のファイル数です。階層型名前空間を使用すると、これらのディレクトリ操作はアトミックになり、パフォーマンスとコストが向上します。さらに、ファイル システムの要素としてディレクトリをサポートすると、親ディレクトリを使用してアクセス許可を伝達する POSIX 準拠のアクセス制御リスト (ACL) のアプリケーションを適用できます。
-
他のクラウド ストレージ サービスと同様に、Data Lake Storage は、格納データの量とそのデータに対して実行した操作にかかるコストに応じて課金されます。コストの内訳を参照する。
-
Data Lake Storage は、主に Hadoop と Hadoop FileSystem をデータ アクセス レイヤーとして使用するすべてのフレームワーク (Spark や Presto など) と連携するように設計されています。詳細をご確認ください。
Azure では、Data Lake Storageは次と相互運用できます:
- Azure Data Factory
- Azure HDInsight
- Azure Databricks
- Azure Synapse Analytics
- Power BI
このサービスは、Azure Blob Storage エコシステムにも含まれています。
-
Data Lake Storage では、データ アクセス制御のための複数のメカニズムが用意されています。階層型名前空間を提供することで、サービスは Hadoop 分散ファイル システム (HDFS) のアクセス許可の基礎を形成する POSIX 準拠のアクセス制御リスト (ACL) を備えた唯一のクラウド分析ストアとなります。Data Lake Storage には、ストレージ ファイアウォール、プライベート エンドポイント、TLS 1.2 エンフォースメント、およびシステムまたは顧客から提供された鍵を使用した保存時暗号化によるトランスポート レベルのセキュリティ機能も含まれています。