跳过导航

Azure Data Lake Storage

可大规模缩放的 Data Lake 存储

Azure Data Lake Storage Gen2 是适用于大数据分析的可高度缩放、具有成本效益的 Data Lake 解决方案。它将大规模执行和经济高效的特点融入到高性能文件系统的功能中,帮助加快见解产生的时间。Data Lake Storage Gen2 扩展了 Azure Blob 存储功能,并且针对分析工作负载进行了优化。存储数据后即可通过现有的 Blob 存储和兼容 HDFS 的文件系统接口访问这些数据,而无需更改程序或复制数据。Data Lake Storage Gen2 是最为全面的可用 Data Lake。

为什么选择 Data Lake Storage?

高效

通过兼容 Hadoop 的文件系统更快地对模型进行测试,此系统支持原子文件和文件夹操作并经过了优化,能够高速执行作业。

可信赖

我们的 Data Lake 文件系统可以满足最严格的企业数据安全要求。它具有兼容 POSIX 的细化 ACL 支持,以及带静态加密、Azure Active Directory 集成和存储帐户防火墙的对象存储安全性。

规模可变

利用 Azure Blob 存储的全球规模、持续性和性能,包括支持大量的存储帐户。

具成本效益

以云对象存储定价水平获取 Data Lake 功能。Data Lake Storage Gen2 利用内置于 Azure Blob 存储的生命周期策略管理和对象级分层功能对数据存储成本进行优化,而无需在服务之间复制数据。

Data Lake Storage 功能

快速生成复杂的分析工作流

Data Lake Storage Gen2 本机集成了其他的 Azure 数据服务,包括 Azure Databricks 和 Azure 数据工厂,用于构建端到端的大数据和高级分析解决方案。

更快、更高效地运行作业

大数据分析工作负载可能在作业执行期间产生高昂的事务成本,例如创建、重命名或删除文件和文件夹时。Data Lake Storage Gen2 支持原子文件操作,这将显著降低作业执行所需的事务开销以及减少完成大数据分析作业所花费的时间。

可以在全球进行分析工作

Data Lake Storage Gen2 符合区域数据管理要求。在正式发布后,Data Lake Storage Gen2 将在所有 Azure 区域中可用。

在这些可靠合作伙伴提供的解决方案中使用 Azure Data Lake Storage Gen2

  • Striim
  • Attunity
  • Informatica Cloud
  • WANDisco

Data Lake Storage 有什么功能?

新式数据仓库

大数据高级分析

实时分析

相关产品和服务

Azure Databricks

基于 Apache Spark 的快速、简单、协作分析平台

数据工厂

轻松进行企业级规模混合数据集成

HDInsight

设置云 Hadoop、Spark、R Server、HBase 和 Storm 群集