跳过导航

Azure Data Lake Storage

基于 Azure Blob 存储构建的高度可缩放的安全 Data Lake 功能

获取云规模的强大 Data Lake 功能

Azure Data Lake Storage Gen2 是适用于大数据分析的可高度缩放、具有成本效益的 Data Lake 解决方案。它将大规模执行和经济高效的特点融入到高性能文件系统的功能中,帮助加快见解产生的时间。Data Lake Storage Gen2 扩展了 Azure Blob 存储功能,并且针对分析工作负载进行了优化。Data Lake Storage Gen2 是最为全面的可用 Data Lake。

阅读博客

观看更多视频

快速

通过兼容 Hadoop 的文件系统更快地对模型进行测试,此系统支持原子文件和文件夹操作并经过了优化,能够高速执行作业。

规模可变

扩展 Azure Blob 存储的全局规模、持续性和性能,并获得对大量存储帐户的支持。

安全

借助兼容 POSIX 的细化 ACL 支持、具有静态加密的对象存储安全性、Azure Active Directory 集成和存储帐户防火墙等工具和资源,满足最严苛的企业数据安全性要求。

具成本效益

以云对象存储定价水平获取 Data Lake 功能。Data Lake Storage Gen2 提供与 Blob 存储相同的生命周期策略管理和对象级分层。

服务功能

大规模可伸缩性

近乎无限的分析数据存储

云对象存储定价

与 Azure Blob 存储相同的低成本数据存储模型

减少文件和文件夹事务

原子事务,可减少计算周期并加快作业执行速度

精细的文件和文件夹安全性

兼容 POSIX 的细化访问控制列表 (ACL)

单个存储中的简化引入

使用 Data Lake Storage Gen2 或 Blob 存储 REST API 实现合并数据存储

完整的 Azure Blob 存储功能集

数据生命周期策略管理; 热层, 冷层和存档层; 高可用性/灾难恢复支持

基于角色的访问和存储帐户防火墙

用于管理数据访问的多层安全性,从而仅允许使用授权 IP 的用户执行分析

通用数据模型 (CDM) 支持

可与 Microsoft Dynamics 365(用于 CRM)和 Power BI 等功能强大的应用程序交换数据

可信赖的合作伙伴

  • Informatica Cloud
  • Attunity
  • WANDisco
  • Striim
  • Qubole
  • Cloudera

Data Lake Storage 有什么功能?

新式数据仓库

Modern adattárházA modern adattárház bármely méretezésben lehetővé teszi az adatok egy helyre gyűjtését, és minden felhasználó hozzájuthat az elemzési irányítópultok, a működési jelentések és a bővített analitika által nyújtott eredményekhez.12354
  1. 概述

概述

通过新式数据仓库可轻松将所有数据汇集到一起,并通过分析仪表板、操作报告或所有用户的高级分析获取见解。

  1. 1 使用 Azure 数据工厂将所有结构化、非结构化和半结构化数据(日志、文件和媒体)结合到 Azure Blob 存储中。
  2. 2 利用 Azure Blob 存储中的数据,通过 Azure Databricks 执行可缩放分析,并获得清理和转换后的数据。
  3. 3 可将清理和转换后的数据移动到 Azure SQL 数据仓库,与现有的结构化数据结合,为所有数据创建一个中心。利用 Azure Databricks 和 Azure SQL 数据仓库间的本地连接器来访问和大规模移动数据。
  4. 4 根据 Azure 数据仓库构建操作报告和分析仪表板,从数据中获取见解,并使用 Azure Analysis Services 为数千名最终用户提供服务。
  5. 5 直接在 Azure Databricks 中的数据上运行临时查询。

大数据高级分析

Big data bővített analitikaAdatait a gyakorlatban is hasznosítható ismeretekké alakíthatja a kategóriájában elsőrangú gépi tanulási eszközkészlet használatával. Ez az architektúra lehetővé teszi, hogy bármilyen típusú és bármennyi adatot kombinálhasson egymással, és egyedi gépi tanulási modelleket alkalmazzon ipari méretű adatbázisokon.1234576
  1. 概述

概述

使用领先机器学习工具将数据转化为可行见解。通过这种架构,可将任何规模的数据进行组合,且可大规模构建和部署自定义机器学习模型。

  1. 1 使用 Azure 数据工厂将所有结构化、非结构化和半结构化数据(日志、文件和媒体)汇集到 Azure Blob 存储中。
  2. 2 使用 Azure Databricks 清理和转换流数据无结构的数据集,并将其与来自操作数据库或数据仓库的结构化数据相结合。
  3. 3 使用可缩放机器学习/深度学习技术,借助 Python、R 或 Scala 以及 Azure Databricks 中的内置笔记本体验,从这些数据中获得更深入的见解。
  4. 4 利用 Azure Databricks 和 Azure SQL 数据仓库间的本地连接器来访问和大规模移动数据。
  5. 5 高级用户利用 Azure Databricks的内置功能来确定根本原因并分析原始数据。
  6. 6 直接在 Azure Databricks 中的数据上运行临时查询。
  7. 7 将来自 Azure Databricks 的见解传入 Cosmos DB,使用户可通过 Web 和移动应用进行访问。

实时分析

Valós idejű elemzésekKönnyedén elemezheti az élő adatfolyamokat. Folyamatosan nyerhet adatokat bármely IoT-eszközből vagy webes kattintássorozat-naplóból, majd valós időben elemezheti őket.12348765
  1. 概述

概述

轻松从实时流数据中获取见解。持续从所有 IoT 设备或网站点击流日志捕获数据,并准实时地处理数据。

  1. 1 使用 Azure HDInsight 中的 Apache Kafka 集群可轻松提取应用程序的实时流数据。
  2. 2 使用 Azure 数据工厂可将所有结构化数据汇集到 Azure Blob 存储。
  3. 3 利用 Azure Databricks 清理、转换和分析流数据,并将其与来自操作数据库或数据仓库的结构化数据相结合。
  4. 4 使用可缩放机器学习/深度学习技术,借助 Python、R 或 Scala 以及 Azure Databricks 中的内置笔记本体验,从这些数据中获得更深入的见解。
  5. 5 利用 Azure Databricks 和 Azure SQL 数据仓库间的本地连接器来访问和大规模移动数据。
  6. 6 根据 Azure 数据仓库构建分析仪表板和嵌入式报表,以便在组织内共享见解,并使用 Azure Analysis Services 将此数据提供给成千上万的用户。
  7. 7 高级用户利用 Azure Databricks 和 Azure HDInsight 的内置功能来确定根本原因并分析原始数据。
  8. 8 将来自 Azure Databricks 的见解传入 Cosmos DB,使用户可通过实时应用进行访问。

相关产品和服务

Azure Databricks

基于 Apache Spark 的快速、简单、协作分析平台

数据工厂

轻松进行企业级规模混合数据集成

SQL 数据仓库

弹性数据仓库即服务,具有企业级功能

Azure Data Lake Storage 入门