Azure Data Lake Storage Gen2 定价

基于 Blob 存储构建的高度可缩放的安全 Data Lake Storage

Azure Data Lake Storage Gen2 是全球最为高效的 Data Lake。它将带有集成式分层命名空间、兼容 Hadoop 的文件系统与 Azure Blob 存储大规模和经济高效的优势结合在一起,帮助加快从概念证明到生产的转换。

  1. 完全集成了 Azure Blob 存储平台;每个 Blob 存储功能(Azure Active Directory 集成、静态加密、高可用性和灾难恢复、自动化生命周期策略管理以及存储帐户防火墙等等)均可以由 Azure Data Lake Storage 使用
  2. 针对领先的云分析引擎进行了优化
  3. 紧密集成了 Azure 大数据分析堆栈的所有元素,可以提供快速的见解
  4. 使分析数据能够与同一存储中的对象数据共存,而无需更改程序或复制数据
  5. 与其他数据存储相比,能够更快地执行,从而使分析工作负载能更快地运行并降低 TCO

常规用途 v2 的定价以最低 GB 存储价格为目标进行了优化,通过它可以访问最新的 Azure 存储功能(包括冷存储和存档存储)。使用这些帐户可访问 Data Lake Storage、块 Blob、页 Blob、文件和队列。

Azure Data Lake Storage Gen2 提供以两种不同的方式组织数据的选项。凭借分层命名空间选项,客户可以将他们的 Data Lake 组织到结构化目录、文件夹和文件中。凭借平面命名空间,客户可以将他们的 Data Lake 作为非结构化 blob 存储进行操作。无论使用哪种选项,客户将支付相同的存储价格,如下表所示。然而,如果使用分层命名空间选项,客户将为与文件夹和目录结构相关联的额外元数据付费,这部分费用是帐单的一部分。

数据存储价格

存档
前 50 TB/月 $-/GB $-/GB $-/GB
超过 450 TB/月 $-/GB $-/GB $-/GB
超过 500 TB/月 $-/GB $-/GB $-/GB
前 50 TB/月 $-/GB $-/GB $-/GB
超过 450 TB/月 $-/GB $-/GB $-/GB
超过 500 TB/月 $-/GB $-/GB $-/GB
前 50 TB/月 $-/GB $-/GB $-/GB
超过 450 TB/月 $-/GB $-/GB $-/GB
超过 500 TB/月 $-/GB $-/GB $-/GB
前 50 TB/月 $-/GB $-/GB 不适用
超过 450 TB/月 $-/GB $-/GB 不适用
超过 500 TB/月 $-/GB $-/GB 不适用
存档
前 50 TB/月 $-/GB $-/GB $-/GB
超过 450 TB/月 $-/GB $-/GB $-/GB
超过 500 TB/月 $-/GB $-/GB $-/GB
前 50 TB/月 $-/GB $-/GB $-/GB
超过 450 TB/月 $-/GB $-/GB $-/GB
超过 500 TB/月 $-/GB $-/GB $-/GB
前 50 TB/月 $-/GB $-/GB $-/GB
超过 450 TB/月 $-/GB $-/GB $-/GB
超过 500 TB/月 $-/GB $-/GB $-/GB
前 50 TB/月 $-/GB $-/GB 不适用
超过 450 TB/月 $-/GB $-/GB 不适用
超过 500 TB/月 $-/GB $-/GB 不适用

事务价格

存档
写入操作* (每 4 MB,按 10,000 计) $- $- $-
读取操作** (每 4 MB,按 10,000 计) $- $- $-
写入操作* (每 4 MB,按 10,000 计) $- $- $-
读取操作** (每 4 MB,按 10,000 计) $- $- $-
写入操作* (每 4 MB,按 10,000 计) $- $- $-
读取操作** (每 4 MB,按 10,000 计) $- $- $-
写入操作* (每 4 MB,按 10,000 计) $- $- 不适用
读取操作** (每 4 MB,按 10,000 计) $- $- 不适用
*以下 API 调用视为写入操作:AppendFile、CreateFilesystem、CreatePath、CreatePathFile、FlushFile、SetFileProperties、SetFilesystemProperties、RenameFile、RenamePathFile、CopyFile **以下 API 调用视为读取操作: ReadFile、ListFilesystemFile
存档
写入操作* (每 4 MB,按 10,000 计) $- $- $-
读取操作** (每 4 MB,按 10,000 计) $- $- $-
写入操作* (每 4 MB,按 10,000 计) $- $- $-
读取操作** (每 4 MB,按 10,000 计) $- $- $-
写入操作* (每 4 MB,按 10,000 计) $- $- $-
读取操作** (每 4 MB,按 10,000 计) $- $- $-
写入操作* (每 4 MB,按 10,000 计) $- $- 不适用
读取操作** (每 4 MB,按 10,000 计) $- $- 不适用
*以下 API 调用视为写入操作:AppendFile、CreateFilesystem、CreatePath、CreatePathFile、FlushFile、SetFileProperties、SetFilesystemProperties、RenameFile、RenamePathFile、CopyFile **以下 API 调用视为读取操作: ReadFile、ListFilesystemFile

“存档”提前删除

除每月每 GB 的费用之外,移动到“存档”层的任何 blob 还需计入 180 天的“存档”层提前删除期费用。此费用按比例收取。例如,如果某个 blob 移动到“存档”层,然后在 45 天后被删除或移动到“热”层,则客户需要支付在“存档”中存储该 blob 135(180 减 45)天的提前删除费用。

其他操作和元数据存储计量

存档
Iterative Write Operations (per 10,000) $- $- $-
迭代写入操作(以 100 计)* $- $- $-
除删除(此操作免费)之外的其他操作(按 10,000 计) $- $- $-
数据检索 (GB) 免费 $- $-
数据写入 (GB) 免费 免费 免费
元数据存储 (GB/月) 不适用 不适用 不适用
Iterative Write Operations (per 10,000) $- $- $-
迭代写入操作(以 100 计)* $- $- $-
除删除(此操作免费)之外的其他操作(按 10,000 计) $- $- $-
数据检索 (GB) 免费 $- $-
数据写入 (GB) 免费 免费 免费
元数据存储 (GB/月) 不适用 不适用 不适用
Iterative Write Operations (per 10,000) $- $- $-
迭代写入操作(以 100 计)* $- $- $-
除删除(此操作免费)之外的其他操作(按 10,000 计) $- $- $-
数据检索 (GB) 免费 $- $-
数据写入 (GB) 免费 免费 免费
元数据存储 (GB/月) 不适用 不适用 不适用
Iterative Write Operations (per 10,000) $- $- 不适用
迭代写入操作(以 100 计)* $- $- 不适用
除删除(此操作免费)之外的其他操作(按 10,000 计) $- $- 不适用
数据检索 (GB) 免费 $- 不适用
数据写入 (GB) 免费 免费 不适用
元数据存储 (GB/月) 不适用 不适用 不适用
*以下 API 调用视为迭代写入操作:RenameDirectory、RenamePath、RenamePathDir
存档
Iterative Write Operations (per 10,000) $- $- $-
迭代写入操作(以 100 计)* $- $- $-
除删除(此操作免费)之外的其他操作(按 10,000 计) $- $- $-
数据检索 (GB) 免费 $- $-
数据写入 (GB) 免费 免费 免费
元数据存储 (GB/月) $- 不适用 不适用
Iterative Write Operations (per 10,000) $- $- $-
迭代写入操作(以 100 计)* $- $- $-
除删除(此操作免费)之外的其他操作(按 10,000 计) $- $- $-
数据检索 (GB) 免费 $- $-
数据写入 (GB) 免费 免费 免费
元数据存储 (GB/月) $- 不适用 不适用
Iterative Write Operations (per 10,000) $- $- $-
迭代写入操作(以 100 计)* $- $- $-
除删除(此操作免费)之外的其他操作(按 10,000 计) $- $- $-
数据检索 (GB) 免费 $- $-
数据写入 (GB) 免费 免费 免费
元数据存储 (GB/月) $- 不适用 不适用
Iterative Write Operations (per 10,000) $- $- 不适用
迭代写入操作(以 100 计)* $- $- 不适用
除删除(此操作免费)之外的其他操作(按 10,000 计) $- $- 不适用
数据检索 (GB) 免费 $- 不适用
数据写入 (GB) 免费 免费 不适用
元数据存储 (GB/月) $- 不适用 不适用
*以下 API 调用视为迭代写入操作:RenameDirectory、RenamePath、RenamePathDir

ADLS Gen2 的数据传输价格

将数据写入到 GRS 帐户时,该数据将被复制到另一个 Azure 区域。异地复制数据传输费用是将数据复制到另一个 Azure 区域的带宽成本。将帐户复制设置从 LRS 更改为 GRS 或 RA-GRS 时,仍需收取此费用。在 Blob 定价页中查看数据传输价格

常见问题

  • Azure Data Lake Storage 针对在非结构化数据上运行分析工作负载进行了优化。Azure Data Lake Storage Gen2 针对大量数据的快速 I/O 进行了优化,使分析工作负载能够更快地运行并且降低分析作业的 TCO。此外,Azure Data Lake Storage Gen2 提供了在平面或分层命名空间中组织数据的额外灵活性。

  • 凭借分层命名空间,可以将数据组织到结构化文件夹和目录中。使用平面命名空间时,文件将按照平面结构进行组织,如 Blob 存储一样。分层命名空间使文件夹重命名和删除等操作能够在单个原子操作中执行,而平面命名空间要求进行的操作数与结构中的对象数量成比例。分层命名空间将存储目录和文件夹结构的额外元数据。然而,当数据量增长时,分层命名空间能够使你的数据保持井井有条,更重要的是,能够针对分析作业带来更佳的存储性能 - 从而降低运行分析作业的整体 TCO。

    • 使用平面命名空间的计费

    假设将 120 TB 的数据存储在使用“热层”中的平面命名空间的 Azure Data Lake Storage Gen2 中整整一个月。在这个月期间,要执行 1 亿次操作,假设每次操作的大小为 6 MB。此外,假如其中 20% 的操作是写入操作,其他 80% 的是读取操作。最后,假设在这个月期间,也对 1 万个目录进行了重命名。

    对于平面命名空间,将不会针对与文件和文件夹相关联的元数据产生费用,因此,将仅对 120 TB 的数据进行收费。此外,由于每次操作的大小为 6 MB,因此将按操作收取两个事务的费用 (4 MB + 2 MB),因为每读取或写入 4 MB 的数据是按一个事务收费的。最后,目录重命名是通过单独的指标计费的。

    以下是总成本的计算方式:

    使用的资源 使用量 价格 每月成本
    存储 120TB

    $- 对于前 50 TB

    $- 对于后 450 TB

    $- * 50TB = $-

    $- * 70TB = $-

    总计 $-
    事务 写入: 每 4 MB = 2

    $-/10K

    2 * $-/10K * 20M = $-

    读取: 每 4 MB = 2

    $-/10K

    2 * $-/10K * 80M = $-

    总计 $-
    目录重命名 10K $-/100 $-/100 * 10K = $-
    每月总成本:

    存储

    事务

    目录重命名

    每月总成本

    $-

    $-

    $-

    $-


    • 使用分层命名空间的计费

    假设将 120 TB 的数据存储在使用“热层”中的分层命名空间的 Azure Data Lake Storage Gen2 中整整一个月。在这个月期间,要执行 1 亿次操作,假设每次操作的大小为 6 MB。此外,假如其中 20% 的操作是写入操作,其他 80% 的是读取操作。最后,假设在这个月期间,也对 1 万个目录进行了重命名。

    对于分层命名空间,将针对与文件和文件夹相关联的元数据收取额外的费用,因此,收取的费用要高于仅仅存储 120 TB 数据的费用。此外,由于每次操作的大小为 6 MB,因此将按操作收取两个事务的费用 (4 MB + 2 MB),因为每读取或写入 4 MB 的数据是按一个事务收费的。最后,目录重命名是通过单独的指标计费的。

    以下是总成本的计算方式:

    使用的资源 使用量 价格 每月成本
    存储 132TB

    $- 对于前 50 TB

    $- 对于后 450 TB

    $- * 50TB = $-

    $- * 82TB = $-

    总计 $-
    事务 写入: 每 4 MB = 2

    $-/10K

    2 * $-/10K * 20M = $-

    读取: 每 4 MB = 2

    $-/10K

    2 * $-/10K * 80M = $-

    总计 $-
    目录重命名 10K $-/100 $-/100 * 10K = $-
    每月总成本:

    存储

    事务

    目录重命名

    每月总成本

    $-

    $-

    $-

    $-

  • 是的,大型文件更具成本效益,并且能带来更佳的分析性能。对于超过 4MB 大小的文件,Azure Data Lake Storage Gen2 为超过 4 MB 后每 4 MB 的数据读取块提供更低的价格。读取 16 MB 大小的单个文件比读取 4 个大小均为 4 MB 的文件要更划算。在这两种情况下,事务的总数都为 4。然而,从 16 MB 文件中作为三个事务读取最后的 12 MB 要更划算,从而使读取 16 MB 文件的总成本要低于读取 4 个大小均为 4 MB 的文件。

    更重要的是,Azure Data Lake Storage Gen2 经过了高度优化,能够快速地在大型文件上执行。这意味着在对大型文件进行操作时,分析作业将更快地运行,从而进一步降低运行分析作业的 TCO。

支持和 SLA

  • 关于计费及订阅管理的免费支持。
  • 灵活的支持计划,$29/月起。购买计划
  • 保证可用性至少达 99.9%(预览服务除外)。阅读 SLA

资源

估计每月的 Azure 服务费用

查看 Azure 定价常见问题

了解有关 存储帐户 的更多信息

查看技术教程、视频和更多资源

添加到估价。 按“V”在计算器上查看

了解并使用 $200 信用额度构建,继续免费使用