跳到主内容
预览中

Azure Databricks Delta 现提供预览

发布日期:九月 24, 2018

Azure Databricks 的高级 SKU 现在包括 Delta 功能并以预览版提供,无额外成本。通过 Delta,客户可以获得更好的数据可靠性、改进其作业和查询的性能,并有机会简化其数据管道。

随着分析的数据量的爆炸性增长、不同数据类型的激增,以及对实时分析的需求,数据管道变得极其复杂。大多数客户生成的多阶段管道都需要在每个步骤具有复原能力,以处理模式不规范和写冲突等问题。解决方案的这种复杂性导致性能显著下降。使用 Azure Databricks 中的 Delta,客户可以显著降低管道的复杂性。

Delta 是 Azure Databricks 中的事务存储层。通过将数据读写到 delta 表(Spark 表的优化版本)与之交互。它以 parquet 格式存储数据,并添加元数据以在 Spark 表上提供附加功能。它在 Azure Databricks 中的 Spark 作业和查询上提供了更好的可靠性和更高的性能。Delta 还通过允许批处理作业和流作业使用同一个表来简化数据管道,同时提供数据一致性,使客户能够简化大规模构建高性能分析解决方案的过程。

只需进行少量代码更改即可开始利用 Azure Databricks 上的 delta。它可与客户用于 Spark 表的 Spark 中的所有现有 API 一起使用。

要开始使用 Azure Databricks 上的 delta,请访问 Databricks delta 快速入门笔记本,并在 delta 文档中阅读有关 Azure Databricks delta 及其功能的更多信息。 

  • Azure Databricks
  • Services

相关产品