略過導覽
預覽中

Azure Databricks 差異現已進入預覽階段

發佈日期: 九月 24, 2018

差異功能現已進入預覽階段,在 Azure Databricks 進階 SKU 中不另行收費。使用差異,客戶能獲得更好的資料可靠性、提升工作和查詢的效能,以及簡化資料管線的機會。

隨著目前分析的資料量爆增、不同的資料類型增生及出現即時分析的需求,資料管線已變得極端複雜。大多數的客戶會建置需要每個步驟都能復原的多重階段管線,以處理結構描述不一致和寫入衝突等問題。此解決方案的複雜程度造成大規模的效能問題。使用 Azure Databricks Delta,客戶能大幅簡化其管線。

差異是 Azure Databricks 中的交易式儲存層。您可透過在 Spark 資料表最佳化版本的差異資料表中讀寫資料,與之互動。它會以 parquet 格式儲存資料及新增中繼資料,透過 Spark 資料表提供其他功能。使用 Azure Databricks 針對 Spark 工作和查詢提供更好的可靠性和更高的效能。差異也會簡化資料管線,允許批次和串流作業使用相同的資料表,同時提供資料一致性,讓客戶簡化大規模高效能分析解決方案的建置工作。

只要變更少量程式碼,即可開始利用 Azure Databricks 差異。對客戶用於 Spark 資料表的所有 Spark 現有 API 都有效。

若要開始使用 Azure Databricks Delta,請瀏覽 Databricks 差異快速入門筆記本,並閱讀差異文件以深入了解 Azure Databricks Delta 及其功能。 

  • Azure Databricks
  • Services

相關產品