Azure Databricks

快速、輕鬆並可共同作業的 Apache SparkTM 型分析服務

使用最佳化的 Apache Spark 進行巨量資料分析和 AI

透過 Azure Databricks 來發掘所有資料的見解並建置人工智慧 (AI) 解決方案;短短幾分鐘內即可設定好 Apache Spark™ 環境;可自動調整;並可在互動式工作區內協作共用專案。Azure Databricks 支援 Python、Scala、R、Java 和 SQL,以及 TensorFlow、PyTorch 和 scikit-learn 等資料科學架構與程式庫。

Apache Spark™ 是 Apache 軟體基金會的商標。

可靠的資料工程

適用於批次及串流工作負載的大規模資料處理

分析您所有的資料

啟用分析以取得最完整且最新的資料

共同作業資料科學

簡化並加速大型資料集上的資料科學

以開放原始碼為根基

快速、最佳化的 Apache Spark 環境

快速使用最佳化的 Apache Spark 環境

Azure Databricks 提供最新版本的 Apache Spark,可讓您與開放原始碼程式庫順暢整合。Azure 的規模與供應區域遍及全球,可讓您在完全受控的 Apache Spark 環境中啟動叢集並快速建置。叢集經過安裝、設定和微調,以確保可靠性和效能,而不需予以監視。利用自動調整和自動終止來提高擁有權總成本 (TCO)。

閱讀 Azure Databricks 文件

使用共用工作區和通用語言來提高生產力

不論您是資料工程師、資料科學家或是商務分析師,都可以使用互動式工作區和筆記本體驗,有效地協作共用專案。使用您所選的語言來建置,包括 Python、Scala、R 和 SQL。使用 GitHub 和 Azure DevOps 輕鬆控制筆記本的版本。

了解如何建立 Azure Databricks 工作區

運用巨量資料提升機器學習

使用整合式 Azure Machine Learning 存取進階自動化機器學習功能,以快速找出合適的演算法和超參數。簡化從雲端部署到邊緣之機器學習模型的管理、監視與更新。Azure Machine Learning 也可以為您的實驗、機器學習管線和模型提供中央登錄。

觀看 Azure Databricks 和 Azure Machine Learning 的網路研討會

獲得高效能的新式資料倉儲

透過分析儀表板與操作報表,結合任何規模的資料並取得見解。使用 Azure Data Factory 自動執行資料移動,然後將資料載入 Azure Data Lake Storage,使用 Azure Databricks 進行轉換與清理,並使用 Azure Synapse Analytics 對資料進行分析。在雲端中將資料倉儲現代化,獲得無與倫比的效能與延展性。

深入了解 Azure 上的雲端規模分析

關鍵服務功能

最佳化的 Spark 引擎

自動調整基礎結構的簡單資料處理,由高度最佳化的 Apache Spark™ 提供支援,可將效能提高多達 50 倍。

機器學習執行階段

按一下即可存取預先設定的機器學習環境,以使用最先進且熱門的架構 (例如 PyTorch、TensorFlow 和 scikit-learn) 來增強機器學習。

MLflow

從中央存放庫追蹤與共用實驗、重現執行,以及共同管理模型。

語言選擇

不論是使用無伺服器或佈建的計算資源,都能利用偏好的語言,包括 Python、Scala、R、Spark SQL 和 .Net。

共同作業筆記本

快速存取並探索資料、尋找與共用新的見解,以及使用自選語言及工具共同建置模型。

Delta Lake

透過專為完整資料生命週期設計的開放原始碼交易式儲存層,為您現有的資料湖帶來資料可靠性與可擴縮性。

與 Azure 服務原生整合

透過與 Azure 服務 (例如 Azure Data Factory、Azure Data Lake Storage、Azure Machine Learning 與 Power BI) 的深入整合,完成端對端分析與機器學習解決方案。

互動式工作區

讓資料科學家、資料工程師與商務分析師之間的共同作業順暢進行。

企業級安全性

簡易原生安全性可保護您的資料安全,在數以千計的使用者與資料集中執行並建立符合規範、非公開及隔離的分析工作區。

已準備好用於生產環境

透過適用於 CI/CD 和監控的生態系統整合,在信任的資料平台上放心地執行與調整您最重要的關鍵資料工作負載。

透過解決方案架構範例深入了解

巨量資料結構上的即時分析

輕鬆取得即時串流資料的見解。持續擷取任何 IoT 裝置的資料,或網站點選流的記錄,並即時處理。

進階分析架構

使用頂級的機器學習工具將資料轉換成可操作的見解。此架構可讓您合併任何規模的資料,以及大規模建置和部署自訂機器學習模型。

機器學習生命週期管理

使用 Azure Databricks、MLflow 和 Azure Machine Learning 來加速與管理您的端對端機器學習生命週期,以建置、共用、部署及管理機器學習應用程式。

絕不妥協的資料安全性與隱私權

  • 利用領先業界的廣泛安全性及合規性功能,保護、監視和管理您的資料與分析解決方案。

  • 使用單一登入與 Azure Active Directory 整合,讓資料專家可以投入更多時間探索見解。

  • Azure 獲得的認證遠多於其他任何雲端提供者。檢視完整清單

深入了解 Azure Databricks 產品與服務

Azure Databricks 定價

受到各業界企業的信賴

使用雲端式深度學習找出安全危害

Shell 使用 Azure、AI 和機器視覺來提供客戶與員工更完善的保護。

閱讀案例

Shell

提升效能並節省更多費用

資料服務 renewables.AI 使用 Azure 及 Apache Spark 協助打造穩定且可營利的太陽能市場。

閱讀案例

Renewables AI

在 Azure 中啟用全面的分析解決方案

物流提供者 LINX Cargo Care Group 使用 Azure Databricks 來推動全公司的創新。

閱讀案例

LINX Cargo Care Group

開始使用 Azure Databricks

註冊 Azure 免費帳戶以立即存取。
閱讀文件以了解如何使用 Azure Databricks。
探索快速入門以建立叢集、筆記本、資料表等項目。

社群與 Azure 支援

MSDN 論壇與 Stack Overflow 中提問並取得 Microsoft 工程師和 Azure 社群專家的支援,或連絡 Azure 支援

熱門實驗室與範本

探索自學型實驗室,以及 Microsoft 與社群製作的熱門常用組態快速入門範本

取得最新的 Azure Databricks 新聞和資源

關於 Azure Databricks 的常見問題集

  • Azure Databricks SLA 保證正常運作時間達 99.95%。
  • 一個 Databricks 單位 (DBU) 即為一單位的每小時處理功能,依每秒使用量計費。
  • 資料工程工作負載是自動啟動與終止其執行所在叢集的作業。例如,工作負載可能會由 Azure Databricks 作業排程器觸發,然後單獨為作業啟動 Apache Spark 叢集,並在作業完成後自動終止叢集。
    資料分析工作負載不會自動進行。例如,Azure Databricks 筆記本中的命令會在 Apache Spark 叢集上執行,直到手動將其終止為止。多名使用者可以共用叢集以共同分析。

當您一切就緒時,就能開始設定 Azure 免費帳戶