Azure Databricks

基于 Apache SparkTM 的简便快捷的协作式分析服务

最佳目标是使用 Apache Spark 进行大数据分析和 AI

使用 Azure Databricks,即可解锁所有数据的见解并构建人工智能 (AI) 解决方案,在数分钟内设置 Apache Spark™ 环境,自动缩放以及在交互式工作区中协作共享项目。Azure Databricks 支持 Python、Scala、R、Java 和 SQL,以及数据科学框架和库(包括 TensorFlow、PyTorch 和 scikit-learn)。

Apache Spark™ 是 Apache Software Foundation 的商标。

速度快且经过优化的 Apache Spark 环境

附带对热门工具、语言和框架的内置支持的交互式工作区

通过与本机 Azure 机器学习集成,增强了机器学习对大数据的处理能力

与 Azure SQL 数据仓库结合使用的高性能现代数据仓库

经过优化的 Apache Spark 环境快速入门

Azure Databricks 提供最新版本的 Apache Spark,使你可以与开放源代码库无缝集成。利用 Azure 的全球规模和可用性,在完全托管的 Apache Spark 环境中快速启动群集和构建群集。设置、配置并调试群集,以确保提供可靠性和性能,而无需监视。利用自动缩放和自动终止来提高总拥有成本 (TCO)。

阅读 Azure Databricks 文档

通过共享工作区和常用语言大幅提高工作效率

无论你是数据工程师、数据科学家还是业务分析师,都可以使用交互式工作区和笔记本体验高效地协作共享项目。使用所选语言(包括 Python、Scala、R 和 SQL)进行构建。通过 GitHub 和 Azure DevOps,轻松实现笔记本的版本控制。

了解如何创建 Azure Databricks 工作区

增强机器学习对大数据的处理能力

使用集成的 Azure 机器学习服务访问高级自动化机器学习功能,以快速识别合适的算法和超参数。简化从云端部署到边缘的机器学习模型的管理、监视和更新。Azure 机器学习服务还为试验、机器学习管道和模型提供中央注册表。

观看 Azure Databricks 和 Azure 机器学习的网络研讨会

获得高性能的现代数据仓库

在云中实现数据仓库的现代化,实现无与伦比的性能和可扩展性。通过分析仪表板和操作报表,合并任意规模的数据并获取见解。使用 Azure 数据工厂自动执行数据移动,将数据加载到 Azure Data Lake Storage,使用 Azure Databricks 转换和清理数据,以便使用 Azure SQL 数据仓库使数据进行可视化处理。

了解 Azure 上的现代数据仓库

业界领先的安全性和符合性

  • 利用与 Azure Active Directory 的本机集成进行基于角色的访问控制。
  • 使用可配置的虚拟网络创建安全的体系结构,而不影响符合性。
  • 使用 Azure Databricks 笔记本、群集、作业和数据的细化的用户权限,使你高枕无忧。

Azure Databricks 定价

  • 快速启动群集并根据使用量需求自动纵向扩展或缩小。浏览所有 Azure Databricks 定价选项。

赢得全行业公司的信任

使用基于云的深度学习识别安全隐患

Shell 使用 Azure、AI 和机器视觉来更好地保护客户和员工。

查看案例

Shell

加快性能速度并增加成本节约

数据服务可续订 AI 利用 Azure 和 Apache Spark 来帮助打造一个稳定且盈利的太阳能市场。

查看案例

Renewables AI

在 Azure 中启用端到端分析解决方案

物流提供商 LINX Cargo Care Group 使用 Azure Databricks 促使全公司进行创新。

查看案例

LINX Cargo Care Group

Azure Databricks 入门

注册 Azure 免费帐户即可获得即时访问权限。
要了解如何使用 Azure Databricks,请参阅文档
要创建群集、笔记本、表等,请浏览快速入门

社区和 Azure 支持

MSDN 论坛和 Stack Overflow 上向 Microsoft 工程师和 Azure 社区专家提问并获取支持,或者与 Azure 支持联系。

热门的实验室和模板

发现由 Microsoft 和社区提供的自定进度实验室和热门的常用配置快速入门模板

有关 Azure Databricks 的常见问题解答

  • Azure Databricks SLA 保证 99.95% 的可用性。
  • Databricks 单位(或 DBU)是每小时处理能力的单位,按每秒使用量计费。
  • 数据工程工作负载是指在其运行的群集上自动启动和终止群集的作业。例如,Azure Databricks 作业计划程序可能会触发工作负载,该计划程序仅为该作业启动新的 Apache Spark 群集,并在作业完成后自动终止群集。
    数据分析工作负载不会自动执行。例如,Azure Databricks 笔记本中的命令在 Apache Spark 群集上运行,直到手动将其终止。多个用户可以共享一个群集以协作进行分析。

准备就绪后,开始设置 Azure 免费帐户。