跳过导航

Azure Databricks

基于 Apache Spark 的快速、简单、协作分析平台

通过专为 Azure 优化的高性能分析平台启用数据科学以加快创新。

推动创新并提高工作效率

将团队聚集在一个交互式工作区中。从数据收集到模型创建,使用 Databricks Notebook 统一整个过程并即时部署到生产。通过单击即可启动新的 Spark 环境。轻松集成多种数据存储和服务,例如 Azure SQL 数据仓库Azure Cosmos DBAzure Data Lake StoreAzure Blob 存储Azure 事件中心Azure IoT 中心Azure 数据工厂。即时添加高级的人工智能 (AI) 功能并通过与 Power BI 的充分集成共享你的见解。

在安全、受信任的云上进行生成

通过 Azure Active Directory 集成、基于角色的控制和企业级 SLA 保护你的数据和业务。细化的用户权限使你安心,可实现安全访问 Databricks Notebook、群集、作业和数据。

无限制缩放

全局缩放你的分析和数据科学项目。使用高级的机器学习功能更快地进行生成和创新。即时添加容量。凭借完全托管、云本机的平台降低成本和复杂性。使用一套完整的分析技术(包括 SQL、流式处理、MLlib 和 GraphX)处理任何大小的数据或项目。

Azure Databricks 快速入门

Azure Databricks 以 Apache Spark 为基础,针对 Azure 进行了优化,是一个快速、简单的协作分析平台。Azure Databricks 由 Apache Spark 的创始人参与设计,结合了 Databricks 和 Azure 的优势,一键式安装、简化的工作流以及交互式工作区让数据科学家、数据工程师和业务分析师能相互协作,加快创新速度。它是一项 Azure 服务,内置于其他 Azure 服务(如 Power BI、SQL 数据仓库和 Cosmos DB)中,具有企业级 Azure 安全(包括 Active Directory 集成、合规性和企业级 SLA),让客户能自动获益。

创建新群集

创建笔记本

协作

步骤 1(共 3 步)

先创建新群集

按需配置群集,点击一个按钮即可启用群集。

步骤 2(共 3 步)

复制群集

复制群集,从而为不同工作流提供支持。

步骤 3(共 3 步)

启用自动缩放

自动缩放功能让你能轻松地快速缩放群集。

还有助于减少手动缩放群集所需的资源和成本。

步骤 1(共 4 步)

轻松创建或导入笔记本

使用笔记本浏览数据。

步骤 2(共 4 步)

设置自定义权限设置

基于角色的权限设置让数据工程师、数据科学家和业务用户可根据个人访问级别相互协作。

步骤 3(共 4 步)

在工作区中创建表

创建新表并从文件或数据源导入现有数据。

步骤 4(共 4 步)

预览并创建表。

使用一个命令即可轻松装载到 Azure 存储。

步骤 1(共 3 步)

实时协作

每位参与者均可就共享项目实时协作并作出评价。

数据科学家可使用数据发现来构建 ML 模型进行训练、测试和运行。

步骤 2(共 3 步)

实时查看数据

业务用户可通过简单易读的实时数据显示,实时查看与其共享的业务关键数据。

步骤 3(共 3 步)

将笔记本作为作业运行

迅速将笔记本作为作业运行。

选择现有笔记本。

从现有流或 ML 库中选择。

提前安排作业,让其自动运行并监控其性能。

了解 Azure Databricks 可以实现的内容

相关产品和服务

Azure Cosmos DB

任何规模的全球分布式多模型数据库服务

SQL 数据仓库

弹性数据仓库即服务,具有企业级功能

存储

持久的、高度可用的、高度可伸缩的云存储器

通过 Azure Databricks 加快数据驱动的创新