数据工厂

大规模构成和安排数据服务

使用 Azure 数据工厂的客户

概览图

采集和准备

Azure 数据工厂在云中是一种全局部署的数据移动服务。使用数据工厂可以从多个本地和云数据源轻松采集数据。然后连接到具有数据管理网关的本地数据源,并使用数据工厂从数据应在位置获取数据。在采集数据时对其进行准备或分区,或应用预处理步骤。

转换和分析

计划、安排和管理数据转换和分析过程。从范围宽广的处理服务中进行选择,并将所选服务组合到托管数据管道中,以便使用最佳作业工具。例如,可以为大型或半结构化数据添加 Hadoop 处理步骤,为结构化数据添加存储过程调用步骤,为分析添加机器学习步骤,或在任何管道中插入你自己的自定义代码作为处理步骤。

发布和使用

使用数据管道将原始数据转换为可由 BI 工具或应用程序使用的完成数据或成型数据。使用数据工厂从数据应在位置获取数据,以便让本地或云应用程序和服务简单使用。

监视和管理

一目了然地直观显示、监视和管理数据管道的整个网络,以便确定问题和采取措施。轻松了解数据到达时间、数据来源、数据如何准备用于处理以及何时可处理。设置提醒,以监视整个数据工厂服务的运行状况。数据工厂通过按需云资源管理,使数据管道自动化,从而为你节省时间和金钱。

相关产品和服务

HDInsight

设置云 Hadoop、Spark、R Server、HBase 和 Storm 群集

机器学习

基于云的强大预测分析工具,用于启动预见性维护

流分析

实时数据流式处理,可处理来自数百万台 IoT 设备的数据

立即开始使用数据工厂