数据工厂

可大规模简化 ETL 的混合数据集成服务

加快数据集成

将数据孤岛与 Azure 数据工厂相集成,后者是一款专为各项数据需求和技能级别构建的服务。在直观的视觉环境中不用代码即可轻松构建 ETL 和 ELT 进程,也可自行编写代码。借助超过 80 个本机构建且免维护的连接器直观集成数据源 - 这些连接器均无额外费用。关注你的数据 - 剩余操作由无服务器集成服务负责。

无需代码和维护,即可在数据工厂视觉环境中构建混合 ETL 和 ELT 管道

极具成本效益且完全托管的无服务器云数据集成工具,可按需伸缩

Azure 安全性可测量到本地应用、基于云的应用和软件即服务应用的连接情况,让你高枕无忧

SSIS 集成运行时让你轻而易举地就能将 SSIS ETL 工作负载移动到云端

缩短上市时间,提升工作效率

无需代码和维护就能开发简单而全面的 ETL 和 ELT 进程。单击几下即可引入、移动、准备、转换和处理数据,还可在易访问的视觉环境中完成数据建模。Azure Databricks 中托管的 Apache Spark™ 服务负责生成和维护代码。

减少开销成本

利用本地 SQL Server Integration Services (SSIS) 中的现有工具和投资。借助 Azure-SSIS 集成运行时,轻而易举地就能将 SSIS ETL 工作负载移动到云端。

使用预构建的连接器传输数据

查看不断扩充的项目组合,其中有 80 多种预构建的连接器,包括 Azure 数据服务、本地数据源、Amazon S3、Amazon Redshift 和 Google BigQuery - 均无需额外成本。数据工厂利用基础网络带宽的完整功能,提供高达 1.5 GB 每秒的吞吐量,可实现高效而可靠的数据传输。

让数据集成极具成本效益

Integrate your data using a serverless tool with no infrastructure to manage. Pay only for what you use, and scale out with elastic capabilities as your data grows. Transform data with speed and scalability using the Apache Spark engine in Azure Databricks. Integrate expanded datasets from external organizations. Use Azure Data Share to accept new datasets into your Azure analytics environment, then use Data Factory to integrate them into your pipelines to prepare, transform, and enrich your data to generate insights.

按你想要的方式工作

数据工厂为各种技能级别提供了一种混合数据集成服务。使用可视界面或采用 Python、.NET 或 ARM 编写自己的代码,从而生成管道。将所选的处理服务放到托管的数据管道中,或者在任意管道中插入自定义代码作为一个处理步骤。

获取持续集成和交付 (CI/CD)

借助 Azure Monitor,通过一个控制台就能持续监视和管理管道性能及应用程序。通过针对管道监视的内置支持实现 DevOps 进程的集成。如果偏爱使用更少编程的方法,请使用内置的视觉监视工具和警报。

遍布全球、值得信赖的云端状况

  • 可在超过 25 个国家/地区访问数据工厂。数据移动服务全球可用,可确保数据符合要求、高效利用,还可降低网络出口成本。
  • 数据工厂已通过 HIPAA、HITECH、ISO/IEC 27001、ISO/IEC 27018 和 CSA STAR 认证。
  • 使用 Azure 机密计算,在使用数据的同时保护数据。数据工厂管理资源建立在 Azure 安全基础结构上,且使用各项 Azure 安全措施。

仅对所需资源付费,无前期成本

了解一系列云数据集成功能,找到适合你的规模、基础结构、兼容性、性能和预算需求的功能。选项包括托管的 SSIS(用于将 SQL Server 项目无缝迁移到云端)和大规模、无服务器数据管道(用户集成各种形状和大小的数据)。

数据工厂定价

数据工厂资源

映射数据流

借助映射数据流(预览版),无需编写代码即可大规模地开发图形化数据转换逻辑。

预定义模板

使用不断扩充的模板库来处理管道构建、从数据库复制、在 Azure 中执行 SSIS 包和 ETL 等常见任务。

触发器

通过创建和安排触发器,自动执行管道运行操作。数据工厂支持三种类型的触发器:“安排”、“滚动窗口”或“基于事件”。

整理数据流

无需编写代码即可查看数据。借助 Wrangling Data Flows(现为个人预览版),无需代码即可大规模准备数据。

控制流

可直观构造工作流,从而大规模地编排数据集成和数据转换进程。

受到各种规模公司的信赖

这家全球制造商使用大数据来帮助员工更智能地工作

Reckitt Benckiser (RB) 是一家生产消费者健康、保洁和家居产品的公司,它将其业务集成解决方案替换成了 Microsoft Power BI 和 Azure。

查看案例

Reckitt Benckiser

心血管信息系统提供商可开具 Rx 药来提升速度

LUMEDX 使用数据工厂来生成见解,而所用时间与之前相比大幅减少。这家总部在加利福尼亚的公司提供可加强图像和数据心脏病专家用来规划患者护理的信息系统。

查看案例

LumedX

使用基于云的机器学习的业务预测天气影响

全球约 20 亿人依赖于 AccuWeather 天气预测。AccuWeather 使用 Azure 机器学习服务为业务客户创建自定义天气影响预测,同时加快自身业务的转型。

查看案例

AccuWeather

是 Azure 的新手?下面介绍了如何开始使用数据工厂

使用免费试用版设置 Azure 订阅。
在 Azure 门户中创建数据工厂
文档中查看快速入门和教程。

文档和资源

支持选项

MSDN 论坛Stack Overflow 上向 Microsoft 工程师和 Azure 社区专家提问并获取支持,或者查看 Azure 支持部门资源。

视频中心

查看数据工厂视频,了解主要功能和特性的概述、操作方法和演示。

有关 数据工厂 的常见问题解答

  • 数据工厂已在 超过 25 个国家/地区推出。数据移动服务全球可用,可确保数据符合要求、高效利用,还可降低网络流出量成本。
  • 我们保证至少在 99.9% 的时间内成功处理请求以对数据工厂资源执行操作。我们同时保证所有活动运行至少在 99.9% 的时间里于其计划执行时间的 4 分钟内启动。请阅读完整的数据工厂服务级别协议 (SLA)。
  • 集成运行时 (IR) 是数据工厂用于跨网络环境提供数据集成功能的计算基础结构。IR 在源数据存储和目标数据存储之间移动数据,同时为内置连接器、格式转换、列映射和可伸缩数据传输提供支持。借助 IR,可在本机为调度活动执行 SSIS 包,还可在托管的 Azure 计算环境中本机执行 SSIS 包。它支持对在多个计算服务上运行的转换活动进行调度和监视。有关详细信息,请参阅数据工厂中的集成运行时

准备就绪后,开始设置 Azure 免费帐户

免费开始使用