Data Factory

大規模な ETL を簡素化するハイブリッド データ統合サービス

データ統合を加速

あらゆるデータ統合ニーズとスキル レベルを対象として構築されたサービスである Azure Data Factory にデータ サイロを統合します。直感的なビジュアル環境内でコーディングなしで ETL プロセスおよび ELT プロセスを容易に構築することも、独自のコードを記述することもできます。ネイティブに構築されメンテナンス不要の 80 を超えるコネクタを使用して、追加のコストなしで、データ ソースを視覚的に統合できます。ご自分のデータに集中できます。ほかのことは、サーバーレス統合サービスにまかせられます。

Data Factory ビジュアル環境内ではハイブリッド ETL および ELT パイプラインの構築にコーディングもメンテナンスも不要

必要に応じてスケーリングされるコスト効率の高いフル マネージド サーバーレス クラウド データ統合ツール

オンプレミスのアプリ、クラウドベースのアプリ、サービスとしてのソフトウェア (SaaS) アプリに安心して接続できるようにするための Azure セキュリティ対策

最低限の作業で、SSIS ETL ワークロードをクラウドに容易に移動できる SSIS 統合ランタイム

製品化までの時間を短縮して生産性を向上する

コーディングまたはメンテナンスを必要としないで、シンプルかつ包括的な ETL プロセスおよび ELT プロセスを開発できます。ご利用のデータの取り込み、移動、準備、変換、処理を数回のクリックで行い、アクセス可能なビジュアル環境でデータ モデリングを完了することができます。コードの生成およびメンテナンスは、Azure Databricks 内のマネージド Apache Spark™ サービスによって行われます。

オーバーヘッド コストを削減する

ご利用のオンプレミスの SQL Server Integration Services (SSIS) における既存のツールと投資を活用できます。Azure SSIS 統合ランタイムを使用すれば、最低限の作業で、ご利用の SSIS ETL ワークロードをクラウドに容易に移動できます。

事前構築済みのコネクタを使用したデータ転送

事前構築済みの 80 を超えるコネクタ (Azure データ サービス、オンプレミスのデータ ソース、Amazon S3 と Redshift、Google BigQuery など) の拡大し続けるポートフォリオに対して、追加のコストをかけずにアクセスできます。Data Factory では、基盤となるネットワーク帯域幅の全容量を使用して、効率的で回復力のあるデータ転送が実現されます (最大で 1.5 GB/s のスループットを提供)。

コスト効率の高い方法でデータを統合する

管理対象のインフラストラクチャが存在しないサーバーレス ツールを使用して、ご自分のデータを統合できます。料金は使用した分だけお支払いいただけます。データの増加に伴い、エラスティック機能を使用してスケールアウトできます。Azure Databricks の Apache Spark エンジンを使用して、データを迅速かつスケーラブルに変換します。外部組織から拡張されたデータセットを統合します。Azure Data Share を使用して新しいデータセットを Azure 分析環境に受け入れた後、Data Factory を使用してそれらをパイプラインに統合し、データを準備、変換、強化して分析情報を生成します。

好きなやり方で作業しましょう

Data Factory は、すべてのスキル レベルを対象とした単一のハイブリッド データ統合サービスです。パイプラインを構築するには、ビジュアル インターフェイスを使用することも、Python、.NET、ARM で独自のコードを書くこともできます。ご自分で選択した処理サービスをマネージド データ パイプラインに入力するか、またはカスタム コードを任意のパイプラインでの処理ステップとして挿入します。

継続的インテグレーションと継続的配信 (CI/CD) を取得

Azure Monitor を使用して単一のコンソールから、アプリケーションと併せてパイプライン パフォーマンスの監視および管理を継続的に行います。パイプライン監視用の組み込みのサポートを使用して、ご利用の DevOps プロセスを統合します。プログラミングをほとんど必要としないアプローチをお好みの場合は、組み込みの監視ツールとアラートをご利用ください。

信頼されているグローバルなクラウド プレゼンス

  • 25 を超える国/地域で Data Factory にアクセスしています。データ移動サービスは、データのコンプライアンス、効率性、ネットワーク送信コスト削減を確実に実現するためにグローバルに利用できます
  • Data Factory は、HIPAA、HITECH、ISO/IEC 27001、ISO/IEC 27018、CSA STAR によって認定されています。
  • Azure Confidential Computing を使用して、使用中のデータを保護します。Data Factory 管理リソースは Azure のセキュリティ インフラストラクチャ上に構築されています。この管理リソースでは Azure が提供するすべてのセキュリティ対策が使用されます。

初期費用は不要で、料金は必要な分だけ発生します。

スケール、インフラストラクチャ、互換性、パフォーマンス、予算のニーズに合う、さまざまなクラウド データ統合機能についてご紹介します。オプションには、SQL Server プロジェクトをクラウドにシームレスに移行するためのマネージド SSIS や、あらゆるシェイプおよびサイズのデータを統合するための大規模なサーバーレス データ パイプラインなどがあります。

Data Factory の価格

Data Factory リソース

マッピング データ フロー

Mapping Data Flow (プレビュー) を使用すると、コードを記述しなくても、大規模なグラフィカル データ変換ロジックを作成できます。

事前定義済みのテンプレート

パイプラインの構築、データベースからのコピー、Azure での SSIS パッケージの実行、ETL などの一般的なタスク用のテンプレートの拡張ライブラリを使用します。

トリガー機能

トリガーを作成し、そのスケジュールを設定することで、パイプラインの実行が自動化されます。Data Factory では、スケジュール、タンブリング ウィンドウ、イベント ベースという 3 種類のトリガーがサポートされています。

Wrangling Data Flows

コードを記述することなく、ご自分のデータを探索します。コーディングなしでデータの準備を大規模に行うには、Wrangling Data Flows (現在、プライベート プレビューの段階) を使用します。

制御フロー

データ統合やデータ変換のプロセスを大規模にオーケストレーションするために、視覚的にワークフローを構築できます。

あらゆる規模の企業から寄せられる信頼

世界的なメーカーでは従業員がよりスマートに業務をこなすことができるようにビッグ データを使用している

消費者向け健康製品、衛生製品、家庭用製品を製造している Reckitt Benckiser (RB) 社は、ビジネス インテリジェンス ソリューションを Microsoft Power BI および Azure に置き換えました。

事例を見る

Reckitt Benckiser

Cardiovascular 情報システム プロバイダーによって速度の Rx が規定される

LUMEDX は、Data Factory を使用することで、分析情報を以前よりもはるかに短時間で作成しています。カリフォルニアに拠点を置くこの会社では、心臓専門医が患者の治療計画を立てる際に使用する画像とデータを統合する情報システムを提供しています。

事例を見る

LumedX

クラウドベースの機械学習を使用して天気の影響を予測する企業

世界中の約 20 億もの人々が AccuWeather の予報を利用しています。AccuWeather では、Machine Learning service を使用して、事業顧客向けのカスタム天気影響予測を作成し、自社のビジネスを急速に変革しています。

事例を見る

AccuWeather

Azure を初めてご利用になりますか?Data Factory の概要を次に示します。

無料試用版を使用して Azure サブスクリプションをセットアップする
ドキュメントのクイックスタートとチュートリアルにアクセスする。

ドキュメントおよびリソース

サポート オプション

MSDN フォーラムStack Overflow で Microsoft のエンジニアや Azure コミュニティのエキスパートに質問したりサポートを要請したりするか、Azure サポート リソースを調べてみてください。

ビデオ センター

概要、操作方法、主要な機能のデモについては、Data Factory のビデオを参照してください。

Data Factory に関してよく寄せられる質問

  • Data Factory は、25 を超える国/地域で利用できます。データ移動サービスは、データのコンプライアンス、効率性、ネットワーク送信コスト削減を確実に実現するためにグローバルに利用できます
  • Data Factory リソースに対する操作の実行要求を 99.9% 以上の時間、正常に処理することを保証します。スケジュールされたすべてのアクティビティの実行が 99.9% 以上の時間において、予定されている実行時刻の 4 分以内に開始されることも保証します。完全な Data Factory サービス レベル アグリーメント (SLA) を読み取ります。
  • 統合ランタイム (IR) は、ネットワーク環境間でデータ統合機能を提供するために Data Factory によって使用されるコンピューティング インフラストラクチャです。IR により、移動元と移動先のデータ ストア間でデータを移動しながら、組み込みのコネクタ、形式変換、列マッピング、高性能でスケーラブルなデータ転送がサポートされます。IR には、ディスパッチ アクティビティ用の SSIS パッケージをネイティブに実行する機能が備えられており、マネージド Azure コンピューティング環境内で SSIS パッケージがネイティブに実行されます。また、複数のコンピューティング サービスで実行される変換アクティビティのディスパッチおよび監視がサポートされています。詳細については、Data Factory の統合ランタイムに関するページを参照してください。

準備が整ったら、Azure の無料アカウントを設定しましょう。

無料で始める