Data Pipeline 定價

定價詳細資料

Azure Data Factory:Data Pipeline 定價

Data Pipeline 的定價計算方式是依據:

  • 管線協調流程和執行
  • 資料流程執行與偵錯
  • Data Factory 作業數,例如建立管線及管線監視

Data Factory 管線協調流程和執行

管線是個別步驟的控制流程,這些步驟稱為活動。您會支付 Data Pipeline 協調流程的費用 (依活動回合),以及活動執行的費用 (依整合執行階段時數)。整合執行階段在 Azure 中為無伺服器,在混合式案例中為自我裝載,可提供用來執行管線中活動的計算資源。整合執行階段費用會按分鐘照比例計算,並無條件進位。

例如,Azure Data Factory 複製活動以安全、可靠、高效能且可調整的方式,在不同資料存放區之間移動資料。整合執行階段可隨著資料量或輸送量需求增加而擴增,以符合這些需求。

類型 Azure Integration Runtime 價格 Azure 受控 VNET 整合執行階段價格 自我裝載整合執行階段價格
協調流程1 每 1,000 回合 $- 每 1,000 回合 $- 每 1,000 回合 $-
資料移動活動2 $-/每小時每個 DIU $-/每小時每個 DIU 每小時 $-
管線活動3 每小時 $-

每小時 $-

(最多可以並行執行 50 個管線活動)

每小時 $-

外部管線活動4 每小時 $- 每小時 $-

(最多可以並行執行 800 個管線活動)

每小時 $-
  1. 協調流程指的是活動執行、觸發程式執行和偵錯執行。
  2. 使用複製活動從 Azure 資料中心輸出資料會產生額外的網路頻寬費用,這部分的費用在帳單上會另以連出資料轉送明細項目列出。深入了解輸出資料轉送定價
  3. 管線活動會在整合執行階段上執行。管線活動包括在製作 (測試連線、瀏覽資料夾清單與資料表清單、取得結構描述及預覽資料) 期間的查閱、取得中繼資料、刪除及結構描述作業。
  4. 外部管線活動是在整合執行階段上管理,但在已連結的服務上執行。這些外部活動包括:Databricks、預存程序、HDInsight 活動等多項活動。如需外部活動的完整清單,請參閱這裡。若是 Mapping Data Flow 活動,請參閱下方的 [Data Factory 資料流程執行與偵錯] 區段。

資料流程執行與偵錯

資料流程是 Data Factory 中以視覺方式設計的元件,能夠進行大規模的資料轉換。資料流程叢集的執行與偵錯時間費用,以每小時每個 vCore 為單位收取。執行資料流程的最小叢集大小為 8 個 vCore。執行與偵錯費用會按分鐘數照比例計算,並無條件進位。

類型 價格
計算最佳化 每小時每個 vCore $-
一般用途 每小時每個 vCore $-
記憶體最佳化 每小時每個 vCore $-

注意:Data Factory 資料流程也會針對資料流程執行與偵錯所需的受控磁碟和 Blob 儲存體收取費用。此外,雖然整頓資料流功能處於公開預覽狀態,但使用此功能的價格將為上表所列價格的半價。

Data Factory 作業

類型 價格 範例
讀取/寫入* 每 50,000 個修改/參考的實體 $- Azure Data Factory 中實體的讀取/寫入*
監視 每 50,000 個擷取的回合記錄 $- 管線、活動、觸發程序和偵錯回合的監視**

* Azure Data Factory 實體的讀取/寫入作業包括建立、讀取、更新和刪除。這些實體包括資料集、已連結的服務、管線、整合執行階段和觸發程序。

** 監視作業包括取得及列出管線、活動、觸發程序和偵錯回合。

非使用中的管線

如果管線沒有相關聯的觸發程序,或一個月內沒有任何回合,則會視為非使用中。非使用中的管線計費方式為每月 $-

常見問題集

  • 讀取/寫入作業包括建立、讀取、更新和刪除 Azure Data Factory 實體。這些實體包括資料集、已連結的服務、管線、整合執行階段和觸發程序。
  • 監視作業包括取得及列出管線、活動、觸發程序和偵錯回合。
  • 活動是管線中的一個步驟。每個活動的執行稱為回合。
  • 整合執行階段是 Azure Data Factory 所使用的計算基礎結構,可跨不同網路環境提供下列資料整合功能:

    • 資料移動:在公用和私人 (內部部署或虛擬私人) 網路中的資料存放區之間轉送資料,同時提供內建連接器、格式轉換、資料行對應,以及高效能且可調整規模的資料轉送支援。
    • 活動分派:分派和監視在 Azure HDInsight、Azure Machine Learning、Azure SQL Database、SQL Server 等各種計算服務上執行的轉換活動。
    • SQL Server Integration Services 套件執行:受控 Azure 計算環境中 SQL Server Integration Services 套件的原生執行。
  • 觸發程序是一個處理單位,用來決定何時需要啟動管線執行。觸發程序回合是觸發程序執行,如果符合條件,可能會產生活動回合。
  • 偵錯回合是使用者可在反覆開發期間執行的測試回合,以確保管線中的步驟如預期運作,然後將變更發佈至 Data Factory。
  • 非使用中的管線是未與任何觸發程序建立關聯且一個月內回合數為零的管線。一個月零回合數之後會收取費用。
  • 管線執行活動 (Azure 整合執行階段資料移動、管線活動、外部和自我裝載整合執行階段資料移動、管線活動和外部) 會依照以上所示的每小時費率計費。管線執行費用會按分鐘比例分配且無條件進位。

    例如:如果您執行的作業花費 2 分鐘 20 秒,則會以 3 分鐘計費。

  • 您可以在 Azure Data Factory 文件頁面上找到以案例為基礎的定價範例。
  • 請查看 Azure Data Factory 主要頁面,以取得如何規劃和管理 ADF 成本的指引。

定價詳細資料

Data Factory 使用量的定價計算方式是依據下列因素:

  • 活動頻率 (高或低)。低頻率活動一天不會執行超過一次 (例如每日、每週、每月);高頻率活動一天會執行超過一次 (例如每小時、每 15 分鐘)。如需詳細資料,請參閱下方的活動協調流程
  • 活動執行所在 (雲端或內部部署)。請參閱下方的資料移動一節。
  • 管線是否為使用中。請參閱下方的非使用中的管線一節。
  • 您是否正在重新執行活動。請參閱下方的重新執行活動一節。

活動協調流程

不頻繁 頻繁
雲端中執行的活動

(例如:複製活動將資料從 Azure Blob 移至 Azure SQL Database;Hive 活動會在 Azure HDInsight 叢集上執行 Hive 指令碼)。
每項活動每月 $- 每項活動每月 $-
在內部部署執行且涉及自我裝載整合執行階段的活動

(例如:複製活動將資料從內部部署 SQL Server 資料庫移至 Azure Blob;預存程序活動會在內部部署 SQL Server 資料庫中執行預存程序)。
每項活動每月 $- 每項活動每月 $-

注意:

  • 每個月使用超過 100 個活動將享有 20% 的折扣,低頻率及高頻率案例皆適用。
  • 雲端及內部部署變體一個月內的前 5 個低頻率活動皆為免費。

資料移動

Azure Data Factory 以安全、可靠、高效能且可調整的方式,在不同資料存放區之間複製資料。Azure Data Factory 可隨著您的資料量或資料移動輸送量成長而擴增,以滿足需求。若要了解如何利用資料移動單位提高資料移動的效能,請參閱複製活動效能指引

在不同雲端資料存放區之間移動資料 每小時 $-
涉及內部部署存放區時的資料移動 每小時 $-
注意:
如有產生資料傳輸費用,在帳單上會另以輸出資料傳輸明細項目列出。只要資料超出 Azure 資料中心範圍,就會收取輸出資料傳輸費用。如需詳細資訊,請參閱資料傳輸定價詳細資料

未使用的管線

您必須使用日期/時間範圍 (開始及結束時間),為您部署到 Azure Data Factory 上的每一個管線,指定資料處理的使用中期間。即使活動並未真正執行,管線也會在指定期間視為使用中,並於此期間以外的時間視為非使用中。

非使用中的管線計費方式為每月 $-

若管線整月停用,該月份將會以適用的「停用管線」費率收費。若管線在一個月中只使用了幾天,該月份將會依照當月停用管線的時數按比例收取停用期間的費用。例如,若管線的開始日期及時間為 2016/1/1 上午 12 點且結束時間為 2016/1/20 上午 12 點,管線會在那 20 天中視為使用中,而其餘 11 天為非使用中。非使用中管線的費用 ($-) 依比例為 11 天。

若管線未指定使用中資料處理的期間 (開始及結束時間),就會被視為非使用中。

重新執行活動

活動可以視需要重新執行 (例如:在排程執行期間無法使用資料來源時)。重新執行活動的費用,會隨活動執行的位置而不同。在雲端中重新執行活動的費用為每個 1,000 重新執行 $-。在內部部署重新執行活動的費用為每個 $-重新執行 1,000。

範例

假設您的資料管線具有下列每天執行一次 (低頻率) 的兩個活動:

  1. [複製] 活動會從內部部署 SQL Server 資料庫將資料複製到 Azure Blob。
  2. [Hive] 活動會在 Azure HDInsight 叢集上執行 Hive 指令碼。

假設一天要花費 2 小時才能將資料從內部部署 SQL Server 資料庫移至 Azure Blob 儲存體。下表顯示與此管線相關聯的費用:

第一個活動 (將資料從內部部署複製到 Azure)
資料移動費用 (每月) 每月 30 天
每天 2 小時
$-
$-
活動協調流程成本 (每月) $-
小計 (每月) $-
第二個活動 (在 Azure HDInsight 上執行的 Hive 指令碼)
資料移動費用 (每月) $-
活動協調流程成本 (每月) $-
小計 (每月) $-
活動總計 (每月) $-

您也可使用 Data Factory 定價計算機計算此案例的費用。

注意:

  • 前五個雲端及內部部署活動免費。上述費用假設您已使用了每月的五個雲端及五個內部部署活動 (於其他管線中)。
  • Azure 儲存體及 HDInsight 服務依其服務費率分開計費。

支援與 SLA

  • 免費的帳單及訂用帳戶管理支援。
  • 每月 $29 起的彈性支援方案。依方案購買
  • 保證成功處理要求,以執行 Data Factory 資源之相關作業的達成率不低於 99.9%。
  • 保證所有執行的活動,皆會在其排定執行時間之 4 分鐘內啟動的達成率不低於 99.9%。
  • 若要深入了解 SLA,請前往 SLA 頁面。

常見問題集

  • 活動會定義要在您資料上執行的動作。每個活動都會採用零或多個資料集作為輸入,並製作一或多個資料集作為輸出。活動是 Azure Data Factory 中的協調流程單位。

    例如,您可使用 [複製] 活動來協調資料集之間複製資料的流程。同樣地,您也可使用 [Hive] 活動在 Azure HDInsight 叢集上執行 Hive 查詢,進而轉換或分析您的資料。Azure Data Factory 提供範圍廣泛的資料轉換資料移動活動。您也可以選擇建立自訂 .NET 活動,執行自己專屬的程式碼。

  • 管線是活動的邏輯分組。管線可於使用者指定的期間為使用中 (開始及結束時間),而其餘時間皆為非使用中。
  • 可以。如果活動使用了諸如 HDInsight 之類的 Azure 服務,這些活動會依其服務費率另外計費。

  • 當您執行資料複製時,會產生兩組費用。首先,用於執行複製的計算資源,會以資料移動計量表表示。資料移動計量表分為雲端及內部部署兩種版本。因為有一部分的複製運算會由您擁有的內部部署資源執行,所以內部部署資料移動的費用會比較低。資料移動費用依分鐘數為比例無條件進入計費。(例如,若複製資料費時 41 分鐘 23 秒的計算時間,則會以 42 分鐘計算)。

    此外,如有產生資料傳輸費用,在帳單上會另以連出資料傳輸明細項目列出。只要資料超出 Azure 資料中心範圍,就會收取輸出資料傳輸費用。如需詳細資訊,請參閱資料傳輸定價詳細資料

資源

預估您 Azure 服務的每月成本

檢閱 Azure 定價常見問題集

深入了解 Data Factory

檢閱技術教學課程、影片和更多資源

已新增至估算。 按下 'v' 即可在計算機上檢視

與銷售專員洽談,取得 Azure 定價的逐步解說。了解您雲端解決方案的定價。

取得免費的雲端服務,以及可於 30 天內用來探索 Azure 的 $200 點數。