使用 Kubeflow 將機器學習模型部署至 AKS

Azure Blob 儲存體
Azure Container Registry
Azure Kubernetes Service (AKS)

解決方案構想

本文是解決方案概念。 如果您想要使用詳細資訊來擴充內容,例如潛在的使用案例、替代服務、實作考慮或定價指引,請提供 GitHub 意見反應 讓我們知道。

本文提供 Azure Kubernetes Service (AKS) 即時推斷的解決方案。

架構

Architecture diagram that shows how machine learning models are deployed to Azure Kubernetes Services (AKS).

下載此架構的 Visio 檔案

資料流程

  1. 機器學習模型會封裝到容器中,併發布至 Azure Container Registry。
  2. Azure Blob 儲存體裝載訓練資料集和定型的模型。
  3. Kubeflow 可用來將定型作業部署到 AKS,包括參數伺服器和背景工作節點。
  4. Kubeflow 可用來讓生產模型可供使用。 此步驟會跨測試、控制和生產環境提升一致的環境。
  5. AKS 支援已啟用 GPU 的 VM。
  6. 開發人員會建置功能來查詢在 AKS 叢集中執行的模型。

元件

  • Blob 儲存體 是屬於Azure 儲存體 一部分的服務 。 Blob 儲存體針對大量的非結構化資料,提供優化的雲端物件儲存體。
  • Container Registry 會建置、儲存及管理容器映射,並可儲存容器化機器學習模型。
  • AKS 是高可用性、安全且完全受控的 Kubernetes 服務。 AKS 可讓您輕鬆地部署和管理容器化應用程式。
  • 機器學習是雲端式環境,可用來定型、部署、自動化、管理及追蹤機器學習模型。 您可以使用模型來預測未來的行為、結果和趨勢。

案例詳細資料

當您需要機器學習模型的大規模生產部署時,AKS 非常有用。 大規模部署牽涉到快速回應時間、自動調整已部署服務,以及記錄。 如需詳細資訊,請參閱 將模型部署至 Azure Kubernetes Service 叢集

此解決方案會使用 Kubeflow 來管理 AKS 的部署。 機器學習模型會在已啟用 GPU 的虛擬機器 (VM) 支援的 AKS 叢集上執行。

潛在的使用案例

此解決方案適用于使用 AKS 和已啟用 GPU 的 VM 進行機器學習的案例。 範例包含:

  • 影像分類系統。
  • 自然語言處理演算法。
  • 預測性維護系統。

下一步

人工智慧 (AI) - 架構概觀