使用 AKS 訓練 Machine Learning 模型

使用大型資料集來訓練模型是一項需耗用大量資源的複雜工作。使用 TensorFlow 和 Kubeflow 這類熟悉的工具,簡化 Machine Learning 模型的訓練。您的 ML 模型會在 AKS 叢集中執行,並由已啟用 GPU 的 VM 支援這些叢集。

Preparação de modelos de Machine Learning com o AKSPreparação de modelos de Machine Learning com o AKS123456

將 ML 模型封裝到容器中,並發佈到 ACR

Azure Blob 儲存體可裝載訓練用的資料集和接受訓練的模型

使用 Kubeflow 將訓練作業部署到 AKS,散發到 AKS 的訓練作業包括參數伺服器和背景工作節點

使用 Kubeflow 來維護生產模型,以建立在測試、控制與生產方面均一致的環境

AKS 支援可使用 GPU 的 VM

開發人員可以建置功能,來查詢在 AKS 叢集中執行的模型

  1. 1 將 ML 模型封裝到容器中,並發佈到 ACR
  2. 2 Azure Blob 儲存體可裝載訓練用的資料集和接受訓練的模型
  3. 3 使用 Kubeflow 將訓練作業部署到 AKS,散發到 AKS 的訓練作業包括參數伺服器和背景工作節點
  1. 4 使用 Kubeflow 來維護生產模型,以建立在測試、控制與生產方面均一致的環境
  2. 5 AKS 支援可使用 GPU 的 VM
  3. 6 開發人員可以建置功能,來查詢在 AKS 叢集中執行的模型