Bearbeiten

Bereitstellen von Machine Learning-Modellen für AKS mit Kubeflow

Azure Blob Storage
Azure Container Registry
Azure Kubernetes Service (AKS)

Lösungsmöglichkeiten

Dieser Artikel ist ein Lösungsvorschlag. Wenn Sie möchten, dass wir diesen Artikel um weitere Informationen ergänzen, z. B. potenzielle Anwendungsfälle, alternative Dienste, Überlegungen zur Implementierung oder Preisempfehlungen, lassen Sie es uns über Feedback auf GitHub wissen.

In diesem Artikel wird eine Lösung für Rückschließen in Echtzeit in Azure Kubernetes Service (AKS) vorgestellt.

Aufbau

Architecture diagram that shows how machine learning models are deployed to Azure Kubernetes Services (AKS).

Laden Sie eine Visio-Datei dieser Architektur herunter.

Datenfluss

  1. Ein Machine Learning-Modell wird in einen Container gepackt und in Azure Container Registry veröffentlicht.
  2. Azure Blob Storage hostet Trainingsdatasets und das trainierte Modell.
  3. Kubeflow wird verwendet, um Trainingsaufträge in AKS bereitzustellen, einschließlich Parameterservern und Workerknoten.
  4. Kubeflow wird verwendet, um ein Produktionsmodell verfügbar zu machen. Dieser Schritt fördert eine konsistente Umgebung in den Bereichen Tests, Kontrolle und Produktion.
  5. AKS unterstützt GPU-aktivierte VMs.
  6. Entwickler erstellen Features, um das in einem AKS-Cluster ausgeführte Modell abzufragen.

Komponenten

  • Blob Storage ist ein Dienst, der zu Azure Storage gehört. Blob Storage bietet einen optimierten Cloudobjektspeicher für große Mengen unstrukturierter Daten.
  • Container Registry erstellt, speichert und verwaltet Containerimages und kann containerisierte Machine Learning-Modelle speichern.
  • AKS ist ein hochverfügbarer, sicherer und vollständig verwalteter Kubernetes-Dienst. AKS erleichtert das Bereitstellen und Verwalten containerisierter Anwendungen.
  • Machine Learning ist eine cloudbasierte Umgebung, die Ihnen das Trainieren, Bereitstellen, Automatisieren, Verwalten und Nachverfolgen von Machine Learning-Modellen ermöglicht. Sie können die Modelle verwenden, um zukünftige Verhaltensweisen, Ergebnisse und Trends zu prognostizieren.

Szenariodetails

AKS ist nützlich, wenn Sie Produktionsbereitstellungen Ihrer Machine Learning-Modelle im großen Stil benötigen. Bereitstellung im großen Stil umfasst schnelle Antwortzeiten, automatische Skalierung des bereitgestellten Diensts und Protokollierung. Weitere Informationen finden Sie im Cluster Bereitstellen eines Modells in einem Azure Kubernetes Service.

In dieser Lösung wird Kubeflow verwendet, um die Bereitstellung in AKS zu verwalten. Die Machine Learning-Modelle werden auf AKS-Clustern ausgeführt, die von GPU-aktivierten virtuellen Computern (VMs) unterstützt werden.

Mögliche Anwendungsfälle

Diese Lösung gilt für Szenarien, die AKS und GPU-aktivierte VMs für maschinelles Lernen verwenden. Beispiele:

  • Bildklassifizierungssysteme.
  • Algorithmen für die Verarbeitung natürlicher Sprache.
  • Predictive Maintenance-Systeme.

Nächste Schritte

Künstliche Intelligenz (KI): Architekturübersicht