Navigation überspringen

Beschleunigen Sie Ihre KI-Anwendungen mit virtuellen Computern von Azure NC A100 v4

Veröffentlicht am 11 April, 2022

Senior Program Manager, Azure HPC and AI

In den letzten zehn Jahren hat die KI in ihrer praktischen Anwendung das Leben revolutioniert und verändert, einschließlich Medien und Unterhaltung, Gesundheitswesen und Life Science, Einzelhandel, Automobilindustrie, Finanzdienstleistungen, Herstellung sowie Öl- und Gasindustrie. Mit einem Smart-Home-Gerät sprechen, die sozialen Medien mit empfohlenen Inhalten durchstöbern oder sich in ein selbstfahrendes Fahrzeug setzen: All das ist keine Zukunftsmusik mehr. Sie können jetzt Schecks ganz einfach mit Ihrem Smartphone einreichen, ohne zur Bank zu gehen? All diese Fortschritte wurden durch neue KI-Durchbrüche in Software und Hardware ermöglicht.

Bei Microsoft hosten wir das Rückschließen mit Deep Learning, Cognitive Science und unsere Applied AI Services auf den Instanzen der NC-Serie. Die in diesen Bereichen im Hinblick auf unsere Infrastruktur gewonnenen Erkenntnisse und gemachten Fortschritte helfen dabei, die Entwurfsentscheidungen für die nächste Generation des NC-Systems zu fördern. Aufgrund unseres Ansatzes können unsere Azure-Kunden von unseren internen Erkenntnissen profitieren.

Wir freuen uns bekanntgeben zu können, dass die nächste Generation der NC A100 v4-Serie jetzt für die Vorschauversion verfügbar ist. Diese virtuellen Computer (VMs) verfügen über NVIDIA A100 80GB Tensor Core PCIe-GPUs und AMD EPYC™ Milan-Prozessoren der 3. Generation. Diese neuen Angebote verbessern die Leistung und Kosteneffizienz einer Vielzahl von GPU-leistungsgebundenen Workloads für das KI-Training und Rückschließen in der realen Welt. Diese Workloads umfassen Objekterkennung, Videoverarbeitung, Bildklassifizierung, Spracherkennung, Empfehlung, vertiefendes Lernen für autonomes Fahren, Simulation von Öl- und Gasspeichern, Analyse von Finanzdokumenten, webbasiertem Rückschließen und mehr.

Die NC A100 v4-Serie bietet drei Klassen von virtuellen Computern im Bereich von einer bis vier NVIDIA A100 80GB PCIe Tensor Core-GPUs. Dies ist kostengünstiger als je zuvor, während Kunden weiterhin die Optionen und Flexibilität genießen, die sie für ihre Workloads benötigen.

Größe

vCPU

Arbeitsspeicher (GB)

GPUs (NVIDIA A100 80 GB Tensor Core)

Azure Network (Gb/s)

Standard_NC24ads_A100_v4

24

220

1

20

Standard_NC48ads_A100_v4

48

440

2

40

Standard_NC96ads_A100_v4

96

880

4

80

Im Vergleich zur vorherigen NC-Generation (NCv3) erzielen Kunden mit architekturbasierten GPUs von NVIDIA Volta eine 1,5- bis 2,5-fache Leistungssteigerung aufgrund von:

  • Doppelt so viel GPU-Leistung für die Host-Bandbreite.
  • Viermal so viele vCPU-Kerne pro GPU-VM.
  • Zweimal so viel RAM pro GPU-VM.
  • Sieben unabhängige GPU-Instanzen auf einer einzelnen NVIDIA A100-GPU dank Multi-Instance-GPU (MIG) auf dem Linux-Betriebssystem.

Im Folgenden finden Sie ein Beispiel dafür, was wir beim Ausführen des KI-Modelltrainings ResNet50 über eine Vielzahl von Batchgrößen mithilfe der VM-Größe NC96ads_A100_v4 im Vergleich zur vorhandenen VM-Größe NCv3 4 V100 GPUs NC24s_v3 beobachtet haben. Die Tests wurden für eine Reihe von Batchgrößen von 1 bis 256 durchgeführt.

Die ResNet50-Ergebnisse wurden mit den Größen virtueller Computer NC24s_v3 und NC96ads_A100_v4 generiert.

Abbildung 1: Die ResNet50-Ergebnisse wurden mit den Größen virtueller Computer NC24s_v3 und NC96ads_A100_v4 generiert.

Weitere Informationen zur Ausführung in Azure und weitere Ergebnisse finden Sie in unserem Performance Technical Community Blog.

Mit unserer neuesten Ergänzung der NC-Serie können Sie die Zeit, die Sie zum Trainieren Ihres Modelltrainings benötigen, um etwa die Hälfte und immer noch innerhalb des Budgets reduzieren. Sie können die trainierten Cognitive Science-Modelle durch Batchrückschluss nahtlos in Anwendungen nutzen, Simulationen biochemischer Prozesse mit Millionen an Atomen für die Medizin der nächsten Generation durchführen, Ihre Web- und Mediendienste in der Cloud für Zehntausende Endbenutzer hosten und vieles mehr.

Weitere Informationen

Die NC A100 v4-Serie ist derzeit in den Azure-Regionen USA, Süden-Mitte, USA, Osten und Asien, Südosten verfügbar. Sie werden in den kommenden Monaten in weiteren Regionen verfügbar sein.
Weitere Informationen zur Azure NC A100 v4-Serie finden Sie unter: