Vorstellung neuer virtueller Azure-Computer der HBv2-Serie für High Performance Computing

Veröffentlicht am 8 August, 2019

Principal Program Manager, Azure HPC

Bekanntgabe virtueller Azure-Computer der HB-Serie der zweiten Generation für High Performance Computing (HPC). Virtuelle Computer der HBv2-Serie bieten eine herausragende Leistung, MPI-Skalierbarkeit (Message Passing Interface) und Kosteneffizienz für verschiedenste HPC-Workloads in der Praxis.

Virtuelle HBv2-Computer bieten 120 CPU-Kerne der AMD EPYC™ 7002-Serie, 480 GB Arbeitsspeicher, 480 MB L3-Cache und kein gleichzeitiges Multithreading (Simultaneous Multi-Threading, SMT). VMs der HBv2-Serie bieten eine Speicherbandbreite von bis zu 350 GB/s und sind damit um 45–50 % schneller als vergleichbare x86-Alternativen und 3-mal schneller als die heute in den Rechenzentren der meisten HPC-Kunden vorhandenen Komponenten.

Größe CPU-Kerne Arbeitsspeicher: GB Speicher pro CPU-Kern: GB Lokales SSD: GiB RDMA-Netzwerk Azure-Netzwerk
Standard_HB120rs 120 480 GB 4 GB 1,6 TB 200 GBit/s 40 GBit/s

„r“ zeigt Unterstützung von RDMA an, „s“ zeigt Unterstützung von SSD Premium-Datenträgern an.

Jeder virtuelle Computer (VM) der HBv2-Serie bietet außerdem bis zu 4 TeraFLOP Leistung bei doppelter Genauigkeit und bis zu 8 TeraFLOP Leistung bei einfacher Genauigkeit. Dies entspricht einer vierfachen Steigerung gegenüber unseren virtuellen Computern der HB-Serie der ersten Generation, und es stellt eine deutliche Verbesserung der Leistung für Anwendungen dar, die den schnellsten Speicher und eine Computedichte der Spitzenklasse erfordern.

Nachstehend finden Sie vorläufige Benchmarks für HBv2 in mehreren verbreiteten HPC-Anwendungen und -Anwendungsgebieten:

Balkendiagramm der relativen Leistung

Zum Erreichen einer optimalen MPI-Leistung (Message Passing Interface) in der gewünschten Skalierung bieten virtuelle HBv2-Computer HDR-InfiniBand mit 200 GBit/s von unseren Technologiepartnern bei Mellanox. Die InfiniBand-Fabric hinter den virtuellen HBv2-Computern ist ein blockierungsfreier Fat Tree mit einem geringen Durchmesser für konsistent extrem geringe Latenzen. Kunden können genau wie in einer Hardwareumgebung Mellanox-/OFED-Standardtreiber verwenden. Virtuelle HBv2-Computer unterstützen offiziell RDMA-Verben und somit alle InfiniBand-basierten MPIs wie OpenMPI, MVAPICH2, Platform MPI und Intel MPI. Außerdem können Kunden eine Hardwareauslagerung für MPI Collective-Funktionen nutzen, um zusätzliche Leistung und Effizienz für kommerziell lizenzierte Anwendungen zu erzielen.

In einer einzigen VM-Skalierungsgruppe können Kunden einen MPI-Auftrag auf virtuellen HBv2-Computern über bis zu 36.000 Kerne ausführen. Für unsere größten Kunden unterstützen virtuelle HBv2-Computer bis zu 80.000 Kerne für einzelnen Aufträge.

Kunden können auch die Ethernet-Schnittstelle von virtuellen HBv2-Computern maximieren, indem sie die auf SRIOV basierenden beschleunigten Netzwerkfunktionen in Azure nutzen und dadurch eine Bandbreite von bis zu 40 GBit/s mit konsistent geringer Latenz erreichen.

Schließlich bieten die neuen virtuellen Computer der H-Serie lokale NVMe-SSDs mit extrem schneller temporärer Speicherung für alle Datengrößen und E/A-Muster. Über moderne Burstpuffertechnologien wie BeeGFS BeeOND erreichen die neuen virtuellen Computer der H-Serie eine E/A-Leistung bei Spitzeninjektion von mehr als 900 GB/s in einer einzelnen VM-Skalierungsgruppe. Die neuen virtuellen Computer der H-Serie unterstützen auch Azure SSD Premium-Datenträger.

Kunden können ihre HBv2-Bereitstellungen mithilfe verschiedener Ressourcen beschleunigen, die vom Azure-HPC-Team optimiert und vorkonfiguriert wurden. Unser vorab erstelltes HPC-Image für CentOS ist maßgeschneidert für optimale Leistung, und es enthält wichtige HPC-Tools wie verschiedene MPI-Bibliotheken, Compiler u. v. m. Das AzureHPC-Projekt hilft Kunden dabei, eine End-to-End-Azure-HPC-Umgebung zuverlässig und schnell bereitzustellen. Zu diesem Zweck schließt es Entwicklungsskripts zum Einrichten von Bausteinen für Netzwerke, Compute, Planern und Speicher ein. Außerdem steht eine wachsende Liste von Tutorials zum Ausführen der eigentlichen HPC-Anwendungen bereit.

Für Kunden, die mit HPC-Planern vertraut sind und diese mit virtuellen HBv2-Computern verwenden möchten, ist Azure CycleCloud die einfachste Möglichkeit zum Orchestrieren von automatisch skalierten Clustern. Azure CycleCloud unterstützt Planer wie Slurm, PBSPro, LSF, GridEngine und HTCondor und ermöglicht Hybridbereitstellungen für Kunden, die virtuelle HBv2-Computer mit ihren bereits vorhandenen lokalen Clustern kombinieren möchten. Die neuen virtuellen Computer der H-Serie werden auch für die cloudnative Batchverarbeitung von Azure Batch unterstützt. Virtuelle Computer der HBv2-Serie werden allen Azure-Plattformpartnern zur Verfügung gestellt.

Kunden können sich bereits heute für den Zugang zur HBv2-Serie registrieren, indem sie dieses Formular ausfüllen. Virtuelle HBv2-Computer werden zunächst in den Azure-Regionen „USA, Süden-Mitte“ und „Europa, Westen“ und bald darauf auch in weiteren Regionen verfügbar gemacht.