Naar hoofdinhoud gaan
NU BESCHIKBAAR

SR-IOV-beschikbaarheid in de SKU voor NCv3-VM's

Publicatiedatum: 17 oktober, 2019

Azure zet zich er doorlopend voor in om uitstekende prestaties te leveren en daarom worden er verbeteringen doorgevoerd vanaf begin november 2019 om ondersteuning in te schakelen voor alle MPI-implementaties en -versies en voor RDMA-bewerkingen voor virtuele machines met InfiniBand (vanaf NCv3). 

Voor de upgrade TREEDT ER REGIONAAL SERVERDOWNTIME OP. Als u het InfiniBand-netwerk wilt gebruiken via MPI, MOET U UW VM'S BIJWERKEN. Lees verder voor meer informatie. 

WAT KUNT U VERWACHTEN? 

Dankzij de snelle groei van berekeningen met meerdere knooppunten en de mogelijkheid om modellen te trainen, zijn de behoeften van klanten én de software die zij gebruiken, veranderd.  Met deze update wordt onze ondersteuning uitgebreid zodat de volledige MPI-stack is inbegrepen. Zo kunt u het InfiniBand RDMA-netwerk gebruiken voor communicatie tussen VM's met een lage latentie en een hoge bandbreedte (via SR-IOV). 

Intel MPI-versie 5.x wordt ook nog ondersteund, net als volgende Intel MPI-versies.  Daarnaast worden alle andere MPI's ondersteund die worden ondersteund door OFED (open Fabric Enterprise Distribution), OpenMPI en de NCCL2-bibliotheek van Nvidia. Op deze manier ontstaan er optimale prestaties voor GPU's.  Deze verbeteringen bieden klanten een grotere InfiniBand-bandbreedte, een lagere latentie en, belangrijker nog, betere prestaties van gedistribueerde toepassingen. 

IMPACT 

Alle gebruikers van NCv3-SKU's worden regio voor regio beïnvloed (zie de onderstaande planning).  De update omvat wijzigingen aan zowel de serverhardware als -software, waardoor er downtime nodig is.  Tijdens de downtime: 

  • NCv3-machines in de regio zijn gedurende 3 uur niet beschikbaar 
  • Alle VM's op de NCv3-machines in de regio worden verwijderd en na de update opnieuw geïmplementeerd 
  • De gegevens die zijn opgeslagen op de lokale (tijdelijke) schijven, gaan verloren.  Opslagaccounts worden niet beïnvloed 

ACTIE VEREIST 

Om gegevensverlies te voorkomen en de potentiële impact op uw service zo klein mogelijk te houden, voert u de volgende stappen uit: 

  • Zorg ervoor dat vóór de geplande update alle taken zijn voltooid en dat er een back-up van uw gegevens is gemaakt in uw opslagaccount.  Alle lokaal opgeslagen gegevens gaan verloren. 
  • U hoeft geen wijzigingen aan te brengen aan uw installatiekopie of configuratie. 
  • Als u wel InfiniBand of MPI nodig hebt, doet u het volgende: 
  • Raadpleeg de hulp voor de service (bijvoorbeeld Azure BatchAzure Machine Learning) voor beheerde services die InfiniBand-scenario's ondersteunen. 
  • Het wordt aanbevolen uw besturingssysteem bij te werken naar een versie met meegeleverde stuurprogramma's voor InfiniBand. Als uw huidige installatiekopie al meegeleverde stuurprogramma's voor InfiniBand bevat, wordt aanbevolen dit vooraf te testen (zie het laatste opsommingsteken hieronder) 
  • Download het nieuwste OFED-stuurprogramma als dit nog niet was inbegrepen bij de installatiekopie (bij een beperkt aantal is het stuurprogramma mogelijk al direct meegeleverd).  Lees dit artikel voor informatie over alle stappen. 
  • Test de bijgewerkte installatiekopie en stuurprogramma's op Hb- en Hc-VM's. Hiervoor is SR-IOV al ingeschakeld.

Als u vragen hebt of zich ergens zorgen over maakt, neemt u contact op met Azure GPU Feedback (azurenfeedback@microsoft.com) of uw eigen klantenservicevertegenwoordiger. 

  • Virtuele machines
  • Features

Verwante producten