Hoppa till huvudinnehåll
TILLGÄNGLIGT NU

SR-IOV-tillgänglighet för SKU:er för virtuella NCv3-datorer

Publiceringsdatum: 17 oktober, 2019

Som en del av Azures målsättning att leverera branschledande prestanda introducerar vi förbättringar som ger stöd för alla MPI-implementeringar och -versioner, samt RDMA-verb för virtuella datorer med InfiniBand, med början med NCv3 som kommer i början av november 2019. 

Uppgraderingen MEDFÖR SERVERAVBROTT på regionnivå och om du planerar att använda InfiniBand-nätverket med MPI MÅSTE DINA VIRTUELLA DATORER UPPDATERAS. Fullständig information finns nedan. 

VAD ÄR PÅ GÅNG? 

Med den snabba tillväxten av beräkningar på flera noder och modellträning har kundernas behov förändrats liksom den programvara de använder.  Den här uppdateringen innebär att vårt stöd utökas med stöd för hela MPI-stacken, så att du kan använda InfiniBand RDMA-nätverket för kommunikation med korta svarstider och hög bandbredd mellan virtuella datorer med SR-IOV. 

Stöd kommer fortfarande att finnas för Intel MPI version 5.x liksom för alla efterföljande Intel MPI-versioner.  Stöd kommer även att finnas för alla andra MPI:er som stöds av Open Fabric Enterprise Distribution (OFED), OpenMPI och Nvidias NCCL2-bibliotek, vilket innebär optimerade prestanda för GUP:er.  Dessa förbättringar ger kunderna högre InfiniBand-bandbredd, kortare svarstider och viktigast av alla, bättre prestanda för distribuerade program. 

PÅVERKAN 

Alla användare av NCv3 SKU:er påverkas baserat på region (se schemat nedan).  Uppdateringen innebär ändringar både av servermaskinvara och programvara, vilket medför avbrottstid.  Under avbrottet: 

  • NCv3-datorer i regionen är otillgängliga under en 3-timmarsperiod 
  • Alla virtuella datorer på NCv3-datorer i regionen tas bort och omdistribueras efter uppdateringen 
  • Data som lagras på lokala (tillfälliga) diskar går förlorade.  Lagringskonton påverkas inte 

ÅTGÄRD KRÄVS 

För att undvika dataförlust och för att minimera risken för att din tjänst påverkas rekommenderar vi att du följer dessa steg: 

  • Slutför alla jobb och säkerhetskopiera alla data i ditt lagringskonto före den schemalagda uppdateringen.  Data som lagras lokalt går förlorade. 
  • Du behöver inte göra några ändringar i din avbildning eller konfiguration. 
  • Gör följande om du behöver InfiniBand eller MPI: 
  • Information om hanterade tjänster som stöder InfiniBand-scenarier finns i den tjänstspecifika vägledningen (t.ex. för Azure Batch eller Azure Machine Learning). 
  • Vi rekommenderar starkt att du uppdaterar ditt operativsystem till en version som inkluderar inbox-drivrutiner för InfiniBand. Om din nuvarande avbildning redan har stöd för inbox-drivrutiner för InfiniBand bör du testa dem innan du fortsätter (se den sista punkten nedan). 
  • Ladda ned och installera den senaste OFED-drivrutinen om den inte redan finns med i din avbildning (de kan ingå som standard i vissa fall).  Detaljerade anvisningar finns i den här artikeln
  • Testa din uppdaterade avbildning och drivrutinerna på virtuella Hb- eller Hc-datorer, som redan är SR-IOV-aktiverade.

Om du har frågor är du välkommen att kontakta Azure GPU Feedback (azurenfeedback@microsoft.com) eller din kundservicerepresentant. 

  • Virtuella datorer
  • Features

Tillhörande produkter