SR-IOV-tilgængelighed på NCv3 Virtual Machines SKU
Dato for publicering: 17 oktober, 2019
Som en del af Azures løbende forpligtelse til at levere brancheførende ydeevne lancerer vi forbedringer for at aktivere understøttelse af alle MPI-implementeringer og -versioner samt RDMA-verber til virtuelle maskiner med InfiniBand. Vi starter med NCv3 i starten af november 2019.
Opgraderingen MEDFØRER NEDETID FOR SERVERE på områdebasis, og hvis du vil bruge InfiniBand-netværket vha. MPI, KRÆVER DET EN OPDATERING AF DINE VM'ER. Se alle oplysninger nedenfor.
HVAD KOMMER DER?
Kundernes behov samt den software, de bruger, har udviklet sig i takt med den hurtige vækst i beregninger med flere noder samt modeltræning. Med denne opdatering udvides understøttelsen til også at omfatte hele MPI-stakken, hvilket gør det muligt for dig at anvende InfiniBand RDMA-netværket til kommunikation mellem VM'er med lav ventetid og høj båndbredde vha. SR-IOV.
Intel MPI version 5.x understøttes fortsat sammen med alle efterfølgende Intel MPI-versioner. Desuden understøttes alle andre MPI'er, der understøttes af OFED (Open Fabric Enterprise Distribution), OpenMPI og Nvidias NCCL2-bibliotek. Det giver en optimeret ydeevne for GPU'er. Disse forbedringer vil give kunderne højere InfiniBand-båndbredde, lavere ventetider og – hvad vigtigere er – bedre distribueret programydeevne.
PÅVIRKNING
Alle brugere af NCv3 SKU'er berøres på baggrund af område (se tidsplan herunder). Opdateringen medfører ændringer af både serverhardwaren og -softwaren, og det kræver nedetid. Under nedetiden:
- NCv3-maskiner i området vil ikke være tilgængelige i en periode på tre timer
- Alle VM'er på NCv3-maskiner i området fjernes og udrulles igen efter opdateringen
- Data, der er lagret på lokale diske (kortvarigt), går tabt. Lagerkonti berøres ikke
PÅKRÆVET HANDLING
Hvis du vil undgå datatab og minimere den potentielle påvirkning af din tjeneste, skal du gennemgå følgende trin:
- Sørg for, at alle jobs er afsluttet, og at data er sikkerhedskopieret til din lagerkonto inden den planlagte opdatering. Alle data, der er gemt lokalt, går tabt.
- Gennemse NCv3-opdateringsplanen. Hvis det er nødvendigt kan du overveje at migrere til et andet område midlertidigt. I så fald kan du kontrollere eksisterende eller anmode om ny kvote i det eller de alternative områder.
- Hvis dine scenarier ikke kræver InfiniBand eller MPI
- Du behøver ikke foretage ændringer af din afbildning eller konfiguration.
- Hvis du har brug for InfiniBand eller MPI, skal du benytte følgende fremgangsmåde:
- I forbindelse med administrerede tjenester, der understøtter InfiniBand-scenarier skal du se den tjenestespecifikke vejledning (f.eks. Azure Batch, Azure Machine Learning).
- Vi anbefaler på det kraftigste, at du opdaterer dit operativsystem til en version, der indeholder indbakkedrivere til InfiniBand. Hvis din aktuelle afbildning allerede indeholder understøttelse af indbakkedrivere til InfiniBand, opfordrer vi dig til at teste det på forhånd (se sidste punkt i nedenstående punktopstilling)
- Download og installér den nyeste OFED-driver, hvis den ikke allerede er inkluderet i din afbildning (de leveres med et begrænset sæt). Se den komplette fremgangsmåde i denne artikel.
- Test din opdaterede afbildning og dine opdaterede drivere på Hb- eller Hc-VM'er, der allerede er aktiveret til SR-IOV.
Hvis du har spørgsmål, kan du kontakte Azure GPU Feedback (azurenfeedback@microsoft.com) eller din Kundeservice-repræsentant.