ORA DISPONIBILE

Disponibilità di SR-IOV nello SKU di macchine virtuali NCv3

Data di pubblicazione: 17 ottobre, 2019

Come parte dell'impegno continuo di Azure per offrire prestazioni leader di settore, annunciamo alcuni miglioramenti per abilitare il supporto per tutte le implementazioni e le versioni di MPI e per i verbi RDMA per macchine virtuali che includono InfiniBand, a partire dalla serie NCv3 disponibile all'inizio di novembre 2019. 

L'aggiornamento COMPORTERÀ TEMPI DI INATTIVITÀ DEI SERVER in base alle diverse aree e, se vuoi utilizzare la rete InfiniBand con MPI, ciò RICHIEDE UN AGGIORNAMENTO ALLE VM. Per informazioni dettagliate complete, leggi il resto della pagina. 

QUALI SONO LE NOVITÀ PREVISTE? 

Con la crescita rapida dell'elaborazione in più nodi e del training di modelli, le esigenze dei clienti si sono evolute insieme al software usato.  Questo aggiornamento consentirà di espandere il supporto in modo da includere l'intero stack di MPI, permettendoti di usare la rete RDMA InfiniBand per ottenere comunicazioni a bassa latenza e larghezza di banda elevata tra le VM con SR-IOV. 

Intel MPI versione 5.x continuerà a essere supportato, analogamente a tutte le versioni successive di Intel MPI.  Saranno inoltre supportati tutti gli altri MPI supportati da Open Fabric Enterprise Distribution (OFED), OpenMPI e dalla libreria NCCL2 di Nvidia, che offre prestazioni ottimizzate per GPU.  Questi miglioramenti offriranno ai clienti larghezza di banda InfiniBand superiore, latenze più basse e soprattutto prestazioni migliori per le applicazioni distribuite. 

IMPATTO 

Tutti gli utenti degli SKU NCv3 saranno interessati in base all'area geografica specifica. Vedi la pianificazione più avanti.  L'aggiornamento comporta modifiche all'hardware e al software del server e ciò richiede tempo di inattività.  Durante il tempo di inattività: 

  • I computer NCv3 nell'area specifica non saranno disponibili per un periodo di 3 ore 
  • Tutte le VM nei computer NCv3 nell'area specifica verranno rimosse e ridistribuite dopo l'aggiornamento 
  • I dati archiviati nei dischi locali (temporanei) andranno persi.  Gli account di archiviazione non sono interessati 

AZIONE NECESSARIA 

Per evitare la perdita di dati e ridurre al minimo l'impatto potenziale sul servizio, segui questa procedura: 

  • Assicurati che tutti i processi siano completi e che sia stato eseguito il backup dei dati nell'account di archiviazione prima dell'aggiornamento pianificato.  Eventuali dati archiviati localmente andranno persi. 
  • Non devi apportare modifiche all'immagine o alla configurazione. 
  • Se ti serve InfiniBand o MPI, segui questa procedura: 
  • Per i servizi gestiti che supportano scenari InfiniBand, vedi le indicazioni specifiche per i servizi, ad esempio Azure BatchAzure Machine Learning
  • Ti consigliamo di aggiornare il sistema operativo a una versione che include driver predefiniti per InfiniBand. Se tuttavia l'immagine corrente include già il supporto per i driver predefiniti per InfiniBand, ti invitiamo a eseguire prima di tutto un test. Vedi l'ultimo punto elenco più avanti. 
  • Scarica e installa il driver OFED più recente, se non è già incluso nell'immagine. È possibile che i driver siano inclusi per impostazione predefinita in un set limitato di immagini.  Per informazioni sulla procedura completa, vedi questo articolo
  • Testa l'immagine e i driver aggiornati in macchine virtuali Hb o Hc, già abilitate per SR-IOV.

In caso di domande o dubbi, contatta i responsabili del feedback per GPU di Azure (azurenfeedback@microsoft.com) o il rappresentante del Supporto tecnico clienti. 

  • Macchine virtuali
  • Features

Prodotti correlati