Przejdź do głównej zawartości
DOSTĘPNE TERAZ

Dostępność funkcji SR-IOV na jednostkach SKU maszyn wirtualnych NCv3

Data opublikowania: 17 października, 2019

W ramach stałego zobowiązania platformy Azure do zapewniania najwyższej wydajności w branży ogłaszamy ulepszenia umożliwiające obsługę techniczną wszystkich wersji i implementacji interfejsów MPI oraz zleceń RDMA dla maszyn wirtualnych wyposażonych w łączność InfiniBand, począwszy od serii NCv3 na początku listopada 2019 r. 

Z wprowadzaniem uaktualnienia BĘDZIE SIĘ WIĄZAŁ PRZESTÓJ SERWERA z podziałem na regiony, a jeśli zamierzasz korzystać z sieci InfiniBand przy użyciu interfejsu MPI, będzie to WYMAGAĆ AKTUALIZACJI MASZYN WIRTUALNYCH. Przeczytaj szczegółowe informacje poniżej. 

CZEGO MOŻNA SIĘ SPODZIEWAĆ W PRZYSZŁOŚCI? 

Wraz z gwałtownym wzrostem trenowania modelu oraz obliczeń w wielu węzłach ewoluowały potrzeby klientów, jak również używane przez nich oprogramowanie.  Ta aktualizacja rozszerzy naszą obsługę techniczną, aby uwzględniała ona cały stos interfejsu MPI, co pozwoli używać sieci RDMA InfiniBand do komunikacji o wysokiej przepustowości i małych opóźnieniach między maszynami wirtualnymi za pomocą funkcji SR-IOV. 

Interfejs Intel MPI w wersji 5.x będzie nadal objęty obsługą techniczną, tak jak wszystkie kolejne wersje interfejsu Intel MPI.  Ponadto będą obsługiwane wszystkie pozostałe interfejsy MPI używane przez bibliotekę Open Fabric Enterprise Distribution (OFED), OpenMPI oraz NCCL2 firmy Nvidia, zapewniając zoptymalizowaną wydajność procesorów GPU.  Te ulepszenia będą zapewniać klientom wyższą przepustowość sieci InfiniBand, mniejsze opóźnienia oraz, co najważniejsze, lepszą wydajność aplikacji rozproszonej. 

WPŁYW 

Będzie to miało wpływ na wszystkich użytkowników jednostek SKU NCv3 według regionów (zobacz harmonogram poniżej).  Aktualizacja obejmuje zmiany zarówno w sprzęcie, jak i w oprogramowaniu serwera, co wymaga przestoju.  Podczas przestoju: 

  • Maszyny z serii NCv3 w danym regionie będą niedostępne przez okres 3 godzin 
  • Wszystkie maszyny wirtualne na maszynach z serii NCv3 w danym regionie zostaną usunięte, a następnie wdrożone ponownie po aktualizacji 
  • Dane przechowywane na dyskach lokalnych (efemerycznych) zostaną utracone.  Nie wywrze to wpływu na konta magazynu 

WYMAGANA AKCJA 

Aby uniknąć utraty danych i zminimalizować potencjalny wpływ na usługę, wykonaj następujące czynności: 

  • Zapewnij, że ukończono wszystkie zadania i utworzono kopię zapasową danych na koncie magazynu przed zaplanowaną aktualizacją.  Wszystkie dane przechowywane lokalnie zostaną utracone. 
  • Nie musisz wprowadzać żadnych zmian w obrazie ani w konfiguracji. 
  • Jeśli wymagasz sieci InfiniBand lub interfejsu MPI, wykonaj następujące czynności: 
  • W przypadku usług zarządzanych obsługujących scenariusze sieci InfiniBand zobacz wskazówki specyficzne dla usługi (np. Azure BatchAzure Machine Learning). 
  • Zdecydowanie zalecamy zaktualizowanie systemu operacyjnego do wersji obejmującej sterowniki skrzynki odbiorczej dla sieci InfiniBand. Jeśli jednak Twój obecny obraz już zapewnia obsługę sterownika skrzynki odbiorczej dla sieci InfiniBand, zachęcamy do uprzedniego przetestowania go (zobacz ostatni punktor poniżej). 
  • Pobierz i zainstaluj najnowszy sterownik OFED, jeśli jeszcze nie jest on uwzględniony w Twoim obrazie (może on być gotowy do użycia w ograniczonym zestawie).  Zobacz ten artykuł, aby poznać pełne kroki. 
  • Przetestuj zaktualizowany obraz i sterowniki na maszynach wirtualnych z serii HB lub HC, dla których już włączono funkcję SR-IOV.

W przypadku jakichkolwiek pytań lub wątpliwości wyraź opinię o procesorach GPU platformy Azure (azurenfeedback@microsoft.com) lub skontaktuj się z przedstawicielem działu obsługi klienta. 

  • Maszyny wirtualne
  • Features

Powiązane produkty