JÁ DISPONÍVEL

Disponibilidade de SR-IOV no SKU de Máquinas Virtuais NCv3

Data de publicação: 17 outubro, 2019

No âmbito do compromisso contínuo do Azure para fornecer desempenho líder do setor, estamos a anunciar melhorias para permitir o suporte de todas as versões e implementações de MPI, e verbos RDMA para máquinas virtuais equipadas com InfiniBand, começando com a série NCv3 a partir do início de novembro de 2019. 

A atualização IRÁ ENVOLVER TEMPO DE INDISPONIBILIDADE DO SERVIDOR numa base regional e, se pretender utilizar a rede InfiniBand com MPI, TERÁ DE ATUALIZAR AS SUAS VMs. Leia abaixo para obter os detalhes completos. 

O QUE SE SEGUE? 

Com o rápido crescimento da preparação de modelos e computação com vários nós, as necessidades dos clientes evoluíram, bem como o software que utilizam.  Esta atualização irá expandir o nosso suporte para incluir toda a pilha de MPI, o que lhe permitirá utilizar a rede RDMA InfiniBand para comunicação de latência baixa e largura de banda alta entre VMs com SR-IOV. 

O Intel MPI versão 5.x continuará a ser suportado, tal como todas as versões seguintes do Intel MPI.  Além disso, todos os outros MPIs suportados pelo Open Fabric Enterprise Distribution (OFED), pelo OpenMPI e pela biblioteca NCCL2 da Nvidia, que fornecem desempenho otimizado para GPUs, também serão suportados.  Estas melhorias irão fornecer aos clientes largura de banda InfiniBand superior, latências mais baixas e, acima de tudo, melhor desempenho de aplicações distribuídas. 

IMPACTO 

Todos os utilizadores dos SKUs de NCv3 serão afetados região a região (veja a agenda abaixo).  A atualização envolve alterações ao hardware e software do servidor, o que exige um período de indisponibilidade.  Durante o período de indisponibilidade: 

  • As máquinas NCv3 na região estarão indisponíveis durante um período de 3 horas 
  • Todas as VMs em máquinas NCv3 na região serão removidas e implementadas novamente após a atualização 
  • Os dados armazenados em discos locais (efémeros) perder-se-ão.  As Contas de Armazenamento não são afetadas 

AÇÃO NECESSÁRIA 

Para evitar a perda de dados e minimizar o potencial impacto no seu serviço, execute os seguintes passos: 

  • Certifique-se de que todas as tarefas estão concluídas e que existe uma cópia de segurança dos dados na sua Conta de Armazenamento antes da atualização agendada.  Todos os dados armazenados localmente perder-se-ão. 
  • Não precisa de fazer alterações à sua imagem ou configuração. 
  • Se precisar de InfiniBand ou MPI, faça o seguinte: 
  • Para os serviços geridos que suportem cenários de InfiniBand, veja a orientação específica do serviço (por exemplo, Azure Batch, Azure Machine Learning). 
  • Recomendamos vivamente que atualize o seu SO para uma versão que inclua controladores nativos para InfiniBand. Contudo, se a sua imagem atual já incluir suporte para controlador nativo para InfiniBand, recomendamos que o teste de antemão (veja a última marca da lista, abaixo) 
  • Transfira e instale o controlador OFED mais recente se este ainda não estiver incluído na sua imagem (um conjunto limitado poderá incluir os controladores prontos a utilizar).  Veja este artigo para obter os passos completos. 
  • Teste a imagem atualizada e os controladores em VMs Hb ou Hc, que já têm capacidade de SR-IOV.

Se tiver dúvidas ou questões, contacte o Azure GPU Feedback (azurenfeedback@microsoft.com) ou o representante de Suporte ao Cliente. 

  • Máquinas Virtuais
  • Features

Produtos Relacionados