Disponibilidade de SR-IOV em Máquinas Virtuais equipadas com InfiniBand
Data de publicação: 24 julho, 2020
Vamos ativar o suporte de todas as implementações de Message Passing Interface (MPI) e verbos de Acesso Remoto Direto à Memória (RDMA) para máquinas virtuais equipadas com InfiniBand. Isto aumenta significativamente a capacidade e as opções para tirar partido do InfiniBand nas suas cargas de trabalho.
A atualização IRÁ ENVOLVER PERÍODO DE INDISPONIBILIDADE DO SERVIDOR numa base regional e, se pretender utilizar a rede InfiniBand, TERÁ DE ATUALIZAR AS SUAS VMs.
O QUE SE SEGUE?
Vamos ativar o suporte da pilha de MPI (todas as implementações de MPI e verbos RDMA) para máquinas virtuais equipadas com InfiniBand. Estes melhoramentos aumentarão a capacidade de tirar partido da nossa rede InfiniBand de largura de banda alta e baixa latência nas suas cargas de trabalho.
IMPACTO
Todos os utilizadores dos tamanhos de VM na agenda de atualizações serão afetados região a região. A atualização envolve alterações ao hardware e software do servidor, o que exige um período de indisponibilidade. Durante o período de indisponibilidade:
- As VMs na região estarão indisponíveis durante um período de 3 horas
- As VMs na região serão desalocadas e reimplementadas após a atualização
- Os dados armazenados em discos locais (efémeros) perder-se-ão. As Contas de Armazenamento não são afetadas
AÇÃO NECESSÁRIA
Para evitar a perda de dados e minimizar o potencial impacto no seu serviço:
Se não precisar de InfiniBand ou MPI
- Certifique-se de que todas as tarefas estão concluídas e que existe uma cópia de segurança dos dados na sua Conta de Armazenamento antes da atualização agendada. Todos os dados armazenados localmente perder-se-ão.
- Veja a agenda de atualizações. Se planear migrar temporariamente para uma região/SKU alternativo, verifique a quota existente ou solicite uma nova quota nas regiões pretendidas.
Se precisar de InfiniBand ou MPI
- Não precisa de fazer alterações à sua imagem de VM e aos controladores existentes.
- Para os serviços geridos que suportem cenários de InfiniBand, veja a orientação específica do serviço (por exemplo, Azure Batch, Azure Machine Learning).
- Atualize a sua imagem de VM para as versões suportadas mais recentes (NOTA: as imagens do CentOS HPC anteriores à versão 7.6 não são compatíveis e podem não ser inicializadas). Siga os passos em Ativar o InfiniBand, se for necessário para outras distribuições do SO e se não estiver a utilizar uma imagem de VM do CentOS-HPC pronta a utilizar.
- Teste a imagem atualizada e os controladores nos tamanhos de VM que já têm capacidade de SR-IOV (veja a secção MPI)
Se tiver dúvidas ou questões, contacte o Azure GPU Feedback ou o Suporte ao Cliente.