Доступность SR-IOV для виртуальных машин с InfiniBand
Дата публикации: 24 июля, 2020
Мы включим поддержку всех реализаций интерфейса Message Passing Interface (MPI) и команд удаленного прямого доступа к памяти (RDMA) для виртуальных машин с InfiniBand. Это значительно расширит возможности по использованию InfiniBand для ваших рабочих нагрузок.
Во время обновления СЕРВЕР БУДЕТ ВРЕМЕННО ПРИОСТАНОВЛЕН в отдельных регионах. Если вы планируете работать с сетью InfiniBand, вам ПОТРЕБУЕТСЯ ОБНОВИТЬ СВОИ ВИРТУАЛЬНЫЕ МАШИНЫ.
ПРЕДСТОЯЩИЕ ИЗМЕНЕНИЯ
Мы включим поддержку для всего стека MPI (все реализации MPI и команды RDMA) для виртуальных машин с InfiniBand. Такие улучшения расширят возможности по использованию нашей сети InfiniBand с высокой пропускной способностью и низкой задержкой для ваших рабочих нагрузок.
ВЛИЯНИЕ
Это коснется всех пользователей в отдельных регионах с виртуальными машинами, которые указаны в графике обновлений. В рамках обновления предусмотрено изменение аппаратного и программного обеспечения сервера, из-за чего он будет временно недоступен. Во время простоя произойдет следующее:
- Виртуальные машины в регионе будут недоступны в течение трех часов.
- Виртуальные машины в этом регионе будут освобождены и повторно развернуты после обновления.
- Данные, хранящие на локальных (временных) дисках, будут удалены. Но учетные записи хранения не будут затронуты.
ТРЕБУЕМОЕ ДЕЙСТВИЕ
Чтобы не потерять данные и свести к минимуму возможные последствия для своей службы, сделайте следующее:
Если вы не планируете использовать InfiniBand или MPI:
- Обязательно завершите все задания и создайте резервные копии данных в учетной записи хранения до запланированного обновления. Все данные, хранящиеся локально, будут удалены.
- Просмотрите график обновлений. Если вы планируете временный перенос данных в другой регион или SKU, проверьте существующую или запросите новую квоту в целевых регионах.
Если вы планируете использовать InfiniBand или MPI:
- Не изменяйте образ и драйверы виртуальной машины.
- Для сценариев с InfiniBand с поддержкой управляемых служб см. соответствующие руководства по службам (например, пакетная служба Azure, Машинное обучение Azure).
- Обновите образ виртуальной машины до последней поддерживаемой версии. (Примечание. Образы CentOS HPC до версии 7.6 являются несовместимыми и могут не загрузиться.) Выполните инструкции, приведенные в статье Включение InfiniBand, если это требуется для других дистрибутивов ОС и если вы не используете готовый образ виртуальной машины CentOS-HPC.
- Протестируйте обновленный образ и драйверы на виртуальных машинах, в которых уже реализована поддержка SR-IOV (см. раздел, посвященный MPI).
Если возникнут вопросы или трудности, отправьте письмо на адрес для отзывов о GPU Azure или в службу поддержки пользователей.