Passer la navigation

Accélérez vos applications d’IA avec des machines virtuelles Azure NC A100 v4

Publié le 11 avril, 2022

Senior Program Manager, Azure HPC and AI

Ces dix dernières années, l’IA a révolutionné et modifié la façon dont les personnes vivent, et ce dans de nombreux domaines (médias et divertissements, santé et sciences de la vie, grande distribution, automobile, services financiers, fabrication, pétrole et gaz). Le fait de parler à un appareil intelligent chez soi, de parcourir des réseaux sociaux avec un contenu recommandé ou d’effectuer un trajet avec un véhicule autonome n’est plus un rêve. Avec votre smartphone, vous pouvez maintenant facilement déposer des chèques sans aller à la Banque. Toutes ces avancées ont été rendues possibles grâce à de nouvelles innovations matérielles et logicielles en matière d’IA.

Chez Microsoft, nous hébergeons notre inférence d’apprentissage profond, la science cognitive et nos services IA appliqués sur les instances de la série NC. Les apprentissages et les améliorations observés par notre infrastructure dans ces domaines aident à prendre des décisions de conception pour la nouvelle génération de système NC. En raison de notre approche, nos clients Azure sont en mesure de tirer parti de nos apprentissages internes.

Nous avons le plaisir de vous annoncer que la nouvelle génération de machines virtuelles de la série NC A100 v4 est à présent disponible en préversion. Ces machines virtuelles sont équipées de processeurs graphiques (GPU) NVIDIA A100 Tensor Core PCIe de 80 Go et des processeurs AMD EPYC ™ Milan 3e génération. Ces nouvelles offres améliorent les performances et la rentabilité d’un large éventail de charges de travail d’inférence et de formation via l’intelligence artificielle liées aux performances du GPU. Ces charges de travail couvrent la détection d’objets, le traitement vidéo, la classification d’images, la reconnaissance vocale, les recommandations, l’apprentissage par renforcement de la conduite autonome, la simulation de réservoir de pétrole et de gaz, l’analyse de documents financiers, l’inférence web, etc.

La série NC A100 v4 offre trois classes de machines virtuelles, allant de 1 à 4 GPU NVIDIA A100 PCIe Tensor Core de 80 Go. Elle est plus rentable que jamais, tout en offrant aux clients les options et la flexibilité dont ils ont besoin pour leurs charges de travail.

Taille

Processeur virtuel

Mémoire (Go)

GPU (NVIDIA A100 Tensor Core de 80 Go)

Réseau Azure (Go/s)

Standard_NC24ads_A100_v4

24

220

1

20

Standard_NC48ads_A100_v4

48

440

2

40

Standard_NC96ads_A100_v4

96

880

4

80

Par rapport à la génération NC précédente (NCv3) avec des GPU basés sur l’architecture NVIDIA Volta, les clients bénéficieront d’une amélioration des performances entre 1,5 et 2,5 fois pour les raisons suivantes :

  • Deux fois plus de GPU pour héberger la bande passante.
  • Quatre fois plus de cœurs de processeurs virtuels par machine virtuelle à GPU.
  • Deux fois plus de mémoire RAM par machine virtuelle à GPU.
  • 7 instances GPU indépendantes sur un seul GPU NVIDIA A100 via le GPU multi-instance (MIG) sur un système d’exploitation Linux.

Voici un exemple des avantages de l’exécution de la formation de modèle d’IA ResNet50 sur une variété de tailles de lot à l’aide de la taille de machine virtuelle NC96ads_A100_v4 comparée à la taille de machine virtuelle NCv3 4 V100 GPU NC24s_v3 existante. Les tests ont été effectués sur une plage de tailles de lot, de 1 à 256.

Les résultats de ResNet50 ont été générés à l’aide des tailles de machines virtuelles NC24r_v3 et NC96ads_A100_v4.

Figure 1 : Les résultats de ResNet50 ont été générés à l’aide des tailles de machines virtuelles NC24s_v3 et NC96ads_A100_v4.

Pour plus d’informations sur la façon d’exécuter cette procédure sur Azure et pour consulter des résultats supplémentaires, consultez le blog de la communauté technique sur les performances.

Avec notre dernière ajout à la série NC, vous pouvez réduire le temps nécessaire à l’apprentissage de votre modèle d’environ la moitié tout en restant dans le budget. Vous pouvez appliquer de façon fluide les modèles de science cognitive à des applications via l’inférence par lot, exécuter plusieurs millions de simulations de biochimie atomique pour les médicaments de nouvelle génération, héberger vos services web et multimédias dans le cloud pour des dizaines de milliers d’utilisateurs finaux et bien plus encore.

En savoir plus

La série NC A100 v4 est actuellement disponible dans les régions Azure USA Centre Sud, USA Est et Asie Sud-Est. Elle sera disponible dans d’autres régions dans les prochains mois.
Pour plus d’informations sur la série Azure NC A100 v4, consultez :