Passer la navigation

Meta sélectionne Azure comme fournisseur de cloud stratégique pour faire progresser les innovations en matière d’IA et approfondir la collaboration avec PyTorch

Publié le 25 mai, 2022

Corporate Vice President, AI Platform

Microsoft s’engage à faire progresser l’IA de façon responsable pour permettre à toutes les personnes et organisations de gagner en productivité. Au cours des derniers mois, nous avons parlé des avancées de notre infrastructure Azure, d’Azure Cognitive Services et d’Azure Machine Learning pour améliorer Azure en lien avec la prise en charge des besoins en IA de tous nos clients, quelle que soit leur taille. Pendant ce temps, nous travaillons en étroite collaboration avec certaines des grandes organisations de recherche du monde entier pour leur permettre de créer de formidables IA.

Aujourd’hui, nous sommes ravis d’annoncer une extension de notre collaboration permanente avec Meta : Meta a sélectionné Azure comme fournisseur de cloud stratégique pour accélérer la recherche et le développement de l’IA. 

Dans le cadre de cette relation plus poussée, Meta étendra son utilisation de la puissance de calcul d’Azure pour accélérer la recherche et le développement de l’IA pour son groupe Meta AI. Meta utilisera un cluster Azure dédié de 5 400 GPU à l’aide de la dernière série de machines virtuelles dans Azure (NDm A100 v4, avec des GPU NVIDIA A100 Tensor Core de 80 Go) pour certaines de leurs charges de travail d’IA à grande échelle. En 2021, Meta a commencé à utiliser le service Machines virtuelles Microsoft Azure (GPU NVIDIA A100 de 80 Go) pour une partie de ses recherches en matière d’IA à grande échelle après avoir expérimenté les performances et l’échelle impressionnantes d’Azure. Avec une bande passante de GPU à GPU entre les machines virtuelles quatre fois supérieure à celle des autres offres de cloud public, la plateforme Azure permet un entraînement distribué et plus rapide de l’IA. Meta a utilisé ces fonctionnalités, par exemple, pour effectuer l’apprentissage de son modèle de langage OPT-175B récent. La série de machines virtuelles NDm A100 v4 sur Azure offre également aux clients la possibilité de configurer des clusters de n’importe quelle taille de manière automatique et dynamique allant de quelques GPU à des milliers, avec la possibilité de mettre en pause et de reprendre pendant l’expérimentation. À présent, l’équipe Meta IA étend son utilisation et apporte davantage de charges de travail d’entraînement Machine Learning de pointe dans Azure afin d’accélérer les recherches de premier plan en matière d’IA.

En outre, Meta et Microsoft collaborent pour mettre à l’échelle l’adoption de PyTorch sur Azure et accélérer le parcours des développeurs, de l’expérimentation à la production. Azure fournit une pile de haut en bas complète pour les utilisateurs de PyTorch avec un matériel de qualité optimale (NDv4s et InfiniBand). Dans les prochains mois, Microsoft créera de nouveaux accélérateurs de développement PyTorch pour faciliter l’implémentation rapide de solutions basées sur PyTorch sur Azure. Microsoft continuera également à fournir un support PyTorch de classe Entreprise afin de permettre aux clients et aux partenaires de déployer des modèles PyTorch en production sur le cloud et la périphérie.

« Nous sommes ravis d’approfondir notre collaboration avec Azure pour faire progresser les efforts de recherche, d’innovation et open source du groupe AI de Meta d’une manière qui avantage un plus grand nombre de développeurs dans le monde », Jerome Pesenti, Vice-président AI, Meta. « Avec la puissance de calcul d’Azure et 1,6 To/s de bande passante d’interconnexion par machine virtuelle, nous sommes en mesure d’accélérer nos demandes d’entraînement sans cesse croissantes pour mieux prendre en charge des modèles d’IA plus vastes et innovants. En outre, nous sommes heureux de collaborer avec Microsoft pour étendre notre expérience à ses clients en utilisant PyTorch dans leur parcours de la recherche à la production. »

En mettant à l’échelle la puissance informatique supérieure d’Azure pour entraîner de volumineux modèles d’IA pour les organisations de recherche leaders dans le monde, et en développant des outils et des ressources pour la collaboration et l’expérimentation open source, nous pouvons développer de nouvelles opportunités pour les développeurs et la communauté technologique plus large, et aller encore plus loin dans notre mission qui est d’offrir à toutes les personnes et les organisations du monde les moyens dont elles ont besoin.