Omitir navegación

Meta selecciona Azure como proveedor estratégico de nube para avanzar en la innovación de la inteligencia artificial y profundizar en la colaboración en torno a PyTorch

Publicado el 25 mayo, 2022

Corporate Vice President, AI Platform

Microsoft se compromete a llevar a cabo un avance responsable de la inteligencia artificial para que todas las personas y organizaciones puedan lograr más cosas. En los últimos meses, hemos hablado de los avances en la infraestructura de Azure, Azure Cognitive Services y Azure Machine Learning para mejorar Azure con el fin de atender mejor las necesidades de inteligencia artificial de todos nuestros clientes, independientemente de su envergadura. Mientras tanto, también colaboramos estrechamente con algunas de las principales organizaciones de investigación de todo el mundo para aportarles la capacidad de crear una inteligencia artificial excelente.

Hoy estamos encantados de anunciar la ampliación de nuestra colaboración actual con Meta: Meta ha seleccionado Azure como proveedor estratégico de nube para ayudar a acelerar la investigación y el desarrollo de la inteligencia artificial. 

Como resultado de esta estrecha relación, Meta hará un mayor uso de la capacidad de supercomputación de Azure para acelerar la investigación y el desarrollo de la inteligencia artificial para su grupo de IA. Meta utilizará un clúster dedicado de Azure de 5400 GPU que usa las máquinas virtuales (VM) más recientes de Azure (serie NDm A100 v4, con GPU NVIDIA A100 Tensor Core de 80 GB) para algunas de sus cargas de trabajo de investigación de inteligencia artificial a gran escala. En 2021, Meta comenzó a usar máquinas virtuales de Microsoft Azure (con GPU NVIDIA A100 de 80 GB) para algunas de sus investigaciones de inteligencia artificial a gran escala, después de experimentar el rendimiento y la escala impresionantes de Azure. Con cuatro veces el ancho de banda de GPU a GPU entre las máquinas virtuales en comparación con otras ofertas de nube pública, la plataforma Azure permite un entrenamiento distribuido de la inteligencia artificial más rápido. Meta lo usó, por ejemplo, para entrenar su reciente modelo de lenguaje OPT-175B. La serie de máquinas virtuales NDm A100 v4 de Azure también ofrece a los clientes la flexibilidad de configurar clústeres de cualquier tamaño de forma automática y dinámica, desde solo algunas GPU hasta miles, así como la capacidad de pausar y reanudar las máquinas durante la experimentación. Ahora, el equipo de IA de Meta ha ampliado su uso y está trasladando a Azure más cargas de trabajo de entrenamiento con aprendizaje automático vanguardista para avanzar aún más en su extraordinaria investigación de la inteligencia artificial.

Además, Meta y Microsoft colaborarán para escalar la adopción de PyTorch en Azure y acelerar el recorrido de los desarrolladores desde la experimentación hasta producción. Azure proporciona una pila completa para los usuarios de PyTorch con un hardware excepcional (NDv4s e Infiniband). En los próximos meses, Microsoft creará nuevos aceleradores de desarrollo de PyTorch para facilitar la rápida implementación de soluciones basadas en PyTorch en Azure. Microsoft también seguirá proporcionando soporte técnico de nivel empresarial para PyTorch con el fin de que los clientes y asociados puedan implementar modelos de PyTorch en producción tanto en la nube como en el perímetro.

Estamos encantados de ampliar nuestra colaboración con Azure para avanzar en la investigación, la innovación y los trabajos de código abierto de IA en Meta de una forma que beneficie a más desarrolladores de todo el mundo”, Jerome Pesenti, vicepresidente de IA en Meta. “Con la capacidad de proceso de Azure y 1,6 TB/s de ancho de banda de interconexión por máquina virtual, podemos acelerar nuestra creciente demanda de entrenamiento para dar cabida a modelos de inteligencia artificial más grandes e innovadores. Además, estamos encantados de trabajar con Microsoft para extender nuestra experiencia a los clientes que usan PyTorch en su recorrido desde la investigación hasta producción”.

Al escalar la capacidad de supercomputación de Azure para entrenar modelos de inteligencia artificial de gran tamaño para las principales organizaciones de investigación del mundo y al expandir nuestros recursos y herramientas para la colaboración y experimentación de código abierto, podemos ayudar a crear nuevas oportunidades para los desarrolladores y la comunidad tecnológica en general, y así avanzar en nuestra misión de capacitar a todas las personas y organizaciones de todo el mundo.