• 2 min read

Acelere sus aplicaciones de inteligencia artificial con las máquinas virtuales NC A100 v4 de Azure

La inteligencia artificial en el mundo real ha revolucionado y cambiado la forma de vida de las personas durante la última década, incluidos los medios de comunicación y el entretenimiento, la asistencia sanitaria y las ciencias biosanitarias, el comercio minorista, la automoción, los servicios financieros, la fabricación, el petróleo y el gas. Hablar con un dispositivo doméstico inteligente, examinar las redes sociales con contenido recomendado o dar un paseo con un vehículo sin conductor ya no es algo del futuro.

La inteligencia artificial en el mundo real ha revolucionado y cambiado la forma de vida de las personas durante la última década, incluidos los medios de comunicación y el entretenimiento, la asistencia sanitaria y las ciencias biosanitarias, el comercio minorista, la automoción, los servicios financieros, la fabricación, el petróleo y el gas. Hablar con un dispositivo doméstico inteligente, examinar las redes sociales con contenido recomendado o dar un paseo con un vehículo sin conductor ya no es algo del futuro. Con la facilidad de su smartphone, ahora puede depositar cheques sin necesidad de ir al banco. Todos estos adelantos han sido posibles gracias a los nuevos avances en inteligencia artificial en el software y el hardware.

En Microsoft, hospedamos la inferencia de aprendizaje profundo, la ciencia cognitiva y nuestros servicios de inteligencia artificial aplicada en instancias de la serie NC. El aprendizaje y los avances realizados en estas áreas con respecto a nuestra infraestructura están ayudando a impulsar las decisiones de diseño para la próxima generación del sistema NC. Este enfoque permite que nuestros clientes de Azure se beneficien de nuestro aprendizaje interno.

Nos complace anunciar que la próxima generación de la serie NC A100 v4 ya está disponible en versión preliminar. Estas máquinas virtuales (VM) están equipadas con GPU NVIDIA A100 Tensor Core PCIe de 80 GB y procesadores AMD EPYC™ de tercera generación. Estas nuevas ofertas mejoran el rendimiento y la rentabilidad de una gran variedad de cargas de trabajo de entrenamiento e inferencia de inteligencia artificial del mundo real muy ligadas al rendimiento de la GPU. Estas cargas de trabajo abarcan la detección de objetos, el procesamiento de vídeo, la clasificación de imágenes, el reconocimiento de voz, los recomendadores, el aprendizaje de refuerzo para la conducción autónoma, la simulación de yacimientos de petróleo y gas, el análisis de documentos financieros, la inferencia web y mucho más.

La serie NC A100 v4 ofrece tres clases de máquinas virtuales que pueden tener desde una hasta cuatro GPU NVIDIA A100 PCIe Tensor Core de 80 GB. Esta serie ofrece una rentabilidad sin parangón, a la vez que proporciona a los clientes las opciones y la flexibilidad que necesitan para sus cargas de trabajo.

Tamaño

vCPU

Memoria (GB)

GPU (NVIDIA A100 Tensor Core de 80 GB)

Red de Azure (Gbps)

Standard_NC24ads_A100_v4

24

220

1

20

Standard_NC48ads_A100_v4

48

440

2

40

Standard_NC96ads_A100_v4

96

880

4

80

En comparación con la generación NC anterior (NCv3), con GPU basadas en la arquitectura Volta de NVIDIA, los clientes experimentarán un rendimiento entre 1,5 y 2,5 veces superior debido a:

  • Doble de GPU para hospedar el ancho de banda.
  • Cuádruple de núcleos de vCPU por máquina virtual con GPU.
  • Doble de RAM por máquina virtual con GPU.
  • Siete instancias de GPU independientes en una sola GPU NVIDIA A100 a través de GPU de varias instancias (MIG) en el sistema operativo Linux.

A continuación se muestra un ejemplo de lo que hemos experimentado al ejecutar el entrenamiento del modelo de inteligencia artificial ResNet50 con varios tamaños de lote usando el tamaño de máquina virtual NC96ads_A100_v4 en comparación con el tamaño de máquina virtual NC24s_v3 actual, con GPU NCv3 4 V100. Las pruebas se realizaron con una gran variedad de tamaños de lote, de uno a 256.

Los resultados de ResNet50 se generaron con los tamaños de máquina virtual NC24r_v3 y NC96ads_A100_v4.

Figura 1: Los resultados de ResNet50 se generaron con los tamaños de máquina virtual NC24r_v3 y NC96ads_A100_v4.

Para obtener más información sobre cómo ejecutar esto en Azure y resultados adicionales, consulte nuestra entrada sobre el rendimiento en el blog de la comunidad técnica.

Con la última incorporación de la serie NC, puede reducir el tiempo necesario para entrenar un modelo aproximadamente a la mitad y manteniéndose dentro del presupuesto. Puede aplicar sin problemas los modelos de ciencia cognitiva entrenados a aplicaciones por medio de la inferencia por lotes, ejecutar millones de simulaciones de bioquímica atómica para la medicina de próxima generación, hospedar servicios web y multimedia en la nube para decenas de miles de usuarios finales y mucho más.

Más información

La serie NC A100 v4 está disponible actualmente en las regiones Centro-sur de EE. UU., Este de EE. UU. y Sudeste Asiático de Azure. En los próximos meses, estará disponible en más regiones.
Si desea obtener más información sobre la serie NC A100 v4 de Azure, consulte: