Supercomputadora basada en Intel Habana lanzada para pruebas • Registro

Antonio Calzadillamayo 22, 2022

0 24 3 minutos de lectura

Supercomputadora basada en Intel Habana lanzada para pruebas • Registro

El Centro de Supercomputadoras de San Diego (SDSC) dice que está listo para ejecutar cargas de trabajo de prueba con su sistema experimental Voyager AI, que parece ser la primera supercomputadora basada en Intel Habana.

La supercomputadora fue construido en cooperación Con Intel como Habana Labs y Supermicro como parte de una subvención de $ 11,25 millones de cinco años de la American National Science Foundation. Y aunque Voyager es potente, no intenta superar los puntos de referencia, no debería ganar.

Voyager está configurado para ser un banco de pruebas para la investigación y el desarrollo de la computación AI / ML en hardware especializado, en este caso los procesadores Goya y Gaudi de Habana, dijo Amit Majumdar, investigador principal de Voyager. Registro.

Presentado en 2019, el Habana Labin Goya fue diseñado para acelerar las cargas de trabajo de razonamiento de inteligencia artificial utilizando ocho núcleos de procesador de tensor que admiten precisión mixta desde FP32 hasta UINT8. Mientras tanto, Gaudí, presentado unos meses después, era un chip de 350 W diseñado para el entrenamiento de ML. Tenía 32 GB de memoria interna funcionando a 1 TB/s de ancho de banda.

Intel adquirió el diseñador de circuitos a fines de 2019 después de abandonar su pobre asociación de Nervana con Meta (entonces Facebook). De alguna manera por tercera vez, buena suerte a Intel en los sistemas de inteligencia artificial.

Los aceleradores Habana AI se utilizan en la red de 42 Supermicro X12 que componen la Voyager. Cada sistema X12 está equipado con un par de procesadores escalables Xeon de tercera generación de Intel y ocho procesadores Habana Gaudi AI. El clúster también utiliza un par de sistemas OEM SuperServer 4029GP-T con ocho tarjetas Goya HL-100 PCIe para el razonamiento de inteligencia artificial.

Debido a que el sistema está diseñado para soportar modelos de IA muy grandes, cada servidor está conectado en red con seis puertos de 400 Gbit/s que operan a través del protocolo RDMA-over-Converged-Ethernet a un gran conmutador de bloqueo Arista.

READ Gemelos idénticos siguen sueños diferentes

Listo, listo, prueba

Cuando el sistema Voyager se está ejecutando, el SDSC ha migrado al sistema fase de prueba sobre el proyecto.

Durante este tiempo, el centro de supercomputación tendrá tres años para trabajar directamente con los investigadores para determinar el rendimiento del sistema, las especificaciones del hardware y los requisitos de compatibilidad del software, explicó Majumdar.

El estudio también explora el uso de los chips Habana, que tradicionalmente se han centrado en la visión por computadora, el procesamiento del lenguaje natural y el aprendizaje profundo, dijo Sree Ganeson, director de gestión de productos de software en Habana Labs. Registro.

“Esta comunidad de científicos e investigadores traerá diferentes problemas de clase y tratará de aplicarlos a un aprendizaje demasiado profundo”, dijo. “Pueden traer consigo diferentes modelos, por lo que será aprender [process]”

Los resultados de esta prueba se compartirán en talleres semestrales y foros de usuarios en los próximos años.

Sin embargo, no todos pueden trabajar en el sistema. Los equipos de investigación identificados con la asistencia de un consejo asesor externo y la información recopilada se utilizarán para desarrollar mejores prácticas y políticas de asignación. Esto es diferente de uno de los sistemas, que se abrirá a proyectos de investigación revisados por pares poco después de estar en línea, dijo Majumdar.

Después de tres años, el proyecto pasará a una fase dividida de dos años, durante la cual el equipo de SDSC se jubilará y permitirá que investigadores independientes realicen investigaciones sobre el sistema.

Aunque Voyager acaba de ingresar a la red, Majumdar afirma que las primeras pruebas han sido prometedoras, ya que el rendimiento es “mejor de lo previsto” y las cargas de trabajo se trasladaron relativamente sin problemas a Gaud y Goya. “La pila de software, la transferencia y el funcionamiento de la máquina han sido realmente fluidos”, dijo.

READ ¡Costa Rica tiene una temporada navideña de conteo de aves! :

¿Qué hay de Gaudi2 y Greco?

Voyager entra en línea solo unas semanas después de que Habana Labs de Intel presentara su procesador de entrenamiento y razonamiento de IA de segunda generación: Gaudi2 y Greco.

Intel afirma que los chips mejorarán significativamente el rendimiento con respecto a la generación anterior y superarán a las GPU A100 de Nvidia en sus comparaciones internas.

El Gaudi2 de 600 W ofrece 24 núcleos tensoriales basados en un proceso de fabricación de 7 nm y 96 GB de memoria HBM2e de gran ancho de banda que funcionan a 2,45 Tt/s. Greco, por otro lado, ofrece 16 GB, lo mismo que Goya, del LPDDR5 más nuevo en una tarjeta PCIe más pequeña de una sola ranura, media altura y media longitud que consume menos de la mitad de la energía.

“Gaudi2 es más grande en muchos sentidos porque tiene más núcleos de procesadores tensoriales, más HBM2e, más puertos escalables, así que aprendemos cualquier cosa. [Voyager] Debería escalarse aún mejor en Gaudi2″, dijo Ganeson. “Esta comunidad está haciendo un trabajo excelente. Entonces podemos aprender y evolucionar para lo que estará en producción en el futuro. ”®

Antonio Calzadilla

Social media expert. Award Winning TV Lover. Future teen idol. Music Evangelist. coffee guru