DGX-A100

El grupo de investigación CVBLAB, perteneciente al I3B de la UPV, mejoró sus instalaciones al adquirir un sistema de gran potencia de cálculo más un software orientado al aprendizaje profundo totalmente integrado y optimizado con el hardware.

Este equipo ha sido financiado por la Unión Europea dentro del Programa operativo FEDER de la Comunidad Valenciana 2014-2020 con el número de subvención IDIFEDER/2020/030. Estas ayudas fueron publicadas en el DOGV número 8596 el 22 de julio de 2019.

Con dicha ayuda, se adquirió una infraestructura específica para inteligencia artificial (IA), en concreto el sistema NVIDIA DGXA100. Dicho sistema está optimizado para llevar a cabo todas las tareas de IA, desde la analítica hasta el entrenamiento y la inferencia. DGX A100 ofrece en un único sistema unos 5PFLOPs de potencia de cálculo con capacidad GPU de múltiples instancias, permitiendo la asignación de un tipo específico de procesos y garantizando que se admitan trabajos grandes y complejos, junto con otros más simples y pequeños.

El objetivo principal de este equipamiento es ser usado en el campo de la patología digital. En concreto para diseñar, desarrollar y emplear técnicas de deep learning, basadas en redes neuronales convolucionales y transformers, sobre imágenes histológicas digitales. El gran tamaño de las imágenes, del orden de un gigabyte, unido a que las técnicas de deep learning requieren de la optimización de parámetros en el diseño de las redes neuronales justifican la necesidad de un sistema hardware y software de gran potencia de computación. Toda la potencia hardware debe ser aprovechada por un software que integre todos los componentes de la manera más eficiente posible para garantizar el flujo óptimo de la computación de datos. El software debe facilitar el diseño y optimización de las redes neuronales según el problema a resolver, así como la importación de datos, normalización de los mismos, visualización de resultados, etc. La Universidad Politécnica de Valencia no tenía hasta la fecha un hardware tan potente como el adquirido gracias a esta ayuda de infraestructuras de la Generalitat Valenciana y muy pocos centros a nivel nacional e internacional lo poseen. Esto hará crecer y posicionar a la universidad como referente en Inteligencia Artificial. La adquisición de un sistema de estas características será vital para poder acometer con éxito los objetivos del grupo de investigación y en especial del proyecto europeo que están actualmente coordinando (CLARIFY, 860627), pero también para acometer otros proyectos en los que participan con mayores garantías.

ESPECIFICACIONES DEL SISTEMA

HARDWARE

  • CPU: Dual AMD Rome 7742, 128 cores total, 2.25 GHz (base), 3.4 GHz (max boost).
  • Memoria del sistema: 1 TB .
  • GPUs: 8x NVIDIA A100 Tensor Core GPUs, 320GB GPU memory, Multi Instance GPU mode .
  • Almacenamiento: OS: 2x 1.92TB M.2 NVME drives, Internal Storage: 15TB (4x 3.84TB) U.2 NVME drives .
  • Red: 8x Single-Port 200Gb/s HDR InfiniBand y 1x Dual-Port. La conectividad Infiniband garantiza un ancho de banda bidireccional de 450Gb/s.
  • Rendimiento: 5 petaFLOPS AI, 10 petaOPS INT8 .
  • Consumo energético: 6.5kW max .
  • Peso del sistema: 123 kgs.

SOFTWARE

  • DGX OS 5 (Ubuntu Linux OS).
  • Software para gestión, monitorización y planificación.
  • Entorno optimizado basado en dockers para tareas de Machine Learning, en particular para Deep Learning.

Agencia

Generalitat Valenciana / European Union through the European Regional Development Fund (ERDF) of the Valencian Community (IDIFEDER/2020/030)

Años

2020 to 2021

 

QUIERES MÁS INFORMACIÓN?