NVIDIA dio a conocer hoy una serie de avances importantes en su plataforma informática de aprendizaje profundo líder en el mundo, que ofrece un aumento del rendimiento de 10 veces en las cargas de trabajo de aprendizaje profundo en comparación con la generación anterior hace seis meses.
Los principales avances en la plataforma NVIDIA, adoptados por todos los proveedores de servicios en la nube y fabricantes de servidores, incluyen un aumento de la memoria 2x a NVIDIA® Tesla® V100, la GPU más potente del centro de datos y una nueva y revolucionaria red de interconexión de GPU llamada NVIDIA NVSwitch ™, que permite hasta 16 GPU Tesla V100 comunicarse simultáneamente a una velocidad de grabación de 2.4 terabytes por segundo. NVIDIA también presentó una pila de software actualizada y totalmente optimizada.
Además, NVIDIA lanzó un gran avance en la informática de aprendizaje profundo con NVIDIA DGX-2 ™, el primer servidor único capaz de entregar dos petaflops de potencia computacional. DGX-2 tiene la potencia de procesamiento de aprendizaje profundo de 300 servidores que ocupan 15 bastidores del espacio del centro de datos, mientras que es 60 veces más pequeño y 18 veces más eficiente.
«Los extraordinarios avances del aprendizaje profundo solo insinúan lo que está por venir», dijo Jensen Huang, fundador y CEO de NVIDIA, al presentar las novedades en GTC 2018. «Muchos de estos avances se encuentran en la plataforma de aprendizaje profundo de NVIDIA, que rápidamente convertirse en el estándar del mundo. Estamos mejorando drásticamente el rendimiento de nuestra plataforma a un ritmo que excede con creces la ley de Moore, permitiendo avances que ayudarán a revolucionar el cuidado de la salud, el transporte, la exploración científica y un sinnúmero de otras áreas «.
Tesla V100 obtiene el doble de la memoria
La GPU Tesla V100, ampliamente adoptada por los investigadores líderes en el mundo, ha recibido un impulso de memoria de 2x para manejar la mayoría de las cargas de trabajo de computación de alto rendimiento y aprendizaje profundo con uso intensivo de memoria.
Ahora equipados con 32 GB de memoria, las GPU Tesla V100 ayudarán a los científicos de datos a entrenar modelos de aprendizaje profundo más profundos y más grandes que nunca. También pueden mejorar el rendimiento de las aplicaciones de HPC con memoria limitada hasta en un 50 por ciento en comparación con la versión anterior de 16 GB.
La GPU Tesla V100 de 32 GB está disponible de inmediato en toda la cartera de sistemas NVIDIA DGX. Además, los principales fabricantes de computadoras Cray, Hewlett Packard Enterprise, IBM, Lenovo, Supermicro y Tyan anunciaron que comenzarán a desplegar sus nuevos sistemas Tesla V100 32GB en el segundo trimestre. Oracle Cloud Infrastructure también anunció planes para ofrecer Tesla V100 32GB en la nube en la segunda mitad del año.
NVSwitch: una tela de interconexión revolucionaria
NVSwitch ofrece un ancho de banda 5 veces mayor que el mejor conmutador PCIe, lo que permite a los desarrolladores construir sistemas con más GPU hiperconectadas entre sí. Ayudará a los desarrolladores a superar las limitaciones previas del sistema y ejecutar conjuntos de datos mucho más grandes. También abre la puerta a cargas de trabajo más grandes y complejas, incluida la capacitación paralela de modelado de redes neuronales.
NVSwitch amplía las innovaciones disponibles a través de NVIDIA NVLink ™, la primera tecnología de interconexión de alta velocidad desarrollada por NVIDIA. NVSwitch permite a los diseñadores de sistemas construir sistemas aún más avanzados que pueden conectar de manera flexible cualquier topología de GPU basadas en NVLink.
Aprendizaje avanzado acelerado por GPU avanzado y HPC Software Stack
Las actualizaciones de la pila de software de aprendizaje profundo y HPC de NVIDIA están disponibles sin cargo para su comunidad de desarrolladores, que ahora suma más de 820,000 usuarios registrados, en comparación con alrededor de 480,000 hace un año.
Entre sus actualizaciones se encuentran las nuevas versiones de NVIDIA CUDA®, TensorRT, NCCL y cuDNN, y un nuevo kit de desarrollador de software Isaac para robótica. Además, a través de una estrecha colaboración con los principales proveedores de servicios en la nube, cada marco principal de aprendizaje profundo se optimiza continuamente para aprovechar al máximo la plataforma de computación GPU de NVIDIA.
NVIDIA DGX-2: los dos primeros sistemas de petaflop del mundo
El nuevo sistema DGX-2 de NVIDIA alcanzó el hito de dos petaflop gracias a una amplia gama de avances tecnológicos líderes en la industria desarrollados por NVIDIA en todos los niveles de la pila de computación.
DGX-2 es el primer sistema para presentar NVSwitch, que permite que las 16 GPU del sistema compartan un espacio de memoria unificado. Los desarrolladores ahora tienen el poder de entrenamiento de aprendizaje profundo para abordar los conjuntos de datos más grandes y los modelos de aprendizaje profundo más complejos.
Combinado con un conjunto totalmente optimizado y actualizado de software de aprendizaje profundo NVIDIA, el DGX-2 está especialmente diseñado para científicos de datos que impulsan los límites externos de la investigación y la informática de aprendizaje profundo.
DGX-2 puede entrenar FAIRSeq, un modelo de traducción automática neuronal de última generación, en menos de dos días: una mejora de 10 veces en el rendimiento de la DGX-1 con Volta, presentado en septiembre.
Soporte de la industria para Tesla V100 32GB
«Microsoft y NVIDIA han progresado enormemente a lo largo de los años en nuestra colaboración en tecnologías de inteligencia artificial, incluidos avances recientes en la traducción de chino a inglés», dijo Xuedong Huang, técnico y jefe de comunicación y lenguaje en Microsoft. «Con las nuevas GPU Tesla V100 de 32 GB, podremos entrenar modelos de inteligencia artificial más grandes y complejos con mayor rapidez. Esto ayudará a extender la precisión de nuestros modelos en reconocimiento de voz y traducción automática, alcanzando las capacidades humanas y mejorando ofertas como Cortana, Bing y Microsoft Translator «.
«Evaluamos DGX-1 con el nuevo Tesla V100 32GB para nuestra aplicación SAP Brand Impact, que analiza automáticamente la exposición de marca en videos casi en tiempo real», dijo Michael Kemelmakher, vicepresidente del Centro de Innovación de SAP en Israel. «La memoria adicional mejoró nuestra capacidad de manejar imágenes de alta definición en un modelo ResNet-152 más grande, reduciendo la tasa de error en un 40 por ciento en promedio. Esto da como resultado servicios precisos, oportunos y auditables a escala «.
Portafolio de productos NVIDIA DGX
DGX-2 es la última incorporación al portafolio de productos NVIDIA DGX, que consta de tres sistemas diseñados para ayudar a los científicos de datos a desarrollar, probar, implementar y escalar nuevos modelos de aprendizaje profundo e innovaciones rápidamente.
DGX-2, con 16 GPU, es la parte superior de la alineación. Se une al sistema NVIDIA DGX-1, que presenta ocho GPU Tesla V100, y DGX Station ™, el primer supercomputador personal de aprendizaje profundo del mundo, con cuatro GPU Tesla V100 en un diseño compacto y de escritorio. Estos sistemas permiten a los científicos de datos escalar su trabajo de los complejos experimentos que realizan en sus escritorios a los mayores problemas de aprendizaje profundo, lo que les permite hacer el trabajo de sus vidas.