El estado de las GPU individuales se supervisa y las tareas se distribuyen en consecuencia. Crédito:Universidad Tecnológica de Viena
Las unidades de procesamiento de gráficos (GPU) se utilizan para muchas tareas computacionalmente intensivas. Su proceso de envejecimiento puede ralentizarse mediante una gestión inteligente, como ahora han demostrado TU Wien (Viena) y la Universidad de California (Irvine).
Las unidades de procesamiento de gráficos no solo se utilizan para mostrar gráficos. Hoy dia, se utilizan con frecuencia para cálculos particularmente desafiantes, por ejemplo, en la investigación científica o incluso en la minería de Bitcoin.
Sin embargo, su rendimiento suele disminuir con el tiempo. A medida que envejecen los núcleos individuales de la unidad de procesamiento, ya no funcionan juntos perfectamente. TU Wien y la Universidad de California, Por lo tanto, Irvine ha desarrollado un método mejorado de gestión de chips, que distribuye las tareas de procesamiento de manera eficiente. En más del 95% de los casos, esto puede ralentizar el proceso de envejecimiento de las GPU.
Computación altamente paralela
"Las computadoras estándar que usamos en casa solo tienen unos pocos núcleos de procesador. Por otro lado, una unidad de procesamiento de gráficos consta de una gran cantidad de núcleos, generalmente cientos o miles", dice el profesor Muhammad Shafique (Instituto de Ingeniería Informática, TU Viena). Por lo tanto, Las GPU son extremadamente útiles para cálculos en paralelo, en el que una tarea se puede dividir en muchos cálculos más pequeños que se pueden resolver de forma independiente entre sí, por diferentes núcleos al mismo tiempo.
Un clúster de CPU. Crédito:Universidad Tecnológica de Viena
Los núcleos sin embargo, nunca son completamente idénticos. "Las estructuras de la GPU son muy pequeñas. Siempre habrá pequeñas imperfecciones y desviaciones debido al proceso de producción", dice Muhammad Shafique. Por lo tanto, el envejecimiento tiene diferentes efectos en diferentes núcleos. Bajo estrés, el rendimiento de diferentes núcleos se desviará.
Este es un problema para la computación paralela. Cuando una tarea se distribuye entre muchos núcleos y el sistema tiene que esperar a que finalice el último antes de que se pueda iniciar el siguiente paso del cálculo, el núcleo más lento determina la velocidad general del proceso. Esto puede reducir drásticamente el rendimiento de la GPU.
Técnicas de gestión inteligentes
Muhammad Shafique y el equipo del profesor Mohammad Al Faruque (Universidad de California, Irvine) quieren resolver este problema utilizando métodos de gestión inteligentes:"Primero, es fundamental conocer el estado de los núcleos individuales ", dice Muahmmad Shafique. "Entonces podemos distribuir diferentes tareas de tal manera entre los núcleos que el estrés físico se distribuya de manera óptima".
Los núcleos con propiedades similares se combinan en "clústeres", que luego se asignan con tareas más o menos desafiantes, dependiendo de su estado actual. De esa manera, el proceso de envejecimiento puede ralentizarse, aumenta el rendimiento general del sistema. "Ya ha habido ideas sobre cómo ralentizar el proceso de envejecimiento de las GPU con técnicas basadas en compiladores, pero nuestro método es mucho más efectivo. Funciona en más del 95% de los casos ", dice Muhammad Shafique.