Densidad de probabilidad para un rendimiento alcanzable (GFlop / s) utilizando 1024 muestras con diferentes mosaicos y tamaños de problemas. Con eDRAM (DRAM =memoria dinámica de acceso aleatorio), la curva de función en su conjunto se desplaza hacia la parte superior derecha, lo que implica que más muestras pueden alcanzar casi el pico (por ejemplo, 90 por ciento) rendimiento. En otras palabras, Tener eDRAM aumenta la posibilidad de que las aplicaciones menos optimizadas alcancen el rendimiento "reclamado por el proveedor". Sin embargo, el límite derecho solo se mueve un poco, lo que indica que eDRAM no puede mejorar significativamente el rendimiento máximo sin procesar. Crédito:Departamento de Energía de EE. UU.
La memoria de gran ancho de banda puede mejorar el rendimiento de una computadora. La memoria en el paquete (OPM) es una opción popular en muchos sistemas comerciales. Antes de este esfuerzo, Se sabía poco sobre las implicaciones de OPM en la velocidad y el uso de energía. El equipo caracterizó y analizó experimentalmente el almacenamiento OPM moderno. Proporcionaron pautas sobre cómo ajustar la memoria para acelerar las aplicaciones de computación de alto rendimiento (HPC).
Este estudio sobre OPM es esencial y fundamental para el avance de los sistemas informáticos. Por ejemplo, motiva la exploración del codiseño de la arquitectura de software. Más lejos, valida modelos y simulaciones. También ha dado lugar a pautas generales de optimización. El trabajo muestra cómo ajustar aplicaciones y arquitecturas para obtener el mejor rendimiento en plataformas con ciertos OPM.
Los investigadores llevaron a cabo una evaluación experimental exhaustiva para discernir cómo los OPM modernos afectaban el rendimiento y la eficiencia energética de importantes núcleos científicos de HPC. que componen el sistema operativo central de una computadora. Examinaron diferentes modos de ajuste de OPM y cómo influyeron en el ajuste de la aplicación para obtener el mejor rendimiento del sistema. El equipo del Laboratorio Nacional del Noroeste del Pacífico, Universidad de Copenhague, y Virginia Tech evaluaron diversos kernels de HPC en dos OPM de Intel, eDRAM en Broadwell multinúcleo y MCDRAM en muchos núcleos Knights Landing, con un gran conjunto de sus matrices de entrada representativas (por ejemplo, 968 matrices para granos dispersos). Este estudio permitió al equipo derivar un modelo analítico visual intuitivo para explicar mejor escenarios arquitectónicos complejos, así como proporcionar pautas generales para futuras optimizaciones de arquitectura y ajustes de eficiencia.