Visualización utilizando HyperTools para representar el contenido de los artículos de Wikipedia. Cada punto representa un solo artículo de Wikipedia (de un conjunto de 3, 000 artículos elegidos al azar). Las posiciones de los puntos reflejan de qué tratan los artículos (los puntos cercanos tratan de temas similares), y los colores de los puntos reflejan "grupos" de artículos descubiertos automáticamente que tratan temas similares. Crédito:Imagen estática por Laboratorio de Dinámica Contextual, Universidad de Dartmouth
Cada conjunto de datos en el universo observable tiene una geometría o forma fundamental, pero esa estructura puede ser muy complicada. Para facilitar la visualización de conjuntos de datos complicados, Un equipo de investigación de Dartmouth ha creado HyperTools, un paquete de software de código abierto que aprovecha un conjunto de técnicas matemáticas para obtener intuiciones sobre conjuntos de datos de alta dimensión a través de las estructuras geométricas subyacentes que reflejan. Los hallazgos se publican en el Journal of Machine Learning Research .
HyperTools se puede utilizar para transformar datos en formas o animaciones visualizables, que se puede utilizar para:comparar diferentes conjuntos de datos, obtener información sobre los patrones subyacentes de una manera intuitiva, hacer generalizaciones en conjuntos de datos, y desarrollar y probar teorías relacionadas con Big Data.
"Los conjuntos de datos a los que nos enfrentamos como científicos modernos pueden ser enormemente complejos, a menudo refleja muchos componentes que interactúan, "explica el autor principal, Jeremy R. Manning, profesor asistente de ciencias psicológicas y cerebrales y director del Laboratorio de dinámica contextual en Dartmouth. "Nuestra herramienta convierte datos complejos en formas tridimensionales intuitivas que se pueden examinar y comparar visualmente. Básicamente, estamos aprovechando la asombrosa capacidad del sistema visual para encontrar patrones en el mundo que nos rodea para también encontrar patrones en datos científicos complejos ".
Los investigadores demuestran cómo se puede aplicar HyperTools a varios tipos de datos. En el papel, muestran visualizaciones de:actividad cerebral, fotogramas de películas y respuestas cerebrales al ver esos fotogramas; cambios en las mediciones de temperatura en la superficie de la Tierra desde 1875 hasta 2013; y el contenido temático de los tuits políticos emitidos por Hillary Clinton y Donald Trump durante la campaña presidencial estadounidense de 2016.
HyperTools generó una visualización de los cambios de temperatura en la superficie de la Tierra entre 1875 y 2013. La visualización destaca la naturaleza cíclica (estacional) de las temperaturas globales que se produce junto con un aumento gradual de las temperaturas globales a lo largo del tiempo. La imagen se encuentra entre las incluidas en la Figura 1 del artículo de revista. Crédito:Imagen estática por Laboratorio de Dinámica Contextual, Universidad de Dartmouth.
Además de utilizar HyperTools para comprender directamente la estructura geométrica de los datos, Los conocimientos revelados por la herramienta también se pueden utilizar para guiar el desarrollo de algoritmos de aprendizaje automático. Por ejemplo, Las visualizaciones de datos pueden revelar cómo los diferentes tipos de observaciones forman grupos estructurados distintos (por ejemplo, los tweets de Trump frente a los tweets de Clinton) que podrían usarse para comprender las similitudes y diferencias entre los grupos.
Como parte de la caja de herramientas de HyperTools, El laboratorio de Manning continúa desarrollando y lanzando otros tipos de análisis de visualización geométrica, incluidos los análisis de texto lanzados recientemente.
Visualización usando HyperTools para representar el contenido de artículos de revistas. Cada punto representa un único artículo publicado en Neural Information Processing Systems (NIPS). Las posiciones de los puntos reflejan de qué tratan los artículos (los puntos cercanos tratan de temas similares), y los colores de los puntos reflejan "grupos" de artículos descubiertos automáticamente que tratan temas similares. Crédito:Laboratorio de dinámica contextual, Universidad de Dartmouth.
Animación 3-D de una visualización utilizando HyperTools para representar el contenido de los artículos de Wikipedia. Crédito:Laboratorio de dinámica contextual, Universidad de Dartmouth