Proyección de aproximación múltiple uniforme de baja dimensión para visualizar cómo las redes neuronales aprenden la similitud semántica de las imágenes naturales. Crédito:Joshua Agar / Lehigh University
Comprender las relaciones estructura-propiedad es un objetivo clave de la investigación de materiales, según Joshua Agar, miembro de la facultad del Departamento de Ciencia e Ingeniería de Materiales de la Universidad de Lehigh. Y, sin embargo, actualmente no existe una métrica para comprender la estructura de los materiales debido a la complejidad y naturaleza multidimensional de la estructura.
Redes neuronales artificiales, un tipo de aprendizaje automático, se puede entrenar para identificar similitudes, e incluso correlacionar parámetros como la estructura y las propiedades, pero hay dos desafíos principales, dice Agar. Una es que la mayoría de las grandes cantidades de datos generados por los experimentos con materiales nunca se analizan. Esto se debe en gran parte a que esas imágenes, producidos por científicos en laboratorios de todo el mundo, rara vez se almacenan de manera utilizable y no se suelen compartir con otros equipos de investigación. El segundo desafío es que las redes neuronales no son muy efectivas para aprender la simetría y la periodicidad (cuán periódica es la estructura de un material), dos características de suma importancia para los investigadores de materiales.
Ahora, un equipo dirigido por la Universidad de Lehigh ha desarrollado un nuevo enfoque de aprendizaje automático que puede crear proyecciones de similitud a través del aprendizaje automático, permitiendo a los investigadores buscar una base de datos de imágenes no estructuradas por primera vez e identificar tendencias. Agar y sus colaboradores desarrollaron y entrenaron un modelo de red neuronal para incluir características conscientes de la simetría y luego aplicaron su método a un conjunto de 25, 133 imágenes de microscopía de fuerza de respuesta piezoeléctrica recopiladas en diversos sistemas de materiales durante cinco años en la Universidad de California, Berkeley. Los resultados:pudieron agrupar clases similares de material y observar tendencias, formando una base para comenzar a comprender las relaciones estructura-propiedad.
"Una de las novedades de nuestro trabajo es que construimos una red neuronal especial para comprender la simetría y la usamos como un extractor de características para mejorar la comprensión de las imágenes, "dice Agar, un autor principal del artículo en el que se describe el trabajo:"Exploración de similitudes de imágenes recursivas conscientes de la simetría para microscopía de materiales, "publicado hoy en Materiales computacionales npj . Además de Agar, los autores incluyen, de la Universidad de Lehigh:Tri N. M. Nguyen, Yichen Guo, Shuyu Qin y Kylie S. Frew y, de la Universidad de Stanford:Ruijuan Xu. Nguyen, un autor principal, estudió en la Universidad de Lehigh y ahora está cursando un doctorado. en Stanford.
El equipo pudo llegar a las proyecciones empleando la Aproximación y Proyección Uniforme de Colector (UMAP), una técnica de reducción de dimensionalidad no lineal. Este enfoque, dice Agar, permite a los investigadores aprender "... de manera difusa, la topología y la estructura de nivel superior de los datos y comprimirlos en 2D ".
"Si entrena una red neuronal, el resultado es un vector, o un conjunto de números que es un descriptor compacto de las características. Esas características ayudan a clasificar las cosas para que se aprenda alguna similitud, ", dice Agar." Lo que se produce todavía es bastante grande en el espacio, aunque, porque es posible que tenga 512 o más funciones diferentes. Entonces, luego desea comprimirlo en un espacio que un humano pueda comprender, como 2D, o 3D - o, quizás , 4D ".
Al hacer esto, Agar y su equipo pudieron llevarse el 25, Más de 000 imágenes y agrupar clases de material muy similares.
"Los tipos de estructuras similares en el material están semánticamente juntos y también se pueden observar ciertas tendencias, especialmente si aplica algunos filtros de metadatos, "dice Agar". Si comienza a filtrar por quién hizo la deposición, quien hizo el material, que estaban tratando de hacer cuál es el sistema material ... realmente puedes empezar a refinar y conseguir más y más similitudes. Esa similitud se puede vincular a otros parámetros como propiedades ".
Proyección de aproximación múltiple uniforme de baja dimensión que muestra similitud de imagen consciente de la simetría de una base de datos de más de 25, 000 imágenes de microscopía de fuerza piezorrespuesta. Crédito:Joshua Agar / Lehigh University
Este trabajo demuestra cómo una mejor gestión y almacenamiento de datos podría acelerar rápidamente los descubrimientos de materiales. Según Agar, de particular valor son las imágenes y los datos generados por experimentos fallidos.
"Nadie publica resultados fallidos y eso es una gran pérdida porque, unos años después, alguien repite la misma línea de experimentos, "dice Agar". desperdicias recursos realmente buenos en un experimento que probablemente no funcionará ".
En lugar de perder toda esa información, los datos que ya se han recopilado podrían usarse para generar nuevas tendencias que no se han visto antes y acelerar el descubrimiento de manera exponencial, dice Agar.
Este estudio es el primer "caso de uso" de una nueva e innovadora empresa de almacenamiento de datos ubicada en el Laboratorio Nacional Oak Ridge llamada DataFed. DataFed, según su sitio web es "... un federado, almacenamiento de big data, colaboración, y un sistema de gestión de ciclo de vida completo para ciencia computacional y / o análisis de datos dentro de entornos de computación distribuida de alto rendimiento (HPC) y / o computación en la nube ".
"Mi equipo en Lehigh ha sido parte del diseño y desarrollo de DataFed en términos de hacerlo relevante para casos de uso científico, "dice Agar." Lehigh es la primera implementación en vivo de este sistema totalmente escalable. Es una base de datos federada para que cualquiera pueda abrir su propio servidor y estar vinculado a la instalación central ".
Agar es el experto en aprendizaje automático del equipo de la Iniciativa presidencial de interfaz nanohumana de la Universidad de Lehigh. La iniciativa interdisciplinar, integrando las ciencias sociales y la ingeniería, busca transformar las formas en que los humanos interactúan con los instrumentos de descubrimiento científico para acelerar las innovaciones.
"Uno de los objetivos clave de la Iniciativa de Interfaz Nano / Humana de Lehigh es poner la información relevante al alcance de los experimentadores para proporcionar información procesable que permita una toma de decisiones más informada y acelere el descubrimiento científico, ", dice Agar." Los seres humanos tienen una capacidad limitada para la memoria y el recuerdo. DataFed es un Memex moderno; proporciona una memoria de información científica que se puede encontrar y recuperar fácilmente ".
DataFed proporciona una herramienta especialmente poderosa e invaluable para los investigadores involucrados en la ciencia de equipos interdisciplinarios, permitiendo a los investigadores que colaboran en proyectos de equipo ubicados en ubicaciones diferentes / remotas acceder a los datos sin procesar de los demás. Este es uno de los componentes clave de nuestra iniciativa Presidential Nano / Human Interface (NHI) de Lehigh para acelerar el descubrimiento científico, "dice Martin P. Harmer, Profesor de la Fundación Alcoa en el Departamento de Ciencia e Ingeniería de Materiales de Lehigh y Director de la Iniciativa de Interfaz Nano / Humana.