Hong-Jun Yoon de ORNL, Mohammed Alawad y Gina Tourassi han desarrollado un método novedoso para capacitar de manera más eficiente a un gran número de redes capaces de resolver problemas científicos complejos. Crédito:Jason Richards / Laboratorio Nacional Oak Ridge, Departamento de Energía de EE. UU.
Un método del Laboratorio Nacional de Oak Ridge para mejorar la eficiencia energética de la inteligencia artificial científica se muestra prometedor en los esfuerzos por analizar los conocimientos de los volúmenes de datos sobre el cáncer.
Los investigadores se están dando cuenta del potencial del aprendizaje profundo para hacer avanzar rápidamente la ciencia, pero "entrenar" las redes neuronales subyacentes con grandes volúmenes de datos para abordar la tarea en cuestión puede requerir grandes cantidades de energía. Estas redes también requieren una conectividad compleja y enormes cantidades de almacenamiento, ambos reducen aún más su eficiencia energética y su potencial en aplicaciones del mundo real.
Para abordar este asunto, Mohammed Alawad de ORNL, Hong-Jun Yoon, y Georgia Tourassi desarrollaron un método novedoso para el desarrollo de redes neuronales profundas energéticamente eficientes capaces de resolver problemas científicos complejos. Presentaron su investigación en la Conferencia IEEE sobre Big Data de 2017 en Boston.
Los investigadores demostraron que al convertir las redes neuronales de aprendizaje profundo (DNN) en redes neuronales de "picos profundos" (DSNN), pueden mejorar la eficiencia energética del diseño y la realización de la red.
Los DSNN imitan a las neuronas del cerebro humano a través de pulsos o "picos" en lugar de señales reales, con los picos individuales indicando dónde realizar los cálculos. Este proceso minimiza los cálculos necesarios y maximiza la eficiencia energética de la red. Sin embargo, la eficiencia energética tiene como costo el desempeño de la tarea, y el novedoso método estocástico de los autores para implementar DSNN supera este compromiso.
Los resultados fueron impresionantes:el enfoque del equipo logró casi la misma precisión que el DNN original y funcionó mejor que una red neuronal de picos de última generación. DSNN de base estocástica del equipo, que distribuye picos de manera uniforme a lo largo del tiempo, consumió 38 veces menos energía que el DNN original y casi 2 veces menos energía que un DSNN convencional al tiempo que ofrece un rendimiento de tareas notablemente mejor.
Los investigadores capacitaron a su red en datos de texto clínico de la Vigilancia del Instituto Nacional del Cáncer, Epidemiología, y programa de resultados finales (SEER), que proporciona estadísticas de cáncer como la incidencia, predominio, y mortalidad en la población asociada a la edad, sexo, raza, año de diagnóstico, y áreas geográficas.
El equipo de ORNL aplicó las redes recién formadas a los informes de patología clínica, la principal fuente de información para el programa nacional de vigilancia del cáncer. Estos informes contienen una gran cantidad de texto no estructurado, dijo Yoon, y los investigadores están desarrollando sistemas inteligentes de comprensión del lenguaje para extraer los conceptos clínicos más relevantes en el mar de texto.
Los informes clínicos representan un conjunto de datos "escaso", que suelen plantear desafíos únicos para las redes de picos. La mayoría de las técnicas de DSNN se han centrado en tareas de visión por computadora, como el conjunto de datos MNIST, que consisten en una serie de dígitos escritos a mano para entrenar redes de procesamiento de imágenes. Estos conjuntos de datos suelen ser "densos, "lo que significa que todas las variables del conjunto de datos se rellenan con valores, una característica que a menudo simplifica los análisis.
Las técnicas tradicionales para mejorar el rendimiento y la eficiencia energética de las redes de picos a menudo conservan las estructuras de las redes neuronales convencionales. una práctica que sacrifica la precisión y el rendimiento. Estas deficiencias llevaron al equipo a desarrollar una nueva metodología, que se basa en hardware de circuito simple para realizar cálculos complejos.
"El aumento de la red reduce el consumo de energía porque ignoramos los cálculos innecesarios y buscamos solo los nodos relevantes de la red, "dijo Yoon, "y esta es una forma en la que obtenemos mejoras en la eficiencia energética al tiempo que identificamos información clínica importante con alta precisión".
La técnica del equipo ayudará a los investigadores de ORNL en el proyecto CANcer Distributed Learning Environment (CANDLE), que tiene como objetivo utilizar la experiencia de clase mundial en big data y las instalaciones informáticas del laboratorio para escanear millones de informes clínicos en busca de información sobre las causas del cáncer, mejores cursos de tratamiento, y mejores resultados. Pronto intentarán paralelizar el algoritmo para una mayor eficiencia computacional.
Las redes de picos se optimizaron en unidades de procesamiento de gráficos (GPU), los procesadores preferidos para aplicaciones de inteligencia artificial, particularmente aquellos que utilizan el aprendizaje automático y el aprendizaje profundo. Sin embargo, la metodología puede extenderse para entrenar redes de spiking, aumentando aún más la eficiencia energética de estas nuevas redes al tiempo que se acelera el descubrimiento científico a través del aprendizaje profundo.