Un nuevo enfoque de aprendizaje automático puede ayudar a los investigadores a resolver problemas como determinar los mejores tamaños de cilindros para capturar energía electromagnética. Crédito:Escuela de Enfermería de la Universidad de Duke
Los ingenieros eléctricos de la Universidad de Duke han ideado un nuevo método para resolver problemas de diseño difíciles con muchas soluciones potenciales en un gran espacio de diseño utilizando el aprendizaje automático. Apodado el "método neuronal adjunto, “El enfoque descubre con éxito un diseño optimizado para un dispositivo de comunicaciones electromagnéticas y también podría usarse para muchos otros desafíos de diseño que van desde la obtención de imágenes biomédicas hasta la holografía.
La investigación apareció en línea el 24 de febrero en la revista. Óptica Express , titulado "Método neuronal adjunto para el diseño inverso de metasuperficies totalmente dieléctricas".
El dilema que está abordando el nuevo método de aprendizaje automático es resolver problemas inversos, lo que significa que los investigadores conocen el resultado que quieren, pero no están seguros de cuál es la mejor manera de lograrlo. Dentro de este tipo de desafío hay una clase llamada problemas inversos mal planteados, lo que significa que hay un número infinito de soluciones sin orientación sobre cuál podría ser la mejor.
"Si se le dan dos números para sumar, puede obtener una solución directa y sencilla, "explicó Willie Padilla, profesor de ingeniería eléctrica e informática en Duke. "Pero si digo que me dé dos números reales que sumen tres, hay un conjunto infinito de números que podría ser la respuesta con cero comprensión si se ha elegido la respuesta correcta. Darle la vuelta a esta simple tarea muestra cuán desafiante puede ser un problema inverso mal planteado ".
En la nueva investigación, La tarea específica que Padilla busca resolver es encontrar el mejor diseño para un metamaterial dieléctrico (libre de metales) que produzca una respuesta electromagnética específica. Los metamateriales son materiales sintéticos compuestos por muchas características de ingeniería individuales, que juntos producen propiedades que no se encuentran en la naturaleza. Lo logran a través de su estructura en lugar de su química. En el experimento de metamaterial dieléctrico de Padilla, utiliza una hoja grande construida a partir de rejillas individuales de dos por dos de cilindros de silicio que se asemejan a cortos, Legos cuadrados.
Calcular cómo interactúan los efectos electromagnéticos de un conjunto idéntico de cilindros entre sí es un proceso sencillo que puede realizarse mediante software comercial. Pero resolver el problema inverso mal planteado de qué geometría producirá mejor un conjunto deseado de propiedades es una propuesta mucho más difícil. Debido a que cada cilindro crea un campo electromagnético que se extiende más allá de sus límites físicos, interactúan entre sí de una manera impredecible, forma no lineal.
"Si intenta generar una respuesta deseada combinando los efectos electromagnéticos producidos por cada cilindro individual, obtendrá un mapa complicado de muchos picos altos y bajos que no es simplemente una suma de sus partes, ", dijo el profesor Padilla." Es un enorme espacio de parámetros geométricos y estás completamente ciego, no hay indicación de qué camino tomar ".
El nuevo enfoque de aprendizaje automático de Padilla para navegar en este complejo espacio de diseño comienza por entrenar una red neuronal profunda con 60, 000 simulaciones de diferentes diseños y las propiedades electromagnéticas que producen. Incluso teniendo en cuenta 14 parámetros geométricos, el algoritmo de aprendizaje automático aprendió la función que conecta la geometría compleja con el resultado electromagnético.
En este punto, la red neuronal profunda podría proporcionar a los investigadores una respuesta a la pregunta inversa de encontrar una geometría que pueda producir una respuesta deseada. Pero con 1,04 billones de soluciones potenciales, la red neuronal tardaría más de tres años en encontrar una respuesta.
"Que yo sepa, este es el mayor problema fotónico del espacio geométrico en el que alguien ha trabajado, "dijo Padilla." Si intentas resolverlo con un algoritmo informático normal, tomaría 600 millones de años. La red neuronal profunda solo muestreó el 0,00000575% del espacio de diseño, pero aprendió la función de todos modos ".
Si bien es una hazaña impresionante, es el segundo paso de este proceso el que es verdaderamente novedoso. Aunque los investigadores no saben exactamente cuál es la función que se le ocurrió a la red neuronal profunda, pueden usarlo para trabajar hacia una respuesta óptima.
El nuevo método neuronal-adjunto funciona a partir de 16, 000 puntos aleatorios y calcular qué tan buena es la solución de cada uno. Luego permite que cada uno se mueva hacia una mejor solución, un proceso llamado descenso de gradiente. Repitiendo este proceso varias veces, el algoritmo se abre camino hacia soluciones optimizadas localmente. Crucialmente, Los investigadores también establecen límites mínimos y máximos en función de su conocimiento del espacio en el que el aprendizaje automático es preciso. lo que impidió que el algoritmo se volviera demasiado loco con sus soluciones.
Después de 300 iteraciones, el programa mira el 16, 000 soluciones óptimas localmente que encontró y elige la mejor opción. También indica si podría haber un límite establecido en un parámetro que podría permitir una mejor solución si se expandiera.
"Al realizar esta investigación, vimos todas nuestras mejores soluciones atascadas contra la altura máxima que habíamos establecido para los cilindros, "dijo Padilla." Nos estábamos limitando pero no lo sabíamos. Entonces ampliamos la altura, hizo aún más simulaciones, y de hecho encontré una mejor solución ".
Aplicado a metamateriales, Padilla dice que este método podría ayudar a desarrollar antenas de comunicaciones planas para los lados de los edificios que pueden reconfigurarse rápidamente para llegar mejor a los usuarios cercanos. Pero dice que también podría usarse en una amplia gama de aplicaciones que recopilan información de ondas electromagnéticas. Por ejemplo, interpretar rayos X u ondas magnéticas en dispositivos de imágenes médicas o desarrollar hologramas generados por computadora.