• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  •  Science >> Ciencia >  >> Física
    Preguntas y respuestas:un experto explica la física de la IA
    Aprendizaje de acciones a partir de datos. Observamos un sistema físico de grados de libertad que interactúan (puntos grises), cuyas interacciones precisas se desconocen (áreas sombreadas). Entrenamos una red neuronal sobre las mediciones del sistema. La red aprende de forma no supervisada una estimación de la distribución de los datos de entrenamiento. Extraemos la acción de los parámetros de la red capa a capa, utilizando un lenguaje esquemático. Los coeficientes de acción final A (k) representan las interacciones aprendidas (nodos rosas). Crédito:Revisión física X (2023). DOI:10.1103/PhysRevX.13.041033

    El desarrollo de una nueva teoría suele asociarse con los grandes de la física. Podríamos pensar en Isaac Newton o Albert Einstein, por ejemplo. Ya se han concedido muchos premios Nobel por nuevas teorías.



    Los investigadores del Forschungszentrum Jülich han programado una inteligencia artificial que también ha logrado esta hazaña. Su IA es capaz de reconocer patrones en conjuntos de datos complejos y formularlos en una teoría física. Los hallazgos se publican en la revista Physical Review X. .

    En la siguiente entrevista, el Prof. Moritz Helias del Instituto de Simulación Avanzada (IAS-6) del Forschungszentrum Jülich explica en qué consiste la "física de la IA" y en qué medida se diferencia de los enfoques convencionales.

    ¿Cómo se les ocurre a los físicos una nueva teoría?

    Generalmente se comienza con observaciones del sistema antes de intentar proponer cómo interactúan entre sí los diferentes componentes del sistema para explicar el comportamiento observado. A partir de ahí se derivan nuevas predicciones que se ponen a prueba.

    Un ejemplo bien conocido es la ley de gravitación de Isaac Newton. No solo describe la fuerza gravitacional en la Tierra, sino que también puede usarse para predecir los movimientos de planetas, lunas y cometas, así como las órbitas de los satélites modernos, con bastante precisión.

    Sin embargo, la forma en que se alcanzan tales hipótesis siempre difiere. Puede comenzar con principios generales y ecuaciones básicas de la física y derivar hipótesis a partir de ellos, o puede elegir un enfoque fenomenológico, limitándose a describir las observaciones con la mayor precisión posible sin explicar sus causas. La dificultad radica en seleccionar un buen enfoque entre los numerosos enfoques posibles, adaptarlo si es necesario y simplificarlo.

    ¿Qué enfoque está adoptando con la IA?

    En general, se trata de un enfoque conocido como "física para el aprendizaje automático". En nuestro grupo de trabajo, utilizamos métodos de la física para analizar y comprender la compleja función de una IA.

    La nueva idea crucial desarrollada por Claudia Merger de nuestro grupo de investigación fue utilizar primero una red neuronal que aprende a mapear con precisión el comportamiento complejo observado en un sistema más simple. En otras palabras, la IA tiene como objetivo simplificar todas las interacciones complejas que observamos entre los componentes del sistema. Luego utilizamos el sistema simplificado y creamos un mapeo inverso con la IA entrenada. Volviendo del sistema simplificado al complejo, desarrollamos la nueva teoría.

    En el camino de regreso, las interacciones complejas se construyen pieza por pieza a partir de las simplificadas. En última instancia, el enfoque no es tan diferente del de un físico, con la diferencia de que la forma en que se ensamblan las interacciones ahora se lee a partir de los parámetros de la IA. Esta perspectiva del mundo (que lo explica a partir de interacciones entre sus diversas partes que siguen ciertas leyes) es la base de la física, de ahí el término "física de la IA".

    ¿En qué aplicaciones se utilizó la IA?

    Utilizamos, por ejemplo, un conjunto de datos de imágenes en blanco y negro con números escritos a mano, que se utiliza a menudo en la investigación cuando se trabaja con redes neuronales. Como parte de su tesis doctoral, Claudia Merger investigó cómo las pequeñas subestructuras de las imágenes, como los bordes de los números, se forman a partir de interacciones entre píxeles. Se encuentran grupos de píxeles que tienden a ser más brillantes juntos y, por lo tanto, contribuyen a la forma del borde del número.

    ¿Qué tan alto es el esfuerzo computacional?

    El uso de la IA es un truco que, en primer lugar, hace posibles los cálculos. Se llega muy rápidamente a un gran número de interacciones posibles. Sin utilizar este truco, sólo se podrían observar sistemas muy pequeños. Sin embargo, el esfuerzo computacional involucrado sigue siendo alto, lo que se debe al hecho de que existen muchas interacciones posibles incluso en sistemas con muchos componentes.

    Sin embargo, podemos parametrizar eficientemente estas interacciones de modo que ahora podamos ver sistemas con alrededor de 1000 componentes que interactúan, es decir, áreas de imagen con hasta 1000 píxeles. En el futuro, gracias a una mayor optimización, también deberían ser posibles sistemas mucho más grandes.

    ¿En qué se diferencia este enfoque de otras IA como ChatGPT?

    Muchas IA tienen como objetivo aprender una teoría de los datos utilizados para entrenar la IA. Sin embargo, las teorías que aprenden las IA normalmente no se pueden interpretar. En cambio, están implícitamente ocultos en los parámetros de la IA entrenada. Por el contrario, nuestro enfoque extrae la teoría aprendida y la formula en el lenguaje de las interacciones entre los componentes del sistema, que subyace a la física.

    Por tanto, pertenece al campo de la IA explicable, específicamente a la "física de la IA", ya que utilizamos el lenguaje de la física para explicar lo que la IA ha aprendido. Podemos utilizar el lenguaje de las interacciones para construir un puente entre el complejo funcionamiento interno de la IA y las teorías que los humanos pueden entender.

    Más información: Claudia Merger et al, Aprendizaje de teorías de interacción a partir de datos, Revisión física X (2023). DOI:10.1103/PhysRevX.13.041033

    Proporcionado por Forschungszentrum Juelich




    © Ciencia https://es.scienceaq.com