• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  • Un estudio muestra que los métodos de aprendizaje automático ampliamente utilizados no funcionan como se afirma

    La IA servirá para desarrollar un sistema de control de red que no solo detecta y reacciona ante problemas, sino que también puede predecirlos y evitarlos. Crédito:CC0 Public Domain

    Los modelos y algoritmos para analizar redes complejas son muy utilizados en la investigación y afectan a la sociedad en general a través de sus aplicaciones en las redes sociales online. los motores de búsqueda, y sistemas de recomendación. Según un nuevo estudio, sin embargo, Un enfoque algorítmico ampliamente utilizado para modelar estas redes es fundamentalmente defectuoso, no capturar propiedades importantes de redes complejas del mundo real.

    "No es que estas técnicas te estén dando una basura absoluta. Probablemente contengan algo de información, pero no tanta información como muchas personas creen, "dijo C." Sesh "Seshadhri, profesor asociado de ciencias de la computación e ingeniería en la Escuela de Ingeniería Baskin de UC Santa Cruz.

    Seshadhri es el primer autor de un artículo sobre los nuevos hallazgos publicado el 2 de marzo en procedimientos de la Academia Nacional de Ciencias . El estudio evaluó técnicas conocidas como "incrustaciones de baja dimensión, "que se utilizan habitualmente como entrada para los modelos de aprendizaje automático. Esta es un área activa de investigación, con nuevos métodos de inclusión que se están desarrollando a un ritmo rápido. Pero Seshadhri y sus coautores dicen que todos estos métodos comparten las mismas deficiencias.

    Para explicar por qué Seshadhri usó el ejemplo de una red social, un tipo familiar de red compleja. Muchas empresas aplican el aprendizaje automático a los datos de las redes sociales para generar predicciones sobre el comportamiento de las personas, recomendaciones para los usuarios, etcétera. Las técnicas de incrustación esencialmente convierten la posición de una persona en una red social en un conjunto de coordenadas para un punto en un espacio geométrico, produciendo una lista de números para cada persona que se puede conectar a un algoritmo.

    "Eso es importante porque algo abstracto como la posición de una persona en una red social se puede convertir en una lista concreta de números. Otra cosa importante es que desea convertir esto en un espacio de baja dimensión, de modo que la lista de números que representan a cada persona sea relativamente pequeña, "Seshadhri explicó.

    Una vez realizada esta conversión, el sistema ignora la red social real y hace predicciones basadas en las relaciones entre puntos en el espacio. Por ejemplo, si muchas personas cercanas a usted en ese espacio están comprando un producto en particular, el sistema puede predecir que es probable que compre el mismo producto.

    Seshadhri y sus coautores demostraron matemáticamente que en este proceso de integración se pierden aspectos estructurales significativos de redes complejas. También confirmaron este resultado empíricamente probando varias técnicas de incrustación en diferentes tipos de redes complejas.

    "No estamos diciendo que ciertos métodos específicos fallan. Estamos diciendo que cualquier método de incrustación que le proporcione una pequeña lista de números va a fallar fundamentalmente, porque una geometría de baja dimensión no es lo suficientemente expresiva para las redes sociales y otras redes complejas, "Dijo Seshadhri.

    Una característica crucial de las redes sociales del mundo real es la densidad de triángulos, o conexiones entre tres personas.

    "Donde tienes muchos triángulos, significa que hay mucha estructura comunitaria en esa parte de una red social, "Seshadhri dijo." Además, estos triángulos son aún más significativos cuando se mira a personas que tienen redes sociales limitadas. En una red social típica, algunas personas tienen toneladas de conexiones, pero la mayoría de la gente no tiene muchas conexiones ".

    En su análisis de las técnicas de incrustación, los investigadores observaron que muchos de los triángulos sociales que representan la estructura de la comunidad se pierden en el proceso de integración. "Toda esta información parece desaparecer, por lo que es casi como si lo que querías encontrar se hubiera perdido cuando construyes estas representaciones geométricas, "Dijo Seshadhri.

    Las incrustaciones de baja dimensión no son de ninguna manera los únicos métodos que se utilizan para generar predicciones y recomendaciones. Por lo general, son solo una de las muchas entradas en un modelo de aprendizaje automático muy grande y complejo.

    "Este modelo es una enorme caja negra, y muchos de los resultados positivos que se informan dicen que si incluye estas incrustaciones de baja dimensión, tu rendimiento sube, tal vez tengas un ligero golpe. Pero si lo usaste solo, parece que te faltarían mucho, "Dijo Seshadhri.

    También señaló que los nuevos métodos de incrustación se están comparando principalmente con otros métodos de incrustación. Trabajo empírico reciente de otros investigadores, sin embargo, muestra que diferentes técnicas pueden dar mejores resultados para tareas específicas.

    "Digamos que quiere predecir quién es republicano y quién es demócrata. Hay técnicas desarrolladas específicamente para esa tarea que funcionan mejor que las incrustaciones, ", dijo." La afirmación es que estas técnicas de integración funcionan para muchas tareas diferentes, y es por eso que mucha gente los ha adoptado. También es muy fácil conectarlos a un sistema de aprendizaje automático existente. Pero para cualquier tarea en particular, resulta que siempre hay algo mejor que puedes hacer ".

    Dada la creciente influencia del aprendizaje automático en nuestra sociedad, Seshadhri dijo que es importante investigar si las suposiciones subyacentes detrás de los modelos son válidas.

    "Tenemos todas estas máquinas complicadas que hacen cosas que afectan nuestras vidas de manera significativa. Nuestro mensaje es simplemente que debemos ser más cuidadosos al evaluar estas técnicas, ", dijo." Especialmente en esta época en que el aprendizaje automático se está volviendo cada vez más complicado, es importante tener cierta comprensión de lo que se puede y no se puede hacer ".


    © Ciencia https://es.scienceaq.com