• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  • La investigación del aprendizaje automático puede ayudar a muchas industrias

    Crédito:CC0 Public Domain

    Correos electrónicos no deseados, Fraude bancario, diabetes, trabajadores que renuncian a sus trabajos. ¿Qué tienen estos temas en común? La respuesta se puede encontrar en la investigación de aprendizaje automático en la Universidad de Binghamton.

    Dana Bani-Hani, un estudiante de doctorado que estudia ingeniería industrial y de sistemas, ha pasado los últimos años enseñando a las máquinas a leer conjuntos de datos en cualquier industria. El sistema que ella codificó, denominado Oracle de red neuronal de regresión general recursiva (R-GRNN Oracle), toma entradas de datos y crea salidas de predicción.

    Los modelos de regresión no son nuevos en la ciencia y el análisis de datos, pero lo que creó Bani-Hani va más allá de lo básico. Un sistema típico usa algoritmos, llamados clasificadores, que se ejecutan a través de un conjunto de datos de muchas variables diferentes para crear una predicción. Los oráculos se crean para ejecutar varios conjuntos de estos clasificadores para ver qué algoritmo crea la predicción más precisa.

    Por ejemplo, un clasificador puede ver una gran cantidad de correos electrónicos y tener en cuenta el uso de ciertas palabras, recuento de palabras y varias otras variables para determinar si el correo electrónico es spam. Un oráculo observa las diferentes salidas del clasificador y determina cuál predijo con mayor precisión los correos electrónicos no deseados.

    Lo que distingue a Oracle R-GRNN de otros oráculos es su capacidad para tomar los resultados del clasificador y clasificarlos en función de su precisión. Según el ranking, los clasificadores reciben pesos y se combinan para producir una predicción superior a cualquier clasificador por sí solo.

    Piense en este proceso como una orquesta. Cada instrumento tiene sus propias fortalezas, al igual que diferentes clasificadores, por lo que es útil incluirlos todos. El conductor, como el Oracle R-GRNN, dirige los diferentes instrumentos para que se toquen en voz alta o más suave en función de cómo el instrumento hace que suene la sinfonía final.

    En este punto, el sistema se llamaría Red neuronal de regresión general (GRNN), que se ha creado antes en la Universidad de Binghamton. El verdadero quid del trabajo de Bani-Hani se encuentra en la primera letra, R, representando la recursividad.

    El R-GRNN Oracle toma la salida GRNN original, y utiliza todo ese sistema como entrada para otra predicción GRNN. Esto se combina con el más exitoso de los clasificadores originales.

    Entonces, de vuelta a la orquesta:se graba la sinfonía original, y luego se vuelve a reproducir más tarde. Esta vez, junto con la grabación, algunos instrumentos vuelven a tocar para afinar aún más los importantes sonidos de la orquesta.

    "Debido a la forma en que funciona [el GRNN], Pude crear el modelo recursivo, ", Dice Bani-Hani." El concepto de recursividad no se utiliza mucho en el aprendizaje automático, así que decidí poner un oráculo dentro de un oráculo ".

    Mohammad Khasawneh, profesor y director de departamento de ciencia de sistemas e ingeniería industrial, supervisó la investigación de Bani-Hani. Él dice que los sistemas como el GRNN y el R-GRNN están infrautilizados y son vitales en eventos de vida graves.

    "El tradicional GRNN Oracle ha recibido una atención limitada en la literatura, ya que solo unos pocos investigadores han publicado trabajos sobre el algoritmo, ", Dice Khasawneh." Pero muchos problemas de la vida real que aplican modelos de aprendizaje automático para automatizar la clasificación de observaciones desconocidas requieren predicciones precisas. Tareas como el diagnóstico de enfermedades implican precisión para evitar problemas graves que potencialmente podrían conducir a problemas como demandas o incluso muertes ".

    Bani-Hani dice que el R-GRNN Oracle produce predicciones más precisas que cualquier clasificador por sí solo, así como un GRNN por sí solo. El R-GRNN Oracle tomó miles de muestras de correo electrónico, programado para factorizar 57 variables, y luego produjo una predicción de spam superior a todos los demás clasificadores probados.

    Bani-Hani también usó el R-GRNN para predecir el fraude en aplicaciones de tarjetas de crédito, diagnóstico de diabetes y si un trabajador dejará de fumar basándose en experiencias pasadas en el lugar de trabajo. En cada caso, el R-GRNN resultó ser el predictor más preciso.

    Ella planea enfocar su modelo en campos específicos, como negocios o finanzas, así como empaquetar tanto el GRNN Oracle como el R-GRNN Oracle para que las empresas no tengan que crear todo el código desde cero.

    El viaje de Bani-Hani hacia la investigación del aprendizaje automático comenzó casi 6, 000 millas de Binghamton en Jordania. Después de completar su licenciatura en ingeniería arquitectónica, se enteró de la Universidad de Binghamton a través de los profesores y líderes académicos de Watson School, y de las sugerencias de apoyo de su padre. Inicialmente cursó una maestría en ingeniería industrial, pero pronto encontró una nueva pasión:la minería de datos y el aprendizaje automático.

    "Obtener un doctorado ha sido un sueño para mí durante los últimos 15 años, "Dice Bani-Hani." Principalmente lo atribuyo a tener una familia con títulos avanzados. Estoy agradecido con mis profesores aquí en la Universidad de Binghamton por presentarme los temas que conforman mi investigación ".


    © Ciencia https://es.scienceaq.com