• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  • Un nuevo estudio explora el humor en las incrustaciones de palabras

    Representación de los clusters identificados por los investigadores. Crédito:Gultchin et al.

    Los avances en el campo de la IA han permitido el desarrollo de herramientas que pueden comprender una variedad de idiomas y comunicarse con los humanos. Sin embargo, todavía hay aspectos de la comunicación humana con los que los sistemas de inteligencia artificial luchan, uno de los cuales es el humor.

    Un equipo de investigadores de la Universidad de Oxford, Microsoft Research y TRASH han llevado a cabo recientemente un estudio que investiga el humor en las incrustaciones de palabras. Las incrustaciones de palabras son una herramienta de inteligencia artificial popular que puede asociar palabras con vectores euclidianos.

    "Estábamos interesados ​​en estudiar cómo las computadoras pueden entender el humor, "Adam Kalai, Investigador de Microsoft que realizó el estudio, dijo a TechXplore. "Si bien la IA es bastante poderosa e incluso puede traducir de un idioma a otro, La IA no ha logrado comprender el humor. Decidimos probar si la IA podía entender el humor al nivel de una palabra individual, ya que muchas personas encuentran algunas palabras como 'nincompoop' un poco divertidas ".

    En su estudio, Kalai y sus colegas consideraron seis características principales del humor verbal, inspirándose en teorías existentes y discusiones académicas sobre el humor. Estas características incluyen:sonidos humorísticos (independientemente del significado), yuxtaposiciones / incongruencia inesperada, connotaciones sexuales, connotaciones escatológicas, palabras insultantes y palabras coloquiales.

    Los investigadores investigaron hasta qué punto estas características se correlacionan con el humor y qué tan bien se incorpora word2vec previamente entrenado en un corpus de Google News, llamado GNEWS, podría capturar cada uno de estos. Un conjunto de datos utilizado en su estudio fue el conjunto de datos Engelthaler-Hill (EH), que consta de calificaciones de humor medio para 4, 997 palabras, cada uno de los cuales fue calificado en una escala de uno a cinco (por aproximadamente 35 evaluadores humanos).

    Para comprender mejor las diferencias en la percepción que tienen las personas de las palabras divertidas, Los investigadores también recopilaron un conjunto de datos original más pequeño de palabras muy divertidas, reclutar personas de habla inglesa para etiquetar estas palabras a través de la plataforma Mechanical Turk de Amazon. Llevaron a cabo una serie de estudios de rating de humor, pedir a los participantes que seleccionen las palabras que les parezcan más divertidas, así como anotar palabras con las teorías de humor relevantes para cada uno.

    Figura que describe la relación entre las características relacionadas con las teorías de las palabras en la incrustación de palabras y sus respectivas calificaciones de humor. Crédito:Gultchin et al.

    "Le pedimos a varias personas que calificaran las palabras que encontraban más divertidas entre las palabras en inglés, "Explicó Kalai." Diseñamos un estudio en el que las personas identificaron las palabras que encontraron más divertidas con el mínimo esfuerzo (la menor cantidad de clics) ".

    Después, los investigadores investigaron cómo las características del humor que habían identificado inicialmente se correlacionaban con las calificaciones del humor en su conjunto de datos, para determinar la efectividad de los constructos teóricos en la captura de calificaciones dadas por humanos. Además, probaron la predictibilidad de estas calificaciones mediante incrustaciones de palabras, explorar hasta qué punto la IA puede entender el humor.

    "Descubrimos que la IA podía entender por qué las personas encontraban algunas palabras más divertidas que otras, y la IA incluso podría comprender las diferencias entre los sentidos del humor, ", Dijo Kalai." La IA todavía no entiende el humor en oraciones o textos más largos, pero esperamos que nuestro trabajo sea un punto de partida ".

    Kalai y sus colegas encontraron que las incrustaciones de palabras capturaban de manera efectiva aspectos del humor de palabras según lo calificado en el conjunto de datos de EH, así como las diferencias en las calificaciones de humor de su nuevo conjunto de datos. Sus hallazgos sugieren además que el sentido del humor de las personas podría incorporarse usando un puñado de calificaciones y que las incorporaciones resultantes podrían usarse para predecir las calificaciones de humor para palabras que no se calificaron previamente.

    "Nuestras conclusiones muestran una aplicación interesante de las incrustaciones de palabras y allanan el camino para explotarlas para hacer más trabajo de humor de IA, como generar o predecir palabras humorísticas que coincidan con los sentidos del humor individuales, y en conjunto, "Limor Gultchin, un investigador de la Universidad de Oxford involucrado en el estudio, dijo a TechXplore. "Al mismo tiempo, también proporcionamos una mayor validación de las nociones intuitivas del humor, y conocimientos acumulados en otros campos, como la psicología o la filosofía ".

    El estudio realizado por Kalai, Gultchin y sus colegas muestran que la inserción de palabras podría mejorar nuestra comprensión del humor de diversas formas. Primeramente, encontraron que las teorías establecidas del humor (por ejemplo, la teoría de la superioridad, teoría de la incongruencia, etc.) se representan en incrustaciones de palabras en diversos grados y, por lo tanto, se pueden usar para identificar o predecir el humor, capturado por calificaciones humanas.

    Tabla que captura las diferencias entre un sentido del humor más "femenino" y un sentido del humor "masculino". Crédito:Gultchin et al.

    Usando representaciones vectoriales de palabras, los investigadores también pudieron definir un sentido del humor individual como un vector promedio, utilizando estos vectores para predecir los sentidos del humor de diferentes personas (es decir, las calificaciones de humor que darían a ciertas palabras). Finalmente, agrupar los sentidos del humor les permitió identificar grupos de humor, como 'humor femenino, '' humor masculino, '' humor antiguo, 'etc.

    Este es un hallazgo importante, ya que valida la idea de que diferentes grupos de personas tienen diferentes sentidos del humor. Por ejemplo, observaron que las palabras sexuales (por ejemplo, 'poppycock') eran más divertidas para los hombres que para las mujeres, mientras que las mujeres reaccionaron más a las palabras 'que sonaban divertidas' (por ejemplo, 'gallardete').

    "En la era de los sistemas de inteligencia artificial predominantes, como sistemas de recomendación o asistentes automáticos, El humor probablemente demostraría ser importante para facilitar una interacción más fluida entre los usuarios y los sistemas automatizados, ", Dijo Gultchin." Esperamos que este trabajo ayude como una prueba de concepto que demuestre que las herramientas de PNL existentes ya pueden ayudarnos a lograr ese objetivo ".

    Kalain, Gultchin y sus colegas pondrán a disposición del público los nuevos conjuntos de datos utilizados en su estudio, para que otros investigadores puedan utilizarlos en sus estudios. Sienten que mejorar la comprensión del humor de palabras de los sistemas de inteligencia artificial podría abrir varias posibilidades interesantes, por ejemplo, conduciendo al desarrollo de herramientas para ayudar a los comediantes o mejorando las interacciones entre las máquinas y los seres humanos.

    "Todavía estamos en el proceso de ver cómo se aceptará este trabajo, pero existen múltiples direcciones futuras, ", Dijo Gultchin." Sería realmente interesante ver si los conceptos aquí expuestos realmente podrían usarse en un sistema interactivo que produzca modificaciones 'divertidas' a las oraciones basadas en el sentido del humor de un individuo, como se representa mediante incrustaciones de palabras. Otra dirección interesante es ver si eventualmente podemos aprender a predecir y generar oraciones llenas de humor o, con desarrollos recientes, párrafos llenos de humor ".

    © 2019 Science X Network




    © Ciencia https://es.scienceaq.com