Una representación de la proyección semántica, que puede determinar la similitud entre dos palabras en un contexto específico. Esta cuadrícula muestra qué tan similares son ciertos animales en función de su tamaño. Crédito:Idan Blank/UCLA
En "A través del espejo", Humpty Dumpty dice con desdén:"Cuando uso una palabra, significa exactamente lo que elijo que signifique, ni más ni menos". Alice responde:"La pregunta es si puedes hacer que las palabras signifiquen tantas cosas diferentes".
El estudio de lo que las palabras realmente significan es muy antiguo. La mente humana debe analizar una red de información detallada y flexible y usar un sofisticado sentido común para percibir su significado.
Ahora, ha surgido un problema más nuevo relacionado con el significado de las palabras:los científicos están estudiando si la inteligencia artificial puede imitar la mente humana para comprender las palabras de la forma en que lo hacen las personas. Un nuevo estudio realizado por investigadores de UCLA, MIT y los Institutos Nacionales de Salud aborda esa pregunta.
El artículo, publicado en la revista Nature Human Behaviour , informa que los sistemas de inteligencia artificial pueden aprender significados de palabras muy complicados, y los científicos descubrieron un truco simple para extraer ese conocimiento complejo. Descubrieron que el sistema de inteligencia artificial que estudiaron representa los significados de las palabras de una manera que se correlaciona fuertemente con el juicio humano.
El sistema de inteligencia artificial que investigaron los autores se ha utilizado con frecuencia en la última década para estudiar el significado de las palabras. Aprende a descifrar los significados de las palabras "leyendo" cantidades astronómicas de contenido en Internet, que abarca decenas de miles de millones de palabras.
Cuando las palabras aparecen juntas con frecuencia (por ejemplo, "mesa" y "silla"), el sistema aprende que sus significados están relacionados. Y si pares de palabras aparecen juntas muy raramente, como "mesa" y "planeta", aprende que tienen significados muy diferentes.
Ese enfoque parece un punto de partida lógico, pero considere qué tan bien los humanos entenderían el mundo si la única forma de entender el significado fuera contar con qué frecuencia las palabras ocurren cerca unas de otras, sin ninguna capacidad de interactuar con otras personas y nuestro entorno.
Idan Blank, profesor asistente de psicología y lingüística de la UCLA y coautor principal del estudio, dijo que los investigadores se propusieron averiguar qué sabe el sistema sobre las palabras que aprende y qué tipo de "sentido común" tiene.
Antes de que comenzara la investigación, dijo Blank, el sistema parecía tener una limitación importante:"En lo que respecta al sistema, cada dos palabras tienen solo un valor numérico que representa cuán similares son".
Por el contrario, el conocimiento humano es mucho más detallado y complejo.
Una cuadrícula que representa algunas de las categorías de palabras analizadas por los investigadores. Los emparejamientos estadísticamente significativos (como "animales" y "peligro" y "animales" y "género" en la primera fila) se indican mediante cuadrados con un borde más grueso. Crédito:Idan Blank/UCLA
"Considere nuestro conocimiento de delfines y caimanes", dijo Blank. "Cuando comparamos los dos en una escala de tamaño, de 'pequeño' a 'grande', son relativamente similares. En cuanto a su inteligencia, son algo diferentes. En cuanto al peligro que representan para nosotros, en una escala de 'seguro' a 'peligroso', difieren mucho. Por lo tanto, el significado de una palabra depende del contexto.
"Queríamos preguntarnos si este sistema realmente conoce estas diferencias sutiles, si su idea de similitud es flexible de la misma manera que lo es para los humanos".
Para averiguarlo, los autores desarrollaron una técnica que denominan "proyección semántica". Uno puede trazar una línea entre las representaciones del modelo de las palabras "grande" y "pequeño", por ejemplo, y ver dónde caen las representaciones de diferentes animales en esa línea.
Usando ese método, los científicos estudiaron 52 grupos de palabras para ver si el sistema podía aprender a ordenar los significados, como juzgar a los animales por su tamaño o cuán peligrosos son para los humanos, o clasificar los estados de EE. UU. por clima o riqueza general.
Entre las otras agrupaciones de palabras había términos relacionados con la ropa, las profesiones, los deportes, las criaturas mitológicas y los nombres de pila. A cada categoría se le asignaron múltiples contextos o dimensiones:tamaño, peligro, inteligencia, edad y velocidad, por ejemplo.
Los investigadores encontraron que, a través de esos muchos objetos y contextos, su método demostró ser muy similar a la intuición humana. (Para hacer esa comparación, los investigadores también pidieron a cohortes de 25 personas cada una que hiciera evaluaciones similares sobre cada uno de los 52 grupos de palabras).
Sorprendentemente, el sistema aprendió a percibir que los nombres "Betty" y "George" son similares en términos de ser relativamente "antiguos", pero que representan diferentes géneros. Y que el "levantamiento de pesas" y la "esgrima" son similares en el sentido de que ambos suelen tener lugar en interiores, pero difieren en cuanto a la cantidad de inteligencia que requieren.
"Es un método maravillosamente simple y completamente intuitivo", dijo Blank. "La línea entre 'grande' y 'pequeño' es como una escala mental, y ponemos a los animales en esa escala".
Blank dijo que en realidad no esperaba que la técnica funcionara, pero que estaba encantado cuando lo hizo.
“Resulta que este sistema de aprendizaje automático es mucho más inteligente de lo que pensábamos; contiene formas de conocimiento muy complejas, y este conocimiento está organizado en una estructura muy intuitiva”, dijo. "Solo haciendo un seguimiento de qué palabras coexisten entre sí en el idioma, puedes aprender mucho sobre el mundo".
Los coautores del estudio son la neurocientífica cognitiva del MIT Evelina Fedorenko, el estudiante graduado del MIT Gabriel Grand y Francisco Pereira, quien dirige el equipo de aprendizaje automático en el Instituto Nacional de Salud Mental de los Institutos Nacionales de Salud.