Crédito:incorpoiedqa.org
Mmm, había una vez, Nos impresionó que este fenómeno de búsqueda llamado Google pudiera responder preguntas instantáneamente y eso es simplemente escribiendo palabras en una barra espaciadora. Mirabile dictu si preguntaras dónde está Miani, Google respondería, ¿Quiso decir Miami?
La escena de preguntas y respuestas ha crecido a pasos agigantados y ahora los científicos están trabajando en otro nivel donde los sistemas inteligentes ven, plan, y razonar la respuesta.
Respuesta a preguntas incorporadas es el nombre de un proyecto y el título de un artículo sobre arXiv. Los seis autores, con afiliaciones al Georgia Institute of Technology y Facebook AI Research, describen su trabajo que abarca una variedad de habilidades de inteligencia artificial.
EmbodiedQA, como se le llama, agentes de tareas con la navegación de entornos ricos en 3-D con el fin de responder preguntas. Will Knight, Revisión de tecnología del MIT , se refirió a este "desafío de búsqueda del tesoro".
Estos agentes deben aprender conjuntamente la comprensión del lenguaje, razonamiento visual, y navegación basada en objetivos para tener éxito.
De qué se trata:un agente se genera en una ubicación aleatoria en un entorno 3-D. Al agente se le hace una pregunta ("¿De qué color es el coche?"). Para obtener la respuesta el agente debe navegar para explorar el entorno, recopilar información a través de una "visión en primera persona (egocéntrica), "y luego responder.
El equipo desarrolló un conjunto de datos de preguntas y respuestas en entornos House3D. (Puede obtener más información sobre House3D, un entorno virtual 3-D, en GitHub).
Su artículo entra en más detalles sobre los tipos de preguntas y las plantillas en el conjunto de datos de EQA. ubicación:¿Qué habitación? ¿De qué color es el objeto? Lo que esta arriba, debajo, junto a, ¿el objeto? Existencia:¿Hay algún objeto en la habitación? ¿Cuantos? ¿Está el Objeto 1 más cerca del Objeto 2 que el Objeto 3?
Las preguntas evalúan habilidades:detección de objetos, reconocimiento de escena, contando, razonamiento espacial, reconocimiento de color y lógica.
También, los autores dijeron que "EQA se puede ampliar fácilmente para incluir nuevas operaciones elementales, tipos de preguntas, y plantillas según sea necesario para aumentar la dificultad de la tarea para que coincida con el desarrollo ".
Los autores enfatizaron que EQA no es un conjunto de datos estáticos. Bastante, es una prueba para "un plan de estudios de capacidades que nos gustaría lograr en agentes comunicantes encarnados".
Por qué esto importa: Empresa rápida tomó nota de que este proyecto de Facebook y Georgia Tech en realidad está entrenando sistemas de inteligencia artificial para analizar preguntas de lenguaje natural y encontrar objetos específicos.
Por qué esto importa a Will Knight en Revisión de tecnología del MIT :"Imagínese pedirle a un Roomba que vaya a aspirar el dormitorio. Incluso si la máquina pudiera entender su voz y ver su entorno, no tiene idea de lo que es un dormitorio, o dónde se puede encontrar. Pero los robots domésticos del futuro podrían usar software de inteligencia artificial que haya aprendido hechos tan simples sobre hogares comunes al explorar primero muchos hogares virtuales ".
¿Cómo lo hicieron los investigadores? Daniel Terdiman en Empresa rápida escribió que el equipo "utilizó numerosos tipos de aprendizaje automático para entrenar a los bots a responder preguntas sobre el hogar virtual".
"Aprender" es una parte importante de lo que logró el equipo. El agente aprendió lo que Knight llamó "una forma rudimentaria de sentido común". Con ensayo y error, descubrió los mejores lugares para buscar el objeto en cuestión. Quizás, por ejemplo, el agente se entera de que los coches suelen encontrarse en el garaje. Puede darse cuenta de que los garajes están por la puerta delantera o trasera.
© 2018 Tech Xplore