AI Aristo realiza una prueba científica, emerge superestrella de opción múltiple

Crédito:aristo

Aristo ha pasado un examen de ciencias de octavo grado en Estados Unidos. Si te dicen que Aristo es un niño serio al que le encanta leer todo lo que pueda sobre Faraday y toca la batería, dirás y qué, Vaya cosa.

Aristo aunque, es un programa de inteligencia artificial y a los científicos les gustaría que el mundo supiera que esto es importante, como "punto de referencia en el desarrollo de IA, "como lo llamó Melissa Locker en Empresa rápida .

Queremos decir, solo piensa en ello. Cade Metz, en Los New York Times , ha pensado en ello. "Hace cuatro años, más de 700 informáticos compitieron en un concurso para desarrollar inteligencia artificial que pudiera aprobar una prueba de ciencias de octavo grado. Había $ 80, 000 en premios en metálico en la línea. Todos reprobaron. Incluso el sistema más sofisticado no pudo hacerlo mejor que el 60% en la prueba. La IA no pudo igualar las habilidades de lenguaje y lógica que se espera que tengan los estudiantes cuando ingresan a la escuela secundaria ".

Entonces, ¿quién está detrás de la prueba que en 2019 finalmente impresionó? No es una mala suposición:el Instituto Allen de Inteligencia Artificial, que es supervisado por Oren Etzioni. Su sistema tenía las respuestas correctas para más del 90 por ciento de las preguntas del examen, y no se detiene ahí:el sistema obtuvo más del 80 por ciento de las respuestas correctas en preguntas de opción múltiple que no son de diagrama en un examen de ciencias del grado 12.

Ahora estamos viendo "un progreso significativo en el desarrollo de IA que puede comprender idiomas e imitar la lógica y la toma de decisiones de los humanos, "dijo Metz.

Para la historia directa, debe leer "De 'F' a 'A' en los Exámenes de Ciencias de los Regentes de Nueva York:una descripción general del Proyecto Aristo, "que ahora está en arXiv. Este proyecto fue una misión de seis años para responder exámenes de ciencias de la escuela primaria y secundaria.

Los autores eran muy conscientes de que la IA no había hecho un espectáculo impresionante en el pasado de desempeñarse en los niveles deseados. Con todo el dominio de la IA en Go, Póquer y peligro, ellos dijeron, "la gran variedad de exámenes estandarizados sigue siendo un desafío histórico. Incluso en 2016, el mejor sistema de inteligencia artificial logró apenas el 59,3% en un desafío de examen de ciencias de octavo grado ".

La IA se sometió a pruebas de opción múltiple; el número del 90 por ciento estaba en el no diagrama del examen, preguntas de respuestas múltiples.

Así es como la IA2 describe a su genio no humano:"Aristo combina la lectura automática y la PNL, vinculación textual e inferencia, razonando con incertidumbre, técnicas estadísticas sobre grandes corpora, y comprensión de diagramas para desarrollar la primera "máquina con conocimientos" sobre ciencia ".

El equipo mimó a Aristo por un motivo oculto, menos que ver con darse palmaditas en la espalda y más sobre lo que podrían aprender del comportamiento de Aristo en los exámenes de ciencias, "como estas preguntas ponen a prueba muchas de las habilidades clave necesarias para la inteligencia artificial, " ellos dijeron.

En su papel explicaron más sobre buenas razones para aprovechar los exámenes de ciencias estandarizados.

"Pruebas estandarizadas, en particular los exámenes de ciencias, son un raro ejemplo de un desafío que cumple con estos requisitos. Si bien no es una prueba completa de la inteligencia de las máquinas, exploran varias capacidades fuertemente asociadas con la inteligencia, incluida la comprensión del idioma, razonamiento, y uso de conocimientos de sentido común. Uno de los aspectos más interesantes y atractivos de los exámenes de ciencias es su naturaleza graduada y multifacética; diferentes preguntas exploran diferentes tipos de conocimiento, variando sustancialmente en dificultad. Por esta razón, se han utilizado como una tarea convincente y desafiante para el campo durante muchos años ".

Nuevos derechos de fanfarronear:Aristo, los autores dijeron, es el primer sistema en lograr una puntuación de más del 90 por ciento en el no diagrama, parte de opción múltiple del examen de ciencias de octavo grado de los Regentes de Nueva York.

Stephen Johnson en Gran pensamiento escribió sobre la incapacidad de Aristo para hacer diagramas. Dijo que "el sistema está diseñado solo para interpretar el lenguaje, lo que significa que puede responder preguntas de opción múltiple, pero no los que presentan una ilustración o un gráfico ".

Sin embargo, la actuación mostró que "los métodos modernos de PNL pueden resultar en el dominio de esta tarea".

Para el instituto, La hazaña de Aristo no se toma como una posición en la montaña, sino más bien como un paso en la dirección deseada. Lo llaman un hito "en el largo camino hacia una máquina que tiene un profundo conocimiento de la ciencia y logra el sueño original de Paul Allen de un Aristóteles Digital".

Las actuaciones más bellas de la naturaleza podrían inspirar a la próxima generación de inteligencia artificial

El desafío Deepfake tiene como objetivo encontrar herramientas para luchar contra la manipulación

Electrónica

El coronavirus podría ralentizar los envíos de iPhone de Apple

Un estudio encuentra grandes beneficios al adoptar la tecnología de seguridad de vehículos

Las células solares de próxima generación funcionan mejor cuando hay una cámara alrededor

Ciencia

La UE presenta nuevas protecciones al consumidor tras el escándalo del dieselgate

Luz temprana brillante de LED

La nueva startup Zapata Computing tiene la intención de comercializar software de computación cuántica