• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  • Una IA se enseñó a sí misma a jugar un videojuego y ahora está ganando a los humanos.

    Ilustración de agentes jugando a Capturar la bandera, mostrando una variedad de comportamientos. Crédito:DeepMind

    Desde los primeros días del ajedrez virtual y el solitario, Los videojuegos han sido un campo de juego para el desarrollo de la inteligencia artificial (IA). Cada victoria de la máquina contra el ser humano ha ayudado a que los algoritmos sean más inteligentes y eficientes. Pero para abordar problemas del mundo real, como la automatización de tareas complejas, incluida la conducción y la negociación, estos algoritmos deben navegar por entornos más complejos que los juegos de mesa. y aprender a trabajar en equipo. Enseñar a la IA cómo trabajar e interactuar con otros jugadores para tener éxito había sido una tarea insuperable, hasta ahora.

    En un nuevo estudio, Los investigadores detallaron una forma de entrenar algoritmos de IA para alcanzar niveles humanos de rendimiento en un popular juego multijugador en 3-D, una versión modificada de Quake III Arena en el modo Capture the Flag.

    Aunque la tarea de este juego es sencilla (dos equipos rivales compiten para capturar las banderas del otro navegando por un mapa), ganar exige una toma de decisiones compleja y la capacidad de predecir y responder a las acciones de otros jugadores.

    Esta es la primera vez que una IA ha adquirido habilidades similares a las humanas en un videojuego en primera persona. Entonces, ¿cómo lo hicieron los investigadores?

    La curva de aprendizaje del robot

    En 2019, Se han alcanzado varios hitos en la investigación de la IA en otros juegos de estrategia multijugador. Cinco "bots (jugadores controlados por una IA) derrotaron a un equipo profesional de deportes electrónicos en un juego de DOTA 2. Los jugadores humanos profesionales también fueron derrotados por una IA en un juego de StarCraft II. En todos los casos, se aplicó una forma de aprendizaje por refuerzo, mediante el cual el algoritmo aprende por ensayo y error e interactuando con su entorno.

    • Figura que muestra las tasas de victorias de jugadores humanos contra agentes con demora en la respuesta. Estos son bajos lo que indica que incluso con retrasos de reacción comparables a los humanos, los agentes superan a los jugadores humanos. Crédito:DeepMind

    • Gif que muestra los resultados más recientes de los agentes que juegan en dos mapas completos diferentes de Quake III Arena con diferentes modos de juego. Crédito:DeepMind

    Los cinco bots que vencieron a los humanos en DOTA 2 no aprendieron de los humanos jugando, fueron entrenados exclusivamente jugando partidos contra clones de ellos mismos. La mejora que les permitió derrotar a los jugadores profesionales provino de escalar los algoritmos existentes. Debido a la velocidad de la computadora, la IA podría jugar en unos segundos un juego que toma minutos o incluso horas para que los humanos lo jueguen. Esto permitió a los investigadores entrenar su IA con 45, 000 años de juego en diez meses de tiempo real.

    El bot Capture the Flag del estudio reciente también comenzó a aprender desde cero. Pero en lugar de jugar contra su clon idéntico, Se creó y entrenó una cohorte de 30 bots en paralelo con su propia señal de recompensa interna. Cada bot dentro de esta población jugaría juntos y aprendería unos de otros. Como señala David Silver, uno de los científicos de investigación involucrados, La IA está comenzando a "eliminar las limitaciones del conocimiento humano ... y crear conocimiento en sí mismo".

    Video que muestra visualizaciones de un agente jugando, así como algunos ejemplos de comportamientos prototipo. Crédito:DeepMind

    La velocidad de aprendizaje para los humanos sigue siendo mucho más rápida que los algoritmos de aprendizaje por refuerzo profundo más avanzados. Tanto los bots de OpenAI como AlphaStar de DeepMind (el bot que juega StarCraft II) devoraron miles de años de juego antes de poder alcanzar un nivel humano de rendimiento. Se estima que este tipo de formación cuesta varios millones de dólares. Sin embargo, una IA autodidacta capaz de vencer a los humanos en su propio juego es un avance emocionante que podría cambiar la forma en que vemos las máquinas.

    El futuro de los humanos y las máquinas

    A menudo se representa a la IA reemplazando o complementando las capacidades humanas, pero rara vez como miembro de un equipo de pleno derecho, realizando la misma tarea que los seres humanos. Como estos experimentos de videojuegos implican la colaboración máquina-humano, ofrecen una visión del futuro.

    Cómo jugar CTF, como lo demostraron los agentes. Crédito:DeepMind

    Los jugadores humanos de Capture the Flag calificaron a los bots como más colaborativos que otros humanos, pero los jugadores de DOTA 2 tuvieron una reacción mixta hacia sus compañeros de equipo de IA. Algunos estaban bastante entusiasmados, diciendo que se sintieron apoyados y que aprendieron jugando con ellos. Ella, un jugador profesional de DOTA 2, habló sobre su experiencia al asociarse con bots:"En realidad se sintió bien; [el compañero de equipo de IA] dio su vida por mí en algún momento. Trató de ayudarme, pensando "Estoy seguro de que ella sabe lo que está haciendo" y, obviamente, yo no. Pero, sabes, él creyó en mí. No entiendo mucho con mis compañeros de equipo [humanos] ".

    Otros fueron menos entusiastas, pero como la comunicación es un pilar de cualquier relación, Mejorar la comunicación hombre-máquina será crucial en el futuro. Los investigadores ya han adaptado algunas funciones para que los bots sean más "amigables para los humanos, "como hacer que los bots esperen artificialmente antes de elegir su personaje durante el draft del equipo antes del juego, para evitar presionar a los humanos.

    Un video de ocho agentes jugando el modo de juego one-flag-capture-the-flag juntos en un mapa de Quake III Arena popular entre los jugadores profesionales. Crédito:DeepMind

    Pero, ¿debería la IA aprender de nosotros o seguir aprendiendo por sí misma? El autoaprendizaje sin imitar a los humanos podría enseñar a la IA más eficiencia y creatividad. pero esto podría crear algoritmos más apropiados para tareas que no involucran la colaboración humana, como robots de almacenamiento.

    Por otra parte, se podría argumentar que tener una máquina entrenada a partir de humanos sería más intuitivo:los humanos que usan tal IA podrían entender por qué una máquina hizo lo que hizo. A medida que la IA se vuelve más inteligente, nos espera más sorpresas.

    Este artículo se ha vuelto a publicar de The Conversation con una licencia de Creative Commons. Lea el artículo original.




    © Ciencia https://es.scienceaq.com