Los investigadores del MIT están entrenando a un par de redes generativas de confrontación, o GAN, para imitar la tierra, mar, y texturas de nubes vistas en imágenes de satélite con el objetivo de visualizar eventualmente el aumento del nivel del mar en el mundo real. Es uno de los muchos proyectos de investigación de inteligencia artificial que han sido posibles gracias a los créditos en la nube donados por IBM y Google. Crédito:Brandon Leshchinskiy
Las redes neuronales han proporcionado a los investigadores una poderosa herramienta para mirar hacia el futuro y hacer predicciones. Pero un inconveniente es su insaciable necesidad de datos y poder de cómputo ("computación") para procesar toda esa información. En el MIT, Se estima que la demanda de computación es cinco veces mayor que la que puede ofrecer el Instituto. Para ayudar a aliviar el crujido, la industria ha intervenido. Una supercomputadora de 11,6 millones de dólares recientemente donada por IBM se pondrá en línea este otoño, y en el último año, tanto IBM como Google han proporcionado créditos de nube a MIT Quest for Intelligence para su distribución en todo el campus. A continuación se destacan cuatro proyectos posibles gracias a las donaciones en la nube de IBM y Google.
Menor, más rápido, redes neuronales más inteligentes
Para reconocer un gato en una imagen, un modelo de aprendizaje profundo puede necesitar ver millones de fotos antes de que sus neuronas artificiales "aprendan" a identificar a un gato. El proceso es computacionalmente intensivo y conlleva un alto costo ambiental, como ha destacado una nueva investigación que intenta medir la huella de carbono de la inteligencia artificial (IA).
Pero puede haber una forma más eficiente. Una nueva investigación del MIT muestra que los modelos solo se necesitan una fracción del tamaño. "Cuando entrena una red grande, hay una pequeña que podría haber hecho todo, "dice Jonathan Frankle, estudiante de posgrado en el Departamento de Ingeniería Eléctrica e Informática del MIT (EECS).
Con el coautor del estudio y profesor de EECS Michael Carbin, Frankle estima que una red neuronal podría funcionar con una décima parte del número de conexiones si se encuentra la subred correcta desde el principio. Normalmente, las redes neuronales se recortan después del proceso de entrenamiento, con las conexiones irrelevantes eliminadas entonces. ¿Por qué no entrenar el modelo pequeño para empezar? Frankle se preguntó.
Experimentando con una red de dos neuronas en su computadora portátil, Frankle obtuvo resultados alentadores y se trasladó a conjuntos de datos de imágenes más grandes como MNIST y CIFAR-10, pidiendo prestadas GPU donde pudiera. Finalmente, a través de IBM Cloud, aseguró suficiente poder de cómputo para entrenar un modelo ResNet real. "Todo lo que había hecho anteriormente eran experimentos con juguetes, ", dice." Finalmente pude ejecutar docenas de configuraciones diferentes para asegurarme de que podía hacer las afirmaciones en nuestro periódico ".
Frankle habló desde las oficinas de Facebook, donde trabajó durante el verano para explorar las ideas planteadas por su artículo de hipótesis de billetes de lotería, uno de los dos elegidos para el premio al mejor artículo en la Conferencia Internacional de Representaciones del Aprendizaje de este año. Las aplicaciones potenciales para el trabajo van más allá de la clasificación de imágenes, Frankle dice:e incluyen modelos de aprendizaje por refuerzo y procesamiento del lenguaje natural. Ya, investigadores de Facebook AI Research, Universidad de Princeton, y Uber han publicado estudios de seguimiento.
"Lo que me encanta de las redes neuronales es que aún no hemos sentado las bases, "dice Frankle, que recientemente pasó de estudiar criptografía y políticas tecnológicas a IA. "Realmente no entendemos cómo aprende, donde es bueno y donde falla. Esto es física 1, 000 años antes de Newton ".
Distinguir el hecho de las noticias falsas
Las plataformas de redes como Facebook y Twitter han hecho que sea más fácil que nunca encontrar noticias de calidad. Pero con demasiada frecuencia las noticias reales quedan ahogadas por información engañosa o completamente falsa publicada en línea. La confusión por un video reciente de la presidenta de la Cámara de Representantes de Estados Unidos, Nancy Pelosi, manipulado para hacerla parecer borracha, es solo el último ejemplo de la amenaza que la desinformación y las noticias falsas representan para la democracia.
"Ahora puedes publicar casi cualquier cosa en Internet, y algunas personas lo creerán "dice Moin Nadeem, estudiante de último año y especialización en EECS en MIT.
Si la tecnología ayudó a crear el problema, también puede ayudar a solucionarlo. Esa fue la razón por la que Nadeem eligió un proyecto superUROP centrado en construir un sistema automatizado para combatir las noticias falsas y engañosas. Trabajando en el laboratorio de James Glass, investigador del Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT, y supervisado por Mitra Mohtarami, Nadeem ayudó a entrenar un modelo de lenguaje para verificar afirmaciones mediante búsquedas en Wikipedia y tres tipos de fuentes de noticias calificadas por los periodistas como de alta calidad. de calidad mixta o de baja calidad.
Para verificar un reclamo, el modelo mide qué tan cerca están de acuerdo las fuentes, con puntuaciones de acuerdo más altas que indican que la afirmación es probablemente cierta. Una puntuación de desacuerdo alta para un reclamo como, "ISIS se infiltra en los Estados Unidos, "es un fuerte indicador de noticias falsas. Un inconveniente de este método, él dice, es que el modelo no identifica la verdad independiente tanto como describe lo que la mayoría de la gente piensa que es verdad.
Con la ayuda de Google Cloud Platform, Nadeem realizó experimentos y creó un sitio web interactivo que permite a los usuarios evaluar instantáneamente la precisión de un reclamo. Él y sus coautores presentaron sus resultados en la conferencia de la Asociación Norteamericana de Lingüística Computacional (NAACL) en junio y continúan ampliando el trabajo.
"El dicho solía decir que ver para creer, "dice Nadeem, en este video sobre su trabajo. "Pero estamos entrando en un mundo donde eso no es cierto. Si la gente no puede confiar en sus ojos y oídos, se convierte en una cuestión de en qué podemos confiar".
Visualización de un clima cálido
Desde el aumento de los mares hasta el aumento de las sequías, los efectos del cambio climático ya se están sintiendo. Dentro de unas décadas, el mundo será más cálido, secadora, y lugar más impredecible. Brandon Leshchinskiy, estudiante de posgrado en el Departamento de Aeronáutica y Astronáutica del MIT (AeroAstro), está experimentando con redes generativas de confrontación, o GAN, para imaginar cómo será la Tierra entonces.
Las GAN producen imágenes hiperrealistas al enfrentar una red neuronal con otra. La primera red aprende la estructura subyacente de un conjunto de imágenes e intenta reproducirlas, mientras que el segundo decide qué imágenes parecen inverosímiles y le dice a la primera red que vuelva a intentarlo.
Inspirado por investigadores que utilizaron GAN para visualizar proyecciones de aumento del nivel del mar a partir de imágenes de Street View, Leshchinskiy quería ver si las imágenes satelitales podían personalizar de manera similar las proyecciones climáticas. Con su consejero, Profesor de AeroAstro Dava Newman, Leshchinskiy está utilizando créditos gratuitos de IBM Cloud para entrenar a un par de GAN en imágenes de la costa este de EE. UU. Con sus puntos de elevación correspondientes. El objetivo es visualizar cómo las proyecciones de aumento del nivel del mar para 2050 rediseñarán la línea costera. Si el proyecto funciona, Leshinskiy espera utilizar otros conjuntos de datos de la NASA para imaginar la futura acidificación de los océanos y los cambios en la abundancia de fitoplancton.
"Hemos superado el punto de mitigación, ", dice." Visualizar cómo será el mundo dentro de tres décadas puede ayudarnos a adaptarnos al cambio climático ".
Identificar a los deportistas a partir de unos pocos gestos.
Unos pocos movimientos en el campo o la cancha son suficientes para que un modelo de visión por computadora identifique a los atletas individuales. Eso es según una investigación preliminar realizada por un equipo dirigido por Katherine Gallagher, investigador del MIT Quest for Intelligence.
El equipo entrenó modelos de visión por computadora en grabaciones de video de partidos de tenis y partidos de fútbol y baloncesto y descubrió que los modelos podían reconocer a jugadores individuales en solo unos pocos fotogramas de puntos clave de su cuerpo, proporcionando un contorno aproximado de su esqueleto.
El equipo usó una API de Google Cloud para procesar los datos de video, y comparó el rendimiento de sus modelos con los modelos entrenados en la plataforma de inteligencia artificial de Google Cloud. "Esta información de pose es tan distintiva que nuestros modelos pueden identificar a los jugadores con una precisión casi tan buena como los modelos que cuentan con mucha más información, como el color del cabello y la ropa, " ella dice.
Sus resultados son relevantes para la identificación automatizada de jugadores en sistemas de análisis deportivo, y podrían proporcionar una base para futuras investigaciones sobre cómo inferir la fatiga de los jugadores para anticipar cuándo deberían cambiarse los jugadores. La detección automática de posturas también podría ayudar a los atletas a perfeccionar su técnica al permitirles aislar los movimientos precisos asociados con la conducción experta de un golfista o el swing ganador de un jugador de tenis.
Esta historia se vuelve a publicar por cortesía de MIT News (web.mit.edu/newsoffice/), un sitio popular que cubre noticias sobre la investigación del MIT, innovación y docencia.