• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  •  science >> Ciencia >  >> Astronomía
    La computadora busca en los datos del telescopio evidencia de planetas distantes

    Una joven estrella similar al sol rodeada por su disco de gas y polvo que forma planetas. Crédito:NASA / JPL-Caltech

    Como parte de un esfuerzo por identificar planetas distantes acogedores para la vida, La NASA ha establecido un proyecto de crowdsourcing en el que los voluntarios buscan imágenes telescópicas en busca de evidencia de discos de escombros alrededor de las estrellas. que son buenos indicadores de exoplanetas.

    Usando los resultados de ese proyecto, Los investigadores del MIT ahora han entrenado un sistema de aprendizaje automático para buscar los discos de desechos. La escala de la búsqueda exige automatización:hay casi 750 millones de posibles fuentes de luz en los datos acumulados solo a través de la misión Wide-Field Infrared Survey Explorer (WISE) de la NASA.

    En pruebas, el sistema de aprendizaje automático estuvo de acuerdo con las identificaciones humanas de los discos de desechos el 97 por ciento de las veces. Los investigadores también entrenaron su sistema para clasificar los discos de escombros de acuerdo con su probabilidad de contener exoplanetas detectables. En un artículo que describe el nuevo trabajo en la revista. Astronomía y Computación , Los investigadores del MIT informan que su sistema identificó 367 objetos celestes no examinados previamente como candidatos particularmente prometedores para estudios posteriores.

    El trabajo representa un enfoque inusual del aprendizaje automático, que ha sido defendido por uno de los coautores del artículo, Víctor Pankratius, científico investigador principal del Observatorio Haystack del MIT. Típicamente, un sistema de aprendizaje automático examinará una gran cantidad de datos de entrenamiento, buscando correlaciones consistentes entre las características de los datos y alguna etiqueta aplicada por un analista humano; en este caso, estrellas rodeadas de discos de escombros.

    Pero Pankratius sostiene que en las ciencias, Los sistemas de aprendizaje automático serían más útiles si incorporaran explícitamente un poco de conocimiento científico, para ayudar a orientar sus búsquedas de correlaciones o identificar desviaciones de la norma que pudieran ser de interés científico.

    "La visión principal es ir más allá de lo que A.I. se centra hoy en día, "Pankratius dice." Hoy, estamos recopilando datos y estamos tratando de encontrar características en los datos. Terminas con miles de millones de funciones. Entonces, ¿qué estás haciendo con ellos? Lo que quieres saber como científico no es que la computadora te diga que ciertos píxeles son ciertas características. Quieres saber 'oh, esto es algo físicamente relevante, y aquí están los parámetros físicos de la cosa '".

    Concepción del aula

    El nuevo artículo surgió de un seminario del MIT que Pankratius co-enseñó con Sara Seager, el Profesor de la Tierra de la Clase de 1941, Atmosférico, y Ciencias Planetarias, quien es conocida por su investigación de exoplanetas. El seminario, Astroinformática para exoplanetas, introdujo a los estudiantes a técnicas de ciencia de datos que podrían ser útiles para interpretar la avalancha de datos generados por nuevos instrumentos astronómicos. Después de dominar las técnicas, se pidió a los estudiantes que los aplicaran a cuestiones astronómicas sobresalientes.

    Para su proyecto final, Tam Nguyen, un estudiante de posgrado en aeronáutica y astronáutica, eligió el problema de entrenar un sistema de aprendizaje automático para identificar los discos de desechos, y el nuevo artículo es una consecuencia de ese trabajo. Nguyen es el primer autor del artículo, y ella se une a Seager, Pankratius, y Laura Eckman, una licenciatura con especialización en ingeniería eléctrica e informática.

    Del proyecto de crowdsourcing de la NASA, los investigadores tenían las coordenadas celestes de las fuentes de luz que los voluntarios humanos habían identificado como discos de escombros. Los discos son reconocibles como elipses de luz con elipses ligeramente más brillantes en sus centros. Los investigadores también utilizaron los datos astronómicos sin procesar generados por la misión WISE.

    Para preparar los datos para el sistema de aprendizaje automático, Nguyen lo cortó en pequeños trozos, luego utilizó técnicas estándar de procesamiento de señales para filtrar los artefactos causados ​​por los instrumentos de imagen o por la luz ambiental. Próximo, ella identificó esos trozos con fuentes de luz en sus centros, y utilizó algoritmos de segmentación de imágenes existentes para eliminar cualquier fuente de luz adicional. Este tipo de procedimientos son típicos en cualquier proyecto de aprendizaje automático de visión por computadora.

    Intuiciones codificadas

    Pero Nguyen usó principios básicos de física para podar aún más los datos. Por una cosa, observó la variación en la intensidad de la luz emitida por las fuentes de luz en cuatro bandas de frecuencia diferentes. También usó métricas estándar para evaluar el puesto, simetría, y escala de las fuentes de luz, estableciendo umbrales para su inclusión en su conjunto de datos.

    Además de los discos de desechos etiquetados del proyecto de crowdsourcing de la NASA, los investigadores también tenían una breve lista de estrellas que los astrónomos habían identificado como probablemente albergando exoplanetas. De esa información, su sistema también infirió características de los discos de escombros que se correlacionaron con la presencia de exoplanetas, para seleccionar los 367 candidatos para estudios posteriores.

    "Dados los desafíos de escalabilidad con big data, Aprovechar el crowdsourcing y la ciencia ciudadana para desarrollar conjuntos de datos de entrenamiento para clasificadores de aprendizaje automático para observaciones astronómicas y objetos asociados es una forma innovadora de abordar desafíos no solo en astronomía sino también en varias áreas científicas de uso intensivo de datos. "dice Dan Crichton, quien dirige el Centro de Ciencia y Tecnología de Datos en el Laboratorio de Propulsión a Chorro de NAASA. "El uso del proceso de descubrimiento asistido por computadora descrito para automatizar la extracción, clasificación, y el proceso de validación será útil para sistematizar cómo se pueden combinar estas capacidades. El documento hace un buen trabajo al discutir la efectividad de este enfoque aplicado a los candidatos a discos de desecho. Las lecciones aprendidas van a ser importantes para generalizar las técnicas a otras aplicaciones de astronomía y diferentes disciplinas ".

    "El equipo científico de Disk Detective ha estado trabajando en su propio proyecto de aprendizaje automático, y ahora que este periódico está publicado, vamos a tener que juntarnos y comparar notas, "dice Marc Kuchner, un astrofísico senior en el Goddard Space Flight Center de la NASA y líder del proyecto de detección de discos de crowdsourcing conocido como Disk Detective. "Estoy muy contento de que Nguyen esté investigando esto porque realmente creo que este tipo de cooperación máquina-humano será crucial para analizar los grandes conjuntos de datos del futuro".

    Esta historia se vuelve a publicar por cortesía de MIT News (web.mit.edu/newsoffice/), un sitio popular que cubre noticias sobre la investigación del MIT, innovación y docencia.




    © Ciencia https://es.scienceaq.com