• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  •  Science >> Ciencia >  >> Biología
    Los ingenieros desarrollan herramientas innovadoras de software de análisis de microbiomas
    Crédito:CC0 Dominio público

    Desde que se secuenció el primer genoma microbiano en 1995, los científicos han reconstruido la composición genómica de cientos de miles de microorganismos e incluso han ideado métodos para realizar un censo de comunidades bacterianas en la piel, el intestino o el suelo, el agua y otros lugares. en muestras masivas, lo que llevó al surgimiento de un campo de estudio relativamente nuevo conocido como metagenómica.



    Analizar datos metagenómicos puede ser una tarea desalentadora, muy parecida a intentar armar varios rompecabezas enormes con todas las piezas mezcladas. Asumiendo este desafío computacional único, el experto en inteligencia artificial (IA) gráfica de la Universidad Rice, Santiago Segarra, y el biólogo computacional Todd Treangen se unieron para explorar cómo el análisis de datos impulsado por IA podría ayudar a crear nuevas herramientas para potenciar la investigación metagenómica.

    El dúo de científicos se centró en dos tipos de datos que hacen que el análisis metagenómico sea particularmente desafiante (repeticiones y variantes estructurales) y desarrolló herramientas para manejar estos tipos de datos que superan a los métodos actuales.

    Las repeticiones son secuencias de ADN idénticas que ocurren repetidamente tanto en todo el genoma de organismos individuales como en múltiples genomas en una comunidad de organismos.

    "El ADN de una muestra metagenómica de múltiples organismos se puede representar como un gráfico", afirma Segarra, profesor asistente de ingeniería eléctrica e informática.

    "Esencialmente, una de las herramientas que desarrollamos aprovecha la estructura de este gráfico para determinar qué fragmentos de ADN aparecen repetidamente entre microbios o dentro del mismo microorganismo".

    Apodado GraSSRep, el método combina aprendizaje autosupervisado, un proceso de aprendizaje automático en el que un modelo de IA se entrena para distinguir entre entradas ocultas y disponibles, y graficar redes neuronales, sistemas que procesan datos que representan objetos y sus interconexiones como gráficos.

    El documento, también disponible en arXiv servidor de preimpresión, se presentó en la 28.ª sesión de una conferencia internacional anual sobre investigación en biología molecular computacional, RECOMB 2024. El proyecto fue dirigido por el estudiante graduado de Rice y asistente de investigación Ali Azizpour. Advait Balaji, ex alumno de doctorado de Rice, también es autor del estudio.

    Las repeticiones son interesantes porque desempeñan un papel importante en procesos biológicos como la respuesta bacteriana a cambios en su entorno o la interacción de los microbiomas con los organismos huéspedes. Un ejemplo específico de un fenómeno en el que las repeticiones pueden desempeñar un papel es la resistencia a los antibióticos.

    En términos generales, el seguimiento de la historia o la dinámica de las repeticiones en un genoma bacteriano puede arrojar luz sobre las estrategias de adaptación o evolución de los microorganismos. Es más, las repeticiones a veces pueden ser en realidad virus disfrazados o bacteriófagos. De la palabra griega que significa "devorar", los fagos a veces se utilizan para matar bacterias.

    "Estos fagos en realidad aparecen como repeticiones, por lo que se puede rastrear la dinámica bacteria-fago basándose en las repeticiones contenidas en los genomas", dijo Treangen, profesor asociado de ciencias de la computación.

    "Esto podría proporcionar pistas sobre cómo deshacerse de las bacterias difíciles de matar o ofrecer una imagen más clara de cómo estos virus interactúan con una comunidad bacteriana".

    Anteriormente, cuando se utilizaba un enfoque basado en gráficos para llevar a cabo la detección repetida, los investigadores utilizaban especificaciones predefinidas sobre qué buscar en los datos del gráfico. Lo que distingue a GraSSRep de estos enfoques anteriores es la falta de parámetros o referencias predefinidos que informen cómo se procesan los datos.

    "Nuestro método aprende cómo utilizar mejor la estructura del gráfico para detectar repeticiones en lugar de depender de la entrada inicial", dijo Segarra. "El aprendizaje autosupervisado permite que esta herramienta se entrene a sí misma en ausencia de una verdad fundamental que establezca qué es una repetición y qué no. Cuando se maneja una muestra metagenómica, no es necesario saber nada sobre lo que hay en ella". ahí para analizarlo."

    Lo mismo ocurre en el caso de otro método de análisis metagenómico desarrollado conjuntamente por Segarra y Treangen:la detección de variantes estructurales sin referencias en microbiomas mediante gráficos de coensamblaje de lectura larga, o ñandú. Su artículo sobre el ñandú se presentará en la conferencia anual de la Sociedad Internacional de Biología Computacional, que tendrá lugar del 12 al 16 de julio en Montreal.

    La autora principal del artículo es Kristen Curry, alumna de doctorado en informática de Rice, quien se unirá al laboratorio de Rayan Chikhi, también coautor del artículo, en el Instituto Pasteur de París como científica postdoctoral. Una versión del artículo está disponible en bioRxiv. servidor de preimpresión.

    Mientras que GraSSRep está diseñado para lidiar con repeticiones, el ñandú maneja variantes estructurales, que son alteraciones genómicas de 10 pares de bases o más que son relevantes para la medicina y la biología molecular debido a su papel en diversas enfermedades, la regulación de la expresión genética, la dinámica evolutiva y la promoción de la diversidad genética. dentro de las poblaciones y entre las especies.

    "Identificar variantes estructurales en genomas aislados es relativamente sencillo, pero es más difícil hacerlo en metagenomas donde no existe un genoma de referencia claro para ayudar a categorizar los datos", dijo Treangen.

    Actualmente, uno de los métodos más utilizados para procesar datos metagenómicos es a través de genomas ensamblados en metagenomas o MAG.

    "Estos ensambladores de novo o guiados por referencia son herramientas bastante bien establecidas que implican todo un proceso operativo con detección repetida o identificación de variantes estructurales como sólo algunas de sus funcionalidades", afirmó Segarra.

    "Una cosa que estamos estudiando es reemplazar los algoritmos existentes con los nuestros y ver cómo eso puede mejorar el rendimiento de estos ensambladores metagenómicos muy utilizados".

    Rhea no necesita genomas de referencia ni MAG para detectar variantes estructurales, y superó a los métodos que se basan en dichos parámetros preespecificados cuando se probó contra dos metagenomas simulados.

    "Esto fue particularmente notable porque obtuvimos una lectura mucho más granular de los datos que cuando utilizamos genomas de referencia", dijo Segarra.

    "La otra cosa que estamos investigando actualmente es aplicar la herramienta a conjuntos de datos del mundo real y ver cómo los resultados se relacionan con los procesos biológicos y qué conocimientos esto podría brindarnos".

    Treangen dijo que GraSSRep y rhea combinados, basándose en contribuciones anteriores en el área, tienen el potencial de "desbloquear las reglas subyacentes de la vida que gobiernan la evolución microbiana".

    Los proyectos son el resultado de una colaboración de años entre los laboratorios Segarra y Treangen.

    "Esto ha sido producto de la realización de una investigación colaborativa de varios años en diferentes áreas de especialización, lo que ha permitido a nuestros estudiantes Ali y Kristen desafiar los paradigmas existentes y desarrollar nuevos enfoques para los problemas existentes en metagenómica", dijo Treangen.

    Más información: Ali Azizpour et al, GraSSRep:Aprendizaje autosupervisado basado en gráficos para la detección repetida en ensamblaje metagenómico, arXiv (2024). DOI:10.48550/arxiv.2402.09381

    Kristen D. Curry et al, Detección de variantes estructurales sin referencias en microbiomas mediante gráficos de coensamblaje de lectura larga, bioRxiv (2024). DOI:10.1101/2024.01.25.577285

    Información de la revista: bioRxiv , arXiv

    Proporcionado por la Universidad Rice




    © Ciencia https://es.scienceaq.com