• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  •  science >> Ciencia >  >> Química
    El software de aprendizaje automático predice el comportamiento de las bacterias

    Representación de un artista de una célula bacteriana. Crédito:Centros para el Control y la Prevención de Enfermedades / James Archer

    Por primera vez en algoritmos de aprendizaje automático, un nuevo software desarrollado en Caltech puede predecir el comportamiento de las bacterias leyendo el contenido de un gen. El avance podría tener implicaciones significativas para nuestra comprensión de la bioquímica bacteriana y para el desarrollo de nuevos medicamentos.

    Un impulso de la farmacología moderna se centra en aliviar las dolencias mediante el desarrollo de medicamentos que se dirigen a proteínas específicas que residen en las membranas de las células de nuestro cuerpo. Estas proteínas, conocidas como proteínas integrales de membrana (IMP), actúan como receptores o "puertas" que permiten que los materiales entren y salgan de las células. Ejemplos de IMP son los receptores acoplados a proteína G, que transmiten información a una célula sobre su entorno, y canales iónicos, que controlan el entorno interior de una celda actuando como guardianes que permiten selectivamente que los iones entren y salgan de la celda. Los IMP son el objetivo de casi el 50 por ciento de todos los medicamentos en el mercado. Desafortunadamente, muchos IMP no se comprenden bien.

    "Estas son moléculas muy importantes que produce nuestro cuerpo de las que simplemente no sabemos lo suficiente, "dice Bil Clemons, profesor de bioquímica en Caltech.

    Para obtener una comprensión más completa de un IMP, los investigadores necesitan generar grandes cantidades para su purificación y estudio detallado. Típicamente, eso se hace insertando el ADN de esa proteína en las bacterias; la proteína se produce entonces de forma natural a medida que la bacteria crece y se multiplica. El problema es que no todas las bacterias están dispuestas a cooperar y a producir solo cantidades ínfimas de proteína. Solo unas pocas bacterias terminan produciendo suficientes proteínas para ser útiles, y, hasta ahora, No ha habido forma de que los investigadores sepan si una bacteria con la que están trabajando será un éxito o un fracaso.

    "Una de las principales limitaciones en el estudio de las proteínas de membrana es la falta de capacidad para expresarlas en cantidades razonables, ", Dice Clemons." Usamos estas bacterias como fábricas para hacer cosas para nosotros, pero es impredecible ... mayormente falla. Como anécdota, ha tenido aproximadamente un 10 por ciento de éxito ".

    Todo el ensayo y error involucrado en lograr que las bacterias cooperen desperdicia el tiempo y los recursos de los investigadores. Clemons se preguntó si sería posible usar computadoras para predecir cómo reaccionarán las bacterias cuando se les pida que creen una proteína que normalmente no producen.

    "Supusimos que las células bacterianas estaban haciendo una lectura cuantitativa del ADN para determinar cuántas de estas proteínas producir, ", dice." Queríamos saber si podíamos utilizar herramientas computacionales para aumentar la tasa de éxito en la búsqueda de bacterias que expresan proteínas en cantidades útiles para ayudarnos a caracterizar moléculas importantes para la medicina ".

    Clemons y su estudiante de posgrado, Shyam Saladi, creó esa herramienta, un software de aprendizaje automático al que han denominado IMProve, que compara el ADN bacteriano con datos sobre cuánta proteína produce la bacteria. Luego utilizaron un conjunto de datos para IMProve que cultivó muchas muestras de bacterias para ver qué tan bien producían las proteínas de membrana deseadas. Los investigadores entrenaron a IMProve alimentando esos resultados y los códigos genéticos en los que se basan las bacterias para expresar las proteínas en IMProve para que pudiera aprender qué secuencias de ADN darían como resultado una alta producción de proteínas.

    Una vez entrenado el software, los investigadores encontraron que predijo el comportamiento bacteriano tan bien que pudieron duplicar su tasa de recolección exitosa de bacterias que expresarían IMP en grandes cantidades.

    "Nos sorprendió porque no había ninguna garantía de que este enfoque fuera a funcionar, "Dice Clemons." Las células son extremadamente complejas, y está pidiendo un modelo estadístico relativamente simple para predecir lo que va a hacer una celda. Desde esa perspectiva, fue bastante impactante ".

    Pero, Clemons agrega que, tal vez sus resultados no sean tan sorprendentes en retrospectiva.

    "Esto subraya la idea de que las células son solo computadoras, y solo están computando cosas, " él dice.

    El papel, titulado "Un modelo estadístico para mejorar la expresión de proteínas de membrana utilizando características derivadas de la secuencia, "aparece en la edición del 30 de marzo de la Revista de química biológica .


    © Ciencia https://es.scienceaq.com