Crédito:CC0 Public Domain
Los investigadores de Stanford han creado un algoritmo que, guiado por investigaciones previas, establece las secuencias de ADN con mayor probabilidad de alinearse con las propiedades antimicrobianas.
A medida que se avecina la amenaza de la resistencia a los antibióticos, los microbiólogos no son los únicos que están pensando en nuevas soluciones. James Zou, Doctor., profesor asistente de ciencia de datos biomédicos en Stanford, ha aplicado el aprendizaje automático para crear un algoritmo que genera miles de secuencias de ADN virtuales completamente nuevas con la intención de algún día crear proteínas antimicrobianas.
El algoritmo llamado Feedback GAN, esencialmente actúa como un productor masivo de diferentes fragmentos de ADN. Y aunque estos intentos de secuencia son algo aleatorios, el algoritmo no funciona a ciegas. Está basando los nuevos péptidos posibles, o pequeños grupos de aminoácidos, en investigaciones anteriores que establecen las secuencias de ADN con mayor probabilidad de alinearse con las propiedades antimicrobianas.
Por ahora, estas plantillas, que no existen en la naturaleza, son teóricos, generado en una computadora. Pero ante la creciente preocupación por la resistencia a los microbios, Zou dijo que es fundamental pensar en soluciones que aún no existen.
"Elegimos buscar proteínas antimicrobianas porque es muy importante, problema de alto impacto que también es un problema relativamente manejable para el algoritmo, ", Dijo Zou." Hay herramientas existentes que incorporamos en nuestro sistema que evalúan si es probable que una nueva secuencia tenga las propiedades de una proteína antimicrobiana exitosa ".
Feedback GAN se basa en eso, trabajando para incorporar el equilibrio justo de azar y precisión.
Un artículo que describe el algoritmo se publicó en línea el 11 de febrero en Aprendizaje automático de la naturaleza . Anvita Gupta, estudiante de informática, es el primer autor; Zou es el autor principal.
Autorrefinado
El algoritmo de Gupta y Zou no solo produce nuevas combinaciones de ADN. También se refina activamente, aprender qué funciona y qué no a través de un ciclo de retroalimentación:después de que el algoritmo escupe una amplia gama de secuencias de ADN, ejecuta un proceso de aprendizaje de prueba y error que examina las sugerencias de péptidos. Basado en su parecido con otros péptidos antimicrobianos conocidos, los "buenos" se retroalimentan en el algoritmo para informar futuras secuencias de ADN generadas a partir del código, y refinarse.
"Hay un árbitro incorporado y, al tener este ciclo de retroalimentación, el sistema aprende a modelar secuencias recién generadas a partir de aquellas que se considera probable que tengan propiedades antimicrobianas, "Dijo Zou." Así que la idea es que tanto las secuencias de péptidos individuales como la generación de las secuencias mejoren cada vez más ".
Zou también ha considerado otro componente central de proteínas hipotéticas:el plegamiento de proteínas. Las proteínas se contorsionan en estructuras muy específicas vinculadas a sus funciones. Un algoritmo podría crear la secuencia perfecta, pero a menos que pueda plegarse, es inútil, como los engranajes de un reloj esparcidos sobre una mesa.
Puede modificar el algoritmo para que, en lugar de analizar la propensión a las propiedades antimicrobianas, determina la probabilidad de un plegado correcto.
"De hecho, podemos hacer estas dos cosas en paralelo en las que observamos las propiedades antimicrobianas de una secuencia y la probabilidad de plegado de otra, ", dijo Zou." Ejecutamos ambos para optimizar las propiedades antimicrobianas o su capacidad de plegado ".
Próximo, Zou espera fusionar las dos variaciones del algoritmo para crear secuencias de péptidos que estén optimizadas tanto para su capacidad de matar microbios como para su capacidad de plegarse en una proteína genuina.