Análisis basado en aprendizaje automático de las vías de señalización que se encuentran dentro de los aminoácidos que se encuentran en las proteínas humanas. Crédito:Navli Duro / Universidad del Sur de Florida
Los algoritmos de aprendizaje automático se destacan en la búsqueda de patrones complejos dentro de big data, por lo que los investigadores los utilizan a menudo para hacer predicciones. Los investigadores están impulsando esta tecnología emergente más allá de encontrar correlaciones para ayudar a descubrir relaciones ocultas de causa-efecto e impulsar descubrimientos científicos.
En la Universidad del Sur de Florida, Los investigadores están integrando técnicas de aprendizaje automático en su trabajo de estudio de proteínas. Como informan en La Revista de Física Química , Uno de sus principales desafíos ha sido la falta de métodos para identificar las relaciones causa-efecto en los datos obtenidos a partir de simulaciones de dinámica molecular.
"Se puede pensar en las proteínas como máquinas nanoscópicas que realizan un conjunto de tareas. Pero cuándo y dónde las proteínas llevan a cabo sus tareas específicas está controlado por las células a través de diversos estímulos, como moléculas pequeñas, "dijo Sameer Varma, profesor asociado de biofísica en la USF. "Estos estímulos interactúan con las proteínas para activarlas y desactivarlas, 'e incluso puede modificar sus velocidades y fortalezas ".
En la mayoría de las proteínas, los estímulos biológicos interactúan con un sitio de la proteína relativamente alejado de la parte que realiza su tarea correspondiente, requiriendo una vía de señalización. “Esta forma de conmutación de proteínas por control remoto se conoce como 'señalización alostérica'. Se han identificado muchas proteínas de importancia farmacéutica en las que se sabe que la dinámica o el `` movimiento y movimiento '' de sus átomos constituyentes son vitales para la señalización alostérica. "Varma dijo." Los detalles, sin embargo, sigue siendo incompleto ".
Varma y sus colegas creen que los enfoques de aprendizaje automático pueden marcar la diferencia. "El desarrollo y el uso de técnicas de aprendizaje automático nos permitirá encontrar relaciones de causa-efecto en los datos de dinámica de proteínas y comenzar a abordar finalmente algunas de las preguntas fundamentales en el alosterio de proteínas, ", dijo." Uno de nuestros hallazgos clave fue que la señal iniciada en el sitio de estimulación de la proteína pareció debilitarse a medida que se alejaba del sitio de estimulación. Fue una sorpresa porque no se observó dependencia de la distancia para el acoplamiento de movimientos térmicos entre sitios de proteínas ".
El trabajo del grupo demuestra cómo se pueden utilizar los enfoques de aprendizaje automático para identificar relaciones de causa-efecto dentro de los datos. Más allá de esto, "estas técnicas nos permiten cerrar brechas críticas en el alosterio de proteínas, "Dijo Varma." En última instancia, cuando nuestros métodos se aplican a las numerosas proteínas de interés farmacéutico, esperamos que los detalles mecanicistas revelen nuevas estrategias de intervención muy necesarias para restaurar las actividades de las proteínas en estados enfermos. Los conocimientos biofísicos generales que obtenemos también deberían ayudar a inspirar nuevas soluciones biomiméticas para muchos problemas de nanoingeniería. como el diseño de nanosensores para la administración de fármacos dirigida ".
Los investigadores visualizan un trabajo nuevo y emocionante que se desarrollará a partir de sus hallazgos recientes. "Hasta aquí, nos hemos centrado en los datos de equilibrio, pero el proceso de señalización tiene un componente crítico de no equilibrio que aún no hemos explorado, ", Dijo Varma. El grupo también planea explorar el papel de las aguas circundantes en la señalización con mayor detalle, así como aplicar sus técnicas de aprendizaje automático a un amplio conjunto de familias de proteínas para determinar hasta qué punto sus nuevos hallazgos biofísicos son generalizables.