Cecilia Clementi. Crédito:Jeff Fitlow / Rice University
Los modelos computacionales han recorrido un largo camino en su capacidad para simular los procesos biológicos más básicos, como la forma en que se pliegan las proteínas. Una nueva técnica creada por investigadores de la Universidad de Rice debería permitir a los científicos modelar moléculas más grandes con mayor precisión que nunca.
El laboratorio de Rice de la química computacional Cecilia Clementi ha desarrollado un marco de modelado molecular que puede reproducir con mayor precisión los resultados experimentales con modelos simples de grano grueso que se utilizan para simular la dinámica de las proteínas.
El marco, Diseño basado en observaciones de modelos moleculares efectivos (ODEM), incorpora los datos experimentales disponibles en la definición de un modelo de simulación de grano grueso. Para un modelo de grano grueso dado, repetir la simulación con cambios incrementales en los parámetros del modelo mejora la capacidad del algoritmo para predecir, por ejemplo, cómo una proteína encontrará su forma funcional.
El trabajo dirigido por el estudiante graduado y autor principal de Clementi y Rice, Justin Chen, aparece en la publicación de la American Chemical Society. Revista de teoría química y computación .
"Entender las proteínas, especialmente su dinámica, es fundamental para entender la vida, "Dijo Clementi." Hay dos formas complementarias de hacer esto:ya sea a través de la simulación o la experimentación. En un experimento mides algo que es real, pero está muy limitado en las cantidades que puede medir directamente. Es como armar un rompecabezas con muy pocas piezas ".
Dijo que las simulaciones permiten a los investigadores observar todos los aspectos de la dinámica de las proteínas, pero los modelos que incorporan las propiedades de cada átomo pueden tardar meses o años en computar las supercomputadoras, incluso si las propias proteínas se pliegan en segundos in vivo. Para obtener resultados más rápidos, Los científicos suelen utilizar modelos de grano grueso, Simulaciones simplificadas en las que unas pocas "perlas" eficaces representan grupos de átomos en una proteína.
"En modelos muy simples hay que realizar aproximaciones sólidas, y como consecuencia, los resultados pueden diferir de la realidad, ", Dijo Clementi." Combinamos estos dos enfoques y usamos el poder de la simulación de una manera que reproduce los experimentos. De esa manera, obtenemos lo mejor de ambos mundos ".
La adquisición de datos iniciales no es un problema, Chen dijo. "Ya hay una gran cantidad de datos experimentales sobre proteínas, para que no sea difícil de encontrar ", dijo." Es sólo una cuestión de encontrar una manera de modelar esos datos en una simulación ".
Clementi dijo que los datos pueden provenir de cualquiera o una combinación de fuentes como la transferencia de energía de resonancia de Förster (FRET), mutagénesis o resonancia magnética nuclear. El marco computacional aprovecha los modelos de Markov para combinar múltiples simulaciones de proteínas cortas para obtener la distribución de equilibrio de las configuraciones de proteínas que se utiliza en ODEM. "Los modelos de Markov nos permiten combinar y explorar diferentes partes del espacio configuracional de una proteína, ", dijo." Es una forma inteligente de dividir y conquistar ".
La clave, según los investigadores, es incluir solo los detalles físicos necesarios para modelar el proceso con precisión.
"Hay modelos que son muy precisos, pero son computacionalmente demasiado costosos, ", Dijo Clementi." Hay demasiada información en esos modelos, por lo que no sabe cuáles son los ingredientes físicos más importantes.
"En nuestros modelos simplificados, incluimos solo los factores físicos que creemos que son importantes, ", dijo." Si al usar ODEM las simulaciones mejoran su concordancia con los experimentos, significa que la hipótesis era correcta. Si no lo hacen, entonces sabemos que faltan ingredientes ".
Los investigadores encontraron que su técnica puede revelar propiedades moleculares inesperadas. En el proceso de probar su algoritmo, los investigadores descubrieron un nuevo detalle sobre el mecanismo de plegado de FiP35, una proteína de dominio WW común que es una parte de proteínas estructurales y de señalización más grandes. FiP35, con solo 35 aminoácidos, se entiende bien y se utiliza a menudo en estudios de plegado.
El modelo ODEM de FiP35, basado en datos experimentales de resultados FRET simulados, reveló varias regiones donde la frustración localizada forzó cambios en el proceso de plegado. Su análisis mostró que las interacciones son importantes para el proceso y probablemente conservadas evolutivamente, pero dijeron que los datos que conducen a esa conclusión nunca habrían aparecido si los datos de FRET simulados no se hubieran utilizado en el modelo de grano grueso.
"Ahora lo estamos ampliando a sistemas más grandes, como proteínas de 400 residuos, aproximadamente 10 veces más grande que nuestra proteína de prueba, ", Dijo Chen." No se pueden hacer simulaciones de átomos completos de estos grandes movimientos y escalas de tiempo prolongadas, pero si haces 10 u 11 iteraciones de un modelo de grano grueso con ODEM, tardan solo unas pocas horas. Eso es una gran reducción del tiempo que le tomaría a una persona ver resultados razonables ".