Joanna Slusky, profesor asociado de biociencias moleculares y biología computacional en la Universidad de Kansas, dirige el laboratorio donde el aprendizaje automático mejoró la precisión de la identificación de metales enzimáticos y no enzimáticos en proteínas. Crédito:Meg Kumin
Última temporada, El mariscal de campo de los Kansas City Chiefs, Patrick Mahomes, contaba con un porcentaje de pases completados de 66,3.
Pero la impresionante estadística de Mahomes palidece en comparación con la precisión de MAHOMES, o heurística de actividad de metales de metaloproteínas y sitios enzimáticos, un modelo de aprendizaje automático desarrollado en la Universidad de Kansas, y nombrado en honor al mariscal de campo, que podría conducir a una terapias farmacológicas más económicas y ecológicas y otros productos industriales.
En lugar de apuntar a receptores anchos, MAHOMES diferencia entre metales enzimáticos y no enzimáticos en proteínas con una tasa de precisión del 92,2%. Un equipo de KU publicó recientemente resultados sobre este enfoque de aprendizaje automático para diferenciar enzimas en Comunicaciones de la naturaleza .
"Las enzimas son proteínas súper interesantes que hacen toda la química:una enzima hace una reacción química en algo para transformarlo de una cosa a otra, "dijo la autora correspondiente Joanna Slusky, profesor asociado de biociencias moleculares y biología computacional en KU. "Todo lo que traes a tu cuerpo, tu cuerpo lo descompone y lo convierte en cosas nuevas, y ese proceso de descomponerse y convertirse en cosas nuevas, todo eso se debe a las enzimas ".
Slusky y colaboradores de estudiantes de posgrado en su laboratorio, Ryan Feehan (el fan de los Chiefs que nombró a MAHOMES) y Meghan Franklin del Centro de Biología Computacional de KU, buscó usar computadoras para distinguir entre metaloproteínas, que no realizan reacciones químicas, y metaloenzimas, que facilitan las reacciones químicas con asombrosa potencia y eficiencia.
El problema es que las metaloproteínas y las metaloenzimas son idénticas en muchos aspectos.
"La gente no sabe exactamente cómo funcionan las enzimas, ", Dijo Slusky." Para cualquier enzima dada, puede decir:"OK, sabes, quita este hidrógeno y pone el grupo -OH, "o lo que sea. Pero si te di una proteína que nunca antes habías visto y te preguntara, '¿Cuál es el final? ¿De qué lado de esto tiene la reacción? ' usted, como científico e incluso como enzimólogo, Probablemente no podría decírmelo. Ahora, una de las claves es que aproximadamente el 40% de todas las enzimas usan metales para la catálisis, por lo que su proteína se une a un metal y luego todo lo que se cambia entra en ese sitio activo y se cambia. Vemos esto en estas proteínas de unión a metales y metaloenzimas, que son enzimas que unen metales, como una tremenda oportunidad para nosotros porque mi laboratorio está interesado en el aprendizaje automático que puede hacer un muy buen trabajo al diferenciar sitios de enzimas de sitios similares pero no enzimáticos ".
Como estudiante de KU, Feehan, coautor principal, comenzó a compilar el conjunto de datos estructurales más grande del mundo de sitios de metaloproteínas enzimáticas y no enzimáticas, un trabajo que continuó en su carrera como estudiante de posgrado. Luego, hizo que el conjunto de datos estuviera disponible gratuitamente para otros investigadores en Github.
"Los datos estructurales son muy difíciles de conseguir, ", Dijo Slusky." Pero si estás interesado en lo que son la física y la química, y donde están esos átomos, y qué pueden hacer dentro de esas relaciones, necesitas estructuras proteicas. La parte difícil de esto fue obtener un montón de estructuras de sitios enzimáticos, sabiendo que eran sitios de enzimas, luego, obteniendo un montón de sitios no enzimáticos que se unían a metales, y sabiendo que no eran enzimas, y extrayéndolos de una gran base de datos estructural ".
Feehan pudo encontrar miles de sitios de unión de metales activos e inactivos únicos, luego probó enfoques de aprendizaje automático para distinguir entre los dos. Para lograr esto, Feehan y Franklin entrenaron un modelo de aprendizaje por computadora (MAHOMES) para examinar una hendidura en una proteína y predecir si esa hendidura podría hacer química (lo que significa que era una enzima). Al observar las características fisicoquímicas, MAHOMES logró un 92,2% de precisión y un 90,1% de recuerdo al diferenciar los sitios activos e inactivos.
Slusky dijo que el enfoque podría ser un paso importante para hacer que las enzimas sean más útiles para la producción de terapias con medicamentos que salvan vidas y una serie de otros procesos industriales. En efecto, el enfoque iniciado por el equipo de KU incluso podría revolucionar la forma en que se diseñan las enzimas.
"Espero que cambie la síntesis en general, ", dijo." Espero que haya medicamentos más baratos fabricados con menos ramificaciones ambientales ". Ahora, La síntesis de las empresas farmacéuticas tiene enormes implicaciones medioambientales, y sería genial si pudiéramos reducirlos. Pero también hay síntesis en general en todas las industrias. Si quieres hacer pintura, la pintura necesita síntesis. Todo está hecho de productos químicos, por ejemplo, textiles. Puedes cosechar algodón, pero ultimamente, le dará propiedades materiales particulares a ese algodón antes de venderlo, y eso requiere productos químicos. Cuanta más síntesis podamos hacer mediante enzimas y más fácil será que las empresas realicen esa síntesis mediante enzimas, cuanto más barato será, y más verde será ".
Según Slusky, la investigación del aprendizaje automático continuaría en tres líneas.
"Número uno, intentamos que el enfoque de aprendizaje automático funcione un poco mejor, "ella dijo." Número dos, estamos empezando a diseñar enzimas con él. Y el número tres es que queremos hacer esto para las enzimas que no se unen a los metales. El cuarenta por ciento de todos los sitios activos enzimáticos tienen metales unidos. Hagamos el otro 60%, también, y encontrar el conjunto de comparación adecuado para el otro 60% es un proyecto en el que está trabajando otro estudiante graduado de mi laboratorio ".