• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  • El marco DeepEC impulsado por el aprendizaje profundo ayuda a comprender con precisión las funciones de las enzimas

    Esquema general de DeepEC. Crédito:KAIST

    Un marco computacional impulsado por el aprendizaje profundo, 'DeepEC, 'permitirá la predicción de alta calidad y alto rendimiento de los números de comisiones de enzimas, que es esencial para la comprensión precisa de las funciones de las enzimas.

    Un equipo compuesto por el Dr. Jae Yong Ryu, Profesor Hyun Uk Kim, y el distinguido profesor Sang Yup Lee de KAIST informaron sobre el marco computacional impulsado por el aprendizaje profundo que predice los números de comisión de enzimas (EC) con alta precisión y de una manera de alto rendimiento.

    DeepEC toma una secuencia de proteínas como entrada y predice con precisión los números de CE como salida. Las enzimas son proteínas que catalizan reacciones bioquímicas y números de CE, que constan de cuatro números de nivel (es decir, a, B, C, d) indicar reacciones bioquímicas. Por lo tanto, La identificación de los números de CE es fundamental para comprender con precisión las funciones y el metabolismo de las enzimas.

    Los números de EC generalmente se dan a una secuencia de proteína que codifica una enzima durante un procedimiento de anotación del genoma. Debido a la importancia de los números CE, Se han desarrollado varias herramientas de predicción de números CE, pero tienen margen de mejora con respecto al tiempo de cálculo, precisión, cobertura, y el tamaño total de los archivos necesarios para la predicción del número CE.

    DeepEC utiliza tres redes neuronales convolucionales (CNN) como motor principal para la predicción de números EC, y también implementa el análisis de homología para los números de CE si las tres CNN no producen números de CE fiables para una secuencia de proteína determinada. DeepEC se desarrolló utilizando un conjunto de datos estándar de oro que cubre 1, 388, 606 secuencias de proteínas y 4, 669 números CE.

    En particular, Los estudios de evaluación comparativa de DeepEC y otras cinco herramientas representativas de predicción de números EC mostraron que DeepEC realizó las predicciones más precisas y rápidas para los números EC. DeepEC también requirió el menor espacio en disco para la implementación, lo que lo convierte en un componente de software de terceros ideal.

    Es más, DeepEC fue el más sensible para detectar la pérdida de función enzimática como resultado de mutaciones en dominios / restos de sitios de unión de secuencias de proteínas; en este análisis comparativo, todos los dominios o el residuo del sitio de unión se sustituyeron por el residuo de L-alanina para eliminar la función de la proteína, que se conoce como el método de escaneo de L-alanina.

    Este estudio fue publicado en línea en la procedimientos de la Academia Nacional de Ciencias ( PNAS ) el 20 de junio, 2019, titulado "El aprendizaje profundo permite la predicción de alta calidad y alto rendimiento de los números de comisión de enzimas".

    "DeepEC se puede utilizar como una herramienta independiente y también como un componente de software de terceros en combinación con otras plataformas computacionales que examinan las reacciones metabólicas. DeepEC está disponible gratuitamente en línea, "dijo el profesor Kim.

    El distinguido profesor Lee dijo:"Con DeepEC, se ha hecho posible procesar volúmenes cada vez mayores de datos de secuencias de proteínas de manera más eficiente y precisa ".


    © Ciencia https://es.scienceaq.com