Científicos del Skoltech Center for Computational and Data-Intensive Science and Engineering (CDISE) y Helmholtz Munich Center for Environmental Health (HMGU, Alemania) han creado una red neuronal para visualizar el espacio químico de compuestos que pueden ser de valor potencial para la industria farmacéutica. El nuevo método ayudará a crear nuevos compuestos químicos y navegar en el espacio de los productos químicos existentes. Los resultados del estudio se publicaron en RSC Advances.
Los químicos a menudo tienen que trabajar duro a través de enormes bases de datos que contienen decenas o incluso cientos de miles de estructuras químicas para seleccionar los mejores candidatos. Para hacerlo necesitan saber qué clases de compuestos contiene la base de datos. Sin embargo, atravesar miles de moléculas es una tarea laboriosa, lo que sería mucho más fácil si las moléculas se representaran como puntos y se colocaran en un plano o en el espacio, con moléculas similares apiñadas. Esto permitiría estudiar el espacio químico usando una herramienta simple de la misma manera que el geógrafo usa mapas digitales de diferentes escalas para ver una imagen más grande o hacer zoom en un área en particular. Pero aquí está el problema:¿cómo sabría el algoritmo dónde colocar las moléculas si la herramienta no tiene conocimientos de química?
Un grupo conjunto de investigadores del CDISE (Dmitry Karlov, Sergey Sosnin y Maxim Fedorov) y HMGU (Igor Tetko) aplicaron métodos de IA para extraer información directamente de los datos, y acopló la red neuronal profunda con el popular método de reducción de dimensión t-SNE para crear una red neuronal capaz de generar una vista 2-D del compuesto en un plano basado en la estructura multidimensional del compuesto recibida como entrada. El nuevo método coloca moléculas con propiedades similares cerca unas de otras, de modo que los compuestos se puedan agrupar en clases según sus propiedades. Los autores del estudio entrenaron su red neuronal en millones de compuestos con actividad biológica conocida.
"Adaptamos el método t-SNE para permitir visualizar el espacio químico de compuestos con potencial farmacéutico entrenando la red neuronal profunda y seleccionando descriptores simples y una métrica para calcular distancias en un espacio multidimensional. También mostramos que este enfoque permite guardar más información en comparación con otros métodos de reducción de dimensiones, al mismo tiempo que está a la par con PCA en términos de velocidad, ", dice el investigador de Skoltech y el primer autor del estudio Dmitry Karlov.
En el futuro, los científicos planean desarrollar una serie de herramientas para que los químicos y farmacéuticos vean la disposición de nuevos, compuestos inexplorados en relación con los ya estudiados y descritos en la literatura. Esto acelerará la fase de I + D en la búsqueda de nuevos medicamentos.