• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  •  science >> Ciencia >  >> Química
    El enfoque de aprendizaje automático podría ayudar al diseño de procesos industriales para la fabricación de medicamentos

    Un nuevo sistema informático predice los productos de reacciones químicas. "La visión es que podrá acercarse a un sistema y decir:"Quiero hacer esta molécula". El software le dirá la ruta desde la que debe hacerlo, y la máquina lo hará, ”Dice el profesor Klays Jensen. Crédito:MIT News

    Cuando los químicos orgánicos identifican un compuesto químico útil:un nuevo fármaco, por ejemplo, depende de los ingenieros químicos determinar cómo producirlo en masa.

    Podría haber 100 secuencias diferentes de reacciones que produzcan el mismo producto final. Pero algunos de ellos usan reactivos más baratos y temperaturas más bajas que otros, y quizás lo más importante, algunos son mucho más fáciles de ejecutar de forma continua, con técnicos que ocasionalmente rellenan reactivos en diferentes cámaras de reacción.

    Históricamente, determinar la forma más eficiente y rentable de producir una molécula determinada ha sido tanto un arte como una ciencia. Pero los investigadores del MIT están tratando de poner este proceso en una base empírica más segura, con un sistema informático entrenado en miles de ejemplos de reacciones experimentales y que aprende a predecir cuáles serán los principales productos de una reacción.

    El trabajo de los investigadores aparece en la revista de la American Chemical Society. Ciencia Central ACS . Como todos los sistemas de aprendizaje automático, el suyo presenta sus resultados en términos de probabilidades. En pruebas, el sistema pudo predecir el producto principal de una reacción el 72 por ciento del tiempo; 87 por ciento del tiempo, clasificó el producto principal entre sus tres resultados más probables.

    "Claramente se entiende mucho sobre las reacciones de hoy, "dice Klavs Jensen, el profesor Warren K. Lewis de ingeniería química en el MIT y uno de los cuatro autores principales del artículo, "pero es una herramienta muy evolucionada adquirió habilidad para mirar una molécula y decidir cómo la va a sintetizar a partir de los materiales de partida ".

    Con el nuevo trabajo Jensen dice:"la visión es que podrá acercarse a un sistema y decir:'Quiero hacer esta molécula'. El software le dirá la ruta desde la que debe hacerlo, y la máquina lo hará ".

    Con un 72 por ciento de posibilidades de identificar el producto principal de una reacción, el sistema aún no está listo para anclar el tipo de síntesis química completamente automatizada que prevé Jensen. Pero podría ayudar a los ingenieros químicos a converger más rápidamente en la mejor secuencia de reacciones, y posiblemente sugerir secuencias que de otro modo no hubieran investigado.

    Jensen está acompañado en el artículo por el primer autor Connor Coley, estudiante de posgrado en ingeniería química; William Green, el Profesor Hoyt C. Hottel de Ingeniería Química, OMS, con Jensen, co-asesora a Coley; Regina Barzilay, el profesor Delta Electronics de Ingeniería Eléctrica y Ciencias de la Computación; y Tommi Jaakkola, el Profesor Thomas Siebel de Ingeniería Eléctrica e Informática.

    Actuando localmente

    Una sola molécula orgánica puede constar de docenas e incluso cientos de átomos. Pero una reacción entre dos de estas moléculas podría involucrar solo dos o tres átomos, que rompen sus enlaces químicos existentes y forman otros nuevos. Miles de reacciones entre cientos de reactivos diferentes a menudo se reducirán a un solo, reacción compartida entre el mismo par de "sitios de reacción".

    Una gran molécula orgánica, sin embargo, puede tener varios sitios de reacción, y cuando se encuentra con otra gran molécula orgánica, sólo una de las varias reacciones posibles entre ellos tendrá lugar realmente. Esto es lo que hace que la predicción automática de reacciones sea tan complicada.

    En el pasado, Los químicos han construido modelos informáticos que caracterizan las reacciones en términos de interacciones en los sitios de reacción. Pero con frecuencia requieren la enumeración de excepciones, que deben investigarse de forma independiente y codificarse a mano. El modelo podría declarar, por ejemplo, que si la molécula A tiene un sitio de reacción X, y la molécula B tiene un sitio de reacción Y, entonces X e Y reaccionarán para formar el grupo Z, a menos que la molécula A también tenga sitios de reacción P, Q, R, S, T, U, o V.

    No es raro que un solo modelo requiera más de una docena de excepciones enumeradas. Y descubrir estas excepciones en la literatura científica y agregarlas a los modelos es una tarea laboriosa, lo que ha limitado la utilidad de los modelos.

    Uno de los principales objetivos del nuevo sistema de investigadores del MIT es sortear este arduo proceso. Coley y sus coautores comenzaron con 15, 000 reacciones observadas empíricamente informadas en solicitudes de patente de EE. UU. Sin embargo, porque el sistema de aprendizaje automático tenía que aprender qué reacciones no ocurrirían, así como los que lo harían, los ejemplos de reacciones exitosas no fueron suficientes.

    Ejemplos negativos

    Entonces, para cada par de moléculas en una de las reacciones enumeradas, Coley también generó una batería de posibles productos adicionales, basado en los sitios de reacción de las moléculas. Luego alimentó descripciones de reacciones, junto con sus listas ampliadas artificialmente de posibles productos, a un sistema de inteligencia artificial conocido como red neuronal, que tenía la tarea de clasificar los posibles productos en orden de probabilidad.

    De esta formación, la red esencialmente aprendió una jerarquía de reacciones —cuáles interacciones en qué sitios de reacción tienden a tener prioridad sobre cuáles otros— sin la laboriosa anotación humana.

    Otras características de una molécula pueden afectar su reactividad. Los átomos en un sitio de reacción dado pueden, por ejemplo, tienen diferentes distribuciones de cargos, dependiendo de qué otros átomos estén a su alrededor. Y la forma física de una molécula puede dificultar el acceso a un sitio de reacción. Por tanto, el modelo de los investigadores del MIT también incluye medidas numéricas de ambas características.

    Según Richard Robinson, investigador de tecnologías químicas en la compañía farmacéutica Novartis, el sistema de investigadores del MIT "ofrece un enfoque diferente al aprendizaje automático dentro del campo de la síntesis dirigida, que en el futuro podría transformar la práctica del diseño experimental en moléculas específicas ".

    "Actualmente confiamos en gran medida en nuestro propio entrenamiento retrosintético, que está alineado con nuestras propias experiencias personales y aumentado con motores de búsqueda de bases de datos de reacciones, ", Dice Robinson." Esto nos sirve bien, pero a menudo todavía da como resultado una tasa de fallas significativa. Incluso los químicos muy experimentados se sorprenden a menudo. Si tuvieras que sumar todas las fallas de síntesis acumulativas como industria, esto probablemente se relacionaría con una inversión significativa de tiempo y costo. ¿Y si pudiéramos mejorar nuestra tasa de éxito? "

    Los investigadores del MIT, Robinson dice:"han demostrado inteligentemente un enfoque novedoso para lograr un rendimiento de reacción predictivo más alto que los enfoques convencionales. Al aumentar la literatura reportada con ejemplos de reacciones negativas, el conjunto de datos tiene más valor ".

    Esta historia se vuelve a publicar por cortesía de MIT News (web.mit.edu/newsoffice/), un sitio popular que cubre noticias sobre la investigación del MIT, innovación y docencia.




    © Ciencia https://es.scienceaq.com