• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  •  science >> Ciencia >  >> Química
    Uso de redes neuronales para predecir los resultados de la química orgánica

    La herramienta basada en web es simple, y el modelo se entrena de principio a fin, totalmente basado en datos y sin la ayuda de consultar una base de datos o cualquier información externa adicional. Crédito:IBM

    Durante más de 200 años, la síntesis de moléculas orgánicas sigue siendo una de las tareas más importantes de la química orgánica. El trabajo de los químicos tiene implicaciones científicas y comerciales que van desde la producción de aspirina hasta la de nailon. Todavía, Se ha hecho poco para cambiar drásticamente las viejas prácticas y permitir una nueva era de productividad basada en la ciencia y las tecnologías pioneras de la inteligencia artificial (IA).

    El desafío para los químicos orgánicos en campos como la química, ciencia de los Materiales, petróleo y gas, y las ciencias de la vida es que hay cientos de miles de reacciones y, mientras que es manejable recordar algunas docenas en el campo de un especialista estrecho, es imposible ser un generalista experto.

    Para abordar esto, nos preguntamos:¿Podemos utilizar el aprendizaje profundo y la inteligencia artificial para predecir reacciones de compuestos orgánicos?

    Primero, desde que estudiamos ingeniería y ciencias de los materiales, pero no química orgánica, tuvimos que ir a los libros. No pasó mucho tiempo antes de que empezáramos a ver la química orgánica en todas partes:por la mañana, mediodía y noche. Aparecieron átomos en lugar de letras, moléculas materializadas a partir de palabras y, luego, sucedió algo increíble:nació una idea.

    Nos dimos cuenta de que los conjuntos de datos de química orgánica y los conjuntos de datos de lenguaje tienen mucho en común:ambos dependen de la gramática, en dependencias de largo alcance, y una pequeña partícula o palabra como "no" puede cambiar todo el significado de una oración al igual que la estereoquímica puede convertir la talidomida en un medicamento o en un veneno mortal.

    Crédito:IBM

    Como hablantes no nativos de inglés, ambos estamos familiarizados con las herramientas de traducción en línea, que hicieron maravillas al convertir del inglés al francés, y del alemán al inglés, Entonces, ¿por qué no intentar usarlos para convertir químicos aleatorios en compuestos funcionales?

    En la Conferencia NIPS 2017 presentamos nuestros resultados:una aplicación basada en la web que toma la idea de relacionar la química orgánica con un idioma y aplica métodos de traducción automática neuronal de última generación para pasar del diseño de materiales a la generación de productos utilizando secuencias. modelos a secuencia (seq2seq).

    Química 101

    De vuelta en la escuela secundaria tuvimos que dibujar a mano los hexágonos y pentágonos y todas las líneas que representan enlaces de moléculas orgánicas. Ahora hemos creado un sistema que toma exactamente la misma representación y puede predecir cómo reaccionarán las moléculas con un clic.

    La herramienta general es simple, y el modelo se entrena de principio a fin, totalmente basado en datos y sin la ayuda de consultar una base de datos o cualquier información externa adicional. Con este enfoque, superamos las soluciones actuales utilizando sus propios conjuntos de entrenamiento y prueba al lograr una precisión de primer nivel del 80,3 por ciento y establecer una primera puntuación del 65,4 por ciento en un conjunto de datos de reacciones de productos únicos y ruidosos extraídos de patentes de EE. UU.

    Usando SONRISAS, esta molécula se traduce en BrCCOC1OCCCC1. Crédito:IBM

    El secreto detrás de nuestra herramienta es lo que se llama un sistema simplificado de entrada de línea de entrada molecular o SMILES. SMILES representa una molécula como una secuencia de caracteres. Por ejemplo, la imagen de la derecha, se convierte en BrCCOC1OCCCC1.

    Entrenamos nuestro modelo usando un conjunto de datos de reacciones químicas disponible abiertamente, que corresponden a 1 millón de reacciones de patentes.

    En el futuro, Nuestro objetivo es mejorar el modelo y mejorar nuestra precisión ampliando nuestro conjunto de datos. Actualmente, nuestros datos se toman de información disponible públicamente en patentes estadounidenses publicadas en línea. pero no hay ninguna razón por la que la herramienta no pueda capacitarse con datos provenientes de otras fuentes, como libros de texto de química y publicaciones científicas.

    También planeamos poner esta herramienta a disposición del público de forma gratuita en la nube a principios de 2018.

    Regístrese en www.zurich.ibm.com/foundintranslation para recibir una alerta cuando la herramienta web esté lista.


    © Ciencia https://es.scienceaq.com