En menos tiempo del que le llevará leer este artículo, un sistema impulsado por inteligencia artificial pudo aprender de forma autónoma ciertas reacciones químicas ganadoras del Premio Nobel y diseñar un procedimiento de laboratorio exitoso para realizarlas. La IA hizo todo eso en tan solo unos minutos y lo logró en el primer intento.
"Esta es la primera vez que una inteligencia no orgánica planificó, diseñó y ejecutó esta compleja reacción inventada por los humanos", dice el químico e ingeniero químico de la Universidad Carnegie Mellon Gabe Gomes, quien dirigió el equipo de investigación que ensambló y probó la IA. sistema basado. Llamaron a su creación "Coscientist".
Las reacciones más complejas que logró Coscientist se conocen en química orgánica como acoplamientos cruzados catalizados por paladio, lo que le valió a sus inventores humanos el Premio Nobel de Química de 2010 en reconocimiento al enorme papel que esas reacciones llegaron a desempeñar en el proceso de desarrollo farmacéutico y en otras industrias que Utilice moléculas delicadas a base de carbono.
El equipo de investigación de cuatro personas incluye a los estudiantes de doctorado Daniil Boiko y Robert MacKnight, quienes recibieron apoyo y capacitación del Centro de Síntesis Quimioenzimática de la Fundación Nacional de Ciencias de EE. UU. en la Universidad Northwestern y del Centro NSF de Síntesis Asistida por Computadora en la Universidad de Notre Dame, respectivamente. .
"Más allá de las tareas de síntesis química demostradas por su sistema, Gomes y su equipo han sintetizado con éxito una especie de compañero de laboratorio hipereficiente", dice el director de la División de Química de NSF, David Berkowitz. "Juntan todas las piezas y el resultado final es mucho más que la suma de sus partes:puede utilizarse con fines científicos genuinamente útiles".
Un sistema inteligente no orgánico ha diseñado, planificado y ejecutado por primera vez un experimento de química, informan investigadores de la Universidad Carnegie Mellon en la edición del 21 de diciembre de la revista Nature . Crédito:Universidad Carnegie Mellon
Reuniendo Coscientist
Entre el software y las piezas basadas en silicio de Coscientist, los principales son los grandes modelos de lenguaje que componen sus "cerebros" artificiales. Un modelo de lenguaje grande es un tipo de IA que puede extraer significado y patrones de cantidades masivas de datos, incluido el texto escrito contenido en documentos.
A través de una serie de tareas, el equipo probó y comparó múltiples modelos de lenguajes grandes, incluido GPT-4 y otras versiones de los modelos de lenguajes grandes GPT fabricados por la empresa OpenAI.
Coscientist también fue equipado con varios módulos de software diferentes que el equipo probó primero individualmente y luego en conjunto.
"Intentamos dividir todas las tareas científicas posibles en pequeñas partes y luego, pieza por pieza, construir el panorama general", dice Boiko, quien diseñó la arquitectura general de Coscientist y sus tareas experimentales. "Al final, logramos unir todo".
Los módulos de software permitieron a Coscientist hacer cosas que hacen todos los químicos investigadores:buscar información pública sobre compuestos químicos, encontrar y leer manuales técnicos sobre cómo controlar equipos de laboratorio robóticos, escribir códigos de computadora para llevar a cabo experimentos y analizar los datos resultantes para determinar qué funcionó y lo que no.
Una prueba examinó la capacidad de Coscientist para planificar con precisión procedimientos químicos que, si se llevaran a cabo, darían como resultado sustancias de uso común como aspirina, paracetamol e ibuprofeno. Los grandes modelos de lenguaje se probaron y compararon individualmente, incluidas dos versiones de GPT con un módulo de software que le permite utilizar Google para buscar información en Internet como lo haría un químico humano.
Luego, los procedimientos resultantes se examinaron y calificaron en función de si habrían conducido a la sustancia deseada, qué tan detallados eran los pasos y otros factores. Algunas de las puntuaciones más altas las obtuvo el módulo GPT-4 con capacidad de búsqueda, que fue el único que creó un procedimiento de calidad aceptable para sintetizar ibuprofeno.
Boiko y MacKnight observaron a Coscientist demostrando "razonamiento químico", que Boiko describe como la capacidad de utilizar información relacionada con la química y conocimientos previamente adquiridos para guiar las acciones. Utilizó información química disponible públicamente codificada en el formato del Sistema Simplificado de Entrada de Línea de Entrada Molecular (SMILES), un tipo de notación legible por máquina que representa la estructura química de las moléculas, e hizo cambios en sus planes experimentales basados en partes específicas de las moléculas que estaba escudriñando dentro de los datos de SMILES.
"Ésta es la mejor versión posible del razonamiento químico", afirma Boiko.
Otras pruebas incorporaron módulos de software que permitieron a Coscientist buscar y utilizar documentos técnicos que describen interfaces de programación de aplicaciones que controlan equipos robóticos de laboratorio. Estas pruebas fueron importantes para determinar si Coscientist podría traducir sus planes teóricos para sintetizar compuestos químicos en un código informático que guiaría a los robots de laboratorio en el mundo físico.
Trae los robots
Los equipos químicos robóticos de alta tecnología se utilizan comúnmente en los laboratorios para aspirar, expulsar, calentar, agitar y hacer otras cosas con pequeñas muestras líquidas con precisión exacta una y otra vez. Estos robots suelen controlarse mediante códigos informáticos escritos por químicos humanos que podrían estar en el mismo laboratorio o en el otro lado del país.
Esta fue la primera vez que estos robots serían controlados mediante un código informático escrito por IA.
El equipo inició Coscientist con tareas simples que requerían que una máquina robótica manipuladora de líquidos dispensara líquido coloreado en una placa que contenía 96 pocillos pequeños alineados en una cuadrícula. Se le dijo que "coloreara cada dos líneas con un color de su elección", "dibujara una diagonal azul" y otras tareas que recordaban al jardín de infantes.
Después de graduarse de manipulador de líquidos 101, el equipo presentó a Coscientist más tipos de equipos robóticos. Se asociaron con Emerald Cloud Lab, una instalación comercial llena de varios tipos de instrumentos automatizados, incluidos espectrofotómetros, que miden las longitudes de onda de la luz absorbida por muestras químicas. Luego se le presentó a Coscientist un plato que contenía líquidos de tres colores diferentes (rojo, amarillo y azul) y se le pidió que determinara qué colores estaban presentes y dónde estaban en el plato.
Como Coscientist no tiene ojos, escribió un código para pasar robóticamente la placa de color misterioso al espectrofotómetro y analizar las longitudes de onda de luz absorbidas por cada pocillo, identificando así qué colores estaban presentes y su ubicación en la placa. Para esta tarea, los investigadores tuvieron que darle a Coscientist un pequeño empujón en la dirección correcta, indicándole que pensara en cómo los diferentes colores absorben la luz. La IA hizo el resto.
El examen final de Coscientist fue reunir los módulos ensamblados y el entrenamiento para cumplir con la orden del equipo de "realizar reacciones de Suzuki y Sonogashira", llamadas así por sus inventores Akira Suzuki y Kenkichi Sonogashira.
Descubiertas en la década de 1970, las reacciones utilizan el metal paladio para catalizar enlaces entre átomos de carbono en moléculas orgánicas. Las reacciones han demostrado ser extremadamente útiles para producir nuevos tipos de medicamentos para tratar la inflamación, el asma y otras afecciones. También se utilizan en semiconductores orgánicos en OLED que se encuentran en muchos teléfonos inteligentes y monitores. Las reacciones revolucionarias y sus amplios impactos fueron reconocidos formalmente con el Premio Nobel otorgado conjuntamente en 2010 a Sukuzi, Richard Heck y Ei-ichi Negishi.
Por supuesto, Coscientist nunca antes había intentado estas reacciones. Entonces, como hizo este autor para escribir el párrafo anterior, fue a Wikipedia y los buscó.
Gran poder, gran responsabilidad
"Para mí, el momento 'eureka' fue ver cómo formulaba todas las preguntas correctas", afirma MacKnight, quien diseñó el módulo de software que permite a Coscientist buscar documentación técnica.
Coscientist buscó respuestas predominantemente en Wikipedia, junto con una serie de otros sitios, incluidos los de la American Chemical Society, la Royal Society of Chemistry y otros que contienen artículos académicos que describen las reacciones de Suzuki y Sonogashira.
En menos de cuatro minutos, Coscientist había diseñado un procedimiento preciso para producir las reacciones requeridas utilizando productos químicos proporcionados por el equipo. Cuando pretendió realizar su procedimiento en el mundo físico con robots, cometió un error en el código que escribió para controlar un dispositivo que calienta y agita muestras líquidas. Sin que los humanos se lo pidieran, Coscientist detectó el problema, consultó el manual técnico del dispositivo, corrigió su código y volvió a intentarlo.
Los resultados estaban contenidos en unas pocas muestras diminutas de líquido transparente. Boiko analizó las muestras y encontró las características espectrales de las reacciones de Suzuki y Sonogashira.
Gomes se quedó incrédulo cuando Boiko y MacKnight le contaron lo que hizo Coscientist. "Pensé que me estaban tomando el pelo", recuerda. "Pero no lo eran. No lo eran en absoluto. Y fue entonces cuando entendí que, está bien, aquí tenemos algo que es muy nuevo, muy poderoso".
Ese poder potencial conlleva la necesidad de utilizarlo sabiamente y protegerse contra el mal uso. Gomes dice que comprender las capacidades y los límites de la IA es el primer paso para elaborar reglas y políticas informadas que puedan prevenir de manera efectiva los usos dañinos de la IA, ya sea intencional o accidental.
"Necesitamos ser responsables y reflexivos sobre cómo se implementan estas tecnologías", afirma.
Gomes es uno de varios investigadores que brindan asesoramiento y orientación expertos para los esfuerzos del gobierno de EE. UU. para garantizar que la IA se utilice de forma segura, como la orden ejecutiva de octubre de 2023 de la administración Biden sobre el desarrollo de la IA.
Acelerar el descubrimiento, democratizar la ciencia
El mundo natural es prácticamente infinito en tamaño y complejidad y contiene descubrimientos incalculables esperando ser encontrados. Imaginemos nuevos materiales superconductores que aumenten drásticamente la eficiencia energética o compuestos químicos que curen enfermedades que de otro modo serían intratables y prolonguen la vida humana. Y, sin embargo, adquirir la educación y la capacitación necesarias para lograr esos avances es un camino largo y arduo. Convertirse en científico es difícil.
Gomes y su equipo visualizan sistemas asistidos por IA como Coscientist como una solución que pueda cerrar la brecha entre la inmensidad inexplorada de la naturaleza y el hecho de que los científicos capacitados son escasos, y probablemente siempre lo serán.
Los científicos humanos también tienen necesidades humanas, como dormir y ocasionalmente salir del laboratorio. Mientras que la IA guiada por humanos puede "pensar" las 24 horas del día, revolviendo metódicamente cada piedra proverbial, verificando y volviendo a verificar la replicabilidad de sus resultados experimentales. "Podemos tener algo que funcione de forma autónoma, intentando descubrir nuevos fenómenos, nuevas reacciones, nuevas ideas", afirma Gomes.
"También se pueden reducir significativamente las barreras de entrada para prácticamente cualquier campo", afirma. Por ejemplo, si un biólogo no capacitado en reacciones de Suzuki quisiera explorar su uso de una manera nueva, podría pedirle a Coscientist que lo ayude a planificar experimentos.
"Se puede lograr esta democratización masiva de los recursos y la comprensión", explica.
Hay un proceso iterativo en la ciencia de probar algo, fallar, aprender y mejorar, que la IA puede acelerar sustancialmente, dice Gomes. "Eso por sí solo será un cambio dramático."
Más información: Gabe Gomes, Capacidades autónomas de investigación científica de grandes modelos lingüísticos, Naturaleza (2023). DOI:10.1038/s41586-023-06792-0. www.nature.com/articles/s41586-023-06792-0
Información de la revista: Naturaleza
Proporcionado por la Fundación Nacional de Ciencias