Los científicos que trabajan en el campo de la química orgánica crean y estudian nuevas moléculas utilizando resonancia magnética. Los estándares utilizados para volver a transcribir los datos recopilados son, sin embargo, específicos de cada laboratorio o publicación, dificultando la exportación de la información de forma electrónica y, por tanto, su uso por la comunidad científica. Un equipo internacional encabezado por químicos de la Universidad de Ginebra (UNIGE) ha desarrollado un nuevo lenguaje electrónico común que traduce los datos de cada molécula exactamente de la misma manera y simplifica su exportación de un sistema de información a otro. Esto significa que los químicos de todo el mundo pueden acceder directamente a datos reutilizables con facilidad, resultando en un importante ahorro de tiempo para futuras investigaciones. Este estudio, publicado en la revista Resonancia magnética en química , allana el camino para la creación de un base de datos de acceso abierto y herramientas específicas, incluido el análisis de inteligencia artificial.
Los químicos orgánicos crean nuevas moléculas basadas en átomos de carbono; estos son tan pequeños, sin embargo, que es imposible ver lo que sintetizan. Los investigadores utilizan la resonancia magnética para verificar estas composiciones que se hacen "ciegas":cada átomo que forma la molécula emite una señal, cuya frecuencia se traduce en forma de espectro que luego los químicos pueden decodificar. Para determinar la estructura de una molécula, los investigadores deben poder "leer" los espectros de resonancia magnética.
Los químicos tienen un vocabulario específico para describir espectros y detallar la resonancia de los átomos. Pero la forma en que los datos brutos se traducen a un lenguaje escrito varía según el laboratorio individual, el software utilizado y la publicación en particular. En breve, no hay una base de datos disponible para las estructuras moleculares asignadas o uniformidad en la forma en que se procesan los espectros y los datos que se les atribuyen. "Por eso es muy difícil reutilizar los datos generados por otros laboratorios, "explica Damien Jeannerat, investigador del Departamento de Química Orgánica de la Facultad de Ciencias de UNIGE. "Así que se nos ocurrió la idea de diseñar un único lenguaje electrónico que se pueda utilizar para cambiar de un sistema a otro sin perder precisión. y construir una internacional, base de datos de acceso abierto ".
Los químicos de UNIGE se asociaron con especialistas de campo e introdujeron un nuevo lenguaje electrónico que puede servir como estándar para procesar datos de moléculas orgánicas. "Nuestro nuevo formato, llamado NMReDATA, opera de acuerdo con un sistema de etiquetas que se asignan a cada elemento de datos extraídos de los espectros en un orden definido, y que puede leerse fácilmente en una computadora, "dice Marion Pupier, ingeniero químico en el Departamento de Química Orgánica de UNIGE. La frecuencia de cada átomo se describirá en una secuencia que muestra el cambio químico, el número de átomos, los acoplamientos, las correlaciones interatómicas y finalmente las asignaciones. "Hasta ahora, todos han usado su propia secuencia para transmitir la misma información, imposibilitando la transferencia electrónica de una computadora a otra y obligando a los investigadores a monitorear y reorganizar constantemente la información. Pero no será necesario hacer esto con nuestro sistema, gracias a la uniformidad del lenguaje, "dice Damien Jeannerat.
La idea de un lenguaje electrónico común está estrechamente relacionada con el deseo de crear bases de datos de acceso abierto. "Esto permitiría a los químicos encontrar la composición exacta de las moléculas que están estudiando sin tener que volver a hacer el trabajo que ya se ha hecho en el pasado". "dice Marion Pupier. La información estará visible y disponible en cualquier lugar y en cualquier momento, ahorrando tiempo y dinero considerables para la investigación de la química orgánica.
Ahora solo queda difundir el nuevo formato y establecerlo como norma para la publicación de artículos en las principales revistas internacionales. "Esperamos que todo el software esté completamente operativo en aproximadamente un año, y que NMReDATA será utilizado por todos, "dice Jeannerat a modo de conclusión.