Un software de reconocimiento de imágenes y nanoporos puede secuenciar un glicosaminoglicano sulfatado en tiempo real. Crédito:Instituto Politécnico Rensselaer
Usando un nanoporo, Los investigadores han demostrado el potencial de reducir el tiempo necesario para secuenciar un glicosaminoglicano, una clase de moléculas de azúcar de cadena larga tan importante para nuestra biología como el ADN, de años a minutos.
Como se publicó esta semana en el Actas de las Academias Nacionales de Ciencias , un equipo del Instituto Politécnico Rensselaer demostró que el software de reconocimiento de imágenes y aprendizaje automático se puede utilizar para identificar de forma rápida y precisa las cadenas de azúcar, específicamente, cuatro heparán sulfatos sintéticos, basados en las señales eléctricas generadas al pasar a través de un pequeño orificio en una oblea de cristal.
"Los glicosaminoglicanos son un repertorio complejo de secuencias, como la obra de Shakespeare o un poema de Yates es una compleja colección de letras. Se necesita un experto para escribirlos y un experto para leerlos, "dijo Robert Linhardt, investigador principal y profesor de química y biología química en el Instituto Politécnico Rensselaer. "Hemos entrenado una máquina para que lea rápidamente el equivalente de palabras con cuatro letras como 'ababab' o 'bcbcbc'. Estas son secuencias simples que no tienen ningún significado, pero nos muestran que a la máquina se le puede enseñar a leer. Si ampliamos y desarrollamos esta tecnología, tiene el potencial de secuenciar los glucanos o incluso las proteínas en tiempo real, eliminando años de esfuerzo ".
Se utilizan dispositivos comerciales de secuenciación de nanoporos para secuenciar el ADN, que se compone de cuatro unidades de ácido nucleico, conocido por las letras A, C, GRAMO, y T, encadenados en una variedad infinita de configuraciones. El dispositivo se basa en una corriente iónica que atraviesa un orificio de solo unas mil millonésimas de metro de ancho en una membrana. Se colocan hebras de ADN en un lado del agujero, y atravesado por el flujo de la corriente. Cada ácido nucleico bloquea un poco el orificio a medida que lo atraviesa, interrumpiendo la corriente y produciendo una señal particular asociada con ese ácido nucleico. Los dispositivos, utilizado actualmente para el trabajo de campo, son sólo una de varias técnicas relativamente rápidas y automatizadas para secuenciar el ADN.
Glicosaminoglicanos, o GAG, son una clase de glucanos estructuralmente compleja, los azúcares esenciales presentes en los organismos vivos, que se encuentran en las superficies celulares y la matriz extracelular de todos los animales y realizan muchas funciones en el crecimiento celular y la señalización. anticoagulación y reparación de heridas, y mantener la adhesión celular. GAG, actualmente extraído de animales sacrificados, se utilizan como fármacos y nutracéuticos.
Como el ADN Los GAG se pueden subdividir en sus unidades de azúcar disacáridos constituyentes. Pero mientras que el ADN está hecho de solo cuatro letras en una cadena lineal, estos glucanos tienen docenas de unidades básicas, algunos con grupos sulfato adjuntos, grupos ácidos, y grupos amida. Por ejemplo, incluso una molécula de sulfato de heparán de origen natural relativamente pequeña de seis unidades de azúcar podría tener 32, 768 secuencias posibles. Debido al desafío, la secuenciación de glucanos sigue siendo onerosa, confiando en un minucioso trabajo de laboratorio y un análisis sofisticado, que involucran técnicas con nombres como cromatografía líquida-espectrometría de masas en tándem y espectroscopía de resonancia magnética nuclear.
Como parte de su trabajo, Linhardt, un experto en glucanos que desarrolló una variante sintética del anticoagulante común heparina, secuencias de GAG para comprender formas naturales y desarrollar variantes sintéticas.
"Utilizando métodos analíticos estándar, tardamos dos años en secuenciar el primer GAG simple, "dijo Linhardt, miembro del Centro Rensselaer de Biotecnología y Estudios Interdisciplinarios. "Tenemos otro en el que hemos trabajado la mayor parte de la secuencia, y nos ha llevado más de cinco años, y probablemente nos llevará otros cinco años terminarlo, "
Razonando que la secuenciación de nanoporos podría usarse para identificar las unidades de disacáridos en un GAG, El equipo de investigación construyó su propio dispositivo de nanoporos y sintetizó cuatro cadenas GAG de heparán sulfato utilizando el proceso quimioenzimático desarrollado por el Linhardt Lab. En tono rimbombante, Estos cuatro heparán sulfatos eran muy simples:hechos con combinaciones de solo cuatro tipos diferentes de unidades de azúcar, ensamblados en una cadena de unas 40 unidades de largo, y con una composición y secuencia cuidadosamente controladas.
El equipo pasó cada sulfato de heparán a través del nanoporo y produjo un gráfico que representa el voltaje a lo largo del tiempo de salida del dispositivo. Cada una de las cuatro variantes se ejecutó a través del dispositivo más de 2, 000 veces, aumentando la probabilidad estadística de una lectura precisa dado el diseño rudimentario del nanoporo experimental.
"El dispositivo secuenció el heparán sulfato más simple en tiempo real y produjo un patrón que nuestros ojos podían reconocer fácilmente de inmediato para cada una de las cuatro muestras, "Dijo Linhardt." Se puede decir inmediatamente que son diferentes ".
Para garantizar un análisis imparcial, el equipo introdujo los resultados en un software gratuito de reconocimiento de imágenes y aprendizaje automático mediante la red neuronal profunda de Google, entrenar el software para distinguir entre los cuatro patrones diferentes e identificar cada variante de heparán sulfato. El modelo de aprendizaje automático más exitoso produjo un análisis con una precisión de casi el 97%.
"El contenido de información en una secuencia GAG puede superar en gran medida al de una cantidad similar de ADN o ARN, lo que significa que la capacidad de leer rápidamente secuencias GAG abre una nueva ventana de comprensión de la compleja bioquímica de la vida ", dijo Curt Breneman, decano de la Escuela de Ciencias Rensselaer. "Este estudio de prueba de concepto vincula métodos innovadores de nanodetección con herramientas de aprendizaje automático de última generación, y muestra el poder del pensamiento interdisciplinario para expandir las fronteras del conocimiento ".
Reducir la velocidad a la que los GAG pasan a través del nanoporo podría aumentar la precisión, y el dispositivo se puede entrenar en unidades de azúcar adicionales, y secuencias más complejas, todos los cuales son objetivos de investigación futuros. Linhardt dijo que la máquina tendría que aprender de 10 a 20 unidades de azúcar para secuenciar completamente un GAG.
"Esta es una prueba de concepto; lo hemos hecho leer palabras de dos letras, "Linhardt dijo." Una vez que le enseñamos el alfabeto completo, podrá leer cada secuencia diferente. Podrá leer todas las palabras ".