Imagínese predecir el orden de llegada exacto del Derby de Kentucky a partir de una fotografía tomada a los 10 segundos de la carrera.
Ese desafío palidece en comparación con lo que enfrentan los investigadores cuando utilizan la secuenciación de ARN unicelular (scRNA-seq) para estudiar cómo se desarrollan los embriones, se diferencian las células, se forman los cánceres y cómo reacciona el sistema inmunológico.
En un artículo publicado hoy en Proceedings of the National Academy of Sciences , investigadores de la Escuela de Ingeniería Molecular Pritzker de UChicago y el Departamento de Química han creado TopicVelo, un nuevo y poderoso método que utiliza instantáneas estáticas de scRNA-seq para estudiar cómo las células y los genes cambian con el tiempo.
El equipo adoptó un enfoque colaborativo interdisciplinario, incorporando conceptos del aprendizaje automático clásico, la biología computacional y la química.
"En términos de aprendizaje automático no supervisado, utilizamos una idea muy simple y bien establecida. Y en términos del modelo transcripcional que utilizamos, también es una idea muy simple y antigua. Pero cuando las juntas, hacen algo más poderoso. de lo que cabría esperar", dijo Samantha Riesenfeld, profesora asistente de ingeniería molecular y medicina de PME, quien escribió el artículo con el profesor Suriyanarayanan Vaikuntanathan del Departamento de Química y su estudiante conjunto, el Ph.D. de Química de UChicago. candidato Cheng Frank Gao.
Los investigadores utilizan scRNA-seq para obtener mediciones potentes y detalladas, pero estáticas por naturaleza.
"Desarrollamos TopicVelo para inferir transiciones del estado celular a partir de datos de scRNA-seq", dijo Riesenfeld. "Es difícil hacer eso a partir de este tipo de datos porque scRNA-seq es destructivo. Cuando se mide la célula de esta manera, se destruye la célula".
Esto deja a los investigadores una instantánea del momento en que se midió/destruyó la célula. Si bien scRNA-seq proporciona la mejor instantánea disponible de todo el transcriptoma, la información que muchos investigadores necesitan es cómo las células realizan la transición con el tiempo. . Necesitan saber cómo una célula se vuelve cancerosa o cómo se comporta un programa genético particular durante una respuesta inmune.
Para ayudar a descubrir procesos dinámicos a partir de una instantánea estática, los investigadores utilizan tradicionalmente lo que se llama "pseudotiempo". Es imposible observar cómo cambia y crece la expresión de una célula o gen individual en una imagen fija, pero esa imagen también capturó otras células y genes del mismo tipo que podrían estar un poco más adelante en el mismo proceso. Si los científicos conectan los puntos correctamente, pueden obtener información valiosa sobre cómo se ve el proceso a lo largo del tiempo.
Conectar esos puntos es una conjetura difícil, basada en la suposición de que células de aspecto similar se encuentran simplemente en puntos diferentes a lo largo del mismo camino. La biología es mucho más complicada, con comienzos en falso, paradas, estallidos y múltiples fuerzas químicas tirando de cada gen.
En lugar de los enfoques tradicionales de pseudotiempo, que analizan la similitud de expresión entre los perfiles transcripcionales de las células, los enfoques de velocidad del ARN analizan la dinámica de la transcripción, el empalme y la degradación del ARNm dentro de esas células.
Es una tecnología prometedora pero temprana.
"La persistente brecha entre la promesa y la realidad de la velocidad del ARN ha restringido en gran medida su aplicación", escribieron los autores en el artículo.
Para cerrar esta brecha, TopicVelo deja de lado los modelos deterministas y adopta (y obtiene información de) un modelo estocástico mucho más difícil que refleja la ineludible aleatoriedad de la biología.
"Las células, cuando se piensa en ellas, son intrínsecamente aleatorias", dijo Gao, el primer autor del artículo. "Puedes tener gemelos o células genéticamente idénticas que crecerán hasta ser muy diferentes. TopicVelo introduce el uso de un modelo estocástico. Podemos capturar mejor la biofísica subyacente en los procesos de transcripción que son importantes para la transcripción del ARNm". /P>
El equipo también se dio cuenta de que otra suposición limita la velocidad estándar del ARN. "La mayoría de los métodos suponen que todas las células expresan básicamente el mismo gran programa genético, pero se puede imaginar que las células tienen que realizar diferentes tipos de procesos simultáneamente, en distintos grados", dijo Riesenfeld. Desenmarañar estos procesos es un desafío.
El modelado probabilístico de temas, una herramienta de aprendizaje automático utilizada tradicionalmente para identificar temas a partir de documentos escritos, proporcionó una estrategia al equipo de UChicago. TopicVelo agrupa los datos de scRNA-seq no por los tipos de células o genes, sino por los procesos en los que están involucrados esas células y genes. Los procesos se infieren a partir de los datos, en lugar de ser impuestos por el conocimiento externo.
"Si miras una revista de ciencia, estará organizada en temas como 'física', 'química' y 'astrofísica', ese tipo de cosas", dijo Gao. "Aplicamos este principio de organización a los datos de secuenciación de ARN unicelular. Así que ahora podemos organizar nuestros datos por temas, como 'síntesis ribosomal', 'diferenciación', 'respuesta inmune' y 'ciclo celular'. Y podemos ajustar modelos transcripcionales estocásticos específicos de cada proceso."
Después de que TopicVelo desenreda este caos de procesos y los organiza por tema, aplica pesos de tema nuevamente a las celdas, para tener en cuenta qué porcentaje del perfil transcripcional de cada celda está involucrado en qué actividad.
Según Riesenfeld, "este enfoque nos ayuda a observar la dinámica de diferentes procesos y comprender su importancia en diferentes células. Y eso es especialmente útil cuando hay puntos de ramificación o cuando una célula es arrastrada en diferentes direcciones".
Los resultados de combinar el modelo estocástico con el modelo temático son sorprendentes. Por ejemplo, TopicVelo pudo reconstruir trayectorias que antes requerían técnicas experimentales especiales para recuperarse. Estas mejoras amplían enormemente las aplicaciones potenciales.
Gao comparó los hallazgos del artículo con el artículo mismo:el producto de muchas áreas de estudio y experiencia.
"En PME, si tienes un proyecto de química, es probable que haya un estudiante de física o ingeniería trabajando en él", dijo. "Nunca es sólo química."
Más información: Cheng Frank Gao et al, Disección e integración de dinámica transcripcional en ráfagas para sistemas complejos, Actas de la Academia Nacional de Ciencias (2024). DOI:10.1073/pnas.2306901121
Información de la revista: Actas de la Academia Nacional de Ciencias
Proporcionado por la Universidad de Chicago