Crédito:Meletios Verras/Shutterstock
A veces no sabes lo que estás buscando hasta que lo encuentras; y esto es especialmente cierto cuando se trata de los enormes conjuntos de datos que se pueden generar utilizando técnicas modernas de secuenciación. Ahora, investigadores de Japón informan sobre el desarrollo de un marco estadístico que puede realizar una extracción imparcial de comunicaciones célula-célula biológicamente relevantes de un mar de datos de expresión génica espacial.
En un estudio publicado en septiembre en Bioinformatics , investigadores de la Universidad de Tsukuba han revelado que un nuevo método de análisis estadístico puede identificar con precisión la comunicación célula-célula que afecta la expresión génica a nivel de una sola célula.
La comunicación entre las células regula la expresión génica de maneras que son cruciales para el funcionamiento normal y el desarrollo de enfermedades. Si bien la secuenciación de ARN de una sola célula y la transcriptómica resuelta espacialmente pueden proporcionar una idea de esta comunicación, los métodos actuales para analizar este tipo de datos tienen algunas limitaciones importantes.
"La mayoría de los métodos de análisis estadístico existentes no tienen en cuenta la organización espacial de las células dentro de un órgano compuesto por varios tipos de células", afirma la profesora asociada Haruka Ozaki, autora principal del estudio. "Sin embargo, la ubicación de las células, el número de células y los tipos de células en las inmediaciones afectan la expresión génica en las células vecinas".
Para capturar esta complejidad, los investigadores crearon un marco estadístico llamado CCPLS (análisis de comunicaciones célula-célula mediante modelos de regresión de mínimos cuadrados parciales) que analiza los datos de expresión génica espacial con resolución de una sola célula. El objetivo de este sistema era identificar y cuantificar la influencia de los tipos de células vecinas en la variabilidad de célula a célula en la expresión génica.
"Primero aplicamos CCPLS a un conjunto de datos simulados y descubrimos que estimaba con precisión los efectos de múltiples tipos de células vecinas en la expresión génica", dice el profesor asociado Ozaki. "Luego, aplicamos el sistema a un conjunto de datos del mundo real y demostramos que los astrocitos promueven la diferenciación de células precursoras de oligodendrocitos en oligodendrocitos, lo cual es consistente con experimentos anteriores con ratones".
Luego, CCPLS se aplicó a otro conjunto de datos del mundo real que contenía datos de expresión génica de nueve tipos de células diferentes que se encuentran en el colon. El análisis mostró que el desarrollo de las células epiteliales de las células B inmaduras se produce a través de la comunicación con las células B IgA, algo que no se había informado anteriormente.
"Nuestros hallazgos muestran que CCPLS se puede utilizar para extraer conocimientos biológicamente relevantes sobre las comunicaciones célula-célula a partir de conjuntos de datos complejos", afirma el profesor Ozaki.
Dado que CCPLS superó un marco estadístico existente en la identificación de la variabilidad de la expresión génica regulada por la comunicación célula-célula, es probable que sea una herramienta muy útil para el análisis de conjuntos de datos en el futuro. Puede ser particularmente efectivo para explorar objetivos farmacológicos y en los casos en que la disposición de las células provoque cambios en la expresión génica. Métodos matemáticos para analizar datos transcriptómicos de una sola célula