- Entrada:datos de secuencia de ARN unicelular (matriz de recuento)
- Control de calidad (QC):elimina células y genes de baja calidad.
- Normalización de datos:normalice los datos para corregir sesgos técnicos.
2. Agrupación
- Realizar agrupaciones en los datos normalizados para identificar grupos de células.
- Se pueden utilizar diferentes métodos de agrupación (por ejemplo, k-medias, agrupación jerárquica, Lovaina)
3. Identificación del gen marcador
- Para cada grupo:
- Calcular la expresión media de cada gen en las células del grupo.
- Comparar la expresión media de genes en el grupo con la de otros grupos.
- Identificar genes que están altamente expresados en el grupo en comparación con otros grupos
4. Validación del gen marcador
- Se pueden aplicar criterios adicionales para seleccionar genes marcadores:
- Cambio de pliegue:Considere genes con un alto cambio de pliegue entre el grupo y otros grupos.
- Significancia estadística:utilice pruebas estadísticas (p. ej., prueba t, prueba de Wilcoxon) para evaluar la importancia de las diferencias de expresión
- Especificidad:Garantizar que los genes marcadores se expresen selectivamente en el grupo de interés.
5. Interpretación y Visualización
- Analizar las funciones y vías asociadas a los genes marcadores identificados.
- Genere mapas de calor, gráficos de volcanes u otras visualizaciones para presentar los genes marcadores y sus patrones de expresión.
6. Validación en conjuntos de datos independientes (opcional)
- Para aumentar la confianza, valide los genes marcadores identificados en un conjunto de datos independiente, si está disponible.