• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  •  Science >> Ciencia >  >> Biología
    El nuevo marco de aprendizaje profundo multitarea integra datos de proteómica y transcriptómica unicelulares a gran escala
    Integración del atlas de células COVID-19. Crédito:Ciencia avanzada (2024). DOI:10.1002/advs.202307835

    El progreso exponencial en las tecnologías multiómicas unicelulares ha llevado a la acumulación de conjuntos de datos multiómicas grandes y diversos. Sin embargo, la integración de datos de proteómica y transcriptómica (o epigenómica) unicelulares plantea un desafío importante para los métodos existentes. Varios modelos basados ​​en transformadores, como Geneformer, han cambiado significativamente el paradigma del análisis del transcriptoma unicelular. Sin embargo, estos métodos imponen demandas significativas de recursos computacionales.

    Para abordar estos desafíos, investigadores del Jardín Botánico de Wuhan de la Academia de Ciencias de China han desarrollado un método basado en transformadores, llamado scmFormer, para integrar datos proteómicos y transcriptómicos unicelulares a gran escala utilizando un transformador multitarea. El estudio titulado "scmFormer integra datos de proteómica y transcriptómica unicelulares a gran escala mediante un transformador multitarea" se publicó en Advanced Science .

    Los investigadores presentaron una evaluación exhaustiva e hicieron estudios de casos de este método; los resultados mostraron que scmFormer exhibió una notable competencia en la armonización de conjuntos de datos ómicos unicelulares a gran escala más proteómica tanto a nivel de tipo celular como a nivel celular de escala más fina con recursos informáticos limitados.

    Además, scmFormer posee la capacidad de integrar múltiples conjuntos de datos multimodales emparejados unicelulares, lo que genera el doble beneficio de reducir el alto costo y mejorar los conocimientos biológicos.

    Además, scmFormer muestra una capacidad excepcional para eliminar diferencias técnicas entre diferentes modalidades ómicas y al mismo tiempo preservar la información biológica subyacente inherente a los datos, que abarca tanto los tipos de células como las condiciones experimentales.

    La aplicación de scmFormer para la integración de dos conjuntos de datos de COVID-19 con 1,48 millones de células demostró aún más la clara ventaja de scmFormer para manejar grandes conjuntos de datos en computadoras portátiles normales.

    Más información: Jing Xu et al, scmFormer integra datos de proteómica y transcriptómica unicelulares a gran escala mediante un transformador multitarea, Ciencia avanzada (2024). DOI:10.1002/adv.202307835

    Información de la revista: Ciencia avanzada

    Proporcionado por la Academia China de Ciencias




    © Ciencia https://es.scienceaq.com