Pasos para construir la matriz de diseño inicial X. (a) TRP de tx1, tx2, tx3 y tx4, y el resumen de patrones de ocupación binarios de los PRT. La transcripción tx5 no pasa el filtrado (H =2.5%) y se filtra de TRP1. En cada patrón binario, dígito 1 significa que hay lecturas que se originan en una eqclass, y 0 en caso contrario. Por ejemplo, hay tres eqclasses en TRP1:eqclass1, eqclass2 y eqclass3. Para eq1 el patrón binario es 1101, lo que significa tres transcripciones, es decir, tx1, tx2 y tx4 tienen lecturas de eq1. (b) Transcripción de vecinos (TN) para tx1 a tx4. (c) Ilustración de la construcción de un grupo de transcripción (TC) a partir de las TN. Primero recopilamos los TN de tx1, tx2, tx3 y tx4, y luego agregue las conexiones entre las transcripciones en el TC. Por ejemplo, desde TN1, agregamos la conexión de tx1-tx2, tx1-tx3 y tx1-tx4. En el final, un TC contendría todas las conexiones entre transcripciones que comparten exones. (d) Se mantiene el conjunto único de patrones binarios, por lo que quedan tres patrones únicos:1101, 1001, 1110. Luego, completamos los recuentos de lectura de cada TRP de fuente. Por ejemplo, para el patrón 1101, en TRP1, el recuento de lecturas es 20 para tx1, en TRP2 la cuenta de lectura es 120 para tx2 y en TRP4 la cuenta de lectura es 150 para tx4. (e) Las lecturas totales de cada transcripción en (d) se estandarizan para sumar 1 para crear la matriz de diseño inicial X. Crédito:DOI:10.1093 / bioinformatics / btz640
La tecnología ómica de alto rendimiento ha revolucionado la investigación biológica y biomédica y se han producido grandes volúmenes de datos ómicos. Para esto, Se han desarrollado herramientas computacionales para administrar y analizar los datos ómicos y existen grandes desafíos en cómo procesar e interpretar los datos ómicos de la mejor manera. Wenjiang Deng ha trabajado para desarrollar metodologías y algoritmos estadísticos novedosos para el análisis de datos ómicos, utilizando datos de cáncer tanto simulados como reales para probar los métodos.
¿Podría describir algunos de los resultados de su tesis?
Sí, en mi primer estudio, identificamos varios genes asociados con la supervivencia de pacientes con neuroblastoma de alto riesgo, dice Wenjiang Deng, Doctor. estudiante del Departamento de epidemiología médica y bioestadística, MEB. El neuroblastoma es el cáncer más común y mortal en niños pequeños menores de cinco años. Creemos que nuestros hallazgos proporcionarán evidencia significativa para el tratamiento y manejo de los pacientes. Nuestros resultados también pueden ser significativos para comprender los mecanismos fisiológicos de la enfermedad.
¿Cómo es que eligió estudiar esta área en particular?
Vivimos en la era del "big data, "y los datos de secuenciación de alto rendimiento son los" macrodatos "predominantes en las ciencias biológicas. Cuando escuché por primera vez el concepto de datos ómicos, Me sorprendió su enorme volumen y el gran potencial de la investigación médica. Hoy en día es bastante fácil producir datos de secuenciación, pero aún necesitamos herramientas eficientes y precisas para analizarlos, así que decidí estudiar el desarrollo de algoritmos durante mi tiempo como Ph.D. estudiante.
¿Que vas a hacer despues?
Después de mi defensa, Me quedaré en MEB por un tiempo para terminar mis manuscritos. Luego iré a Shenzhen, Porcelana, y empezar a trabajar en una empresa de biotecnología que tiene como objetivo desarrollar nuevos métodos para el diagnóstico precoz de cánceres. Espero que nuestro trabajo allí contribuya a la salud general de los seres humanos.