Un bucle de horquilla de un pre-ARNm. Se destacan las nucleobases (verde) y la columna vertebral de ribosa-fosfato (azul). Tenga en cuenta que se trata de una sola hebra de ARN que se pliega sobre sí misma. Crédito:Vossman / Wikipedia
Los biólogos computacionales de la Universidad Carnegie Mellon han desarrollado un método computacional más preciso para reconstruir las secuencias de nucleótidos de longitud completa de los productos de ARN en las células. llamadas transcripciones, que transforman la información de un gen en proteínas u otros productos génicos.
Su software, llamado vieira, ayudará a los científicos a construir una biblioteca más completa de transcripciones de ARN y así ayudará a los científicos a comprender mejor la regulación de la expresión génica.
Un informe sobre Scallop de Carl Kingsford, profesor asociado de biología computacional, y Mingfu Shao, Lane Fellow en el Departamento de Biología Computacional de la Facultad de Ciencias de la Computación, está siendo publicado en línea hoy por la revista Biotecnología de la naturaleza .
Scallop es un ensamblador de transcripciones, tomando fragmentos de secuencias de ARN, llamado lee, que son producidos por tecnologías de secuenciación de ARN de alto rendimiento (RNA-seq), y poniéndolos de nuevo juntos, como piezas de un rompecabezas, para reconstruir transcripciones de ARN completas.
"Hay muchos ensambladores existentes, "Shao dijo, "pero estos métodos existentes todavía no son lo suficientemente precisos".
En comparación con dos ensambladores líderes, StringTie y TransComb, La vieira es un 34,5 por ciento y un 36,3 por ciento más precisa para las transcripciones que constan de múltiples exones, subunidades de un gen que codifica parte del producto génico.
Como otros ensambladores basados en referencias, Scallop comienza construyendo un gráfico para organizar las lecturas que se asignan a las ubicaciones correspondientes en el ADN del gen. Existen muchas rutas alternativas para conectar las lecturas, sin embargo, por lo que los errores se cometen fácilmente. Scallop mejora sus probabilidades mediante el uso de un algoritmo novedoso para aprovechar al máximo la información de las lecturas que abarcan varios exones para guiarlo a las rutas de ensamblaje correctas.
La vieira demuestra ser particularmente hábil al ensamblar transcripciones de ARN menos abundantes, mejorando la precisión de StringTie y TransComb en un 67,5 por ciento y un 52,3 por ciento.
Los investigadores ya han lanzado Scallop como software abierto en el repositorio de GitHub.
"Ya hemos tenido más de 100 descargas y, según los comentarios que hemos recibido, la gente realmente lo está usando, ", Dijo Shao." Esperamos más usuarios ahora que nuestro periódico está agotado ".