Crédito:CC0 Public Domain
Los científicos de Johns Hopkins informan que han utilizado con éxito dos tecnologías de genes independientes para ensamblar la secuencia del genoma más completa hasta la fecha de Triticum aestivum, la especie de trigo cultivada más común que se utiliza para hacer pan.
Se publicó un informe sobre el logro en la edición del 23 de octubre de GigaScience solo unas semanas antes de su informe relacionado sobre la secuenciación del "antepasado del trigo harinero, "Aegilops tauschii, publicado el 15 de noviembre en Naturaleza .
Juntos, ellos dicen, Las secuencias del genoma del trigo pueden ayudar a los biólogos no solo a comprender mejor la historia evolutiva del trigo, pero también avanzar en la búsqueda de más resistentes, tipos de trigo más resistentes a las plagas y la sequía para ayudar a alimentar a la creciente población mundial.
"Después de muchos años de intentarlo, finalmente pudimos producir un ensamblaje de alta calidad de este genoma tan desafiante, "dice Steven Salzberg, Doctor., Bloomberg Profesor Distinguido de Ingeniería Biomédica en la Facultad de Ingeniería Whiting de la Universidad Johns Hopkins y el Instituto de Medicina Genética McKusick-Nathans en la Facultad de Medicina de la Universidad Johns Hopkins.
Según los científicos de Johns Hopkins, El trigo harinero tiene uno de los genomas más complejos conocidos por la ciencia, que contiene un estimado de 16 mil millones de pares de bases de ADN y seis copias de siete cromosomas. En comparación, el genoma humano es aproximadamente cinco veces más pequeño, con aproximadamente tres mil millones de pares de bases y dos copias de 23 cromosomas. Las versiones publicadas anteriormente del genoma del trigo harinero han contenido grandes lagunas en su secuencia de ADN altamente repetitiva.
"La naturaleza repetitiva de este genoma dificulta la secuenciación completa, ", dice Salzberg." Es como intentar armar un rompecabezas de una escena de paisaje con un enorme cielo azul. Hay muchos muy similares, piezas pequeñas para montar ".
El genoma del trigo harinero recién ensamblado, que cuesta $ 300, 000 solo para la secuenciación, Los investigadores de Johns Hopkins tardaron un año en reunir 1,5 billones de bases de datos sin procesar en un ensamblaje final de 15,34 mil millones de pares de bases.
Para hacerlo, Salzberg y su equipo utilizaron dos tipos de tecnología de secuenciación del genoma:secuenciación de lectura corta de alto rendimiento y lectura larga, secuenciación de una sola molécula. Como su nombre lo indica, La secuenciación de alto rendimiento genera cantidades masivas de pares de bases de ADN de manera muy rápida y económica, aunque los fragmentos son muy cortos, solo 150 pares de bases para este proyecto. Para ayudar a ensamblar las áreas repetitivas, el equipo de Johns Hopkins utilizó tiempo real, secuenciación de una sola molécula, que lee el ADN a medida que se sintetiza en una pequeña, Bien a nanoescala en un chip. La tecnología permite a los científicos leer hasta 20, 000 pares de bases a la vez midiendo las señales fluorescentes que se emiten a medida que se copia cada base de ADN.
Salzberg dice que secuenciar un genoma de este tamaño requiere no solo experiencia genética, pero también recursos informáticos muy grandes disponibles en relativamente pocas instituciones de investigación en todo el mundo. El equipo se basó en gran medida en el Centro de Computación de Investigación Avanzada de Maryland, un centro de computación compartido por Hopkins y la Universidad de Maryland, que tiene más de 20, 000 núcleos de computadora (CPU) y más de 20 petabytes de almacenamiento de datos. El equipo usó aproximadamente 100 años de CPU para armar este genoma.
Salzberg y su equipo también participaron en el esfuerzo de colaboración reportado en la revista Nature para secuenciar un tipo ancestral de trigo, Aegilops tauschii, que se conoce comúnmente como pasto de cabra y todavía se encuentra en partes de Asia y Europa. Su genoma es aproximadamente un tercio del tamaño del genoma del trigo harinero, pero tiene niveles similares de repetición. La obra, hecho como parte de un esfuerzo de colaboración entre la Universidad de California, Davis; Johns Hopkins; y la Universidad de Georgia, tardó aproximadamente cuatro años en completarse. Usando la secuenciación del genoma de clones ordenados, secuenciación de escopeta y mapeo óptico del genoma, el equipo reunió los 4,3 mil millones de nucleótidos que componen la secuencia genética de la planta. Con esta información, el resto del equipo pudo identificar las secuencias que componen los genes responsables de las características específicas de la planta.