• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  •  Science >> Ciencia >  >> Biología
    Se espera que la IA desvele los secretos de los genes no codificantes
    Crédito:Pixabay/CC0 Dominio público

    Desde chatbots inteligentes hasta aplicaciones que pueden escribir artículos completos, la Inteligencia Artificial (IA) se está convirtiendo en una parte cada vez más omnipresente de nuestras vidas. Michael Schon, investigador asociado de la Universidad e Investigación de Wageningen, está diseñando una herramienta de inteligencia artificial que puede realizar comparaciones de ARN no codificante en genomas de plantas. Se espera que la herramienta acelere y simplifique el desarrollo futuro de nuevas variedades de plantas con mayor resistencia a la sequía o a las enfermedades, por ejemplo.



    Las proteínas son los componentes básicos de las células de los organismos. Las instrucciones para producir estas proteínas son emitidas (codificadas) por el ARN de los genes. Además de estos ARN codificantes, algunos genes pueden producir ARN no codificantes:en otras palabras, ARN que no incluye instrucciones para producir una proteína.

    Este tipo de ARN también desempeña un papel importante en el desarrollo de los organismos, afirma Michael Schon. "Por ejemplo, pueden activar genes o hacer lo contrario y desactivarlos. Esto afectará al aspecto de una planta y a sus propiedades. Ciertos ARN no codificantes importantes también determinan si una planta alcanza la madurez."

    Parientes dentro de la misma familia

    El ARN no codificante también podría revelar por qué una especie de planta pertenece a una familia particular pero tiene características diferentes. En investigaciones anteriores, Schon identificó ARN no codificantes de Arabidopsis thaliana (thale berro). Los científicos utilizan esta planta como organismo modelo.

    "Arabidopsis pertenece a la familia Brassicaceae, junto con cultivos importantes como el brócoli, la coliflor y el colinabo. Esta familia también se conoce como familia de la mostaza o crucíferas. Sin embargo, es difícil comparar los ARN no codificantes de Arabidopsis con el de otras plantas del mundo. familia de la mostaza porque el trabajo previo en estas especies se ha centrado principalmente en genes que codifican proteínas."

    Anotación limitada de ARN no codificante

    Esto significa que una comparación entre plantas requiere una anotación genética separada para el ARN no codificante de cada cultivo. A través de su proyecto Veni, Schon busca nuevas formas de identificar ARN no codificantes utilizando conocimientos de especies relacionadas.

    "Hay más de 200 secuencias genómicas disponibles para plantas de la familia de la mostaza. Cada genoma se almacena como un gran archivo de texto que consta de millones de letras que representan las bases de una molécula de ADN (A, C, T y G). "Los bits codificantes no están catalogados (anotados) adecuadamente en estos genomas, es imposible comparar todos los genes no codificantes dispersos dentro de esta montaña de datos. Necesitamos nuevas estrategias y herramientas para eso. Estoy tratando de desarrollarlas".

    Una pequeña parte de cada genoma

    El primer problema es saber en qué parte del genoma buscar. Una de las herramientas que Schon está desarrollando es algo que él llama GeneSketch. Para encontrar las partes correspondientes de diferentes genomas, utiliza un método llamado Minimizer Sketch.

    "La idea detrás del Minimizer Sketch es que sólo es necesario observar una pequeña porción de ADN (un boceto) en lugar de la secuencia completa", dice Schon. "Eso significa que sólo hay que prestar atención a unos pocos miles de caracteres por genoma para realizar una comparación, en lugar de a millones.

    El Minimizer Sketch se utilizó anteriormente para construir un árbol de la evolución de los primates, que incluye a los humanos y sus parientes más cercanos. Resultó que se puede hacer un árbol genealógico muy preciso de nuestros antepasados ​​a partir de bocetos hechos de menos del 1% de los genomas completos. Por lo tanto, un boceto minimizador es una forma muy eficaz de estimar qué tan similares son las piezas de ADN entre sí, por lo que también debería ser útil para comparar genomas dentro de la familia de la mostaza."

    Misma tecnología que ChatGPT

    Una vez que sepa dónde buscar, el siguiente paso es comprender lo que está mirando. La tecnología que Schon planea utilizar en GeneSketch es la misma que se utiliza actualmente en otras herramientas de inteligencia artificial, como ChatGPT.

    "Es algo que se llama tecnología de 'transformadores'", afirma Schon.

    "Puedes pedirle a un transformador que complete una palabra que falta en una oración, por ejemplo. Inicialmente, el transformador te da una palabra aleatoria porque nunca antes ha visto palabras. Pero si lo entrenas con millones de oraciones de ejemplo, aprende lentamente". adivinar las palabras correctas prestando atención a los patrones en el texto.

    "Después del entrenamiento, un modelo de lenguaje grande como ChatGPT se vuelve muy bueno en ciertas tareas, como responder preguntas o traducir de un idioma a otro. Se puede entrenar a un transformador para que aprenda no solo los lenguajes humanos, sino también el lenguaje del ADN, que tiene su Mis propios patrones distintos. Estoy trabajando en un modelo para detectar patrones en el ADN de muchas especies diferentes y traducir esos patrones a un lenguaje que nosotros, como humanos, podamos entender".

    El modelo debe estar entrenado

    Schon entrenará al transformador de GeneSketch para que preste atención a cómo cambian los genes en diferentes especies, especialmente los genes no codificantes. Pero espera encontrar algunos desafíos en el camino.

    "Una cuestión importante es la confiabilidad. El transformador es una tecnología relativamente nueva y comete errores. ChatGPT, por ejemplo, fue entrenado en muchas fuentes diferentes de texto, pero si le preguntas sobre un tema que nunca vio durante el entrenamiento, necesita Inventa algo. Esperas que invente algo razonable en función de los patrones que ha visto, pero esto nunca es una garantía. Obviamente quieres evitar resultados sin sentido. Cuanto más entrenas un transformador, menos tonterías produce, pero entrena. puede costar mucho tiempo y dinero. ¿Es mejor entrenar el modelo completamente desde cero o construir a partir de modelos existentes? Estoy probando ambos enfoques."

    Potencial del GeneSketch

    Schon espera tener un prototipo de GeneSketch después del primer año del proyecto, que comenzó en octubre de 2023. Planea usarlo para crear anotaciones genéticas para toda la familia de la mostaza.

    La herramienta podría ser útil no sólo para el sector de la investigación sino también para la industria agrícola, afirma Schon. "Podría, por ejemplo, proporcionar a los mejoradores de semillas una forma rápida de comprender el ADN de un cultivo y sus parientes silvestres. Al aprender más sobre cómo los cultivos han podido desarrollar rasgos únicos a lo largo de los siglos, los mejoradores podrían tomar decisiones más informadas para mejorar características, como hacer que los cultivos sean más resistentes al cambio climático. Por lo tanto, el impacto potencial podría ser enorme".

    Proporcionado por la Universidad de Wageningen




    © Ciencia https://es.scienceaq.com