Campo de sorgo, un cultivo importante utilizado como alimento y en la producción de biocombustibles. Crédito:Pixabay
¿Cómo podría afectar la inteligencia artificial (IA) a la agricultura, la industria alimentaria, y el campo de la bioingeniería? Dan Jacobson, un miembro del personal de investigación y desarrollo de la División de Biociencias del Laboratorio Nacional Oak Ridge (ORNL) del Departamento de Energía de EE. UU. (DOE), tiene algunas ideas.
Durante los últimos 5 años, Jacobson y su equipo han estudiado plantas para comprender las variables genéticas y los patrones que las hacen adaptables a entornos y climas cambiantes. Como biólogo computacional, Jacobson utiliza algunas de las supercomputadoras más poderosas del mundo para su trabajo, incluida la Cray XK7 Titan recientemente desmantelada y la supercomputadora más poderosa e inteligente del mundo para la ciencia abierta. la supercomputadora IBM AC922 Summit, ambos ubicados en Oak Ridge Leadership Computing Facility (OLCF), una instalación para usuarios de la Oficina de Ciencias del DOE en ORNL.
El año pasado, Jacobson y su equipo ganaron un premio Gordon Bell de la Asociación de Maquinaria de Computación después de usar una técnica de computación especial conocida como "precisión mixta" en Summit para convertirse en el primer grupo en alcanzar una velocidad de exaescala, aproximadamente un trillón de cálculos por segundo.
El equipo de Jacobson está trabajando actualmente en numerosos proyectos que forman una hoja de ruta integrada para el futuro de la IA en el fitomejoramiento y la bioenergía. El trabajo del equipo se presentó en Tendencias en biotecnología en octubre.
En esta sesión de preguntas y respuestas, Jacobson habla sobre el trabajo de su equipo en un algoritmo de selección genómica, su visión para el futuro de la genómica ambiental, y el espacio donde la simulación se encuentra con la IA.
¿En qué ha estado trabajando su equipo durante el último año?
Jacobson:Hemos estado trabajando en un par de cosas. Recientemente, hemos desarrollado nuevas formas de hacer lo que se llama "selección genómica, "o diseñar un organismo con fines de reproducción. Hemos desarrollado un nuevo algoritmo de selección genómica impulsado por métodos emergentes de aprendizaje automático llamados colectivamente" IA explicable ". "que es un campo que mejora los métodos de IA del clasificador de caja negra al intentar comprender cómo estos algoritmos toman decisiones.
Este algoritmo nos ayuda a determinar qué variaciones en un genoma necesitamos combinar para producir plantas que puedan adaptarse a sus entornos. Esto informa los esfuerzos de cría, esfuerzos de edición de genes, o combinaciones de esos, dependiendo del tipo de estrategia de bioingeniería que desee adoptar.
El año pasado ganó un premio Gordon Bell después de romper la barrera de la exaescala con un código que le permite estudiar las interacciones combinatorias entre organismos y sus entornos. ¿Cómo encaja este algoritmo en esa investigación?
Jacobson:Seguimos usando el modelo que usamos el año pasado, pero ahora, Hemos introducido este algoritmo de selección genómica impulsado por IA en nuestro código de métricas combinatorias [CoMet] y lo estamos alimentando con información ambiental todos los días del año. para que podamos hacer estudios de asociación de todo el genoma a lo largo del tiempo climático.
Adicionalmente, Hemos expandido a escala global nuestros esfuerzos en lo que llamamos "climatipos":la información climática y ambiental a la que se están adaptando las plantas. Con la ayuda de Peter Thornton de ORNL y la experiencia de su grupo en biogeografía y clima, construimos modelos de cada kilómetro cuadrado de tierra del planeta y codificamos 50 años de datos ambientales y climáticos en estos modelos, que van desde el suelo, a través de la calidad espectral de la luz, y todo lo demás.
Para comprender todas las relaciones entre diferentes entornos, comparamos estos entornos entre sí en Summit usando un nuevo algoritmo llamado Duo que agregamos a nuestra base de código CoMet. Hasta donde sabemos, este es el cálculo científico más grande jamás realizado.
Eso suena como un gran logro. ¿Qué tipo de información te pueden dar estas comparaciones?
Jacobson:Estas comparaciones pueden ayudarnos a determinar exactamente dónde podemos apuntar a ciertos entornos y qué mutaciones genéticas y alelos debemos incluir para ayudar a estas plantas a adaptarse a diferentes entornos. Podemos mirar un entorno y decir:"Para este entorno, esto es lo que necesitaremos tener en el genoma de esta planta para que prospere lo mejor que pueda ".
¿Es este el futuro de la genómica ambiental?
Jacobson:La visión integrada que vemos es la conexión de todas las capas "-omics", de la genómica (expresión génica), proteómica (expresión de proteínas), y metabolómica (expresión de metabolitos) a lo largo de los fenotipos:rasgos observables; asi que, del genoma al fenoma y todo lo demás.
Idealmente, nos gustaría tener una combinación de datos de genotipo con datos climáticos y ambientales en un modelo integrado, desde nucleótidos individuales, las estructuras moleculares que componen el ADN, hasta el medio ambiente y el clima a escala planetaria. Estos modelos integrados completos son ahora posibles porque en realidad hemos calculado la escala espectral de luz de cada punto del planeta; ese es un fenotipo astrofísico que proviene de nuestra estrella más cercana, el sol.
Primero, necesitamos observar las interacciones combinatorias en dichos modelos para ver cómo conducen a las propiedades emergentes que estamos tratando de optimizar en las plantas para la productividad y la sostenibilidad futuras. Luego, podemos conectar eso con cómo las plantas se han adaptado históricamente a los entornos para diseñar nuevos genotipos ideales para la bioenergía o la producción de alimentos que estén optimizados para prosperar en entornos específicos.
¿Es esto algo que se requerirá en la agricultura en el futuro?
Jacobson:A medida que el mundo cambia, hay una presión cada vez mayor para utilizar "tierras marginales, "se trata de tierras que a menudo no se utilizan actualmente para la agricultura o que no se utilizan de forma eficiente para la agricultura. Por lo tanto, si diseñamos genotipos que prosperan en estos entornos marginales, podremos aumentar nuestra producción de alimentos además de nuestra producción de energía. Esta es una tecnología de doble uso.
También estamos realmente preocupados por la fertilización excesiva de la tierra porque puede conducir a una escorrentía que tiene grandes consecuencias ecológicas. Si podemos optimizar las plantas para que utilicen los nutrientes que están allí con poco fertilizante adicional, eso también es un gran beneficio para la sostenibilidad. Entonces, Realmente estamos tratando de ver esto de manera integral y construir la mayor cantidad posible de estas adaptaciones en el modelo para que conozcamos los efectos en ciertos entornos.
¿En qué estás trabajando a continuación?
Jacobson:El siguiente paso es observar los datos históricos y todas estas relaciones y luego proyectar hacia adelante para que podamos diseñar genotipos que no solo prosperarán en las zonas ambientales actuales, sino que continuarán prosperando en el futuro a medida que cambia la red global. La capacidad de proyectar hacia adelante, tanto para cultivos anuales como para cultivos perennes a largo plazo, es realmente importante.
¿Cuáles son algunos de los desafíos pendientes?
Jacobson:Todo lo que estamos haciendo es un trabajo pesado, pero estamos viendo cómo podemos diseñar este nuevo enfoque en Summit y el futuro sistema de exaescala de la OLCF, Frontera, para que podamos comprender realmente todas estas relaciones. También, ahora que tenemos estos datos en todas estas capas "-omics", tenemos que ejecutar estas combinaciones de capas, llamadas politopos, miles o decenas de miles o cientos de miles de veces. El siguiente conjunto de algoritmos que estamos construyendo es encontrar todas las relaciones y asociaciones posibles dentro y entre todos los politopos. Esa es la próxima frontera.
¿Se cruzará su trabajo con los modelos tradicionales de simulación climática?
Jacobson:Esta es una vista basada en datos e inteligencia artificial de la información climática, que es diferente de un enfoque de simulación. Tiempo extraordinario, será interesante ver dónde se cruzan, y puede haber cosas que aprendamos aquí que sean muy informativas para los modelos climáticos y viceversa. También sabemos que este mismo tipo de tecnología de inteligencia artificial explicable puede ayudar mucho con los estudios de simulación. Idealmente, Podríamos desarrollar modelos explicables basados en IA que puedan ayudar a los modelos de simulación con algunos de sus cuellos de botella. Si podemos aprender los patrones que utilizan los modelos de simulación y reemplazar algunos de sus cuellos de botella con un resultado aprendido, entonces esos modelos pueden hacer cosas más creativas. Ahí es realmente donde podríamos ver que parte de este espacio se cruza en el futuro.