Un programa de aprendizaje automático desarrollado por un equipo internacional de investigadores puede ayudar a las empresas farmacéuticas a producir mayores cantidades de medicamentos de vanguardia necesarios para los tratamientos médicos.
En un estudio, el equipo desarrolló un algoritmo informático utilizando datos de expresión génica de células de ovario de hámster chino, una línea celular que los investigadores biofarmacéuticos utilizan a menudo para la investigación médica, para optimizar la producción de proteínas en esas células.
"La industria farmacéutica generalmente se basa en las células de ovario de un hámster chino (células CHO) para la investigación y la creación de medicamentos eficaces. pero, porque las células no producen mucha proteína por célula, requiere una producción a gran escala, "dijo Claudio Angione, profesor titular de informática, Universidad de Teesside. "Lo que mostramos es que, en comparación con otros métodos, La combinación de este modelo metabólico con métodos basados en datos podría ser una gran mejora para la automatización del diseño de cultivos. identificando con precisión las condiciones óptimas de crecimiento para producir compuestos terapéuticos diana ".
Los investigadores, quienes informaron sus hallazgos en la Segunda Conferencia Electrónica Internacional sobre Metabolómica, aprendizaje automático combinado y un modelo computacional que reconstruye el metabolismo de las células de ovario de hámster chino (CHO) para maximizar la eficiencia de la célula.
"Este es un paso novedoso porque, por primera vez, estamos combinando dos metodologías que se suelen utilizar individualmente en estudios de bioprocesamiento, "dijo Angione.
Los investigadores pudieron predecir la producción de lactato, un producto de desecho tóxico, dentro de las células, en términos de sus estados genéticos y metabólicos.
"La producción de lactato generalmente no es deseada ya que dificulta el crecimiento celular y, en consecuencia, limita el rendimiento de los productos deseados, "dijo Macauley Coggins, asistente de investigación, Universidad de Teesside. "Al predecir las condiciones celulares en las que se minimiza la acumulación de lactato, es posible reducir, o posiblemente evitar, una larga serie de ensayos experimentales".
Proteínas terapéuticas, como los que se producen en las células CHO, tienen una amplia gama de aplicaciones en medicina.
"Algunos de ellos se utilizan en vacunas y protegen contra agentes infecciosos como virus, "añadió Guido Zampieri, estudiante de doctorado en genómica y bioinformática, Centro de Biotecnología CRIBI, Universidad de Padua. "Se pueden usar otras proteínas con actividad de dirección especial para tratar a pacientes que carecen de esas proteínas debido a afecciones genéticas. Los medicamentos contra el cáncer son otro ejemplo".
El aprendizaje automático es un campo que explora cómo las computadoras pueden aprender a resolver problemas y realizar tareas específicas sin estar programadas. según Coggins. Para hacer esto, Los investigadores suelen desarrollar un algoritmo para entrenar a una computadora a reconocer patrones, una técnica de aprendizaje automático a la que a menudo se hace referencia como aprendizaje supervisado.
"Es muy parecido a cómo se enseña a un niño a reconocer diferentes formas mostrándoles qué es cada forma y cómo se ve"
En el futuro, este método podría utilizarse para optimizar otros metabolitos o proteínas, sugieren los investigadores. La producción de mayores cantidades de medicamentos también podría conducir a tratamientos menos costosos.
"Vemos varias direcciones de investigación interesantes, "dijo Angione." Principalmente, Nuestro objetivo es impulsar la integración de diferentes metodologías computacionales como el aprendizaje automático y el modelado biológico. Esto es importante ya que poseen diferentes puntos fuertes, que si se combinan podrían permitir la adopción de intervenciones de bioingeniería más precisas.
Particularmente, el aprendizaje automático puede extraer conocimientos útiles de datos experimentales, mientras que el modelado metabólico proporciona información sobre los mecanismos locales y globales en las redes bioquímicas.
"También queremos explorar otros pasos de bioingeniería que podrían beneficiarse de esta optimización integrada. El objetivo final es obtener un conjunto de herramientas computacionales que puedan guiar los procesos industriales en múltiples niveles".
Los investigadores utilizaron datos de un conjunto de datos de expresión génica a gran escala disponible públicamente de dos líneas celulares CHO diferentes con 295 perfiles de microarrays con valores de expresión para 3592 genes de 121 cultivos de células CHO. Para la reconstrucción del genoma, the researchers used a recently developed genome-scale metabolic model—GSMM—used to accurately predict growth phenotypes. The model is currently the largest reconstruction of CHO metabolism.
They then combined the model of CHO cell metabolism with the gene expression data to create condition and cell line-specific polyomics models.