Crédito:CC0 Public Domain
Investigadores del Broad Institute of MIT y Harvard han llevado el Mapa de conectividad, un recurso de herramientas y datos ampliamente utilizado, a nuevas alturas con una versión masivamente ampliada. Para esta nueva plataforma, los investigadores también han mejorado su accesibilidad para la comunidad científica, posibilitando estudios de la función de genes y moléculas pequeñas e informando los ensayos clínicos.
El mapa de conectividad, o CMap, es un conjunto de datos de referencia funcional del genoma humano que conecta genes, drogas y estados de enfermedad a través de patrones comunes de actividad genética, conocidas como firmas de expresión genética. La versión original de CMap incluía solo unos pocos cientos de perfiles de expresión génica en unas pocas líneas celulares, producido utilizando microarrays de ADN costosos. Los científicos generales han desarrollado ahora un método de alto rendimiento para la expresión génica, mediante el cual se mide la expresión de un subconjunto de genes, y la expresión de los genes restantes no medidos se infiere computacionalmente. Este método, llamado L1000, permitió que el equipo amplio expandiera el CMap existente en más de 1, 000 veces, convirtiéndolo en un recurso mucho más completo y útil para la comunidad científica.
El trabajo se describe en la edición del 30 de noviembre de Celda .
Con más de 1.3 millones de perfiles de expresión génica y desarrollado a través del Consorcio NIH LINCS, investigadores de todo el mundo pueden explorar este CMap de "próxima generación" a través de un nuevo entorno de análisis basado en la nube, permitiéndoles anotar funcionalmente variantes genéticas de genes de enfermedades, descubrir el mecanismo de acción de pequeñas moléculas no caracterizadas, y generar nuevas hipótesis terapéuticas.
"El Mapa de conectividad ampliado es un ejemplo de nuevas direcciones en la investigación genómica. Estamos entusiasmados de ver que nuestros datos y herramientas ya están siendo utilizados por científicos de la academia y la industria. para apoyar la ciencia básica y el descubrimiento de fármacos, "dijo Todd Golub, autor principal del estudio y director científico de Broad, donde también es director del Programa de Cáncer del instituto. "Es probable que los datos y las herramientas se utilicen de formas que ni siquiera imaginamos, y esperamos que los usuarios nos ayuden a mejorar las herramientas y hacer que CMap sea aún más útil a medida que continuamos expandiendo el recurso ".
La utilidad de la versión piloto de CMap estaba limitada por su pequeño tamaño. Los científicos de CMap sabían que para construir un recurso verdaderamente completo que pudiera producir conocimientos biológicos mecánicos y a nivel de circuito, tendrían que ampliar enormemente el compendio con muchas perturbaciones químicas y genéticas en diversos tipos de células.
Porque hacerlo usando microarrays o incluso secuenciación de ARN sería demasiado costoso, el equipo de CMap desarrolló un nuevo método de creación de perfiles conocido como "L1000". En lugar de perfilar la expresión de cada gen que codifica proteínas en el genoma, el método genera una mirada a escala del genoma en la expresión midiendo la actividad de 1, 000 genes "emblemáticos" y utilizar esas mediciones para inferir la actividad de la mayoría de los genes no medidos. Los investigadores analizaron los datos existentes sobre los patrones de expresión génica para elegir los genes emblemáticos que pueden servir como representantes precisos de todo el transcriptoma.
Este enfoque permitió al equipo aumentar drásticamente la escala del experimento, de modo que CMap ahora incluye más de 1 millón de perfiles de expresión génica de múltiples líneas celulares tratadas con perturbaciones químicas o genéticas. En comparación con los 164 fármacos descritos en el piloto CMap, el nuevo conjunto de datos incluye perfiles de expresión de células tratadas con 42, 080 perturbagenos, incluidos los fármacos de molécula pequeña, compuestos de herramientas, y compuestos no optimizados de mecanismos de acción previamente desconocidos.
Para demostrar la utilidad del recurso, el equipo demostró con éxito que CMap puede ayudar a predecir cómo funciona una pequeña molécula o fármaco, que puede acelerar los esfuerzos de descubrimiento de fármacos. Si el perfil de expresión de las células perturbadas por una molécula pequeña coincide con la firma de expresión de las células perturbadas con compuestos de función conocida, sugiere que la molécula pequeña puede funcionar a través de la misma vía celular y les da a los científicos una ventaja experimental al explorar la función de compuestos no estudiados o terapias potenciales.
El equipo también demostró que CMap puede ayudar a los investigadores a descubrir compuestos con actividades deseadas. En un caso, lo usaron para descubrir un compuesto que inhibe la caseína quinasa 1 alfa, una proteína involucrada en ciertas leucemias y que también confiere resistencia a una clase de medicamentos contra el cáncer de pulmón llamados inhibidores de EGFR.
Esto subraya el poder del Mapa de conectividad ampliado como un punto de partida valioso para el descubrimiento de fármacos.
En una prueba del potencial de CMap para informar la investigación clínica, los investigadores analizaron muestras de tumores obtenidas antes y después del tratamiento en ensayos con medicamentos contra el cáncer. Los resultados mostraron cambios en los patrones de actividad genética de las células tumorales debido a la terapia contra el cáncer. y la comparación con los perturbagenos CMap sugirió la participación de vías conocidas de resistencia a los fármacos.
El mapa de conectividad se selecciona constantemente con nuevos datos generados por el equipo de Broad. La nueva versión contiene firmas de expresión de compuestos que se han estudiado previamente, pero también los que aún no han sido caracterizados.
Todos los datos y herramientas están ahora disponibles en un entorno de análisis basado en datos desarrollado por investigadores de Broad y conocido como CLUE, que el equipo de CMap anima a los usuarios a acceder y explorar. El equipo de CMap planea expandir el recurso para incluir más tipos de células, más perturbaciones, y más tipos de datos, incluidos los datos de imágenes proteómicas y celulares.
La próxima generación de CMap fue posible gracias a la estrecha colaboración entre el equipo de CMap, otros miembros del Consorcio NIH LINCS, y varios otros grupos en el Broad Institute, incluido el Centro para el Desarrollo de la Terapéutica (CDoT), la Plataforma de Perturbación Genética, el equipo PRISM, y la Plataforma de Proteómica.
"Este esfuerzo solo fue posible con la experiencia combinada de muchos programas y plataformas de Broad, requiriendo una increíble cantidad de trabajo en equipo, "dijo Aravind Subramanian, co-primer autor del artículo junto con los investigadores de Broad Steven Corsello y Rajiv Narayan. "Nuestra aspiración es que CMap se convierta en una parte rutinaria del descubrimiento de fármacos, proporcionando pistas útiles a medida que los objetivos y las moléculas atraviesan las diversas etapas del desarrollo terapéutico. Nos complace poder compartir los resultados de nuestros esfuerzos con la comunidad científica. En tono rimbombante, aún no hemos terminado; invitamos a los cazadores de drogas de la academia y la industria a utilizar el recurso y comunicarse con nosotros con sus comentarios ".