Los científicos han utilizado Diamond Light Source para desarrollar un nuevo método para extraer información previamente oculta de los datos de difracción de rayos X que se miden al resolver las estructuras atómicas tridimensionales (3D) de proteínas y otras moléculas biológicas.
Al intentar desarrollar compuestos químicos hacia candidatos a fármacos potentes, los científicos intentan estudiar el detalle atómico de cómo los compuestos se unen a sus proteínas objetivo. Para hacerlo comparan los datos de rayos X medidos tanto en presencia como en ausencia del compuesto. Sin embargo, con algoritmos de análisis existentes, esta señal de diferencia a menudo puede verse inundada por el ruido de los artefactos experimentales, lo que hace que sea muy poco fiable interpretar la señal observada.
El nuevo método Pan-Dataset Density Analysis (PanDDA) extrae la imagen del compuesto unido con un detalle excepcionalmente claro e inequívoco. PanDDA primero identifica la fuente del ruido, y luego lo elimina de los datos. Aprovecha la capacidad de Diamond para repetir decenas a cientos de mediciones rápidamente, que luego se caracterizan por las diferencias entre ellos, indicando la presencia de compuesto unido, después de lo cual se aplica una corrección de ruido en 3D. Los resultados se publican hoy en Comunicaciones de la naturaleza .
Cristalografía macromolecular (MX), la técnica a la que se aplica PanDDA, es una de las herramientas más poderosas que utilizan los investigadores interesados en determinar las estructuras 3D de grandes moléculas biológicas, incluidas las proteínas, y es el experimento del caballo de batalla para el diseño racional de fármacos.
"El problema de identificar eventos vinculantes en conjuntos de datos cristalográficos puede parecer como buscar una aguja en un pajar, "explica el Dr. Nicholas Pearce, autor principal del artículo que proviene de su proyecto de doctorado en la Universidad de Oxford en el Centro de Enfoques de Sistemas para las Ciencias Biomédicas (SABS) para la Formación Doctoral, donde fue financiado conjuntamente por UCB Pharma y Diamond. "En el caso de los datos que analizamos, fue aun peor, porque teníamos cientos de pajares, y no sabía cuál de ellos contenía agujas ". Nick ahora trabaja en el Grupo de Química Estructural y Cristalina de la Universiteit Utrecht.
Los investigadores pudieron aprovechar el hecho de que la mayoría de las mediciones eran de cristales 'vacíos' que no contenían un ligando unido. permitiéndoles caracterizar la forma libre y simplemente buscando conjuntos de datos que fueran diferentes.
"A menudo, en la cristalografía se pueden pasar por alto las formas ligadas 'débiles', porque cada medida es una superposición de las formas ligadas y no ligadas, "continúa el Dr. Pearce." Esto es similar a varias hojas de papel de calco, cada uno con una de al menos dos imágenes, todos superpuestos uno encima del otro ".
"Al intentar identificar la imagen en solo una de las 'hojas', se confunde con lo que se ve en todas las demás hojas, por lo que la imagen se vuelve susceptible a errores de interpretación, "El Dr. Pearce agrega." Para superar esto, desarrollamos un método para extraer el conjunto correcto de 'hojas' de la superposición; una vez que hicimos eso, interpretar la forma encuadernada se vuelve mucho más fácil, y nos permite interpretar los datos con confianza, y construir modelos de los estados interesantes en los datos ".
"La idea básica es conceptualmente muy simple, es decir, tratar la superposición confusa como un problema de corrección de fondo, "explica el profesor Frank von Delft, quien es conjuntamente Investigador Principal del grupo de Cristalografía de Proteínas en el Consorcio de Genómica Estructural (SGC) en la Universidad de Oxford, y científico principal de la línea de luz I04-1 en Diamond. "Sin embargo, una estimación precisa del fondo es crucial, y en la práctica esto era impensable hasta la llegada de la nueva tecnología robótica ofrecida por Diamond, lo que hace que sea rutinario realizar un gran número de mediciones ".
"UCB está encantada de haber trabajado en estrecha colaboración con Diamond en el desarrollo de PanDDA y su aplicación al cribado de fragmentos cristalográficos, "comenta el Dr. Neil Weir, Vicepresidente senior de descubrimiento en UCB Pharma. "Como resultado directo, hemos podido identificar fragmentos, que de otro modo no se distinguen de los antecedentes, unido a un objetivo clave del fármaco de interacción proteína-proteína ".
La investigación implicó la producción de alrededor de 860 conjuntos de datos, de los cuales sólo 75 contienen una forma limitada de interés para los investigadores. "Si bien es de aplicación general en MX, el método es particularmente transformador para una versión del experimento MX llamada detección de fragmentos, donde los efectos que buscamos son muy raros e incluso más difíciles de verificar mediante algoritmos convencionales, "continúa von Delft.
Una coda crucial para el trabajo fue la carga de todas las estructuras al Protein Data Bank (wwPDB), the online repository of 3D structures of proteins and nucleic acids, where everybody has completely free access to all structures ever published. One of the wwPDB host sites, RCSB PDB, recently developed a new group deposition tool to allow the mass upload of structures, and this was crucial to completing this collaboration.
The RCSB PDB Group Deposition system allows authors to take advantage of local templates and PDB_extract for batch processing, packing, upload, review, validation, and one-click submission of many structures at once. Searching group title "PanDDA analysis group deposition" at rcsb.org will return these 860 depositions.
"The Diamond and PDB groups have accomplished something quite incredible, and we have been delighted to help them" says Aled Edwards, Director of the SGC. "I would also like to highlight the team's commitment to open science. By placing all the research output into the public domain, they have ensured that the data can be used by all."
Now celebrating its 10th year of research and innovation, Diamond is committed to working with our users to enable them to carry out world-leading research at the facility.
"We've come a long way in the last ten years, and collaborations like these are key to how we will maintain our place as a key facility for researchers working in the life sciences, " adds Professor Dave Stuart, Director of Life Sciences at Diamond. "The idea that we can clearly see weak binding events is particularly exciting and something we're looking forward to sharing with our crystallography community."
The researchers hope that this new method will provide a significant shift in how crystallographic models are generated; opening windows to explore more poorly ordered crystals.