• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  •  science >> Ciencia >  >> Física
    ¿Por qué conservar los datos sin procesar?

    Imagen gráfica de reutilización de datos. Crédito:Kroon-Batenburg et al.

    El tema cada vez más popular de la deposición de datos de difracción sin procesar se examina en una revisión tópica en IUCrJ . Sobre la base del taller de 2015 organizado por el Grupo de Trabajo de Deposición de Datos de Difracción de IUCr (DDDWG), los autores actualizan la historia con relatos de nuevos repositorios de datos institucionales y específicos del tema, y de las crecientes presiones políticas sobre la gestión de datos de investigación, como la iniciativa europea de ciencia abierta.

    El artículo es, sin embargo, más que un simple informe de un taller o una encuesta sobre la evolución de las políticas. Busca informar los argumentos de costo-beneficio sobre la deposición de datos de difracción con ejemplos de investigaciones reales de primera línea. Por ejemplo, Kroon-Batenburg y Helliwell han colaborado en estudios de unión a proteínas del agente quimioterapéutico cisplatino, y han puesto a disposición todos sus 34 conjuntos de datos sin procesar a través de la Biblioteca de datos de la Universidad de Manchester. Algunos de estos conjuntos de datos se han vuelto a analizar y han dado como resultado una nueva comprensión de los modelos de cisplatino-lisozima.

    La perspectiva de extraer más información de conjuntos de datos primarios archivados de esta manera (ya sea mediante la percepción de nuevos pares de ojos o mediante mejoras posteriores en el análisis de software) tiene implicaciones para las bases de datos estructurales. facilitando la idea de mejora continua de los estudios, como por ejemplo para los modelos de estructura macromolecular (durante mucho tiempo defendido por Terwilliger).

    No es solo en el campo de la determinación de la estructura macromolecular donde estas consideraciones son importantes. Uno de los mayores desafíos para reutilizar cualquier dato sin procesar es la necesidad de metadatos completos asociados con cualquier conjunto de datos sin procesar, para permitir su posterior interpretación y evaluación completa.

    Varias Comisiones IUCr están publicando activamente sus resúmenes de los metadatos esenciales que deben capturarse junto con todos los conjuntos de datos experimentales. Estas iniciativas y su relación con el estándar de la IUCr para la caracterización de datos (CIF, el Marco de información cristalográfica) se revisan en el artículo. De nuevo, Se dan indicaciones prácticas a los metadatos esenciales que deben capturarse junto con los conjuntos de datos de difracción.

    Si bien hay indicios alentadores de que la comunidad científica está tomando un interés más informado en la gestión de datos y su potencial científico, La última generación de instrumentación presenta nuevos desafíos, capaz de generar grandes cantidades de datos a un ritmo increíble. Puede que no sea posible archivar o incluso analizar a fondo todos los datos que se están produciendo. Sin embargo, Este artículo ayudará a proporcionar una comprensión profunda de las razones por las que la sociedad debería invertir esfuerzos y recursos para extraer el mayor valor posible de la avalancha de datos. en cristalografía como en cualquier ciencia.

    © Ciencia https://es.scienceaq.com