• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  • Los investigadores desarrollan un nuevo sistema de código abierto para administrar y compartir conjuntos de datos complejos

    Los investigadores han creado un nuevo sistema de gestión de datos de código abierto para científicos, con la esperanza de que el sistema facilite la colaboración. Crédito:Markus Spiske en Unsplash

    Los datos suelen estar en el corazón de la ciencia:los investigadores rastrean las velocidades, medir la luz proveniente de las estrellas, analizar la frecuencia cardíaca y los niveles de colesterol y escanear el cerebro humano en busca de impulsos eléctricos.

    Pero a menudo, compartir esos datos con otros científicos, o con editores de revistas revisados ​​por pares, o patrocinadores — es difícil. El software puede ser propietario, y su compra es prohibitivamente cara. Puede que sean necesarios años de formación para que una persona sea capaz de gestionar y comprender el software. O la empresa que creó el software podría haber cerrado.

    Un equipo de investigación ha desarrollado un sistema de gestión de datos de código abierto que los científicos esperan que resuelva todos esos problemas. Los investigadores describieron su sistema hoy en la revista. MÁS UNO .

    "Queríamos crear un formato de archivo y un modelo de conjunto de datos que encapsulara la mayoría de los conjuntos de datos en los que trabajamos, en todos los instrumentos de un laboratorio, "dijo Philip Grandinetti, profesor de química en la Universidad Estatal de Ohio y autor principal del artículo. "Hay un problema de larga data, omnipresente entre los científicos, que compra un instrumento multimillonario y las empresas que fabrican ese instrumento tienen su propio formato patentado, y es una pesadilla compartir con nadie más ".

    Los grandes conjuntos de datos son difíciles de compartir, en parte porque el software suele ser propietario, pero también en parte porque los archivos suelen ser tan grandes que es difícil compartirlos en un correo electrónico o mediante un servidor basado en la nube. E incluso si los archivos se pueden exportar como un tipo de archivo que se puede compartir, Los metadatos importantes, las cosas que explican lo que realmente es el conjunto de datos, a menudo se pierden.

    Su sistema, que Grandinetti y sus colegas denominaron "Modelo de datos científicos básicos, "está diseñado para compartir conjuntos de datos complejos fácilmente, sin archivos masivos que ocupan mucho ancho de banda y espacio en el disco duro, y sin perder metadatos. Considere un conjunto de datos que incluye la temperatura del aire, presión del aire, velocidad del viento y flujo solar:este sistema puede manejarlo. O considere las medidas y el color de una luz proveniente de una estrella en una galaxia distante; este sistema puede manejarlo.

    "Necesita un conjunto de datos que sea increíblemente flexible en su capacidad para mantener todas esas cosas en un formato de archivo sin perder información, ", Dijo Grandinetti." Así que la idea es que creamos un modelo que pensamos que era lo suficientemente flexible para hacer eso ".

    El equipo de la Universidad Estatal de Ohio, en colaboración con el profesor Thomas Vosegaard de la Universidad de Aarhus en Dinamarca, y el Dr. Dominique Massiot de la Universidad de Orleans en Francia, software construido que puede ejecutarse en una Mac o PC. Lo subieron a la web e hicieron que el código fuera de código abierto (lo que significa que cualquiera puede verlo, úsalo, y descárguelo gratis.) La publicación en MÁS UNO es intencional:la revista también está disponible para cualquier persona, gratis.

    Y, los investigadores esperan, el sistema podría ser simple, forma gratuita de combinar varios tipos de datos en un solo lugar.

    "Estudiamos varios conjuntos de datos como científicos, y como científico yo mismo, Me gustaría poder obtener los datos de todos esos archivos y juntarlos de una manera con la que pueda trabajar, "dijo Deepansh Srivastava, investigador postdoctoral en el grupo de Grandinetti.

    "En lugar de buscar datos y extraerlos de conjuntos de datos, si pudiéramos simplemente exportarlo como este tipo de archivo, como un tipo de archivo de datos científicos básicos, podríamos trabajar en un sistema común ".


    © Ciencia https://es.scienceaq.com