• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  •  science >> Ciencia >  >> Otro
    Las gemas ocultas de las declaraciones de accesibilidad de datos

    A veces, la mejor parte de leer un artículo científico es un momento inesperado de reconocimiento, no en la ciencia, sino en la humanidad de los científicos. Es reconfortante de alguna manera encontrar pequeñas desviaciones de la fórmula científica formal:una nota que cae fuera de la sintaxis esperada de Resumen-Introducción-Métodos-Resultados-Discusión. Como científico de carrera temprana que se encuentra en medio de esculpir capítulos de disertación en manuscritos, Es bueno recordar que los artículos # 365 que leo son productos de autores que, como yo, luchó con las revisiones y bromeó con los coautores y encontró un humor sombrío en los momentos oscuros.

    Blogs de ecología, gorjeo, y a los medios de comunicación en general también les encanta notar los títulos caprichosos, reconocimientos divertidos (y serios), figuras memorables, y determinaciones únicas de orden de coautoría que han aparecido en las páginas de revistas científicas. Disfruto tropezar con estos momentos de ligereza en mi archivo TO READ; la primavera pasada postergué el formateo de mi disertación leyendo con avidez la sección de Agradecimientos de cualquier persona con la que incluso me hubiera superpuesto vagamente en mi doctorado. programa. Un lugar en el que no he pensado buscar el humor científico fortuito:la Declaración de disponibilidad de datos. Como resulta, Me he perdido una historia interesante.

    Un artículo reciente de PLOS ONE se propuso analizar las declaraciones de disponibilidad de datos de casi 50, 000 artículos recientes de PLOS ONE. Esto puede parecer un tema aburrido, pero el trabajo de Lisa Federer y sus coautores es sorprendentemente atractivo, actual, y estimulante. En marzo de 2014, PLOS dio a conocer una política de datos que requiere que los artículos de investigación incluyan una declaración de disponibilidad de datos que proporcione a los lectores detalles sobre cómo acceder a los datos relevantes para cada artículo. Pero, como señalan Federer y otros, "la 'disponibilidad' puede interpretarse de maneras que tienen resultados prácticos muy diferentes en términos de quién puede acceder a los datos y cómo".

    ¿Por qué son importantes las declaraciones de disponibilidad de datos? En ecología, Los defensores de los datos abiertos defienden la reproducibilidad y la reutilización. Muchos de nosotros trabajamos en áreas de estudio pequeñas y acumulamos hojas de cálculo aisladas de datos, y luego publicar en nuestro sistema, tal vez arrojando un subconjunto de los datos que recopilamos en un archivo complementario. Pero las preguntas generales que miran a través de escalas, ecosistemas, y los enfoques se basan en big data, y el big data es a menudo una amalgama de muchos pequeños conjuntos de datos de una amplia gama de científicos. Conjuntos de datos pequeños (o de cualquier tamaño) que están disponibles públicamente, y de fácil acceso en repositorios de datos en lugar de viejos cuadernos de laboratorio o computadoras de laboratorio desaparecidas, es mucho más probable que tengan piernas, para volver a utilizarlo y volverlo a probar, y contribuir al campo en general.

    Crédito:Eric Heupel, https://www.flickr.com/photos/eclectic-echoes/

    Si bien PLOS estaba a la vanguardia de las declaraciones de accesibilidad a los datos entre las revistas revisadas por pares, La revisión de Federer del contenido de estas declaraciones de disponibilidad de datos deja en claro que aún no estamos en el brillante futuro de los datos abiertos. La política de accesibilidad de datos de PLOS "recomienda encarecidamente" que los datos se depositen en un repositorio público; Federer descubrió que solo el 18,2% de PLOS artículos nombrados un repositorio o fuente específicos donde los datos estaban disponibles. La mayoría de las declaraciones de accesibilidad de datos dirigen al lector al documento en sí o información complementaria. Incluso entre los artículos del repositorio de datos, algunas declaraciones de accesibilidad de datos indicaron un repositorio pero no incluyeron una URL, DOI, o número de acceso:básicamente, envía a los lectores a una búsqueda inútil para ubicar sus datos dentro del repositorio.

    Otras declaraciones parecen haber sido ingresadas como marcadores de posición, potencialmente destinado a ser reemplazado tras la publicación del artículo, como "Todos los datos sin procesar están disponibles en la base de datos XXX [sic] (número (s) de acceso XXX, XXX [sic]) "o" Los datos y el conjunto completo de instrucciones experimentales de este estudio se pueden encontrar en . [Este enlace será de acceso público [sic] después de la publicación de este artículo.] "Estos dos artículos, publicado en 2016 y 2015, respectivamente, todavía contienen este texto de marcador de posición al momento de escribir este artículo.

    Estos ejemplos de marcadores de posición que se publicaron son vergonzosos, pero humano, y como señala Federer, Las declaraciones de accesibilidad de datos deben ser revisadas por editores y revisores pares con el mismo escrutinio que aplicamos al diseño del estudio. Análisis estadístico, y citas.

    He trabajado en metaanálisis y proyectos que dependen de datos de archivos digitales existentes. La frustración de perseguir información complementaria, DOI de dríadas, y las direcciones de GitHub solo para encontrar un callejón sin salida o una dirección de correo electrónico del autor correspondiente rota es una sensación similar a la de las ardillas terrestres masticando los cables del registrador de temperatura a mitad de la temporada de campo. Federer señala que la marea está girando hacia los datos abiertos:después de un comienzo difícil en 2014, el equipo de Federer analizó muchos artículos que probablemente se enviaron antes (pero publicados después) de que la política de disponibilidad de datos entró en vigencia; en 2015 y 2016 se registró el porcentaje de artículos que carecían de un La declaración de disponibilidad de datos se redujo drásticamente. Durante el mismo período de tiempo, Federer observa ligeros aumentos en el número de declaraciones que se refieren a los datos en un repositorio y menos que afirman que los datos están en el papel o, escalofríos, disponibles a pedido.

    A un nivel más amplio, Los datos abiertos son un tema recientemente politizado. La EPA propuso recientemente nuevos estándares que prohibirían que los estudios científicos informen sobre propósitos regulatorios a menos que todos los datos sin procesar estén ampliamente disponibles en público y puedan ser reproducidos. Esto no es tanto un estándar de oro como una regla de mordaza. En un editorial de PLOS, John P. A. Ioannidis señala que si bien "al hacer datos científicos, métodos, protocolos, software, y scripts ampliamente disponibles es un emocionante, digna aspiración "de eliminar todo menos la ciencia llamada perfecta del proceso regulador, la EPA se compromete a tomar decisiones que "dependan únicamente de la opinión y el capricho". La mayoría de los datos sin procesar de estudios anteriores no están disponibles públicamente y, como muestra la investigación de Federer, incluso en una época de declaraciones de disponibilidad de datos requeridas, Los datos abiertos todavía son un trabajo en progreso. Y así seguimos adelante:científicos contra administradores de la Agencia de Protección Ambiental contrarios a la ciencia, devuelto incesantemente en apoyo de la publicación accesible, los datos abiertos como una especie de luz verde a las investigaciones pasadas.

    Esta historia se vuelve a publicar por cortesía de PLOS Blogs:blogs.plos.org.




    © Ciencia https://es.scienceaq.com