• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  •  science >> Ciencia >  >> Otro
    Perdón, número incorrecto:el punto de referencia estadístico es criticado

    En este 1 de julio Foto de archivo de 1960, un químico trabaja en un laboratorio en Cambridge, Mass. Durante décadas, Los científicos han utilizado la "significación estadística" para estimar si sus resultados son fiables o simplemente una casualidad. Ha sido criticado durante mucho tiempo pero 2019 ha traído dos llamadas de alto perfil para deshacerse de él por completo. (Foto AP / Peter J. Carroll)

    A principios de este otoño, el Dr. Scott Solomon presentó los resultados de un enorme estudio de fármacos para el corazón a una audiencia de colegas cardiólogos en París.

    Los resultados que describía Solomon parecían prometedores:los pacientes que tomaron el medicamento tuvieron una tasa más baja de hospitalización y muerte que los pacientes que tomaron un medicamento diferente.

    Luego mostró a su audiencia otro número.

    "Hubo algunos jadeos, o 'Ooohs, '"Salomón, del Hospital Brigham and Women's de Harvard, recordado recientemente. "Mucha gente se sintió decepcionada".

    Un analista de inversiones reaccionó reduciendo su pronóstico de ventas máximas del medicamento en mil millones de dólares.

    ¿Qué sucedió?

    El número que provocó los jadeos fue 0,059. La audiencia buscaba algo por debajo de 0,05.

    Lo que significaba era que los prometedores resultados de Salomón habían entrado en conflicto con un concepto estadístico del que quizás nunca hayas oído hablar:la significación estadística. Es una cosa de todo o nada. Tus resultados estadísticos son significativos, lo que significa que son confiables, o no significativo, lo que indica una probabilidad inaceptablemente alta de que fueran solo una casualidad.

    El concepto se ha utilizado durante décadas. Tiene mucha influencia sobre cómo se evalúan los resultados científicos, qué estudios se publican, y qué medicamentos llegan a las farmacias.

    Pero este año ha traído dos llamadas de alto perfil de críticos, incluso desde el interior del arcano mundo de las estadísticas, deshacerse de él, en parte debido a la preocupación de que descarte prematuramente resultados como el de Salomón.

    La importancia se refleja en un cálculo que produce algo llamado valor p. Generalmente, si esto produce un valor p menor que 0.05, los hallazgos del estudio se consideran significativos. Que no, el estudio no pasó la prueba.

    El estudio de Salomón acaba de fallar. Entonces, la aparente ventaja que mostraba su medicamento sobre el otro medicamento se consideró insignificante. Según este criterio, no había ninguna diferencia "real".

    Solomon cree que el fármaco de hecho produjo un beneficio real y que un estudio más grande o de mayor duración podría haber alcanzado una significación estadística.

    "No estoy llorando por la leche derramada, ", dijo." Nosotros establecemos las reglas. La pregunta es, ¿Es esa la forma correcta de hacerlo? "

    No es el único que hace esa pregunta.

    "Es una apuesta segura que la gente ha sufrido o muerto porque los científicos (y editores, reguladores, periodistas y otros) han utilizado pruebas de significancia para interpretar los resultados, "El epidemiólogo Kenneth Rothman de RTI Health Solutions en Research Triangle Park, CAROLINA DEL NORTE., y la Universidad de Boston escribieron en 2016.

    El peligro es tanto que un hallazgo médico potencialmente beneficioso pueda ignorarse porque un estudio no alcanza significación estadística, y una práctica médica dañina o infructuosa podría aceptarse simplemente porque lo hace, dijo en un correo electrónico.

    El punto de corte del valor p para la significancia es "una medida que ha ganado el estatus de guardián ... no solo para la publicación, sino para que las personas se tomen en serio sus resultados, "dice el estadístico de la Universidad Northwestern Blake McShane.

    No es de extrañar que un estadístico en una charla reciente con periodistas sobre el tema justo antes de Halloween, mostró una diapositiva de una calabaza tallada con esta vista, obviamente aterrador para cualquiera en ciencia o medicina:"P =.06".

    McShane y otros argumentan que la importancia del umbral del valor p es inmerecida. Fue coautor de un llamado a abolir la noción de significancia estadística, que fue publicado en la prestigiosa revista Nature este año. La propuesta atrajo a más de 800 cofirmantes.

    Incluso la Asociación Estadounidense de Estadística, que nunca había emitido una declaración formal sobre prácticas estadísticas específicas, bajó mucho en 2016 al usar cualquier tipo de límite de valor p de esta manera. Y este año fue más allá, declarando en un número especial con 43 trabajos sobre el tema, "Es hora de dejar de usar el término" estadísticamente significativo "por completo".

    ¿Cuál es el problema? McShane y otros enumeran varios:

    - El valor p no mide directamente la probabilidad de que el resultado de un experimento sea una casualidad. Lo que realmente representa está muy mal entendido, incluso por científicos y algunos estadísticos, dijo Nicole Lazar, profesor de estadística en la Universidad de Georgia.

    - El uso de una etiqueta de significación estadística "brinda más certeza de la que realmente se justifica, "Debemos reconocer el hecho de que hay incertidumbre en nuestros hallazgos", dijo Lazar.

    - El límite tradicional de 0,05 es arbitrario.

    - La importancia estadística no significa necesariamente "significativo", o que un hallazgo sea importante desde el punto de vista práctico o científico, Dice Lazar. Puede que ni siquiera sea cierto:Solomon cita un gran estudio de medicamentos para el corazón que encontró un efecto de tratamiento significativo para los pacientes nacidos en agosto pero no en julio. obviamente, solo una fluctuación aleatoria.

    - El término "significación estadística" establece una línea de objetivos para los investigadores, una medida clara de éxito o fracaso. Eso significa que los investigadores pueden esforzarse demasiado para alcanzarlo. Pueden jugar deliberadamente con el sistema para obtener un valor p aceptable, o simplemente elegir inconscientemente métodos analíticos que ayuden, McShane y Lazar dijeron.

    - Eso puede distorsionar los efectos no solo de experimentos individuales, sino también los resultados acumulativos de estudios sobre un tema determinado, para que, en general, un medicamento pueda verse "mucho mejor de lo que realmente es, "Dijo McShane.

    ¿Qué debería hacerse en su lugar? Suprime la línea brillante de significación estadística, y solo informe el valor p junto con otros análisis para brindar un esquema más completo de lo que puede significar el resultado de la prueba, McShane y otros dicen.

    Puede que no sea tan claro como una simple declaración de importancia o insignificancia, pero "tendremos una mejor idea de lo que está pasando, ", Dijo Lazar." Creo que será más fácil eliminar el mal trabajo ".

    No todo el mundo compra la idea de eliminar la significación estadística. El destacado investigador de Stanford, el Dr. John Ioannidis, dice que la abolición "podría promover los prejuicios. Las tonterías irrefutables gobernarían". Aunque está de acuerdo en que un estándar de valor p de menos de 0,05 es débil y se abusa fácilmente, él cree que los científicos deberían usar un valor p más estricto u otra medida estadística en su lugar, especificado antes de realizar el experimento.

    McShane dijo que, aunque se han planteado durante años llamamientos para abolir la significación estadística, parece haber más impulso últimamente.

    "Quizás, " él dijo, "Es hora de poner el clavo en el ataúd de este para siempre".

    © 2019 The Associated Press. Reservados todos los derechos.




    © Ciencia https://es.scienceaq.com