• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  •  science >> Ciencia >  >> Otro
    Las estadísticas simples pueden ser lo suficientemente buenas

    Las distribuciones gaussianas son simples y fáciles de entender, pero para algunos datos como las precipitaciones y la velocidad del viento, pueden resultar en colas físicamente imposibles a valores negativos. Crédito:Marek Uliasz / Alamy Foto de stock

    El estudio del desajuste entre los datos ambientales espaciales y un análisis estadístico de uso común sugiere que, en muchos casos, las estadísticas más simples son suficientes.

    Los científicos ambientales y sus colegas estadísticos enfrentan un dilema común:¿Las pruebas estadísticas más simples caracterizan adecuadamente un conjunto de datos? ¿Y vale la pena el esfuerzo de derivar y aplicar métodos estadísticos que posiblemente estén mejor emparejados pero más difíciles de interpretar? En la mayoría de los casos gana el camino de menor resistencia, pero la elección de una base estadística simple puede arrojar ligeras dudas sobre la validez de los resultados de los estudios derivados estadísticamente.

    El investigador de KAUST Marc Genton y su estudiante de doctorado Yuan Yan desarrollaron un marco para probar exactamente cuán inexacto podría ser un desajuste entre los datos y el análisis estadístico. y los resultados son sorprendentes.

    "Los investigadores tienden a ajustar los datos espaciales con un modelo gaussiano simple, la clásica curva de campana simétrica alrededor del valor promedio, a pesar de que los datos pueden tener una distribución asimétrica con características que divergen de Gauss, ", dice Yan." Investigamos el efecto de la 'no gaussianidad' de los datos en la estimación y predicción estadísticas bajo la suposición gaussiana incorrecta ".

    Las distribuciones gaussianas son generalmente intuitivas, con un valor promedio y desviaciones estándar del promedio que implican una distribución de datos estrecha o amplia. Son ampliamente aplicados y comprendidos, tanto desde la perspectiva del profesional como para los usuarios no técnicos. Pero, en muchas situaciones, particularmente para datos ambientales, la distribución de datos está sesgada. Velocidad del viento y lluvia por ejemplo, no puede ser menor que cero, sin embargo, una distribución gaussiana con un valor promedio pequeño pero una distribución extendida a valores más altos puede tener una cola en el extremo inferior que se extiende a valores negativos, ciertamente incorrecto, pero por cuanto?

    Uno de los conceptos más importantes en los análisis estadísticos espaciales es la fuerza con la que los datos se influyen entre sí cuando están a cierta distancia, que viene dada por lo que se conoce como función de covarianza. Genton y Yan se propusieron estudiar sistemáticamente el efecto de aplicar un modelo gaussiano para estimar la función de covarianza para datos no gaussianos.

    "Desarrollamos un esquema de simulación personalizado para generar datos espaciales no gaussianos con una estructura de covarianza determinada, ", dice Genton." Demostramos a través de nuestro estudio de simulación que cuando los datos espaciales no son gaussianos, el estimador de probabilidad gaussiano de los parámetros de covarianza aún funciona mejor que un estimador de mínimos cuadrados ponderados alternativo para datos que no están muy sesgados ".

    El hallazgo sugiere que el modelo gaussiano simple es, de hecho, generalmente adecuado para la estimación de parámetros para datos espaciales en muchos casos, ofreciendo algo de consuelo a los científicos espaciales sobre su elección de enfoque estadístico.


    © Ciencia https://es.scienceaq.com