Muchos programas universitarios requieren estadísticas. Un concepto clave presentado en una clase de estadística típica es la distribución normal de datos o una curva de campana. Comprender cómo interpretar un conjunto de datos que cae en una distribución natural hace posible la comprensión de los estudios científicos. Obtenga una buena comprensión de la curva de campana, la media, las desviaciones estándar y su relación con los percentiles para familiarizarse con el lenguaje de la investigación científica.
Distribución normal y Curva de campana
Cuando muchos tipos de datos naturales como la altura, los cocientes de inteligencia y la presión arterial se trazan en un histograma, donde los puntajes están en el eje horizontal y las ocurrencias o el número de puntajes están en el eje vertical, los datos caen en un patrón en forma de campana una curva de campana Este patrón, conocido como distribución normal, se presta para el análisis estadístico.
La media y mediana
El promedio medio de todos los puntajes caerá en el medio aproximado de la curva de campana. La media representa el percentil 50, donde la mitad de todas las puntuaciones están por encima de esa medida, y la mitad están por debajo. En datos distribuidos normalmente, el puntaje mediano también caerá en el centro de la curva de campana, representando la mayoría de las ocurrencias.
Desviaciones estándar y varianza
¿Qué tan lejos de la media hay una medida? En conjuntos de datos normalmente distribuidos, una medida puede describirse como un cierto número de desviaciones estándar de la media. Una desviación estándar es una medida de varianza, o qué tan dispersa, o dispersa, los datos provienen de la media. Si las medidas tienen mucha varianza, la curva de campana se extiende; si tienen poca varianza, la curva de campana es estrecha. Cuantas más desviaciones estándar haya en el puntaje, menor será la probabilidad de que el puntaje ocurra en la naturaleza.
Percentiles y la regla empírica
Al observar una curva de campana, el 68% de las medidas se encuentran dentro de una desviación estándar de la media. El 95% de la distribución se encuentra dentro de dos desviaciones estándar de la media. Un 99,7% de las medidas caen dentro de tres desviaciones estándar de la misma. Estos porcentajes, denominados regla empírica, son la base del análisis estadístico de los fenómenos naturales. Si un investigador médico, por ejemplo, descubre que un grupo que tomó un determinado medicamento para controlar el colesterol ahora tiene medidas del colesterol dos desviaciones estándar de la media, es poco probable que ocurra por casualidad.