Simplifique las comparaciones de conjuntos de números, especialmente conjuntos de números grandes, calculando los valores centrales utilizando la media, la moda y la mediana. Use los rangos y las desviaciones estándar de los conjuntos para examinar la variabilidad de los datos.
Cálculo de la media
La media identifica el valor promedio del conjunto de números. Por ejemplo, considere el conjunto de datos que contiene los valores 20, 24, 25, 36, 25, 22, 23.
Para encontrar la media, use el fórmula: La media es igual a la suma de los números en el conjunto de datos dividido por el número de valores en el conjunto de datos. En términos matemáticos: Media \u003d (suma de todos los términos) ÷ (cuántos términos o valores en el conjunto).
Agregar los números en el conjunto de datos de ejemplo : 20 + 24 + 25 + 36 + 25 + 22 + 23 \u003d 175.
Divide por el número de puntos de datos en el conjunto. Este conjunto tiene siete valores, así que divídalo entre 7.
Inserte los valores en la fórmula para calcular la media. La media es igual a la suma de los valores (175) dividida por el número de puntos de datos (7). Como 175 ÷ 7 \u003d 25, la media de este conjunto de datos es igual a 25. No todos los valores medios serán iguales a un número entero.
Cálculo de la mediana
La mediana identifica el punto medio o el valor medio de un conjunto de números.
Ordena los números de menor a mayor. Use el conjunto de valores de ejemplo: 20, 24, 25, 36, 25, 22, 23. Colocados en orden, el conjunto se convierte en: 20, 22, 23, 24, 25, 25, 36.
Dado que este conjunto de números tiene siete valores, la mediana o valor en el centro es 24.
Si el conjunto de números tiene un número par de valores, calcule promedio de los dos valores centrales. Por ejemplo, suponga que el conjunto de números contiene los valores 22, 23, 25, 26. El centro se encuentra entre 23 y 25. Sumar 23 y 25 produce 48. Dividir 48 entre dos da un valor medio de 24.
Modo de cálculo
El modo identifica el valor o valores más comunes en el conjunto de datos. Dependiendo de los datos, puede haber uno o más modos, o ningún modo en absoluto.
Como encontrar la mediana, ordenar el conjunto de datos desde el más pequeño al más grande En el conjunto de ejemplos, los valores ordenados se convierten en: 20, 22, 23, 24, 25, 25, 36.
Se produce un modo cuando los valores se repiten. En el conjunto de ejemplos, el valor 25 aparece dos veces. No se repiten otros números. Por lo tanto, el modo es el valor 25.
En algunos conjuntos de datos, se produce más de un modo. El conjunto de datos 22, 23, 23, 24, 27, 27, 29 contiene dos modos, uno cada uno en 23 y 27. Otros conjuntos de datos pueden tener más de dos modos, pueden tener modos con más de dos números (como 23, 23 , 24, 24, 24, 28, 29: el modo es igual a 24) o puede no tener ningún modo (como 21, 23, 24, 25, 26, 27, 29). El modo puede ocurrir en cualquier parte del conjunto de datos, no solo en el medio.
Cálculo del rango
El rango muestra la distancia matemática entre los valores más bajos y más altos en el conjunto de datos. El rango mide la variabilidad del conjunto de datos. Un amplio rango indica una mayor variabilidad en los datos, o tal vez un valor atípico lejos del resto de los datos. Los valores atípicos pueden sesgar o cambiar el valor medio lo suficiente como para afectar el análisis de datos.
En el grupo de muestra, el valor más bajo es 20 y el valor más alto es 36.
Para calcular el rango, reste el valor más bajo del valor más alto. Como 36-20 \u003d 16, el rango es igual a 16.
En el conjunto de muestras, el valor de datos alto de 36 excede el valor anterior, 25, por 11 Este valor parece extremo, dados los otros valores del conjunto. El valor de 36 podría ser un punto de datos atípicos.
Cálculo de la desviación estándar
La desviación estándar mide la variabilidad del conjunto de datos. Al igual que el rango, una desviación estándar más pequeña indica menos variabilidad.
Para encontrar la desviación estándar es necesario sumar la diferencia al cuadrado entre cada punto de datos y la media [∑ (x- µ) 2], sumando todos los cuadrados, dividiendo esa suma por uno menos que el número de valores (N-1), y finalmente calculando la raíz cuadrada del dividendo. Matemáticamente, comience con el cálculo de la media. Calcule la media sumando todos los valores de puntos de datos y luego dividiendo por el número de puntos de datos. En el conjunto de datos de muestra, 20 + 24 + 25 + 36 + 25 + 22 + 23 \u003d 175. Divida la suma, 175, por el número de puntos de datos, 7, o 175 ÷ 7 \u003d 25. La media es igual a 25. Luego, reste la media de cada punto de datos, luego cuadre cada diferencia. La fórmula se ve así: ∑ (x-µ) 2, donde ∑ significa suma, x representa el valor de cada conjunto de datos y µ representa el valor medio. Continuando con el conjunto de ejemplos, los valores se convierten en: 20-25 \u003d -5 y -5 2 \u003d 25; 24-25 \u003d -1 y -1 2 \u003d 1; 25-25 \u003d 0 y 0 2 \u003d 0; 36-25 \u003d 11 y 11 2 \u003d 121; 25-25 \u003d 0 y 0 2 \u003d 0; 22-25 \u003d -3 y -3 2 \u003d 9; y 23-25 \u003d -2 y -2 2 \u003d 4. Agregar las diferencias al cuadrado produce: 25 + 1 + 0 + 121 + 0 + 9 + 4 \u003d 160. Divida la suma de las diferencias al cuadrado entre uno menos que el número de puntos de datos. El conjunto de datos de ejemplo tiene 7 valores, por lo que N-1 es igual a 7-1 \u003d 6. La suma de las diferencias al cuadrado, 160, dividido por 6 es aproximadamente 26.6667. Calcule la desviación estándar al encontrar la raíz cuadrada de la división por N-1. En el ejemplo, la raíz cuadrada de 26.6667 es igual a aproximadamente 5.164. Por lo tanto, la desviación estándar es igual a aproximadamente 5.164. La desviación estándar ayuda a evaluar los datos. Los números en el conjunto de datos que se encuentran dentro de una desviación estándar de la media son parte del conjunto de datos. Los números que quedan fuera de dos desviaciones estándar son valores extremos o valores atípicos. En el conjunto de ejemplos, el valor 36 se encuentra a más de dos desviaciones estándar de la media, por lo que 36 es un valor atípico. Los valores atípicos pueden representar datos erróneos o sugerir circunstancias imprevistas y deben considerarse cuidadosamente al interpretar los datos.