Por Kevin Beck, actualizado el 30 de agosto de 2022
Imagina que quieres saber cómo se compara el peso de tu cachorro de raza pura de 12 semanas con el de otros perros de la misma edad, sexo y raza en todo el mundo. Si tiene acceso a una base de datos completa, puede comparar el peso de su cachorro con el promedio de la población y ver su clasificación. Pero, ¿qué pasa si solo tienes unos pocos puntos de datos y aun así quieres evaluar cómo se relaciona un valor particular con la población en general?
En tales casos, entran en juego dos herramientas estadísticas:el z‑score y el t‑score . Ambos le ayudan a comprender cómo se compara una observación específica con un valor "típico", pero se utilizan en circunstancias diferentes.
La media (promedio) de un conjunto de datos es la suma de todos los valores dividida por el número de observaciones, n . Para una población, la media se denota por μ , y la desviación estándar por σ . En una distribución normal estándar, aproximadamente el 68 % de las observaciones se encuentran dentro de ±1 σ de la media, y aproximadamente el 95 % se encuentran dentro de ±2 σ.
La magnitud de la desviación estándar relativa a la media indica la dispersión de los datos:una σ mayor produce una curva de campana más amplia, mientras que una σ menor da como resultado una más estrecha.
Una puntuación z mide cuántas desviaciones estándar tiene una sola observación, x , proviene de la media poblacional:Z =(x – μ) / σ . Una puntuación z de 0 significa que la observación es igual a la media; +1,00 y –1,00 indican una desviación estándar por encima o por debajo de la media, respectivamente.
Una puntuación t es similar pero usa la media muestral (𝑥̄ ) y la desviación estándar muestral (s ), e incorpora el tamaño de la muestra:t =(𝑥̄ – μ) / (s / √n) . El denominador representa el error estándar de la media.
Si su muestra contiene menos de 30 observaciones, se prefiere una puntuación t a una puntuación z. A medida que crece el tamaño de la muestra, la distribución t converge hacia la distribución normal, haciendo que la diferencia sea insignificante para n grandes. . La elección del intervalo de confianza (normalmente 90 % o 95 % para las pruebas de dos colas) determina el valor crítico con el que compara su puntuación t.
Supongamos que una clase de 25 estudiantes universitarios obtiene un promedio de 64% en una prueba sorpresa de trivia de Harry Potter. La media poblacional es 60% y la desviación estándar muestral es 15%. Para calcular la puntuación t:
t = (64 – 60) / (15 / √25) = 4 / (15 / 5) = 4 / 3 ≈ 1.33
Los grados de libertad son df = n – 1 = 24 . Al buscar un nivel de confianza del 90% en una tabla de distribución t (o usar una calculadora en línea), el valor crítico para 24df es aproximadamente 1,711. Desde 1,33 < 1,711, el promedio de la clase no es significativamente mayor que la media de la población con un nivel de confianza del 90 %.
Ajustar el intervalo de confianza (por ejemplo, al 80 % o al 70 %) cambiaría el valor crítico y podría alterar la conclusión.
Para obtener tablas y calculadoras más detalladas, consulte fuentes acreditadas como la entrada de Wikipedia sobre t-distribution o software estadístico como R o la biblioteca SciPy de Python.