Experimentos prueban predicciones. Estas predicciones a menudo son numéricas, lo que significa que, a medida que los científicos recopilan datos, esperan que los números se descompongan de cierta manera. Los datos del mundo real rara vez coinciden exactamente con las predicciones de los científicos, por lo que los científicos necesitan una prueba para decirles si la diferencia entre los números observados y esperados se debe al azar, o debido a algún factor imprevisto que obligará al científico a ajustar la teoría subyacente . Una prueba de chi-cuadrado es una herramienta estadística que los científicos usan para este propósito.
El tipo de datos requeridos
Necesita datos categóricos para usar una prueba de chi-cuadrado. Un ejemplo de datos categóricos es el número de personas que respondieron a la pregunta "sí" versus el número de personas que respondieron la pregunta "no" (dos categorías) o el número de ranas en una población que son verdes, amarillas o grises ( tres categorías). No puede usar una prueba de chi-cuadrado en datos continuos, como los que se pueden recopilar de una encuesta que pregunta a las personas qué tan altas son. De dicha encuesta, obtendría una amplia gama de alturas. Sin embargo, si dividía las alturas en categorías como "menos de 6 pies de altura" y "6 pies de altura y más", podría usar una prueba de chi-cuadrado en los datos.
La bondad de Prueba de ajuste
Una prueba de bondad de ajuste es una prueba común, y tal vez la más simple, realizada con la estadística de chi-cuadrado. En una prueba de bondad de ajuste, el científico hace una predicción específica sobre los números que espera ver en cada categoría de sus datos. Luego recopila datos del mundo real, llamados datos observados, y usa la prueba de chi-cuadrado para ver si los datos observados coinciden con sus expectativas.
Por ejemplo, imagine que un biólogo está estudiando los patrones de herencia en una especie de rana Entre 100 descendientes de un grupo de padres de ranas, el modelo genético del biólogo la lleva a esperar 25 crías amarillas, 50 crías verdes y 25 crías grises. Lo que realmente observa es 20 crías amarillas, 52 crías verdes y 28 crías grises. ¿Su predicción es compatible o su modelo genético es incorrecto? Puede usar una prueba de chi-cuadrado para averiguarlo.
Calcular la estadística de Chi-Cuadrado
Comience a calcular la estadística de chi-cuadrado restando cada valor esperado de su valor observado correspondiente y cuadrando cada resultado. El cálculo para el ejemplo de la descendencia de la rana se vería así:
amarillo = (20 - 25) ^ 2 = 25 verde = (52 - 50) ^ 2 = 4 gris = (28 - 25) ^ 2 = 9
Ahora divida cada resultado por su valor esperado correspondiente.
amarillo = 25 ÷ 25 = 1 verde = 4 ÷ 50 = 0.08 gris = 9 ÷ 25 = 0.36
Finalmente, sume las respuestas del paso anterior.
chi-square = 1 + 0.08 + 0.36 = 1.44
Interpretando la Estadística Chi-Cuadrada
La chi -esta estadística cuadrada te dice qué tan diferentes fueron tus valores observados de tus valores predichos. Cuanto mayor es el número, mayor es la diferencia. Puede determinar si su valor de chi-cuadrado es demasiado alto o bajo para soportar su predicción al ver si está por debajo de cierto valor crítico en una tabla de distribución de chi-cuadrado. Esta tabla coincide con los valores de chi-cuadrado con probabilidades, llamados valores p. Específicamente, la tabla indica la probabilidad de que las diferencias entre los valores observados y los esperados se deban simplemente a la posibilidad aleatoria o a que haya algún otro factor presente. Para una prueba de bondad de ajuste, si el valor p es 0.05 o menos, entonces debe rechazar su predicción.
Debe determinar los grados de libertad (df) en sus datos antes de poder buscar el valor crítico de chi-cuadrado en una tabla de distribución. Los grados de libertad se calculan restando 1 del número de categorías en sus datos. Hay tres categorías en este ejemplo, por lo que hay 2 grados de libertad. Un vistazo a esta tabla de distribución de chi-cuadrado le dice que, para 2 grados de libertad, el valor crítico para una probabilidad de 0.05 es 5.99. Esto significa que, siempre que su valor calculado de chi-cuadrado sea inferior a 5.99, sus valores esperados, y por lo tanto la teoría subyacente, son válidos y compatibles. Dado que la estadística de chi-cuadrado para los datos de descendientes de ranas fue 1.44, el biólogo puede aceptar su modelo genético.