Cuando construyes modelos en estadísticas, generalmente los probarás, asegurándote de que los modelos coincidan con situaciones reales. El residual es un número que te ayuda a determinar qué tan cerca está tu modelo teórico del fenómeno en el mundo real. Los residuos no son demasiado difíciles de entender: son solo números que representan qué tan lejos está un punto de datos de lo que "debería ser" según el modelo predicho.
Definición matemática
Matemáticamente, un residuo es la diferencia entre un punto de datos observado y el valor esperado o estimado de lo que debería haber sido ese punto de datos. La fórmula para un residuo es R = O - E, donde "O" significa el valor observado y "E" significa el valor esperado. Esto significa que los valores positivos de R muestran valores más altos de lo esperado, mientras que los valores negativos muestran valores más bajos de lo esperado. Por ejemplo, puede tener un modelo estadístico que diga que cuando el peso de un hombre es de 140 libras, su altura debe ser de 6 pies o 72 pulgadas. Cuando sale y recopila datos, puede encontrar a alguien que pese 140 libras pero que mida 5 pies 9 pulgadas, o 69 pulgadas. El residual es de 69 pulgadas menos 72 pulgadas, lo que le da un valor negativo de 3 pulgadas. En otras palabras, el punto de datos observado está 3 pulgadas por debajo del valor esperado.
Comprobación de modelos
Los residuos son especialmente útiles cuando desea verificar si su modelo teorizado funciona en el mundo real. Cuando creas un modelo y calculas sus valores esperados, estás teorizando. Pero cuando va a recopilar datos, es posible que los datos no coincidan con el modelo. Una forma de encontrar este desajuste entre su modelo y el mundo real es calcular los residuos. Por ejemplo, si encuentra que sus residuos están siempre muy alejados de sus valores estimados, es posible que su modelo no tenga una teoría subyacente sólida. Una manera fácil de usar los residuos de esta manera es trazarlos.
Sciencing Video Vault
Crear el soporte (casi) perfecto: aquí es cómo crear el soporte (casi) perfecto: aquí cómo hacer un gráfico Residuos
Cuando calculas los residuos, tienes un puñado de números, lo que es difícil de interpretar para los humanos. El trazado de los residuos a menudo puede mostrar patrones. Estos patrones pueden llevarlo a determinar si el modelo es un buen ajuste. Dos aspectos de los residuos pueden ayudarlo a analizar una gráfica de residuos. Primero, los residuos para un buen modelo deben estar dispersos en ambos lados de cero. Es decir, una gráfica de residuos debe tener aproximadamente la misma cantidad de residuos negativos que los residuos positivos. En segundo lugar, los residuos deben parecer aleatorios. Si ve un patrón en su trazado residual, como el que tiene un patrón lineal o curvo claro, su modelo original podría tener un error.
Residuos especiales: valores atípicos
Valores atípicos, o residuos de valores extremadamente grandes , aparecen inusualmente lejos de los otros puntos en su gráfico de residuos. Cuando encuentre un residuo que es un valor atípico en su conjunto de datos, debe pensarlo cuidadosamente. Algunos científicos recomiendan eliminar los valores atípicos porque son "anomalías" o casos especiales. Otros recomiendan una mayor investigación de por qué tiene un residuo tan grande. Por ejemplo, podría estar haciendo un modelo de cómo el estrés afecta las calificaciones escolares y teorizar que más estrés generalmente significa peores calificaciones. Si sus datos demuestran que esto es cierto, excepto para una persona, que tiene muy poco estrés y calificaciones muy bajas, puede preguntarse por qué. Tal persona podría simplemente no preocuparse por nada, incluida la escuela, explicando el gran residuo. En este caso, podría considerar eliminar el resto de su conjunto de datos porque desea modelar solo a los estudiantes que se preocupan por la escuela.