Por Ariel Balter, Ph.D. Actualizado el 30 de agosto de 2022
DragonImages/iStock/Getty Images
En el análisis de regresión, designamos una variable como variable explicativa (x) y la otra como variable de respuesta (y). El modelo de regresión produce una función y =f(x) que predice mejor y a partir de x. Para cada observación i, el residual es la diferencia entre la respuesta observada y[i] y su valor predicho f(x[i]):
Residual =y[i] – f(x[i])
Considere cinco individuos con los siguientes pares de altura (cm) y peso (kg):(152, 54), (165, 65), (175, 100), (170, 80) y (140, 45). Un ajuste cuadrático del peso en función de la altura produce la ecuación:
w =f(h) =1160 – 15,5h + 0,054h²
Usando este modelo, los residuos (en kilogramos) son [2,38, 7,65, 1,25, 5,60, 3,40]. La suma de los residuos es de 15,5 kg.
El modelo de regresión más simple es lineal, representado por y =m x + b. Por construcción, la suma de los residuos de una regresión lineal es cero, porque la línea se ajusta para minimizar la desviación vertical total.