Una de las herramientas más básicas para la ingeniería o el análisis científico es la regresión lineal. Esta técnica comienza con un conjunto de datos en dos variables. La variable independiente generalmente se llama "x" y la variable dependiente generalmente se llama "y". El objetivo de la técnica es identificar la línea, y \u003d mx + b, que se aproxima al conjunto de datos. Esta línea de tendencia puede mostrar, gráfica y numéricamente, las relaciones entre las variables dependientes e independientes. A partir de este análisis de regresión, también se calcula un valor para la correlación.
Identifica y separa los valores x e y de tus puntos de datos. Si está utilizando una hoja de cálculo, ingréselos en columnas adyacentes. Debe haber el mismo número de valores x e y. De lo contrario, el cálculo será inexacto o la función de hoja de cálculo devolverá un error. x \u003d (6, 5, 11, 7, 5, 4, 4) y \u003d (2, 3, 9, 1, 8, 7, 5)
Calcule el valor promedio de los valores de x y valores y dividiendo la suma de todos los valores por el número total de valores en el conjunto. "x_avg" e y_avg. "X_avg \u003d (6 + 5 + 11 + 7 + 5 + 4 + 4) /7 \u003d 6 y_avg \u003d (2 + 3 + 9 + 1 + 8 + 7 + 5) /7 \u003d 5
Cree dos nuevos conjuntos de datos restando el valor x_avg de cada valor x y el valor y_avg de cada valor y. X1 \u003d (6 - 6, 5 - 6, 11 - 6, 7 - 6 ...) x1 \u003d (0, -1, 5, 1, -1, -2, -2) y1 \u003d (2 - 5, 3 - 5, 9 - 5, 1 - 5, ... ) y1 \u003d (-3, -2, 4, -4, 3, 2, 0)
Multiplica cada valor x1 por cada valor y1, en orden. x1y1 \u003d (0 * -3, -1 * -2, 5 * 4, ...) x1y1 \u003d (0, 2, 20, -4, -3, -4, 0)
Cuadra cada valor x1. X1 ^ 2 \u003d (0 ^ 2 , 1 ^ 2, -5 ^ 2, ...) x1 ^ 2 \u003d (0, 1, 25, 1, 1, 4, 4)
Calcule las sumas de los valores x1y1 y x1 ^ 2 valores sum_x1y1 \u003d 0 + 2 + 20 - 4 - 3 - 4 + 0 \u003d 11 sum_x1 ^ 2 \u003d 0 + 1+ 25 + 1 + 1 + 4 + 4 \u003d 36
Divida "sum_x1y1" por " sum_x1 ^ 2 "para obtener el coeficiente de regresión. sum_x1y1 /sum_x1 ^ 2 \u003d 11/36 \u003d 0.306
Consejos
Para aquellos que prefieren trabajar directamente con la ecuación uation, es m \u003d sum [(x_i - x_avg) (y_i - y_avg)] /sum [(x_i - x_avg) ^ 2].
Muchas hojas de cálculo tendrán una variedad de funciones de regresión lineal. En Microsoft Excel, puede usar la función "Pendiente" para tomar el promedio de las columnas x e y, y la hoja de cálculo realizará automáticamente todos los cálculos restantes.