Al ajustar una línea recta a un conjunto de datos, puede interesarle determinar qué tan bien la línea resultante se ajusta a los datos. Una forma de hacerlo es calcular el error de suma de cuadrados (SSE). Este valor proporciona una medida de qué tan bien la línea de mejor ajuste se aproxima al conjunto de datos. El SSE es importante para el análisis de datos experimentales y se determina solo a través de unos pocos pasos.
Encuentre una línea de mejor ajuste para modelar los datos mediante regresión. La línea de mejor ajuste tiene la forma y = ax + b, donde a y b son parámetros que debe determinar. Puede encontrar estos parámetros usando un análisis de regresión lineal simple. Por ejemplo, supongamos que la línea de mejor ajuste tiene la forma y = 0.8x + 7.
Usa la ecuación para determinar el valor de cada valor y predicho por la línea de mejor ajuste. Puede hacer esto sustituyendo cada valor x en la ecuación de la línea. Por ejemplo, si x es igual a 1, sustituyéndolo en la ecuación y = 0.8x + 7 da 7.8 para el valor y.
Determine la media de los valores predichos a partir de la línea de la ecuación de mejor ajuste. Puede hacer esto sumando todos los valores y pronosticados a partir de las ecuaciones, y dividiendo el número resultante por el número de valores. Por ejemplo, si los valores son 7.8, 8.6 y 9.4, al sumar estos valores da 25.8, y dividiendo este número por el número de valores, 3 en este caso, da 8.6.
Reste cada uno de los valores individuales de la media, y el cuadrado del número resultante. En nuestro ejemplo, si restamos el valor 7.8 de la media 8.6, el número resultante es 0.8. Cuadrar este valor da 0,64.
Sumar todos los valores al cuadrado del Paso 4. Si aplica las instrucciones del Paso 4 a los tres valores en nuestro ejemplo, encontrará valores de 0.64, 0 y 0.64. Al sumar estos valores se obtiene 1.28. Este es el error de suma de cuadrados.
Advertencia
Los números de los datos solo se usan para determinar la ecuación de la línea de mejor ajuste. Use valores de la línea de mejor ajuste al calcular el error de suma de cuadrados.