Cuando los científicos, economistas o estadísticos hacen predicciones basadas en la teoría y luego recopilan datos reales, necesitan una forma de medir la variación entre los valores pronosticados y medidos. Por lo general, se basan en el error cuadrático medio (MSE), que es la suma de las variaciones de los puntos de datos individuales al cuadrado y dividido por el número de puntos de datos menos 2. Cuando los datos se muestran en un gráfico, usted determina el MSE sumando las variaciones en los puntos de datos del eje vertical. En un gráfico x-y, ese sería el valor y.
¿Por qué cuadrar las variaciones?
Multiplicar la variación entre los valores predichos y observados tiene dos efectos deseables. El primero es garantizar que todos los valores sean positivos. Si uno o más valores fueron negativos, la suma de todos los valores podría ser poco realista y una representación pobre de la variación real entre los valores predichos y observados. La segunda ventaja de la cuadratura es dar más peso a las diferencias más grandes, lo que asegura que un gran valor para MSE significa grandes variaciones de datos.
Algoritmo de stock de cálculo de muestra
Supongamos que tiene un algoritmo que predice los precios de una acción en particular sobre una base diaria. El lunes, predice que el precio de las acciones será de $ 5.50, el martes será de $ 6.00, el miércoles $ 6.00, el jueves $ 7.50 y el viernes $ 8.00. Teniendo en cuenta el lunes como Día 1, tiene un conjunto de puntos de datos que aparecen así: (1, 5,50), (2, 6,00), (3, 6,00), (4, 7,50) y (5, 8,00). Los precios reales son los siguientes: lunes $ 4.75 (1, 4.75); Martes $ 5.35 (2, 5.35); Miércoles $ 6.25 (3, 6.25); Jueves $ 7.25 (4, 7.25); y viernes: $ 8.50 (5, 8.50).
Las variaciones entre los valores y de estos puntos son 0.75, 0.65, -0.25, 0.25 y -0.50 respectivamente, donde el signo negativo indica un valor predicho menor que el observado. Para calcular MSE, primero debe cuadrar cada valor de variación, lo que elimina los signos menos y rinde 0.5625, 0.4225, 0.0625, 0.0625 y 0.25. Si se suman estos valores da 1,36 y se divide entre el número de mediciones menos 2, que es 3, se obtiene el MSE, que resulta ser 0,45.
MSE y RMSE
Los valores más pequeños para MSE indican una mayor concordancia entre los resultados pronosticados y observados, y un MSE de 0.0 indica un acuerdo perfecto. Sin embargo, es importante recordar que los valores de variación son al cuadrado. Cuando se requiere una medición de error que está en las mismas unidades que los puntos de datos, los estadísticos toman el error cuadrático medio (RMSE). Lo obtienen tomando la raíz cuadrada del error cuadrático medio. Para el ejemplo anterior, la RSME sería 0.671 o aproximadamente 67 centavos.