Cuando los científicos, economistas o estadísticos hacen predicciones basadas en la teoría y luego recopilan datos reales, necesitan una forma de medir la variación entre los valores pronosticados y medidos. Por lo general, se basan en el error cuadrático medio (MSE), que es la suma de las variaciones de los puntos de datos individuales al cuadrado y dividido por el número de puntos de datos menos 2. Cuando los datos se muestran en un gráfico, usted determina el MSE por sumando las variaciones en los puntos de datos del eje vertical. En un gráfico x-y, esos serían los valores y.
¿Por qué cuadrar las variaciones?
Multiplicar la variación entre los valores pronosticados y observados tiene dos efectos deseables. El primero es garantizar que todos los valores sean positivos. Si uno o más valores fueran negativos, la suma de todos los valores podría ser irrealmente pequeña y una representación pobre de la variación real entre los valores pronosticados y observados. La segunda ventaja de la cuadratura es dar más peso a las diferencias más grandes, lo que garantiza que un valor grande para MSE signifique grandes variaciones de datos. Algoritmo de stock de cálculo de muestra
Suponga que tiene un algoritmo que predice los precios de un stock en particular a diario. El lunes predice que el precio de las acciones será de $ 5.50, el martes será de $ 6.00, el miércoles $ 6.00, el jueves $ 7.50 y el viernes $ 8.00. Considerando el lunes como Día 1, tiene un conjunto de puntos de datos que aparecen así: (1, 5.50), (2, 6.00), (3, 6.00), (4, 7.50) y (5, 8.00). Los precios reales son los siguientes: lunes $ 4.75 (1, 4.75); Martes $ 5.35 (2, 5.35); Miércoles $ 6.25 (3, 6.25); Jueves $ 7.25 (4, 7.25); y viernes: $ 8.50 (5, 8.50).
Las variaciones entre los valores y de estos puntos son 0.75, 0.65, -0.25, 0.25 y -0.50 respectivamente, donde el signo negativo indica un valor predicho menor que el observado Para calcular MSE, primero debe cuadrar cada valor de variación, lo que elimina los signos menos y produce 0.5625, 0.4225, 0.0625, 0.0625 y 0.25. Sumar estos valores da 1.36 y dividir por el número de mediciones menos 2, que es 3, produce el MSE, que resulta ser 0.45.
MSE y RMSE
Los valores más pequeños para MSE indican un acuerdo más estrecho entre resultados pronosticados y observados, y un MSE de 0.0 indica un acuerdo perfecto. Sin embargo, es importante recordar que los valores de variación son cuadrados. Cuando se requiere una medición de error que esté en las mismas unidades que los puntos de datos, los estadísticos toman el error cuadrático medio (RMSE). Lo obtienen tomando la raíz cuadrada del error cuadrático medio. Para el ejemplo anterior, el RSME sería 0.671 o aproximadamente 67 centavos.