El sesgo es el error en las estimaciones debido a errores sistemáticos que conducen a resultados consistentemente altos o bajos en comparación con los valores reales. El sesgo individual de una estimación que se sabe que está sesgado es la diferencia entre los valores estimados y reales. Si no se sabe que la estimación está sesgada, la diferencia también podría deberse a un error aleatorio u otras imprecisiones. Contrariamente al sesgo, que siempre actúa en una dirección, estos errores pueden ser positivos o negativos.
Para calcular el sesgo de un método utilizado para muchas estimaciones, encuentre los errores restando cada estimación del valor real u observado . Sume todos los errores y divida por el número de estimaciones para obtener el sesgo. Si los errores suman cero, las estimaciones fueron imparciales, y el método ofrece resultados imparciales. Si las estimaciones están sesgadas, puede ser posible encontrar la fuente del sesgo y eliminarlo para mejorar el método.
TL; DR (demasiado largo; no leído)
Calcule el sesgo al encontrar la diferencia entre una estimación y el valor real. Para encontrar el sesgo de un método, realice muchas estimaciones y sume los errores en cada estimación en comparación con el valor real. Dividir por el número de estimaciones da el sesgo del método. En estadística, puede haber muchas estimaciones para encontrar un solo valor. El sesgo es la diferencia entre la media de estas estimaciones y el valor real.
Cómo funciona el sesgo
Cuando las estimaciones están sesgadas, están constantemente equivocadas en una dirección debido a errores en el sistema utilizado para las estimaciones. Por ejemplo, un pronóstico del tiempo puede predecir consistentemente temperaturas más altas que las realmente observadas. El pronóstico está sesgado, y en algún lugar del sistema hay un error que da una estimación demasiado alta. Si el método de pronóstico es imparcial, aún puede predecir temperaturas que no son correctas, pero las temperaturas incorrectas a veces serán más altas y otras más bajas que las temperaturas observadas.
El sesgo estadístico funciona de la misma manera pero generalmente se basa en Un gran número de estimaciones, encuestas o pronósticos. Estos resultados pueden representarse gráficamente en una curva de distribución y el sesgo es la diferencia entre la media de la distribución y el valor real. Si hay sesgo, siempre habrá una diferencia a pesar de que algunas estimaciones individuales pueden caer a ambos lados del valor real.
Sesgo en encuestas
Un ejemplo de sesgo es una empresa de encuestas que realiza encuestas durante las elecciones campañas, pero los resultados de sus encuestas sobrestiman constantemente los resultados de un partido político en comparación con los resultados electorales reales. El sesgo se puede calcular para cada elección restando el resultado real de la predicción de la encuesta. El sesgo promedio del método de encuesta utilizado puede calcularse al encontrar el promedio de los errores individuales. Si el sesgo es grande y consistente, la empresa encuestadora puede intentar averiguar por qué su método está sesgado.
El sesgo puede provenir de dos fuentes principales. O bien la selección de participantes para la encuesta está sesgada, o el sesgo resulta de la interpretación de la información recibida de los participantes. Por ejemplo, las encuestas de Internet son inherentemente sesgadas porque los participantes de la encuesta que completan los formularios de Internet no son representativos de toda la población. Este es un sesgo de selección.
Las empresas encuestadoras son conscientes de este sesgo de selección y compensan ajustando los números. Si los resultados aún están sesgados, es un sesgo de información porque las compañías no interpretaron la información correctamente. En todos estos casos, un cálculo de sesgo muestra en qué medida los valores estimados son útiles y cuándo los métodos necesitan ajustes.