Un diagrama de dispersión es una herramienta de diagnóstico importante en el arsenal de un estadístico, que se obtiene graficando dos variables entre sí. Permite al estadístico analizar las variables y formar una hipótesis de trabajo sobre su relación. Por esta razón, generalmente se dibuja antes de llevar a cabo un análisis de regresión. El estadístico posteriormente prueba la hipótesis usando un análisis de regresión y determina el signo y la magnitud precisa de la relación. Además, un diagrama de dispersión ayuda a identificar valores atípicos, valores que están anormalmente distantes de la mayoría de los datos en la muestra. La eliminación de valores atípicos ayuda a mejorar el modelo de regresión.
Compruebe la relación negativa entre las dos variables en el gráfico de dispersión. Si los valores bajos de la primera variable corresponden con los valores altos de la segunda variable, hay una correlación negativa. En este caso, una línea trazada a través de los puntos de datos tiene una pendiente negativa.
Examine la gráfica de dispersión para una relación positiva entre las variables. Si los valores bajos de la primera variable en la gráfica de dispersión corresponden con valores bajos de la segunda, y los valores altos de la primera coinciden de manera similar con los valores altos de la segunda, las variables tienen una correlación positiva. En este caso, una línea trazada a través de los puntos de datos tiene una pendiente positiva.
Inspeccione el diagrama de dispersión para ver si no hay relación entre las variables. Si los puntos de datos en el diagrama de dispersión se distribuyen aleatoriamente sin relación aparente entre los dos, no tienen correlación o una correlación pequeña, estadísticamente insignificante. En este caso, una línea dibujada a través de los puntos de datos es horizontal con pendiente igual a cero.
Ajuste una línea a través de los puntos de datos y examine su forma para medir la naturaleza de la relación entre las dos variables. Una línea recta se interpreta como una relación lineal, una forma curva sugiere una relación cuadrática, y una línea que permanece relativamente plana antes de dispararse repentinamente hacia arriba o hacia abajo se interpreta como una relación exponencial.
Examine la gráfica de dispersión para valores atípicos , valores que se encuentran anormalmente lejos del conjunto de puntos de datos. Los valores atípicos distorsionan la relación entre las variables. Elimínelos, pero solo si su ausencia no afecta el análisis de la relación entre las dos variables.