Un diagrama de dispersión es un gráfico que muestra la relación entre dos conjuntos de datos. Algunas veces es útil usar los datos contenidos en un diagrama de dispersión para obtener una relación matemática entre dos variables. La ecuación de un diagrama de dispersión se puede obtener a mano, usando cualquiera de dos formas principales: una técnica gráfica o una técnica llamada regresión lineal.
Crear un Gráfico de dispersión
Utilice papel cuadriculado para crear un diagrama de dispersión. Dibuje los ejes xey, asegúrese de que se crucen y etiqueten el origen. Asegúrese de que los ejes xey también tengan títulos correctos. Luego, trace cada punto de datos dentro del gráfico. Cualquier tendencia entre los conjuntos de datos graficados ahora debería ser evidente.
Línea de mejor ajuste
Una vez que se ha creado un diagrama de dispersión, suponiendo que hay una correlación lineal entre dos conjuntos de datos, podemos usar un método gráfico para obtener la ecuación. Toma una regla y traza una línea lo más cerca posible de todos los puntos. Intente asegurarse de que haya tantos puntos sobre la línea como debajo de la línea. Una vez que se ha dibujado la línea, utilice los métodos estándar para encontrar la ecuación de la línea recta
Ecuación de la línea recta
Una vez que se ha colocado una línea de mejor ajuste en un gráfico de dispersión, es sencillo para encontrar la ecuación La ecuación general de una línea recta es:
y = mx + c
Donde m es la pendiente (gradiente) de la recta y c es la intersección en y. Para obtener el degradado, encuentre dos puntos sobre la línea. Por el bien de este ejemplo, supongamos que los dos puntos son (1,3) y (0,1). El gradiente se puede calcular tomando la diferencia en las coordenadas y y dividiendo por la diferencia en las coordenadas x:
m = (3 - 1) /(1 - 0) = 2/1 = 2
El gradiente en este caso es igual a 2. Hasta ahora, la ecuación de la línea recta es
y = 2x + c
El valor de c se puede obtener sustituyendo en los valores por un punto conocido. Siguiendo el ejemplo, uno de los puntos conocidos es (1,3). Enchufa esto en la ecuación y reorganiza para c:
3 = (2 * 1) + c
c = 3 - 2 = 1
La ecuación final en este caso es:
y = 2x + 1
Regresión lineal
La regresión lineal es un método matemático que se puede usar para obtener la ecuación de línea recta de un gráfico de dispersión. Comience colocando sus datos en una tabla. Para este ejemplo, supongamos que tenemos los siguientes datos:
(4.1, 2.2) (6.5, 4.5) (12.6, 10.4)
Calcule la suma de los valores x:
x_sum = 4.1 + 6.5 + 12.6 = 23.2
A continuación, calcule la suma de los valores y:
y_sum = 2.2 + 4.4 + 10.4 = 17
Ahora sume los productos de cada conjunto de puntos de datos:
xy_sum = (4.1 * 2.2) + (6.5 * 4.4) + (12.6 * 10.4) = 168.66
A continuación, calcule la suma de los valores x al cuadrado y los valores y al cuadrado:
x_square_sum = (4.1 ^ 2) + (6.5 ^ 2) + (12.6 ^ 2) = 217.82
y_square_sum = (2.2 ^ 2) + (4.5 ^ 2) + (10.4 ^ 2) = 133.25
Finalmente, cuente la cantidad de puntos de datos que tiene. En este caso, tenemos tres puntos de datos (N = 3). El gradiente para la línea de mejor ajuste se puede obtener de:
m = (N * xy_sum) - (x_sum * y_sum) /(N * x_square_sum) - (x_sum * x_sum) = (3 * 168.66) - (23,2 * 17) /(3 * 217,82) - (23,2 * 23,2) = 0,968
El intercepto de la línea que mejor se ajusta se puede obtener de:
c = (x_square_sum * y_sum) - (x_sum * xy_sum) /(N * x_square_sum) - (x_sum * x_sum)
\\ = (217.82 17) - (23.2 La ecuación final es por lo tanto: y = 0.968x - 1.82
168.66) /(3 * 217.82) - (23.2 * 23.2) \\ = -1.82