Un diagrama de dispersión es un gráfico que muestra la relación entre dos conjuntos de datos. A veces es útil usar los datos contenidos en un diagrama de dispersión para obtener una relación matemática entre dos variables. La ecuación de un diagrama de dispersión se puede obtener a mano, utilizando cualquiera de las dos formas principales: una técnica gráfica o una técnica llamada regresión lineal.
Crear un diagrama de dispersión
Use papel cuadriculado para crear un diagrama de dispersión . Dibuje los ejes x e y, asegúrese de que se crucen y etiquete el origen. Asegúrese de que los ejes X e Y también tengan títulos correctos. Luego, trace cada punto de datos dentro del gráfico. Cualquier tendencia entre los conjuntos de datos trazados ahora debería ser evidente.
Línea de mejor ajuste
Una vez que se ha creado un diagrama de dispersión, suponiendo que haya una correlación lineal entre dos conjuntos de datos, podemos usar un método gráfico para obtener la ecuación. Tome una regla y dibuje una línea lo más cerca posible de todos los puntos. Intente asegurarse de que haya tantos puntos sobre la línea como hay debajo de la línea. Una vez que se ha dibujado la línea, use métodos estándar para encontrar la ecuación de la línea recta
Ecuación de línea recta
Una vez que se ha colocado una línea de mejor ajuste en un gráfico de dispersión, es sencillo encontrar el ecuación. La ecuación general de una línea recta es:
y \u003d mx + c
Donde m es la pendiente (gradiente) de la línea y c es la intersección en y. Para obtener el gradiente, encuentre dos puntos sobre la línea. Por el bien de este ejemplo, supongamos que los dos puntos son (1,3) y (0,1). El gradiente se puede calcular tomando la diferencia en las coordenadas y y dividiendo por la diferencia en las coordenadas x:
m \u003d (3 - 1) /(1 - 0) \u003d 2/1 \u003d 2
El gradiente en este caso es igual a 2. Hasta ahora, la ecuación de la línea recta es
y \u003d 2x + c
Se puede obtener el valor para c mediante la sustitución en los valores de un punto conocido. Siguiendo el ejemplo, uno de los puntos conocidos es (1,3). Inserte esto en la ecuación y reorganice para c:
3 \u003d (2 * 1) + c
c \u003d 3 - 2 \u003d 1
La ecuación final en este caso es:
y \u003d 2x + 1
Regresión lineal
La regresión lineal es un método matemático que puede usarse para obtener la ecuación de línea recta de un diagrama de dispersión. Comience colocando sus datos en una tabla. Para este ejemplo, supongamos que tenemos los siguientes datos:
(4.1, 2.2) (6.5, 4.5) (12.6, 10.4)
Calcule la suma de los valores de x:
x_sum \u003d 4.1 + 6.5 + 12.6 \u003d 23.2
A continuación, calcule la suma de los valores y:
y_sum \u003d 2.2 + 4.4 + 10.4 \u003d 17
Ahora suma los productos de cada conjunto de puntos de datos:
xy_sum \u003d (4.1 * 2.2) + (6.5 * 4.4) + (12.6 * 10.4) \u003d 168.66
A continuación, calcule la suma de los valores x al cuadrado y los valores y al cuadrado:
x_square_sum \u003d (4.1 ^ 2) + (6.5 ^ 2) + (12.6 ^ 2) \u003d 217.82
y_square_sum \u003d (2.2 ^ 2) + (4.5 ^ 2) + (10.4 ^ 2) \u003d 133.25
Finalmente, cuente el número de puntos de datos que tiene. En este caso tenemos tres puntos de datos (N \u003d 3). El gradiente para la línea de mejor ajuste se puede obtener de:
m \u003d (N * xy_sum) - (x_sum * y_sum) /(N * x_square_sum) - (x_sum * x_sum) \u003d (3 * 168.66) - (23.2 * 17) /(3 * 217.82) - (23.2 * 23.2) \u003d 0.968
La intersección para la línea de mejor ajuste se puede obtener de:
c \u003d (x_square_sum * y_sum) - (x_sum * xy_sum) /(N * x_square_sum) - (x_sum * x_sum)
\\ \u003d (217.82 17) - (23.2 La ecuación final es, por lo tanto: y \u003d 0.968x - 1.82
168.66) /(3 * 217.82) - (23.2 * 23.2) \\ \u003d -1.82