Encontrar la fuerza de la asociación entre dos variables es una habilidad importante para los científicos de todo tipo. Si dos variables están correlacionadas entre sí, muestra que hay un vínculo entre ellas. Una correlación positiva significa que cuando una variable aumenta, la otra también lo hace, y una correlación negativa significa que cuando una variable aumenta, la otra disminuye. Las correlaciones no prueban la causalidad, aunque es posible que otras pruebas demuestren una relación causal entre las variables. El coeficiente de correlación R muestra la fuerza de la relación entre las dos variables, y si se trata de una correlación positiva o negativa.
TL; DR (demasiado largo; no leído)
Llamar Calcule el valor de R usando la fórmula:
R \u003d [n (Σxy) - (Σx) (Σy)] ÷ √ {[n Σx 2− (Σx) 2] [ , 3, [[n Σy 2− (Σy) 2]} Donde n es el tamaño de su muestra. Haga una tabla de sus datos. Esto debe incluir una columna para el número de participante, una columna para la primera variable (etiquetada x) y una columna para la segunda variable (etiquetada y). Por ejemplo, si está buscando ver si existe una correlación entre la altura y el tamaño del zapato, una columna identificará a cada persona que mida, una columna mostrará la altura de cada persona y otra mostrará el tamaño de su zapato. Haga tres columnas adicionales, una para xy, una para x 2 y una para y 2. Use sus datos para completar las tres columnas adicionales. Por ejemplo, imagine que su primera persona mide 75 pulgadas de alto y tiene un tamaño de 12 pies. La columna x (altura) mostraría 75, y la columna y (tamaño del zapato) mostraría 12. Necesita encontrar xy, x 2 e y 2. Entonces, usando este ejemplo: xy \u003d 75 × 12 \u003d 900 x 2 \u003d 75 2 \u003d 5,625 y 2 \u003d 12 2 \u003d 144 Complete estos cálculos para cada persona para la que tenga datos. Cree una nueva fila en la parte inferior de su tabla para las sumas de cada columna. Sume todos los valores x, todos los valores y, todos los valores xy, todos los valores x 2 y todos los valores y 2, y luego coloque los resultados en la parte inferior de columna correspondiente en su nueva fila. Puede etiquetar su nueva fila como "suma" o usar un símbolo sigma (Σ). Puede encontrar R de sus datos usando la fórmula: R \u003d [n (Σxy) - (Σx) (Σy)] ÷ √ {[nΣx 2− (Σx) 2] [nΣy 2− (Σy) 2]} Esto parece un poco desalentador, por lo que puede dividirlo en dos partes, que llamaremos syt. s \u003d n (Σxy) - (Σx) ( Σy) t \u003d √ {[n Σx 2− (Σx) 2] [n Σy 2− (Σy) 2]} En estas ecuaciones, n es el número de participantes que tiene (el tamaño de su muestra). El resto de las partes de la ecuación son las sumas que calculó en el último paso. Entonces, para s, multiplique el tamaño de su muestra por la suma de la columna xy, y luego reste la suma de la columna x multiplicada por la suma de la columna y de esto. Para t, hay cuatro Pasos principales. Primero, calcule n multiplicado por la suma de su columna x 2, y luego reste la suma de su columna x al cuadrado (multiplicada por sí misma) de este valor. Segundo, haga exactamente lo mismo pero con la suma de la columna y 2 y la suma de la columna y al cuadrado en lugar de las partes x (es decir, n × Σy 2 - [Σy × Σy]) . Tercero, multiplique estos dos resultados (para las xs e ys) juntos. Cuarto, saca la raíz cuadrada de esta respuesta. Si has trabajado en partes, puedes calcular R como simplemente R \u003d s ÷ t. Obtendrá una respuesta entre −1 y 1. Una respuesta positiva muestra una correlación positiva, con cualquier cosa por encima de 0.7 generalmente se considera una relación fuerte. Una respuesta negativa muestra una correlación negativa, con algo por encima de -0.7 considerado una fuerte relación negativa. Del mismo modo, ± 0.5 se considera una relación moderada y ± 0.3 se considera una relación débil. Cualquier cosa cercana a 0 muestra una falta de correlación.