Encontrar la fuerza de la asociación entre dos variables es una habilidad importante para los científicos de todo tipo. Si dos variables están correlacionadas entre sí, muestra que hay un vínculo entre ellas. Una correlación positiva significa que cuando una variable aumenta, la otra también lo hace, y una correlación negativa significa que cuando una variable aumenta, la otra disminuye. Las correlaciones no prueban la causalidad, aunque es posible que pruebas adicionales demuestren una relación causal entre las variables. El coeficiente de correlación R muestra la fuerza de la relación entre las dos variables, y si es una correlación positiva o negativa.
TL; DR (Demasiado largo; No lo leyó)
Llamar una variable x y una variable y Calcule el valor de R usando la fórmula:
R = [n (Σxy) - (Σx) (Σy)] ÷ √ {[n Σx 2- (Σx) 2] [ ,null,null,3],n Σy 2- (Σy) 2]} Donde n es su tamaño de muestra. Haga una tabla de sus datos Haga una tabla de tus datos Esto debe incluir una columna para el número de participante, una columna para la primera variable (etiquetada como x) y una columna para la segunda variable (etiquetada como). Por ejemplo, si está buscando ver si existe una correlación entre la altura y el tamaño del zapato, una columna identificará a cada persona que mida, una columna mostrará la altura de cada persona y otra mostrará el tamaño de su zapato. Haga tres columnas adicionales, una para xy, una para x 2 y una para y 2. Calcule los valores para las columnas vacías Use sus datos para completar las tres columnas adicionales. Por ejemplo, imagine que su primera persona mide 75 pulgadas de alto y tiene un tamaño de 12 pies. La columna x (altura) mostraría 75, y la columna y (tamaño del zapato) mostraría 12. Necesita encontrar xy, x 2 e y 2. Entonces usando este ejemplo: xy = 75 × 12 = 900 x 2 = 75 2 = 5,625 y 2 = 12 2 = 144 Complete estos cálculos para cada persona para la que tenga datos. Encuentre la suma de cada columna Cree una nueva fila en la parte inferior de su tabla para las sumas de cada columna. Sume todos los valores x, todos los valores y, todos los valores xy, todos los valores x 2 y todos los valores y 2, y luego coloque los resultados en la parte inferior del columna correspondiente en su nueva fila. Puede etiquetar su nueva fila "sum" o usar un símbolo sigma (Σ). Calcular R Usar la fórmula Puede encontrar R de sus datos usando la fórmula: R = [n (Σxy) - (Σx) (Σy)] ÷ √ {[nΣx 2- (Σx) 2] [nΣy 2- (Σy) 2]} Esto parece algo desalentador, por lo que puedes dividirlo en dos partes, que llamaremos s y t. s = n (Σxy) - (Σx) (Σy) t = √ {[n Σx 2- (Σx) 2] [n Σy 2- (Σy) 2]} En estos ecuaciones, n es la cantidad de participantes que tiene (su tamaño de muestra). El resto de las partes de la ecuación son las sumas que calculó en el último paso. Entonces para s, multiplica el tamaño de tu muestra por la suma de la columna xy, y luego resta la suma de la columna x multiplicada por la suma de la columna y de esto. Para t, hay cuatro Pasos principales. Primero, calcula n multiplicado por la suma de tu columna x 2, y luego resta la suma de tu columna x al cuadrado (multiplicada por sí misma) desde este valor. Segundo, haz exactamente lo mismo pero con la suma de la columna y 2 y la suma de la columna y al cuadrado en lugar de las x partes (es decir, n × Σy 2 - [Σy × Σy]) . Tercero, multiplica estos dos resultados (para el xs y el ys) juntos. Cuarto, tome la raíz cuadrada de esta respuesta. Si ha trabajado en partes, puede calcular R simplemente como R = s ÷ t. Obtendrá una respuesta entre -1 y 1. Una respuesta positiva muestra una correlación positiva, con algo más de 0.7 generalmente se considera una relación fuerte. Una respuesta negativa muestra una correlación negativa, con algo mayor de -0.7 considerado una relación negativa fuerte. De manera similar, ± 0.5 se considera una relación moderada y ± 0.3 se considera una relación débil. Cualquier cosa cercana a 0 muestra una falta de correlación.