correlación pearson y de spearman

REPÚBLICA BOLIVARIANA DE VENEZUELAMINISTERIO DEL PODER POPULAR PARA LA EDUCACIÓN

INSTITUTO UNIVERSITARIO POLITÉCNICO “SANTIAGO MARIÑO”EXTENSIÓN BARCELONA

ESCUELA SISTEMAS

Coeficientes de correlación de Pearson y de Spearman

Barcelona, Julio 2015

Integrante: Villalba Carlos C.I. 24.827.139

Sección “SV”

Coeficiente de Correlación de PearsonEl coeficiente de correlación de Pearson, normalmente denotado como "r", es un valor estadístico que mide la relación linear entre dos variables. Los rangos de valor van de +1 a -1, lo que indica una perfecta relación linear positiva y negativa respectivamente entre ambas variables. El cálculo del coeficiente de correlación normalmente se realiza con programas de estadística, como SPSS y SAS, para dar los valores posibles más precisos en estudios científicos. Su interpretación y uso varía de acuerdo con el contexto y propósito del respectivo estudio en donde se calcula.

En el caso de que se esté estudiando dos variables aleatorias x e y sobre una población; el coeficiente de correlación de Pearson se simboliza con la letra \rho_{x,y}, siendo la expresión que nos permite calcularlo:

De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas.

Tipo de Uso1) Identifica el dependiente variable que se probará entre dos observaciones derivadas independientemente. Uno de los requisitos del coeficiente de correlación de Pearson es que las dos variables que se comparan deben observarse o medirse de manera independiente para eliminar cualquier resultado sesgado.

2) Calcula el coeficiente de correlación de Pearson. Para cantidades grandes de información, el calculo puede ser tedioso. Además de los varios programas de estadística, muchas calculadoras científicas pueden calcular el valor.

3) Reporta un valor de correlación cercano a 0 como un indicador de que no hay relación linear entre las dos variables. Conforme el coeficiente de correlación se acerque al 0, los valores se vuelven menos correlacionados, lo que identifica las variables que no pueden ser relacionadas entre sí.

4) Reporta un valor de correlación cercano al 1 como indicador de que existe una relación linear positiva entre las dos variables. Un valor mayor a cero que se acerque a 1 da como resultado una mayor correlación positiva entre la información. Conforme una variable aumenta cierta cantidad, la otra aumenta en cantidad correspondiente. La interpretación debe determinarse de acuerdo con el contexto del estudio.

5) Reporta un valor de correlación cercano a -1 como indicador de que hay una relación linear negativa entre las dos variables. Conforme el coeficiente se acerca a -1, las variables se vuelven negativamente más correlacionadas, lo que indica que conforme una variable aumenta, la variable disminuye por una cantidad correspondiente. La interpretación, de nuevo, debe determinarse de acuerdo con el contexto del estudio.

6) Interpreta el coeficiente de correlación de acuerdo con el contexto de los datos particulares. El valor de correlación es esencialmente un valor arbitrario que debe aplicarse de acuerdo con las variables que se comparan. Por ejemplo, un valor r de 0.912 indica una relación linear positiva muy fuerte entre las dos variables. En un estudio donde se comparan dos variables que normalmente se identifican como relacionadas, estos resultados dan evidencia de que una variable puede afectar de manera positiva a la otra, lo que resulta un caso para mayor investigación entre las dos. Sin embargo, el mismo valor r en un estudio que compara dos variables donde está probado que tienen una relación linear positiva puede identificar un error en la información u otros problemas potenciales en el diseño experimental. Por ello, es importante entender el contexto de la información cuando se reporta e interpreta el coeficiente de correlación de Pearson.

7) Determina la importancia de los resultados. Esto se logra con el uso del coeficiente de correlación, grados de libertad y una tabla de valores críticos del coeficiente de correlación. Los grados de libertad se calculan como el número de las dos observaciones menos 2. Con este valor, identifica el valor crítico correspondiente en la tabla de correlación para una prueba de 0.05 y 0.01 que identifique 95 y 99 por ciento de nivel de confiabilidad respectivamente. Compara el valor crítico al coeficiente de correlación previamente calculado. Si el coeficiente de correlación es mayor, los resultados son importantes.

Ventaja- Requiere datos de cantidad solo del periodo base

Desventaja- No refleja cambios en los patrones de compra conforme pasa el tiempo

Coeficiente de Correlación de Spearman Es una medida de la correlación (la asociación o interdependencia) entre dos variables aleatorias continuas. Para calcular ρ, los datos son ordenados y reemplazados por su respectivo orden.El estadístico ρ viene dado por la expresión:

donde D es la diferencia entre los correspondientes estadísticos de orden de x - y. N es el número de parejas.

Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si éstos son pocos, se puede ignorar tal circunstancia

El coeficiente de correlación de Spearman es menos sensible que el de Pearson para los valores muy lejos de lo esperado. En este ejemplo: Pearson = 0.30706 Spearman = 0.76270

TIPO DE USO

- Para aplicar el coeficiente de correlación de Spearman se requiere que las variables estén medidas al menos en escala ordinal, es decir, de forma que las puntuaciones que las representan puedan ser colocadas en dos series ordenadas.

- A veces, este coeficiente es denominado por la letra griega ρs (rho), aunque cuando nos situamos en el contexto de la Estadística Descriptiva se emplea la notación rs

- La fórmula de cálculo para rs puede derivarse de la utilizada en el caso de rxy; bastaría aplicar el coeficiente de correlación de Pearson a dos series de puntuaciones ordinales, compuestas cada una de ellas por los n primeros números naturales.

Ventajas

- Los supuestos son menos estrictos. Es robusto a la presencia de outliers (es decir permite ciertos desvíos del patrón normal).

- La manifestación de una relación causa-efecto es posible sólo a través de la comprensión dela relación natural que existe entre las variable y no debe Al ser Spearman una técnica no para métrica es libre de distribución probabilística“(.2, 5, 9).

Desventajas

- Los coeficientes de correlación más utilizados sólo miden una relación lineal. Por lo tanto, es perfectamente posible que, si bien existe una fuerte relación no lineal entre las variables, r está cerca de 0 o igual a 0. En tal caso, un diagrama de dispersión puede indicar aproximadamente la existencia o no de una relación no lineal.

- Hay que tener cuidado al interpretar el valor de 'r'. Por ejemplo, se podría calcular 'r' entre el número de calzado y la inteligencia de las personas, la altura y los ingresos. Cualquiera sea el valor de 'r', no tiene sentido y por lo tanto es llamado correlación de oportunidad o sin sentido.

Bibliografía

WWW.WIKIPEDIA.COM

WWW.MONOGRAFIAS.COM

WWW.BUENASTAREAS.COM

http://www.wikipedia.com/

http://www.monografias.com/

http://www.buenastareas.com/

correlación pearson y de spearman

Education