correlacion de pearson

17
República Bolivariana de Venezuela Ministerio del Poder Popular para la Educación I.U.P “Santiago Mariño”. Sede Barcelona. Correlación de Pearson y de Spearman. Bachiller: Valentina Hurtado. C.I: 23.997.291 Profesor: Pedro Beltrán. Bna, 03 de Julio del 2015.

Upload: valentina

Post on 14-Aug-2015

49 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Correlacion de Pearson

República Bolivariana de VenezuelaMinisterio del Poder Popular para la EducaciónI.U.P “Santiago Mariño”.Sede Barcelona.

Correlación de Pearson y de Spearman.

Bachiller:Valentina Hurtado.C.I: 23.997.291

Profesor:Pedro Beltrán.

Bna, 03 de Julio del 2015.

Page 2: Correlacion de Pearson

El coeficiente de correlación de Pearson. Normalmente denotado como "r", es un

valor estadístico que mide la relación linear entre dos variables. Los rangos de valor van de +1 a -1, lo que indica una perfecta relación linear positiva y negativa respectivamente entre ambas variables. El cálculo del coeficiente de correlación normalmente se realiza con programas de estadística, como SPSS y SAS, para dar los valores posibles más precisos en estudios científicos. Su interpretación y uso varía de acuerdo con el contexto y propósito del respectivo estudio en donde se calcula.

Page 3: Correlacion de Pearson

Instrucciones:

Identifica el dependiente variable que se probará entre dos observaciones derivadas independientemente. Uno de los requisitos del coeficiente de correlación de Pearson es que las dos variables que se comparan deben observarse o medirse de manera independiente para eliminar cualquier resultado sesgado.

Calcula el coeficiente de correlación de Pearson. Para cantidades grandes de información, el calculo puede ser tedioso. Además de los varios programas de estadística, muchas calculadoras científicas pueden calcular el valor.

Reporta un valor de correlación cercano a 0 como un indicador de que no hay relación linear entre las dos variables. Conforme el coeficiente de correlación se acerque al 0, los valores se vuelven menos correlacionados, lo que identifica las variables que no pueden ser relacionadas entre sí.

Reporta un valor de correlación cercano al 1 como indicador de que existe una relación linear positiva entre las dos variables. Un valor mayor a cero que se acerque a 1 da como resultado una mayor correlación positiva entre la información. Conforme una variable aumenta cierta cantidad, la otra aumenta en cantidad correspondiente. La interpretación debe determinarse de acuerdo con el contexto del estudio.

Page 4: Correlacion de Pearson

Instrucciones:

Reporta un valor de correlación cercano a -1 como indicador de que hay una relación linear negativa entre las dos variables. Conforme el coeficiente se acerca a -1, las variables se vuelven negativamente más correlacionadas, lo que indica que conforme una variable aumenta, la variable disminuye por una cantidad correspondiente. La interpretación, de nuevo, debe determinarse de acuerdo con el contexto del estudio.

Interpreta el coeficiente de correlación de acuerdo con el contexto de los datos particulares. El valor de correlación es esencialmente un valor arbitrario que debe aplicarse de acuerdo con las variables que se comparan. Por ejemplo, un valor r de 0.912 indica una relación linear positiva muy fuerte entre las dos variables. En un estudio donde se comparan dos variables que normalmente se identifican como relacionadas, estos resultados dan evidencia de que una variable puede afectar de manera positiva a la otra, lo que resulta un caso para mayor investigación entre las dos. Sin embargo, el mismo valor r en un estudio que compara dos variables donde está probado que tienen una relación linear positiva puede identificar un error en la información u otros problemas potenciales en el diseño experimental. Por ello, es importante entender el contexto de la información cuando se reporta e interpreta el coeficiente de correlación de Pearson.

Page 5: Correlacion de Pearson

Instrucciones:

Determina la importancia de los resultados. Esto se logra con el uso del coeficiente de correlación, grados de libertad y una tabla de valores críticos del coeficiente de correlación. Los grados de libertad se calculan como el número de las dos observaciones menos 2. Con este valor, identifica el valor crítico correspondiente en la tabla de correlación para una prueba de 0.05 y 0.01 que identifique 95 y 99 por ciento de nivel de confiabilidad respectivamente. Compara el valor crítico al coeficiente de correlación previamente calculado. Si el coeficiente de correlación es mayor, los resultados son importantes.

Dada dos variables, la correlación permite hacer estimaciones del valor de una de ellas conociendo el valor de la otra variable.

Los coeficientes de correlación son medidas que indican la situación relativa de los mismos sucesos respecto a las dos variables, es decir, son la expresión numérica que nos indica el grado de relación existente entre las 2 variables y en qué medida se relacionan. Son números que varían entre los límites +1 y -1. Su magnitud indica el grado de asociación entre las variables; el valor r = 0 indica que no existe relación entre las variables; los valores ( 1 son indicadores de una correlación perfecta positiva (al crecer o decrecer X, crece o decrece Y) o negativa (Al crecer o decrecer X, decrece o crece Y).

Page 6: Correlacion de Pearson
Page 7: Correlacion de Pearson

Para interpretar el coeficiente de correlación utilizamos la siguiente escala:

Valor Significado-1 Correlación negativa grande y

perfecta.

-0,9 a -0,99 Correlación negativa muy alta.

-0,7 a -0,89 Correlación negativa alta.

-0,4 a -0,69 Correlación negativa moderada.

-0,2 a -0,39 Correlación negativa baja.

-0,01 a -0,19

Correlación negativa muy baja.

0 Correlación nula.

0,01 a 0,19 Correlación positiva muy baja.

0,2 a 0,39 Correlación positiva baja.

0,4 a 0,69 Correlación positiva moderada.

0,7 a 0,89 Correlación positiva alta.

0,9 a 0,99 Correlación positiva muy alta.

1 Correlación positiva grande y perfecta.

Page 8: Correlacion de Pearson

Para datos no agrupados se calcula aplicando la siguiente ecuación:

Para datos agrupados, el coeficiente de Correlación de Pearson se calcula aplicando la siguiente fórmula:

Page 9: Correlacion de Pearson

Ejemplo:

El calculo de coeficiente de correlación (r) entre peso y talla de 20 niños varones se muestra.  La covarianza, que en este ejemplo es el producto de peso (kg) por talla (cm), para que no tenga dimensión y sea un coeficiente, se divide por la desviación típica de X (talla) y por la desviación típica de Y (peso) con lo que obtenemos el coeficiente de correlación de Pearson que en este caso es de 0.885 e indica una importante correlación entre las dos variables. Es evidente que el hecho de que la correlación sea fuerte no implica causalidad. Si elevamos al cuadrado el coeficiente de correlación obtendremos el coeficiente de determinación (r2=0.783) que nos indica que el 78.3% de la variabilidad en el peso se explica por la talla del niño. Por lo tanto existen otras variables que modifican y explican la variabilidad del peso de estos niños. La introducción de más variable con técnicas de análisis multivariado nos permitirá identificar la importancia de que otras variables pueden tener sobre el peso.

Page 10: Correlacion de Pearson
Page 11: Correlacion de Pearson
Page 12: Correlacion de Pearson

•Coeficiente de correlación de Spearman.

Es una medida de la correlación (la asociación o interdependencia) entre dos variables aleatorias continuas. Para calcular ρ, los datos son ordenados y reemplazados por su respectivo orden.El estadístico ρ viene dado por la expresión:

donde D es la diferencia entre los correspondientes estadísticos de orden de x - y. N es el número de parejas.Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si éstos son pocos, se puede ignorar tal circunstanciaPara muestras mayores de 20 observaciones, podemos utilizar la siguiente aproximación a la distribución t de Student

La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson. Oscila entre -1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no independencia. La tau de Kendall es un coeficiente de correlación por rangos, inversiones entre dos ordenaciones de una distribución normal bivariante.

Page 13: Correlacion de Pearson

Ejemplo:

Los datos brutos usados en este ejemplo se ven debajo.

CI Horas de tv a la semana.

106 7

86 0

100 28

100 50

99 28

103 28

97 20

113 12

113 7

110 17

Page 14: Correlacion de Pearson

El primer paso es ordenar los datos de la primera columna. Se agregan dos columnas 'orden(i)' y 'orden(t)‘

Para el orden i, se corresponderán con el numero de fila del cuadro, para 99, orden(i) =3 ya que ocupa el 3.er lugar, ordenado de menor a mayor.Para el orden t, se debe hacer lo mismo pero ordenando por 'Horas de TV a la semana', para no hacer otro cuadro, la secuencia ordenada quedaría…T = { 0, 7, 7, 12, 17, 20, 28, 28, 28, 50 }

Para este caso, el orden sería para cada elemento, respectivamente: orden(t) = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 }

Sin embargo, el valor de orden esta dado por el valor promedio de sus posiciones, así para:7 aparece 2 veces, sumando sus posiciones = ( 2 + 3 ) / 2 = 2.528 aparece 3 veces, sumando sus posiciones = ( 7 + 8 + 9 ) / 3 = 850 aparece 1 vez, sumando sus posiciones = 10 / 1 = 10Después, se crean dos columnas más, una columna "d" que muestra las diferencias entre las dos columnas de orden y, otra columna "d2". Esta última es sólo la columna "d" al cuadrado.

Page 15: Correlacion de Pearson

Después de realizar todo esto con los datos del ejemplo, se debería acabar con algo como lo siguiente:

Nótese como el número de orden de los valores que son idénticos es la media de los números de orden que les corresponderían si no lo fueran.

CI H. sem.

Orden (i) Orden (t) d d2

106 7 1 1 0 0

86 0 2 6 4 16

100 28 3 8 5 25

100 50 4.5 10 5.5 30.25

99 28 4.5 8 3.5 12.25

103 28 6 8 2 4

97 20 7 2.5 4.5 20.25

113 12 8 5 3 9

113 7 9.5 2.5 7 49

110 17 9.5 4 5.5 30.25

Page 16: Correlacion de Pearson

Los valores de la columna d2 pueden ser sumados para averiguar 

 El valor de n es 10. Así que esos valores pueden ser sustituidos en la fórmula.

De lo que resulta

¿Cuándo utilizar la prueba de correlación de rangos de Spearman?El coeficiente de correlación no debe utilizarse para comparar dos métodos que intentan medir el mismo evento, como por ejemplo dos instrumentos que miden la saturación de oxígeno en sangre. El coeficiente de correlación mide el grado de asociación entre dos cantidades, pero no mira el nivel de acuerdo o concordancia. Si los instrumentos de medida miden sistemáticamente cantidades diferentes uno del otro, la correlación puede ser 1 y su concordancia ser nula . El coeficiente de correlación de Spearman es recomendable utilizarlo cuando los datos presentan valores extremos, ya que dichos valores afectan mucho el coeficiente de correlación de Pearson, o ante distribuciones no normales. No está afectada por los cambios en las unidades de medida.

Page 17: Correlacion de Pearson

Bibliografía.

http://www.monografias.com/trabajos85/coeficiente-correlacion-karl-pearson/coeficiente-correlacion-karl-pearson.shtml http://www.ehowenespanol.com/coeficiente-correlacion-pearson-como_84118/ https://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_de_Spearman http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S1729-519X2009000200017