seminario 10

32
SEMINARIO 10: CORRELACIÓN Sandra García Ramírez Grupo 2

Upload: sangarram

Post on 30-Jul-2015

42 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Seminario 10

SEMINARIO 10: CORRELACIÓN

Sandra García RamírezGrupo 2

Page 2: Seminario 10

EJERCICIO 1Utilizando nuestra base de datos comprueba la

correlación entre la variable peso y la variable horas de dedicación al deporte. Comenta los resultados.

Tenemos dos variables: • Variable X: peso• Variable Y: horas de dedicación al deporte. Como tenemos dos variables, utilizamos el

coeficiente de correlación de Pearson, para poder averiguar si existe correlación entre las dos variables.

Primero podemos realizar un gráfico para ver a simple vista la correlación.

Page 3: Seminario 10
Page 4: Seminario 10
Page 5: Seminario 10

En el gráfico podemos observar que existe poca correlación entre ambas variables, pero tenemos que recurrir a procedimientos analíticos que permitan verificar con exactitud la hipótesis de linealidad.

Page 6: Seminario 10

Ahora realizamos el coeficiente de correlación de Pearson

Page 7: Seminario 10
Page 8: Seminario 10
Page 9: Seminario 10

Según el resultado que nos da el SPSS hay una relación positiva de 0,379 entre las variables peso y horas de dedicación al deporte, por lo que hay un grado bajo de correlación entre estas dos variables.A medida que aumenta una variable aumenta ligeramente la otra variable.

Page 10: Seminario 10

EJERCICIO 2Calcula el Coeficiente de Correlación de

Pearson para las variables número de cigarrillos al día y nota de acceso. Comenta los resultados.

Tenemos dos variables:• Variable X: número de cigarrillos al día• Variable Y: nota de acceso Primero podemos realizar un gráfico para

ver a simple vista si existe relación entre las dos variables.

Page 11: Seminario 10

A simple vista podemos observar que existe una correlación fuerte entre las dos variables, pero tenemos que recurrir a procedimientos analíticos que nos permitan verificar con exactitud la hipótesis de linealidad.

Page 12: Seminario 10

Según el resultado de SPSS tenemos una correlación negativa de 0,930 entre la variable número de cigarrillos al día y nota de acceso, por lo que la correlación es muy alta.A medida que una variable aumenta la otra variable disminuye.

Page 13: Seminario 10

EJERCICIO 3Calcula el Coeficiente de Correlación de

Pearson para las variables peso y altura (limitando la muestra a 10 casos). Comenta los resultados.

Tenemos dos variables:• Variable X: peso• Variable Y: altura Limitamos la muestra a 10 casos tal como

dice el ejercicio, y realizamos un gráfico primero para poder ver la correlación a simple vista.

Page 14: Seminario 10

Muestra

Page 15: Seminario 10

Podemos observar a simple vista que existe un grado de correlación alto, pero tenemos que recurrir a procedimientos estadísticos que nos permita verificar con exactitud la hipótesis de linealidad.

Page 16: Seminario 10

En el resultado de SPSS podemos ver que existe una correlación positiva de 0,757, por lo que al aumenta una variable la otra también aumente, existiendo una correlación alta.

Page 17: Seminario 10

EJERCICIO 4Muestra los gráficos en una de las

correlaciones. Este ejercicio esta resuelto en los apartados

anteriores. A continuación muestro los tres gráficos de los ejercicios anteriores.

Page 18: Seminario 10
Page 19: Seminario 10

EJERCICIO 5De una muestra de niños conocemos su

edad (X) medida en días y su peso (Y) en Kg, según los resultados de la tabla. Si ambas variables se distribuyen normalmente, averiguar si existe correlación entre ambas variables en la población de donde proviene la muestra.

Page 20: Seminario 10

Se puede comprobar si existe una tendencia lineal en la relación recurriendo a procedimientos gráficos.Aunque se observa la existencia de una cierta tendencia lineal en la relación, hay que recurrir a procedimientos analíticos que permitan verificar con exactitud la Hipótesis de linealidad.

Page 21: Seminario 10

Tenemos dos variables cuantitativas “edad” y “peso” que se distribuyen normalmente, por lo que tenemos que:

Calcular el coeficiente de correlación de Pearson

Averiguar si el coeficiente de correlación es significativo

Page 22: Seminario 10
Page 23: Seminario 10

rxy = (n Σ XY – Σ X ΣY) / √ [ (n Σ X2) – (ΣX)2 ] [ (n Σ Y2) – (Σ Y)2] = ( 21 x 12892,35 – 1890 x 122,815) / √ [ ( 21 x 245700) – (1890)2] x [ (21 x 771,73) – (122,815)2] = 0,91

Con esta correlación de Pearson podemos observar una correlación positiva casi perfecta entre la variable “edad” y “peso”

Page 24: Seminario 10

5.2. ¿Es significativo el coeficiente de correlación hallado?Para ello realizo el contraste de hipótesis de rxy.

Ho: p=0 (el coeficiente de correlación obtenido procede de una población cuya correlación es cero).

H1: p=0 (el coeficiente de correlación obtenido procede de una población cuyo coeficiente de correlación es distinto de cero)

Para realizar el contraste de hipótesis de rxy se calcula el estadístico t de Student que sigue una distribución t de Student con n-2 grados de libertad.

tn-2 = rxy √ (n-2) / 1 – r2xy = 0,91 √ (21- 2) / 1- 0,912 = 9,57

Como no me dan α, voy a utilizar un α de 0,05 por lo que t0,5;19 = 2,093

Por lo que t n-2 = 9,57 > t 0,5;19 = 2,093, por lo que rechazo la Ho y acepto la H1 con un riesgo máximo de equivocarnos de 0,05, por lo que si existe correlación lineal entre la variable “peso” y “edad”.

Page 25: Seminario 10

EJERCICIO 6De una muestra de alumnos conocemos

las notas de Matemáticas (X) y de Lengua (Y), según los resultados de la tabla. Si ambas variables se distribuyen normalmente, averiguar ¿existe correlación entre ambas variables en la población de donde proviene la muestra?

Primero realizamos un gráfico para ver gráficamente si hay algún tipo de correlación.

Page 26: Seminario 10

Aunque no se observa la existencia de una tendencia lineal en la relación, hay que recurrir a procedimientos analíticos que permitan verificar con exactitud la hipótesis de NO linealidad.

Page 27: Seminario 10

Tenemos dos variables cuantitativas “nota de matemáticas” y “nota de lengua” que se distribuyen normalmente, por lo que tenemos que.

Calcular el coeficiente de correlación de Pearson

Averiguar si el coeficiente de correlación es significativo.

Page 28: Seminario 10
Page 29: Seminario 10

Calcular el coeficiente de correlación de Pearson entre X e Y.

rxy = (n Σ XY – Σ X ΣY) / √ [ (n Σ X2) – (ΣX)2 ] [ (n Σ Y2) – (Σ Y)2] = ( 7 x 140 – 28 x 35) / √ [ (7 x 140) – (28)2] x [ (7 x 203) – (35)2 = 0

Con el resultado que no da en la correlación de Pearson podemos observar que no existe ninguna correlación.

Page 30: Seminario 10

¿Es significativo el coeficiente de correlación hallado? Realiza el contraste de hipótesis de rxy.

Para ello realizo el contraste de hipótesis de rxy.

Ho: p=0 (el coeficiente de correlación obtenido procede de una población cuya correlación es cero).

H1: p=0 (el coeficiente de correlación obtenido procede de una población cuyo coeficiente de correlación es distinto de cero)

Para realizar el contraste de hipótesis de rxy se calcula el estadístico t de Student que sigue una distribución t de Student con n-2 grados de libertad.

Page 31: Seminario 10

tn-2 = rxy √ (n-2) / 1 – r2xy = 0 √ (7 – 2) / 1- 02 =

0 Como no nos dan α, la establecemos

nosotros, α =0,05, por lo que la t0,05;5 = 2, 57.

Por lo que tn-2 = 0 < t0,05;5 = 2, 57, por lo que se acepta la Ho con un riesgo máximo de 0,05, por lo que no existe correlación lineal entre la variable 2nota de matemática” y “nota de lengua”.

Page 32: Seminario 10

FIN