seminario 10
TRANSCRIPT
SEMINARIO 10: CORRELACIÓN
Sandra García RamírezGrupo 2
EJERCICIO 1Utilizando nuestra base de datos comprueba la
correlación entre la variable peso y la variable horas de dedicación al deporte. Comenta los resultados.
Tenemos dos variables: • Variable X: peso• Variable Y: horas de dedicación al deporte. Como tenemos dos variables, utilizamos el
coeficiente de correlación de Pearson, para poder averiguar si existe correlación entre las dos variables.
Primero podemos realizar un gráfico para ver a simple vista la correlación.
En el gráfico podemos observar que existe poca correlación entre ambas variables, pero tenemos que recurrir a procedimientos analíticos que permitan verificar con exactitud la hipótesis de linealidad.
Ahora realizamos el coeficiente de correlación de Pearson
Según el resultado que nos da el SPSS hay una relación positiva de 0,379 entre las variables peso y horas de dedicación al deporte, por lo que hay un grado bajo de correlación entre estas dos variables.A medida que aumenta una variable aumenta ligeramente la otra variable.
EJERCICIO 2Calcula el Coeficiente de Correlación de
Pearson para las variables número de cigarrillos al día y nota de acceso. Comenta los resultados.
Tenemos dos variables:• Variable X: número de cigarrillos al día• Variable Y: nota de acceso Primero podemos realizar un gráfico para
ver a simple vista si existe relación entre las dos variables.
A simple vista podemos observar que existe una correlación fuerte entre las dos variables, pero tenemos que recurrir a procedimientos analíticos que nos permitan verificar con exactitud la hipótesis de linealidad.
Según el resultado de SPSS tenemos una correlación negativa de 0,930 entre la variable número de cigarrillos al día y nota de acceso, por lo que la correlación es muy alta.A medida que una variable aumenta la otra variable disminuye.
EJERCICIO 3Calcula el Coeficiente de Correlación de
Pearson para las variables peso y altura (limitando la muestra a 10 casos). Comenta los resultados.
Tenemos dos variables:• Variable X: peso• Variable Y: altura Limitamos la muestra a 10 casos tal como
dice el ejercicio, y realizamos un gráfico primero para poder ver la correlación a simple vista.
Muestra
Podemos observar a simple vista que existe un grado de correlación alto, pero tenemos que recurrir a procedimientos estadísticos que nos permita verificar con exactitud la hipótesis de linealidad.
En el resultado de SPSS podemos ver que existe una correlación positiva de 0,757, por lo que al aumenta una variable la otra también aumente, existiendo una correlación alta.
EJERCICIO 4Muestra los gráficos en una de las
correlaciones. Este ejercicio esta resuelto en los apartados
anteriores. A continuación muestro los tres gráficos de los ejercicios anteriores.
EJERCICIO 5De una muestra de niños conocemos su
edad (X) medida en días y su peso (Y) en Kg, según los resultados de la tabla. Si ambas variables se distribuyen normalmente, averiguar si existe correlación entre ambas variables en la población de donde proviene la muestra.
Se puede comprobar si existe una tendencia lineal en la relación recurriendo a procedimientos gráficos.Aunque se observa la existencia de una cierta tendencia lineal en la relación, hay que recurrir a procedimientos analíticos que permitan verificar con exactitud la Hipótesis de linealidad.
Tenemos dos variables cuantitativas “edad” y “peso” que se distribuyen normalmente, por lo que tenemos que:
Calcular el coeficiente de correlación de Pearson
Averiguar si el coeficiente de correlación es significativo
rxy = (n Σ XY – Σ X ΣY) / √ [ (n Σ X2) – (ΣX)2 ] [ (n Σ Y2) – (Σ Y)2] = ( 21 x 12892,35 – 1890 x 122,815) / √ [ ( 21 x 245700) – (1890)2] x [ (21 x 771,73) – (122,815)2] = 0,91
Con esta correlación de Pearson podemos observar una correlación positiva casi perfecta entre la variable “edad” y “peso”
5.2. ¿Es significativo el coeficiente de correlación hallado?Para ello realizo el contraste de hipótesis de rxy.
Ho: p=0 (el coeficiente de correlación obtenido procede de una población cuya correlación es cero).
H1: p=0 (el coeficiente de correlación obtenido procede de una población cuyo coeficiente de correlación es distinto de cero)
Para realizar el contraste de hipótesis de rxy se calcula el estadístico t de Student que sigue una distribución t de Student con n-2 grados de libertad.
tn-2 = rxy √ (n-2) / 1 – r2xy = 0,91 √ (21- 2) / 1- 0,912 = 9,57
Como no me dan α, voy a utilizar un α de 0,05 por lo que t0,5;19 = 2,093
Por lo que t n-2 = 9,57 > t 0,5;19 = 2,093, por lo que rechazo la Ho y acepto la H1 con un riesgo máximo de equivocarnos de 0,05, por lo que si existe correlación lineal entre la variable “peso” y “edad”.
EJERCICIO 6De una muestra de alumnos conocemos
las notas de Matemáticas (X) y de Lengua (Y), según los resultados de la tabla. Si ambas variables se distribuyen normalmente, averiguar ¿existe correlación entre ambas variables en la población de donde proviene la muestra?
Primero realizamos un gráfico para ver gráficamente si hay algún tipo de correlación.
Aunque no se observa la existencia de una tendencia lineal en la relación, hay que recurrir a procedimientos analíticos que permitan verificar con exactitud la hipótesis de NO linealidad.
Tenemos dos variables cuantitativas “nota de matemáticas” y “nota de lengua” que se distribuyen normalmente, por lo que tenemos que.
Calcular el coeficiente de correlación de Pearson
Averiguar si el coeficiente de correlación es significativo.
Calcular el coeficiente de correlación de Pearson entre X e Y.
rxy = (n Σ XY – Σ X ΣY) / √ [ (n Σ X2) – (ΣX)2 ] [ (n Σ Y2) – (Σ Y)2] = ( 7 x 140 – 28 x 35) / √ [ (7 x 140) – (28)2] x [ (7 x 203) – (35)2 = 0
Con el resultado que no da en la correlación de Pearson podemos observar que no existe ninguna correlación.
¿Es significativo el coeficiente de correlación hallado? Realiza el contraste de hipótesis de rxy.
Para ello realizo el contraste de hipótesis de rxy.
Ho: p=0 (el coeficiente de correlación obtenido procede de una población cuya correlación es cero).
H1: p=0 (el coeficiente de correlación obtenido procede de una población cuyo coeficiente de correlación es distinto de cero)
Para realizar el contraste de hipótesis de rxy se calcula el estadístico t de Student que sigue una distribución t de Student con n-2 grados de libertad.
tn-2 = rxy √ (n-2) / 1 – r2xy = 0 √ (7 – 2) / 1- 02 =
0 Como no nos dan α, la establecemos
nosotros, α =0,05, por lo que la t0,05;5 = 2, 57.
Por lo que tn-2 = 0 < t0,05;5 = 2, 57, por lo que se acepta la Ho con un riesgo máximo de 0,05, por lo que no existe correlación lineal entre la variable 2nota de matemática” y “nota de lengua”.
FIN