ejercicio seminario 9 pearson

9
EJERCICIO SEMINARIO 9 En una muestra de 8 personas medimos la frecuencia cardiaca (FC) y la edad. 1. Di si en la muestra, existe asociación lineal o correlación entre las dos variables y por qué. Y si existe, ¿Cómo es la correlación? 2. Averigua, usando SPSS y también sin usar SPSS, si existe correlación entre FC y edad en la población de donde proviene la muestra, para un nivel significación de 0.01, razonando paso a paso la decisión tomada. FC 96 65 100 90 72 95 61 82 EDAD 47 58 35 72 69 52 24 80

Upload: fran-narvaez

Post on 14-Apr-2017

79 views

Category:

Health & Medicine


3 download

TRANSCRIPT

Page 1: Ejercicio seminario 9   pearson

EJERCICIO SEMINARIO 9

En una muestra de 8 personas medimos la frecuencia cardiaca (FC) y la edad.

1. Di si en la muestra, existe asociación lineal o correlación entre las dos variables y por qué. Y si existe, ¿Cómo es la correlación?

2. Averigua, usando SPSS y también sin usar SPSS, si existe correlación entre FC y edad en la población de donde proviene la muestra, para un nivel significación de 0.01, razonando paso a paso la decisión tomada.

FC 96 65 100 90 72 95 61 82

EDAD 47 58 35 72 69 52 24 80

Page 2: Ejercicio seminario 9   pearson

Actividad 1

En primer lugar identificamos las variables. Vemos que nos encontramos antes dos variable cuantitativas y queremos saber si existe correlación entre ellas o no. Para ello debemos usar la correlación lineal de Pearson.

Antes de todo debemos asegurarnos que las variables sigan una distribución normal, ya que si no fuera así, no se podría utilizar esta prueba paramétrica. Para saber si siguen una distribución normal existen dos posibles pruebas:

Shapiro-Wilk: prueba utilizada en muestras inferiores a cincuenta individuos. Kolmogorov-Smirnov: prueba utilizada en muestras superiores a cincuenta individuos.

Como vemos, la muestra se compone de 8 individuos, es decir, que tendremos que utilizar a Shapiro-Wilk para saber si las variables se distribuyen normalmente.

Page 3: Ejercicio seminario 9   pearson

A continuación, nos fijamos en la significancia (sig.) en Shapiro-Wilk, o lo que es lo mismo, en el Pvalor, el cual vemos que es 0,342. Establecemos las hipótesis:

• H0 : las variables se distribuyen normalmente.• H1 : las variables no se distribuyen normalmente.

Observamos que el Pvalor es mayor que nuestro alfa: 0,342>0,01, por tanto, tenemos que aceptar nuestra hipótesis nula.Las variables FC y edad siguen una distribución normal por lo que podemos aplicar la correlación lineal de Pearson.

Construimos nuestro diagrama de puntos:

- Tras haber dibujado la recta, podemos observar que habrá correlación entre las variables pero ésta será muy baja.

Page 4: Ejercicio seminario 9   pearson

Seguidamente calculamos el coeficiente de correlación lineal de Pearson utilizando la siguiente fórmula:

Antes de utilizar la fórmula, agrupamos los datos en una tabla para operar más fácilmente.

A continuación, procedemos a realizar el cálculo con la fórmula anterior:

r= (8x36194) – (437x661) / √[(8x26423) – (437)² ] x [(8x56195) - (661)²] = 0,043

El coeficiente de correlación lineal de Pearson (r) da como resultado un valor distinto de 0 por lo que se puede afirmar que en la muestra sí existe correlación entre las dos variables, sin embargo, puesto que el coeficiente de Pearson se encuentra entre 0 y 0,2 se trata de una correlación positiva muy baja.

X Y X2 Y2 XY47 96 2209 9216 451258 65 3364 4225 377035 100 1225 10000 350072 90 5184 8100 648069 72

4761 5184 4968

52 95 2704 9025 494024 61 576 3721 146480 82 6400 6724 6560437 661 26423 56195 36194

Page 5: Ejercicio seminario 9   pearson

Actividad 2

Hemos podido observar que en la muestra sí existe correlación entre las variables. Ahora tenemos que hacer la inferencia estadística para ver si en la población también ocurre lo mismo que en nuestra muestra. Este es el fin del contraste de hipótesis, comprobar si lo que ocurre en la muestra sucede también en la población.

Establecemos las dos hipótesis:

H0 : no existe correlación entre las variables en la población. H1 : sí existe correlación entre las variables en la población.

A continuación aplicamos T-Student, ya que como vimos antes, las variables se distribuían normalmente, utilizando la siguiente fórmula:

Tn-2== 0,043· √6 / 0,998 = 0,1054

Page 6: Ejercicio seminario 9   pearson

Para α=0,01 y siendo los grados de libertad igual a 6 (8-2), nos vamos a la tabla de T-Student y hallamos el punto crítico.

Como hemos podido observar, el valor obtenido con T-Student (0,1054) es más pequeño que el punto crítico que hemos obtenido en la tabla (3,143), por lo tanto se acepta la hipótesis nula que nos dice que no hay correlación entre las variables FC y edad en la población. Por ello, podemos afirmar que la muestra no es estadísticamente significativa.

Page 7: Ejercicio seminario 9   pearson

Realizamos este apartado con SPSS. En primer lugar introducimos los datos en el programa, como vemos a continuación:

Una vez introducidos los datos, hacemos clic en “analizar” y seguidamente le damos a “correlaciones”. Como son dos variables las que deseamos estudiar, seleccionamos la opción de "bivariadas".

Page 8: Ejercicio seminario 9   pearson

Una vez hecho clic en “aceptar” nos aparece el cuadro deseado para observar los datos.

Page 9: Ejercicio seminario 9   pearson

Para finalizar, podemos ver que nos ha salido el mismo resultado de la correlación lineal de Pearson que calculamos anteriormente sin SPSS. La correlación de una variable consigo misma es perfecta, por este motivo es igual a 1. Dado que el valor de significancia o Pvalor (0,919) es mayor que alfa (0,01), aceptamos la hipótesis nula, y rechazamos la hipótesis alterna. Llegamos a la conclusión de que los resultados de la muestra son debido al azar, es decir, que no hay correlación entre la frecuencia cardíaca y la edad.