seminario 10 primera parte

23
SEMINARIO 10. PRIMERA PARTE Laura Moreno García. Subgrupo 6.

Upload: laumorgar2

Post on 19-Jul-2015

75 views

Category:

Education


0 download

TRANSCRIPT

Page 1: Seminario 10 primera parte

SEMINARIO 10. PRIMERA PARTELaura Moreno García. Subgrupo 6.

Page 2: Seminario 10 primera parte

1)Queremos saber si existe relación entre el peso y la alturaNuestra hipótesis alternativa ( H1), será: Existe relación entre el peso y la altura.

Para saber si en variables cuantitativas podemos utilizar la R de Pearson, o en su defecto la Rho de Spearman, debemos comprobar si hay una relación lineal y una distribución normal con respecto a las variables.

Para ello, mediante el diagrama de puntos podemos comprobar si hay una tendencia lineal:

En SPSS para realizar el diagrama de puntos, seleccionaremos las siguientes pestañas:

GRAFICOSCUADRO DE DIALOGO ANTIGUODISPERSION/PUNTODISPERSION SIMPLE.

Page 3: Seminario 10 primera parte

Como podemos observar en el gráfico, sigue una distribución lineal, por lo que se cumple la primera asunción para la R de Pearson.

Page 4: Seminario 10 primera parte

Explorar la normalidad.

• El segundo paso es explorar la normalidad: lo que se podría hacer de modo grafico o mediante pruebas( Kolmogorov-smirnof y Shapiro-Wilk).

• Debemos explorar la normalidad de las dos variables que estamos analizando: Peso y Talla.

• Para ello en SPSS, seleccionamos: ANALIZAR ESTADISTICOS DESCRIPTIVOS EXPLORAR e incluiremos las variables peso y talla dentro de la lista de dependientes.

• Por otro lado, dentro de la misma pestaña seleccionaremos los gráficos de histograma y los gráficos con pruebas de normalidad.

• A continuación, nos saldrá, primero la tabla de control y seguidamente las pruebas de normalidad de Kolmogorov y de Shapiro.

Page 5: Seminario 10 primera parte

La casilla denominada en este caso significación, es la p, o el error tipo 1. Al ser menor de 0,05 quiere decir que aceptamos la hipótesis alternativa, es decir, existe relación entre el peso y la talla, y existen diferencias respecto a la distribución normal. Al haber aceptado la hipótesis alternativa, podríamos decir que nuestra hipótesis es distinta a la hipótesis de normalidad. (PARA ACEPTAR LA HIPOTESIS NULA, LA P DEBE SER MAYOR A 0,05 Y PARA ACEPTAR LA ALTERNATIVA DEBE SER MENOR A 0,05).

Según esta prueba estadística no podríamos aplicar la R de Pearson, ya que, las variables siguen una tendencia lineal pero no una distribución normal. Sin embargo, también podemos explorar la normalidad de forma grafica, que es lo que procederemos a ver ahora:

Page 6: Seminario 10 primera parte

Observando el histograma de la variable peso con la curva normal, identificamos una leve asimetría hacia la izquierda.

Page 7: Seminario 10 primera parte

En este grafico, el gráfico Q-Q, observamos que por debajo, hay ciertas puntuaciones que se alejan de la línea, que representaría la normalidad.

Page 8: Seminario 10 primera parte

En el gráfico de cajas, también se representan algunas puntuaciones alejadas como el individuo 24

Page 9: Seminario 10 primera parte

Con los gráficos, respecto a la talla, también se observan las diferencias

En los dos últimos gráficos, apreciamos bastante simetría, por lo que podríamos decir, que al menos la talla si se asemeja más, a diferencia con el peso, a la distribución normal. En el peso, hay un leve incumplimiento

Page 10: Seminario 10 primera parte

Normalidad

• Sin embargo, en muestras grandes, las muestras tienden a ser significativas por lo que, las pruebas de normalidad realizadas no funcionan bien, ya que nuestra muestra es muy grande

( N= 569).

Aunque hemos hecho las pruebas de normalidad, no deberíamos haberlas hecho, por el tamaño de la población escogida, ya que con una N por encima de 100, directamente tienden a la distribución normal.

De esta manera nuestra muestra es lineal y normal.

Page 11: Seminario 10 primera parte

Conclusión

• Por tanto, podemos aplicar la R de Pearson: En el programa SPSS seleccionaríamos lo siguiente:

• ANALIZAR CORRELACIONES BIVARIADAS.

Page 12: Seminario 10 primera parte
Page 13: Seminario 10 primera parte

Correlaciones

• La correlación del peso con el peso y de la talla con la talla es obviamente 1. Cuando se compara una variable consigo mismo el resultado siempre será 1.

• El peso con la talla, según Pearson es 0,65 Hay una alta correlación. El error tipo 1 es 0, es decir, se acepta la hipótesis alternativa, porque es menor a 0,05EXISTE RELACION ENTRE EL PESO Y LA TALLA.

• En la diapositiva anterior, se representaba también las correlaciones no paramétricas que aunque no eran necesarias en este caso, la hemos pedido. La Rho de Spearman el resultado es muy parecido a Pearson, en cambio la tau b de kendall es más conservadora.

Page 14: Seminario 10 primera parte

Variables categóricas

• Ahora veremos la segunda parte, que es para variables categóricas, ya que antes hemos visto para variables cuantitativas u ordinales. En este caso, utilizaremos la correlacion puntual biserial, coeficiente phi, contingencia y v de cramer.

Page 15: Seminario 10 primera parte

Correlación puntual biserial

• Se utiliza cuando queremos relacionar una variable binaria o categórica y una variable cuantitativa.

• Variable binaria: Sexo

• Variable cuantitativa: Frecuencia de ejercicio físico.

• H1: Existe relación entre el sexo y la frecuencia de ejercicio físico.

• H0: No existe relación entre el sexo y la frecuencia de ejercicio físico.

Page 16: Seminario 10 primera parte

Normalidad

• Lo primero que debemos de hacer es explorar la normalidad de la variable cuantitativa, pero no lo vamos a hacer porque nuestra muestra es grande y asumimos que es normal, por lo que directamente nos vamos a explorar la relación.

Page 17: Seminario 10 primera parte

Correlación

• La puntual biserial no es más que un coeficiente de la R de Pearson.

• ANALIZARCORRELACIONES BIVARIADASPEARSON

El tamaño del efecto es medio puesto que la r es 0,3, es decir, la relación entre el sexo y el ejercicio físico es 0,3. El signo es negativo( RELACION NEGATIVA) es decir, a más sexo menos ejercicio, como habíamos puesto que el 1 era chico y el 2 era chica, quiere decir que cuando pasamos de chico a chica se reduzca la frecuencia de ejercicio.

Page 18: Seminario 10 primera parte

Coeficiente de Phi

• Se utilizaba para ver la relación entre dos variables categóricas dicotómicas.: por ejemplo, Sexo y consumo de tabaco.

• H1 sería: Existe relación entre sexo y el consumo de tabaco.

• Para ver la relación, utilizamos tablas de contingencia.

• ANALIZAR ESTADISTICOS DESCRIPTIVOSTABLAS CRUZADAS

• ESTADISTICOS CASILLAS OBSERVADO Y ESPERADO

Page 19: Seminario 10 primera parte

El coeficiente de phi es muy bajo, es menor de 0,1, por lo que el tamaño del efecto es muy bajo. La p es mayor a 0,05, por lo que aceptamos la hipótesis nula:

No existe relación entre sexo y consumo de tabaco.

Page 20: Seminario 10 primera parte

No hay apenas diferencia entre las frecuencias observadas y las esperadas.

Page 21: Seminario 10 primera parte

Coeficiente de contingencia y V de Cramer

• Variables categóricas pero con más de dos categorías, nominales

• H1: Existe relación entre el grado APGAR( 3 categorias) y la frecuencia del consumo de tabaco.

Page 22: Seminario 10 primera parte

La correlación es baja ya que es 0,20 y Es positiva, de manera que cuanto más funcional es la familia, más personas fuman todos los días. Además si observamos el recuento observado y esperado, podemos apreciar, que se afirma con más frecuencia a la que se esperaba que fuma tabaco todos los días

Page 23: Seminario 10 primera parte

Gracias.