seminario 10 primera parte

Post on 19-Jul-2015

76 Views

Category:

Education

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

SEMINARIO 10. PRIMERA PARTELaura Moreno García. Subgrupo 6.

1)Queremos saber si existe relación entre el peso y la alturaNuestra hipótesis alternativa ( H1), será: Existe relación entre el peso y la altura.

Para saber si en variables cuantitativas podemos utilizar la R de Pearson, o en su defecto la Rho de Spearman, debemos comprobar si hay una relación lineal y una distribución normal con respecto a las variables.

Para ello, mediante el diagrama de puntos podemos comprobar si hay una tendencia lineal:

En SPSS para realizar el diagrama de puntos, seleccionaremos las siguientes pestañas:

GRAFICOSCUADRO DE DIALOGO ANTIGUODISPERSION/PUNTODISPERSION SIMPLE.

Como podemos observar en el gráfico, sigue una distribución lineal, por lo que se cumple la primera asunción para la R de Pearson.

Explorar la normalidad.

• El segundo paso es explorar la normalidad: lo que se podría hacer de modo grafico o mediante pruebas( Kolmogorov-smirnof y Shapiro-Wilk).

• Debemos explorar la normalidad de las dos variables que estamos analizando: Peso y Talla.

• Para ello en SPSS, seleccionamos: ANALIZAR ESTADISTICOS DESCRIPTIVOS EXPLORAR e incluiremos las variables peso y talla dentro de la lista de dependientes.

• Por otro lado, dentro de la misma pestaña seleccionaremos los gráficos de histograma y los gráficos con pruebas de normalidad.

• A continuación, nos saldrá, primero la tabla de control y seguidamente las pruebas de normalidad de Kolmogorov y de Shapiro.

La casilla denominada en este caso significación, es la p, o el error tipo 1. Al ser menor de 0,05 quiere decir que aceptamos la hipótesis alternativa, es decir, existe relación entre el peso y la talla, y existen diferencias respecto a la distribución normal. Al haber aceptado la hipótesis alternativa, podríamos decir que nuestra hipótesis es distinta a la hipótesis de normalidad. (PARA ACEPTAR LA HIPOTESIS NULA, LA P DEBE SER MAYOR A 0,05 Y PARA ACEPTAR LA ALTERNATIVA DEBE SER MENOR A 0,05).

Según esta prueba estadística no podríamos aplicar la R de Pearson, ya que, las variables siguen una tendencia lineal pero no una distribución normal. Sin embargo, también podemos explorar la normalidad de forma grafica, que es lo que procederemos a ver ahora:

Observando el histograma de la variable peso con la curva normal, identificamos una leve asimetría hacia la izquierda.

En este grafico, el gráfico Q-Q, observamos que por debajo, hay ciertas puntuaciones que se alejan de la línea, que representaría la normalidad.

En el gráfico de cajas, también se representan algunas puntuaciones alejadas como el individuo 24

Con los gráficos, respecto a la talla, también se observan las diferencias

En los dos últimos gráficos, apreciamos bastante simetría, por lo que podríamos decir, que al menos la talla si se asemeja más, a diferencia con el peso, a la distribución normal. En el peso, hay un leve incumplimiento

Normalidad

• Sin embargo, en muestras grandes, las muestras tienden a ser significativas por lo que, las pruebas de normalidad realizadas no funcionan bien, ya que nuestra muestra es muy grande

( N= 569).

Aunque hemos hecho las pruebas de normalidad, no deberíamos haberlas hecho, por el tamaño de la población escogida, ya que con una N por encima de 100, directamente tienden a la distribución normal.

De esta manera nuestra muestra es lineal y normal.

Conclusión

• Por tanto, podemos aplicar la R de Pearson: En el programa SPSS seleccionaríamos lo siguiente:

• ANALIZAR CORRELACIONES BIVARIADAS.

Correlaciones

• La correlación del peso con el peso y de la talla con la talla es obviamente 1. Cuando se compara una variable consigo mismo el resultado siempre será 1.

• El peso con la talla, según Pearson es 0,65 Hay una alta correlación. El error tipo 1 es 0, es decir, se acepta la hipótesis alternativa, porque es menor a 0,05EXISTE RELACION ENTRE EL PESO Y LA TALLA.

• En la diapositiva anterior, se representaba también las correlaciones no paramétricas que aunque no eran necesarias en este caso, la hemos pedido. La Rho de Spearman el resultado es muy parecido a Pearson, en cambio la tau b de kendall es más conservadora.

Variables categóricas

• Ahora veremos la segunda parte, que es para variables categóricas, ya que antes hemos visto para variables cuantitativas u ordinales. En este caso, utilizaremos la correlacion puntual biserial, coeficiente phi, contingencia y v de cramer.

Correlación puntual biserial

• Se utiliza cuando queremos relacionar una variable binaria o categórica y una variable cuantitativa.

• Variable binaria: Sexo

• Variable cuantitativa: Frecuencia de ejercicio físico.

• H1: Existe relación entre el sexo y la frecuencia de ejercicio físico.

• H0: No existe relación entre el sexo y la frecuencia de ejercicio físico.

Normalidad

• Lo primero que debemos de hacer es explorar la normalidad de la variable cuantitativa, pero no lo vamos a hacer porque nuestra muestra es grande y asumimos que es normal, por lo que directamente nos vamos a explorar la relación.

Correlación

• La puntual biserial no es más que un coeficiente de la R de Pearson.

• ANALIZARCORRELACIONES BIVARIADASPEARSON

El tamaño del efecto es medio puesto que la r es 0,3, es decir, la relación entre el sexo y el ejercicio físico es 0,3. El signo es negativo( RELACION NEGATIVA) es decir, a más sexo menos ejercicio, como habíamos puesto que el 1 era chico y el 2 era chica, quiere decir que cuando pasamos de chico a chica se reduzca la frecuencia de ejercicio.

Coeficiente de Phi

• Se utilizaba para ver la relación entre dos variables categóricas dicotómicas.: por ejemplo, Sexo y consumo de tabaco.

• H1 sería: Existe relación entre sexo y el consumo de tabaco.

• Para ver la relación, utilizamos tablas de contingencia.

• ANALIZAR ESTADISTICOS DESCRIPTIVOSTABLAS CRUZADAS

• ESTADISTICOS CASILLAS OBSERVADO Y ESPERADO

El coeficiente de phi es muy bajo, es menor de 0,1, por lo que el tamaño del efecto es muy bajo. La p es mayor a 0,05, por lo que aceptamos la hipótesis nula:

No existe relación entre sexo y consumo de tabaco.

No hay apenas diferencia entre las frecuencias observadas y las esperadas.

Coeficiente de contingencia y V de Cramer

• Variables categóricas pero con más de dos categorías, nominales

• H1: Existe relación entre el grado APGAR( 3 categorias) y la frecuencia del consumo de tabaco.

La correlación es baja ya que es 0,20 y Es positiva, de manera que cuanto más funcional es la familia, más personas fuman todos los días. Además si observamos el recuento observado y esperado, podemos apreciar, que se afirma con más frecuencia a la que se esperaba que fuma tabaco todos los días

Gracias.

top related