seminario 10

9
SEMINARIO 10 -Variables cuantitativas H1: existe relación entre peso y talla H0: no existe relación. Para usar la R de Pearson hay que ver si es relación lineal y si es normal. Para ver si es lineal hay que verlo mediante un diagrama de puntos. Observamos que nuestros datos se comportan linealmente por ello ahora vamos a explorar la normalidad mediante gráficos o pruebas. En muestras grandes las pruebas pueden ser significativas y dar ausencia de normalidad. Y según la N lo realizaremos según unas pruebas u otras. Resumen del procesamiento de los casos Casos Válidos Perdidos Total N Porcentaje N Porcentaje N Porcentaje PESO 539 94,7% 30 5,3% 569 100,0%

Upload: margueroy

Post on 10-Aug-2015

38 views

Category:

Education


0 download

TRANSCRIPT

Page 1: Seminario 10

SEMINARIO 10

-Variables cuantitativas

H1: existe relación entre peso y talla

H0: no existe relación.

Para usar la R de Pearson hay que ver si es relación lineal y si es normal.

Para ver si es lineal hay que verlo mediante un diagrama de puntos.

Observamos que nuestros datos se comportan linealmente por ello ahora vamos a explorar la

normalidad mediante gráficos o pruebas. En muestras grandes las pruebas pueden ser

significativas y dar ausencia de normalidad. Y según la N lo realizaremos según unas pruebas u

otras.

Resumen del procesamiento de los casos

Casos

Válidos Perdidos Total

N Porcentaje N Porcentaje N Porcentaje

PESO 539 94,7% 30 5,3% 569 100,0%

Page 2: Seminario 10

Resumen del procesamiento de los casos

Casos

Válidos Perdidos Total

N Porcentaje N Porcentaje N Porcentaje

PESO 539 94,7% 30 5,3% 569 100,0%

TALLA 539 94,7% 30 5,3% 569 100,0%

Pruebas de normalidad

Kolmogorov-Smirnov

a Shapiro-Wilk

Estadístico gl Sig. Estadístico gl Sig.

PESO ,084 539 ,000 ,977 539 ,000

TALLA ,067 539 ,000 ,992 539 ,007

a. Corrección de la significación de Lilliefors

Como P es ,000 (si P < 0.05 aceptamos H1) es significativa y por ello aceptamos la hipótesis

alternativa H1.

Por lo tanto, se cumple que es lineal pero nuestra distribución es diferente a lo normal.

En el histograma referente a peso hay una pequeña desviación a la izquierda y lo vemos

también en el grafico Q-Q que hay puntos que se salen de la línea, todo esto lo podemos

apreciar a continuación.

Page 3: Seminario 10
Page 4: Seminario 10

Ahora miramos los graficos relacionados con la talla.

Page 5: Seminario 10

Si miramos entonces los gráficos de peso y talla vemos que si se acercan significativamente a la

realidad y recordamos que no nos dieron antes las pruebas normales porque la distribución es

muy grande (N= 569) por ello podemos usar la R de Pearson porque es más potente y siempre

que podamos vamos a usarlas.

¡LAS MUESTRAS MUY GRANDES TIENEN SIEMPRE A DISTRIBUCIN NORMAL!

- Correlaciones:

Correlaciones

PESO TALLA

PESO Correlación de Pearson 1 ,646**

Sig. (bilateral) ,000

N 545 539

TALLA Correlación de Pearson ,646** 1

Sig. (bilateral) ,000

N 539 549

**. La correlación es significativa al nivel 0,01 (bilateral).

Page 6: Seminario 10

Cuando una variable se relaciona consigo misma siempre dará 1.

El peso con la talla da 0.65 y por lo tanto hay una correlación importante, como la sig

(bilateral) da 0.000 que es P es menor a 0.5 aceptamos la H1, con lo cual aceptamos que

existe relación entre el peso y la talla.

- Correlaciones NO paramétricas: (Tau de Kendall (es la más conservadora) y Rho de Spearman)

En este caso no hubiese hecho falta realizarlas.

Correlaciones

PESO TALLA

Tau_b de Kendall PESO Coeficiente de correlación 1,000 ,483**

Sig. (bilateral) . ,000

N 545 539

TALLA Coeficiente de correlación ,483** 1,000

Sig. (bilateral) ,000 .

N 539 549

Rho de Spearman PESO Coeficiente de correlación 1,000 ,650**

Sig. (bilateral) . ,000

N 545 539

TALLA Coeficiente de correlación ,650** 1,000

Sig. (bilateral) ,000 .

N 539 549

**. La correlación es significativa al nivel 0,01 (bilateral).

- Variables categoricas:

1. Correlación puntual biserial:

H1: existe relación entre el sexo y el ejercicio físico.

H0: No existe relación.

Como nuestra muestra es grande asumimos que es normal y vamos a ver la

correlación.

Correlaciones

SEXO

¿Con qué frecuencia semanal realizas

actividad física al menos 1 hora al

día?

Page 7: Seminario 10

SEXO Correlación de Pearson 1 -,303**

Sig. (bilateral) ,000

N 566 563

¿Con qué frecuencia semanal

realizas actividad física al

menos 1 hora al día?

Correlación de Pearson -,303** 1

Sig. (bilateral) ,000

N 563 566

**. La correlación es significativa al nivel 0,01 (bilateral).

La correlación es media porque supera al 0.3. Aceptamos la hipótesis H1 porque P es menor a

0.5. Como el signo es de más de una variable es menos de la otra por eso de chico a chica va de

mas ejercicio a menos.

2. PHI:

Se usa para ver dos variables categóricas dicotómicas (SI/NO, MASC/FEM) como por

ejemplo una variable dicotómica SEXO y otra CONSUMO DE TABACO.

2.1 Nuestra hipótesis alternativa (H1) es que existe relación entre sexo y consumo de

tabaco.

Tablas de contingencia.

Tabla de contingencia ¿Has fumado tabaco alguna vez? * SEXO

SEXO

Total CHICO CHICA

¿Has fumado tabaco alguna

vez?

No Recuento 149 151 300

Frecuencia esperada 146,3 153,7 300,0

Sí Recuento 127 139 266

Frecuencia esperada 129,7 136,3 266,0

Total Recuento 276 290 566

Frecuencia esperada 276,0 290,0 566,0

No hay diferencias significativas entre lo esperado y lo observado.

Medidas simétricas

Valor Sig. aproximada

Nominal por nominal Phi ,019 ,648

V de Cramer ,019 ,648

N de casos válidos 566

Page 8: Seminario 10

- El valor de phi es muy bajo (correlación baja) por lo tanto su efecto también y su P es

mayor de 0.5 por lo tanto se rechaza la hipótesis alternativa es decir, no existe relación

entre sexo y consumo de tabaco.

3. V de Cramer: Son variables categóricas no dicotómicas.

Vamos a ver si existe relación ente el grado APGAR y la frecuencia de consumo de tabaco

(el cuanto fuman tabaco)

Resumen del procesamiento de los casos

Casos

Válidos Perdidos Total

N Porcentaje N Porcentaje N Porcentaje

¿Con qué frecuencia fumas

tabaco en la actualidad? *

Grado de funcionamiento

familiar

547 96,1% 22 3,9% 569 100,0%

Viendo la tabla siguiente vamos a ver que según los datos estudiados las personas

fuman más de lo esperado cuando el grado de disfuncionalidad grave.

Tabla de contingencia ¿Con qué frecuencia fumas tabaco en la actualidad? * Grado de funcionamiento

familiar

Grado de funcionamiento familiar

Total

Disfuncional

grave

Disfuncional

leve Normofuncional

¿Con qué

frecuencia fumas

tabaco en la

actualidad?

No fumo Recuento 10 56 348 414

Frecuencia

esperada

12,9 65,1 336,0 414,0

Menos de una

vez a la semana

Recuento 2 13 31 46

Frecuencia

esperada

1,4 7,2 37,3 46,0

Al menos una vez

a la semana, pero

no todos los días

Recuento 0 5 33 38

Frecuencia

esperada

1,2 6,0 30,8 38,0

Todos los días Recuento 5 12 32 49

Frecuencia

esperada

1,5 7,7 39,8 49,0

Page 9: Seminario 10

Total Recuento 17 86 444 547

Frecuencia

esperada

17,0 86,0 444,0 547,0

Medidas simétricas

Valor Sig. aproximada

Nominal por nominal Phi ,329 ,000

V de Cramer ,190 ,000

Coeficiente de contingencia ,312 ,000

N de casos válidos 546

Cogemos el coeficiente de contingencia porque es el que mayor valor tiene aunque la

correlación es baja.