seminario 10
TRANSCRIPT
SEMINARIO 10
-Variables cuantitativas
H1: existe relación entre peso y talla
H0: no existe relación.
Para usar la R de Pearson hay que ver si es relación lineal y si es normal.
Para ver si es lineal hay que verlo mediante un diagrama de puntos.
Observamos que nuestros datos se comportan linealmente por ello ahora vamos a explorar la
normalidad mediante gráficos o pruebas. En muestras grandes las pruebas pueden ser
significativas y dar ausencia de normalidad. Y según la N lo realizaremos según unas pruebas u
otras.
Resumen del procesamiento de los casos
Casos
Válidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
PESO 539 94,7% 30 5,3% 569 100,0%
Resumen del procesamiento de los casos
Casos
Válidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
PESO 539 94,7% 30 5,3% 569 100,0%
TALLA 539 94,7% 30 5,3% 569 100,0%
Pruebas de normalidad
Kolmogorov-Smirnov
a Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
PESO ,084 539 ,000 ,977 539 ,000
TALLA ,067 539 ,000 ,992 539 ,007
a. Corrección de la significación de Lilliefors
Como P es ,000 (si P < 0.05 aceptamos H1) es significativa y por ello aceptamos la hipótesis
alternativa H1.
Por lo tanto, se cumple que es lineal pero nuestra distribución es diferente a lo normal.
En el histograma referente a peso hay una pequeña desviación a la izquierda y lo vemos
también en el grafico Q-Q que hay puntos que se salen de la línea, todo esto lo podemos
apreciar a continuación.
Ahora miramos los graficos relacionados con la talla.
Si miramos entonces los gráficos de peso y talla vemos que si se acercan significativamente a la
realidad y recordamos que no nos dieron antes las pruebas normales porque la distribución es
muy grande (N= 569) por ello podemos usar la R de Pearson porque es más potente y siempre
que podamos vamos a usarlas.
¡LAS MUESTRAS MUY GRANDES TIENEN SIEMPRE A DISTRIBUCIN NORMAL!
- Correlaciones:
Correlaciones
PESO TALLA
PESO Correlación de Pearson 1 ,646**
Sig. (bilateral) ,000
N 545 539
TALLA Correlación de Pearson ,646** 1
Sig. (bilateral) ,000
N 539 549
**. La correlación es significativa al nivel 0,01 (bilateral).
Cuando una variable se relaciona consigo misma siempre dará 1.
El peso con la talla da 0.65 y por lo tanto hay una correlación importante, como la sig
(bilateral) da 0.000 que es P es menor a 0.5 aceptamos la H1, con lo cual aceptamos que
existe relación entre el peso y la talla.
- Correlaciones NO paramétricas: (Tau de Kendall (es la más conservadora) y Rho de Spearman)
En este caso no hubiese hecho falta realizarlas.
Correlaciones
PESO TALLA
Tau_b de Kendall PESO Coeficiente de correlación 1,000 ,483**
Sig. (bilateral) . ,000
N 545 539
TALLA Coeficiente de correlación ,483** 1,000
Sig. (bilateral) ,000 .
N 539 549
Rho de Spearman PESO Coeficiente de correlación 1,000 ,650**
Sig. (bilateral) . ,000
N 545 539
TALLA Coeficiente de correlación ,650** 1,000
Sig. (bilateral) ,000 .
N 539 549
**. La correlación es significativa al nivel 0,01 (bilateral).
- Variables categoricas:
1. Correlación puntual biserial:
H1: existe relación entre el sexo y el ejercicio físico.
H0: No existe relación.
Como nuestra muestra es grande asumimos que es normal y vamos a ver la
correlación.
Correlaciones
SEXO
¿Con qué frecuencia semanal realizas
actividad física al menos 1 hora al
día?
SEXO Correlación de Pearson 1 -,303**
Sig. (bilateral) ,000
N 566 563
¿Con qué frecuencia semanal
realizas actividad física al
menos 1 hora al día?
Correlación de Pearson -,303** 1
Sig. (bilateral) ,000
N 563 566
**. La correlación es significativa al nivel 0,01 (bilateral).
La correlación es media porque supera al 0.3. Aceptamos la hipótesis H1 porque P es menor a
0.5. Como el signo es de más de una variable es menos de la otra por eso de chico a chica va de
mas ejercicio a menos.
2. PHI:
Se usa para ver dos variables categóricas dicotómicas (SI/NO, MASC/FEM) como por
ejemplo una variable dicotómica SEXO y otra CONSUMO DE TABACO.
2.1 Nuestra hipótesis alternativa (H1) es que existe relación entre sexo y consumo de
tabaco.
Tablas de contingencia.
Tabla de contingencia ¿Has fumado tabaco alguna vez? * SEXO
SEXO
Total CHICO CHICA
¿Has fumado tabaco alguna
vez?
No Recuento 149 151 300
Frecuencia esperada 146,3 153,7 300,0
Sí Recuento 127 139 266
Frecuencia esperada 129,7 136,3 266,0
Total Recuento 276 290 566
Frecuencia esperada 276,0 290,0 566,0
No hay diferencias significativas entre lo esperado y lo observado.
Medidas simétricas
Valor Sig. aproximada
Nominal por nominal Phi ,019 ,648
V de Cramer ,019 ,648
N de casos válidos 566
- El valor de phi es muy bajo (correlación baja) por lo tanto su efecto también y su P es
mayor de 0.5 por lo tanto se rechaza la hipótesis alternativa es decir, no existe relación
entre sexo y consumo de tabaco.
3. V de Cramer: Son variables categóricas no dicotómicas.
Vamos a ver si existe relación ente el grado APGAR y la frecuencia de consumo de tabaco
(el cuanto fuman tabaco)
Resumen del procesamiento de los casos
Casos
Válidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
¿Con qué frecuencia fumas
tabaco en la actualidad? *
Grado de funcionamiento
familiar
547 96,1% 22 3,9% 569 100,0%
Viendo la tabla siguiente vamos a ver que según los datos estudiados las personas
fuman más de lo esperado cuando el grado de disfuncionalidad grave.
Tabla de contingencia ¿Con qué frecuencia fumas tabaco en la actualidad? * Grado de funcionamiento
familiar
Grado de funcionamiento familiar
Total
Disfuncional
grave
Disfuncional
leve Normofuncional
¿Con qué
frecuencia fumas
tabaco en la
actualidad?
No fumo Recuento 10 56 348 414
Frecuencia
esperada
12,9 65,1 336,0 414,0
Menos de una
vez a la semana
Recuento 2 13 31 46
Frecuencia
esperada
1,4 7,2 37,3 46,0
Al menos una vez
a la semana, pero
no todos los días
Recuento 0 5 33 38
Frecuencia
esperada
1,2 6,0 30,8 38,0
Todos los días Recuento 5 12 32 49
Frecuencia
esperada
1,5 7,7 39,8 49,0
Total Recuento 17 86 444 547
Frecuencia
esperada
17,0 86,0 444,0 547,0
Medidas simétricas
Valor Sig. aproximada
Nominal por nominal Phi ,329 ,000
V de Cramer ,190 ,000
Coeficiente de contingencia ,312 ,000
N de casos válidos 546
Cogemos el coeficiente de contingencia porque es el que mayor valor tiene aunque la
correlación es baja.