seminario 7

15
Análisis bivariado con variables cualitativas (proporciones) Mariló Páyer Pérez Macarena A Subgrupo 3

Upload: marilopayer

Post on 27-Jan-2017

136 views

Category:

Health & Medicine


3 download

TRANSCRIPT

Page 1: Seminario 7

Análisis bivariado con variables cualitativas

(proporciones)

Mariló Páyer PérezMacarena ASubgrupo 3

Page 2: Seminario 7

EJERCICIO 1Si queremos conocer si existe asociación entre el consumo de tabaco y el bajo peso al nacer; estudiamos a 250 mujeres fumadoras y a 1750 mujeres no fumadoras y encontramos que:

De las 250 mujeres fumadoras, 43 tienen un niño con bajo peso al nacer De las 1750 mujeres no fumadoras, 105 tienen un niño con bajo peso al

nacer

A) Representa los datos en un tabla de contingencia indicando las frecuencias observadas y porcentajes

Madres fumadoras

Madres no fumadoras

Total

Hijos con bajo peso

43 105 148

Hijos con peso

normal

207 1645 1852

Total 250 1750 2000

Madres fumadoras

Madres no fumadoras

Hijos con bajo peso

17,2% 6%

Hijos con peso

normal

82,8% 94%

Page 3: Seminario 7

Observando ambas tablas a simple vista, nos damos cuenta de que el porcentaje de hijos con peso bajo es mayor si las madres son fumadoras. Esto nos hace pensar que el hábito del tabaco de la madre influirá en el peso del niño, luego pasamos al segundo apartado del ejercicio:

B) Establece una hipótesis adecuada para el estudio H0: El hábito del tabaquismo en las madres no influye en el peso de sus hijos al

nacer (establece que no hay diferencia, que hay igualdad) H1: El hábito del tabaquismo en las madres influye en el peso de sus hijos al nacer

C) Utiliza la prueba chi-cuadrado de Pearson para contrastar tu hipótesisLa prueba de chi-cuadrado se utiliza para comprobar si la diferencia en los datos que observamos es debida al azar (aceptamos la Ho) o es debida a algo más, por ejemplo una asociación entre las variables que estudiamos (rechazamos la H0 y aceptamos la H1). Para empezar a calcular chi cuadrado, hallaremos los valores esperados:

Madres fumadoras

Madres no fumadoras

Total

Hijos con bajo peso

43 105 148

Hijos con peso

normal

207 1645 1852

Total 250 1750 2000

Madres fumadoras

Madres no fumadoras

Hijos con bajo peso

18,5% 129,5%

Hijos con peso

normal

231,5% 1620,5%

Page 4: Seminario 7

Después, aplicaremos la fórmula de chi-cuadrado:𝑋2= = + + + = 32,45 + 2,59 + 4,64 + 0,37 = 40,05

A continuación calculamos el grado de libertad, que será…GL = (F-1)(C-1) = (2-1)(2-1)= 1… y buscaremos el valor teórico en la tabla de chi-cuadrado (atendiendo a un margen de error de 0,05)

Page 5: Seminario 7

Teóricamente, chi-cuadrado nos da un valor de 3,84, pero el valor real calculado mediante la fórmula es 40,05. ¿Qué significa esto?

Si Chi cuadrado en los datos es mayor que la teórica, quiere decir que la diferencia entre nuestros datos NO es debida al azar, luego aceptamos la hipótesis alternativa, H1: el hábito del tabaquismo en las madres influirá en el peso de sus hijos al nacer

Page 6: Seminario 7

D) Calcula la odds ratioLa odds ratio permite cuantificar la importancia/fuerza de la asociación entre dos variables, y como en este caso, puede acompañar al resultado de la prueba chi-cuadrado.Odds ratio sería el cociente entre la odds de expuestos a la categoría de riesgo de la variable de riesgo que tienen el carácter estudiado y los expuestos a la categoría de riesgo de la variable de riesgo que NO tienen el carácter estudiado.En nuestro caso, veamos de nuevo nuestra tabla de contingencia:

Mujeres fumadoras

Mujeres no

fumadorasHijos con bajo peso

43 105

Hijos con peso

normal

207 1645

Así pues, suponiendo que fumar es un factor de riesgo, nuestra odds ratio sería:a) Para hijos con bajo peso: OR= =

Page 7: Seminario 7

Teniendo en cuenta que…

OR=1 indica que no hay asociación (independencia)OR>1 la presencia del factor de exposición se asocia a mayor ocurrencia del eventoOR <1 la presencia del factor de exposición se asocia a menor ocurrencia del evento

… y que el resultado de nuestra OR fue de 3,25, podemos decir que la presencia del factor fumar se asocia a mayor ocurrencia de hijos con bajo peso, o lo que es lo mismo, aceptamos la hipótesis alternativa.

Page 8: Seminario 7

E) Repite el ejercicio con R Commander. ¿Los resultados son los mismos?En primer lugar, vamos a crear nuestra famosa tabla de contingencia:

Marcamos esta opción para calcular odd ratio

Page 9: Seminario 7

Este es el resultado que nos da R Commander:

Como podemos ver, al comparar chi obtenido en datos (X- squared = 40,044) y chi teórico (p-value =2,483), nos sale que el primer valor es mayor, al igual que como calculamos anteriormente sin R Commander.

Y, como deducimos anteriormente, aceptamos la hipótesis alternativa. Por lo tanto, tanto como haciendo el ejercicio manualmente como por R Commander obtendremos el mismo resultado.

En cuanto a la odds ratio, nos da el mismo valor que calculamos manualmente.

Page 10: Seminario 7

EJERCICIO 2Siguiendo todos los pasos anteriores establece y describe si existe asociación entre las variables del archivo “activossalud.Rdata” sexo y:a) Practicadeporte (Sí, No)b) Fruta:

“Nunca o casi nunca” “Menos de una vez por semana” “Una o dos veces a la semana” “Tres o más veces a la semana” “A diario”

Page 11: Seminario 7

Para resolver el apartado a), vamos a comenzar planteando nuestras hipótesis a la pregunta de investigación: ¿existe relación entre el sexo y la práctica de deporte? H0: No existe diferencia en la hora de práctica deportiva entre hombres y mujeres H1: Existe diferencia en la hora de práctica deportiva entre hombres y mujeres

Tras cargar nuestro conjunto de datos en R Commander, seleccionamos las dos variables que nos interesan en una tabla de doble entrada, recordando marcar “Test exacto de Fisher”

Page 12: Seminario 7

La observación de la tabla a simple vista nos hace pensar que los hombres hacen más deporte que las mujeres, pero para corroborar esta teoría, usamos Chi cuadrado:

Con la prueba de Chi- cuadrado comprobamos con facilidad que la Chi calculada es mayor que la teórica, luego, como explicamos en el ejercicio anterior, aceptamos la hipótesis alternativa (existe diferencia en la hora de práctica deportiva entre hombres y mujeres), luego ambas variables ESTÁN RELACIONADAS.

Page 13: Seminario 7

No obstante, la odds ratio tiene un valor de 0,2, lo que, al ser menor de 1, significa que la presencia del factor de exposición (sexo) implica una menor probabilidad de que ocurra el suceso (hacer deporte). En este caso el sexo que usa R es varón, luego esto no se corresponde con los datos obtenidos anteriormente

Para decidir qué opción es la correcta, nos fijamos en el intervalo de confianza. En este caso, el intervalo de confianza no incluye el valor 1, por lo que podemos asegurar que OR será diferente de 1 y por lo tanto habrá asociación entre ambas variables.

Page 14: Seminario 7

Para el apartado b), empezaremos igual que en el anterior. En este caso, nuestra pregunta de investigación es “¿existe relación entre el sexo y la ingesta de fruta”, y nuestras hipótesis son: H0: Existe una relación entre el sexo y la ingesta de fruta H1: No existe relación entre el sexo y la ingesta de fruta

La metodología en R será la misma que anteriormente:

Page 15: Seminario 7

Este apartado es exactamente igual, por lo que lo haremos de la manera más rápida:• Chi calculada (7,6036) es mayor que chi teórica (0,1072),

luego aceptaremos la hipótesis alternativa: ambas variables (sexo e ingesta de fruta) están relacionadas