seminario 8. test de chi - cuadrado

19
SEMINARIO 8 Test de Chi-Cuadrado de Pearson MARTA SÁNCHEZ ELICES ESTADÍSTICA Y TICs U.D. Virgen del Rocío GRUPO PEQUEÑO: 16

Upload: martaelices

Post on 14-Aug-2015

132 views

Category:

Education


4 download

TRANSCRIPT

SEMINARIO 8

Test de Chi-Cuadrado de PearsonMARTA SÁNCHEZ ELICES

ESTADÍSTICA Y TICs U.D. Virgen del Rocío

GRUPO PEQUEÑO: 16

Procedimiento a la hora de realizar Chi-Cuadrado

Establecer hipótesis nula

Realizar una tabla con los datos observados o frecuencias observadas

Calcular Grados de Libertad

Calcular frecuencias esperadas

Utilizar el estadístico

Compararlo con las tablas a nivel de significación fijadas.

Aceptar o rechazar la H0

Ejemplo de ejercicio: Un enfermero de la unidad de digestivo observa que

se producen diferencias relacionadas con los meses en los reingresos de pacientes

con úlcera gástrica. Recoge los siguientes datos:

• En primer lugar establecemos cuál será la hipótesis nula:

H0: no hay relación entre el mes del año y los reingresos.

En 2014 ha habido 48 reingresos.

• Si se cumpliera la hipótesis nula: lo esperado sería, si tenemos 12 meses, 4

ingresos al mes.

• Variable independiente: mes, que tiene 12 categorías. (Mientras más

categorías tenga la variable, más probabilidad de que me salga un valor esperado

menor a 5. Para poder hacer el test de Chi cuadrado, lo que puedo hacer es

convertir los meses, en estaciones del año, por lo que solo habría 4 categorías).

Voy a reagrupar la variable independiente, en estaciones: el mes lo voy a convertir en estaciones. Lo esperado sería:

• Invierno (enero, febrero, marzo): 12 reingresos

• Primavera (abril, mayo, junio): 12

• Verano (julio, agosto, septiembre): 12

• Otoño (octubre, nov, diciembre): 12

Lo observado es diferente (según la tabla de la diapositiva):

• Invierno: 7

• Primavera: 15

• Verano: 6

• Otoño: 20

Variable dependiente: reingreso. Tiene 2 categorías (Sí, No).

Se trata de ver si hay diferencia entre lo observado y lo esperado.

¿Cómo calculamos el test Chi-cuadrado?

- Grados de libertad [(nº categorías V.I) – 1)] x [( nº categorías V.D) – 1]

(4-1) x (2-1) = 3

Calculamos el valor de Chi-cuadrado mediante la fórmula:

• fo= frecuencia observada

• fe = frecuencia esperada

Aplicamos la fórmula, en este caso el resultado de Chi-cuadrado es: 11,16Normalmente los investigadores aceptan un máximo de 5 % de error. Eso es lo que se llama nivel de significación p < 0,05.

Correspondencia inversa: mientras más alta sea Chi-cuadrado, más pequeño es el error (p)

2 2 2 2 2

2 7 12 15 12 6 12 20 1211,16

12 12 12 12

fo fe

fe

Miramos en la tabla:

- Grados de libertad: 3

- Nivel de significación: 0,05

En este caso Chi-cuadrado vale: 7,82.

Como nuestro resultado es de 11,16 (mayor que 7,82), el nivel de

significación será menor que 0,05.

- Cuando el nivel de significación es menor: rechazamos la hipótesis

nula.

- Cuando el nivel de significación es mayor: aceptamos la hipótesis

nula.

En este caso, rechazamos la hipótesis nula. Por ello decimos: si existe

relación entre las estaciones y los reingresos.

Se acumulan los reingresos en otoño y en primavera.

Ejercicio 1: Un estudio para saber si la pertenencia a barriadas más pobres influye en la obesidad infantil.Nivel de significación de 0,01

Ho: la pertenencia a barriadas más pobres no influye en la obesidad infantil.

Hemos recogido unos datos:

Calculamos los totales:

20 45

70 26

  Barrio pobre Barrio rico  

Obesidad infantil si

20 45 65

Obesidad infantil no

70 26 96

  90 71 161

65 personas con obesidad infantil

96 personas sin obesidad infantil

90 personas pertenecen a barriadas pobres

71 personas pertenecen a barriadas más ricas

VI: barrio en el que vive, tiene 2 categorías: barrio rico o

barrio pobre COLUMNAS

VD: Obesidad infantil, tiene 2 categorías: si o no FILAS

Voy a calcular los datos esperados en una tabla a parte:

Grados de libertad: (2-1) x (2-1) = 1

  Barrio pobre Barrio rico  

Obesidad infantil si

=36,3 =28,66 65

Obesidad infantil no

=53,66 =42,3 96

  90 71 161

Calculamos Chi-cuadrado:

+ + + = 27,9

- Miramos el valor de Chi-Cuadrado en la Tabla (1 grado de libertad y nivel de significación 0,01)

Miramos la tabla. Para que p sea 0,01, Chi cuadrado tiene que valer: 6,64

27,9 es mucho mayor que este valor, por lo cual p es mucho menor que 0,01, lo

que significa que rechazamos la hipótesis nula.

Esto quiere decir que hay relación entre el barrio al que pertenece y el

padecer o no obesidad infantil.

Si rechazamos la hipótesis nula puede ser que haya mas obesos entre los

niños marginales o los no marginales. Tenemos que ver donde están los

obesos.

- Obesidad barrios marginales : = 0,22

- Obesidad barrios no marginales: = 0.63

Hay mas obesidad infantil en los barrios no marginales.

Ejercicio 2: Tenemos la siguiente tabla de contingencia que refleja los datos de la asignatura de religión en centros escolares. ¿Influye el tipo de colegio en la nota obtenida? Con un margen de error 0,05.

  Insuficiente

Suficiente o bien

Notable Sobresaliente

Total

Centro privado

6 14 17 9 46

Instituto 30 32 17 3 82  36 46 34 12 128

H0 = no influye el tipo de colegio en la nota obtenida.

Hacemos una tabla con los datos esperados:

  Insuficiente

Suficiente o bien

Notable Sobresaliente

Total

Centro privado

12,94 16,53 12,22 4,31 46 

Instituto 23,06 29,47 21,78 7,69 82   30  46  34   12 128 

VI: nota obtenida: 4 categorías

VD: tipo de colegio, 2 categorías

Grado de libertad: (4-1) x (2-1) = 3

- Calculamos el valor de Chi – cuadrado:

(6 - 12,94)2/12,94 + (30 – 23,06)2/23, 06 + (14 - 16,53)2/16,53 + (32 – 29,47)2/29,47 + (17 – 12,22)2/12,22 + (17 – 21,78)2/21,78 + (9 - 4,31)2/4,31 + (3 – 7,69)2/7,69 =

17,3

Miramos la tabla:

Para que el nivel de significación fuese 0,05, Chi-

cuadrado debería valer 7,82.

En nuestro caso Chi-cuadrado vale 17,3. Es mucho

mayor, por lo que la p<0,05

Rechazamos la hipótesis nula. Si influye el tipo de

colegio en la nota obtenida. ¿Dónde hay mas porcentaje

de suspensos?.

Privado: 6/46 = 0,13

Publico: 30/82 = 0,36

Se suspende mucho mas en los centros públicos

que en los privados.

Ejercicio 3: En un grupo de enfermos que se quejaban de que no dormían se les dio somníferos y placebos. Con los siguientes resultados. Nivel de significación: 0,05

¿Es lo mismo tomar somníferos que placebos para dormir

bien o mal en este grupo de enfermos?

RESULTADO Chi-cuadrado = 2,5778

H0 = no hay relación entre tomar somníferos o placebos y dormir bien o mal.

V.I = tomar somníferos o placebos. 2 categorías

V.D = dormir bien o mal. 2 categorías

Hacemos una tabla con los datos observados:

Hacemos una tabla con los datos esperados:

Duerme bien Duerme mal

Somníferos 44 10 54

Placebos 81 35 116

125 45 170

Duerme bien Duerme mal

Somníferos 125 x 54/170 = 39,7

45 x 54/170 = 14,29

54

Placebos 125 x 116/170 = 85,29

45 x 116/170 = 30,70

116

125 45 170

- Grados de libertad : (2 – 1) x (2 – 1)= 1

Calculamos Chi-cuadrado:

(44 – 29,7)2/29,7 + (81 – 85,29)2/85,29 + (10 – 14,29)2/14,29 + (35 – 30,70)2/30,70 = 2,57

Buscamos el valor de Chi-cuadrado en la tabla (1 grado de libertad y un nivel de significación de 0,05)

El valor de Chi- cuadrado para que p = 0,05 es 3,84. 2,57 es menor que este valor. Por lo que la p>0,05.

Así que aceptamos la hipótesis nula:

No hay relación entre tomar somníferos o placebos y dormir bien o mal.

Ejercicio 4: En un C de Salud analizamos las historias de enfermería (292 hombres y 192 mujeres). De ellos tienen úlcera 10 hombres y 24 mujeres y no tienen 282 y 168 respectivamente. Nivel significación 0,05

H0 = no influye el sexo en el hecho de tener o no tener úlceras.

Hacemos una tabla con los datos observados:

- V.I = sexo. Tiene 2 categorías (mujer, hombre).

- V.D = presencia de úlceras. Tiene 2 categorías (si tiene, no tiene).

Tienen úlcera No tienen úlcera

Mujer 24 168 192

Hombre 10 282 292

34 450 484

Hacemos una tabla con los datos esperados:

- Grados de libertad: (2-1) x (2-1) = 1

- Nivel de significación = 0,05

Calculamos el valor de Chi-cuadrado:

(24 – 13,5)2/13,5 + (10 – 20,5)2/20,5 + (168 – 178,5)2/178,5 + (292 – 271,5)2/271,5

= 14,6

Tienen úlcera No tienen úlcera

Mujer 34 x 192/484 = 13,5

450 x 192/484 = 178,5

192

Hombre 34 x 292/484 = 20,5

450 x 292/484 = 271,5

292

34 450 484

Miramos en la tabla cuál sería el valor de Chi-cuadrado para que p = 0,05

Para que p = 0,05, Chi-cuadrado tiene que valer 3,84. Nuestro valor es mucho mayor (14,6). Por lo que la p será mucho menor de 0,05. Rechazamos la hipótesis nula.

Sí influye el sexo en el hecho de tener o no tener úlceras.

- Úlceras en hombres: 10/292 = 0,034 x 100 = 3,4%

- Úlceras en mujeres: 24/192 = 0,125 x 100 = 12,5%

LAS ÚLCERAS APARECEN MÁS EN MUJERES QUE EN HOMBRES.