11. mi ii sesión 11, 2008 met.investigacion
TRANSCRIPT
Metodología Metodología de la Investigación IIde la Investigación II
Domingo A. LancellottiDomingo A. Lancellotti
Facultad de MedicinaFacultad de MedicinaUniversidad Católica del NorteUniversidad Católica del Norte
Coquimbo, 2008Coquimbo, 2008
Prueba de Significancia para el Coeficiente de Regresión
para = 0
(prueba t de Student)
st
b
b
siendo
el error estándar del coeficiente de regresión
nX
X ii
XYSSb
22
2
·
la varianza de los residuos …
donde
2
2
2
2
2
2
·2
nn
nn X
X
YXYX
YY
i
i
XY
i
iiii
i
S
... y
son los grados de libertad (n = número de pares de datos)
= n - 2
iv) calcular la probabilidad de |t |
Procedimiento:
i) H0: HA: (prueba de 2-cola)
ii) nivel de significancia, = 0,05
iii) valor crítico para :
= n - 2 |t0,05(2),| =
Prueba de Significancia para el Coeficiente de Correlación
para = 0
(prueba t de Student)
srrt
siendo
el error estándar del coeficiente de correlación
2
21
nr
rS
... y
son los grados de libertad (n = número de pares de datos)
= n - 2
iv) calcular la probabilidad de |t |
Procedimiento:
i) H0: HA: (prueba de 2-cola)
ii) nivel de significancia, = 0,05
iii) valor crítico para :
= n - 2 |t0,05(2),| =
Pruebas para Datos Agrupados en
Unidades Discretas
– categorías -
Pruebas parala Bondad de
Ajuste Propósito :
establece si la población conforma una distribución
teórica específica
Proporción de pacientes por grupo de riesgo con diagnóstico positivo
0
0,2
0,4
0,6
0,8
1
G1 G2 G3
Grupos de Riesgo
Pro
babi
lidad
de
Con
trae
r C
ánce
r
fobsi frecuencia observada en la categoría ifespi frecuencia esperada en la categoría ik número de categorías
k
i iesp
iespiobs
fff
1
22
Prueba del X2 (chi-cuadrado)
el valor de fespi es calculado multiplicando el número total de observaciones, n, por la proporción que la hipótesis nula predice para la respectiva categoría i
el valor crítico de la prueba es X 2,
donde = k -1
Prueba del X2 (chi-cuadrado)
Prueba del X2 (chi-cuadrado)
Caso 6.1
Para tres grupos de pacientes con riesgo diferencial de contraer cáncer a la próstata (diferentes edades), se quiere establecer si dicho riesgo experimenta un aumento progresivo en relación al aumento de la edad.
Esto es, 1:2:4.
Caso 6.1
Desde un registro regional de cáncer, fueron elegidos al azar 42 fichas de pacientes cuyas biopsias a la próstata indicaban presencia de células malignas (cáncer). Los pacientes fueron agrupados en los siguientes rangos de edades: (G1) de 40-49 años, (G2) de 55-64 años y (G3) de 70-79 años.
G1 G2 G3 n
fobsi 4 11 27 42
Procedimiento:
i) H0: la muestra de pacientes viene de una población con una razón de riesgo 1:2:4 para los grupos
de edades G1:G2:G3
HA: la muestra de pacientes NO viene de una población con una razón de riesgo 1:2:4 para los grupos de edades G1:G2:G3
Caso 6.1
iv) cálculo de la probabilidad de X 2
ii) nivel de significancia, = 0,05
iii) valor crítico para :
X 2,
X 20,05;2 = 5,991
Procedimiento:
Caso 6.1
Número de pacientes por grupo de riesgo con diagnóstico positivo y frecuencia esperada
G1 G2 G3 n
fobsi 4 11 27 42
fespi
(1) (2) (4)
Caso 6.1
Número de pacientes por grupo de riesgo con diagnóstico positivo y frecuencia esperada
G1 G2 G3 n
fobsi 4 11 27 42
fespi
(1/7) (2/7) (4/7)
Caso 6.1
Número de pacientes por grupo de riesgo con diagnóstico positivo y frecuencia esperada
G1 G2 G3 n
fobsi 4 11 27 42
fespi
6 12 24 42
Caso 6.1
24
2427
12
1211
6
64222
2
375,0083,0667,02
125,12
k
i iesp
iespiobs
fff
1
22
Caso 6.1
conclusión:
como X 2calculado X 2
tabulado se acepta H0. Entonces, la muestra de pacientes proviene de una población en que el riego de padecer cáncer a la próstata aumenta en la proporción 1:2:4 para los respectivos grupos de edades.
X 20,05;2 = 5,991
X 2calculado = 1,125
Caso 6.1
i) para k = 2, el X 2 requiere el siguiente factor de corrección
(corrección de continuidad de Yates)
k
i iesp
iespiobs
fff
1
22 5,0
restricciones:
Prueba del X2 (chi-cuadrado
ii) el X 2 es sensible a valores de fespi menores que 5; de este modo, debe usarse un N suficientemente
grande para asegurar frecuencias esperadas mayores que 5
restricciones:
Prueba del X2 (chi-cuadrado
Caso 6.2
Se quiere establecer si los bebés varones y mujeres nacidos en el 2005 en el Hospital San Pablo de Coquimbo siguen la proporción 1:1.
Caso 6.2
Del total de 2308 bebés, el número por sexo fue el siguiente:
Varones Mujeres n
fobsi 1146 1162 2308
Procedimiento:
i) H0: el sexo de los niños al nacer sigue la proporción 1:1
HA: el sexo de los niños al nacer NO sigue la proporción 1:1
Caso 6.2
iv) cálculo de la probabilidad de X 2
ii) nivel de significancia, = 0,05
iii) valor crítico para :
X 2,
X 20,05;1 = 3,841
Procedimiento:
Caso 6.2
Número de recién nacidos según sexo.
Varones Mujeres n
fobsi 1146 1162 2308
fespi
(1) (1)
Caso 6.2
Número de recién nacidos según sexo.
Varones Mujeres n
fobsi 1146 1162 2308
fespi
(1/2) (1/2)
Caso 6.2
Número de recién nacidos según sexo.
Varones Mujeres n
fobsi 1146 1162 2308
fespi
1154 1154
Caso 6.2
1154
5,011541162
1154
5,01154114622
2
049,0049,02
098,02
k
i iesp
iespiobs
fff
1
22 5,0
Caso 6.2
conclusión:
como X 2calculado X 2
tabulado se acepta H0. Entonces, el número de bebés varones y mujeres nacidos en el Hospital San Pablo de Coquimbo, año 2005, sigue la proporción 1:1.
X 20,05;1 = 3,841
X 2calculado = 0,098
Caso 6.2
Tablas de Contingencia
para datos agrupados en unidades discretas
– categorías -, tomados simultáneamente para dos (ó
más) variables
Tablas de Contingencia
Propósito :establecer si las frecuencias
observadas en las categorías de una variable son independientes a las frecuencias observadas en
las categorías de la otra variable (es decir, que las variables no
están relacionadas)
prueba del X 2 para tablas de contingencia
Tablas de Contingencia
(considerar el factor de corrección de Yates para k = 2)
c
i
r
j ijesp
ijespijobs
fff
1 1
2
2
Ri n total de observaciones en la filai
Cj n total de observaciones en la columnaj
n número total de datos
donde la frecuencia esperada - fespij - corresponde a
n
ji CRijespf
Tablas de Contingencia
siendo el valor crítico de la prueba X
2, donde
= (r -1)*(c -1)
r = número de filasc = número de categorías
Tablas de Contingencia
Caso 6.3
Se realizó un estudio para probar la hipótesis que la frecuencia de ocurrencia de los diferentes colores de pelo en hombres y mujeres son independientes.
Negro Café Rubio Rojo
Hombres 32 43 16 9
Mujeres 55 65 64 16
Caso 6.3
i) H0: El color de pelo en humanos es independiente del sexo
HA: El color de pelo en humanos NO ES independiente del sexo
protocolo de análisis:
iv) cálculo de la probabilidad de X 2
ii) nivel de significancia, = 0,05
iii) valor crítico para :
r = número de filas (♂♂ y ♀♀)c = número de categorías (negro, café, rubio y rojo)
X 2,
X 20,05;3 = 7,815
protocolo de análisis:
Caso 6.3
Frecuencia observada del color de pelo para hombres y mujeres
Color de Pelo
Negro Café Rubio Rojo total
Hombres 32 43 16 9 100
Mujeres 55 65 64 16 200
Total 87 108 80 25 300
Sexo
Caso 6.3
Ri n total de observaciones en la filai
Cj n total de observaciones en la columnaj
n número total de datos
cálculo de fespij
n
ji CRijespf
Caso 6.3
Color de Pelo
Negro Café Rubio Rojo total
Hombres 87*100 108*100 80*100 25*100 100
Mujeres 87*200 108*200 80*200 25*200 200
Total 87 108 80 25 300
Cálculos de las frecuencias esperadas - fespij - para los colores de pelo
Sexo
300 300 300 300
300 300 300 300
Caso 6.3
Color de Pelo
Negro Café Rubio Rojo total
Hombres 29 36 26,67 8,33
Mujeres 58 72 53,33 16,67
Total
Frecuencias esperadas - fespij – para los colores de pelo
Sexo
Caso 6.3
33,8
33,89
67,26
67,2616
36
3643
29
29322222
2
67,16
67,1616
33,53
33,5364
72
7265
58
58552222
Caso 6.3
0533,02667,43611,13103,020267,01333,26806,01552,0
987,82
Caso 6.3
conclusión:
como X 2calculado X 2
tabulado se rechaza la H0 de independencia. Entonces, las proporciones del color de pelo no es la misma para ambos sexos (al menos en la población muestreada)
X 20,05;3 = 7,815
X 2calculado = 8,987
Caso 6.3
Caso 6.4
Se quiere estudiar la posible asociación entre el hecho que una gestante fume durante el embarazo y que el bebé presente bajo peso al nacer. Esto es, probar si la probabilidad de tener bajo peso al nacer es diferente en gestantes que fuman vs. en gestantes que no fuman.
Caso 6.4
Para responder a esta pregunta se realizó un estudio de seguimiento sobre una cohorte de 2000 gestantes, a las que se les preguntó sobre su hábito de fumar durante la gestación. Una vez que dieron a luz se determinó el peso del recién nacido.
i) H0: Las variables son independientes, o sea, el bajo peso del recién nacido y el hecho de fumar durante la gestación no están asociados.
HA: Las variables NO son independientes, es decir, el bajo peso y el fumar durante la gestación están asociados.
Procedimiento:
Caso 6.4
iv) cálculo de la probabilidad de X 2
ii) nivel de significancia, = 0,05
iii) valor crítico para :r = número de filas – Fumar durante el embarazo (SI y NO)c = número de categorías – Bajo Peso (SI y NO)
X 2,
X 20,05;1 = 3,841
Procedimiento :
Caso 6.4
Resultados del estudio de seguimiento de 2000 gestantes
Bajo Peso RN
SI NO total
SI 43 207 250
NO 105 1645 1750
total 148 1852 2000
Fumadora
Caso 6.4
Ri n total de observaciones en la filai
Cj n total de observaciones en la columnaj
n número total de datos
cálculo de fespij
n
ji CRijespf
Caso 6.4
Frecuencias esperadas - fespij - para el Bajo Peso de RN y Gestante Fumadora:
Bajo Peso RN
SI NO total
SI 18,5 231,5
NO 129,5 1620,5
total
Fumadora
Caso 6.4
355,0448,4488,2135,312
427,382
5,231
5,05,231207
5,18
5,05,184322
2
5,1620
5,05,16201645
5,129
5,05,12910522
Caso 6.4
conclusión:
como X 2calculado X 2
tabulado se rechaza la H0 de independencia. Entonces, el bajo peso al nacer y el hábito de fumar durante la gestación están asociados
X 20,05;1 = 3,841
X 2calculado = 38,427
Caso 6.4
Caso 6.5
En relación al riesgo de contraer cáncer a la próstata, se quiere establecer si con dos métodos independientes de examen se llega a la misma conclusión.
Del grupo de pacientes con mayor riesgo, estos es, el grupo G3 de 70-79 años (ver Caso 6.1), fueron elegidos al azar 301 pacientes. Cada individuo fue examinado mediante palpación rectal (DRE) y biopsia (BIOP).
i) H0: los resultado de los exámenes DRE y BIOP son independientes
HA: los resultado de los exámenes DRE y BIOP NO son independientes
El que sean independientes (es decir, las variables no están relacionadas) significa que el resultado de un examen no nos dice nada sobre el resultado del otro examen ... en nuestro caso, el DRE no nos dice nada sobre el cáncer.
Procedimiento:
Caso 6.5
iv) cálculo de la probabilidad de X 2
ii) nivel de significancia, = 0,05
iii) valor crítico para :r = número de filas - Presencia del cáncer (SI/NO)c = número de categorías – Resultado del examen (SI/NO)
X 2,
X 20,05;1 = 3,841
Procedimiento :
Caso 6.5
Resultados de la Biopsia y del examen DRE, obtenidos simultáneamente
DRE
+ - total
+ 68 27 95
- 117 89 206
total 185 116 301
BIOP
Caso 6.5
Ri n total de observaciones en la filai
Cj n total de observaciones en la columnaj
n número total de datos
cálculo de fespij
n
ji CRijespf
Caso 6.5
DRE
+ - total
+ 185*95 116*95 95
301 301
- 185*206 116*206 206
301 301
total 185 116 301
Cálculos de las frecuencias esperadas - fespij - para la Biopsia y examen DRE
BIOP
Caso 6.5
Frecuencias esperadas - fespij - para la Biopsia y examen DRE
DRE
+ - total
+ 58,4 36,6
- 126,6 79,4
total
BIOP
Caso 6.5
043,1654,0263,2418,12
378,52
6,36
5,06,3627
4,58
5,04,586822
2
4,79
5,04,7989
6,126
5,06,12611722
Caso 6.5
conclusión:
como X 2calculado X 2
tabulado se rechaza la H0 de independencia. Entonces, el resultado del examen DRE nos da alguna información acerca de la presencia del cáncer de próstata (están de algún modo relacionados)
X 20,05;1 = 3,841
X 2calculado = 5,378
Caso 6.5