11. mi ii sesión 11, 2008 met.investigacion

Metodología Metodología de la Investigación IIde la Investigación II

Domingo A. LancellottiDomingo A. Lancellotti

Facultad de MedicinaFacultad de MedicinaUniversidad Católica del NorteUniversidad Católica del Norte

Coquimbo, 2008Coquimbo, 2008

Prueba de Significancia para el Coeficiente de Regresión

para = 0

(prueba t de Student)

st

b

b

siendo

el error estándar del coeficiente de regresión

nX

X ii

XYSSb

22

2

·

la varianza de los residuos …

donde

2

2

2

2

2

2

·2

nn

nn X

X

YXYX

YY

i

i

XY

i

iiii

i

S

... y

son los grados de libertad (n = número de pares de datos)

= n - 2

iv) calcular la probabilidad de |t |

Procedimiento:

i) H0: HA: (prueba de 2-cola)

ii) nivel de significancia, = 0,05

iii) valor crítico para :

= n - 2 |t0,05(2),| =

Prueba de Significancia para el Coeficiente de Correlación

para = 0

(prueba t de Student)

srrt

siendo

el error estándar del coeficiente de correlación

2

21

nr

rS

... y

son los grados de libertad (n = número de pares de datos)

= n - 2

iv) calcular la probabilidad de |t |

Procedimiento:

i) H0: HA: (prueba de 2-cola)



= n - 2 |t0,05(2),| =

Pruebas para Datos Agrupados en

Unidades Discretas

– categorías -

Pruebas parala Bondad de

Ajuste Propósito :

establece si la población conforma una distribución

teórica específica

Proporción de pacientes por grupo de riesgo con diagnóstico positivo

0

0,2

0,4

0,6

0,8

1

G1 G2 G3

Grupos de Riesgo

Pro

babi

lidad

de

Con

trae

r C

ánce

r

fobsi frecuencia observada en la categoría ifespi frecuencia esperada en la categoría ik número de categorías

k

i iesp

iespiobs

fff

1

22

Prueba del X2 (chi-cuadrado)

el valor de fespi es calculado multiplicando el número total de observaciones, n, por la proporción que la hipótesis nula predice para la respectiva categoría i

el valor crítico de la prueba es X 2,

donde = k -1


Caso 6.1

Para tres grupos de pacientes con riesgo diferencial de contraer cáncer a la próstata (diferentes edades), se quiere establecer si dicho riesgo experimenta un aumento progresivo en relación al aumento de la edad.

Esto es, 1:2:4.

Caso 6.1

Desde un registro regional de cáncer, fueron elegidos al azar 42 fichas de pacientes cuyas biopsias a la próstata indicaban presencia de células malignas (cáncer). Los pacientes fueron agrupados en los siguientes rangos de edades: (G1) de 40-49 años, (G2) de 55-64 años y (G3) de 70-79 años.

G1 G2 G3 n

fobsi 4 11 27 42

Procedimiento:

i) H0: la muestra de pacientes viene de una población con una razón de riesgo 1:2:4 para los grupos

de edades G1:G2:G3

HA: la muestra de pacientes NO viene de una población con una razón de riesgo 1:2:4 para los grupos de edades G1:G2:G3

Caso 6.1

iv) cálculo de la probabilidad de X 2



X 2,

X 20,05;2 = 5,991

Procedimiento:

Caso 6.1

Número de pacientes por grupo de riesgo con diagnóstico positivo y frecuencia esperada

G1 G2 G3 n

fobsi 4 11 27 42

fespi

(1) (2) (4)

Caso 6.1


G1 G2 G3 n

fobsi 4 11 27 42

fespi

(1/7) (2/7) (4/7)

Caso 6.1


G1 G2 G3 n

fobsi 4 11 27 42

fespi

6 12 24 42

Caso 6.1

24

2427

12

1211

6

64222

2

375,0083,0667,02

125,12

k

i iesp

iespiobs

fff

1

22

Caso 6.1

conclusión:

como X 2calculado X 2

tabulado se acepta H0. Entonces, la muestra de pacientes proviene de una población en que el riego de padecer cáncer a la próstata aumenta en la proporción 1:2:4 para los respectivos grupos de edades.

X 20,05;2 = 5,991

X 2calculado = 1,125

Caso 6.1

i) para k = 2, el X 2 requiere el siguiente factor de corrección

(corrección de continuidad de Yates)

k

i iesp

iespiobs

fff

1

22 5,0

restricciones:

Prueba del X2 (chi-cuadrado

ii) el X 2 es sensible a valores de fespi menores que 5; de este modo, debe usarse un N suficientemente

grande para asegurar frecuencias esperadas mayores que 5

restricciones:

Prueba del X2 (chi-cuadrado

Caso 6.2

Se quiere establecer si los bebés varones y mujeres nacidos en el 2005 en el Hospital San Pablo de Coquimbo siguen la proporción 1:1.

Caso 6.2

Del total de 2308 bebés, el número por sexo fue el siguiente:

Varones Mujeres n

fobsi 1146 1162 2308

Procedimiento:

i) H0: el sexo de los niños al nacer sigue la proporción 1:1

HA: el sexo de los niños al nacer NO sigue la proporción 1:1

Caso 6.2




X 2,

X 20,05;1 = 3,841

Procedimiento:

Caso 6.2

Número de recién nacidos según sexo.

Varones Mujeres n

fobsi 1146 1162 2308

fespi

(1) (1)

Caso 6.2


Varones Mujeres n

fobsi 1146 1162 2308

fespi

(1/2) (1/2)

Caso 6.2


Varones Mujeres n

fobsi 1146 1162 2308

fespi

1154 1154

Caso 6.2

1154

5,011541162

1154

5,01154114622

2

049,0049,02

098,02

k

i iesp

iespiobs

fff

1

22 5,0

Caso 6.2

conclusión:


tabulado se acepta H0. Entonces, el número de bebés varones y mujeres nacidos en el Hospital San Pablo de Coquimbo, año 2005, sigue la proporción 1:1.

X 20,05;1 = 3,841


Caso 6.2

Tablas de Contingencia

para datos agrupados en unidades discretas

– categorías -, tomados simultáneamente para dos (ó

más) variables


Propósito :establecer si las frecuencias

observadas en las categorías de una variable son independientes a las frecuencias observadas en

las categorías de la otra variable (es decir, que las variables no

están relacionadas)

prueba del X 2 para tablas de contingencia


(considerar el factor de corrección de Yates para k = 2)

c

i

r

j ijesp

ijespijobs

fff

1 1

2

2

Ri n total de observaciones en la filai

Cj n total de observaciones en la columnaj

n número total de datos

donde la frecuencia esperada - fespij - corresponde a

n

ji CRijespf


siendo el valor crítico de la prueba X

2, donde

= (r -1)*(c -1)

r = número de filasc = número de categorías


Caso 6.3

Se realizó un estudio para probar la hipótesis que la frecuencia de ocurrencia de los diferentes colores de pelo en hombres y mujeres son independientes.

Negro Café Rubio Rojo

Hombres 32 43 16 9

Mujeres 55 65 64 16

Caso 6.3

i) H0: El color de pelo en humanos es independiente del sexo

HA: El color de pelo en humanos NO ES independiente del sexo

protocolo de análisis:




r = número de filas (♂♂ y ♀♀)c = número de categorías (negro, café, rubio y rojo)

X 2,

X 20,05;3 = 7,815

protocolo de análisis:

Caso 6.3

Frecuencia observada del color de pelo para hombres y mujeres

Color de Pelo

Negro Café Rubio Rojo total

Hombres 32 43 16 9 100

Mujeres 55 65 64 16 200

Total 87 108 80 25 300

Sexo

Caso 6.3




cálculo de fespij

n

ji CRijespf

Caso 6.3

Color de Pelo


Hombres 87*100 108*100 80*100 25*100 100

Mujeres 87*200 108*200 80*200 25*200 200

Total 87 108 80 25 300

Cálculos de las frecuencias esperadas - fespij - para los colores de pelo

Sexo

300 300 300 300

300 300 300 300

Caso 6.3

Color de Pelo


Hombres 29 36 26,67 8,33

Mujeres 58 72 53,33 16,67

Total

Frecuencias esperadas - fespij – para los colores de pelo

Sexo

Caso 6.3

33,8

33,89

67,26

67,2616

36

3643

29

29322222

2

67,16

67,1616

33,53

33,5364

72

7265

58

58552222

Caso 6.3

0533,02667,43611,13103,020267,01333,26806,01552,0

987,82

Caso 6.3

conclusión:


tabulado se rechaza la H0 de independencia. Entonces, las proporciones del color de pelo no es la misma para ambos sexos (al menos en la población muestreada)

X 20,05;3 = 7,815


Caso 6.3

Caso 6.4

Se quiere estudiar la posible asociación entre el hecho que una gestante fume durante el embarazo y que el bebé presente bajo peso al nacer. Esto es, probar si la probabilidad de tener bajo peso al nacer es diferente en gestantes que fuman vs. en gestantes que no fuman.

Caso 6.4

Para responder a esta pregunta se realizó un estudio de seguimiento sobre una cohorte de 2000 gestantes, a las que se les preguntó sobre su hábito de fumar durante la gestación. Una vez que dieron a luz se determinó el peso del recién nacido.

i) H0: Las variables son independientes, o sea, el bajo peso del recién nacido y el hecho de fumar durante la gestación no están asociados.

HA: Las variables NO son independientes, es decir, el bajo peso y el fumar durante la gestación están asociados.

Procedimiento:

Caso 6.4



iii) valor crítico para :r = número de filas – Fumar durante el embarazo (SI y NO)c = número de categorías – Bajo Peso (SI y NO)

X 2,

X 20,05;1 = 3,841

Procedimiento :

Caso 6.4

Resultados del estudio de seguimiento de 2000 gestantes

Bajo Peso RN

SI NO total

SI 43 207 250

NO 105 1645 1750

total 148 1852 2000

Fumadora

Caso 6.4




cálculo de fespij

n

ji CRijespf

Caso 6.4

Frecuencias esperadas - fespij - para el Bajo Peso de RN y Gestante Fumadora:

Bajo Peso RN

SI NO total

SI 18,5 231,5

NO 129,5 1620,5

total

Fumadora

Caso 6.4

355,0448,4488,2135,312

427,382

5,231

5,05,231207

5,18

5,05,184322

2

5,1620

5,05,16201645

5,129

5,05,12910522

Caso 6.4

conclusión:


tabulado se rechaza la H0 de independencia. Entonces, el bajo peso al nacer y el hábito de fumar durante la gestación están asociados

X 20,05;1 = 3,841


Caso 6.4

Caso 6.5

En relación al riesgo de contraer cáncer a la próstata, se quiere establecer si con dos métodos independientes de examen se llega a la misma conclusión.

Del grupo de pacientes con mayor riesgo, estos es, el grupo G3 de 70-79 años (ver Caso 6.1), fueron elegidos al azar 301 pacientes. Cada individuo fue examinado mediante palpación rectal (DRE) y biopsia (BIOP).

i) H0: los resultado de los exámenes DRE y BIOP son independientes

HA: los resultado de los exámenes DRE y BIOP NO son independientes

El que sean independientes (es decir, las variables no están relacionadas) significa que el resultado de un examen no nos dice nada sobre el resultado del otro examen ... en nuestro caso, el DRE no nos dice nada sobre el cáncer.

Procedimiento:

Caso 6.5



iii) valor crítico para :r = número de filas - Presencia del cáncer (SI/NO)c = número de categorías – Resultado del examen (SI/NO)

X 2,

X 20,05;1 = 3,841

Procedimiento :

Caso 6.5

Resultados de la Biopsia y del examen DRE, obtenidos simultáneamente

DRE

+ - total

+ 68 27 95

- 117 89 206

total 185 116 301

BIOP

Caso 6.5




cálculo de fespij

n

ji CRijespf

Caso 6.5

DRE

+ - total

+ 185*95 116*95 95

301 301

- 185*206 116*206 206

301 301

total 185 116 301

Cálculos de las frecuencias esperadas - fespij - para la Biopsia y examen DRE

BIOP

Caso 6.5

Frecuencias esperadas - fespij - para la Biopsia y examen DRE

DRE

+ - total

+ 58,4 36,6

- 126,6 79,4

total

BIOP

Caso 6.5

043,1654,0263,2418,12

378,52

6,36

5,06,3627

4,58

5,04,586822

2

4,79

5,04,7989

6,126

5,06,12611722

Caso 6.5

conclusión:


tabulado se rechaza la H0 de independencia. Entonces, el resultado del examen DRE nos da alguna información acerca de la presencia del cáncer de próstata (están de algún modo relacionados)

X 20,05;1 = 3,841


Caso 6.5

11. mi ii sesión 11, 2008 met.investigacion

Education