daniels capítulo 6 bioestadística: base para el análisis de las ciencias de la salud . daniel...

53
6.1 6.2 6.3 6.4 6.5 6.6 6.1 INTRODUCCION INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACION DISTRIBUCION t INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLAC.ONALES INTERVALO DE CONFIANZA PARA LA PROPORCION DE UNA POBLACION INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE LAS PROPORCIONES DE DOS POBLACIONES INTRODUCCION 6.7 6.8 6.9 ·6.10 6.11 DETERMINACION DEL TAMANO DE LA MUESTRA PARA LA ESTIMACJON DE LAS MEDIAS DETERMINACION DEL TAMANO DE LA MUESTRA PARA LA ESTIMACION DE LAS PROPORCIONES ' v INTERVALO DE CONFIANZA PARA LA VARIANCIA DE . POBLACIONES CON DISTRIBUCION NORMAL INTERVALQ DE CQNFIANZA PARA LA RAZON DE LAS VARIANCIAS DE DOS POBLACIONES CON DISTRIBUCION NORMAL RESUMEN En capitulo se analiza la estimaci6n, que es la primexa de las dos areas generales de la inferepcia estadistica. La segunda area general, pr,uebas de hipotesis, se estudia en el siguiente capitulo.- . En el capItulo I se define la inferencia estadfstica de la siguiente manera: DEFINICION La inferencia estadistica es el proeedimiento por medio del eual se'llega a eonclusiones aeerea de una poblaci6n coli base en la inforIllaci6n que se obtiene a partir de una muestra seleecionadade esa poblaei6n. EI proceso de estimacion implica calcular, a partir de los datos de una muestra, alguna estadfstica que se ofrece como una aproximacion del panimetro correspondiente de la poblacion de la cual fueextraida la muestra. EI razonamiento en el que se basa la estimacion en el campo de las ciencias de la salud se apoya en la suposicion de que los trabajadores tengan interes en 150

Upload: carolina-andrea-giuffra-godoy

Post on 28-Jul-2015

5.578 views

Category:

Documents


40 download

TRANSCRIPT

61

62

63

64

65

66

61

INTRODUCCION

INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACION

DISTRIBUCION t

INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACONALES

INTERVALO DE CONFIANZA PARA LA PROPORCION DE UNA POBLACION

INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE LAS PROPORCIONES DE DOS POBLACIONES

INTRODUCCION

67

68

69

middot610

611

DETERMINACION DEL TAMANO DE LA MUESTRA PARA LA ESTIMACJON DE LAS MEDIAS

DETERMINACION DEL TAMANO DE LA MUESTRA PARA LA ESTIMACION DE LAS PROPORCIONES v

INTERVALO DE CONFIANZA PARA LA VARIANCIA DE

POBLACIONES CON DISTRIBUCION NORMAL

INTERVALQ DE CQNFIANZA PARA LA RAZON DE LAS VARIANCIAS DE DOS POBLACIONES CON DISTRIBUCION NORMAL

RESUMEN

En est~ capitulo se analiza la estimaci6n que es la primexa de las dos areas generales de la inferepcia estadistica La segunda area general pruebas de hipotesis se estudia en el siguiente capitulo- En el capItulo I se define la inferencia estadfstica de la siguiente manera

DEFINICION

La inferencia estadistica es el proeedimiento por medio del eual sellega a eonclusiones aeerea de una poblaci6n coli base en la inforIllaci6n que se obtiene a partir de una muestra seleecionadade esa poblaei6n

EI proceso de estimacion implica calcular a partir de los datos de una muestra alguna estadfstica que se ofrece como una aproximacion del panimetro correspondiente de la poblacion de la cual fueextraida la muestra

EI razonamiento en el que se basa la estimacion en el campo de las ciencias de la salud se apoya en la suposicion de que los trabajadores tengan interes en

150

151 61 INTRODUCCION

parametros como la media y la proporci6n de varias poblaciones Si este es el caso existe una buena razon por la que se debe confiar en los procedimientos de la estimacion para obtener informaci6n respecto a dichos parametros muchas poblaciones de interes aunque finitas son tan grandes que el costo de un estudio

del 100 por ciento seria prohibitivo Suponga que al administrador de un gran hospital Ie interesa saber la edad

promedio de los pacientes internados en el transcurso de un ano Es posible que considere demasiado laborioso consultar el registro de cada paciente internado en el transcurso de ese ano y en consecuencia decide examinar una muestra de los registros a partir de la cual sea posible calcular una estimaci6n de la edad

promedio de los pacientes internados en ese ano Un medico general puede estar interesado en saber que proporcion de

cierto tipo de individuoStratados con un determinadomedicamento presentan efectos secundarios indeseables Sin duda su idea de poblaci6n consiste en todas aquellas personas que alguna vez han sido 0 seran tratadas con este medicamenshyto Aplazar una conclusion hast a haber observado a la poblaci6n completa podria tener efectos adversos en el ejercicio de su profesion

Estos dos casos ejemplifican el in teres por estimar la media y la proporcion de una poblacion respectivamente Otros parametros cuya estimacion se estudia

en estecapftulo son la diferencia entre dos medias entre dos proporciones la variancia de la poblaci6n y la razon de dos variancias

Se encontrara que para cada uno de los parametros estudiados es posible calcular dos tipos de estimaci6n estimaci6n puntual y estimaci6n por

bullintervalos

DEFINICION

Una estimaci6n puntual es un solo valor numerico utilizado para estimarelmiddotpanimetro correspondiente de la poblaci6n

DEFINICION

Una estimaci6n POT intervalos consta de dos valores numericos que definen un intervalo que con un grado especifico df confianza se considera que incluye al parametro por estimar

Estos conceptos se explican en las secciones siguientes

152 CAPITULO 6 ESTlMACION

Eleccion del estimador adecuado Esconveniente notar que se ha dado el nombre de estimacion a un solo valor calrulado La regIa para calrular este valor a estimaci6n se conoce como estimador Los estimadores generalmente se presentan como f6rmulas Por ejemplo

n

es un estimador de la media de la poblaci6n )t El valor numerico individual que resulta de la evaluaci6n de esta f6rmula se canoce como estimaci6n del parametro )t

En muchos casos es posible estimar un panimetro por media de mas de un estimador Par ejemplo se puede utilizar la mediana de la muestra para estimar la media de la poblaci6n ~C6mo decidirentonces que estimador se debe utilizar para estimar un parametro en particular La decisi6n se basa en criterios que reflejan la bondad de los estimadores partirulares Cuando se miden contra estos criteshyrios algunos estimadores son mejores que otros Uno de estos criterios es la propieshydad de ser insesgado

DEFINICION

Se dice queun estimador por ejemplo T para el parametro () es un estimador insesgado de () si E(T) = ()

E(T) significa el valor esperado de Tn Para una poblaci6n fmita E(T) se obtiene tomando el valor promedio de T calculado a partir de todas las muestras posibles de un tamafto dado que puedan extraerse de la poblaci6n Es decir E(T)= I-lr Para una poblaci6n infinita E(T) se define en terminos del calculo matematico

En el capitulo anterior se via que la media de la muestra y la proporci6n de la muestra la diferencia entre las medias de dos muestras la diferencia entre las proporciones de dos muestras son cada una estimadores insesgados de sus parametros correspondientes Esta propiedad qued6 implfcita ruando se dijo que los parametros eran las medias de lasdistribuciones del muestrco correspondienshytes Por ejemplo dado que la media de la distribuci6n mliestral de x es igual a )t se sabe que x es un estimador insesgado de )t En este libra no se estudian los otros criterios para un buen estimador Ellector interesado los encontrara detashyllados en muchos libras de estadfstica matematka

Poblaciones muestreatlnS y poblaciones objetivo EI investigador en el area de la salud que utiliza los procedimientos de inferentia estadfstica debe estar al tanto de las diferencias entre dos tipos depoblaci6nla poblacion muestreada y la poblaci6n objetivo

DEFINICION

La poblacion muestreada es la poblacion de la cual se extrae unamuestra

153 61 INTRODUCCION

DEFINICION

La poblacion objetivo es la poblacion de la que se pretende hacer una inferencia

Estas dos poblaciones pueden ser las mismas a no Los pracedimientos de inferencia estadfstica permiten inferir respecto a las poblaciones muestreadas (siemshypre y cuando se hayan utilizado los metodos de muestreo correctos) Solo cuando la poblacion objetivo y la poblacion muestreada son las mismas es posible utilizar pracedimientos de inferencia estadfstica para llegar a conclusiones acerca de la poshyblaci6n objetivo Si la poblacion muestreada y la poblacion objetivo son diferenshytes el investigador puede llegar a conclusiones respecto a la poblaci6n objetivo solo can base en consideraciones no estadisticas

Par ejemplo suponga que un investigador quiere estimar la eficacia de un metoda para tratar la artritis reumatoide La poblaci6n objetivo esta formada por todos los pacientes que sufren esta enfermedad y no es practico extraer una mliestra de esta poblacion Sin embargo el investigador puede extraer una muestra de toshydos los pacientes can artritis reumatoide de alguna clfnica especifica Estos pacienshytes constituyen la poblacion muestreada y si se utilizan metodos de muestreo adecuados es posible hacer inferencias respecto a esta poblacion muestreada con base en la informacion de la muestra Si el investigador qui ere hacer inferencias acerca de todos los pacientes con artritis reumatoide debe utilizar metodos no estadfsticos Quiza el investigador sepa que la poblaci6n muestreada es similar can respecto a todas las caracteristicas importantes a la poblacion objetivo Es decir es posible que el investigador sepa que edad sexo gravedad de enfermedad tiempo de evolucion deesta asf como otras datos son similares en ambas poblaciones Y con base en esteconocimiento el investigador puede extrapolar sus descubrimienshytos ala poblacion objetivo

En muchos casas la poblacion muestreada y la poblaci6n objetivo son identishycas y cuando esto ocurre las inferencias en torno a la poblacion objetivo son direcshytas Sin embargo el investigador debe estar consciente de que este no siempre es el caso a fin de no caer en la trampa de hacer inferencias err6neas respecto a una poblacion diferente de la que ha sid a muestreada

Muestras alealarias y na alealarias En los ejemplos y ejercicios de este libra se supone que los datos analizados pravienen de muestras aleatorias La esshytricta validez de los pracedimientosestadisticos estudiados depende de esta suposishycion En muchos casas en las aplicaciones reales es imposible a impractico utilizar muestras verdaderamente aleatorias En experimentos con animales par ejemplo los investigadores frecuentemente utilizan cualquier animal cori el que cuenta el proveedor a su prapia raza de crianza Si los investigadores tuvieran que depender de materialseleccionado al azar se llevaria a cabo muy poca investigacion de este tipo Una vez mas las consideraciones no estadfsticas deben tamar parte en el praceso de generalizacion Los investigadores pueden afirmar que las muestras realmente utilizadas equivalen a muestras aleatorias simples dado que no hay rashy

154 CAPiTULO 6 ESTIMACIOl

zon para creer que el material utilizado no es representativo de la poblacion de la que se desea hacer inferencias

En muchos proyectos de investigacion en el area de la salud se utilizan muestras de conveniencia en lugar de muestras aleatorias Puede ser que los investigadores tengan que confiar en voluntarios 0 en personas disponibles como los estudiantes de su clase Nuevamente se debe hacer generalizaciones con base en consideraciones no estadisticas Sin embargo las consecuencias de dichas generalizaciones pueden ser utiles 0 pueden clasificarse desde erroneas hasta desastrosas

En algunos casos puede aplicarse aleatoriedad en un experimento aun cuanshydo los individuos disponibles no sean seleccionados aleatoriamente de alguna poshyblacion bien definida Al comparar dos tratamientos por ejemplo a cada individuo se Ie puede asignar aleatoriamente uno u otro de los tratamientos Las inferencias en tales casos se aplican a los tratamientos y no a los individuos y en consecuencia dichas inferencias son vaUdas

62 INTERVALO DE CONFIANZAPARA LI MEDIA DE UNA POBLICION

Suponga que un grupo de investigadores quiene estimar la media de una poblaci6n que sigue una distribucion normal Para ello extraen una muestra aleatoria de tamafio n de la poblacion y ca1culan el valor de x el cual utilizan como una estimashycion puntual de 11 Aunque este estimador de 11 posee todas las cualidades de un buen estimador se sabe que debido a los caprichos del muestreo aleatorio no se puede esperar que x sea igual a 11

Por 10 tanto serfa mucho mas significativo estimar 11 mediante un intervalo que de alguna forma muestre su probable magnitud 11

DistribuciOn muestral y estimaci6n Para obtener dicha estimacion por intervalos se debe aprovechar el conocimiento acerca de las distribuciones muestrales En este caso puesto que el interes esta en la media de la muestra como estimador de la media de una poblacion es necesario recordar 10 que se sabe resshypecto a la distribucion muestral de la media de la muestra

En el capitulo anterior se aprendio qu~ si el muestreo se realiza a partir de una pohlacion con distribucion normal la distribucion muestral de la media de la muestra presenta una distribucion normal con una media Ilx igual a la media de la poblacion 11 y variancia cr igual a cron Se podrfa graficar la distribucion muestral si se supiera en que lugar del eje xse localiza Con base en el conocimiento adquishyrido acerca de la distribucion normal en general se sabe aun mas sobre la distribushyci6n de xpara estecaso Por ejemplo se sabe que sin irilportar d6nde se localizan aproximadamente 95por ciento de los valores posibles de que constituyen la distribuci6n estan ados desviaciones estandarrespecto a la media Los dos puntos que estan ados desviaciones estandar de la media son 1l-2crx y 1l+2crx de tal manera que el intervalo de 11 plusmn2cr contendra aproxil11adamente 95 por ciento dex los valores posibles de x Aunque 11 y Ilx son desconocidas arbitrariamente se puede poner la distribuci6n muestral de x sobre eleje x

Dado que se desconoce el valor de 11 la expresion )i plusmn 2crx no dice mucho Sin embargo se tiene una estimaci6n puntual de 11 que es x (Resultaria uti obtener un intervalo en tomo a esta estimaci611 puntual de Il La respuesta es S1 Suponga

62 INTERVALO DE CONFIANZA PARA LA MEDIA DE UNAPOBLACION 155

a2 a2

FIGUR4 621 Intervalo de confianza de 95 por dento para l

que se forman intervalos a partir de todos los valores posibles de x cakulados a partir de todas las niuestras posibles de tamafio n de la poblacion de interes De esa forma se tendrfa un gran numerode intervalos de la forma xplusmn2crx con amplitushydes todas igtiales a la del intervalo en torno a lall desconocida Aproximadamente 95 por ciento de estos intervalos tendria centros que caen dentro del intervalo plusmn2crx en torno a 11 Cada uno de estos intervalos que caen dentro de 2cr en torno a 11 pueden contener ala misma 11 Estas ideas se muestran en la figura 621 En dicha figura se observa que xl XiY x4 caen dentro del intervalo 2cr en torno allY en consecuencia los intervalos 2cr alrededor de las medias de la muestra induyen el valor de IJ Las medias muestrales y Xs no caen derttro del intervalo 2cr en torno a IJ y los intervalos de 2crx en torno a ellas no incluyen a IJ

FJElIPLO 621 Suponga que un investigador interesado en obtener una estimacion del nivel promeshydio de alguna enzima en cierta poblacion de seres humano toma una muestra de 10 individuos determina elnivel de la enzima en cada uno de elIos y calcula la media de la muestra x 22 Ademas que la variable de interes sigue una distribucion aproximashydamente normal con una variancia de 45 Se desea estimar el valor de 11

Solucion Un intervalo de confianza de aproximadamente 95 por dento para 11 esta dado por

xplusmn2cr 22plusmn2 Gi10 22 plusmn2(21213) 17762624 bull

156 CAPITULO 6 ESTIMACION

Componentes para la estimaciOn del intervalo Examine la composishycion para la estimacion del intervalo elaborada en el ejemplo 621 Este contiene en su centro la estimacion puntual para 11 Se identifica a 2 como un valor de la distribucion normal estandar que indica a cuantos errores estandar estan aproxishymadamente 95 por ciento de los valores posibles de x Este valor de Z se conoce como coeficiente de confiabilidad EI ultimo componente (ix es el error estandar 0

desviacion estandar de la distribucion muestral de x En general una estimacion por intervalos se expresa como sigue

estimador plusmn (coeficiente de confiabilidad) x (error estandar) (621)

En particular cuando el muestreo se realiza a partir de una distribucion norshymal con variancia conocida una estimacion por intervalos para Jl se expresa como

donde z(l_lt12) es el valor de Z a la izquierda de donde esta 1 rtJ2 y ala derecha en que se encuentra rtJ2 del area bajo la curva

Interpretacion del intervalo de conftarua ~Como se interpreta el intershyvalo de la ecuacion 622 En este ejemplo donde el coeficiente de confiabilidad es igual a 2 se dice que al repetirel muestreo aproximadamente 95 por ciento de los intervalos construidos mediantela formula 622 induyen la media de la poblacion Esta interpretacion se basa en la probabilidad de ocurrencia de diferentes valores de x Es posible generalizar esta interpretacion si se designael area total blttio la curva de x que queda fuera del intervalo Jl plusmn 2(ix como ex y eIarea dentro del intervalo como 1 - ex y dar la siguiente interpretaciOn probabilistica de la formula 622

Interpretaci6n probabilistica

En el muestreo repetido de una poblaci6n condistribuci6n normal y desviaci6n estdndafmiddot conocida 100(1- a) por ciento de todos los intervalos de la forma Xplusmn Z(I_amOx incluyen a la larga la media de la poblaci6n 11

Ala cantidad 1 - (X en este caso 95se Ie conoce como eoeficiente (0 nivel) de conjianza y al intervalo XplusmnZ(1_12)(ix se Ie conoce comointervalo de conjianza para Jl Cuando (1 ex) =95 al intervalo se Ie llama intervalo de confianza de 95 por ciento para Jl En este ejemplo se dice que existe 95 por ciento de confianza d~ que la media de Ia poblacion este entre 1776 y 2624 A esto se Ie llama interpretacion practica de la formula 622 En general se puede expresar de la siguiente manera

Interpretaci6n practica

Cuando se hace un muestreo a partir de poblaciones que siguen una distribuci6n normal y con desviaci6n estdndar conocida existe un 100(1 - a) por ciento de confianza de que el intervalo calculado xplusmn z(l_aI2)Ox contiene la media de la poblaci6n Jl

62 INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACION 157

En el ejemplo 621 es preferible en lugar de 2un valor mas exacto para z 196 que corresponde al coeficiente de confianza de95 Los investigadores pueshyden utilizar cualquier coeficiente de confianza los mas utilizados son 90 95 Y 99 a los cuales se asocian factores de confiabilidad de 1645 196 Y 258 respectivashymente

Precision A la cantidad que se obtiene al multiplicar el factor de confiabilidad por el error estandar de la media se Ie llama precision de la estimaci6n Tambien se Ie llama margen de error

EJEMPLO 622

Un fisioterapeuta desea estimar con 99 por ciento de confianza la media de fuerza maxima de un musculo particular en cierto grupo de individuos Se inc1ina a suposhyner que los valores de dicha fuerza muestran una distribucion aproximadamente normal con una variancia de 144 Una muestra de 15 individuos que participaron en el experimento presento una media de 843

Soluci6n En latabla D el valor para z que corresponde a un coeficiente de conshyfianza de 99 es 258 Este es el coeficiente de confiabilidad El error estandar es de ax 12fl5 =30984 Por 10 tanto el intervalo de conshyfianza de 99 por ciento para ~ es

843 plusmn258(30984) 843 plusmn 80 763923

Se dice que se tiene 99 por ciento de confianza de que la media de la poblacion este entre 763 y 923 porque al repetirel muestreo 99 por ciento de todos los intervalos que pueden construirse en la forma descrishyta inc1uyen a la media de la poblacion bull

Situaciones en las que la variable de interes sigue una distribucion aproximadashymentenormal con una variancia conocida son muy raras y casi nunca se presentan en la practica El prop6sito de los ejemplos anteriores en los que se supone que existe esta condici6n ideal fue el de formar las bases teoricas para construir intershyvalos de confianza para las medias de la poblacion En la mayorf de los casos practicos las variables no siguen una distribuci6n aproximadamente normal 0 no se conocen las variancias de la poblaci6n 0 suceden ambas cosas En el ejemplo 623 y en la secci6n 63 se explican los procedimientos que se utilizan en situaciones menos ideales pero mas comunes

Muestreo a partir de pobluciunes que no presenlan una distribucion normal No siempre es posible 0 prudente suponer que la poblaci6n de interes muesshytra una distribuci6n normal Gracias al teOlema del limite central esto no sera un problema si se puede seleccionar una muestra 10 suficientemente grande Se ha dicho que para muestras grandes la distribucion muestral de Xi presenta una distribuci6n aproximadamente normal sin importar como esta distribuida la poblacion original

158 CAPiTULO 6 ESTIMACION

EJEMPLO 623

Un equipo de investigadores esta interesado en la puntualidad de los pacientes en las citas concertadas En un estudio de flqjo depacientes en los consultorios de medicos generales se encontr6 que una muestra de 35 pacientes llegaba 172 minutos tarde a las citas en promedio Una investigaci6n previa habia demostrado que la desviaci6n estandar era de 8 minutos aproximadamente Se tuvo la sensaci6n de que la distribushyci6n de la poblaci6n no era normal ~Cual es el intervalo de confianza de 90 por ciento para 11 que es el promedio real de impuntualidad en las citas

Soluci6n Dado que el tamafio de la muestra es bastante grande (mayor que 30) y se conoce la desviaci6n estandar de la poblaci6n la situaci6n se aproxishyrna al teorema del limite central y se supone que la distribuci6n muestral de xpresenta una distribud6n aproximadamente normal AI consultar la tabla D se encuentra que el coeficiente de confiabilidad que corresponshyde a uri coeficiente de confianza de 90se aproxima a 1645 si se interpola El error estandar es de C5z 8-35 13522 de modo que el intervalo de confianza de 90 por ciento para 11 es

172 plusmn 1645(13522) 172 plusmn 22 150 194 bull

Con frecuencia cuando la muestra es 10 suficientemente grande para aplicar el teorema dellfmite central la variancia de la poblacion se desconoce En ese caso se sustituye esta variancia conla de la muestra en la f6rmula para construir el intervashy10 de confianza para la media de la poblacion

Andlisispor computadora Cuando se requiere de los intervalos de confianza se economiza una buena cantidad de tiempo mediante el uso de una computadora la cual puede ser programada para construir los intervalos de datos no procesados

EJEMPLO 624

Los siguientes datos corresponden a los valores de la actividad (micromoles por minuto por gramo de tejido) de cierta enzima medida en el tejido gastrico normal de 35 pacientes con carcinoma gastrico

60 1189 614 788 273 2464 571 1827 537 374 449 262 448 971

372 898 411 348 1925 550 622

610 319 406 413 767 385 674

521 603 533 662 1177 307 1499

Mediante el uso del paquete de software para computadora MINITAB se pretenshyde construirun intervalo de confianza de 95 por ciento para la media de la poblashycion Suponga que la variancia de la poblaci6n es iguala 36 No es necesario suponer que la poblaci6n muestreada de val ores sigue una distribuci6n normal porque el tamafio de la muestra es losuficientemente grande para aplicar el teoreshyrna del limite central

159 62 INTERV ALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACION

Caja de dialogo Comandos de la sesi6n

Statgt Basic Statisticsgt 1-Sample z MTB gt ZINTERVAl 95 6 C1

Teclear Cl en Variables Se1ecdonar Confidence interval y teclear 95 en la caja de texto Teclear6 en Sigma Clic OK

Resultados

Confidence Intervals

The assumed sigma = 0600

Variable MicMoles

N 35

Mean 0718

StDev 0511

SE Mean 0101

950 Cr (0519 0917)

FIGURA 622 Procedimiento del paquete MINITAB para construir un intrevalo de conshyfianza de 95 por ciento para la media de la poblacion ejemplo 624

Solucion Se introducen los datos en lacolumna 1 y se procede como se muestra en la figura 622 Estas instrucdones indican a la computadora que e1 factor de confiabilidad es z que se necesita unintervalo de conshyfianza de 95 por dento que la desviaci6n estandarde la poblaci6n es de 6 y que los datos estan en la columna 1 El resultado indica que la media de la muestra es 718 la desviad6n estandar es 511 y e1 error estandar de la media af es 6J35 101

Se tiene 95 pordento middotde confianza de que la media de la poblashyci6n se encuentra entre 519y 917 bull

Puede obtenerse los intervalos de confianza a traves de otros paquetes de sofuvare Por ejemplo SASreg puede construir intervalos de confianza a traves de PROC MEANS o PROC UNIVARIATE

Otras eslimaciones de La tendencia central Tal como se ha visto la meshydia es muy sensible a los val ores extremos es dedr aquellos que se desvfan consideshyrablemente de la mayorfa de las mediciones en el con junto de datos A dichos valores se les conoce como sesgos Tambien se puede apreciar que lamediana que no es sensible a las mediciones extremas algunas veces se utiliza en lugar de la media como medida de tendenda central cuando los sesgos estan presentes Por la misshyrna raz6n quiza se prefiera el uso de la mediana de la muestra comomiddotestimador de la rnediana de la poblaci6n cuando se requiere realizar inferencias acerca de la tendenda central de la poblaci6n No solamente se utiliza la mediana de la muestra

160 CAPITULO 6 ESTlMACION

como una estimacion puntual para la mediana de la poblacion sino que tambien es posible construir un intervalo de confianza para la mediana de la poblacion En esta obra no se proporciona la formula pero esta se puede encontrar en la obra de Rice (1)

Media ajustada Los estimadores que son insensibles a los sesgos se Haman estimadores eficaces Otra medida y estimador eficaz de tendencia central es la media ajustada Para un conjunto de datos que contiene n mediciones se calcula el 1000 por ciento de la media ajustada como sigue

1 Ordenar las mediciones

2 Descartar las medici ones mas pequeiias y mas grandes que 100a por ciento de las mediciones El valor recomendado para a esta entre 1 y 2

3 Calcular la media aritmetica de las mediciones restantes

Observe que la mediana podrfa considerarse como 50 por ciento de la media ajusshytada Se debe recordar que la media ajustada para el conjunto de datos es una de las medidas descriptivas que puede calcular MINITAB

FJERCICIOS

Construya para cada uno de los siguientes ejercicios los intervalos de confianza al 90 95 Y 99 por ciento para la media de la poblacion y establezca para cada uno la interpretacion probabilistica y practica Indique cualinterpretacion puede ser mas aderuada para utilizar ruando se trata sobre intervalos de confianza con alguien que no conoce de estadfstica y establezca eI razonamientode por que se eUgi6 Explique por que los tres intervalos no tjenen la misma amplitud Indique cual de los tres intervalos es preferible como estimador de la media de la poblacion y establezca el razonamiento de la elecci6n

621 Se pretende estimar el numero promedio de latidos del coraz6n por minuto para cierta poblaci6n Se encontr6 que el numero promedio de latidos por minuto para 49 personas era de YO Considere que esos 49 pacientes constituyen una muestra aleatoria y que la poblacion sigue una distribucion normal con una desviaci6n estandar de 10

622 Se pretende estimar la concentraci6n media de bilirrubina indirecta en el suero en nmos de cuatro dias de nacidos La media para una muestra de 16 ninos es de 598 mglOO cc Conshysiderese que la concentraci6n de bilirrubina en los ninos de cuatro dfas de nacidos sigue una distribucion aproximadamente normal con una desviaci6n estandar de 35 mgIOO cc

623 En un estudio acerca de la duraci6n de la hospitalizacion dirigido por vados hospitales en cooperacion se extrajo una muestra aleatoria de 64 individuos con ulcera peptica de la lista de todos los pacientes con esa enfermedad internados alguna vez en los hospitales particishypantes Se determin6 para cada uno de eUos el tiempo de hospitalizaci6n Se encontr6 que la duraci6n media de hospitalizaci6n fue de 825 dfas y se sabe que la desviaci6n estandar de la poblaci6n es de tres dfas

624 Una muestrade 100 hombres adultos aparentemente sanos de 25 anos de edad muestra una presi6n sist61ica sangufnea media de 125 Considere que la desviaci6n estandar de la poblaci6n es de 15

161 63 DISTRIBUCI6N

625 Algunos estudios acerca de la enfermedad Alzheimer (EA)han mostrado un incremento en la producci6n de 14C0

2 en pacientes con ese padecimiento Durante un estudio se obtuvieshy

ron los siguientes valores de 14C02

a partir de 16 biopsias de neocorteza de pacientes con la enfermedad (EA)

1009 1280 1180 12551547 2352 1956 1080

1776 1767 1680 2050 1452 2857 3100 1621

Considereseque la poblaci6n sigue una distribuci6n normal con una desviaci6n estandar de 350

63 DISTRIBUCION t

En la seccion 62 se describe un procedimiento para obtener un intervalo de conshyfianza para la media de una poblaci6n EI procedimiento requiere del conodmiento de la varianda de la poblacion de la que se extrae la muestra Puede parecer un tanto extrafio que se tenga conocimiento de lavariancia de la poblacion y no se conozca elvalor de la media de la poblacion De hecho es comun en situacioshynes como las que se han presentado que se deSconozca tanto la variancia como la media de la poblacion Esta situacionpresenta un problema respecto a la construcshycion delos intervalos de confianza Por ejemplo aun cuando la estadfstica

x J1shyZ=---

crJn presenta una distribudon normal cuando la poblacion tambien tiene una distribuci6n normal y sigue una distribuci6n aproximadamente normal cuando n es muy grande independientemenle de la forma funcional de la poblacion no se puede hacer uso de este hecho porque cr se desconoce Sin embargo no todo esrn perdido y la soluci6n mas logica para este problema es utilizar la desviacion estandar de ~muestra

s = ~L(Xi - x)2(n-l)

para sustituir cr Por ejemplo cuando el tamafio de la muestra es mayor que 30 la confianza en s como una aproximacion de cr es por 10 general sustancial por 10 que se justifica la utilizacion de la teorfa de la distribudon normal para construir un intervalo de confianza para la media de la poblacion En tal caso se procede como se indica en la seccion 62

Cuando se tienen muestras pequefias es imprescindible encontrar otro proceshydimiento para construir intervalos de confianza

Como resultado del trabajo de Gosset (2) escrito bajo el seudonimo de Student se dispone de otra alternativa conocida como distribuci6n t de Student con frecuenda abreviada como distribuci6n t

La cantidad

sigue esta distribucion

162 CAPiTULO 6 ESTIMACION

Propiedades de la distribucion t La distribuci6n t tiene las siguientes proshypiedades

1 Tiene una media de O

2 Es simetrica con respecto a la media

3 En general tiene una variancia mayor que 1 pero esta tiende a I a medida que aumenta el tamaiio de la muestra Para dfgt 2 la variancia de la distribushyci6n t es dfl(df - 2) donde df representa los grados de libertad En forma alterna puesto que df n - 1 para n gt 3 se puede escribir la variancia de la distribuci6n t como (n l)(n 3)

4 La variable t va de - hasta + 00DO

5 La distribuci6n t es realmente una familia de distribuciones puesto que hay una distribuci6n diferente por cada valor de la muestra de n - 1 que es el divisor que se utiliza para ca1cular S2 Recuerde que n - 1 representa los grados de libertad En la figura 631 se muestran las distribuciones t correspondienshytes a algunos valores de los grados de libertad

6 Comparada con la distribuci6n normal ladistribuci6n t es menos espigada en el centro y tiene colas mas largas En la figura 632 se com para la distribushyci6n t con la distribuci6n normal

7 La distribuci6n t se aproxima ala distribuci6n normal a medida que n - 1 se aproxima al infinito

La distribuci6n t al igual quela distribuci6n normal estandar se ha tabulado ampliamente Una de estas tablas es la tabla E del apendice Tal como se puede apreciar se debe tomar en cuenta eLcoeficiente de confianza y los grados de libershytad cuando se utiliza la tabla de la distribuci6n t

FIGUR- 631 Distribuci6n t para diferentes grados de libertad

-----

163 63 DISTRIBUCION

__ Distribucion normal

- - - Dislribucion I

x

FIGURA 632 Comparaci6n de las distribuciones normal yt

Es posible utilizar el paquete MINITAB para graficar la distribuci6n t (para grados espedficos de libertad) y otras distribuciones Despues de asignar el eje horizontal y las siguientes direcciones en el cuadro de Set Patterned Data seleccioshyne del menu Calc y despues Probability Distributions Utilice el cuadro de diashylogo Plot para generar la grafica

Inlervalos de conJiQllia qllR uJilban fa dislribucion t El procedimien to general para construir interval os de confianza no se ve afectado por la necesidad de utilizar la distribuci6n t en lugar de la distribuci6n normal estandar Aun es necesario usar la relaci6n expresada por

estimador plusmn (coeficiente de confiabiIidad) x (error estandar)

Lo que es diferente es el origen del coeficiente de confiabilidad Este se obtiene a partir de la tabla de la distribucion t en lugar de la tabla de la distribuci6n normal estandar Para ser mas especfficos cuando se obtienen muestras a partir de una distribushycion normal cuya desviaci6n estdndi17 a se desconoce ell OO( 1 - a) por ciento del intervalo de confianza para la media de la poblaci6n J1 estd dado por

(631 )

Es importante aclarar que el requisito para el uso valido de la distribucion t es que la muestra debe ser extrafda de una poblad6n con distribucion normal Sin embarshygo la experiencia ha demostrado que se pueden tolerar desviaciones moderadas de esterequisito Como consecuencia la distribucion t se utiliza incluso cuando se sabe que la poblaci6n original se desvia de la normalidad Lltl mayorfa de los invesshytigadores requieren que al menos pueda sostenerse el supuesto de una distribushyd6n de poblacion en forma de montfculo

EJEMPLO 631

Maureen McCauley (A-I) realiz6 un estudio para evaluar los efectos de un conjunto de instrucciones de mecanica en ellugar de labores sobre el desempeno laboral de obreros jovenes recientemente contratados Se utilizaron dos grupos de individuos elegidos aleatoriamente uno de los grupos para aplicar el experimento y el otro

164 CAPITULO 6 ESTlMACI6N

como grupo de control EI grupo con el que se experimento recibio una hora de capacitacion impartida por un terapeuta ocupacional EI grupo de control no recishybio esta capacitacion Para evaluar el esfuerzo de cada obrero para levan tar bajar jalar y transportar objetos dentro del entorno laboral se utilizo una lista de cotejo para la evaluacion de trabajo mecanico que inclufa criterios de referencia Una tarea bien hecha recibio una calificacion de 1 EI grupo de control formado por 15 individuos alcanzo una calificacion media de 1153 en la evaluacion con una desshyviacion estandar de 3681 Se supone que el grupo de control se comporto como una muestra aleatoria extraida de una poblacion similar de individuos Se pretende utilizar los datos de la muestra para estimar la calificacion media para la poblacion

Soluci6n Se puede utilizar la media de la muestra 1153 como una estimacion puntualde la media de la poblacion sin embargo debido a que se descoshynoce la desviacion estandar de la poblacion se debe considerar que los valores siguen una distribucion aproximadamente normal antes de consshytruir los intervalos de confianza para l Se considera que esta suposicion es razonable y que se necesita un intervalo de confianza de ~or cienshyto el estimador es i y el error estandar es s -r 681 15 =9504 Ahora es necesario conocer el coeficiente de confiabilidad el valor de t asodado al coeficiente de confianza de 95 y a los n 1 = 14 grados de libertad Puesto que el intervalo de confianza de 95 por ciento deja 05 del area bajo la curva de t para dividirse en dos colas iguales se necesita el valor de tala derecha del cual esta el 025 del area Este valor se localiza en la tabla E enla columna encabezada por t

975 bull Este es el valor

para tala izquierda delcual esta 975 del area bajo la curva EI area a la derechade este valor es igual al 025 deseado Ahora sobre la columna de grados de libertad se localiza el numero 14 EI valor para t se encuentra en la interseccion del renglon con la etiqueta 14 y la columna con la etiqueta t975 bull Se encuentra que este valqr para t que representa al coeficiente de confiabilidad es 21448 Finalmente el intervalo de confianza de 95 por ciento se construye como sigue

1153 plusmn 21448(9504) 1153 plusmn 204 949 1357 bull

Este intervalo puede interpretarse con ambos puntos de vista probabiHstico y practico Puede asegurarse en un 95 por dento que 1a media l correcta de la poblacion se encuentra entre 949 y 1357 porque al repetir el muestreo 95 por dento de los intervalos construidos deigual manera incluyen a l

Decidir entre z r t Cuando se obtiene un intervalo de confianza para la media de una poblacion se debe decidir si se utiliza un valor de z6 de t como factor de confiabilidad Para hacer una elecci6n adecuada se debe considerar el tamafto de la muestra si la poblacion muestreada sigue una distribucion normal y si la varian cia de la poblacion es conocida La figura 633 muestra un diagrama de flujo que se puede utilizar para decidir rapidamente si el factor de confiabilidad debe ser Z 0 t

EJERCICIOS 165

EJERCICIOS

Sa aplica al leorema dellfmile central

FIGURA 633 Diagrama de flujo para deddir entre utililizar z y t cuando se hagan inferencias respecto a las medias de la poblaci6n (Para utilizar un procedimiento no parametrico vease el capitulo 13)

Analisis par computadara Si el proposito es construir un intervalo de conshyfianza con el programa MINITAB para la media de la poblacion cuando el estadfsshytico t es el factor de confiabilidad adecuado el comando se inicia con la palabra TINTERVAL Seleccione en Windows I-Sample t desde el menu de Basic Statistics

631 Utilice la distribud6n t para encontrar el factor de confiabilidad para el intervalo de confianshyza basado en los siguientes coeficientes de confianza y tamafiosde las muestras

a b c d

Coefidente de confianza 95 99 90 95 Tamafio de la muestra 15 24 8 30

632 En una investigacion acerca de la dependencia del flujo y volumen de todo el sistema respishyratorio en un grupo de pacientes con enfermedad obstructiva pulmonar cronica conectados a respiradores artificiales Tantucci et ai (A-2) registraron los siguientes valores de linea de

166 CAPITULO 6 ESTIMACION

base del flUjD continuo inspiratDriD (Us) 90 97 103110 104 100 CDnsidere que una muestra aleatDria simple esta cDnfDrmada pDr seis individuDs a partir de una pDblacion que sigue una distribuci6n nDrmal CDn individuDs CDn la misma enfermedad

a) ~Cuat es la estimaci6n puntual de la media de la pDblaci6n

b) ~Cuil es la desviacion estandar de la muestra

c) ~Cultll es la estimacion del error estandar para la media de la muestra

d) CDnstruya un intervalD de cDnfianza de 95 pDr ciento para el flUjD mediD cDntinuD inspishyratDriD de la pDblaci6n

e) ~Cual es la precision de la estimacion

f) Explique la interpretaci6n prDbabilistica para este intervalD de confianza

g) Explique la interpretacion practica para este intervalD de cDnfianza

633 LlDyd y MaillDux (A-3) informaron IDS siguientes datDs acerca del peso de la glandula pituitaria en una muestra de cuatrD ratas de Wistar Furth

media = 90 mg error estandar para la media = 3

FUEJTE Ricardo V Lloyd y Joe Mailloux Analysis ofSshy100 Protein Positive Folliculo Stellate Cells in Rat Pituitary Tissues AmericanJournal ofPathology 133 338-346

a) ~Cual es la desviadon estandar de la muestra

b) CDnstruya un intervalD de confianza de 95 pDr ciento para el peso medio de la glandula pituitaria para una pDblacion similar de ratas

c) ~Que supDsiciDnes se necesitan para que sea validD el intervalo de cDnfianza del inciso b

d) ~Que interpretacion puede ser la mas indicada cuandD se trata sDbre intervalos de conshyfianzacon alguien que no sabe de estadfstica Explique pDrque es la mas cDnveniente

e) 5i fuera necesario elabDrar un intervalD de cDnfianza de 90 pDr cientD para la media de la pDblaci6n ~el intervalD de cDnfianza serta mayDr 0 menor que el intervalD de 95 pDr dentD Explique su respuesta sin construir realmente el intervalD de cDnfianza

f) 5i [uera necesariD considerar un intervalo de CDnfianza de 99 pDr cientDpara lamedia de la poblacion ~el intervalo de cDnfianza serra mayDr 0 menDr que el intervalD de 95 pDr dentD Explique su respuesta sin cDnstruir realmentt el intervalD de cDnfianza

634 Kaminski y Rechberger (A-4) encontrarDn en un estudio sDbre la preeclampsia que la media de la presi6n sistolica sangufnea en 10 mujeres sanas y que no estan embarazadas es de 119 CDn una desviacion estandar de 21

a) 2Cual es el errDr estandar estimadD para la media

b) CDnstruya un intervalD de confianza de 99 pDr cientD para la media de la poblaci6n a partir de la cual puede considerarse que IDS 10 individuos conforman una muestra aleatoria

c) ~CUlil es la precisi6n estimada

d) ~Que consideraciones deben hacerse para comprobar la validez del intervalo de confiahza

635 Unamuestra de 16nifias de 10 afiDS pesan en promediD 715 con una desviacion estandar de 12libras CDnsidere el calculD de intervalDs de cDnfianza de 9095 y 99 pDr ciento para I-L

167 64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS

636 Una muestra aleatoria simple conformada por 16 individuos aparentemente sanos presenta los siguientes valores de arsenico eliminado en la orina (miligramos por dfa)

Individuo Valor Individuo Valor

1 007 9 012 2 030 10 006 3 025 11 010 4 008 12 032 5 030 13 006 6 038 14 009 7 007 15 014 8 005 16 011

Elabore un intervalo de confianza de 95 por ciento para la media de la poblaci6n

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES

En ocasiones se presentan casos en los que se desea estimar 1a diferencia entre 1a media de dos poblaciones A partir de cada poblacion se extrae una muestra aleatoria independiente y de los datos de cada una se calculan las medias muestrales XI y x2

respectivamente En el capitulo anterior se dijo que el estimador XI - x2 ofrece una estimacion insesgada de la diferencia entre las medias de las poblaciones III shy11 2 bull La variancia del estimador es (cr~ n l ) + (cr~ n 2 ) Tambien se menciono que seglin las condiciones la distribucion muestral de XI - x2 puede presentar una distribution al menos aproximadamente normal de modo que en muchos casos se utiliza la teorfa adecuada para las distribuciones normales en el calculo de un intershyvalo de confianza para III - 11 2 bull Cuando se conocen las variancias de la poblacion el intervalo de confianza del 100(1 - ex) por ciento para III - 112 esta dado por

(641)

El anal isis del intervalo de confianza para la diferencia entre las medias poblacionales ofrece informacion util para decidir si es 0 no probable que las medias de las dos poblaciones sean iguales Cuando el intervalo no incluye al cero se dice que el intervalo ofrece evidencia de que las dos poblaciones tienen medias diferentes Cuando el intervalo incluye al cero se dice que las poblaciones pueden tener meshydias iguales

Esto se ilustra a continuacion para el caso donde el muestreo se realiza a partir de una distribucion normal

168 CAPITULO 6 ESTlMACI6N

EJEMPLO 641

A un equipo de investigacion Ie interesa conocer la diferencia entre las concentracioshynes de acido urico en pacientes con y sin el sfndrome de Down En un gran hospital para el tratamiento de pacientes con retardo mental una muestra de 12 individuos con el sindrome presenta una media de XI = 45 mgll00 mL En un hospital general se encontro que una muestra de 15 individuos normales de la misma edad y sexo presenta un nivel medio de x2= 34 Si es razonable suponer que las dos poblaciones de valores muestran una distribucion normal y sus variancias son iguales a 1 y 15 calcule el intervalo de confianza de 95 por ciento para ~l - ~2

Soluci6n Para una estimacion puntual de III 112 se udliza Xl X2= 45 34 11 EI coeficiente de confiabilidad que corresponde a 95 localizado en la tabla D es 196 EI error estandar es

Por 10 tanto el intervalo de confianza de 95 por ciento es

11 plusmn 196(4282) 11plusmn84 26 194

Se dice que se dene una confianza de 95 por ciento de que la difeshyrencia real 111 - 112 este entre 26 y 194 porque en muestreos repetidos 95 por ciento de los intervalos construidos de esa manera incluiria la diferencia entre las medias reales

Puesto que el intervalo no incluye al cero se concluye que las dos poblaciones tienen diferentes medias bull

Muestreo a partir de poblaciones que no signen una distribuci6n ItOrmal La construccion de un intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando el muestreo se realiza a partir de poblaciones no normales se lleva a cabo en la forma descrita en el ejemplo 641 si las muestras n l y n

2 son grandes Una vez mas este es un resultado del teorema del limite central

Si se desconocen las variancias de la poblacion se utili zan las variancias de las muestras para estimarlas

IUEMPLO 642

Motivados por d conocimiento de la existencia de una gran cantidad de textos polemicos que sugieren que el estres la ansiedad y la depresion son dafiinos para el sistema inmunologico Gormanet ai (4-5) condujeron un estudio en el que se conshysider6 a individuos varoneshomosexuales algunos con VIH (virus de inmunodefishyciencia humana) positivo y otros con VIH negativo Los datos fueron registrados con una amplia vltJriedad de mediciones medicas inmunologicas psiquiatricas y neurol6gicas una de las cuales corresponde al numero de celulas CD4+ en la sanshy

64 INTERV ALO DE CONFIANZA PAHALA DIFERENCIA ENTRE DOS MEDIAS 169

gre El numero promedio de celulas CD4+ para middot112 individuos con infecci6n por VIR fue de 4018 con una desviaci6n estandar de 2264 Para los 75 individuos sin la infecci6n por VIR la media y la desviaci6n estandar fueron de 8282 y 2749 respectivamente Se pretende elaborar un intervalo de confianza de 99 por ciento para la diferencia de las medias de las poblaciones

Soluci6n No hay informaci6n con respecto a la forma de la distribuci6n de las celulas CD4+ Sin embargo como el tamafto de las muestras es grande el teorema del limite central asegura que la distribuci6n muestral de las diferencias entre las medias de la muestra siguen una distribuci6n aproxishymadamente normal independientemente de que la distribuci6n de la variable en las poblaciones no siga una distribuci6n normal Se puede utilizar este hecho para justificar el uso de la estadistica z como factor de confiabilidad en la construcci6n del intervalo de confianza Tampoco hay informaci6n acerca de las desviaciones estandar por 10 que puede emplearse las desviaciones estandar de las muestras para estimarlas La estimaci6n puntual para la diferencia entre las medias de las poblacioshynes es la diferencia entre las medias de las muestras 8282 - 4018 = 4264 En la tabla D se encuentra que el factor de confiabilidad es 258 La estimaci6n del error estandar es

s __ = 27492

+ 22642 =382786

Xl-X 75 112

Por la ecuaci6n 641 el intervalo de confianza de 99 por ciento para la diferencia entre las medias de la poblaci6n es

4264 plusmn 258(382786) 3276 5252

Se tiene la seguridad de 99 por ciento de que el promedio de celulas CD4+ en varones con VIR positivo difieren de la media para los varoshynes con VIR negativo por 3276 a 5252 bull

Distribuci6n t y la diferencia entre las medias Cuando no se conocen las variancias y se pretende estimar la diferencia entre las medias de dos poblacioshynes con un intervalo de confianza es posible utilizar la distribuci6n t para suminisshytrar el factor de confiabilidad si se conocen ciertas suposiciones se debe saber 0

suponer de buena fe que las dos poblaciones muestreadas siguen una distribuci6n normal Respecto a las variancias de las poblaciones se debe distinguir entre dos situaciones 1) la situaci6n en la que las variancias son iguales y 2) la situaci6n en la que no 10 son A continuaci6n se consideranambas sitpaciones por separado

Varianciaspoblacifmales iguales Si la suposici6n sobre igualdad de las variancias de las poblaciones esta justificada las dos variancias de las muestras calculadas a partir de las muestras independientes pueden considerarse como estishymaciones de 10 mismo es decir la variancia comun Parece 16gico entonces aproshyvechar este hecho en el anal isis en cuesti6n Esto es precisamente 10 que se hace para establecer una estimaci6n conjunta para la variancia comun Esta variancia se obtiene mediante el caIculo promedio ponderado de las dos variancias de las muesshy

170 CAPITULO 6 ESTlMACI6N

tras Cada variancia de la muestra es ponderada con base en sus grados de libertad Si los tamafios de las muestras son iguales este promedio ponderado es la media aritmetica de las variancias de las dos muestras Si el tamano de las dos muestras es distinto el promedio ponderado aprovecha la informacion adicional proporcionada por la muestra mayor La estimacion con junta se obtiene con la fOrmula

S2 = (nl _1)SI2 + (n2 l)s~ p (642)

+n2 -2nl

Asf la estimacion del error estandar esta dada por

(643)

y el intervalo de confianza de 100(1 a) por ciento para III 112 esta dada por

(644)

El nfunero de grados de libertad utilizado para determinar el valor de t que se usa para construir el intervalo es n

1 + n

2 2 que es el denominador de la ecuacion

642 Este intervalo se interpreta en la forma habitual Los metodos que pueden emplearse para tomar la decision acerca de la igualshy

dad de las variancias de las poblaciones se estudian en la seccion 610 y 78

EJEMPLO 643

Uno de los estudios de Stone et al (A-6) tuvo como objetivo determinar los efectos del ejercicio por un tiempo prolongado en los ejecutivos de una compania inscritos en un programa supervisado de acondicionamiento fisico Se registraron datos de 13 individuos (el grupo deportista) que voluntariamente se inscribieron el programa y que permanecieron activos por 13 anos en promedio y de 17 individuos (el segunshydo grupo el sedentario) que decidieron no inscribirse Entre los datos que se regisshytraron acerca de los individuos esta el mlmero maximo de sentadillas realizadas en 30 segundos El grupo deportista obtuvo una media y una desviacion estandar de 210 y 49 respectivamente La media y la desviacion estandar para el grupo sedenshytario fueron 121 y 56 respectivamente Se considera que las dos poblaciones de medici ones de acondicionamiento muscular siguen una distribuci6n aproxirnadashymente normal y que las variancias para ambas poblacionesson iguales Se pretenshyde elaborar un intervalo de confianza de 95 por ciento para Ja diferencia entre las medias de as poblaciones representadas por las dos muestras Soluci6n Primero se utiliza la ecuaci6n 642 para calcular la estimaci6n conjunta

de la variancia comtin de las poblaciones

(13-1)(49 2 )+(17 1)(562 ) =2821

13+17-2 Cuando se consulta la tabla E con 13 + 17 - 2= 28 grados de libertad y el nivel de confianza de 95 se encuentra que eLfactor de confiabilidad es 20484 Con la ecuacion 644 se calcula el intervalo de confianza de

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS 171

95 por ciento para la diferencia entre las medias de las poblaciones de la siguiente manera

2821 2821(210-121)plusmn20484 --+-shy

13 17 89 plusmn 40085

49129

Se tiene una confianza de 95 por ciento de que la diferencia entre las medias de las poblaciones estan entre 49 y 129 Se puede decir esto porque se sabe quesi se repite el amilisis muchfsimas veces y se calculan los intervalos de confianza de la misma manera cerca de 95 por ciento de los intervalos de confianza induiran la diferencia entre las medias de las poblaciones

Debido a que los intervalos no induyen al cerose conduye que las medias de las poblaciones son diferentes bull

Variancias poblacionales distintas Cuando no se puede conduir que las variancias de dos poblaciones de interes son iguales aun ruando pueda suponerse que las dos poblaciones presentan distribuciones normales no es adecuado utilizar la distribucion t como se acaba de describir para construir los intervalos de confianza

Una solucion al problema de variancias distintas fue propuesta por Behrens (3) y posteriormente fue verificada y generalizada por Fisher (4 5) Neyman (6) Scheffe (7 8) Y Welch (9 10) tambien proponen soluciones EI problema es analizashydo en detalle por Cochran (11)

EI problema gira en tomo al hecho de que la cantidad

no sigue una distribuci6n t con nj + n 2 grados de libertad ruando las variancias 2 shy

de las poblaciones son distintas Consecuentemente la distribucion t no se puede utilizar en la forma habitual pata obtener el factor de confiabilidad del intervalo de confianza para la diferencia entre las medias de dos poblaciones que tienen variancias diferentes La solucion propuesta por Cochran consiste en el calculo del factor de confiabilidad mediante la siguiente formula

wltj + w2tZ t l

f

-0f2 = (645) WI +w2

donde WI 512

np W 2 = s~ n2 tl = tl _ para nj - 1 grados de libertad y t2 = t l

_w2aI2

para n2

- 1 grados de libertad Un intervalo aproximado de confianza del 100(1 shya) por ciento para III - 112 esta dado por

(646)

172

EJERCICIOS

CAPITULO 6 ESTlMACION

FJEIUPLO 644

En la investigacion de Stone et al (A-6) descrita en el ejercicio 643 los investigashydores tambien informaron los siguientes datos de las medici ones referentes a todas las calificaciones del acondicionamiento muscular logradas por los individuos

Muestra n Media Desviaci6n estimdar

Grupo deportista 13 45 3

Grupo sedentario 17 37 10

Se considera que las dos poblaciones de todas las calificaciones de acondicionashymiento muscular siguen una distribuci6n aproximadamente normal Sin embargo no debe suponerse que las dos variancias poblacionales son iguales Se pretende construir un intervalo de confianza de 95 por ciento para la diferencia entre las medias de todas las calificaciones de acondicionamiento muscular para las dos poshyblaciones representadas por las muestras

Soluci6n Se utiliza t de la ecuaci6n 645 para calcular el factor de confiabilidad En la tabla E se muestra que con 12 grados de libertad y 1 - 052 = 975 t( 21788 Analogamente con 16 grados de libertad y 1- 052 = 975 t2 = 21199 Ahora Sf calcula

(3 2 13)(21788) + (102 17)(21199) 139784 t= =

(3 2 13)+(102 17) 065747

=21261

Con la ecuaci6n 646 ahora se construye el intervalo de confianza de 95 por ciento para la diferencia entre las medias de las dos poblaciones

2 2

(45 37)plusmn21261 3 + 10 13 17

8 plusmn 21261 (25641101) 25134

Puesto que el intervalo no incluye acero se concluye que las medias de las dos poblaciones son diferentes bull

Cuando se construyen intervalos de confianza para la diferencia entre las medias de dos poblaciones es posible utilizar la figura 641 para decidir rapidashymente si el factor de confiabilidad debe ser z t 0 tf

Para cada uno de los siguientes ejercicios construya intervalos de confianza de 90 95 y 99 par ciento para las diferencias entre las medias poblacionales Establezca consideraciones que hagan que el metodo sea valido Determine las interpretaciones practica y probabilistica

clJ clJ FIGURA 541 Diagrama de flujo para decidir si e1 factor de confiabilidad debe ser z tot cuando se realizan inferencia inferencias acerca de la diferencia entre las medias de dos pobladones (Para usar un procedimiento no parametrico ver el capitulo 11)

174 CAPiTULO 6 ESTlMACION

para cad a intervalo construido Suponga las variables bajo considerati6n en cad a ejercicio y establezca para que pueden servir a los investigadores esos resultados

641 EI objetivo de un experimento de Buckner et al (A-7) consisti6 en estudiar los efectos del relajamiento muscular inducido por el pancuronium en el volumen del plasma circulante Los individuos estudiados son recien nacidos con un peso mayor a 1700 gramos que necesishytaron de ayuda para respirar durante las primeras 24 horas despues de nacer y cumplieron con otros criterios cHnicos Cinco recien nacidos paraIizados con el pancuronium y siete recien nacidos no tratados presentaron las siguientes estadisticas en la segunda de las tres mediciones del volumen de plasma (ml) hecha durante la respiraci6n mecanica

Paralizados 480 81 No tratados 567 81

La segunda medici6n para el grupo tratado ocurri6 de 12 a 24 horas despues de la primera dosis de pancuronium Para el grupo no tratado las mediciones se hicieron de 12 a 24 horas despues de iniciar la respiracion mecanica

642 Zuckery Archer (A-8) afirman que la N-nitrosobis (2-oxopropyl)amina (BOP) y las nitrosaminas 3-oxidizadas producen una alta incidencia de tumores de conductos pancreaticos en el hamster dorado sirio Estudiaron los efectos en el peso sangufneo en la glucosa del plasma en la insulina yen los niveles de transamina glutamico-oxaloacetica del plasma (GOT) de los hamsters expuestos in vivo a la BOP Los investigadores reportaron los siguientes resultados en ocho animales tratados y 12 sin tratamiento

Variable Sin tratamiento Con tratamiento

Glucosa del plasma (mglgl) 101 plusmn 5 74plusmn 6

FUENTE Peter F Zucker y Michael C Archer Alterations Pancreatic Islet Function Produced by Carcinogenic Nitrosamines in the Syrian Hamster AmericanJournal oPathology 133 573-577

Los datos son la media de la muestra plusmn la estimaci6n del error estandar de la media de la muestra

643 Los objetivos de un estudio de Davis et al (A-g) son evaluar 1) la eficacia del programa auto ayuda momento para dejar de fumar cuando se utiliza con base de uno a uno en el hogar y 2) la viabilidad de ensefiar temicas para abandonar el habito de fumar a los estudiantes de enfermerfa en bachillerato A estudiantes graduados de enfermerfa inscritos en dos cursos de metodologia de la investigacion de la Universidad de Ottawa se les invit6 a participar en el proyecto Se aplic6 un cuestionario de opcion multiple para abandonar el habito de fumar a 120 estudiantes de enfermeria que participaron y a otros 42 estudiantes que no participashyron antes ni despues del estudio Se calcularon las diferencias entre las calificaciones antes y despues del estudio as como las siguientes estadisticas a partir de las diferencias

EJERCICIOS 175

Grupo Media Desviaci6n estandar

Participantes (A) 214444 15392 No participantes (B) 33333 14595

644 El doctor Ali Khraibi (A-IO) de la CHnica y Fundaci6n Mayo condujo una serie de experishymentos con el fin de evaluar las respuestas diureticas y natiureticas de ratas Okamoto esponshytaneamente hipertensivas (REB) y ratas Wistar-Kyoto (WRY) para dirigir incrementos en la presion hidrostatica renal intersticial (PBRI) Para aumentar la PBRI se utiIiz6 la expansi6n directa del volumen renal intersticial (DRIVE) a traves de una matriz implantada cronicamente en el rinOn Entre los datos registrados durante el estudio estan las siguientes mediciones de excreci6n de sodio a traves de la orina (UNa V) durante el periodo de DRIVE

Grupo

REB 632572796483527 2WKY 420469482 108210

FUENTE Publicada con autorizaci6n del Dr Ali A Khraibi

645 Osberg y Di Scala (A-II) realizaron un estudio centrado en la eficacia de los cinturones de seguridad para reducir 1esiones entre sobrevivientes de accidentes automoviHsticos internashydos en hospitales con edades de 4 a 14 afios El estudio compar610s resultados de 123 ninos que utilizaron el cintur6n contra 290 que no 10 utilizaron entre aquellos que se vieton enshyvueltos en tales accidentes y que fueron hospitalizados El informe con tenia la siguiente estadistica del numero de dfas en la unidad de cuidados intensivos

Grupo Media Error estandar estimado

Utiliz6 el cintur6n 83 16 No utiliz6 el cintur6n 139 18

646 La medicion del diametro transversal del coraz6n de hombres y mujeres adultos presenta los siguientes resultados

sx Grupo Tamafto de Ia muestra (cm) (cm)

Varones 12 1321 105 Mujeres 9 IIOO 101

Considere que las poblaciones siguen una distribucion normal con variancias iguales

176 CAPITULO 6 ESTIMACION

647 Veintiruatro animales de laboratorio con deficiencia de vitamina D fueron divididos en dos grupos iguales EI grupo 1 recibi6 un tratamiento consistente en una dieta que proporcionashyba vitamina D EI segundo grupo no fue tratado AI termino del periodo experimental se midieron las concentraciones de calcio ensuero obteniendose los siguientes resultados

Grupo tratado X 111 mg 100 mls = 15 Grupo sin tratamiento x= 78 mg 100 ml s = 20

Considere que las poblaciones siguen una distribuci6n normal con variancias iguales

648 Ados grupos de nifios se les hicieron pruebas de agudeza vi~ual El grupo 1 estuvo formado por 11 nifios que recibieron la atenci6n de medicos privados La calificaci6n media para este grupo fue de 26 con una desviaci6n estandar de 5 El segundogrupo que incluy6 14 nifios que recibieron atenci6n medica por parte del departamento de salud publica tuvo una calishyficaci6n promedio de 21 con una desviaci6n estandar de 6 Suponga que las poblaciones siguen una distribuci6n normal con variancias iguales

649 El tiempo promedio de estancia de una muestra de 20 pacientes dados de alta de un hospital general es de siete dras con una desviaci6n estaildar de dos dras Una muestra de 24 padenshytes dados de alta de un hospital de enfermedades cr6nicas tuvo un tiempo promedio de estancia de 36 dfas con una desviaci6n estindar de 10 dias Suponga que la poblaci6n sigue una distribuci6n normal con variancias desiguales

6410 En un estudio de factores que se consideran responsables de los efectos adversos del tabashyquismo sobre la reproducci6n humana se midieron los niveles de cadmio (nanogramos por gramo) en el tejido de la placenta de una muestra de 14 madres que fumaban y una muestra aleatoria independiente de 18 mujeres no fumadoras Los resultados fueron los siguientes

No fumadoras toO 84 128250 118 98 125 154 235

94251 1952559875 118122150

Fumadoras 300301150241305178168148

134285 175 144 125204

ms probable que el nivel medio de cadmio registrado sea mayor entre las fumadoras que entre las no fumadoras ~Por que se llegarfa a esta conclusi6n

65 INTERVALO DE CONFIANZA PARA IA PROPORCION DE UNA POBIACION

Muchas preguntas de interes para que el tecnico en salud tienen relacion con las proporciones de poblacion ~Que propordon de padentes que redben un tipo espeshycial de tratamiento se recuperan ~Que proporcion de alguna poblacion tiene cierta enfermedad ~Que propordon de una poblacion es inmune a derta enfermedad

Para estimar la proporcion de una poblacion se procede en la misma forma que cuando se estima la media de una poblacion Se extrae una muestra de la poblacion de interes y se calcula su proporcion p Esta se utiliza como el estimador puntual para la proporcion de la pobladon Un intervalo de confianza se obtiene mediante la siguiente formula general

estimador plusmn (coefidente de confiabilidad) X (error estandar)

EJERCICIOS

EJERCICIOS 177

En el capitulo anterior se vio que cuando np y n(1 - p) son mayores que 5 se puede considerar que la distribuci6n muestral de pse aproxima bastante a una distribuci6n normal Cuando se cumple con esta condici6n el coeficiente de confiabilidad es algUn valor de z de la distribuci6n normal estandar Esta visto que el error estandar es igual a (J p =fi(l-p) n Puesto que p que es el parametro que se trata de calcular se desconoce se debe utilizar pcomo una estimaci6n Asf se estima (J j por medio de ~p(l Pn y el intervalo de confianza de 100(1 - 0) por ciento para pesta dado por

pplusmn Z(I-1J2)~P(l- P) Fn (651)

Este intervalo se interpreta tanto desde el punto de vista practico como probabilistico

FJEMPLO 651

Mathers et al (A-12) encontraron queen una muestra de 591 pacientes internados en un hospital psiquiatrico 204 admitieron que consuniieron marihuana al meshynos una vez durante su vida Se pretende construir un intervalo de confianza de 95 por ciento para la proporcion de individuos que consumieron marihuana durante su vida en la poblaci6n muestreada de los internos del hospital psiquiatrico

Solucion La mejor estima~i6n puntual para la proporci6Il de la poblaci6nes p== 204591 3452 El tamafio de la muestra y hiestimacion de p tienen una magnitud suficiente parajustifKar el empleo de la distribucion norshymal estandar paraelaborar un intervalo de confianza EI coeficiente de corifiabilidad que corresponde alnivel de confianza de 95 es 196 la estimacion del errorestandar (Jp es ~p(l-pgtn = (3452)(6548)591

0 1956El intervalo de confianza para p de acuerdo con estos datos es

3452 plusmn 196(01956) 3452 plusmn 0383 3069 3835

Se puede decir que se tiene 95 por ciento de confianza de que la proporshycionpeste entre 3069 y 3835 ya que al repetir el muestreo casi 95 por ciento de los intervalos construidos en la forma de este intervalo inclushyyen a la proporcion p real Con base en estos resultados se espera con una confianza de 95 por ciento encontrar que entre 3069 y 3835 por ciento de los internados en el hospital psiquiatrico tiene antecedentes de consumo de marihuana bull

Para cada uno de los siguientes ejercicios establezca la interpretacion prictica yprobabilistica de los intervalos que se pide construir Identifique cada componente del intervalo la estimashycion puntual el coeficiente de confiabilidad yel error estandar Explique por que los coefishycientes de confiabilidad no son los misInos para todos los ejercicios

178 CAPITULO 6 ESTIIlACI6N

651 En una investigaci6nde ninos maltratados en pacientes psiquiatricos Brown y Anderson (A-IS) encontraron 166 pacientes en una muestra de 947 con antecedentes de abuso sexual y maltrato flsico Construya un intervalo de confianza de 90 por dento para la proporci6n de la poblaci6n

652 Catania et at (A-14) obtuvieron datos respecto al comportamiento sexual de una muestra de hombres y mujeres solteros con edades entre 20 y 44 residentes en areas geoijfaficas caracshyterizadas por tasas altas de enfermedades de transmision sexual e ingreso a programas de drogas De 1229 encuestados 50 por ciento respondieron que nunca utilizaron preservatishyvos Construya un intervalo de confianza de 95 por ciento para la proporcion de la poblaci6n que nunca utiliza preservativos

653 Rothberg y Lits (A-I 5 ) estudiaron el efecto del estres de la maternidad durante el embarazo en el peso del producto Los individuos eran 86 mujeres blancas con antecedentes de estres que no tenfan faetores de riesgo medico u obstetrico conoddo de peso bajo del producto Los investigadores eneontraron que 128 por dento de las madres estudiadas dieron a luz bebes que cubrfan el criterio de peso bajo Construya un intervalo de confianza de 99 por ciento para la proporci6n de la poblaci6n

654 En una muestra aleatoria simple de 125 varones desempleados quienes desertaron de la escuela preparatoria entre las edades de 16 y 21 anos inclusive 88 declararon que eran consumidores regulares de bebidas alcoh6litas Construya un intervalo de eonfianza de 95 por ciento para la proporcion de la poblacion

66 INTERVALO DE CONFIANZA PARA lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS POBlACIONES

A menudo se tiene interes en conocer la magnitud de la diferencia entre las proporcioshynes de dospoblaciones Es posible que se quiera comparar por ejemplo entre hombres y mujeres dos grupos de edades dos grupos socioecon6micos 0 dos grupos de diagshynostico con respecto a la proporcion que posee alguna caractenstica de interes Un estimador puntual insesgado de la diferencia entre dos proporciones de las poblacioshynes se obtieneal calcular la diferencia de las proporciones de las muestras PI P2 Tal como Se ha visto cuando n1 Yn2 son de gran tamano y las proporciones de la poblacion no estan muy cerca de 0 0 de 1 es posible aplicar el teorema del limite central y utilizar la teona de la distribucion normal para obtener los intervalos de conshyfianza EI error estandar de la estimacion se calcula mediante la siguiente formula

dado que como regIa se desconocen las proporciones de Ia poblacion Un intervashy10 de confianza de 100(1 - a) por ciento para PI P2 se obtiene as

(661)

Es posible interpretar este intervalo desde elpunto de vista probabiHstico y practico

EJERCICIOS 179

EJEMPLO 661

Borst et al (A-16) investigaron la relaci6n de desarrollo del ego edad sexo y diagshyn6stico de suicidio entre los internos adolescentes de la unidad de psiquiatria La muestra consistia en 96 varones y 123 niiias con edades entre 12 y 16 aiios seleccioshynados de entre los internados en la unidad de adolescentes y niiios de un hospital psiquiatrico privado Se reportaron 18 niiios y 60 niiias con intento de suicidio Cons ishyderese el comportamiento de las niiias como el de una muestra aleatoria simple a partir de una poblaci6n similar de niiias y que los j6venes igualmente pueden considerarse como una muestra aleatoria simple extraida de una poblaci6n similar de niiios Para estas dos poblaciones se pretende construir un intervalo de confianshyza de 99 por ciento para la diferencia entre las proporciones de los individuos con intento de suicidio

Soluci6n Las proporciones para las niiias y niiios respectivamente son Pc = 601 123 = A878y PB = 1896 1875 La diferencia entre las proporciones de lasmuestrases Pc PB = 4878 1875 = 3003 El error estandar estimado de la diferenda entre las proporciones de las muestras es

(4878)(5122) (1875)(8125) ---~~-~ +-------shy

123 96

El factor de confiabilidad a partir de la tabla D es 258 de modo que el intervalo de confianza con la f6rmula 661 es

3003 plusmn 258(0602) 14504556

Se dene la confianza de 99 por dento de que para las poblaciones muestteadas la ptopord6n de intentos de suiddio entre las niiias exceshyde a lapropord6n de intentosde suiddio entre los varones por 1450 y 4556

Puesto que el intervalo no incluye al cero se concluye que las dos proporciones de pobladones son diferentes bull

FJERCICIOS

Para cada uno de los siguientes ejercicios establezca las interpretaciones pnicticas y probabishylisticas de los intervalos que se pide construir Identifique cada componente del intervalo la estimaci6n puntual el coeficiente de confiabilidad y el error estandar Explique por que los coeficientes de confiabilidad no son el mismo para todos los ejercicios

661 Hargers et al (A-17) del departamento de Salud PUblica y Ambieptal en Amsterdam condushyjeron un estudio en el que los individuos eran consumidores de drogasinyectables (CDI) En una muestrade 194 consumidores de metadona regular de largo plazo (MLP) 145 eran varones En una muestra de 189 CDIque no consmiddotumian MLP 133 eran varones Establezca las consideraciones necesarias acerca de las muestras ypoblaciones representadas y construshy

180 CAPITULO 6 ESTlMACI6N

ya un intervalo de confianza de 95 por ciemo para la diferenda entre las proporciones de varones en las dos poblaciones

662 Una investigaci6n de Lane et ai (A-I8) valor6las diferencias en las pnicticas de deteccion de cancer de seno entre muestras de mujeres predominantemente de bajos ingresos con edashydes de 50 a 75 anos que lltilizan los servicios de c1inicas de sailld para todo el estado y mlljeres de la misma edad residentes en ciudades donde las c1inicas de salud son locales De las 404 encuestadas seleccionadas en toda la comunidad 592 por ciento estuvo de acuerdo con el siguiente comentario acerca del cancer de pecho las mujeres prolongan su vida si detectan el cancer desde el inicio De entre 795 usuarias de clinicas de salud en la mllestra 449 por ciento estuvo de acuerdo Establezca las suposiciones apropiadas para elaborar un intervalo de confianzade 99 por ciento para la diferencia entre las dos proporciones de las poblaciones de interes

663 Williams et at (A-19) encuestaron a una muestra de 67 medicos y 133 enfermeras con famishyliares farmacodependientes EI prop6sito del estudio era evaluar la influencia en los medishyEOS y enfermeras de estar estrechamente involucrados con una 0 mas personas farmaco dependientes Cincuenta y dos medicos y 89 enfermeras dijeron que vivian con personas farmacoldependientes que adversamente afectaban 8U trabajo E8tablezca todas las consideshyraciones que crea necesarias para construir un intervalo de confianza de 95 por ciento para la diferencia entre las proporciones en las dos poblaciones de trabajadores que se espera esten adversamente afectados por vivir con personas farmacodependientes

664 Aronow y Kronzon (A-20) identificaron los factores de riesgo coronado entre hombres y mujeres en una dinica de cuidados de la salud a largo plazo De los 215 individuos negros 58 tienen diabetes mellitus al igual que 217 individuos blancos de 1140 Elabore un intervalo de confianza de 90 por ciento de confianzapara la diferencia entre las proporciones de las dos poblaciones tCuaies son las poblaciones correspondientes ~Que consideraciones son necesarias para hacer valido el procedimiento de inferencia

67 DETEHMINAUON DEL TAMANO DE LA MUESTRA PARA LA ESTIMACIONDEIAS MEDIAS

La pregunta de que tan grande debe ser una muestra surge inmediatamente al inicio del planteamiento de cualquier encuesta 0 experimento Esta es una pregunshyta importante y no se debe tratara la ligera Tomar una muestra mas grande de 10 necesario para obtener los resultados deseados es un desperdicio de recursos mienshytras que por otro lado las muestras demasiado pequenas con frecuencia dan resulshytados que carecen de uso practico En esta secci6n se estudia c6mo determinar el tamano de la muestra de acuerdo con la situaci6n A continuaci6n se proporciona un metodo para determinar el tamano de la muestra que se requiere para estimar Ia media de la poblaci6n yen la siguiente secci6n se aplica este metodo para detershyminar el tamano de la milestra cuando se desea estimar la proporci6n de una poshyblaci6n Mediante extensiltmes directas de estos metodos es posible determinar el tamano necesario de las muestras para situaciones mas complicadas

Objetivos El objetivo de la estimaci6n porintervalos es el de obtener intervalos estrechos con alta confiabilidad Si se observan los componentes ~e un intervalo de confianzase veque 8U dimension esta determinada por la magnitud de la cantidad

(coeficiente de confiabilidad) x (error estandar)

131 67 DETERMINACION DEL TAMANO PARA LA l-IUESTRAmiddot

ya que lamagnitud total del intervalo de confIanza es eldoble de esta cantidad Se aprendi6 que a esta cantidad generalmente se Ie llama precisi6n de la estimaci6n o margen de error Para un error estandar dado incrementar la confIabilidad signishyfIca un coefIciente con mayor confIabilidad Y un coefIciente con mayor confIabilidad produce unintervalo mas amplio

Por otra parte si se ftia el coefIciente de confIabilidad la unica manera de redudr la amplitud del intervalo es la reducci6n del error estandar Dado que el error estandar es igual a (J IJ y como (J es una constante la unica forma de obtener un error estandar menor es tomar una muestra grande ~Que tan grande debeser la muestra Esto depende del tamafio de (J la desviad6n estandar de la poblaci6n asi como del grado de confIabilidad y dimensi6n del intervalo deseados

Suponga que se desea obtener un intervalo que se extienda d unidades hacia uno y otro lado del estimador Ellose enuncia

d (coefIciente de confIabilidad) X (error estandar) (671)

Si el muestreo es con reemplazos a partir de una poblaci6n infInita 0 de una que sea 10 sufIcientemente grande como para ignorar la correcci6n por poblaci6n fInita la ecuaci6n 671 se transforma en

(J

d z- (672)-r la cual cuando se despeja n nos da

(673)d2

Cuando el nmestreo se hacesin reemplazos a partir de una poblaci6n fInita y peshyquefia se requiere de la correcci6n por poblaci6n fInita y la ecuaci6n 671 se transforma en

(J~d (674)fN~

que al despejar n resulta en

n-----shy (675)d 2(N 1) + Z2(J2

Si puede omitirse la correcci6n por poblad6n fInita la ecuaci6n 675 se reshyduce a la ecuaci6n 673

Estillluci6n de (J 2 Las f6rmulas para el tamafio de la muestra requieren del conocimiento de (J2 pero como ya se ha sefialado la varian cia de la poblaci6n casi

132 CAPITULO 6 ESTlMACION

siempre sedesconoce Como resultado esnecesarioestimar (J2 Las fuentes de estishymaci6n de(J2 que se utilizan con mas frecuencia son las siguientes

1 Se extrae una muestrapilato 0 prel~l11inar de lapoblaci6n y se puede utilizar la variancia calculada a partir de esta muestra como unaestimaci6n de (J2 Las observaciones uti lizadas en la muestra piloto se toman como parte de la muesshytrafinal de modo que n (el tamaiio calculado de la muestra) n

1 (el tamaiio

de la muestra piloto) n2 (el numero de observaciones necesarias para satisfacer el requerimiento total del tamaiio de la muestra)

2 A partir de estudios anteriores osimilares es posible obtener estimaciones de (J2

3Si se cree que la poblaci6n de lacual se extrae la muestraposee una distribushyci6n aproximadamente nqrmal se puede aprovechar el hecho de que la amshyplitud es aproximadamente igual a 6 desviaciones estandar y calcular (J R6 Este metodo requiere aIglin conocimiento acerca de los valores minimo y maximo de la variable en la poblaci6n

EJEMPLO 671

Un nutri6logo del departamento de salud al efectuar una encuesta entre una poshyblacien de muchachas adolescentes con e1 fin de determinitr su ingesti6n diaria promedio de proteinas (medidas en gramos) busc6 el consejo de un bioestadistico con respecto al tamaiio de la muestra que deberfa tomar

~Que procedimiento debe seguir el bioestadistico para asesorar al nutri610go Antes de que el estadistico pueda ayudar el nutri6logo este debe proporcionar tres elementos de informaci6n h dimensi6n deseada del intervalo de confianza el nivel de confianza deseado y la magnitud de la variancia de la poblaci6n

Soludon Suponga que el nutri6logo requiere un intervalo con una dimensi6n de aprQximadamente 10 gramos es decir la estimaci6n se deberfa enconshytrar alrededor de 5 gramos de la media de la poblaci6n en ambas direcshyciones En otras palabras se desea un margen de error de 5 gramos Suponga que se decide por un coeficiente de confian7a de 95 y que con base en su experiencia previa el nutri6logo percibe que la desviaci6n estandar de la poblaci6n es probablemente de alrededor de 20 gramos EI estadfstico dispone ya de la informaci6n necesaria para calcular el tamaiio de la muestra z 196 (J = 20 y d 5 Suponga que el tamaiio de la poblaci6n es grande asf queel estadistico puede ignorar la correcshyci6n por poblaci6n finita y utilizar la ecuaci6n 673 Con las sustitucioshynes adecuadas el valor de n se calcula como

Se recomienda que el nutri610go tome una muestra de tamafio 62 AI calcular el tamaiio de una muestra a partir de las ecuaciones 673 0 675 el resultado se redondea al siguiente nurnero entero mayor si los calculosdan un numerocon decimales bull

183 68 DETERMINACION DEL TAl1ANO PARA LAS PROPORCIONES

EJERCICIOS

671 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su hospital Si se desea un intervalo de confianza de 99 por dento con una amplitud de 1 libra ~que tan grande debe ser la muestra de los registros de nacimiento Suponga que un estimashy

dor razonable para (J es 1 libra ~De que tamano debe ser la muestra si el coeficiente de confiabilidad se hace descender a 95

672 El director de la secdon de control dela rabia del departamento de salud publica desea extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso del ano anterior para estimar la edad media de las personas mordidas Requiere un intervalo de confianza de 95 por dento decide utilizar un valor de 25 para d y a partir de estudios anteriores estima que la desviacion estandar de la poblacion esta alrededor de los 15 anos ~Que tan grande debe ser el tamano de la muestra

673 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mglOO ml) de pacientes atendidos en una clinica para diabeticos durante el transcurso de los ultimos 10 anos Determine el numero de registros que el medico debe examinar para obtener un intershyvalo de confianza de 90 por ciento para 11 si la dimension requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varian cia de 60

674 Se deseaestimar la edad media en la que a los padentes de esclerosis multiple se les diagnosshytico el padecimiento por primera vez Se requiere un intervalo de confianza de 95 por dento con una dimension de 10 anos Si la variancia de la poblaci6n es de 90 ~que tan grande debera ser la muestra

68 DETERMINACION DELTAMANO DE lA MUESTRA PARA lA ESIDIACION DE lAS PROPORCIONES

EI metodo para estimar el tamafio de la muestra cuando se requiere estimar la proshyporcion de una poblacion es esencialmente el mismo que se describio para estimar la media de una poblacion Se aprovecha el hecho de que la mitad del intervalo deseashydo d se puede igualar al producto del coeficiente de confiabilidad y el error estandar

Si se supone que el muestreo ha sido hecho de manera aleatoria y que existen condiciones que garanticen que la distribuci6n de psea aproximadamente normal se obtiene la siguiente formula para n cuando el muestreo es con reemplazo cuanshydo se realizaa partir de una poblacion infinita 0 ruando la poblacion muestreada es 10 suficientemente grande como para hacer innecesario el uso de la correcci6n por poblacion finita

n (681)

dondeq = I-p Si la correccion por poblacion finita no puede descartarse la formula adecuashy

da paran es

(682)n d 2 (N -1)+z2pq

euan do N es grande en comparacion con n (es decir n IN 05) se puede pasar por alto la correccion por poblacion finita y la ecuacion 682 se reduce a la ecuacion 681

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

151 61 INTRODUCCION

parametros como la media y la proporci6n de varias poblaciones Si este es el caso existe una buena razon por la que se debe confiar en los procedimientos de la estimacion para obtener informaci6n respecto a dichos parametros muchas poblaciones de interes aunque finitas son tan grandes que el costo de un estudio

del 100 por ciento seria prohibitivo Suponga que al administrador de un gran hospital Ie interesa saber la edad

promedio de los pacientes internados en el transcurso de un ano Es posible que considere demasiado laborioso consultar el registro de cada paciente internado en el transcurso de ese ano y en consecuencia decide examinar una muestra de los registros a partir de la cual sea posible calcular una estimaci6n de la edad

promedio de los pacientes internados en ese ano Un medico general puede estar interesado en saber que proporcion de

cierto tipo de individuoStratados con un determinadomedicamento presentan efectos secundarios indeseables Sin duda su idea de poblaci6n consiste en todas aquellas personas que alguna vez han sido 0 seran tratadas con este medicamenshyto Aplazar una conclusion hast a haber observado a la poblaci6n completa podria tener efectos adversos en el ejercicio de su profesion

Estos dos casos ejemplifican el in teres por estimar la media y la proporcion de una poblacion respectivamente Otros parametros cuya estimacion se estudia

en estecapftulo son la diferencia entre dos medias entre dos proporciones la variancia de la poblaci6n y la razon de dos variancias

Se encontrara que para cada uno de los parametros estudiados es posible calcular dos tipos de estimaci6n estimaci6n puntual y estimaci6n por

bullintervalos

DEFINICION

Una estimaci6n puntual es un solo valor numerico utilizado para estimarelmiddotpanimetro correspondiente de la poblaci6n

DEFINICION

Una estimaci6n POT intervalos consta de dos valores numericos que definen un intervalo que con un grado especifico df confianza se considera que incluye al parametro por estimar

Estos conceptos se explican en las secciones siguientes

152 CAPITULO 6 ESTlMACION

Eleccion del estimador adecuado Esconveniente notar que se ha dado el nombre de estimacion a un solo valor calrulado La regIa para calrular este valor a estimaci6n se conoce como estimador Los estimadores generalmente se presentan como f6rmulas Por ejemplo

n

es un estimador de la media de la poblaci6n )t El valor numerico individual que resulta de la evaluaci6n de esta f6rmula se canoce como estimaci6n del parametro )t

En muchos casos es posible estimar un panimetro por media de mas de un estimador Par ejemplo se puede utilizar la mediana de la muestra para estimar la media de la poblaci6n ~C6mo decidirentonces que estimador se debe utilizar para estimar un parametro en particular La decisi6n se basa en criterios que reflejan la bondad de los estimadores partirulares Cuando se miden contra estos criteshyrios algunos estimadores son mejores que otros Uno de estos criterios es la propieshydad de ser insesgado

DEFINICION

Se dice queun estimador por ejemplo T para el parametro () es un estimador insesgado de () si E(T) = ()

E(T) significa el valor esperado de Tn Para una poblaci6n fmita E(T) se obtiene tomando el valor promedio de T calculado a partir de todas las muestras posibles de un tamafto dado que puedan extraerse de la poblaci6n Es decir E(T)= I-lr Para una poblaci6n infinita E(T) se define en terminos del calculo matematico

En el capitulo anterior se via que la media de la muestra y la proporci6n de la muestra la diferencia entre las medias de dos muestras la diferencia entre las proporciones de dos muestras son cada una estimadores insesgados de sus parametros correspondientes Esta propiedad qued6 implfcita ruando se dijo que los parametros eran las medias de lasdistribuciones del muestrco correspondienshytes Por ejemplo dado que la media de la distribuci6n mliestral de x es igual a )t se sabe que x es un estimador insesgado de )t En este libra no se estudian los otros criterios para un buen estimador Ellector interesado los encontrara detashyllados en muchos libras de estadfstica matematka

Poblaciones muestreatlnS y poblaciones objetivo EI investigador en el area de la salud que utiliza los procedimientos de inferentia estadfstica debe estar al tanto de las diferencias entre dos tipos depoblaci6nla poblacion muestreada y la poblaci6n objetivo

DEFINICION

La poblacion muestreada es la poblacion de la cual se extrae unamuestra

153 61 INTRODUCCION

DEFINICION

La poblacion objetivo es la poblacion de la que se pretende hacer una inferencia

Estas dos poblaciones pueden ser las mismas a no Los pracedimientos de inferencia estadfstica permiten inferir respecto a las poblaciones muestreadas (siemshypre y cuando se hayan utilizado los metodos de muestreo correctos) Solo cuando la poblacion objetivo y la poblacion muestreada son las mismas es posible utilizar pracedimientos de inferencia estadfstica para llegar a conclusiones acerca de la poshyblaci6n objetivo Si la poblacion muestreada y la poblacion objetivo son diferenshytes el investigador puede llegar a conclusiones respecto a la poblaci6n objetivo solo can base en consideraciones no estadisticas

Par ejemplo suponga que un investigador quiere estimar la eficacia de un metoda para tratar la artritis reumatoide La poblaci6n objetivo esta formada por todos los pacientes que sufren esta enfermedad y no es practico extraer una mliestra de esta poblacion Sin embargo el investigador puede extraer una muestra de toshydos los pacientes can artritis reumatoide de alguna clfnica especifica Estos pacienshytes constituyen la poblacion muestreada y si se utilizan metodos de muestreo adecuados es posible hacer inferencias respecto a esta poblacion muestreada con base en la informacion de la muestra Si el investigador qui ere hacer inferencias acerca de todos los pacientes con artritis reumatoide debe utilizar metodos no estadfsticos Quiza el investigador sepa que la poblaci6n muestreada es similar can respecto a todas las caracteristicas importantes a la poblacion objetivo Es decir es posible que el investigador sepa que edad sexo gravedad de enfermedad tiempo de evolucion deesta asf como otras datos son similares en ambas poblaciones Y con base en esteconocimiento el investigador puede extrapolar sus descubrimienshytos ala poblacion objetivo

En muchos casas la poblacion muestreada y la poblaci6n objetivo son identishycas y cuando esto ocurre las inferencias en torno a la poblacion objetivo son direcshytas Sin embargo el investigador debe estar consciente de que este no siempre es el caso a fin de no caer en la trampa de hacer inferencias err6neas respecto a una poblacion diferente de la que ha sid a muestreada

Muestras alealarias y na alealarias En los ejemplos y ejercicios de este libra se supone que los datos analizados pravienen de muestras aleatorias La esshytricta validez de los pracedimientosestadisticos estudiados depende de esta suposishycion En muchos casas en las aplicaciones reales es imposible a impractico utilizar muestras verdaderamente aleatorias En experimentos con animales par ejemplo los investigadores frecuentemente utilizan cualquier animal cori el que cuenta el proveedor a su prapia raza de crianza Si los investigadores tuvieran que depender de materialseleccionado al azar se llevaria a cabo muy poca investigacion de este tipo Una vez mas las consideraciones no estadfsticas deben tamar parte en el praceso de generalizacion Los investigadores pueden afirmar que las muestras realmente utilizadas equivalen a muestras aleatorias simples dado que no hay rashy

154 CAPiTULO 6 ESTIMACIOl

zon para creer que el material utilizado no es representativo de la poblacion de la que se desea hacer inferencias

En muchos proyectos de investigacion en el area de la salud se utilizan muestras de conveniencia en lugar de muestras aleatorias Puede ser que los investigadores tengan que confiar en voluntarios 0 en personas disponibles como los estudiantes de su clase Nuevamente se debe hacer generalizaciones con base en consideraciones no estadisticas Sin embargo las consecuencias de dichas generalizaciones pueden ser utiles 0 pueden clasificarse desde erroneas hasta desastrosas

En algunos casos puede aplicarse aleatoriedad en un experimento aun cuanshydo los individuos disponibles no sean seleccionados aleatoriamente de alguna poshyblacion bien definida Al comparar dos tratamientos por ejemplo a cada individuo se Ie puede asignar aleatoriamente uno u otro de los tratamientos Las inferencias en tales casos se aplican a los tratamientos y no a los individuos y en consecuencia dichas inferencias son vaUdas

62 INTERVALO DE CONFIANZAPARA LI MEDIA DE UNA POBLICION

Suponga que un grupo de investigadores quiene estimar la media de una poblaci6n que sigue una distribucion normal Para ello extraen una muestra aleatoria de tamafio n de la poblacion y ca1culan el valor de x el cual utilizan como una estimashycion puntual de 11 Aunque este estimador de 11 posee todas las cualidades de un buen estimador se sabe que debido a los caprichos del muestreo aleatorio no se puede esperar que x sea igual a 11

Por 10 tanto serfa mucho mas significativo estimar 11 mediante un intervalo que de alguna forma muestre su probable magnitud 11

DistribuciOn muestral y estimaci6n Para obtener dicha estimacion por intervalos se debe aprovechar el conocimiento acerca de las distribuciones muestrales En este caso puesto que el interes esta en la media de la muestra como estimador de la media de una poblacion es necesario recordar 10 que se sabe resshypecto a la distribucion muestral de la media de la muestra

En el capitulo anterior se aprendio qu~ si el muestreo se realiza a partir de una pohlacion con distribucion normal la distribucion muestral de la media de la muestra presenta una distribucion normal con una media Ilx igual a la media de la poblacion 11 y variancia cr igual a cron Se podrfa graficar la distribucion muestral si se supiera en que lugar del eje xse localiza Con base en el conocimiento adquishyrido acerca de la distribucion normal en general se sabe aun mas sobre la distribushyci6n de xpara estecaso Por ejemplo se sabe que sin irilportar d6nde se localizan aproximadamente 95por ciento de los valores posibles de que constituyen la distribuci6n estan ados desviaciones estandarrespecto a la media Los dos puntos que estan ados desviaciones estandar de la media son 1l-2crx y 1l+2crx de tal manera que el intervalo de 11 plusmn2cr contendra aproxil11adamente 95 por ciento dex los valores posibles de x Aunque 11 y Ilx son desconocidas arbitrariamente se puede poner la distribuci6n muestral de x sobre eleje x

Dado que se desconoce el valor de 11 la expresion )i plusmn 2crx no dice mucho Sin embargo se tiene una estimaci6n puntual de 11 que es x (Resultaria uti obtener un intervalo en tomo a esta estimaci611 puntual de Il La respuesta es S1 Suponga

62 INTERVALO DE CONFIANZA PARA LA MEDIA DE UNAPOBLACION 155

a2 a2

FIGUR4 621 Intervalo de confianza de 95 por dento para l

que se forman intervalos a partir de todos los valores posibles de x cakulados a partir de todas las niuestras posibles de tamafio n de la poblacion de interes De esa forma se tendrfa un gran numerode intervalos de la forma xplusmn2crx con amplitushydes todas igtiales a la del intervalo en torno a lall desconocida Aproximadamente 95 por ciento de estos intervalos tendria centros que caen dentro del intervalo plusmn2crx en torno a 11 Cada uno de estos intervalos que caen dentro de 2cr en torno a 11 pueden contener ala misma 11 Estas ideas se muestran en la figura 621 En dicha figura se observa que xl XiY x4 caen dentro del intervalo 2cr en torno allY en consecuencia los intervalos 2cr alrededor de las medias de la muestra induyen el valor de IJ Las medias muestrales y Xs no caen derttro del intervalo 2cr en torno a IJ y los intervalos de 2crx en torno a ellas no incluyen a IJ

FJElIPLO 621 Suponga que un investigador interesado en obtener una estimacion del nivel promeshydio de alguna enzima en cierta poblacion de seres humano toma una muestra de 10 individuos determina elnivel de la enzima en cada uno de elIos y calcula la media de la muestra x 22 Ademas que la variable de interes sigue una distribucion aproximashydamente normal con una variancia de 45 Se desea estimar el valor de 11

Solucion Un intervalo de confianza de aproximadamente 95 por dento para 11 esta dado por

xplusmn2cr 22plusmn2 Gi10 22 plusmn2(21213) 17762624 bull

156 CAPITULO 6 ESTIMACION

Componentes para la estimaciOn del intervalo Examine la composishycion para la estimacion del intervalo elaborada en el ejemplo 621 Este contiene en su centro la estimacion puntual para 11 Se identifica a 2 como un valor de la distribucion normal estandar que indica a cuantos errores estandar estan aproxishymadamente 95 por ciento de los valores posibles de x Este valor de Z se conoce como coeficiente de confiabilidad EI ultimo componente (ix es el error estandar 0

desviacion estandar de la distribucion muestral de x En general una estimacion por intervalos se expresa como sigue

estimador plusmn (coeficiente de confiabilidad) x (error estandar) (621)

En particular cuando el muestreo se realiza a partir de una distribucion norshymal con variancia conocida una estimacion por intervalos para Jl se expresa como

donde z(l_lt12) es el valor de Z a la izquierda de donde esta 1 rtJ2 y ala derecha en que se encuentra rtJ2 del area bajo la curva

Interpretacion del intervalo de conftarua ~Como se interpreta el intershyvalo de la ecuacion 622 En este ejemplo donde el coeficiente de confiabilidad es igual a 2 se dice que al repetirel muestreo aproximadamente 95 por ciento de los intervalos construidos mediantela formula 622 induyen la media de la poblacion Esta interpretacion se basa en la probabilidad de ocurrencia de diferentes valores de x Es posible generalizar esta interpretacion si se designael area total blttio la curva de x que queda fuera del intervalo Jl plusmn 2(ix como ex y eIarea dentro del intervalo como 1 - ex y dar la siguiente interpretaciOn probabilistica de la formula 622

Interpretaci6n probabilistica

En el muestreo repetido de una poblaci6n condistribuci6n normal y desviaci6n estdndafmiddot conocida 100(1- a) por ciento de todos los intervalos de la forma Xplusmn Z(I_amOx incluyen a la larga la media de la poblaci6n 11

Ala cantidad 1 - (X en este caso 95se Ie conoce como eoeficiente (0 nivel) de conjianza y al intervalo XplusmnZ(1_12)(ix se Ie conoce comointervalo de conjianza para Jl Cuando (1 ex) =95 al intervalo se Ie llama intervalo de confianza de 95 por ciento para Jl En este ejemplo se dice que existe 95 por ciento de confianza d~ que la media de Ia poblacion este entre 1776 y 2624 A esto se Ie llama interpretacion practica de la formula 622 En general se puede expresar de la siguiente manera

Interpretaci6n practica

Cuando se hace un muestreo a partir de poblaciones que siguen una distribuci6n normal y con desviaci6n estdndar conocida existe un 100(1 - a) por ciento de confianza de que el intervalo calculado xplusmn z(l_aI2)Ox contiene la media de la poblaci6n Jl

62 INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACION 157

En el ejemplo 621 es preferible en lugar de 2un valor mas exacto para z 196 que corresponde al coeficiente de confianza de95 Los investigadores pueshyden utilizar cualquier coeficiente de confianza los mas utilizados son 90 95 Y 99 a los cuales se asocian factores de confiabilidad de 1645 196 Y 258 respectivashymente

Precision A la cantidad que se obtiene al multiplicar el factor de confiabilidad por el error estandar de la media se Ie llama precision de la estimaci6n Tambien se Ie llama margen de error

EJEMPLO 622

Un fisioterapeuta desea estimar con 99 por ciento de confianza la media de fuerza maxima de un musculo particular en cierto grupo de individuos Se inc1ina a suposhyner que los valores de dicha fuerza muestran una distribucion aproximadamente normal con una variancia de 144 Una muestra de 15 individuos que participaron en el experimento presento una media de 843

Soluci6n En latabla D el valor para z que corresponde a un coeficiente de conshyfianza de 99 es 258 Este es el coeficiente de confiabilidad El error estandar es de ax 12fl5 =30984 Por 10 tanto el intervalo de conshyfianza de 99 por ciento para ~ es

843 plusmn258(30984) 843 plusmn 80 763923

Se dice que se tiene 99 por ciento de confianza de que la media de la poblacion este entre 763 y 923 porque al repetirel muestreo 99 por ciento de todos los intervalos que pueden construirse en la forma descrishyta inc1uyen a la media de la poblacion bull

Situaciones en las que la variable de interes sigue una distribucion aproximadashymentenormal con una variancia conocida son muy raras y casi nunca se presentan en la practica El prop6sito de los ejemplos anteriores en los que se supone que existe esta condici6n ideal fue el de formar las bases teoricas para construir intershyvalos de confianza para las medias de la poblacion En la mayorf de los casos practicos las variables no siguen una distribuci6n aproximadamente normal 0 no se conocen las variancias de la poblaci6n 0 suceden ambas cosas En el ejemplo 623 y en la secci6n 63 se explican los procedimientos que se utilizan en situaciones menos ideales pero mas comunes

Muestreo a partir de pobluciunes que no presenlan una distribucion normal No siempre es posible 0 prudente suponer que la poblaci6n de interes muesshytra una distribuci6n normal Gracias al teOlema del limite central esto no sera un problema si se puede seleccionar una muestra 10 suficientemente grande Se ha dicho que para muestras grandes la distribucion muestral de Xi presenta una distribuci6n aproximadamente normal sin importar como esta distribuida la poblacion original

158 CAPiTULO 6 ESTIMACION

EJEMPLO 623

Un equipo de investigadores esta interesado en la puntualidad de los pacientes en las citas concertadas En un estudio de flqjo depacientes en los consultorios de medicos generales se encontr6 que una muestra de 35 pacientes llegaba 172 minutos tarde a las citas en promedio Una investigaci6n previa habia demostrado que la desviaci6n estandar era de 8 minutos aproximadamente Se tuvo la sensaci6n de que la distribushyci6n de la poblaci6n no era normal ~Cual es el intervalo de confianza de 90 por ciento para 11 que es el promedio real de impuntualidad en las citas

Soluci6n Dado que el tamafio de la muestra es bastante grande (mayor que 30) y se conoce la desviaci6n estandar de la poblaci6n la situaci6n se aproxishyrna al teorema del limite central y se supone que la distribuci6n muestral de xpresenta una distribud6n aproximadamente normal AI consultar la tabla D se encuentra que el coeficiente de confiabilidad que corresponshyde a uri coeficiente de confianza de 90se aproxima a 1645 si se interpola El error estandar es de C5z 8-35 13522 de modo que el intervalo de confianza de 90 por ciento para 11 es

172 plusmn 1645(13522) 172 plusmn 22 150 194 bull

Con frecuencia cuando la muestra es 10 suficientemente grande para aplicar el teorema dellfmite central la variancia de la poblacion se desconoce En ese caso se sustituye esta variancia conla de la muestra en la f6rmula para construir el intervashy10 de confianza para la media de la poblacion

Andlisispor computadora Cuando se requiere de los intervalos de confianza se economiza una buena cantidad de tiempo mediante el uso de una computadora la cual puede ser programada para construir los intervalos de datos no procesados

EJEMPLO 624

Los siguientes datos corresponden a los valores de la actividad (micromoles por minuto por gramo de tejido) de cierta enzima medida en el tejido gastrico normal de 35 pacientes con carcinoma gastrico

60 1189 614 788 273 2464 571 1827 537 374 449 262 448 971

372 898 411 348 1925 550 622

610 319 406 413 767 385 674

521 603 533 662 1177 307 1499

Mediante el uso del paquete de software para computadora MINITAB se pretenshyde construirun intervalo de confianza de 95 por ciento para la media de la poblashycion Suponga que la variancia de la poblaci6n es iguala 36 No es necesario suponer que la poblaci6n muestreada de val ores sigue una distribuci6n normal porque el tamafio de la muestra es losuficientemente grande para aplicar el teoreshyrna del limite central

159 62 INTERV ALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACION

Caja de dialogo Comandos de la sesi6n

Statgt Basic Statisticsgt 1-Sample z MTB gt ZINTERVAl 95 6 C1

Teclear Cl en Variables Se1ecdonar Confidence interval y teclear 95 en la caja de texto Teclear6 en Sigma Clic OK

Resultados

Confidence Intervals

The assumed sigma = 0600

Variable MicMoles

N 35

Mean 0718

StDev 0511

SE Mean 0101

950 Cr (0519 0917)

FIGURA 622 Procedimiento del paquete MINITAB para construir un intrevalo de conshyfianza de 95 por ciento para la media de la poblacion ejemplo 624

Solucion Se introducen los datos en lacolumna 1 y se procede como se muestra en la figura 622 Estas instrucdones indican a la computadora que e1 factor de confiabilidad es z que se necesita unintervalo de conshyfianza de 95 por dento que la desviaci6n estandarde la poblaci6n es de 6 y que los datos estan en la columna 1 El resultado indica que la media de la muestra es 718 la desviad6n estandar es 511 y e1 error estandar de la media af es 6J35 101

Se tiene 95 pordento middotde confianza de que la media de la poblashyci6n se encuentra entre 519y 917 bull

Puede obtenerse los intervalos de confianza a traves de otros paquetes de sofuvare Por ejemplo SASreg puede construir intervalos de confianza a traves de PROC MEANS o PROC UNIVARIATE

Otras eslimaciones de La tendencia central Tal como se ha visto la meshydia es muy sensible a los val ores extremos es dedr aquellos que se desvfan consideshyrablemente de la mayorfa de las mediciones en el con junto de datos A dichos valores se les conoce como sesgos Tambien se puede apreciar que lamediana que no es sensible a las mediciones extremas algunas veces se utiliza en lugar de la media como medida de tendenda central cuando los sesgos estan presentes Por la misshyrna raz6n quiza se prefiera el uso de la mediana de la muestra comomiddotestimador de la rnediana de la poblaci6n cuando se requiere realizar inferencias acerca de la tendenda central de la poblaci6n No solamente se utiliza la mediana de la muestra

160 CAPITULO 6 ESTlMACION

como una estimacion puntual para la mediana de la poblacion sino que tambien es posible construir un intervalo de confianza para la mediana de la poblacion En esta obra no se proporciona la formula pero esta se puede encontrar en la obra de Rice (1)

Media ajustada Los estimadores que son insensibles a los sesgos se Haman estimadores eficaces Otra medida y estimador eficaz de tendencia central es la media ajustada Para un conjunto de datos que contiene n mediciones se calcula el 1000 por ciento de la media ajustada como sigue

1 Ordenar las mediciones

2 Descartar las medici ones mas pequeiias y mas grandes que 100a por ciento de las mediciones El valor recomendado para a esta entre 1 y 2

3 Calcular la media aritmetica de las mediciones restantes

Observe que la mediana podrfa considerarse como 50 por ciento de la media ajusshytada Se debe recordar que la media ajustada para el conjunto de datos es una de las medidas descriptivas que puede calcular MINITAB

FJERCICIOS

Construya para cada uno de los siguientes ejercicios los intervalos de confianza al 90 95 Y 99 por ciento para la media de la poblacion y establezca para cada uno la interpretacion probabilistica y practica Indique cualinterpretacion puede ser mas aderuada para utilizar ruando se trata sobre intervalos de confianza con alguien que no conoce de estadfstica y establezca eI razonamientode por que se eUgi6 Explique por que los tres intervalos no tjenen la misma amplitud Indique cual de los tres intervalos es preferible como estimador de la media de la poblacion y establezca el razonamiento de la elecci6n

621 Se pretende estimar el numero promedio de latidos del coraz6n por minuto para cierta poblaci6n Se encontr6 que el numero promedio de latidos por minuto para 49 personas era de YO Considere que esos 49 pacientes constituyen una muestra aleatoria y que la poblacion sigue una distribucion normal con una desviaci6n estandar de 10

622 Se pretende estimar la concentraci6n media de bilirrubina indirecta en el suero en nmos de cuatro dias de nacidos La media para una muestra de 16 ninos es de 598 mglOO cc Conshysiderese que la concentraci6n de bilirrubina en los ninos de cuatro dfas de nacidos sigue una distribucion aproximadamente normal con una desviaci6n estandar de 35 mgIOO cc

623 En un estudio acerca de la duraci6n de la hospitalizacion dirigido por vados hospitales en cooperacion se extrajo una muestra aleatoria de 64 individuos con ulcera peptica de la lista de todos los pacientes con esa enfermedad internados alguna vez en los hospitales particishypantes Se determin6 para cada uno de eUos el tiempo de hospitalizaci6n Se encontr6 que la duraci6n media de hospitalizaci6n fue de 825 dfas y se sabe que la desviaci6n estandar de la poblaci6n es de tres dfas

624 Una muestrade 100 hombres adultos aparentemente sanos de 25 anos de edad muestra una presi6n sist61ica sangufnea media de 125 Considere que la desviaci6n estandar de la poblaci6n es de 15

161 63 DISTRIBUCI6N

625 Algunos estudios acerca de la enfermedad Alzheimer (EA)han mostrado un incremento en la producci6n de 14C0

2 en pacientes con ese padecimiento Durante un estudio se obtuvieshy

ron los siguientes valores de 14C02

a partir de 16 biopsias de neocorteza de pacientes con la enfermedad (EA)

1009 1280 1180 12551547 2352 1956 1080

1776 1767 1680 2050 1452 2857 3100 1621

Considereseque la poblaci6n sigue una distribuci6n normal con una desviaci6n estandar de 350

63 DISTRIBUCION t

En la seccion 62 se describe un procedimiento para obtener un intervalo de conshyfianza para la media de una poblaci6n EI procedimiento requiere del conodmiento de la varianda de la poblacion de la que se extrae la muestra Puede parecer un tanto extrafio que se tenga conocimiento de lavariancia de la poblacion y no se conozca elvalor de la media de la poblacion De hecho es comun en situacioshynes como las que se han presentado que se deSconozca tanto la variancia como la media de la poblacion Esta situacionpresenta un problema respecto a la construcshycion delos intervalos de confianza Por ejemplo aun cuando la estadfstica

x J1shyZ=---

crJn presenta una distribudon normal cuando la poblacion tambien tiene una distribuci6n normal y sigue una distribuci6n aproximadamente normal cuando n es muy grande independientemenle de la forma funcional de la poblacion no se puede hacer uso de este hecho porque cr se desconoce Sin embargo no todo esrn perdido y la soluci6n mas logica para este problema es utilizar la desviacion estandar de ~muestra

s = ~L(Xi - x)2(n-l)

para sustituir cr Por ejemplo cuando el tamafio de la muestra es mayor que 30 la confianza en s como una aproximacion de cr es por 10 general sustancial por 10 que se justifica la utilizacion de la teorfa de la distribudon normal para construir un intervalo de confianza para la media de la poblacion En tal caso se procede como se indica en la seccion 62

Cuando se tienen muestras pequefias es imprescindible encontrar otro proceshydimiento para construir intervalos de confianza

Como resultado del trabajo de Gosset (2) escrito bajo el seudonimo de Student se dispone de otra alternativa conocida como distribuci6n t de Student con frecuenda abreviada como distribuci6n t

La cantidad

sigue esta distribucion

162 CAPiTULO 6 ESTIMACION

Propiedades de la distribucion t La distribuci6n t tiene las siguientes proshypiedades

1 Tiene una media de O

2 Es simetrica con respecto a la media

3 En general tiene una variancia mayor que 1 pero esta tiende a I a medida que aumenta el tamaiio de la muestra Para dfgt 2 la variancia de la distribushyci6n t es dfl(df - 2) donde df representa los grados de libertad En forma alterna puesto que df n - 1 para n gt 3 se puede escribir la variancia de la distribuci6n t como (n l)(n 3)

4 La variable t va de - hasta + 00DO

5 La distribuci6n t es realmente una familia de distribuciones puesto que hay una distribuci6n diferente por cada valor de la muestra de n - 1 que es el divisor que se utiliza para ca1cular S2 Recuerde que n - 1 representa los grados de libertad En la figura 631 se muestran las distribuciones t correspondienshytes a algunos valores de los grados de libertad

6 Comparada con la distribuci6n normal ladistribuci6n t es menos espigada en el centro y tiene colas mas largas En la figura 632 se com para la distribushyci6n t con la distribuci6n normal

7 La distribuci6n t se aproxima ala distribuci6n normal a medida que n - 1 se aproxima al infinito

La distribuci6n t al igual quela distribuci6n normal estandar se ha tabulado ampliamente Una de estas tablas es la tabla E del apendice Tal como se puede apreciar se debe tomar en cuenta eLcoeficiente de confianza y los grados de libershytad cuando se utiliza la tabla de la distribuci6n t

FIGUR- 631 Distribuci6n t para diferentes grados de libertad

-----

163 63 DISTRIBUCION

__ Distribucion normal

- - - Dislribucion I

x

FIGURA 632 Comparaci6n de las distribuciones normal yt

Es posible utilizar el paquete MINITAB para graficar la distribuci6n t (para grados espedficos de libertad) y otras distribuciones Despues de asignar el eje horizontal y las siguientes direcciones en el cuadro de Set Patterned Data seleccioshyne del menu Calc y despues Probability Distributions Utilice el cuadro de diashylogo Plot para generar la grafica

Inlervalos de conJiQllia qllR uJilban fa dislribucion t El procedimien to general para construir interval os de confianza no se ve afectado por la necesidad de utilizar la distribuci6n t en lugar de la distribuci6n normal estandar Aun es necesario usar la relaci6n expresada por

estimador plusmn (coeficiente de confiabiIidad) x (error estandar)

Lo que es diferente es el origen del coeficiente de confiabilidad Este se obtiene a partir de la tabla de la distribucion t en lugar de la tabla de la distribuci6n normal estandar Para ser mas especfficos cuando se obtienen muestras a partir de una distribushycion normal cuya desviaci6n estdndi17 a se desconoce ell OO( 1 - a) por ciento del intervalo de confianza para la media de la poblaci6n J1 estd dado por

(631 )

Es importante aclarar que el requisito para el uso valido de la distribucion t es que la muestra debe ser extrafda de una poblad6n con distribucion normal Sin embarshygo la experiencia ha demostrado que se pueden tolerar desviaciones moderadas de esterequisito Como consecuencia la distribucion t se utiliza incluso cuando se sabe que la poblaci6n original se desvia de la normalidad Lltl mayorfa de los invesshytigadores requieren que al menos pueda sostenerse el supuesto de una distribushyd6n de poblacion en forma de montfculo

EJEMPLO 631

Maureen McCauley (A-I) realiz6 un estudio para evaluar los efectos de un conjunto de instrucciones de mecanica en ellugar de labores sobre el desempeno laboral de obreros jovenes recientemente contratados Se utilizaron dos grupos de individuos elegidos aleatoriamente uno de los grupos para aplicar el experimento y el otro

164 CAPITULO 6 ESTlMACI6N

como grupo de control EI grupo con el que se experimento recibio una hora de capacitacion impartida por un terapeuta ocupacional EI grupo de control no recishybio esta capacitacion Para evaluar el esfuerzo de cada obrero para levan tar bajar jalar y transportar objetos dentro del entorno laboral se utilizo una lista de cotejo para la evaluacion de trabajo mecanico que inclufa criterios de referencia Una tarea bien hecha recibio una calificacion de 1 EI grupo de control formado por 15 individuos alcanzo una calificacion media de 1153 en la evaluacion con una desshyviacion estandar de 3681 Se supone que el grupo de control se comporto como una muestra aleatoria extraida de una poblacion similar de individuos Se pretende utilizar los datos de la muestra para estimar la calificacion media para la poblacion

Soluci6n Se puede utilizar la media de la muestra 1153 como una estimacion puntualde la media de la poblacion sin embargo debido a que se descoshynoce la desviacion estandar de la poblacion se debe considerar que los valores siguen una distribucion aproximadamente normal antes de consshytruir los intervalos de confianza para l Se considera que esta suposicion es razonable y que se necesita un intervalo de confianza de ~or cienshyto el estimador es i y el error estandar es s -r 681 15 =9504 Ahora es necesario conocer el coeficiente de confiabilidad el valor de t asodado al coeficiente de confianza de 95 y a los n 1 = 14 grados de libertad Puesto que el intervalo de confianza de 95 por ciento deja 05 del area bajo la curva de t para dividirse en dos colas iguales se necesita el valor de tala derecha del cual esta el 025 del area Este valor se localiza en la tabla E enla columna encabezada por t

975 bull Este es el valor

para tala izquierda delcual esta 975 del area bajo la curva EI area a la derechade este valor es igual al 025 deseado Ahora sobre la columna de grados de libertad se localiza el numero 14 EI valor para t se encuentra en la interseccion del renglon con la etiqueta 14 y la columna con la etiqueta t975 bull Se encuentra que este valqr para t que representa al coeficiente de confiabilidad es 21448 Finalmente el intervalo de confianza de 95 por ciento se construye como sigue

1153 plusmn 21448(9504) 1153 plusmn 204 949 1357 bull

Este intervalo puede interpretarse con ambos puntos de vista probabiHstico y practico Puede asegurarse en un 95 por dento que 1a media l correcta de la poblacion se encuentra entre 949 y 1357 porque al repetir el muestreo 95 por dento de los intervalos construidos deigual manera incluyen a l

Decidir entre z r t Cuando se obtiene un intervalo de confianza para la media de una poblacion se debe decidir si se utiliza un valor de z6 de t como factor de confiabilidad Para hacer una elecci6n adecuada se debe considerar el tamafto de la muestra si la poblacion muestreada sigue una distribucion normal y si la varian cia de la poblacion es conocida La figura 633 muestra un diagrama de flujo que se puede utilizar para decidir rapidamente si el factor de confiabilidad debe ser Z 0 t

EJERCICIOS 165

EJERCICIOS

Sa aplica al leorema dellfmile central

FIGURA 633 Diagrama de flujo para deddir entre utililizar z y t cuando se hagan inferencias respecto a las medias de la poblaci6n (Para utilizar un procedimiento no parametrico vease el capitulo 13)

Analisis par computadara Si el proposito es construir un intervalo de conshyfianza con el programa MINITAB para la media de la poblacion cuando el estadfsshytico t es el factor de confiabilidad adecuado el comando se inicia con la palabra TINTERVAL Seleccione en Windows I-Sample t desde el menu de Basic Statistics

631 Utilice la distribud6n t para encontrar el factor de confiabilidad para el intervalo de confianshyza basado en los siguientes coeficientes de confianza y tamafiosde las muestras

a b c d

Coefidente de confianza 95 99 90 95 Tamafio de la muestra 15 24 8 30

632 En una investigacion acerca de la dependencia del flujo y volumen de todo el sistema respishyratorio en un grupo de pacientes con enfermedad obstructiva pulmonar cronica conectados a respiradores artificiales Tantucci et ai (A-2) registraron los siguientes valores de linea de

166 CAPITULO 6 ESTIMACION

base del flUjD continuo inspiratDriD (Us) 90 97 103110 104 100 CDnsidere que una muestra aleatDria simple esta cDnfDrmada pDr seis individuDs a partir de una pDblacion que sigue una distribuci6n nDrmal CDn individuDs CDn la misma enfermedad

a) ~Cuat es la estimaci6n puntual de la media de la pDblaci6n

b) ~Cuil es la desviacion estandar de la muestra

c) ~Cultll es la estimacion del error estandar para la media de la muestra

d) CDnstruya un intervalD de cDnfianza de 95 pDr ciento para el flUjD mediD cDntinuD inspishyratDriD de la pDblaci6n

e) ~Cual es la precision de la estimacion

f) Explique la interpretaci6n prDbabilistica para este intervalD de confianza

g) Explique la interpretacion practica para este intervalD de cDnfianza

633 LlDyd y MaillDux (A-3) informaron IDS siguientes datDs acerca del peso de la glandula pituitaria en una muestra de cuatrD ratas de Wistar Furth

media = 90 mg error estandar para la media = 3

FUEJTE Ricardo V Lloyd y Joe Mailloux Analysis ofSshy100 Protein Positive Folliculo Stellate Cells in Rat Pituitary Tissues AmericanJournal ofPathology 133 338-346

a) ~Cual es la desviadon estandar de la muestra

b) CDnstruya un intervalD de confianza de 95 pDr ciento para el peso medio de la glandula pituitaria para una pDblacion similar de ratas

c) ~Que supDsiciDnes se necesitan para que sea validD el intervalo de cDnfianza del inciso b

d) ~Que interpretacion puede ser la mas indicada cuandD se trata sDbre intervalos de conshyfianzacon alguien que no sabe de estadfstica Explique pDrque es la mas cDnveniente

e) 5i fuera necesario elabDrar un intervalD de cDnfianza de 90 pDr cientD para la media de la pDblaci6n ~el intervalD de cDnfianza serta mayDr 0 menor que el intervalD de 95 pDr dentD Explique su respuesta sin construir realmente el intervalD de cDnfianza

f) 5i [uera necesariD considerar un intervalo de CDnfianza de 99 pDr cientDpara lamedia de la poblacion ~el intervalo de cDnfianza serra mayDr 0 menDr que el intervalD de 95 pDr dentD Explique su respuesta sin cDnstruir realmentt el intervalD de cDnfianza

634 Kaminski y Rechberger (A-4) encontrarDn en un estudio sDbre la preeclampsia que la media de la presi6n sistolica sangufnea en 10 mujeres sanas y que no estan embarazadas es de 119 CDn una desviacion estandar de 21

a) 2Cual es el errDr estandar estimadD para la media

b) CDnstruya un intervalD de confianza de 99 pDr cientD para la media de la poblaci6n a partir de la cual puede considerarse que IDS 10 individuos conforman una muestra aleatoria

c) ~CUlil es la precisi6n estimada

d) ~Que consideraciones deben hacerse para comprobar la validez del intervalo de confiahza

635 Unamuestra de 16nifias de 10 afiDS pesan en promediD 715 con una desviacion estandar de 12libras CDnsidere el calculD de intervalDs de cDnfianza de 9095 y 99 pDr ciento para I-L

167 64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS

636 Una muestra aleatoria simple conformada por 16 individuos aparentemente sanos presenta los siguientes valores de arsenico eliminado en la orina (miligramos por dfa)

Individuo Valor Individuo Valor

1 007 9 012 2 030 10 006 3 025 11 010 4 008 12 032 5 030 13 006 6 038 14 009 7 007 15 014 8 005 16 011

Elabore un intervalo de confianza de 95 por ciento para la media de la poblaci6n

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES

En ocasiones se presentan casos en los que se desea estimar 1a diferencia entre 1a media de dos poblaciones A partir de cada poblacion se extrae una muestra aleatoria independiente y de los datos de cada una se calculan las medias muestrales XI y x2

respectivamente En el capitulo anterior se dijo que el estimador XI - x2 ofrece una estimacion insesgada de la diferencia entre las medias de las poblaciones III shy11 2 bull La variancia del estimador es (cr~ n l ) + (cr~ n 2 ) Tambien se menciono que seglin las condiciones la distribucion muestral de XI - x2 puede presentar una distribution al menos aproximadamente normal de modo que en muchos casos se utiliza la teorfa adecuada para las distribuciones normales en el calculo de un intershyvalo de confianza para III - 11 2 bull Cuando se conocen las variancias de la poblacion el intervalo de confianza del 100(1 - ex) por ciento para III - 112 esta dado por

(641)

El anal isis del intervalo de confianza para la diferencia entre las medias poblacionales ofrece informacion util para decidir si es 0 no probable que las medias de las dos poblaciones sean iguales Cuando el intervalo no incluye al cero se dice que el intervalo ofrece evidencia de que las dos poblaciones tienen medias diferentes Cuando el intervalo incluye al cero se dice que las poblaciones pueden tener meshydias iguales

Esto se ilustra a continuacion para el caso donde el muestreo se realiza a partir de una distribucion normal

168 CAPITULO 6 ESTlMACI6N

EJEMPLO 641

A un equipo de investigacion Ie interesa conocer la diferencia entre las concentracioshynes de acido urico en pacientes con y sin el sfndrome de Down En un gran hospital para el tratamiento de pacientes con retardo mental una muestra de 12 individuos con el sindrome presenta una media de XI = 45 mgll00 mL En un hospital general se encontro que una muestra de 15 individuos normales de la misma edad y sexo presenta un nivel medio de x2= 34 Si es razonable suponer que las dos poblaciones de valores muestran una distribucion normal y sus variancias son iguales a 1 y 15 calcule el intervalo de confianza de 95 por ciento para ~l - ~2

Soluci6n Para una estimacion puntual de III 112 se udliza Xl X2= 45 34 11 EI coeficiente de confiabilidad que corresponde a 95 localizado en la tabla D es 196 EI error estandar es

Por 10 tanto el intervalo de confianza de 95 por ciento es

11 plusmn 196(4282) 11plusmn84 26 194

Se dice que se dene una confianza de 95 por ciento de que la difeshyrencia real 111 - 112 este entre 26 y 194 porque en muestreos repetidos 95 por ciento de los intervalos construidos de esa manera incluiria la diferencia entre las medias reales

Puesto que el intervalo no incluye al cero se concluye que las dos poblaciones tienen diferentes medias bull

Muestreo a partir de poblaciones que no signen una distribuci6n ItOrmal La construccion de un intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando el muestreo se realiza a partir de poblaciones no normales se lleva a cabo en la forma descrita en el ejemplo 641 si las muestras n l y n

2 son grandes Una vez mas este es un resultado del teorema del limite central

Si se desconocen las variancias de la poblacion se utili zan las variancias de las muestras para estimarlas

IUEMPLO 642

Motivados por d conocimiento de la existencia de una gran cantidad de textos polemicos que sugieren que el estres la ansiedad y la depresion son dafiinos para el sistema inmunologico Gormanet ai (4-5) condujeron un estudio en el que se conshysider6 a individuos varoneshomosexuales algunos con VIH (virus de inmunodefishyciencia humana) positivo y otros con VIH negativo Los datos fueron registrados con una amplia vltJriedad de mediciones medicas inmunologicas psiquiatricas y neurol6gicas una de las cuales corresponde al numero de celulas CD4+ en la sanshy

64 INTERV ALO DE CONFIANZA PAHALA DIFERENCIA ENTRE DOS MEDIAS 169

gre El numero promedio de celulas CD4+ para middot112 individuos con infecci6n por VIR fue de 4018 con una desviaci6n estandar de 2264 Para los 75 individuos sin la infecci6n por VIR la media y la desviaci6n estandar fueron de 8282 y 2749 respectivamente Se pretende elaborar un intervalo de confianza de 99 por ciento para la diferencia de las medias de las poblaciones

Soluci6n No hay informaci6n con respecto a la forma de la distribuci6n de las celulas CD4+ Sin embargo como el tamafto de las muestras es grande el teorema del limite central asegura que la distribuci6n muestral de las diferencias entre las medias de la muestra siguen una distribuci6n aproxishymadamente normal independientemente de que la distribuci6n de la variable en las poblaciones no siga una distribuci6n normal Se puede utilizar este hecho para justificar el uso de la estadistica z como factor de confiabilidad en la construcci6n del intervalo de confianza Tampoco hay informaci6n acerca de las desviaciones estandar por 10 que puede emplearse las desviaciones estandar de las muestras para estimarlas La estimaci6n puntual para la diferencia entre las medias de las poblacioshynes es la diferencia entre las medias de las muestras 8282 - 4018 = 4264 En la tabla D se encuentra que el factor de confiabilidad es 258 La estimaci6n del error estandar es

s __ = 27492

+ 22642 =382786

Xl-X 75 112

Por la ecuaci6n 641 el intervalo de confianza de 99 por ciento para la diferencia entre las medias de la poblaci6n es

4264 plusmn 258(382786) 3276 5252

Se tiene la seguridad de 99 por ciento de que el promedio de celulas CD4+ en varones con VIR positivo difieren de la media para los varoshynes con VIR negativo por 3276 a 5252 bull

Distribuci6n t y la diferencia entre las medias Cuando no se conocen las variancias y se pretende estimar la diferencia entre las medias de dos poblacioshynes con un intervalo de confianza es posible utilizar la distribuci6n t para suminisshytrar el factor de confiabilidad si se conocen ciertas suposiciones se debe saber 0

suponer de buena fe que las dos poblaciones muestreadas siguen una distribuci6n normal Respecto a las variancias de las poblaciones se debe distinguir entre dos situaciones 1) la situaci6n en la que las variancias son iguales y 2) la situaci6n en la que no 10 son A continuaci6n se consideranambas sitpaciones por separado

Varianciaspoblacifmales iguales Si la suposici6n sobre igualdad de las variancias de las poblaciones esta justificada las dos variancias de las muestras calculadas a partir de las muestras independientes pueden considerarse como estishymaciones de 10 mismo es decir la variancia comun Parece 16gico entonces aproshyvechar este hecho en el anal isis en cuesti6n Esto es precisamente 10 que se hace para establecer una estimaci6n conjunta para la variancia comun Esta variancia se obtiene mediante el caIculo promedio ponderado de las dos variancias de las muesshy

170 CAPITULO 6 ESTlMACI6N

tras Cada variancia de la muestra es ponderada con base en sus grados de libertad Si los tamafios de las muestras son iguales este promedio ponderado es la media aritmetica de las variancias de las dos muestras Si el tamano de las dos muestras es distinto el promedio ponderado aprovecha la informacion adicional proporcionada por la muestra mayor La estimacion con junta se obtiene con la fOrmula

S2 = (nl _1)SI2 + (n2 l)s~ p (642)

+n2 -2nl

Asf la estimacion del error estandar esta dada por

(643)

y el intervalo de confianza de 100(1 a) por ciento para III 112 esta dada por

(644)

El nfunero de grados de libertad utilizado para determinar el valor de t que se usa para construir el intervalo es n

1 + n

2 2 que es el denominador de la ecuacion

642 Este intervalo se interpreta en la forma habitual Los metodos que pueden emplearse para tomar la decision acerca de la igualshy

dad de las variancias de las poblaciones se estudian en la seccion 610 y 78

EJEMPLO 643

Uno de los estudios de Stone et al (A-6) tuvo como objetivo determinar los efectos del ejercicio por un tiempo prolongado en los ejecutivos de una compania inscritos en un programa supervisado de acondicionamiento fisico Se registraron datos de 13 individuos (el grupo deportista) que voluntariamente se inscribieron el programa y que permanecieron activos por 13 anos en promedio y de 17 individuos (el segunshydo grupo el sedentario) que decidieron no inscribirse Entre los datos que se regisshytraron acerca de los individuos esta el mlmero maximo de sentadillas realizadas en 30 segundos El grupo deportista obtuvo una media y una desviacion estandar de 210 y 49 respectivamente La media y la desviacion estandar para el grupo sedenshytario fueron 121 y 56 respectivamente Se considera que las dos poblaciones de medici ones de acondicionamiento muscular siguen una distribuci6n aproxirnadashymente normal y que las variancias para ambas poblacionesson iguales Se pretenshyde elaborar un intervalo de confianza de 95 por ciento para Ja diferencia entre las medias de as poblaciones representadas por las dos muestras Soluci6n Primero se utiliza la ecuaci6n 642 para calcular la estimaci6n conjunta

de la variancia comtin de las poblaciones

(13-1)(49 2 )+(17 1)(562 ) =2821

13+17-2 Cuando se consulta la tabla E con 13 + 17 - 2= 28 grados de libertad y el nivel de confianza de 95 se encuentra que eLfactor de confiabilidad es 20484 Con la ecuacion 644 se calcula el intervalo de confianza de

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS 171

95 por ciento para la diferencia entre las medias de las poblaciones de la siguiente manera

2821 2821(210-121)plusmn20484 --+-shy

13 17 89 plusmn 40085

49129

Se tiene una confianza de 95 por ciento de que la diferencia entre las medias de las poblaciones estan entre 49 y 129 Se puede decir esto porque se sabe quesi se repite el amilisis muchfsimas veces y se calculan los intervalos de confianza de la misma manera cerca de 95 por ciento de los intervalos de confianza induiran la diferencia entre las medias de las poblaciones

Debido a que los intervalos no induyen al cerose conduye que las medias de las poblaciones son diferentes bull

Variancias poblacionales distintas Cuando no se puede conduir que las variancias de dos poblaciones de interes son iguales aun ruando pueda suponerse que las dos poblaciones presentan distribuciones normales no es adecuado utilizar la distribucion t como se acaba de describir para construir los intervalos de confianza

Una solucion al problema de variancias distintas fue propuesta por Behrens (3) y posteriormente fue verificada y generalizada por Fisher (4 5) Neyman (6) Scheffe (7 8) Y Welch (9 10) tambien proponen soluciones EI problema es analizashydo en detalle por Cochran (11)

EI problema gira en tomo al hecho de que la cantidad

no sigue una distribuci6n t con nj + n 2 grados de libertad ruando las variancias 2 shy

de las poblaciones son distintas Consecuentemente la distribucion t no se puede utilizar en la forma habitual pata obtener el factor de confiabilidad del intervalo de confianza para la diferencia entre las medias de dos poblaciones que tienen variancias diferentes La solucion propuesta por Cochran consiste en el calculo del factor de confiabilidad mediante la siguiente formula

wltj + w2tZ t l

f

-0f2 = (645) WI +w2

donde WI 512

np W 2 = s~ n2 tl = tl _ para nj - 1 grados de libertad y t2 = t l

_w2aI2

para n2

- 1 grados de libertad Un intervalo aproximado de confianza del 100(1 shya) por ciento para III - 112 esta dado por

(646)

172

EJERCICIOS

CAPITULO 6 ESTlMACION

FJEIUPLO 644

En la investigacion de Stone et al (A-6) descrita en el ejercicio 643 los investigashydores tambien informaron los siguientes datos de las medici ones referentes a todas las calificaciones del acondicionamiento muscular logradas por los individuos

Muestra n Media Desviaci6n estimdar

Grupo deportista 13 45 3

Grupo sedentario 17 37 10

Se considera que las dos poblaciones de todas las calificaciones de acondicionashymiento muscular siguen una distribuci6n aproximadamente normal Sin embargo no debe suponerse que las dos variancias poblacionales son iguales Se pretende construir un intervalo de confianza de 95 por ciento para la diferencia entre las medias de todas las calificaciones de acondicionamiento muscular para las dos poshyblaciones representadas por las muestras

Soluci6n Se utiliza t de la ecuaci6n 645 para calcular el factor de confiabilidad En la tabla E se muestra que con 12 grados de libertad y 1 - 052 = 975 t( 21788 Analogamente con 16 grados de libertad y 1- 052 = 975 t2 = 21199 Ahora Sf calcula

(3 2 13)(21788) + (102 17)(21199) 139784 t= =

(3 2 13)+(102 17) 065747

=21261

Con la ecuaci6n 646 ahora se construye el intervalo de confianza de 95 por ciento para la diferencia entre las medias de las dos poblaciones

2 2

(45 37)plusmn21261 3 + 10 13 17

8 plusmn 21261 (25641101) 25134

Puesto que el intervalo no incluye acero se concluye que las medias de las dos poblaciones son diferentes bull

Cuando se construyen intervalos de confianza para la diferencia entre las medias de dos poblaciones es posible utilizar la figura 641 para decidir rapidashymente si el factor de confiabilidad debe ser z t 0 tf

Para cada uno de los siguientes ejercicios construya intervalos de confianza de 90 95 y 99 par ciento para las diferencias entre las medias poblacionales Establezca consideraciones que hagan que el metodo sea valido Determine las interpretaciones practica y probabilistica

clJ clJ FIGURA 541 Diagrama de flujo para decidir si e1 factor de confiabilidad debe ser z tot cuando se realizan inferencia inferencias acerca de la diferencia entre las medias de dos pobladones (Para usar un procedimiento no parametrico ver el capitulo 11)

174 CAPiTULO 6 ESTlMACION

para cad a intervalo construido Suponga las variables bajo considerati6n en cad a ejercicio y establezca para que pueden servir a los investigadores esos resultados

641 EI objetivo de un experimento de Buckner et al (A-7) consisti6 en estudiar los efectos del relajamiento muscular inducido por el pancuronium en el volumen del plasma circulante Los individuos estudiados son recien nacidos con un peso mayor a 1700 gramos que necesishytaron de ayuda para respirar durante las primeras 24 horas despues de nacer y cumplieron con otros criterios cHnicos Cinco recien nacidos paraIizados con el pancuronium y siete recien nacidos no tratados presentaron las siguientes estadisticas en la segunda de las tres mediciones del volumen de plasma (ml) hecha durante la respiraci6n mecanica

Paralizados 480 81 No tratados 567 81

La segunda medici6n para el grupo tratado ocurri6 de 12 a 24 horas despues de la primera dosis de pancuronium Para el grupo no tratado las mediciones se hicieron de 12 a 24 horas despues de iniciar la respiracion mecanica

642 Zuckery Archer (A-8) afirman que la N-nitrosobis (2-oxopropyl)amina (BOP) y las nitrosaminas 3-oxidizadas producen una alta incidencia de tumores de conductos pancreaticos en el hamster dorado sirio Estudiaron los efectos en el peso sangufneo en la glucosa del plasma en la insulina yen los niveles de transamina glutamico-oxaloacetica del plasma (GOT) de los hamsters expuestos in vivo a la BOP Los investigadores reportaron los siguientes resultados en ocho animales tratados y 12 sin tratamiento

Variable Sin tratamiento Con tratamiento

Glucosa del plasma (mglgl) 101 plusmn 5 74plusmn 6

FUENTE Peter F Zucker y Michael C Archer Alterations Pancreatic Islet Function Produced by Carcinogenic Nitrosamines in the Syrian Hamster AmericanJournal oPathology 133 573-577

Los datos son la media de la muestra plusmn la estimaci6n del error estandar de la media de la muestra

643 Los objetivos de un estudio de Davis et al (A-g) son evaluar 1) la eficacia del programa auto ayuda momento para dejar de fumar cuando se utiliza con base de uno a uno en el hogar y 2) la viabilidad de ensefiar temicas para abandonar el habito de fumar a los estudiantes de enfermerfa en bachillerato A estudiantes graduados de enfermerfa inscritos en dos cursos de metodologia de la investigacion de la Universidad de Ottawa se les invit6 a participar en el proyecto Se aplic6 un cuestionario de opcion multiple para abandonar el habito de fumar a 120 estudiantes de enfermeria que participaron y a otros 42 estudiantes que no participashyron antes ni despues del estudio Se calcularon las diferencias entre las calificaciones antes y despues del estudio as como las siguientes estadisticas a partir de las diferencias

EJERCICIOS 175

Grupo Media Desviaci6n estandar

Participantes (A) 214444 15392 No participantes (B) 33333 14595

644 El doctor Ali Khraibi (A-IO) de la CHnica y Fundaci6n Mayo condujo una serie de experishymentos con el fin de evaluar las respuestas diureticas y natiureticas de ratas Okamoto esponshytaneamente hipertensivas (REB) y ratas Wistar-Kyoto (WRY) para dirigir incrementos en la presion hidrostatica renal intersticial (PBRI) Para aumentar la PBRI se utiIiz6 la expansi6n directa del volumen renal intersticial (DRIVE) a traves de una matriz implantada cronicamente en el rinOn Entre los datos registrados durante el estudio estan las siguientes mediciones de excreci6n de sodio a traves de la orina (UNa V) durante el periodo de DRIVE

Grupo

REB 632572796483527 2WKY 420469482 108210

FUENTE Publicada con autorizaci6n del Dr Ali A Khraibi

645 Osberg y Di Scala (A-II) realizaron un estudio centrado en la eficacia de los cinturones de seguridad para reducir 1esiones entre sobrevivientes de accidentes automoviHsticos internashydos en hospitales con edades de 4 a 14 afios El estudio compar610s resultados de 123 ninos que utilizaron el cintur6n contra 290 que no 10 utilizaron entre aquellos que se vieton enshyvueltos en tales accidentes y que fueron hospitalizados El informe con tenia la siguiente estadistica del numero de dfas en la unidad de cuidados intensivos

Grupo Media Error estandar estimado

Utiliz6 el cintur6n 83 16 No utiliz6 el cintur6n 139 18

646 La medicion del diametro transversal del coraz6n de hombres y mujeres adultos presenta los siguientes resultados

sx Grupo Tamafto de Ia muestra (cm) (cm)

Varones 12 1321 105 Mujeres 9 IIOO 101

Considere que las poblaciones siguen una distribucion normal con variancias iguales

176 CAPITULO 6 ESTIMACION

647 Veintiruatro animales de laboratorio con deficiencia de vitamina D fueron divididos en dos grupos iguales EI grupo 1 recibi6 un tratamiento consistente en una dieta que proporcionashyba vitamina D EI segundo grupo no fue tratado AI termino del periodo experimental se midieron las concentraciones de calcio ensuero obteniendose los siguientes resultados

Grupo tratado X 111 mg 100 mls = 15 Grupo sin tratamiento x= 78 mg 100 ml s = 20

Considere que las poblaciones siguen una distribuci6n normal con variancias iguales

648 Ados grupos de nifios se les hicieron pruebas de agudeza vi~ual El grupo 1 estuvo formado por 11 nifios que recibieron la atenci6n de medicos privados La calificaci6n media para este grupo fue de 26 con una desviaci6n estandar de 5 El segundogrupo que incluy6 14 nifios que recibieron atenci6n medica por parte del departamento de salud publica tuvo una calishyficaci6n promedio de 21 con una desviaci6n estandar de 6 Suponga que las poblaciones siguen una distribuci6n normal con variancias iguales

649 El tiempo promedio de estancia de una muestra de 20 pacientes dados de alta de un hospital general es de siete dras con una desviaci6n estaildar de dos dras Una muestra de 24 padenshytes dados de alta de un hospital de enfermedades cr6nicas tuvo un tiempo promedio de estancia de 36 dfas con una desviaci6n estindar de 10 dias Suponga que la poblaci6n sigue una distribuci6n normal con variancias desiguales

6410 En un estudio de factores que se consideran responsables de los efectos adversos del tabashyquismo sobre la reproducci6n humana se midieron los niveles de cadmio (nanogramos por gramo) en el tejido de la placenta de una muestra de 14 madres que fumaban y una muestra aleatoria independiente de 18 mujeres no fumadoras Los resultados fueron los siguientes

No fumadoras toO 84 128250 118 98 125 154 235

94251 1952559875 118122150

Fumadoras 300301150241305178168148

134285 175 144 125204

ms probable que el nivel medio de cadmio registrado sea mayor entre las fumadoras que entre las no fumadoras ~Por que se llegarfa a esta conclusi6n

65 INTERVALO DE CONFIANZA PARA IA PROPORCION DE UNA POBIACION

Muchas preguntas de interes para que el tecnico en salud tienen relacion con las proporciones de poblacion ~Que propordon de padentes que redben un tipo espeshycial de tratamiento se recuperan ~Que proporcion de alguna poblacion tiene cierta enfermedad ~Que propordon de una poblacion es inmune a derta enfermedad

Para estimar la proporcion de una poblacion se procede en la misma forma que cuando se estima la media de una poblacion Se extrae una muestra de la poblacion de interes y se calcula su proporcion p Esta se utiliza como el estimador puntual para la proporcion de la pobladon Un intervalo de confianza se obtiene mediante la siguiente formula general

estimador plusmn (coefidente de confiabilidad) X (error estandar)

EJERCICIOS

EJERCICIOS 177

En el capitulo anterior se vio que cuando np y n(1 - p) son mayores que 5 se puede considerar que la distribuci6n muestral de pse aproxima bastante a una distribuci6n normal Cuando se cumple con esta condici6n el coeficiente de confiabilidad es algUn valor de z de la distribuci6n normal estandar Esta visto que el error estandar es igual a (J p =fi(l-p) n Puesto que p que es el parametro que se trata de calcular se desconoce se debe utilizar pcomo una estimaci6n Asf se estima (J j por medio de ~p(l Pn y el intervalo de confianza de 100(1 - 0) por ciento para pesta dado por

pplusmn Z(I-1J2)~P(l- P) Fn (651)

Este intervalo se interpreta tanto desde el punto de vista practico como probabilistico

FJEMPLO 651

Mathers et al (A-12) encontraron queen una muestra de 591 pacientes internados en un hospital psiquiatrico 204 admitieron que consuniieron marihuana al meshynos una vez durante su vida Se pretende construir un intervalo de confianza de 95 por ciento para la proporcion de individuos que consumieron marihuana durante su vida en la poblaci6n muestreada de los internos del hospital psiquiatrico

Solucion La mejor estima~i6n puntual para la proporci6Il de la poblaci6nes p== 204591 3452 El tamafio de la muestra y hiestimacion de p tienen una magnitud suficiente parajustifKar el empleo de la distribucion norshymal estandar paraelaborar un intervalo de confianza EI coeficiente de corifiabilidad que corresponde alnivel de confianza de 95 es 196 la estimacion del errorestandar (Jp es ~p(l-pgtn = (3452)(6548)591

0 1956El intervalo de confianza para p de acuerdo con estos datos es

3452 plusmn 196(01956) 3452 plusmn 0383 3069 3835

Se puede decir que se tiene 95 por ciento de confianza de que la proporshycionpeste entre 3069 y 3835 ya que al repetir el muestreo casi 95 por ciento de los intervalos construidos en la forma de este intervalo inclushyyen a la proporcion p real Con base en estos resultados se espera con una confianza de 95 por ciento encontrar que entre 3069 y 3835 por ciento de los internados en el hospital psiquiatrico tiene antecedentes de consumo de marihuana bull

Para cada uno de los siguientes ejercicios establezca la interpretacion prictica yprobabilistica de los intervalos que se pide construir Identifique cada componente del intervalo la estimashycion puntual el coeficiente de confiabilidad yel error estandar Explique por que los coefishycientes de confiabilidad no son los misInos para todos los ejercicios

178 CAPITULO 6 ESTIIlACI6N

651 En una investigaci6nde ninos maltratados en pacientes psiquiatricos Brown y Anderson (A-IS) encontraron 166 pacientes en una muestra de 947 con antecedentes de abuso sexual y maltrato flsico Construya un intervalo de confianza de 90 por dento para la proporci6n de la poblaci6n

652 Catania et at (A-14) obtuvieron datos respecto al comportamiento sexual de una muestra de hombres y mujeres solteros con edades entre 20 y 44 residentes en areas geoijfaficas caracshyterizadas por tasas altas de enfermedades de transmision sexual e ingreso a programas de drogas De 1229 encuestados 50 por ciento respondieron que nunca utilizaron preservatishyvos Construya un intervalo de confianza de 95 por ciento para la proporcion de la poblaci6n que nunca utiliza preservativos

653 Rothberg y Lits (A-I 5 ) estudiaron el efecto del estres de la maternidad durante el embarazo en el peso del producto Los individuos eran 86 mujeres blancas con antecedentes de estres que no tenfan faetores de riesgo medico u obstetrico conoddo de peso bajo del producto Los investigadores eneontraron que 128 por dento de las madres estudiadas dieron a luz bebes que cubrfan el criterio de peso bajo Construya un intervalo de confianza de 99 por ciento para la proporci6n de la poblaci6n

654 En una muestra aleatoria simple de 125 varones desempleados quienes desertaron de la escuela preparatoria entre las edades de 16 y 21 anos inclusive 88 declararon que eran consumidores regulares de bebidas alcoh6litas Construya un intervalo de eonfianza de 95 por ciento para la proporcion de la poblacion

66 INTERVALO DE CONFIANZA PARA lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS POBlACIONES

A menudo se tiene interes en conocer la magnitud de la diferencia entre las proporcioshynes de dospoblaciones Es posible que se quiera comparar por ejemplo entre hombres y mujeres dos grupos de edades dos grupos socioecon6micos 0 dos grupos de diagshynostico con respecto a la proporcion que posee alguna caractenstica de interes Un estimador puntual insesgado de la diferencia entre dos proporciones de las poblacioshynes se obtieneal calcular la diferencia de las proporciones de las muestras PI P2 Tal como Se ha visto cuando n1 Yn2 son de gran tamano y las proporciones de la poblacion no estan muy cerca de 0 0 de 1 es posible aplicar el teorema del limite central y utilizar la teona de la distribucion normal para obtener los intervalos de conshyfianza EI error estandar de la estimacion se calcula mediante la siguiente formula

dado que como regIa se desconocen las proporciones de Ia poblacion Un intervashy10 de confianza de 100(1 - a) por ciento para PI P2 se obtiene as

(661)

Es posible interpretar este intervalo desde elpunto de vista probabiHstico y practico

EJERCICIOS 179

EJEMPLO 661

Borst et al (A-16) investigaron la relaci6n de desarrollo del ego edad sexo y diagshyn6stico de suicidio entre los internos adolescentes de la unidad de psiquiatria La muestra consistia en 96 varones y 123 niiias con edades entre 12 y 16 aiios seleccioshynados de entre los internados en la unidad de adolescentes y niiios de un hospital psiquiatrico privado Se reportaron 18 niiios y 60 niiias con intento de suicidio Cons ishyderese el comportamiento de las niiias como el de una muestra aleatoria simple a partir de una poblaci6n similar de niiias y que los j6venes igualmente pueden considerarse como una muestra aleatoria simple extraida de una poblaci6n similar de niiios Para estas dos poblaciones se pretende construir un intervalo de confianshyza de 99 por ciento para la diferencia entre las proporciones de los individuos con intento de suicidio

Soluci6n Las proporciones para las niiias y niiios respectivamente son Pc = 601 123 = A878y PB = 1896 1875 La diferencia entre las proporciones de lasmuestrases Pc PB = 4878 1875 = 3003 El error estandar estimado de la diferenda entre las proporciones de las muestras es

(4878)(5122) (1875)(8125) ---~~-~ +-------shy

123 96

El factor de confiabilidad a partir de la tabla D es 258 de modo que el intervalo de confianza con la f6rmula 661 es

3003 plusmn 258(0602) 14504556

Se dene la confianza de 99 por dento de que para las poblaciones muestteadas la ptopord6n de intentos de suiddio entre las niiias exceshyde a lapropord6n de intentosde suiddio entre los varones por 1450 y 4556

Puesto que el intervalo no incluye al cero se concluye que las dos proporciones de pobladones son diferentes bull

FJERCICIOS

Para cada uno de los siguientes ejercicios establezca las interpretaciones pnicticas y probabishylisticas de los intervalos que se pide construir Identifique cada componente del intervalo la estimaci6n puntual el coeficiente de confiabilidad y el error estandar Explique por que los coeficientes de confiabilidad no son el mismo para todos los ejercicios

661 Hargers et al (A-17) del departamento de Salud PUblica y Ambieptal en Amsterdam condushyjeron un estudio en el que los individuos eran consumidores de drogasinyectables (CDI) En una muestrade 194 consumidores de metadona regular de largo plazo (MLP) 145 eran varones En una muestra de 189 CDIque no consmiddotumian MLP 133 eran varones Establezca las consideraciones necesarias acerca de las muestras ypoblaciones representadas y construshy

180 CAPITULO 6 ESTlMACI6N

ya un intervalo de confianza de 95 por ciemo para la diferenda entre las proporciones de varones en las dos poblaciones

662 Una investigaci6n de Lane et ai (A-I8) valor6las diferencias en las pnicticas de deteccion de cancer de seno entre muestras de mujeres predominantemente de bajos ingresos con edashydes de 50 a 75 anos que lltilizan los servicios de c1inicas de sailld para todo el estado y mlljeres de la misma edad residentes en ciudades donde las c1inicas de salud son locales De las 404 encuestadas seleccionadas en toda la comunidad 592 por ciento estuvo de acuerdo con el siguiente comentario acerca del cancer de pecho las mujeres prolongan su vida si detectan el cancer desde el inicio De entre 795 usuarias de clinicas de salud en la mllestra 449 por ciento estuvo de acuerdo Establezca las suposiciones apropiadas para elaborar un intervalo de confianzade 99 por ciento para la diferencia entre las dos proporciones de las poblaciones de interes

663 Williams et at (A-19) encuestaron a una muestra de 67 medicos y 133 enfermeras con famishyliares farmacodependientes EI prop6sito del estudio era evaluar la influencia en los medishyEOS y enfermeras de estar estrechamente involucrados con una 0 mas personas farmaco dependientes Cincuenta y dos medicos y 89 enfermeras dijeron que vivian con personas farmacoldependientes que adversamente afectaban 8U trabajo E8tablezca todas las consideshyraciones que crea necesarias para construir un intervalo de confianza de 95 por ciento para la diferencia entre las proporciones en las dos poblaciones de trabajadores que se espera esten adversamente afectados por vivir con personas farmacodependientes

664 Aronow y Kronzon (A-20) identificaron los factores de riesgo coronado entre hombres y mujeres en una dinica de cuidados de la salud a largo plazo De los 215 individuos negros 58 tienen diabetes mellitus al igual que 217 individuos blancos de 1140 Elabore un intervalo de confianza de 90 por ciento de confianzapara la diferencia entre las proporciones de las dos poblaciones tCuaies son las poblaciones correspondientes ~Que consideraciones son necesarias para hacer valido el procedimiento de inferencia

67 DETEHMINAUON DEL TAMANO DE LA MUESTRA PARA LA ESTIMACIONDEIAS MEDIAS

La pregunta de que tan grande debe ser una muestra surge inmediatamente al inicio del planteamiento de cualquier encuesta 0 experimento Esta es una pregunshyta importante y no se debe tratara la ligera Tomar una muestra mas grande de 10 necesario para obtener los resultados deseados es un desperdicio de recursos mienshytras que por otro lado las muestras demasiado pequenas con frecuencia dan resulshytados que carecen de uso practico En esta secci6n se estudia c6mo determinar el tamano de la muestra de acuerdo con la situaci6n A continuaci6n se proporciona un metodo para determinar el tamano de la muestra que se requiere para estimar Ia media de la poblaci6n yen la siguiente secci6n se aplica este metodo para detershyminar el tamano de la milestra cuando se desea estimar la proporci6n de una poshyblaci6n Mediante extensiltmes directas de estos metodos es posible determinar el tamano necesario de las muestras para situaciones mas complicadas

Objetivos El objetivo de la estimaci6n porintervalos es el de obtener intervalos estrechos con alta confiabilidad Si se observan los componentes ~e un intervalo de confianzase veque 8U dimension esta determinada por la magnitud de la cantidad

(coeficiente de confiabilidad) x (error estandar)

131 67 DETERMINACION DEL TAMANO PARA LA l-IUESTRAmiddot

ya que lamagnitud total del intervalo de confIanza es eldoble de esta cantidad Se aprendi6 que a esta cantidad generalmente se Ie llama precisi6n de la estimaci6n o margen de error Para un error estandar dado incrementar la confIabilidad signishyfIca un coefIciente con mayor confIabilidad Y un coefIciente con mayor confIabilidad produce unintervalo mas amplio

Por otra parte si se ftia el coefIciente de confIabilidad la unica manera de redudr la amplitud del intervalo es la reducci6n del error estandar Dado que el error estandar es igual a (J IJ y como (J es una constante la unica forma de obtener un error estandar menor es tomar una muestra grande ~Que tan grande debeser la muestra Esto depende del tamafio de (J la desviad6n estandar de la poblaci6n asi como del grado de confIabilidad y dimensi6n del intervalo deseados

Suponga que se desea obtener un intervalo que se extienda d unidades hacia uno y otro lado del estimador Ellose enuncia

d (coefIciente de confIabilidad) X (error estandar) (671)

Si el muestreo es con reemplazos a partir de una poblaci6n infInita 0 de una que sea 10 sufIcientemente grande como para ignorar la correcci6n por poblaci6n fInita la ecuaci6n 671 se transforma en

(J

d z- (672)-r la cual cuando se despeja n nos da

(673)d2

Cuando el nmestreo se hacesin reemplazos a partir de una poblaci6n fInita y peshyquefia se requiere de la correcci6n por poblaci6n fInita y la ecuaci6n 671 se transforma en

(J~d (674)fN~

que al despejar n resulta en

n-----shy (675)d 2(N 1) + Z2(J2

Si puede omitirse la correcci6n por poblad6n fInita la ecuaci6n 675 se reshyduce a la ecuaci6n 673

Estillluci6n de (J 2 Las f6rmulas para el tamafio de la muestra requieren del conocimiento de (J2 pero como ya se ha sefialado la varian cia de la poblaci6n casi

132 CAPITULO 6 ESTlMACION

siempre sedesconoce Como resultado esnecesarioestimar (J2 Las fuentes de estishymaci6n de(J2 que se utilizan con mas frecuencia son las siguientes

1 Se extrae una muestrapilato 0 prel~l11inar de lapoblaci6n y se puede utilizar la variancia calculada a partir de esta muestra como unaestimaci6n de (J2 Las observaciones uti lizadas en la muestra piloto se toman como parte de la muesshytrafinal de modo que n (el tamaiio calculado de la muestra) n

1 (el tamaiio

de la muestra piloto) n2 (el numero de observaciones necesarias para satisfacer el requerimiento total del tamaiio de la muestra)

2 A partir de estudios anteriores osimilares es posible obtener estimaciones de (J2

3Si se cree que la poblaci6n de lacual se extrae la muestraposee una distribushyci6n aproximadamente nqrmal se puede aprovechar el hecho de que la amshyplitud es aproximadamente igual a 6 desviaciones estandar y calcular (J R6 Este metodo requiere aIglin conocimiento acerca de los valores minimo y maximo de la variable en la poblaci6n

EJEMPLO 671

Un nutri6logo del departamento de salud al efectuar una encuesta entre una poshyblacien de muchachas adolescentes con e1 fin de determinitr su ingesti6n diaria promedio de proteinas (medidas en gramos) busc6 el consejo de un bioestadistico con respecto al tamaiio de la muestra que deberfa tomar

~Que procedimiento debe seguir el bioestadistico para asesorar al nutri610go Antes de que el estadistico pueda ayudar el nutri6logo este debe proporcionar tres elementos de informaci6n h dimensi6n deseada del intervalo de confianza el nivel de confianza deseado y la magnitud de la variancia de la poblaci6n

Soludon Suponga que el nutri6logo requiere un intervalo con una dimensi6n de aprQximadamente 10 gramos es decir la estimaci6n se deberfa enconshytrar alrededor de 5 gramos de la media de la poblaci6n en ambas direcshyciones En otras palabras se desea un margen de error de 5 gramos Suponga que se decide por un coeficiente de confian7a de 95 y que con base en su experiencia previa el nutri6logo percibe que la desviaci6n estandar de la poblaci6n es probablemente de alrededor de 20 gramos EI estadfstico dispone ya de la informaci6n necesaria para calcular el tamaiio de la muestra z 196 (J = 20 y d 5 Suponga que el tamaiio de la poblaci6n es grande asf queel estadistico puede ignorar la correcshyci6n por poblaci6n finita y utilizar la ecuaci6n 673 Con las sustitucioshynes adecuadas el valor de n se calcula como

Se recomienda que el nutri610go tome una muestra de tamafio 62 AI calcular el tamaiio de una muestra a partir de las ecuaciones 673 0 675 el resultado se redondea al siguiente nurnero entero mayor si los calculosdan un numerocon decimales bull

183 68 DETERMINACION DEL TAl1ANO PARA LAS PROPORCIONES

EJERCICIOS

671 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su hospital Si se desea un intervalo de confianza de 99 por dento con una amplitud de 1 libra ~que tan grande debe ser la muestra de los registros de nacimiento Suponga que un estimashy

dor razonable para (J es 1 libra ~De que tamano debe ser la muestra si el coeficiente de confiabilidad se hace descender a 95

672 El director de la secdon de control dela rabia del departamento de salud publica desea extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso del ano anterior para estimar la edad media de las personas mordidas Requiere un intervalo de confianza de 95 por dento decide utilizar un valor de 25 para d y a partir de estudios anteriores estima que la desviacion estandar de la poblacion esta alrededor de los 15 anos ~Que tan grande debe ser el tamano de la muestra

673 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mglOO ml) de pacientes atendidos en una clinica para diabeticos durante el transcurso de los ultimos 10 anos Determine el numero de registros que el medico debe examinar para obtener un intershyvalo de confianza de 90 por ciento para 11 si la dimension requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varian cia de 60

674 Se deseaestimar la edad media en la que a los padentes de esclerosis multiple se les diagnosshytico el padecimiento por primera vez Se requiere un intervalo de confianza de 95 por dento con una dimension de 10 anos Si la variancia de la poblaci6n es de 90 ~que tan grande debera ser la muestra

68 DETERMINACION DELTAMANO DE lA MUESTRA PARA lA ESIDIACION DE lAS PROPORCIONES

EI metodo para estimar el tamafio de la muestra cuando se requiere estimar la proshyporcion de una poblacion es esencialmente el mismo que se describio para estimar la media de una poblacion Se aprovecha el hecho de que la mitad del intervalo deseashydo d se puede igualar al producto del coeficiente de confiabilidad y el error estandar

Si se supone que el muestreo ha sido hecho de manera aleatoria y que existen condiciones que garanticen que la distribuci6n de psea aproximadamente normal se obtiene la siguiente formula para n cuando el muestreo es con reemplazo cuanshydo se realizaa partir de una poblacion infinita 0 ruando la poblacion muestreada es 10 suficientemente grande como para hacer innecesario el uso de la correcci6n por poblacion finita

n (681)

dondeq = I-p Si la correccion por poblacion finita no puede descartarse la formula adecuashy

da paran es

(682)n d 2 (N -1)+z2pq

euan do N es grande en comparacion con n (es decir n IN 05) se puede pasar por alto la correccion por poblacion finita y la ecuacion 682 se reduce a la ecuacion 681

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

152 CAPITULO 6 ESTlMACION

Eleccion del estimador adecuado Esconveniente notar que se ha dado el nombre de estimacion a un solo valor calrulado La regIa para calrular este valor a estimaci6n se conoce como estimador Los estimadores generalmente se presentan como f6rmulas Por ejemplo

n

es un estimador de la media de la poblaci6n )t El valor numerico individual que resulta de la evaluaci6n de esta f6rmula se canoce como estimaci6n del parametro )t

En muchos casos es posible estimar un panimetro por media de mas de un estimador Par ejemplo se puede utilizar la mediana de la muestra para estimar la media de la poblaci6n ~C6mo decidirentonces que estimador se debe utilizar para estimar un parametro en particular La decisi6n se basa en criterios que reflejan la bondad de los estimadores partirulares Cuando se miden contra estos criteshyrios algunos estimadores son mejores que otros Uno de estos criterios es la propieshydad de ser insesgado

DEFINICION

Se dice queun estimador por ejemplo T para el parametro () es un estimador insesgado de () si E(T) = ()

E(T) significa el valor esperado de Tn Para una poblaci6n fmita E(T) se obtiene tomando el valor promedio de T calculado a partir de todas las muestras posibles de un tamafto dado que puedan extraerse de la poblaci6n Es decir E(T)= I-lr Para una poblaci6n infinita E(T) se define en terminos del calculo matematico

En el capitulo anterior se via que la media de la muestra y la proporci6n de la muestra la diferencia entre las medias de dos muestras la diferencia entre las proporciones de dos muestras son cada una estimadores insesgados de sus parametros correspondientes Esta propiedad qued6 implfcita ruando se dijo que los parametros eran las medias de lasdistribuciones del muestrco correspondienshytes Por ejemplo dado que la media de la distribuci6n mliestral de x es igual a )t se sabe que x es un estimador insesgado de )t En este libra no se estudian los otros criterios para un buen estimador Ellector interesado los encontrara detashyllados en muchos libras de estadfstica matematka

Poblaciones muestreatlnS y poblaciones objetivo EI investigador en el area de la salud que utiliza los procedimientos de inferentia estadfstica debe estar al tanto de las diferencias entre dos tipos depoblaci6nla poblacion muestreada y la poblaci6n objetivo

DEFINICION

La poblacion muestreada es la poblacion de la cual se extrae unamuestra

153 61 INTRODUCCION

DEFINICION

La poblacion objetivo es la poblacion de la que se pretende hacer una inferencia

Estas dos poblaciones pueden ser las mismas a no Los pracedimientos de inferencia estadfstica permiten inferir respecto a las poblaciones muestreadas (siemshypre y cuando se hayan utilizado los metodos de muestreo correctos) Solo cuando la poblacion objetivo y la poblacion muestreada son las mismas es posible utilizar pracedimientos de inferencia estadfstica para llegar a conclusiones acerca de la poshyblaci6n objetivo Si la poblacion muestreada y la poblacion objetivo son diferenshytes el investigador puede llegar a conclusiones respecto a la poblaci6n objetivo solo can base en consideraciones no estadisticas

Par ejemplo suponga que un investigador quiere estimar la eficacia de un metoda para tratar la artritis reumatoide La poblaci6n objetivo esta formada por todos los pacientes que sufren esta enfermedad y no es practico extraer una mliestra de esta poblacion Sin embargo el investigador puede extraer una muestra de toshydos los pacientes can artritis reumatoide de alguna clfnica especifica Estos pacienshytes constituyen la poblacion muestreada y si se utilizan metodos de muestreo adecuados es posible hacer inferencias respecto a esta poblacion muestreada con base en la informacion de la muestra Si el investigador qui ere hacer inferencias acerca de todos los pacientes con artritis reumatoide debe utilizar metodos no estadfsticos Quiza el investigador sepa que la poblaci6n muestreada es similar can respecto a todas las caracteristicas importantes a la poblacion objetivo Es decir es posible que el investigador sepa que edad sexo gravedad de enfermedad tiempo de evolucion deesta asf como otras datos son similares en ambas poblaciones Y con base en esteconocimiento el investigador puede extrapolar sus descubrimienshytos ala poblacion objetivo

En muchos casas la poblacion muestreada y la poblaci6n objetivo son identishycas y cuando esto ocurre las inferencias en torno a la poblacion objetivo son direcshytas Sin embargo el investigador debe estar consciente de que este no siempre es el caso a fin de no caer en la trampa de hacer inferencias err6neas respecto a una poblacion diferente de la que ha sid a muestreada

Muestras alealarias y na alealarias En los ejemplos y ejercicios de este libra se supone que los datos analizados pravienen de muestras aleatorias La esshytricta validez de los pracedimientosestadisticos estudiados depende de esta suposishycion En muchos casas en las aplicaciones reales es imposible a impractico utilizar muestras verdaderamente aleatorias En experimentos con animales par ejemplo los investigadores frecuentemente utilizan cualquier animal cori el que cuenta el proveedor a su prapia raza de crianza Si los investigadores tuvieran que depender de materialseleccionado al azar se llevaria a cabo muy poca investigacion de este tipo Una vez mas las consideraciones no estadfsticas deben tamar parte en el praceso de generalizacion Los investigadores pueden afirmar que las muestras realmente utilizadas equivalen a muestras aleatorias simples dado que no hay rashy

154 CAPiTULO 6 ESTIMACIOl

zon para creer que el material utilizado no es representativo de la poblacion de la que se desea hacer inferencias

En muchos proyectos de investigacion en el area de la salud se utilizan muestras de conveniencia en lugar de muestras aleatorias Puede ser que los investigadores tengan que confiar en voluntarios 0 en personas disponibles como los estudiantes de su clase Nuevamente se debe hacer generalizaciones con base en consideraciones no estadisticas Sin embargo las consecuencias de dichas generalizaciones pueden ser utiles 0 pueden clasificarse desde erroneas hasta desastrosas

En algunos casos puede aplicarse aleatoriedad en un experimento aun cuanshydo los individuos disponibles no sean seleccionados aleatoriamente de alguna poshyblacion bien definida Al comparar dos tratamientos por ejemplo a cada individuo se Ie puede asignar aleatoriamente uno u otro de los tratamientos Las inferencias en tales casos se aplican a los tratamientos y no a los individuos y en consecuencia dichas inferencias son vaUdas

62 INTERVALO DE CONFIANZAPARA LI MEDIA DE UNA POBLICION

Suponga que un grupo de investigadores quiene estimar la media de una poblaci6n que sigue una distribucion normal Para ello extraen una muestra aleatoria de tamafio n de la poblacion y ca1culan el valor de x el cual utilizan como una estimashycion puntual de 11 Aunque este estimador de 11 posee todas las cualidades de un buen estimador se sabe que debido a los caprichos del muestreo aleatorio no se puede esperar que x sea igual a 11

Por 10 tanto serfa mucho mas significativo estimar 11 mediante un intervalo que de alguna forma muestre su probable magnitud 11

DistribuciOn muestral y estimaci6n Para obtener dicha estimacion por intervalos se debe aprovechar el conocimiento acerca de las distribuciones muestrales En este caso puesto que el interes esta en la media de la muestra como estimador de la media de una poblacion es necesario recordar 10 que se sabe resshypecto a la distribucion muestral de la media de la muestra

En el capitulo anterior se aprendio qu~ si el muestreo se realiza a partir de una pohlacion con distribucion normal la distribucion muestral de la media de la muestra presenta una distribucion normal con una media Ilx igual a la media de la poblacion 11 y variancia cr igual a cron Se podrfa graficar la distribucion muestral si se supiera en que lugar del eje xse localiza Con base en el conocimiento adquishyrido acerca de la distribucion normal en general se sabe aun mas sobre la distribushyci6n de xpara estecaso Por ejemplo se sabe que sin irilportar d6nde se localizan aproximadamente 95por ciento de los valores posibles de que constituyen la distribuci6n estan ados desviaciones estandarrespecto a la media Los dos puntos que estan ados desviaciones estandar de la media son 1l-2crx y 1l+2crx de tal manera que el intervalo de 11 plusmn2cr contendra aproxil11adamente 95 por ciento dex los valores posibles de x Aunque 11 y Ilx son desconocidas arbitrariamente se puede poner la distribuci6n muestral de x sobre eleje x

Dado que se desconoce el valor de 11 la expresion )i plusmn 2crx no dice mucho Sin embargo se tiene una estimaci6n puntual de 11 que es x (Resultaria uti obtener un intervalo en tomo a esta estimaci611 puntual de Il La respuesta es S1 Suponga

62 INTERVALO DE CONFIANZA PARA LA MEDIA DE UNAPOBLACION 155

a2 a2

FIGUR4 621 Intervalo de confianza de 95 por dento para l

que se forman intervalos a partir de todos los valores posibles de x cakulados a partir de todas las niuestras posibles de tamafio n de la poblacion de interes De esa forma se tendrfa un gran numerode intervalos de la forma xplusmn2crx con amplitushydes todas igtiales a la del intervalo en torno a lall desconocida Aproximadamente 95 por ciento de estos intervalos tendria centros que caen dentro del intervalo plusmn2crx en torno a 11 Cada uno de estos intervalos que caen dentro de 2cr en torno a 11 pueden contener ala misma 11 Estas ideas se muestran en la figura 621 En dicha figura se observa que xl XiY x4 caen dentro del intervalo 2cr en torno allY en consecuencia los intervalos 2cr alrededor de las medias de la muestra induyen el valor de IJ Las medias muestrales y Xs no caen derttro del intervalo 2cr en torno a IJ y los intervalos de 2crx en torno a ellas no incluyen a IJ

FJElIPLO 621 Suponga que un investigador interesado en obtener una estimacion del nivel promeshydio de alguna enzima en cierta poblacion de seres humano toma una muestra de 10 individuos determina elnivel de la enzima en cada uno de elIos y calcula la media de la muestra x 22 Ademas que la variable de interes sigue una distribucion aproximashydamente normal con una variancia de 45 Se desea estimar el valor de 11

Solucion Un intervalo de confianza de aproximadamente 95 por dento para 11 esta dado por

xplusmn2cr 22plusmn2 Gi10 22 plusmn2(21213) 17762624 bull

156 CAPITULO 6 ESTIMACION

Componentes para la estimaciOn del intervalo Examine la composishycion para la estimacion del intervalo elaborada en el ejemplo 621 Este contiene en su centro la estimacion puntual para 11 Se identifica a 2 como un valor de la distribucion normal estandar que indica a cuantos errores estandar estan aproxishymadamente 95 por ciento de los valores posibles de x Este valor de Z se conoce como coeficiente de confiabilidad EI ultimo componente (ix es el error estandar 0

desviacion estandar de la distribucion muestral de x En general una estimacion por intervalos se expresa como sigue

estimador plusmn (coeficiente de confiabilidad) x (error estandar) (621)

En particular cuando el muestreo se realiza a partir de una distribucion norshymal con variancia conocida una estimacion por intervalos para Jl se expresa como

donde z(l_lt12) es el valor de Z a la izquierda de donde esta 1 rtJ2 y ala derecha en que se encuentra rtJ2 del area bajo la curva

Interpretacion del intervalo de conftarua ~Como se interpreta el intershyvalo de la ecuacion 622 En este ejemplo donde el coeficiente de confiabilidad es igual a 2 se dice que al repetirel muestreo aproximadamente 95 por ciento de los intervalos construidos mediantela formula 622 induyen la media de la poblacion Esta interpretacion se basa en la probabilidad de ocurrencia de diferentes valores de x Es posible generalizar esta interpretacion si se designael area total blttio la curva de x que queda fuera del intervalo Jl plusmn 2(ix como ex y eIarea dentro del intervalo como 1 - ex y dar la siguiente interpretaciOn probabilistica de la formula 622

Interpretaci6n probabilistica

En el muestreo repetido de una poblaci6n condistribuci6n normal y desviaci6n estdndafmiddot conocida 100(1- a) por ciento de todos los intervalos de la forma Xplusmn Z(I_amOx incluyen a la larga la media de la poblaci6n 11

Ala cantidad 1 - (X en este caso 95se Ie conoce como eoeficiente (0 nivel) de conjianza y al intervalo XplusmnZ(1_12)(ix se Ie conoce comointervalo de conjianza para Jl Cuando (1 ex) =95 al intervalo se Ie llama intervalo de confianza de 95 por ciento para Jl En este ejemplo se dice que existe 95 por ciento de confianza d~ que la media de Ia poblacion este entre 1776 y 2624 A esto se Ie llama interpretacion practica de la formula 622 En general se puede expresar de la siguiente manera

Interpretaci6n practica

Cuando se hace un muestreo a partir de poblaciones que siguen una distribuci6n normal y con desviaci6n estdndar conocida existe un 100(1 - a) por ciento de confianza de que el intervalo calculado xplusmn z(l_aI2)Ox contiene la media de la poblaci6n Jl

62 INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACION 157

En el ejemplo 621 es preferible en lugar de 2un valor mas exacto para z 196 que corresponde al coeficiente de confianza de95 Los investigadores pueshyden utilizar cualquier coeficiente de confianza los mas utilizados son 90 95 Y 99 a los cuales se asocian factores de confiabilidad de 1645 196 Y 258 respectivashymente

Precision A la cantidad que se obtiene al multiplicar el factor de confiabilidad por el error estandar de la media se Ie llama precision de la estimaci6n Tambien se Ie llama margen de error

EJEMPLO 622

Un fisioterapeuta desea estimar con 99 por ciento de confianza la media de fuerza maxima de un musculo particular en cierto grupo de individuos Se inc1ina a suposhyner que los valores de dicha fuerza muestran una distribucion aproximadamente normal con una variancia de 144 Una muestra de 15 individuos que participaron en el experimento presento una media de 843

Soluci6n En latabla D el valor para z que corresponde a un coeficiente de conshyfianza de 99 es 258 Este es el coeficiente de confiabilidad El error estandar es de ax 12fl5 =30984 Por 10 tanto el intervalo de conshyfianza de 99 por ciento para ~ es

843 plusmn258(30984) 843 plusmn 80 763923

Se dice que se tiene 99 por ciento de confianza de que la media de la poblacion este entre 763 y 923 porque al repetirel muestreo 99 por ciento de todos los intervalos que pueden construirse en la forma descrishyta inc1uyen a la media de la poblacion bull

Situaciones en las que la variable de interes sigue una distribucion aproximadashymentenormal con una variancia conocida son muy raras y casi nunca se presentan en la practica El prop6sito de los ejemplos anteriores en los que se supone que existe esta condici6n ideal fue el de formar las bases teoricas para construir intershyvalos de confianza para las medias de la poblacion En la mayorf de los casos practicos las variables no siguen una distribuci6n aproximadamente normal 0 no se conocen las variancias de la poblaci6n 0 suceden ambas cosas En el ejemplo 623 y en la secci6n 63 se explican los procedimientos que se utilizan en situaciones menos ideales pero mas comunes

Muestreo a partir de pobluciunes que no presenlan una distribucion normal No siempre es posible 0 prudente suponer que la poblaci6n de interes muesshytra una distribuci6n normal Gracias al teOlema del limite central esto no sera un problema si se puede seleccionar una muestra 10 suficientemente grande Se ha dicho que para muestras grandes la distribucion muestral de Xi presenta una distribuci6n aproximadamente normal sin importar como esta distribuida la poblacion original

158 CAPiTULO 6 ESTIMACION

EJEMPLO 623

Un equipo de investigadores esta interesado en la puntualidad de los pacientes en las citas concertadas En un estudio de flqjo depacientes en los consultorios de medicos generales se encontr6 que una muestra de 35 pacientes llegaba 172 minutos tarde a las citas en promedio Una investigaci6n previa habia demostrado que la desviaci6n estandar era de 8 minutos aproximadamente Se tuvo la sensaci6n de que la distribushyci6n de la poblaci6n no era normal ~Cual es el intervalo de confianza de 90 por ciento para 11 que es el promedio real de impuntualidad en las citas

Soluci6n Dado que el tamafio de la muestra es bastante grande (mayor que 30) y se conoce la desviaci6n estandar de la poblaci6n la situaci6n se aproxishyrna al teorema del limite central y se supone que la distribuci6n muestral de xpresenta una distribud6n aproximadamente normal AI consultar la tabla D se encuentra que el coeficiente de confiabilidad que corresponshyde a uri coeficiente de confianza de 90se aproxima a 1645 si se interpola El error estandar es de C5z 8-35 13522 de modo que el intervalo de confianza de 90 por ciento para 11 es

172 plusmn 1645(13522) 172 plusmn 22 150 194 bull

Con frecuencia cuando la muestra es 10 suficientemente grande para aplicar el teorema dellfmite central la variancia de la poblacion se desconoce En ese caso se sustituye esta variancia conla de la muestra en la f6rmula para construir el intervashy10 de confianza para la media de la poblacion

Andlisispor computadora Cuando se requiere de los intervalos de confianza se economiza una buena cantidad de tiempo mediante el uso de una computadora la cual puede ser programada para construir los intervalos de datos no procesados

EJEMPLO 624

Los siguientes datos corresponden a los valores de la actividad (micromoles por minuto por gramo de tejido) de cierta enzima medida en el tejido gastrico normal de 35 pacientes con carcinoma gastrico

60 1189 614 788 273 2464 571 1827 537 374 449 262 448 971

372 898 411 348 1925 550 622

610 319 406 413 767 385 674

521 603 533 662 1177 307 1499

Mediante el uso del paquete de software para computadora MINITAB se pretenshyde construirun intervalo de confianza de 95 por ciento para la media de la poblashycion Suponga que la variancia de la poblaci6n es iguala 36 No es necesario suponer que la poblaci6n muestreada de val ores sigue una distribuci6n normal porque el tamafio de la muestra es losuficientemente grande para aplicar el teoreshyrna del limite central

159 62 INTERV ALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACION

Caja de dialogo Comandos de la sesi6n

Statgt Basic Statisticsgt 1-Sample z MTB gt ZINTERVAl 95 6 C1

Teclear Cl en Variables Se1ecdonar Confidence interval y teclear 95 en la caja de texto Teclear6 en Sigma Clic OK

Resultados

Confidence Intervals

The assumed sigma = 0600

Variable MicMoles

N 35

Mean 0718

StDev 0511

SE Mean 0101

950 Cr (0519 0917)

FIGURA 622 Procedimiento del paquete MINITAB para construir un intrevalo de conshyfianza de 95 por ciento para la media de la poblacion ejemplo 624

Solucion Se introducen los datos en lacolumna 1 y se procede como se muestra en la figura 622 Estas instrucdones indican a la computadora que e1 factor de confiabilidad es z que se necesita unintervalo de conshyfianza de 95 por dento que la desviaci6n estandarde la poblaci6n es de 6 y que los datos estan en la columna 1 El resultado indica que la media de la muestra es 718 la desviad6n estandar es 511 y e1 error estandar de la media af es 6J35 101

Se tiene 95 pordento middotde confianza de que la media de la poblashyci6n se encuentra entre 519y 917 bull

Puede obtenerse los intervalos de confianza a traves de otros paquetes de sofuvare Por ejemplo SASreg puede construir intervalos de confianza a traves de PROC MEANS o PROC UNIVARIATE

Otras eslimaciones de La tendencia central Tal como se ha visto la meshydia es muy sensible a los val ores extremos es dedr aquellos que se desvfan consideshyrablemente de la mayorfa de las mediciones en el con junto de datos A dichos valores se les conoce como sesgos Tambien se puede apreciar que lamediana que no es sensible a las mediciones extremas algunas veces se utiliza en lugar de la media como medida de tendenda central cuando los sesgos estan presentes Por la misshyrna raz6n quiza se prefiera el uso de la mediana de la muestra comomiddotestimador de la rnediana de la poblaci6n cuando se requiere realizar inferencias acerca de la tendenda central de la poblaci6n No solamente se utiliza la mediana de la muestra

160 CAPITULO 6 ESTlMACION

como una estimacion puntual para la mediana de la poblacion sino que tambien es posible construir un intervalo de confianza para la mediana de la poblacion En esta obra no se proporciona la formula pero esta se puede encontrar en la obra de Rice (1)

Media ajustada Los estimadores que son insensibles a los sesgos se Haman estimadores eficaces Otra medida y estimador eficaz de tendencia central es la media ajustada Para un conjunto de datos que contiene n mediciones se calcula el 1000 por ciento de la media ajustada como sigue

1 Ordenar las mediciones

2 Descartar las medici ones mas pequeiias y mas grandes que 100a por ciento de las mediciones El valor recomendado para a esta entre 1 y 2

3 Calcular la media aritmetica de las mediciones restantes

Observe que la mediana podrfa considerarse como 50 por ciento de la media ajusshytada Se debe recordar que la media ajustada para el conjunto de datos es una de las medidas descriptivas que puede calcular MINITAB

FJERCICIOS

Construya para cada uno de los siguientes ejercicios los intervalos de confianza al 90 95 Y 99 por ciento para la media de la poblacion y establezca para cada uno la interpretacion probabilistica y practica Indique cualinterpretacion puede ser mas aderuada para utilizar ruando se trata sobre intervalos de confianza con alguien que no conoce de estadfstica y establezca eI razonamientode por que se eUgi6 Explique por que los tres intervalos no tjenen la misma amplitud Indique cual de los tres intervalos es preferible como estimador de la media de la poblacion y establezca el razonamiento de la elecci6n

621 Se pretende estimar el numero promedio de latidos del coraz6n por minuto para cierta poblaci6n Se encontr6 que el numero promedio de latidos por minuto para 49 personas era de YO Considere que esos 49 pacientes constituyen una muestra aleatoria y que la poblacion sigue una distribucion normal con una desviaci6n estandar de 10

622 Se pretende estimar la concentraci6n media de bilirrubina indirecta en el suero en nmos de cuatro dias de nacidos La media para una muestra de 16 ninos es de 598 mglOO cc Conshysiderese que la concentraci6n de bilirrubina en los ninos de cuatro dfas de nacidos sigue una distribucion aproximadamente normal con una desviaci6n estandar de 35 mgIOO cc

623 En un estudio acerca de la duraci6n de la hospitalizacion dirigido por vados hospitales en cooperacion se extrajo una muestra aleatoria de 64 individuos con ulcera peptica de la lista de todos los pacientes con esa enfermedad internados alguna vez en los hospitales particishypantes Se determin6 para cada uno de eUos el tiempo de hospitalizaci6n Se encontr6 que la duraci6n media de hospitalizaci6n fue de 825 dfas y se sabe que la desviaci6n estandar de la poblaci6n es de tres dfas

624 Una muestrade 100 hombres adultos aparentemente sanos de 25 anos de edad muestra una presi6n sist61ica sangufnea media de 125 Considere que la desviaci6n estandar de la poblaci6n es de 15

161 63 DISTRIBUCI6N

625 Algunos estudios acerca de la enfermedad Alzheimer (EA)han mostrado un incremento en la producci6n de 14C0

2 en pacientes con ese padecimiento Durante un estudio se obtuvieshy

ron los siguientes valores de 14C02

a partir de 16 biopsias de neocorteza de pacientes con la enfermedad (EA)

1009 1280 1180 12551547 2352 1956 1080

1776 1767 1680 2050 1452 2857 3100 1621

Considereseque la poblaci6n sigue una distribuci6n normal con una desviaci6n estandar de 350

63 DISTRIBUCION t

En la seccion 62 se describe un procedimiento para obtener un intervalo de conshyfianza para la media de una poblaci6n EI procedimiento requiere del conodmiento de la varianda de la poblacion de la que se extrae la muestra Puede parecer un tanto extrafio que se tenga conocimiento de lavariancia de la poblacion y no se conozca elvalor de la media de la poblacion De hecho es comun en situacioshynes como las que se han presentado que se deSconozca tanto la variancia como la media de la poblacion Esta situacionpresenta un problema respecto a la construcshycion delos intervalos de confianza Por ejemplo aun cuando la estadfstica

x J1shyZ=---

crJn presenta una distribudon normal cuando la poblacion tambien tiene una distribuci6n normal y sigue una distribuci6n aproximadamente normal cuando n es muy grande independientemenle de la forma funcional de la poblacion no se puede hacer uso de este hecho porque cr se desconoce Sin embargo no todo esrn perdido y la soluci6n mas logica para este problema es utilizar la desviacion estandar de ~muestra

s = ~L(Xi - x)2(n-l)

para sustituir cr Por ejemplo cuando el tamafio de la muestra es mayor que 30 la confianza en s como una aproximacion de cr es por 10 general sustancial por 10 que se justifica la utilizacion de la teorfa de la distribudon normal para construir un intervalo de confianza para la media de la poblacion En tal caso se procede como se indica en la seccion 62

Cuando se tienen muestras pequefias es imprescindible encontrar otro proceshydimiento para construir intervalos de confianza

Como resultado del trabajo de Gosset (2) escrito bajo el seudonimo de Student se dispone de otra alternativa conocida como distribuci6n t de Student con frecuenda abreviada como distribuci6n t

La cantidad

sigue esta distribucion

162 CAPiTULO 6 ESTIMACION

Propiedades de la distribucion t La distribuci6n t tiene las siguientes proshypiedades

1 Tiene una media de O

2 Es simetrica con respecto a la media

3 En general tiene una variancia mayor que 1 pero esta tiende a I a medida que aumenta el tamaiio de la muestra Para dfgt 2 la variancia de la distribushyci6n t es dfl(df - 2) donde df representa los grados de libertad En forma alterna puesto que df n - 1 para n gt 3 se puede escribir la variancia de la distribuci6n t como (n l)(n 3)

4 La variable t va de - hasta + 00DO

5 La distribuci6n t es realmente una familia de distribuciones puesto que hay una distribuci6n diferente por cada valor de la muestra de n - 1 que es el divisor que se utiliza para ca1cular S2 Recuerde que n - 1 representa los grados de libertad En la figura 631 se muestran las distribuciones t correspondienshytes a algunos valores de los grados de libertad

6 Comparada con la distribuci6n normal ladistribuci6n t es menos espigada en el centro y tiene colas mas largas En la figura 632 se com para la distribushyci6n t con la distribuci6n normal

7 La distribuci6n t se aproxima ala distribuci6n normal a medida que n - 1 se aproxima al infinito

La distribuci6n t al igual quela distribuci6n normal estandar se ha tabulado ampliamente Una de estas tablas es la tabla E del apendice Tal como se puede apreciar se debe tomar en cuenta eLcoeficiente de confianza y los grados de libershytad cuando se utiliza la tabla de la distribuci6n t

FIGUR- 631 Distribuci6n t para diferentes grados de libertad

-----

163 63 DISTRIBUCION

__ Distribucion normal

- - - Dislribucion I

x

FIGURA 632 Comparaci6n de las distribuciones normal yt

Es posible utilizar el paquete MINITAB para graficar la distribuci6n t (para grados espedficos de libertad) y otras distribuciones Despues de asignar el eje horizontal y las siguientes direcciones en el cuadro de Set Patterned Data seleccioshyne del menu Calc y despues Probability Distributions Utilice el cuadro de diashylogo Plot para generar la grafica

Inlervalos de conJiQllia qllR uJilban fa dislribucion t El procedimien to general para construir interval os de confianza no se ve afectado por la necesidad de utilizar la distribuci6n t en lugar de la distribuci6n normal estandar Aun es necesario usar la relaci6n expresada por

estimador plusmn (coeficiente de confiabiIidad) x (error estandar)

Lo que es diferente es el origen del coeficiente de confiabilidad Este se obtiene a partir de la tabla de la distribucion t en lugar de la tabla de la distribuci6n normal estandar Para ser mas especfficos cuando se obtienen muestras a partir de una distribushycion normal cuya desviaci6n estdndi17 a se desconoce ell OO( 1 - a) por ciento del intervalo de confianza para la media de la poblaci6n J1 estd dado por

(631 )

Es importante aclarar que el requisito para el uso valido de la distribucion t es que la muestra debe ser extrafda de una poblad6n con distribucion normal Sin embarshygo la experiencia ha demostrado que se pueden tolerar desviaciones moderadas de esterequisito Como consecuencia la distribucion t se utiliza incluso cuando se sabe que la poblaci6n original se desvia de la normalidad Lltl mayorfa de los invesshytigadores requieren que al menos pueda sostenerse el supuesto de una distribushyd6n de poblacion en forma de montfculo

EJEMPLO 631

Maureen McCauley (A-I) realiz6 un estudio para evaluar los efectos de un conjunto de instrucciones de mecanica en ellugar de labores sobre el desempeno laboral de obreros jovenes recientemente contratados Se utilizaron dos grupos de individuos elegidos aleatoriamente uno de los grupos para aplicar el experimento y el otro

164 CAPITULO 6 ESTlMACI6N

como grupo de control EI grupo con el que se experimento recibio una hora de capacitacion impartida por un terapeuta ocupacional EI grupo de control no recishybio esta capacitacion Para evaluar el esfuerzo de cada obrero para levan tar bajar jalar y transportar objetos dentro del entorno laboral se utilizo una lista de cotejo para la evaluacion de trabajo mecanico que inclufa criterios de referencia Una tarea bien hecha recibio una calificacion de 1 EI grupo de control formado por 15 individuos alcanzo una calificacion media de 1153 en la evaluacion con una desshyviacion estandar de 3681 Se supone que el grupo de control se comporto como una muestra aleatoria extraida de una poblacion similar de individuos Se pretende utilizar los datos de la muestra para estimar la calificacion media para la poblacion

Soluci6n Se puede utilizar la media de la muestra 1153 como una estimacion puntualde la media de la poblacion sin embargo debido a que se descoshynoce la desviacion estandar de la poblacion se debe considerar que los valores siguen una distribucion aproximadamente normal antes de consshytruir los intervalos de confianza para l Se considera que esta suposicion es razonable y que se necesita un intervalo de confianza de ~or cienshyto el estimador es i y el error estandar es s -r 681 15 =9504 Ahora es necesario conocer el coeficiente de confiabilidad el valor de t asodado al coeficiente de confianza de 95 y a los n 1 = 14 grados de libertad Puesto que el intervalo de confianza de 95 por ciento deja 05 del area bajo la curva de t para dividirse en dos colas iguales se necesita el valor de tala derecha del cual esta el 025 del area Este valor se localiza en la tabla E enla columna encabezada por t

975 bull Este es el valor

para tala izquierda delcual esta 975 del area bajo la curva EI area a la derechade este valor es igual al 025 deseado Ahora sobre la columna de grados de libertad se localiza el numero 14 EI valor para t se encuentra en la interseccion del renglon con la etiqueta 14 y la columna con la etiqueta t975 bull Se encuentra que este valqr para t que representa al coeficiente de confiabilidad es 21448 Finalmente el intervalo de confianza de 95 por ciento se construye como sigue

1153 plusmn 21448(9504) 1153 plusmn 204 949 1357 bull

Este intervalo puede interpretarse con ambos puntos de vista probabiHstico y practico Puede asegurarse en un 95 por dento que 1a media l correcta de la poblacion se encuentra entre 949 y 1357 porque al repetir el muestreo 95 por dento de los intervalos construidos deigual manera incluyen a l

Decidir entre z r t Cuando se obtiene un intervalo de confianza para la media de una poblacion se debe decidir si se utiliza un valor de z6 de t como factor de confiabilidad Para hacer una elecci6n adecuada se debe considerar el tamafto de la muestra si la poblacion muestreada sigue una distribucion normal y si la varian cia de la poblacion es conocida La figura 633 muestra un diagrama de flujo que se puede utilizar para decidir rapidamente si el factor de confiabilidad debe ser Z 0 t

EJERCICIOS 165

EJERCICIOS

Sa aplica al leorema dellfmile central

FIGURA 633 Diagrama de flujo para deddir entre utililizar z y t cuando se hagan inferencias respecto a las medias de la poblaci6n (Para utilizar un procedimiento no parametrico vease el capitulo 13)

Analisis par computadara Si el proposito es construir un intervalo de conshyfianza con el programa MINITAB para la media de la poblacion cuando el estadfsshytico t es el factor de confiabilidad adecuado el comando se inicia con la palabra TINTERVAL Seleccione en Windows I-Sample t desde el menu de Basic Statistics

631 Utilice la distribud6n t para encontrar el factor de confiabilidad para el intervalo de confianshyza basado en los siguientes coeficientes de confianza y tamafiosde las muestras

a b c d

Coefidente de confianza 95 99 90 95 Tamafio de la muestra 15 24 8 30

632 En una investigacion acerca de la dependencia del flujo y volumen de todo el sistema respishyratorio en un grupo de pacientes con enfermedad obstructiva pulmonar cronica conectados a respiradores artificiales Tantucci et ai (A-2) registraron los siguientes valores de linea de

166 CAPITULO 6 ESTIMACION

base del flUjD continuo inspiratDriD (Us) 90 97 103110 104 100 CDnsidere que una muestra aleatDria simple esta cDnfDrmada pDr seis individuDs a partir de una pDblacion que sigue una distribuci6n nDrmal CDn individuDs CDn la misma enfermedad

a) ~Cuat es la estimaci6n puntual de la media de la pDblaci6n

b) ~Cuil es la desviacion estandar de la muestra

c) ~Cultll es la estimacion del error estandar para la media de la muestra

d) CDnstruya un intervalD de cDnfianza de 95 pDr ciento para el flUjD mediD cDntinuD inspishyratDriD de la pDblaci6n

e) ~Cual es la precision de la estimacion

f) Explique la interpretaci6n prDbabilistica para este intervalD de confianza

g) Explique la interpretacion practica para este intervalD de cDnfianza

633 LlDyd y MaillDux (A-3) informaron IDS siguientes datDs acerca del peso de la glandula pituitaria en una muestra de cuatrD ratas de Wistar Furth

media = 90 mg error estandar para la media = 3

FUEJTE Ricardo V Lloyd y Joe Mailloux Analysis ofSshy100 Protein Positive Folliculo Stellate Cells in Rat Pituitary Tissues AmericanJournal ofPathology 133 338-346

a) ~Cual es la desviadon estandar de la muestra

b) CDnstruya un intervalD de confianza de 95 pDr ciento para el peso medio de la glandula pituitaria para una pDblacion similar de ratas

c) ~Que supDsiciDnes se necesitan para que sea validD el intervalo de cDnfianza del inciso b

d) ~Que interpretacion puede ser la mas indicada cuandD se trata sDbre intervalos de conshyfianzacon alguien que no sabe de estadfstica Explique pDrque es la mas cDnveniente

e) 5i fuera necesario elabDrar un intervalD de cDnfianza de 90 pDr cientD para la media de la pDblaci6n ~el intervalD de cDnfianza serta mayDr 0 menor que el intervalD de 95 pDr dentD Explique su respuesta sin construir realmente el intervalD de cDnfianza

f) 5i [uera necesariD considerar un intervalo de CDnfianza de 99 pDr cientDpara lamedia de la poblacion ~el intervalo de cDnfianza serra mayDr 0 menDr que el intervalD de 95 pDr dentD Explique su respuesta sin cDnstruir realmentt el intervalD de cDnfianza

634 Kaminski y Rechberger (A-4) encontrarDn en un estudio sDbre la preeclampsia que la media de la presi6n sistolica sangufnea en 10 mujeres sanas y que no estan embarazadas es de 119 CDn una desviacion estandar de 21

a) 2Cual es el errDr estandar estimadD para la media

b) CDnstruya un intervalD de confianza de 99 pDr cientD para la media de la poblaci6n a partir de la cual puede considerarse que IDS 10 individuos conforman una muestra aleatoria

c) ~CUlil es la precisi6n estimada

d) ~Que consideraciones deben hacerse para comprobar la validez del intervalo de confiahza

635 Unamuestra de 16nifias de 10 afiDS pesan en promediD 715 con una desviacion estandar de 12libras CDnsidere el calculD de intervalDs de cDnfianza de 9095 y 99 pDr ciento para I-L

167 64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS

636 Una muestra aleatoria simple conformada por 16 individuos aparentemente sanos presenta los siguientes valores de arsenico eliminado en la orina (miligramos por dfa)

Individuo Valor Individuo Valor

1 007 9 012 2 030 10 006 3 025 11 010 4 008 12 032 5 030 13 006 6 038 14 009 7 007 15 014 8 005 16 011

Elabore un intervalo de confianza de 95 por ciento para la media de la poblaci6n

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES

En ocasiones se presentan casos en los que se desea estimar 1a diferencia entre 1a media de dos poblaciones A partir de cada poblacion se extrae una muestra aleatoria independiente y de los datos de cada una se calculan las medias muestrales XI y x2

respectivamente En el capitulo anterior se dijo que el estimador XI - x2 ofrece una estimacion insesgada de la diferencia entre las medias de las poblaciones III shy11 2 bull La variancia del estimador es (cr~ n l ) + (cr~ n 2 ) Tambien se menciono que seglin las condiciones la distribucion muestral de XI - x2 puede presentar una distribution al menos aproximadamente normal de modo que en muchos casos se utiliza la teorfa adecuada para las distribuciones normales en el calculo de un intershyvalo de confianza para III - 11 2 bull Cuando se conocen las variancias de la poblacion el intervalo de confianza del 100(1 - ex) por ciento para III - 112 esta dado por

(641)

El anal isis del intervalo de confianza para la diferencia entre las medias poblacionales ofrece informacion util para decidir si es 0 no probable que las medias de las dos poblaciones sean iguales Cuando el intervalo no incluye al cero se dice que el intervalo ofrece evidencia de que las dos poblaciones tienen medias diferentes Cuando el intervalo incluye al cero se dice que las poblaciones pueden tener meshydias iguales

Esto se ilustra a continuacion para el caso donde el muestreo se realiza a partir de una distribucion normal

168 CAPITULO 6 ESTlMACI6N

EJEMPLO 641

A un equipo de investigacion Ie interesa conocer la diferencia entre las concentracioshynes de acido urico en pacientes con y sin el sfndrome de Down En un gran hospital para el tratamiento de pacientes con retardo mental una muestra de 12 individuos con el sindrome presenta una media de XI = 45 mgll00 mL En un hospital general se encontro que una muestra de 15 individuos normales de la misma edad y sexo presenta un nivel medio de x2= 34 Si es razonable suponer que las dos poblaciones de valores muestran una distribucion normal y sus variancias son iguales a 1 y 15 calcule el intervalo de confianza de 95 por ciento para ~l - ~2

Soluci6n Para una estimacion puntual de III 112 se udliza Xl X2= 45 34 11 EI coeficiente de confiabilidad que corresponde a 95 localizado en la tabla D es 196 EI error estandar es

Por 10 tanto el intervalo de confianza de 95 por ciento es

11 plusmn 196(4282) 11plusmn84 26 194

Se dice que se dene una confianza de 95 por ciento de que la difeshyrencia real 111 - 112 este entre 26 y 194 porque en muestreos repetidos 95 por ciento de los intervalos construidos de esa manera incluiria la diferencia entre las medias reales

Puesto que el intervalo no incluye al cero se concluye que las dos poblaciones tienen diferentes medias bull

Muestreo a partir de poblaciones que no signen una distribuci6n ItOrmal La construccion de un intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando el muestreo se realiza a partir de poblaciones no normales se lleva a cabo en la forma descrita en el ejemplo 641 si las muestras n l y n

2 son grandes Una vez mas este es un resultado del teorema del limite central

Si se desconocen las variancias de la poblacion se utili zan las variancias de las muestras para estimarlas

IUEMPLO 642

Motivados por d conocimiento de la existencia de una gran cantidad de textos polemicos que sugieren que el estres la ansiedad y la depresion son dafiinos para el sistema inmunologico Gormanet ai (4-5) condujeron un estudio en el que se conshysider6 a individuos varoneshomosexuales algunos con VIH (virus de inmunodefishyciencia humana) positivo y otros con VIH negativo Los datos fueron registrados con una amplia vltJriedad de mediciones medicas inmunologicas psiquiatricas y neurol6gicas una de las cuales corresponde al numero de celulas CD4+ en la sanshy

64 INTERV ALO DE CONFIANZA PAHALA DIFERENCIA ENTRE DOS MEDIAS 169

gre El numero promedio de celulas CD4+ para middot112 individuos con infecci6n por VIR fue de 4018 con una desviaci6n estandar de 2264 Para los 75 individuos sin la infecci6n por VIR la media y la desviaci6n estandar fueron de 8282 y 2749 respectivamente Se pretende elaborar un intervalo de confianza de 99 por ciento para la diferencia de las medias de las poblaciones

Soluci6n No hay informaci6n con respecto a la forma de la distribuci6n de las celulas CD4+ Sin embargo como el tamafto de las muestras es grande el teorema del limite central asegura que la distribuci6n muestral de las diferencias entre las medias de la muestra siguen una distribuci6n aproxishymadamente normal independientemente de que la distribuci6n de la variable en las poblaciones no siga una distribuci6n normal Se puede utilizar este hecho para justificar el uso de la estadistica z como factor de confiabilidad en la construcci6n del intervalo de confianza Tampoco hay informaci6n acerca de las desviaciones estandar por 10 que puede emplearse las desviaciones estandar de las muestras para estimarlas La estimaci6n puntual para la diferencia entre las medias de las poblacioshynes es la diferencia entre las medias de las muestras 8282 - 4018 = 4264 En la tabla D se encuentra que el factor de confiabilidad es 258 La estimaci6n del error estandar es

s __ = 27492

+ 22642 =382786

Xl-X 75 112

Por la ecuaci6n 641 el intervalo de confianza de 99 por ciento para la diferencia entre las medias de la poblaci6n es

4264 plusmn 258(382786) 3276 5252

Se tiene la seguridad de 99 por ciento de que el promedio de celulas CD4+ en varones con VIR positivo difieren de la media para los varoshynes con VIR negativo por 3276 a 5252 bull

Distribuci6n t y la diferencia entre las medias Cuando no se conocen las variancias y se pretende estimar la diferencia entre las medias de dos poblacioshynes con un intervalo de confianza es posible utilizar la distribuci6n t para suminisshytrar el factor de confiabilidad si se conocen ciertas suposiciones se debe saber 0

suponer de buena fe que las dos poblaciones muestreadas siguen una distribuci6n normal Respecto a las variancias de las poblaciones se debe distinguir entre dos situaciones 1) la situaci6n en la que las variancias son iguales y 2) la situaci6n en la que no 10 son A continuaci6n se consideranambas sitpaciones por separado

Varianciaspoblacifmales iguales Si la suposici6n sobre igualdad de las variancias de las poblaciones esta justificada las dos variancias de las muestras calculadas a partir de las muestras independientes pueden considerarse como estishymaciones de 10 mismo es decir la variancia comun Parece 16gico entonces aproshyvechar este hecho en el anal isis en cuesti6n Esto es precisamente 10 que se hace para establecer una estimaci6n conjunta para la variancia comun Esta variancia se obtiene mediante el caIculo promedio ponderado de las dos variancias de las muesshy

170 CAPITULO 6 ESTlMACI6N

tras Cada variancia de la muestra es ponderada con base en sus grados de libertad Si los tamafios de las muestras son iguales este promedio ponderado es la media aritmetica de las variancias de las dos muestras Si el tamano de las dos muestras es distinto el promedio ponderado aprovecha la informacion adicional proporcionada por la muestra mayor La estimacion con junta se obtiene con la fOrmula

S2 = (nl _1)SI2 + (n2 l)s~ p (642)

+n2 -2nl

Asf la estimacion del error estandar esta dada por

(643)

y el intervalo de confianza de 100(1 a) por ciento para III 112 esta dada por

(644)

El nfunero de grados de libertad utilizado para determinar el valor de t que se usa para construir el intervalo es n

1 + n

2 2 que es el denominador de la ecuacion

642 Este intervalo se interpreta en la forma habitual Los metodos que pueden emplearse para tomar la decision acerca de la igualshy

dad de las variancias de las poblaciones se estudian en la seccion 610 y 78

EJEMPLO 643

Uno de los estudios de Stone et al (A-6) tuvo como objetivo determinar los efectos del ejercicio por un tiempo prolongado en los ejecutivos de una compania inscritos en un programa supervisado de acondicionamiento fisico Se registraron datos de 13 individuos (el grupo deportista) que voluntariamente se inscribieron el programa y que permanecieron activos por 13 anos en promedio y de 17 individuos (el segunshydo grupo el sedentario) que decidieron no inscribirse Entre los datos que se regisshytraron acerca de los individuos esta el mlmero maximo de sentadillas realizadas en 30 segundos El grupo deportista obtuvo una media y una desviacion estandar de 210 y 49 respectivamente La media y la desviacion estandar para el grupo sedenshytario fueron 121 y 56 respectivamente Se considera que las dos poblaciones de medici ones de acondicionamiento muscular siguen una distribuci6n aproxirnadashymente normal y que las variancias para ambas poblacionesson iguales Se pretenshyde elaborar un intervalo de confianza de 95 por ciento para Ja diferencia entre las medias de as poblaciones representadas por las dos muestras Soluci6n Primero se utiliza la ecuaci6n 642 para calcular la estimaci6n conjunta

de la variancia comtin de las poblaciones

(13-1)(49 2 )+(17 1)(562 ) =2821

13+17-2 Cuando se consulta la tabla E con 13 + 17 - 2= 28 grados de libertad y el nivel de confianza de 95 se encuentra que eLfactor de confiabilidad es 20484 Con la ecuacion 644 se calcula el intervalo de confianza de

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS 171

95 por ciento para la diferencia entre las medias de las poblaciones de la siguiente manera

2821 2821(210-121)plusmn20484 --+-shy

13 17 89 plusmn 40085

49129

Se tiene una confianza de 95 por ciento de que la diferencia entre las medias de las poblaciones estan entre 49 y 129 Se puede decir esto porque se sabe quesi se repite el amilisis muchfsimas veces y se calculan los intervalos de confianza de la misma manera cerca de 95 por ciento de los intervalos de confianza induiran la diferencia entre las medias de las poblaciones

Debido a que los intervalos no induyen al cerose conduye que las medias de las poblaciones son diferentes bull

Variancias poblacionales distintas Cuando no se puede conduir que las variancias de dos poblaciones de interes son iguales aun ruando pueda suponerse que las dos poblaciones presentan distribuciones normales no es adecuado utilizar la distribucion t como se acaba de describir para construir los intervalos de confianza

Una solucion al problema de variancias distintas fue propuesta por Behrens (3) y posteriormente fue verificada y generalizada por Fisher (4 5) Neyman (6) Scheffe (7 8) Y Welch (9 10) tambien proponen soluciones EI problema es analizashydo en detalle por Cochran (11)

EI problema gira en tomo al hecho de que la cantidad

no sigue una distribuci6n t con nj + n 2 grados de libertad ruando las variancias 2 shy

de las poblaciones son distintas Consecuentemente la distribucion t no se puede utilizar en la forma habitual pata obtener el factor de confiabilidad del intervalo de confianza para la diferencia entre las medias de dos poblaciones que tienen variancias diferentes La solucion propuesta por Cochran consiste en el calculo del factor de confiabilidad mediante la siguiente formula

wltj + w2tZ t l

f

-0f2 = (645) WI +w2

donde WI 512

np W 2 = s~ n2 tl = tl _ para nj - 1 grados de libertad y t2 = t l

_w2aI2

para n2

- 1 grados de libertad Un intervalo aproximado de confianza del 100(1 shya) por ciento para III - 112 esta dado por

(646)

172

EJERCICIOS

CAPITULO 6 ESTlMACION

FJEIUPLO 644

En la investigacion de Stone et al (A-6) descrita en el ejercicio 643 los investigashydores tambien informaron los siguientes datos de las medici ones referentes a todas las calificaciones del acondicionamiento muscular logradas por los individuos

Muestra n Media Desviaci6n estimdar

Grupo deportista 13 45 3

Grupo sedentario 17 37 10

Se considera que las dos poblaciones de todas las calificaciones de acondicionashymiento muscular siguen una distribuci6n aproximadamente normal Sin embargo no debe suponerse que las dos variancias poblacionales son iguales Se pretende construir un intervalo de confianza de 95 por ciento para la diferencia entre las medias de todas las calificaciones de acondicionamiento muscular para las dos poshyblaciones representadas por las muestras

Soluci6n Se utiliza t de la ecuaci6n 645 para calcular el factor de confiabilidad En la tabla E se muestra que con 12 grados de libertad y 1 - 052 = 975 t( 21788 Analogamente con 16 grados de libertad y 1- 052 = 975 t2 = 21199 Ahora Sf calcula

(3 2 13)(21788) + (102 17)(21199) 139784 t= =

(3 2 13)+(102 17) 065747

=21261

Con la ecuaci6n 646 ahora se construye el intervalo de confianza de 95 por ciento para la diferencia entre las medias de las dos poblaciones

2 2

(45 37)plusmn21261 3 + 10 13 17

8 plusmn 21261 (25641101) 25134

Puesto que el intervalo no incluye acero se concluye que las medias de las dos poblaciones son diferentes bull

Cuando se construyen intervalos de confianza para la diferencia entre las medias de dos poblaciones es posible utilizar la figura 641 para decidir rapidashymente si el factor de confiabilidad debe ser z t 0 tf

Para cada uno de los siguientes ejercicios construya intervalos de confianza de 90 95 y 99 par ciento para las diferencias entre las medias poblacionales Establezca consideraciones que hagan que el metodo sea valido Determine las interpretaciones practica y probabilistica

clJ clJ FIGURA 541 Diagrama de flujo para decidir si e1 factor de confiabilidad debe ser z tot cuando se realizan inferencia inferencias acerca de la diferencia entre las medias de dos pobladones (Para usar un procedimiento no parametrico ver el capitulo 11)

174 CAPiTULO 6 ESTlMACION

para cad a intervalo construido Suponga las variables bajo considerati6n en cad a ejercicio y establezca para que pueden servir a los investigadores esos resultados

641 EI objetivo de un experimento de Buckner et al (A-7) consisti6 en estudiar los efectos del relajamiento muscular inducido por el pancuronium en el volumen del plasma circulante Los individuos estudiados son recien nacidos con un peso mayor a 1700 gramos que necesishytaron de ayuda para respirar durante las primeras 24 horas despues de nacer y cumplieron con otros criterios cHnicos Cinco recien nacidos paraIizados con el pancuronium y siete recien nacidos no tratados presentaron las siguientes estadisticas en la segunda de las tres mediciones del volumen de plasma (ml) hecha durante la respiraci6n mecanica

Paralizados 480 81 No tratados 567 81

La segunda medici6n para el grupo tratado ocurri6 de 12 a 24 horas despues de la primera dosis de pancuronium Para el grupo no tratado las mediciones se hicieron de 12 a 24 horas despues de iniciar la respiracion mecanica

642 Zuckery Archer (A-8) afirman que la N-nitrosobis (2-oxopropyl)amina (BOP) y las nitrosaminas 3-oxidizadas producen una alta incidencia de tumores de conductos pancreaticos en el hamster dorado sirio Estudiaron los efectos en el peso sangufneo en la glucosa del plasma en la insulina yen los niveles de transamina glutamico-oxaloacetica del plasma (GOT) de los hamsters expuestos in vivo a la BOP Los investigadores reportaron los siguientes resultados en ocho animales tratados y 12 sin tratamiento

Variable Sin tratamiento Con tratamiento

Glucosa del plasma (mglgl) 101 plusmn 5 74plusmn 6

FUENTE Peter F Zucker y Michael C Archer Alterations Pancreatic Islet Function Produced by Carcinogenic Nitrosamines in the Syrian Hamster AmericanJournal oPathology 133 573-577

Los datos son la media de la muestra plusmn la estimaci6n del error estandar de la media de la muestra

643 Los objetivos de un estudio de Davis et al (A-g) son evaluar 1) la eficacia del programa auto ayuda momento para dejar de fumar cuando se utiliza con base de uno a uno en el hogar y 2) la viabilidad de ensefiar temicas para abandonar el habito de fumar a los estudiantes de enfermerfa en bachillerato A estudiantes graduados de enfermerfa inscritos en dos cursos de metodologia de la investigacion de la Universidad de Ottawa se les invit6 a participar en el proyecto Se aplic6 un cuestionario de opcion multiple para abandonar el habito de fumar a 120 estudiantes de enfermeria que participaron y a otros 42 estudiantes que no participashyron antes ni despues del estudio Se calcularon las diferencias entre las calificaciones antes y despues del estudio as como las siguientes estadisticas a partir de las diferencias

EJERCICIOS 175

Grupo Media Desviaci6n estandar

Participantes (A) 214444 15392 No participantes (B) 33333 14595

644 El doctor Ali Khraibi (A-IO) de la CHnica y Fundaci6n Mayo condujo una serie de experishymentos con el fin de evaluar las respuestas diureticas y natiureticas de ratas Okamoto esponshytaneamente hipertensivas (REB) y ratas Wistar-Kyoto (WRY) para dirigir incrementos en la presion hidrostatica renal intersticial (PBRI) Para aumentar la PBRI se utiIiz6 la expansi6n directa del volumen renal intersticial (DRIVE) a traves de una matriz implantada cronicamente en el rinOn Entre los datos registrados durante el estudio estan las siguientes mediciones de excreci6n de sodio a traves de la orina (UNa V) durante el periodo de DRIVE

Grupo

REB 632572796483527 2WKY 420469482 108210

FUENTE Publicada con autorizaci6n del Dr Ali A Khraibi

645 Osberg y Di Scala (A-II) realizaron un estudio centrado en la eficacia de los cinturones de seguridad para reducir 1esiones entre sobrevivientes de accidentes automoviHsticos internashydos en hospitales con edades de 4 a 14 afios El estudio compar610s resultados de 123 ninos que utilizaron el cintur6n contra 290 que no 10 utilizaron entre aquellos que se vieton enshyvueltos en tales accidentes y que fueron hospitalizados El informe con tenia la siguiente estadistica del numero de dfas en la unidad de cuidados intensivos

Grupo Media Error estandar estimado

Utiliz6 el cintur6n 83 16 No utiliz6 el cintur6n 139 18

646 La medicion del diametro transversal del coraz6n de hombres y mujeres adultos presenta los siguientes resultados

sx Grupo Tamafto de Ia muestra (cm) (cm)

Varones 12 1321 105 Mujeres 9 IIOO 101

Considere que las poblaciones siguen una distribucion normal con variancias iguales

176 CAPITULO 6 ESTIMACION

647 Veintiruatro animales de laboratorio con deficiencia de vitamina D fueron divididos en dos grupos iguales EI grupo 1 recibi6 un tratamiento consistente en una dieta que proporcionashyba vitamina D EI segundo grupo no fue tratado AI termino del periodo experimental se midieron las concentraciones de calcio ensuero obteniendose los siguientes resultados

Grupo tratado X 111 mg 100 mls = 15 Grupo sin tratamiento x= 78 mg 100 ml s = 20

Considere que las poblaciones siguen una distribuci6n normal con variancias iguales

648 Ados grupos de nifios se les hicieron pruebas de agudeza vi~ual El grupo 1 estuvo formado por 11 nifios que recibieron la atenci6n de medicos privados La calificaci6n media para este grupo fue de 26 con una desviaci6n estandar de 5 El segundogrupo que incluy6 14 nifios que recibieron atenci6n medica por parte del departamento de salud publica tuvo una calishyficaci6n promedio de 21 con una desviaci6n estandar de 6 Suponga que las poblaciones siguen una distribuci6n normal con variancias iguales

649 El tiempo promedio de estancia de una muestra de 20 pacientes dados de alta de un hospital general es de siete dras con una desviaci6n estaildar de dos dras Una muestra de 24 padenshytes dados de alta de un hospital de enfermedades cr6nicas tuvo un tiempo promedio de estancia de 36 dfas con una desviaci6n estindar de 10 dias Suponga que la poblaci6n sigue una distribuci6n normal con variancias desiguales

6410 En un estudio de factores que se consideran responsables de los efectos adversos del tabashyquismo sobre la reproducci6n humana se midieron los niveles de cadmio (nanogramos por gramo) en el tejido de la placenta de una muestra de 14 madres que fumaban y una muestra aleatoria independiente de 18 mujeres no fumadoras Los resultados fueron los siguientes

No fumadoras toO 84 128250 118 98 125 154 235

94251 1952559875 118122150

Fumadoras 300301150241305178168148

134285 175 144 125204

ms probable que el nivel medio de cadmio registrado sea mayor entre las fumadoras que entre las no fumadoras ~Por que se llegarfa a esta conclusi6n

65 INTERVALO DE CONFIANZA PARA IA PROPORCION DE UNA POBIACION

Muchas preguntas de interes para que el tecnico en salud tienen relacion con las proporciones de poblacion ~Que propordon de padentes que redben un tipo espeshycial de tratamiento se recuperan ~Que proporcion de alguna poblacion tiene cierta enfermedad ~Que propordon de una poblacion es inmune a derta enfermedad

Para estimar la proporcion de una poblacion se procede en la misma forma que cuando se estima la media de una poblacion Se extrae una muestra de la poblacion de interes y se calcula su proporcion p Esta se utiliza como el estimador puntual para la proporcion de la pobladon Un intervalo de confianza se obtiene mediante la siguiente formula general

estimador plusmn (coefidente de confiabilidad) X (error estandar)

EJERCICIOS

EJERCICIOS 177

En el capitulo anterior se vio que cuando np y n(1 - p) son mayores que 5 se puede considerar que la distribuci6n muestral de pse aproxima bastante a una distribuci6n normal Cuando se cumple con esta condici6n el coeficiente de confiabilidad es algUn valor de z de la distribuci6n normal estandar Esta visto que el error estandar es igual a (J p =fi(l-p) n Puesto que p que es el parametro que se trata de calcular se desconoce se debe utilizar pcomo una estimaci6n Asf se estima (J j por medio de ~p(l Pn y el intervalo de confianza de 100(1 - 0) por ciento para pesta dado por

pplusmn Z(I-1J2)~P(l- P) Fn (651)

Este intervalo se interpreta tanto desde el punto de vista practico como probabilistico

FJEMPLO 651

Mathers et al (A-12) encontraron queen una muestra de 591 pacientes internados en un hospital psiquiatrico 204 admitieron que consuniieron marihuana al meshynos una vez durante su vida Se pretende construir un intervalo de confianza de 95 por ciento para la proporcion de individuos que consumieron marihuana durante su vida en la poblaci6n muestreada de los internos del hospital psiquiatrico

Solucion La mejor estima~i6n puntual para la proporci6Il de la poblaci6nes p== 204591 3452 El tamafio de la muestra y hiestimacion de p tienen una magnitud suficiente parajustifKar el empleo de la distribucion norshymal estandar paraelaborar un intervalo de confianza EI coeficiente de corifiabilidad que corresponde alnivel de confianza de 95 es 196 la estimacion del errorestandar (Jp es ~p(l-pgtn = (3452)(6548)591

0 1956El intervalo de confianza para p de acuerdo con estos datos es

3452 plusmn 196(01956) 3452 plusmn 0383 3069 3835

Se puede decir que se tiene 95 por ciento de confianza de que la proporshycionpeste entre 3069 y 3835 ya que al repetir el muestreo casi 95 por ciento de los intervalos construidos en la forma de este intervalo inclushyyen a la proporcion p real Con base en estos resultados se espera con una confianza de 95 por ciento encontrar que entre 3069 y 3835 por ciento de los internados en el hospital psiquiatrico tiene antecedentes de consumo de marihuana bull

Para cada uno de los siguientes ejercicios establezca la interpretacion prictica yprobabilistica de los intervalos que se pide construir Identifique cada componente del intervalo la estimashycion puntual el coeficiente de confiabilidad yel error estandar Explique por que los coefishycientes de confiabilidad no son los misInos para todos los ejercicios

178 CAPITULO 6 ESTIIlACI6N

651 En una investigaci6nde ninos maltratados en pacientes psiquiatricos Brown y Anderson (A-IS) encontraron 166 pacientes en una muestra de 947 con antecedentes de abuso sexual y maltrato flsico Construya un intervalo de confianza de 90 por dento para la proporci6n de la poblaci6n

652 Catania et at (A-14) obtuvieron datos respecto al comportamiento sexual de una muestra de hombres y mujeres solteros con edades entre 20 y 44 residentes en areas geoijfaficas caracshyterizadas por tasas altas de enfermedades de transmision sexual e ingreso a programas de drogas De 1229 encuestados 50 por ciento respondieron que nunca utilizaron preservatishyvos Construya un intervalo de confianza de 95 por ciento para la proporcion de la poblaci6n que nunca utiliza preservativos

653 Rothberg y Lits (A-I 5 ) estudiaron el efecto del estres de la maternidad durante el embarazo en el peso del producto Los individuos eran 86 mujeres blancas con antecedentes de estres que no tenfan faetores de riesgo medico u obstetrico conoddo de peso bajo del producto Los investigadores eneontraron que 128 por dento de las madres estudiadas dieron a luz bebes que cubrfan el criterio de peso bajo Construya un intervalo de confianza de 99 por ciento para la proporci6n de la poblaci6n

654 En una muestra aleatoria simple de 125 varones desempleados quienes desertaron de la escuela preparatoria entre las edades de 16 y 21 anos inclusive 88 declararon que eran consumidores regulares de bebidas alcoh6litas Construya un intervalo de eonfianza de 95 por ciento para la proporcion de la poblacion

66 INTERVALO DE CONFIANZA PARA lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS POBlACIONES

A menudo se tiene interes en conocer la magnitud de la diferencia entre las proporcioshynes de dospoblaciones Es posible que se quiera comparar por ejemplo entre hombres y mujeres dos grupos de edades dos grupos socioecon6micos 0 dos grupos de diagshynostico con respecto a la proporcion que posee alguna caractenstica de interes Un estimador puntual insesgado de la diferencia entre dos proporciones de las poblacioshynes se obtieneal calcular la diferencia de las proporciones de las muestras PI P2 Tal como Se ha visto cuando n1 Yn2 son de gran tamano y las proporciones de la poblacion no estan muy cerca de 0 0 de 1 es posible aplicar el teorema del limite central y utilizar la teona de la distribucion normal para obtener los intervalos de conshyfianza EI error estandar de la estimacion se calcula mediante la siguiente formula

dado que como regIa se desconocen las proporciones de Ia poblacion Un intervashy10 de confianza de 100(1 - a) por ciento para PI P2 se obtiene as

(661)

Es posible interpretar este intervalo desde elpunto de vista probabiHstico y practico

EJERCICIOS 179

EJEMPLO 661

Borst et al (A-16) investigaron la relaci6n de desarrollo del ego edad sexo y diagshyn6stico de suicidio entre los internos adolescentes de la unidad de psiquiatria La muestra consistia en 96 varones y 123 niiias con edades entre 12 y 16 aiios seleccioshynados de entre los internados en la unidad de adolescentes y niiios de un hospital psiquiatrico privado Se reportaron 18 niiios y 60 niiias con intento de suicidio Cons ishyderese el comportamiento de las niiias como el de una muestra aleatoria simple a partir de una poblaci6n similar de niiias y que los j6venes igualmente pueden considerarse como una muestra aleatoria simple extraida de una poblaci6n similar de niiios Para estas dos poblaciones se pretende construir un intervalo de confianshyza de 99 por ciento para la diferencia entre las proporciones de los individuos con intento de suicidio

Soluci6n Las proporciones para las niiias y niiios respectivamente son Pc = 601 123 = A878y PB = 1896 1875 La diferencia entre las proporciones de lasmuestrases Pc PB = 4878 1875 = 3003 El error estandar estimado de la diferenda entre las proporciones de las muestras es

(4878)(5122) (1875)(8125) ---~~-~ +-------shy

123 96

El factor de confiabilidad a partir de la tabla D es 258 de modo que el intervalo de confianza con la f6rmula 661 es

3003 plusmn 258(0602) 14504556

Se dene la confianza de 99 por dento de que para las poblaciones muestteadas la ptopord6n de intentos de suiddio entre las niiias exceshyde a lapropord6n de intentosde suiddio entre los varones por 1450 y 4556

Puesto que el intervalo no incluye al cero se concluye que las dos proporciones de pobladones son diferentes bull

FJERCICIOS

Para cada uno de los siguientes ejercicios establezca las interpretaciones pnicticas y probabishylisticas de los intervalos que se pide construir Identifique cada componente del intervalo la estimaci6n puntual el coeficiente de confiabilidad y el error estandar Explique por que los coeficientes de confiabilidad no son el mismo para todos los ejercicios

661 Hargers et al (A-17) del departamento de Salud PUblica y Ambieptal en Amsterdam condushyjeron un estudio en el que los individuos eran consumidores de drogasinyectables (CDI) En una muestrade 194 consumidores de metadona regular de largo plazo (MLP) 145 eran varones En una muestra de 189 CDIque no consmiddotumian MLP 133 eran varones Establezca las consideraciones necesarias acerca de las muestras ypoblaciones representadas y construshy

180 CAPITULO 6 ESTlMACI6N

ya un intervalo de confianza de 95 por ciemo para la diferenda entre las proporciones de varones en las dos poblaciones

662 Una investigaci6n de Lane et ai (A-I8) valor6las diferencias en las pnicticas de deteccion de cancer de seno entre muestras de mujeres predominantemente de bajos ingresos con edashydes de 50 a 75 anos que lltilizan los servicios de c1inicas de sailld para todo el estado y mlljeres de la misma edad residentes en ciudades donde las c1inicas de salud son locales De las 404 encuestadas seleccionadas en toda la comunidad 592 por ciento estuvo de acuerdo con el siguiente comentario acerca del cancer de pecho las mujeres prolongan su vida si detectan el cancer desde el inicio De entre 795 usuarias de clinicas de salud en la mllestra 449 por ciento estuvo de acuerdo Establezca las suposiciones apropiadas para elaborar un intervalo de confianzade 99 por ciento para la diferencia entre las dos proporciones de las poblaciones de interes

663 Williams et at (A-19) encuestaron a una muestra de 67 medicos y 133 enfermeras con famishyliares farmacodependientes EI prop6sito del estudio era evaluar la influencia en los medishyEOS y enfermeras de estar estrechamente involucrados con una 0 mas personas farmaco dependientes Cincuenta y dos medicos y 89 enfermeras dijeron que vivian con personas farmacoldependientes que adversamente afectaban 8U trabajo E8tablezca todas las consideshyraciones que crea necesarias para construir un intervalo de confianza de 95 por ciento para la diferencia entre las proporciones en las dos poblaciones de trabajadores que se espera esten adversamente afectados por vivir con personas farmacodependientes

664 Aronow y Kronzon (A-20) identificaron los factores de riesgo coronado entre hombres y mujeres en una dinica de cuidados de la salud a largo plazo De los 215 individuos negros 58 tienen diabetes mellitus al igual que 217 individuos blancos de 1140 Elabore un intervalo de confianza de 90 por ciento de confianzapara la diferencia entre las proporciones de las dos poblaciones tCuaies son las poblaciones correspondientes ~Que consideraciones son necesarias para hacer valido el procedimiento de inferencia

67 DETEHMINAUON DEL TAMANO DE LA MUESTRA PARA LA ESTIMACIONDEIAS MEDIAS

La pregunta de que tan grande debe ser una muestra surge inmediatamente al inicio del planteamiento de cualquier encuesta 0 experimento Esta es una pregunshyta importante y no se debe tratara la ligera Tomar una muestra mas grande de 10 necesario para obtener los resultados deseados es un desperdicio de recursos mienshytras que por otro lado las muestras demasiado pequenas con frecuencia dan resulshytados que carecen de uso practico En esta secci6n se estudia c6mo determinar el tamano de la muestra de acuerdo con la situaci6n A continuaci6n se proporciona un metodo para determinar el tamano de la muestra que se requiere para estimar Ia media de la poblaci6n yen la siguiente secci6n se aplica este metodo para detershyminar el tamano de la milestra cuando se desea estimar la proporci6n de una poshyblaci6n Mediante extensiltmes directas de estos metodos es posible determinar el tamano necesario de las muestras para situaciones mas complicadas

Objetivos El objetivo de la estimaci6n porintervalos es el de obtener intervalos estrechos con alta confiabilidad Si se observan los componentes ~e un intervalo de confianzase veque 8U dimension esta determinada por la magnitud de la cantidad

(coeficiente de confiabilidad) x (error estandar)

131 67 DETERMINACION DEL TAMANO PARA LA l-IUESTRAmiddot

ya que lamagnitud total del intervalo de confIanza es eldoble de esta cantidad Se aprendi6 que a esta cantidad generalmente se Ie llama precisi6n de la estimaci6n o margen de error Para un error estandar dado incrementar la confIabilidad signishyfIca un coefIciente con mayor confIabilidad Y un coefIciente con mayor confIabilidad produce unintervalo mas amplio

Por otra parte si se ftia el coefIciente de confIabilidad la unica manera de redudr la amplitud del intervalo es la reducci6n del error estandar Dado que el error estandar es igual a (J IJ y como (J es una constante la unica forma de obtener un error estandar menor es tomar una muestra grande ~Que tan grande debeser la muestra Esto depende del tamafio de (J la desviad6n estandar de la poblaci6n asi como del grado de confIabilidad y dimensi6n del intervalo deseados

Suponga que se desea obtener un intervalo que se extienda d unidades hacia uno y otro lado del estimador Ellose enuncia

d (coefIciente de confIabilidad) X (error estandar) (671)

Si el muestreo es con reemplazos a partir de una poblaci6n infInita 0 de una que sea 10 sufIcientemente grande como para ignorar la correcci6n por poblaci6n fInita la ecuaci6n 671 se transforma en

(J

d z- (672)-r la cual cuando se despeja n nos da

(673)d2

Cuando el nmestreo se hacesin reemplazos a partir de una poblaci6n fInita y peshyquefia se requiere de la correcci6n por poblaci6n fInita y la ecuaci6n 671 se transforma en

(J~d (674)fN~

que al despejar n resulta en

n-----shy (675)d 2(N 1) + Z2(J2

Si puede omitirse la correcci6n por poblad6n fInita la ecuaci6n 675 se reshyduce a la ecuaci6n 673

Estillluci6n de (J 2 Las f6rmulas para el tamafio de la muestra requieren del conocimiento de (J2 pero como ya se ha sefialado la varian cia de la poblaci6n casi

132 CAPITULO 6 ESTlMACION

siempre sedesconoce Como resultado esnecesarioestimar (J2 Las fuentes de estishymaci6n de(J2 que se utilizan con mas frecuencia son las siguientes

1 Se extrae una muestrapilato 0 prel~l11inar de lapoblaci6n y se puede utilizar la variancia calculada a partir de esta muestra como unaestimaci6n de (J2 Las observaciones uti lizadas en la muestra piloto se toman como parte de la muesshytrafinal de modo que n (el tamaiio calculado de la muestra) n

1 (el tamaiio

de la muestra piloto) n2 (el numero de observaciones necesarias para satisfacer el requerimiento total del tamaiio de la muestra)

2 A partir de estudios anteriores osimilares es posible obtener estimaciones de (J2

3Si se cree que la poblaci6n de lacual se extrae la muestraposee una distribushyci6n aproximadamente nqrmal se puede aprovechar el hecho de que la amshyplitud es aproximadamente igual a 6 desviaciones estandar y calcular (J R6 Este metodo requiere aIglin conocimiento acerca de los valores minimo y maximo de la variable en la poblaci6n

EJEMPLO 671

Un nutri6logo del departamento de salud al efectuar una encuesta entre una poshyblacien de muchachas adolescentes con e1 fin de determinitr su ingesti6n diaria promedio de proteinas (medidas en gramos) busc6 el consejo de un bioestadistico con respecto al tamaiio de la muestra que deberfa tomar

~Que procedimiento debe seguir el bioestadistico para asesorar al nutri610go Antes de que el estadistico pueda ayudar el nutri6logo este debe proporcionar tres elementos de informaci6n h dimensi6n deseada del intervalo de confianza el nivel de confianza deseado y la magnitud de la variancia de la poblaci6n

Soludon Suponga que el nutri6logo requiere un intervalo con una dimensi6n de aprQximadamente 10 gramos es decir la estimaci6n se deberfa enconshytrar alrededor de 5 gramos de la media de la poblaci6n en ambas direcshyciones En otras palabras se desea un margen de error de 5 gramos Suponga que se decide por un coeficiente de confian7a de 95 y que con base en su experiencia previa el nutri6logo percibe que la desviaci6n estandar de la poblaci6n es probablemente de alrededor de 20 gramos EI estadfstico dispone ya de la informaci6n necesaria para calcular el tamaiio de la muestra z 196 (J = 20 y d 5 Suponga que el tamaiio de la poblaci6n es grande asf queel estadistico puede ignorar la correcshyci6n por poblaci6n finita y utilizar la ecuaci6n 673 Con las sustitucioshynes adecuadas el valor de n se calcula como

Se recomienda que el nutri610go tome una muestra de tamafio 62 AI calcular el tamaiio de una muestra a partir de las ecuaciones 673 0 675 el resultado se redondea al siguiente nurnero entero mayor si los calculosdan un numerocon decimales bull

183 68 DETERMINACION DEL TAl1ANO PARA LAS PROPORCIONES

EJERCICIOS

671 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su hospital Si se desea un intervalo de confianza de 99 por dento con una amplitud de 1 libra ~que tan grande debe ser la muestra de los registros de nacimiento Suponga que un estimashy

dor razonable para (J es 1 libra ~De que tamano debe ser la muestra si el coeficiente de confiabilidad se hace descender a 95

672 El director de la secdon de control dela rabia del departamento de salud publica desea extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso del ano anterior para estimar la edad media de las personas mordidas Requiere un intervalo de confianza de 95 por dento decide utilizar un valor de 25 para d y a partir de estudios anteriores estima que la desviacion estandar de la poblacion esta alrededor de los 15 anos ~Que tan grande debe ser el tamano de la muestra

673 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mglOO ml) de pacientes atendidos en una clinica para diabeticos durante el transcurso de los ultimos 10 anos Determine el numero de registros que el medico debe examinar para obtener un intershyvalo de confianza de 90 por ciento para 11 si la dimension requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varian cia de 60

674 Se deseaestimar la edad media en la que a los padentes de esclerosis multiple se les diagnosshytico el padecimiento por primera vez Se requiere un intervalo de confianza de 95 por dento con una dimension de 10 anos Si la variancia de la poblaci6n es de 90 ~que tan grande debera ser la muestra

68 DETERMINACION DELTAMANO DE lA MUESTRA PARA lA ESIDIACION DE lAS PROPORCIONES

EI metodo para estimar el tamafio de la muestra cuando se requiere estimar la proshyporcion de una poblacion es esencialmente el mismo que se describio para estimar la media de una poblacion Se aprovecha el hecho de que la mitad del intervalo deseashydo d se puede igualar al producto del coeficiente de confiabilidad y el error estandar

Si se supone que el muestreo ha sido hecho de manera aleatoria y que existen condiciones que garanticen que la distribuci6n de psea aproximadamente normal se obtiene la siguiente formula para n cuando el muestreo es con reemplazo cuanshydo se realizaa partir de una poblacion infinita 0 ruando la poblacion muestreada es 10 suficientemente grande como para hacer innecesario el uso de la correcci6n por poblacion finita

n (681)

dondeq = I-p Si la correccion por poblacion finita no puede descartarse la formula adecuashy

da paran es

(682)n d 2 (N -1)+z2pq

euan do N es grande en comparacion con n (es decir n IN 05) se puede pasar por alto la correccion por poblacion finita y la ecuacion 682 se reduce a la ecuacion 681

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

153 61 INTRODUCCION

DEFINICION

La poblacion objetivo es la poblacion de la que se pretende hacer una inferencia

Estas dos poblaciones pueden ser las mismas a no Los pracedimientos de inferencia estadfstica permiten inferir respecto a las poblaciones muestreadas (siemshypre y cuando se hayan utilizado los metodos de muestreo correctos) Solo cuando la poblacion objetivo y la poblacion muestreada son las mismas es posible utilizar pracedimientos de inferencia estadfstica para llegar a conclusiones acerca de la poshyblaci6n objetivo Si la poblacion muestreada y la poblacion objetivo son diferenshytes el investigador puede llegar a conclusiones respecto a la poblaci6n objetivo solo can base en consideraciones no estadisticas

Par ejemplo suponga que un investigador quiere estimar la eficacia de un metoda para tratar la artritis reumatoide La poblaci6n objetivo esta formada por todos los pacientes que sufren esta enfermedad y no es practico extraer una mliestra de esta poblacion Sin embargo el investigador puede extraer una muestra de toshydos los pacientes can artritis reumatoide de alguna clfnica especifica Estos pacienshytes constituyen la poblacion muestreada y si se utilizan metodos de muestreo adecuados es posible hacer inferencias respecto a esta poblacion muestreada con base en la informacion de la muestra Si el investigador qui ere hacer inferencias acerca de todos los pacientes con artritis reumatoide debe utilizar metodos no estadfsticos Quiza el investigador sepa que la poblaci6n muestreada es similar can respecto a todas las caracteristicas importantes a la poblacion objetivo Es decir es posible que el investigador sepa que edad sexo gravedad de enfermedad tiempo de evolucion deesta asf como otras datos son similares en ambas poblaciones Y con base en esteconocimiento el investigador puede extrapolar sus descubrimienshytos ala poblacion objetivo

En muchos casas la poblacion muestreada y la poblaci6n objetivo son identishycas y cuando esto ocurre las inferencias en torno a la poblacion objetivo son direcshytas Sin embargo el investigador debe estar consciente de que este no siempre es el caso a fin de no caer en la trampa de hacer inferencias err6neas respecto a una poblacion diferente de la que ha sid a muestreada

Muestras alealarias y na alealarias En los ejemplos y ejercicios de este libra se supone que los datos analizados pravienen de muestras aleatorias La esshytricta validez de los pracedimientosestadisticos estudiados depende de esta suposishycion En muchos casas en las aplicaciones reales es imposible a impractico utilizar muestras verdaderamente aleatorias En experimentos con animales par ejemplo los investigadores frecuentemente utilizan cualquier animal cori el que cuenta el proveedor a su prapia raza de crianza Si los investigadores tuvieran que depender de materialseleccionado al azar se llevaria a cabo muy poca investigacion de este tipo Una vez mas las consideraciones no estadfsticas deben tamar parte en el praceso de generalizacion Los investigadores pueden afirmar que las muestras realmente utilizadas equivalen a muestras aleatorias simples dado que no hay rashy

154 CAPiTULO 6 ESTIMACIOl

zon para creer que el material utilizado no es representativo de la poblacion de la que se desea hacer inferencias

En muchos proyectos de investigacion en el area de la salud se utilizan muestras de conveniencia en lugar de muestras aleatorias Puede ser que los investigadores tengan que confiar en voluntarios 0 en personas disponibles como los estudiantes de su clase Nuevamente se debe hacer generalizaciones con base en consideraciones no estadisticas Sin embargo las consecuencias de dichas generalizaciones pueden ser utiles 0 pueden clasificarse desde erroneas hasta desastrosas

En algunos casos puede aplicarse aleatoriedad en un experimento aun cuanshydo los individuos disponibles no sean seleccionados aleatoriamente de alguna poshyblacion bien definida Al comparar dos tratamientos por ejemplo a cada individuo se Ie puede asignar aleatoriamente uno u otro de los tratamientos Las inferencias en tales casos se aplican a los tratamientos y no a los individuos y en consecuencia dichas inferencias son vaUdas

62 INTERVALO DE CONFIANZAPARA LI MEDIA DE UNA POBLICION

Suponga que un grupo de investigadores quiene estimar la media de una poblaci6n que sigue una distribucion normal Para ello extraen una muestra aleatoria de tamafio n de la poblacion y ca1culan el valor de x el cual utilizan como una estimashycion puntual de 11 Aunque este estimador de 11 posee todas las cualidades de un buen estimador se sabe que debido a los caprichos del muestreo aleatorio no se puede esperar que x sea igual a 11

Por 10 tanto serfa mucho mas significativo estimar 11 mediante un intervalo que de alguna forma muestre su probable magnitud 11

DistribuciOn muestral y estimaci6n Para obtener dicha estimacion por intervalos se debe aprovechar el conocimiento acerca de las distribuciones muestrales En este caso puesto que el interes esta en la media de la muestra como estimador de la media de una poblacion es necesario recordar 10 que se sabe resshypecto a la distribucion muestral de la media de la muestra

En el capitulo anterior se aprendio qu~ si el muestreo se realiza a partir de una pohlacion con distribucion normal la distribucion muestral de la media de la muestra presenta una distribucion normal con una media Ilx igual a la media de la poblacion 11 y variancia cr igual a cron Se podrfa graficar la distribucion muestral si se supiera en que lugar del eje xse localiza Con base en el conocimiento adquishyrido acerca de la distribucion normal en general se sabe aun mas sobre la distribushyci6n de xpara estecaso Por ejemplo se sabe que sin irilportar d6nde se localizan aproximadamente 95por ciento de los valores posibles de que constituyen la distribuci6n estan ados desviaciones estandarrespecto a la media Los dos puntos que estan ados desviaciones estandar de la media son 1l-2crx y 1l+2crx de tal manera que el intervalo de 11 plusmn2cr contendra aproxil11adamente 95 por ciento dex los valores posibles de x Aunque 11 y Ilx son desconocidas arbitrariamente se puede poner la distribuci6n muestral de x sobre eleje x

Dado que se desconoce el valor de 11 la expresion )i plusmn 2crx no dice mucho Sin embargo se tiene una estimaci6n puntual de 11 que es x (Resultaria uti obtener un intervalo en tomo a esta estimaci611 puntual de Il La respuesta es S1 Suponga

62 INTERVALO DE CONFIANZA PARA LA MEDIA DE UNAPOBLACION 155

a2 a2

FIGUR4 621 Intervalo de confianza de 95 por dento para l

que se forman intervalos a partir de todos los valores posibles de x cakulados a partir de todas las niuestras posibles de tamafio n de la poblacion de interes De esa forma se tendrfa un gran numerode intervalos de la forma xplusmn2crx con amplitushydes todas igtiales a la del intervalo en torno a lall desconocida Aproximadamente 95 por ciento de estos intervalos tendria centros que caen dentro del intervalo plusmn2crx en torno a 11 Cada uno de estos intervalos que caen dentro de 2cr en torno a 11 pueden contener ala misma 11 Estas ideas se muestran en la figura 621 En dicha figura se observa que xl XiY x4 caen dentro del intervalo 2cr en torno allY en consecuencia los intervalos 2cr alrededor de las medias de la muestra induyen el valor de IJ Las medias muestrales y Xs no caen derttro del intervalo 2cr en torno a IJ y los intervalos de 2crx en torno a ellas no incluyen a IJ

FJElIPLO 621 Suponga que un investigador interesado en obtener una estimacion del nivel promeshydio de alguna enzima en cierta poblacion de seres humano toma una muestra de 10 individuos determina elnivel de la enzima en cada uno de elIos y calcula la media de la muestra x 22 Ademas que la variable de interes sigue una distribucion aproximashydamente normal con una variancia de 45 Se desea estimar el valor de 11

Solucion Un intervalo de confianza de aproximadamente 95 por dento para 11 esta dado por

xplusmn2cr 22plusmn2 Gi10 22 plusmn2(21213) 17762624 bull

156 CAPITULO 6 ESTIMACION

Componentes para la estimaciOn del intervalo Examine la composishycion para la estimacion del intervalo elaborada en el ejemplo 621 Este contiene en su centro la estimacion puntual para 11 Se identifica a 2 como un valor de la distribucion normal estandar que indica a cuantos errores estandar estan aproxishymadamente 95 por ciento de los valores posibles de x Este valor de Z se conoce como coeficiente de confiabilidad EI ultimo componente (ix es el error estandar 0

desviacion estandar de la distribucion muestral de x En general una estimacion por intervalos se expresa como sigue

estimador plusmn (coeficiente de confiabilidad) x (error estandar) (621)

En particular cuando el muestreo se realiza a partir de una distribucion norshymal con variancia conocida una estimacion por intervalos para Jl se expresa como

donde z(l_lt12) es el valor de Z a la izquierda de donde esta 1 rtJ2 y ala derecha en que se encuentra rtJ2 del area bajo la curva

Interpretacion del intervalo de conftarua ~Como se interpreta el intershyvalo de la ecuacion 622 En este ejemplo donde el coeficiente de confiabilidad es igual a 2 se dice que al repetirel muestreo aproximadamente 95 por ciento de los intervalos construidos mediantela formula 622 induyen la media de la poblacion Esta interpretacion se basa en la probabilidad de ocurrencia de diferentes valores de x Es posible generalizar esta interpretacion si se designael area total blttio la curva de x que queda fuera del intervalo Jl plusmn 2(ix como ex y eIarea dentro del intervalo como 1 - ex y dar la siguiente interpretaciOn probabilistica de la formula 622

Interpretaci6n probabilistica

En el muestreo repetido de una poblaci6n condistribuci6n normal y desviaci6n estdndafmiddot conocida 100(1- a) por ciento de todos los intervalos de la forma Xplusmn Z(I_amOx incluyen a la larga la media de la poblaci6n 11

Ala cantidad 1 - (X en este caso 95se Ie conoce como eoeficiente (0 nivel) de conjianza y al intervalo XplusmnZ(1_12)(ix se Ie conoce comointervalo de conjianza para Jl Cuando (1 ex) =95 al intervalo se Ie llama intervalo de confianza de 95 por ciento para Jl En este ejemplo se dice que existe 95 por ciento de confianza d~ que la media de Ia poblacion este entre 1776 y 2624 A esto se Ie llama interpretacion practica de la formula 622 En general se puede expresar de la siguiente manera

Interpretaci6n practica

Cuando se hace un muestreo a partir de poblaciones que siguen una distribuci6n normal y con desviaci6n estdndar conocida existe un 100(1 - a) por ciento de confianza de que el intervalo calculado xplusmn z(l_aI2)Ox contiene la media de la poblaci6n Jl

62 INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACION 157

En el ejemplo 621 es preferible en lugar de 2un valor mas exacto para z 196 que corresponde al coeficiente de confianza de95 Los investigadores pueshyden utilizar cualquier coeficiente de confianza los mas utilizados son 90 95 Y 99 a los cuales se asocian factores de confiabilidad de 1645 196 Y 258 respectivashymente

Precision A la cantidad que se obtiene al multiplicar el factor de confiabilidad por el error estandar de la media se Ie llama precision de la estimaci6n Tambien se Ie llama margen de error

EJEMPLO 622

Un fisioterapeuta desea estimar con 99 por ciento de confianza la media de fuerza maxima de un musculo particular en cierto grupo de individuos Se inc1ina a suposhyner que los valores de dicha fuerza muestran una distribucion aproximadamente normal con una variancia de 144 Una muestra de 15 individuos que participaron en el experimento presento una media de 843

Soluci6n En latabla D el valor para z que corresponde a un coeficiente de conshyfianza de 99 es 258 Este es el coeficiente de confiabilidad El error estandar es de ax 12fl5 =30984 Por 10 tanto el intervalo de conshyfianza de 99 por ciento para ~ es

843 plusmn258(30984) 843 plusmn 80 763923

Se dice que se tiene 99 por ciento de confianza de que la media de la poblacion este entre 763 y 923 porque al repetirel muestreo 99 por ciento de todos los intervalos que pueden construirse en la forma descrishyta inc1uyen a la media de la poblacion bull

Situaciones en las que la variable de interes sigue una distribucion aproximadashymentenormal con una variancia conocida son muy raras y casi nunca se presentan en la practica El prop6sito de los ejemplos anteriores en los que se supone que existe esta condici6n ideal fue el de formar las bases teoricas para construir intershyvalos de confianza para las medias de la poblacion En la mayorf de los casos practicos las variables no siguen una distribuci6n aproximadamente normal 0 no se conocen las variancias de la poblaci6n 0 suceden ambas cosas En el ejemplo 623 y en la secci6n 63 se explican los procedimientos que se utilizan en situaciones menos ideales pero mas comunes

Muestreo a partir de pobluciunes que no presenlan una distribucion normal No siempre es posible 0 prudente suponer que la poblaci6n de interes muesshytra una distribuci6n normal Gracias al teOlema del limite central esto no sera un problema si se puede seleccionar una muestra 10 suficientemente grande Se ha dicho que para muestras grandes la distribucion muestral de Xi presenta una distribuci6n aproximadamente normal sin importar como esta distribuida la poblacion original

158 CAPiTULO 6 ESTIMACION

EJEMPLO 623

Un equipo de investigadores esta interesado en la puntualidad de los pacientes en las citas concertadas En un estudio de flqjo depacientes en los consultorios de medicos generales se encontr6 que una muestra de 35 pacientes llegaba 172 minutos tarde a las citas en promedio Una investigaci6n previa habia demostrado que la desviaci6n estandar era de 8 minutos aproximadamente Se tuvo la sensaci6n de que la distribushyci6n de la poblaci6n no era normal ~Cual es el intervalo de confianza de 90 por ciento para 11 que es el promedio real de impuntualidad en las citas

Soluci6n Dado que el tamafio de la muestra es bastante grande (mayor que 30) y se conoce la desviaci6n estandar de la poblaci6n la situaci6n se aproxishyrna al teorema del limite central y se supone que la distribuci6n muestral de xpresenta una distribud6n aproximadamente normal AI consultar la tabla D se encuentra que el coeficiente de confiabilidad que corresponshyde a uri coeficiente de confianza de 90se aproxima a 1645 si se interpola El error estandar es de C5z 8-35 13522 de modo que el intervalo de confianza de 90 por ciento para 11 es

172 plusmn 1645(13522) 172 plusmn 22 150 194 bull

Con frecuencia cuando la muestra es 10 suficientemente grande para aplicar el teorema dellfmite central la variancia de la poblacion se desconoce En ese caso se sustituye esta variancia conla de la muestra en la f6rmula para construir el intervashy10 de confianza para la media de la poblacion

Andlisispor computadora Cuando se requiere de los intervalos de confianza se economiza una buena cantidad de tiempo mediante el uso de una computadora la cual puede ser programada para construir los intervalos de datos no procesados

EJEMPLO 624

Los siguientes datos corresponden a los valores de la actividad (micromoles por minuto por gramo de tejido) de cierta enzima medida en el tejido gastrico normal de 35 pacientes con carcinoma gastrico

60 1189 614 788 273 2464 571 1827 537 374 449 262 448 971

372 898 411 348 1925 550 622

610 319 406 413 767 385 674

521 603 533 662 1177 307 1499

Mediante el uso del paquete de software para computadora MINITAB se pretenshyde construirun intervalo de confianza de 95 por ciento para la media de la poblashycion Suponga que la variancia de la poblaci6n es iguala 36 No es necesario suponer que la poblaci6n muestreada de val ores sigue una distribuci6n normal porque el tamafio de la muestra es losuficientemente grande para aplicar el teoreshyrna del limite central

159 62 INTERV ALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACION

Caja de dialogo Comandos de la sesi6n

Statgt Basic Statisticsgt 1-Sample z MTB gt ZINTERVAl 95 6 C1

Teclear Cl en Variables Se1ecdonar Confidence interval y teclear 95 en la caja de texto Teclear6 en Sigma Clic OK

Resultados

Confidence Intervals

The assumed sigma = 0600

Variable MicMoles

N 35

Mean 0718

StDev 0511

SE Mean 0101

950 Cr (0519 0917)

FIGURA 622 Procedimiento del paquete MINITAB para construir un intrevalo de conshyfianza de 95 por ciento para la media de la poblacion ejemplo 624

Solucion Se introducen los datos en lacolumna 1 y se procede como se muestra en la figura 622 Estas instrucdones indican a la computadora que e1 factor de confiabilidad es z que se necesita unintervalo de conshyfianza de 95 por dento que la desviaci6n estandarde la poblaci6n es de 6 y que los datos estan en la columna 1 El resultado indica que la media de la muestra es 718 la desviad6n estandar es 511 y e1 error estandar de la media af es 6J35 101

Se tiene 95 pordento middotde confianza de que la media de la poblashyci6n se encuentra entre 519y 917 bull

Puede obtenerse los intervalos de confianza a traves de otros paquetes de sofuvare Por ejemplo SASreg puede construir intervalos de confianza a traves de PROC MEANS o PROC UNIVARIATE

Otras eslimaciones de La tendencia central Tal como se ha visto la meshydia es muy sensible a los val ores extremos es dedr aquellos que se desvfan consideshyrablemente de la mayorfa de las mediciones en el con junto de datos A dichos valores se les conoce como sesgos Tambien se puede apreciar que lamediana que no es sensible a las mediciones extremas algunas veces se utiliza en lugar de la media como medida de tendenda central cuando los sesgos estan presentes Por la misshyrna raz6n quiza se prefiera el uso de la mediana de la muestra comomiddotestimador de la rnediana de la poblaci6n cuando se requiere realizar inferencias acerca de la tendenda central de la poblaci6n No solamente se utiliza la mediana de la muestra

160 CAPITULO 6 ESTlMACION

como una estimacion puntual para la mediana de la poblacion sino que tambien es posible construir un intervalo de confianza para la mediana de la poblacion En esta obra no se proporciona la formula pero esta se puede encontrar en la obra de Rice (1)

Media ajustada Los estimadores que son insensibles a los sesgos se Haman estimadores eficaces Otra medida y estimador eficaz de tendencia central es la media ajustada Para un conjunto de datos que contiene n mediciones se calcula el 1000 por ciento de la media ajustada como sigue

1 Ordenar las mediciones

2 Descartar las medici ones mas pequeiias y mas grandes que 100a por ciento de las mediciones El valor recomendado para a esta entre 1 y 2

3 Calcular la media aritmetica de las mediciones restantes

Observe que la mediana podrfa considerarse como 50 por ciento de la media ajusshytada Se debe recordar que la media ajustada para el conjunto de datos es una de las medidas descriptivas que puede calcular MINITAB

FJERCICIOS

Construya para cada uno de los siguientes ejercicios los intervalos de confianza al 90 95 Y 99 por ciento para la media de la poblacion y establezca para cada uno la interpretacion probabilistica y practica Indique cualinterpretacion puede ser mas aderuada para utilizar ruando se trata sobre intervalos de confianza con alguien que no conoce de estadfstica y establezca eI razonamientode por que se eUgi6 Explique por que los tres intervalos no tjenen la misma amplitud Indique cual de los tres intervalos es preferible como estimador de la media de la poblacion y establezca el razonamiento de la elecci6n

621 Se pretende estimar el numero promedio de latidos del coraz6n por minuto para cierta poblaci6n Se encontr6 que el numero promedio de latidos por minuto para 49 personas era de YO Considere que esos 49 pacientes constituyen una muestra aleatoria y que la poblacion sigue una distribucion normal con una desviaci6n estandar de 10

622 Se pretende estimar la concentraci6n media de bilirrubina indirecta en el suero en nmos de cuatro dias de nacidos La media para una muestra de 16 ninos es de 598 mglOO cc Conshysiderese que la concentraci6n de bilirrubina en los ninos de cuatro dfas de nacidos sigue una distribucion aproximadamente normal con una desviaci6n estandar de 35 mgIOO cc

623 En un estudio acerca de la duraci6n de la hospitalizacion dirigido por vados hospitales en cooperacion se extrajo una muestra aleatoria de 64 individuos con ulcera peptica de la lista de todos los pacientes con esa enfermedad internados alguna vez en los hospitales particishypantes Se determin6 para cada uno de eUos el tiempo de hospitalizaci6n Se encontr6 que la duraci6n media de hospitalizaci6n fue de 825 dfas y se sabe que la desviaci6n estandar de la poblaci6n es de tres dfas

624 Una muestrade 100 hombres adultos aparentemente sanos de 25 anos de edad muestra una presi6n sist61ica sangufnea media de 125 Considere que la desviaci6n estandar de la poblaci6n es de 15

161 63 DISTRIBUCI6N

625 Algunos estudios acerca de la enfermedad Alzheimer (EA)han mostrado un incremento en la producci6n de 14C0

2 en pacientes con ese padecimiento Durante un estudio se obtuvieshy

ron los siguientes valores de 14C02

a partir de 16 biopsias de neocorteza de pacientes con la enfermedad (EA)

1009 1280 1180 12551547 2352 1956 1080

1776 1767 1680 2050 1452 2857 3100 1621

Considereseque la poblaci6n sigue una distribuci6n normal con una desviaci6n estandar de 350

63 DISTRIBUCION t

En la seccion 62 se describe un procedimiento para obtener un intervalo de conshyfianza para la media de una poblaci6n EI procedimiento requiere del conodmiento de la varianda de la poblacion de la que se extrae la muestra Puede parecer un tanto extrafio que se tenga conocimiento de lavariancia de la poblacion y no se conozca elvalor de la media de la poblacion De hecho es comun en situacioshynes como las que se han presentado que se deSconozca tanto la variancia como la media de la poblacion Esta situacionpresenta un problema respecto a la construcshycion delos intervalos de confianza Por ejemplo aun cuando la estadfstica

x J1shyZ=---

crJn presenta una distribudon normal cuando la poblacion tambien tiene una distribuci6n normal y sigue una distribuci6n aproximadamente normal cuando n es muy grande independientemenle de la forma funcional de la poblacion no se puede hacer uso de este hecho porque cr se desconoce Sin embargo no todo esrn perdido y la soluci6n mas logica para este problema es utilizar la desviacion estandar de ~muestra

s = ~L(Xi - x)2(n-l)

para sustituir cr Por ejemplo cuando el tamafio de la muestra es mayor que 30 la confianza en s como una aproximacion de cr es por 10 general sustancial por 10 que se justifica la utilizacion de la teorfa de la distribudon normal para construir un intervalo de confianza para la media de la poblacion En tal caso se procede como se indica en la seccion 62

Cuando se tienen muestras pequefias es imprescindible encontrar otro proceshydimiento para construir intervalos de confianza

Como resultado del trabajo de Gosset (2) escrito bajo el seudonimo de Student se dispone de otra alternativa conocida como distribuci6n t de Student con frecuenda abreviada como distribuci6n t

La cantidad

sigue esta distribucion

162 CAPiTULO 6 ESTIMACION

Propiedades de la distribucion t La distribuci6n t tiene las siguientes proshypiedades

1 Tiene una media de O

2 Es simetrica con respecto a la media

3 En general tiene una variancia mayor que 1 pero esta tiende a I a medida que aumenta el tamaiio de la muestra Para dfgt 2 la variancia de la distribushyci6n t es dfl(df - 2) donde df representa los grados de libertad En forma alterna puesto que df n - 1 para n gt 3 se puede escribir la variancia de la distribuci6n t como (n l)(n 3)

4 La variable t va de - hasta + 00DO

5 La distribuci6n t es realmente una familia de distribuciones puesto que hay una distribuci6n diferente por cada valor de la muestra de n - 1 que es el divisor que se utiliza para ca1cular S2 Recuerde que n - 1 representa los grados de libertad En la figura 631 se muestran las distribuciones t correspondienshytes a algunos valores de los grados de libertad

6 Comparada con la distribuci6n normal ladistribuci6n t es menos espigada en el centro y tiene colas mas largas En la figura 632 se com para la distribushyci6n t con la distribuci6n normal

7 La distribuci6n t se aproxima ala distribuci6n normal a medida que n - 1 se aproxima al infinito

La distribuci6n t al igual quela distribuci6n normal estandar se ha tabulado ampliamente Una de estas tablas es la tabla E del apendice Tal como se puede apreciar se debe tomar en cuenta eLcoeficiente de confianza y los grados de libershytad cuando se utiliza la tabla de la distribuci6n t

FIGUR- 631 Distribuci6n t para diferentes grados de libertad

-----

163 63 DISTRIBUCION

__ Distribucion normal

- - - Dislribucion I

x

FIGURA 632 Comparaci6n de las distribuciones normal yt

Es posible utilizar el paquete MINITAB para graficar la distribuci6n t (para grados espedficos de libertad) y otras distribuciones Despues de asignar el eje horizontal y las siguientes direcciones en el cuadro de Set Patterned Data seleccioshyne del menu Calc y despues Probability Distributions Utilice el cuadro de diashylogo Plot para generar la grafica

Inlervalos de conJiQllia qllR uJilban fa dislribucion t El procedimien to general para construir interval os de confianza no se ve afectado por la necesidad de utilizar la distribuci6n t en lugar de la distribuci6n normal estandar Aun es necesario usar la relaci6n expresada por

estimador plusmn (coeficiente de confiabiIidad) x (error estandar)

Lo que es diferente es el origen del coeficiente de confiabilidad Este se obtiene a partir de la tabla de la distribucion t en lugar de la tabla de la distribuci6n normal estandar Para ser mas especfficos cuando se obtienen muestras a partir de una distribushycion normal cuya desviaci6n estdndi17 a se desconoce ell OO( 1 - a) por ciento del intervalo de confianza para la media de la poblaci6n J1 estd dado por

(631 )

Es importante aclarar que el requisito para el uso valido de la distribucion t es que la muestra debe ser extrafda de una poblad6n con distribucion normal Sin embarshygo la experiencia ha demostrado que se pueden tolerar desviaciones moderadas de esterequisito Como consecuencia la distribucion t se utiliza incluso cuando se sabe que la poblaci6n original se desvia de la normalidad Lltl mayorfa de los invesshytigadores requieren que al menos pueda sostenerse el supuesto de una distribushyd6n de poblacion en forma de montfculo

EJEMPLO 631

Maureen McCauley (A-I) realiz6 un estudio para evaluar los efectos de un conjunto de instrucciones de mecanica en ellugar de labores sobre el desempeno laboral de obreros jovenes recientemente contratados Se utilizaron dos grupos de individuos elegidos aleatoriamente uno de los grupos para aplicar el experimento y el otro

164 CAPITULO 6 ESTlMACI6N

como grupo de control EI grupo con el que se experimento recibio una hora de capacitacion impartida por un terapeuta ocupacional EI grupo de control no recishybio esta capacitacion Para evaluar el esfuerzo de cada obrero para levan tar bajar jalar y transportar objetos dentro del entorno laboral se utilizo una lista de cotejo para la evaluacion de trabajo mecanico que inclufa criterios de referencia Una tarea bien hecha recibio una calificacion de 1 EI grupo de control formado por 15 individuos alcanzo una calificacion media de 1153 en la evaluacion con una desshyviacion estandar de 3681 Se supone que el grupo de control se comporto como una muestra aleatoria extraida de una poblacion similar de individuos Se pretende utilizar los datos de la muestra para estimar la calificacion media para la poblacion

Soluci6n Se puede utilizar la media de la muestra 1153 como una estimacion puntualde la media de la poblacion sin embargo debido a que se descoshynoce la desviacion estandar de la poblacion se debe considerar que los valores siguen una distribucion aproximadamente normal antes de consshytruir los intervalos de confianza para l Se considera que esta suposicion es razonable y que se necesita un intervalo de confianza de ~or cienshyto el estimador es i y el error estandar es s -r 681 15 =9504 Ahora es necesario conocer el coeficiente de confiabilidad el valor de t asodado al coeficiente de confianza de 95 y a los n 1 = 14 grados de libertad Puesto que el intervalo de confianza de 95 por ciento deja 05 del area bajo la curva de t para dividirse en dos colas iguales se necesita el valor de tala derecha del cual esta el 025 del area Este valor se localiza en la tabla E enla columna encabezada por t

975 bull Este es el valor

para tala izquierda delcual esta 975 del area bajo la curva EI area a la derechade este valor es igual al 025 deseado Ahora sobre la columna de grados de libertad se localiza el numero 14 EI valor para t se encuentra en la interseccion del renglon con la etiqueta 14 y la columna con la etiqueta t975 bull Se encuentra que este valqr para t que representa al coeficiente de confiabilidad es 21448 Finalmente el intervalo de confianza de 95 por ciento se construye como sigue

1153 plusmn 21448(9504) 1153 plusmn 204 949 1357 bull

Este intervalo puede interpretarse con ambos puntos de vista probabiHstico y practico Puede asegurarse en un 95 por dento que 1a media l correcta de la poblacion se encuentra entre 949 y 1357 porque al repetir el muestreo 95 por dento de los intervalos construidos deigual manera incluyen a l

Decidir entre z r t Cuando se obtiene un intervalo de confianza para la media de una poblacion se debe decidir si se utiliza un valor de z6 de t como factor de confiabilidad Para hacer una elecci6n adecuada se debe considerar el tamafto de la muestra si la poblacion muestreada sigue una distribucion normal y si la varian cia de la poblacion es conocida La figura 633 muestra un diagrama de flujo que se puede utilizar para decidir rapidamente si el factor de confiabilidad debe ser Z 0 t

EJERCICIOS 165

EJERCICIOS

Sa aplica al leorema dellfmile central

FIGURA 633 Diagrama de flujo para deddir entre utililizar z y t cuando se hagan inferencias respecto a las medias de la poblaci6n (Para utilizar un procedimiento no parametrico vease el capitulo 13)

Analisis par computadara Si el proposito es construir un intervalo de conshyfianza con el programa MINITAB para la media de la poblacion cuando el estadfsshytico t es el factor de confiabilidad adecuado el comando se inicia con la palabra TINTERVAL Seleccione en Windows I-Sample t desde el menu de Basic Statistics

631 Utilice la distribud6n t para encontrar el factor de confiabilidad para el intervalo de confianshyza basado en los siguientes coeficientes de confianza y tamafiosde las muestras

a b c d

Coefidente de confianza 95 99 90 95 Tamafio de la muestra 15 24 8 30

632 En una investigacion acerca de la dependencia del flujo y volumen de todo el sistema respishyratorio en un grupo de pacientes con enfermedad obstructiva pulmonar cronica conectados a respiradores artificiales Tantucci et ai (A-2) registraron los siguientes valores de linea de

166 CAPITULO 6 ESTIMACION

base del flUjD continuo inspiratDriD (Us) 90 97 103110 104 100 CDnsidere que una muestra aleatDria simple esta cDnfDrmada pDr seis individuDs a partir de una pDblacion que sigue una distribuci6n nDrmal CDn individuDs CDn la misma enfermedad

a) ~Cuat es la estimaci6n puntual de la media de la pDblaci6n

b) ~Cuil es la desviacion estandar de la muestra

c) ~Cultll es la estimacion del error estandar para la media de la muestra

d) CDnstruya un intervalD de cDnfianza de 95 pDr ciento para el flUjD mediD cDntinuD inspishyratDriD de la pDblaci6n

e) ~Cual es la precision de la estimacion

f) Explique la interpretaci6n prDbabilistica para este intervalD de confianza

g) Explique la interpretacion practica para este intervalD de cDnfianza

633 LlDyd y MaillDux (A-3) informaron IDS siguientes datDs acerca del peso de la glandula pituitaria en una muestra de cuatrD ratas de Wistar Furth

media = 90 mg error estandar para la media = 3

FUEJTE Ricardo V Lloyd y Joe Mailloux Analysis ofSshy100 Protein Positive Folliculo Stellate Cells in Rat Pituitary Tissues AmericanJournal ofPathology 133 338-346

a) ~Cual es la desviadon estandar de la muestra

b) CDnstruya un intervalD de confianza de 95 pDr ciento para el peso medio de la glandula pituitaria para una pDblacion similar de ratas

c) ~Que supDsiciDnes se necesitan para que sea validD el intervalo de cDnfianza del inciso b

d) ~Que interpretacion puede ser la mas indicada cuandD se trata sDbre intervalos de conshyfianzacon alguien que no sabe de estadfstica Explique pDrque es la mas cDnveniente

e) 5i fuera necesario elabDrar un intervalD de cDnfianza de 90 pDr cientD para la media de la pDblaci6n ~el intervalD de cDnfianza serta mayDr 0 menor que el intervalD de 95 pDr dentD Explique su respuesta sin construir realmente el intervalD de cDnfianza

f) 5i [uera necesariD considerar un intervalo de CDnfianza de 99 pDr cientDpara lamedia de la poblacion ~el intervalo de cDnfianza serra mayDr 0 menDr que el intervalD de 95 pDr dentD Explique su respuesta sin cDnstruir realmentt el intervalD de cDnfianza

634 Kaminski y Rechberger (A-4) encontrarDn en un estudio sDbre la preeclampsia que la media de la presi6n sistolica sangufnea en 10 mujeres sanas y que no estan embarazadas es de 119 CDn una desviacion estandar de 21

a) 2Cual es el errDr estandar estimadD para la media

b) CDnstruya un intervalD de confianza de 99 pDr cientD para la media de la poblaci6n a partir de la cual puede considerarse que IDS 10 individuos conforman una muestra aleatoria

c) ~CUlil es la precisi6n estimada

d) ~Que consideraciones deben hacerse para comprobar la validez del intervalo de confiahza

635 Unamuestra de 16nifias de 10 afiDS pesan en promediD 715 con una desviacion estandar de 12libras CDnsidere el calculD de intervalDs de cDnfianza de 9095 y 99 pDr ciento para I-L

167 64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS

636 Una muestra aleatoria simple conformada por 16 individuos aparentemente sanos presenta los siguientes valores de arsenico eliminado en la orina (miligramos por dfa)

Individuo Valor Individuo Valor

1 007 9 012 2 030 10 006 3 025 11 010 4 008 12 032 5 030 13 006 6 038 14 009 7 007 15 014 8 005 16 011

Elabore un intervalo de confianza de 95 por ciento para la media de la poblaci6n

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES

En ocasiones se presentan casos en los que se desea estimar 1a diferencia entre 1a media de dos poblaciones A partir de cada poblacion se extrae una muestra aleatoria independiente y de los datos de cada una se calculan las medias muestrales XI y x2

respectivamente En el capitulo anterior se dijo que el estimador XI - x2 ofrece una estimacion insesgada de la diferencia entre las medias de las poblaciones III shy11 2 bull La variancia del estimador es (cr~ n l ) + (cr~ n 2 ) Tambien se menciono que seglin las condiciones la distribucion muestral de XI - x2 puede presentar una distribution al menos aproximadamente normal de modo que en muchos casos se utiliza la teorfa adecuada para las distribuciones normales en el calculo de un intershyvalo de confianza para III - 11 2 bull Cuando se conocen las variancias de la poblacion el intervalo de confianza del 100(1 - ex) por ciento para III - 112 esta dado por

(641)

El anal isis del intervalo de confianza para la diferencia entre las medias poblacionales ofrece informacion util para decidir si es 0 no probable que las medias de las dos poblaciones sean iguales Cuando el intervalo no incluye al cero se dice que el intervalo ofrece evidencia de que las dos poblaciones tienen medias diferentes Cuando el intervalo incluye al cero se dice que las poblaciones pueden tener meshydias iguales

Esto se ilustra a continuacion para el caso donde el muestreo se realiza a partir de una distribucion normal

168 CAPITULO 6 ESTlMACI6N

EJEMPLO 641

A un equipo de investigacion Ie interesa conocer la diferencia entre las concentracioshynes de acido urico en pacientes con y sin el sfndrome de Down En un gran hospital para el tratamiento de pacientes con retardo mental una muestra de 12 individuos con el sindrome presenta una media de XI = 45 mgll00 mL En un hospital general se encontro que una muestra de 15 individuos normales de la misma edad y sexo presenta un nivel medio de x2= 34 Si es razonable suponer que las dos poblaciones de valores muestran una distribucion normal y sus variancias son iguales a 1 y 15 calcule el intervalo de confianza de 95 por ciento para ~l - ~2

Soluci6n Para una estimacion puntual de III 112 se udliza Xl X2= 45 34 11 EI coeficiente de confiabilidad que corresponde a 95 localizado en la tabla D es 196 EI error estandar es

Por 10 tanto el intervalo de confianza de 95 por ciento es

11 plusmn 196(4282) 11plusmn84 26 194

Se dice que se dene una confianza de 95 por ciento de que la difeshyrencia real 111 - 112 este entre 26 y 194 porque en muestreos repetidos 95 por ciento de los intervalos construidos de esa manera incluiria la diferencia entre las medias reales

Puesto que el intervalo no incluye al cero se concluye que las dos poblaciones tienen diferentes medias bull

Muestreo a partir de poblaciones que no signen una distribuci6n ItOrmal La construccion de un intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando el muestreo se realiza a partir de poblaciones no normales se lleva a cabo en la forma descrita en el ejemplo 641 si las muestras n l y n

2 son grandes Una vez mas este es un resultado del teorema del limite central

Si se desconocen las variancias de la poblacion se utili zan las variancias de las muestras para estimarlas

IUEMPLO 642

Motivados por d conocimiento de la existencia de una gran cantidad de textos polemicos que sugieren que el estres la ansiedad y la depresion son dafiinos para el sistema inmunologico Gormanet ai (4-5) condujeron un estudio en el que se conshysider6 a individuos varoneshomosexuales algunos con VIH (virus de inmunodefishyciencia humana) positivo y otros con VIH negativo Los datos fueron registrados con una amplia vltJriedad de mediciones medicas inmunologicas psiquiatricas y neurol6gicas una de las cuales corresponde al numero de celulas CD4+ en la sanshy

64 INTERV ALO DE CONFIANZA PAHALA DIFERENCIA ENTRE DOS MEDIAS 169

gre El numero promedio de celulas CD4+ para middot112 individuos con infecci6n por VIR fue de 4018 con una desviaci6n estandar de 2264 Para los 75 individuos sin la infecci6n por VIR la media y la desviaci6n estandar fueron de 8282 y 2749 respectivamente Se pretende elaborar un intervalo de confianza de 99 por ciento para la diferencia de las medias de las poblaciones

Soluci6n No hay informaci6n con respecto a la forma de la distribuci6n de las celulas CD4+ Sin embargo como el tamafto de las muestras es grande el teorema del limite central asegura que la distribuci6n muestral de las diferencias entre las medias de la muestra siguen una distribuci6n aproxishymadamente normal independientemente de que la distribuci6n de la variable en las poblaciones no siga una distribuci6n normal Se puede utilizar este hecho para justificar el uso de la estadistica z como factor de confiabilidad en la construcci6n del intervalo de confianza Tampoco hay informaci6n acerca de las desviaciones estandar por 10 que puede emplearse las desviaciones estandar de las muestras para estimarlas La estimaci6n puntual para la diferencia entre las medias de las poblacioshynes es la diferencia entre las medias de las muestras 8282 - 4018 = 4264 En la tabla D se encuentra que el factor de confiabilidad es 258 La estimaci6n del error estandar es

s __ = 27492

+ 22642 =382786

Xl-X 75 112

Por la ecuaci6n 641 el intervalo de confianza de 99 por ciento para la diferencia entre las medias de la poblaci6n es

4264 plusmn 258(382786) 3276 5252

Se tiene la seguridad de 99 por ciento de que el promedio de celulas CD4+ en varones con VIR positivo difieren de la media para los varoshynes con VIR negativo por 3276 a 5252 bull

Distribuci6n t y la diferencia entre las medias Cuando no se conocen las variancias y se pretende estimar la diferencia entre las medias de dos poblacioshynes con un intervalo de confianza es posible utilizar la distribuci6n t para suminisshytrar el factor de confiabilidad si se conocen ciertas suposiciones se debe saber 0

suponer de buena fe que las dos poblaciones muestreadas siguen una distribuci6n normal Respecto a las variancias de las poblaciones se debe distinguir entre dos situaciones 1) la situaci6n en la que las variancias son iguales y 2) la situaci6n en la que no 10 son A continuaci6n se consideranambas sitpaciones por separado

Varianciaspoblacifmales iguales Si la suposici6n sobre igualdad de las variancias de las poblaciones esta justificada las dos variancias de las muestras calculadas a partir de las muestras independientes pueden considerarse como estishymaciones de 10 mismo es decir la variancia comun Parece 16gico entonces aproshyvechar este hecho en el anal isis en cuesti6n Esto es precisamente 10 que se hace para establecer una estimaci6n conjunta para la variancia comun Esta variancia se obtiene mediante el caIculo promedio ponderado de las dos variancias de las muesshy

170 CAPITULO 6 ESTlMACI6N

tras Cada variancia de la muestra es ponderada con base en sus grados de libertad Si los tamafios de las muestras son iguales este promedio ponderado es la media aritmetica de las variancias de las dos muestras Si el tamano de las dos muestras es distinto el promedio ponderado aprovecha la informacion adicional proporcionada por la muestra mayor La estimacion con junta se obtiene con la fOrmula

S2 = (nl _1)SI2 + (n2 l)s~ p (642)

+n2 -2nl

Asf la estimacion del error estandar esta dada por

(643)

y el intervalo de confianza de 100(1 a) por ciento para III 112 esta dada por

(644)

El nfunero de grados de libertad utilizado para determinar el valor de t que se usa para construir el intervalo es n

1 + n

2 2 que es el denominador de la ecuacion

642 Este intervalo se interpreta en la forma habitual Los metodos que pueden emplearse para tomar la decision acerca de la igualshy

dad de las variancias de las poblaciones se estudian en la seccion 610 y 78

EJEMPLO 643

Uno de los estudios de Stone et al (A-6) tuvo como objetivo determinar los efectos del ejercicio por un tiempo prolongado en los ejecutivos de una compania inscritos en un programa supervisado de acondicionamiento fisico Se registraron datos de 13 individuos (el grupo deportista) que voluntariamente se inscribieron el programa y que permanecieron activos por 13 anos en promedio y de 17 individuos (el segunshydo grupo el sedentario) que decidieron no inscribirse Entre los datos que se regisshytraron acerca de los individuos esta el mlmero maximo de sentadillas realizadas en 30 segundos El grupo deportista obtuvo una media y una desviacion estandar de 210 y 49 respectivamente La media y la desviacion estandar para el grupo sedenshytario fueron 121 y 56 respectivamente Se considera que las dos poblaciones de medici ones de acondicionamiento muscular siguen una distribuci6n aproxirnadashymente normal y que las variancias para ambas poblacionesson iguales Se pretenshyde elaborar un intervalo de confianza de 95 por ciento para Ja diferencia entre las medias de as poblaciones representadas por las dos muestras Soluci6n Primero se utiliza la ecuaci6n 642 para calcular la estimaci6n conjunta

de la variancia comtin de las poblaciones

(13-1)(49 2 )+(17 1)(562 ) =2821

13+17-2 Cuando se consulta la tabla E con 13 + 17 - 2= 28 grados de libertad y el nivel de confianza de 95 se encuentra que eLfactor de confiabilidad es 20484 Con la ecuacion 644 se calcula el intervalo de confianza de

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS 171

95 por ciento para la diferencia entre las medias de las poblaciones de la siguiente manera

2821 2821(210-121)plusmn20484 --+-shy

13 17 89 plusmn 40085

49129

Se tiene una confianza de 95 por ciento de que la diferencia entre las medias de las poblaciones estan entre 49 y 129 Se puede decir esto porque se sabe quesi se repite el amilisis muchfsimas veces y se calculan los intervalos de confianza de la misma manera cerca de 95 por ciento de los intervalos de confianza induiran la diferencia entre las medias de las poblaciones

Debido a que los intervalos no induyen al cerose conduye que las medias de las poblaciones son diferentes bull

Variancias poblacionales distintas Cuando no se puede conduir que las variancias de dos poblaciones de interes son iguales aun ruando pueda suponerse que las dos poblaciones presentan distribuciones normales no es adecuado utilizar la distribucion t como se acaba de describir para construir los intervalos de confianza

Una solucion al problema de variancias distintas fue propuesta por Behrens (3) y posteriormente fue verificada y generalizada por Fisher (4 5) Neyman (6) Scheffe (7 8) Y Welch (9 10) tambien proponen soluciones EI problema es analizashydo en detalle por Cochran (11)

EI problema gira en tomo al hecho de que la cantidad

no sigue una distribuci6n t con nj + n 2 grados de libertad ruando las variancias 2 shy

de las poblaciones son distintas Consecuentemente la distribucion t no se puede utilizar en la forma habitual pata obtener el factor de confiabilidad del intervalo de confianza para la diferencia entre las medias de dos poblaciones que tienen variancias diferentes La solucion propuesta por Cochran consiste en el calculo del factor de confiabilidad mediante la siguiente formula

wltj + w2tZ t l

f

-0f2 = (645) WI +w2

donde WI 512

np W 2 = s~ n2 tl = tl _ para nj - 1 grados de libertad y t2 = t l

_w2aI2

para n2

- 1 grados de libertad Un intervalo aproximado de confianza del 100(1 shya) por ciento para III - 112 esta dado por

(646)

172

EJERCICIOS

CAPITULO 6 ESTlMACION

FJEIUPLO 644

En la investigacion de Stone et al (A-6) descrita en el ejercicio 643 los investigashydores tambien informaron los siguientes datos de las medici ones referentes a todas las calificaciones del acondicionamiento muscular logradas por los individuos

Muestra n Media Desviaci6n estimdar

Grupo deportista 13 45 3

Grupo sedentario 17 37 10

Se considera que las dos poblaciones de todas las calificaciones de acondicionashymiento muscular siguen una distribuci6n aproximadamente normal Sin embargo no debe suponerse que las dos variancias poblacionales son iguales Se pretende construir un intervalo de confianza de 95 por ciento para la diferencia entre las medias de todas las calificaciones de acondicionamiento muscular para las dos poshyblaciones representadas por las muestras

Soluci6n Se utiliza t de la ecuaci6n 645 para calcular el factor de confiabilidad En la tabla E se muestra que con 12 grados de libertad y 1 - 052 = 975 t( 21788 Analogamente con 16 grados de libertad y 1- 052 = 975 t2 = 21199 Ahora Sf calcula

(3 2 13)(21788) + (102 17)(21199) 139784 t= =

(3 2 13)+(102 17) 065747

=21261

Con la ecuaci6n 646 ahora se construye el intervalo de confianza de 95 por ciento para la diferencia entre las medias de las dos poblaciones

2 2

(45 37)plusmn21261 3 + 10 13 17

8 plusmn 21261 (25641101) 25134

Puesto que el intervalo no incluye acero se concluye que las medias de las dos poblaciones son diferentes bull

Cuando se construyen intervalos de confianza para la diferencia entre las medias de dos poblaciones es posible utilizar la figura 641 para decidir rapidashymente si el factor de confiabilidad debe ser z t 0 tf

Para cada uno de los siguientes ejercicios construya intervalos de confianza de 90 95 y 99 par ciento para las diferencias entre las medias poblacionales Establezca consideraciones que hagan que el metodo sea valido Determine las interpretaciones practica y probabilistica

clJ clJ FIGURA 541 Diagrama de flujo para decidir si e1 factor de confiabilidad debe ser z tot cuando se realizan inferencia inferencias acerca de la diferencia entre las medias de dos pobladones (Para usar un procedimiento no parametrico ver el capitulo 11)

174 CAPiTULO 6 ESTlMACION

para cad a intervalo construido Suponga las variables bajo considerati6n en cad a ejercicio y establezca para que pueden servir a los investigadores esos resultados

641 EI objetivo de un experimento de Buckner et al (A-7) consisti6 en estudiar los efectos del relajamiento muscular inducido por el pancuronium en el volumen del plasma circulante Los individuos estudiados son recien nacidos con un peso mayor a 1700 gramos que necesishytaron de ayuda para respirar durante las primeras 24 horas despues de nacer y cumplieron con otros criterios cHnicos Cinco recien nacidos paraIizados con el pancuronium y siete recien nacidos no tratados presentaron las siguientes estadisticas en la segunda de las tres mediciones del volumen de plasma (ml) hecha durante la respiraci6n mecanica

Paralizados 480 81 No tratados 567 81

La segunda medici6n para el grupo tratado ocurri6 de 12 a 24 horas despues de la primera dosis de pancuronium Para el grupo no tratado las mediciones se hicieron de 12 a 24 horas despues de iniciar la respiracion mecanica

642 Zuckery Archer (A-8) afirman que la N-nitrosobis (2-oxopropyl)amina (BOP) y las nitrosaminas 3-oxidizadas producen una alta incidencia de tumores de conductos pancreaticos en el hamster dorado sirio Estudiaron los efectos en el peso sangufneo en la glucosa del plasma en la insulina yen los niveles de transamina glutamico-oxaloacetica del plasma (GOT) de los hamsters expuestos in vivo a la BOP Los investigadores reportaron los siguientes resultados en ocho animales tratados y 12 sin tratamiento

Variable Sin tratamiento Con tratamiento

Glucosa del plasma (mglgl) 101 plusmn 5 74plusmn 6

FUENTE Peter F Zucker y Michael C Archer Alterations Pancreatic Islet Function Produced by Carcinogenic Nitrosamines in the Syrian Hamster AmericanJournal oPathology 133 573-577

Los datos son la media de la muestra plusmn la estimaci6n del error estandar de la media de la muestra

643 Los objetivos de un estudio de Davis et al (A-g) son evaluar 1) la eficacia del programa auto ayuda momento para dejar de fumar cuando se utiliza con base de uno a uno en el hogar y 2) la viabilidad de ensefiar temicas para abandonar el habito de fumar a los estudiantes de enfermerfa en bachillerato A estudiantes graduados de enfermerfa inscritos en dos cursos de metodologia de la investigacion de la Universidad de Ottawa se les invit6 a participar en el proyecto Se aplic6 un cuestionario de opcion multiple para abandonar el habito de fumar a 120 estudiantes de enfermeria que participaron y a otros 42 estudiantes que no participashyron antes ni despues del estudio Se calcularon las diferencias entre las calificaciones antes y despues del estudio as como las siguientes estadisticas a partir de las diferencias

EJERCICIOS 175

Grupo Media Desviaci6n estandar

Participantes (A) 214444 15392 No participantes (B) 33333 14595

644 El doctor Ali Khraibi (A-IO) de la CHnica y Fundaci6n Mayo condujo una serie de experishymentos con el fin de evaluar las respuestas diureticas y natiureticas de ratas Okamoto esponshytaneamente hipertensivas (REB) y ratas Wistar-Kyoto (WRY) para dirigir incrementos en la presion hidrostatica renal intersticial (PBRI) Para aumentar la PBRI se utiIiz6 la expansi6n directa del volumen renal intersticial (DRIVE) a traves de una matriz implantada cronicamente en el rinOn Entre los datos registrados durante el estudio estan las siguientes mediciones de excreci6n de sodio a traves de la orina (UNa V) durante el periodo de DRIVE

Grupo

REB 632572796483527 2WKY 420469482 108210

FUENTE Publicada con autorizaci6n del Dr Ali A Khraibi

645 Osberg y Di Scala (A-II) realizaron un estudio centrado en la eficacia de los cinturones de seguridad para reducir 1esiones entre sobrevivientes de accidentes automoviHsticos internashydos en hospitales con edades de 4 a 14 afios El estudio compar610s resultados de 123 ninos que utilizaron el cintur6n contra 290 que no 10 utilizaron entre aquellos que se vieton enshyvueltos en tales accidentes y que fueron hospitalizados El informe con tenia la siguiente estadistica del numero de dfas en la unidad de cuidados intensivos

Grupo Media Error estandar estimado

Utiliz6 el cintur6n 83 16 No utiliz6 el cintur6n 139 18

646 La medicion del diametro transversal del coraz6n de hombres y mujeres adultos presenta los siguientes resultados

sx Grupo Tamafto de Ia muestra (cm) (cm)

Varones 12 1321 105 Mujeres 9 IIOO 101

Considere que las poblaciones siguen una distribucion normal con variancias iguales

176 CAPITULO 6 ESTIMACION

647 Veintiruatro animales de laboratorio con deficiencia de vitamina D fueron divididos en dos grupos iguales EI grupo 1 recibi6 un tratamiento consistente en una dieta que proporcionashyba vitamina D EI segundo grupo no fue tratado AI termino del periodo experimental se midieron las concentraciones de calcio ensuero obteniendose los siguientes resultados

Grupo tratado X 111 mg 100 mls = 15 Grupo sin tratamiento x= 78 mg 100 ml s = 20

Considere que las poblaciones siguen una distribuci6n normal con variancias iguales

648 Ados grupos de nifios se les hicieron pruebas de agudeza vi~ual El grupo 1 estuvo formado por 11 nifios que recibieron la atenci6n de medicos privados La calificaci6n media para este grupo fue de 26 con una desviaci6n estandar de 5 El segundogrupo que incluy6 14 nifios que recibieron atenci6n medica por parte del departamento de salud publica tuvo una calishyficaci6n promedio de 21 con una desviaci6n estandar de 6 Suponga que las poblaciones siguen una distribuci6n normal con variancias iguales

649 El tiempo promedio de estancia de una muestra de 20 pacientes dados de alta de un hospital general es de siete dras con una desviaci6n estaildar de dos dras Una muestra de 24 padenshytes dados de alta de un hospital de enfermedades cr6nicas tuvo un tiempo promedio de estancia de 36 dfas con una desviaci6n estindar de 10 dias Suponga que la poblaci6n sigue una distribuci6n normal con variancias desiguales

6410 En un estudio de factores que se consideran responsables de los efectos adversos del tabashyquismo sobre la reproducci6n humana se midieron los niveles de cadmio (nanogramos por gramo) en el tejido de la placenta de una muestra de 14 madres que fumaban y una muestra aleatoria independiente de 18 mujeres no fumadoras Los resultados fueron los siguientes

No fumadoras toO 84 128250 118 98 125 154 235

94251 1952559875 118122150

Fumadoras 300301150241305178168148

134285 175 144 125204

ms probable que el nivel medio de cadmio registrado sea mayor entre las fumadoras que entre las no fumadoras ~Por que se llegarfa a esta conclusi6n

65 INTERVALO DE CONFIANZA PARA IA PROPORCION DE UNA POBIACION

Muchas preguntas de interes para que el tecnico en salud tienen relacion con las proporciones de poblacion ~Que propordon de padentes que redben un tipo espeshycial de tratamiento se recuperan ~Que proporcion de alguna poblacion tiene cierta enfermedad ~Que propordon de una poblacion es inmune a derta enfermedad

Para estimar la proporcion de una poblacion se procede en la misma forma que cuando se estima la media de una poblacion Se extrae una muestra de la poblacion de interes y se calcula su proporcion p Esta se utiliza como el estimador puntual para la proporcion de la pobladon Un intervalo de confianza se obtiene mediante la siguiente formula general

estimador plusmn (coefidente de confiabilidad) X (error estandar)

EJERCICIOS

EJERCICIOS 177

En el capitulo anterior se vio que cuando np y n(1 - p) son mayores que 5 se puede considerar que la distribuci6n muestral de pse aproxima bastante a una distribuci6n normal Cuando se cumple con esta condici6n el coeficiente de confiabilidad es algUn valor de z de la distribuci6n normal estandar Esta visto que el error estandar es igual a (J p =fi(l-p) n Puesto que p que es el parametro que se trata de calcular se desconoce se debe utilizar pcomo una estimaci6n Asf se estima (J j por medio de ~p(l Pn y el intervalo de confianza de 100(1 - 0) por ciento para pesta dado por

pplusmn Z(I-1J2)~P(l- P) Fn (651)

Este intervalo se interpreta tanto desde el punto de vista practico como probabilistico

FJEMPLO 651

Mathers et al (A-12) encontraron queen una muestra de 591 pacientes internados en un hospital psiquiatrico 204 admitieron que consuniieron marihuana al meshynos una vez durante su vida Se pretende construir un intervalo de confianza de 95 por ciento para la proporcion de individuos que consumieron marihuana durante su vida en la poblaci6n muestreada de los internos del hospital psiquiatrico

Solucion La mejor estima~i6n puntual para la proporci6Il de la poblaci6nes p== 204591 3452 El tamafio de la muestra y hiestimacion de p tienen una magnitud suficiente parajustifKar el empleo de la distribucion norshymal estandar paraelaborar un intervalo de confianza EI coeficiente de corifiabilidad que corresponde alnivel de confianza de 95 es 196 la estimacion del errorestandar (Jp es ~p(l-pgtn = (3452)(6548)591

0 1956El intervalo de confianza para p de acuerdo con estos datos es

3452 plusmn 196(01956) 3452 plusmn 0383 3069 3835

Se puede decir que se tiene 95 por ciento de confianza de que la proporshycionpeste entre 3069 y 3835 ya que al repetir el muestreo casi 95 por ciento de los intervalos construidos en la forma de este intervalo inclushyyen a la proporcion p real Con base en estos resultados se espera con una confianza de 95 por ciento encontrar que entre 3069 y 3835 por ciento de los internados en el hospital psiquiatrico tiene antecedentes de consumo de marihuana bull

Para cada uno de los siguientes ejercicios establezca la interpretacion prictica yprobabilistica de los intervalos que se pide construir Identifique cada componente del intervalo la estimashycion puntual el coeficiente de confiabilidad yel error estandar Explique por que los coefishycientes de confiabilidad no son los misInos para todos los ejercicios

178 CAPITULO 6 ESTIIlACI6N

651 En una investigaci6nde ninos maltratados en pacientes psiquiatricos Brown y Anderson (A-IS) encontraron 166 pacientes en una muestra de 947 con antecedentes de abuso sexual y maltrato flsico Construya un intervalo de confianza de 90 por dento para la proporci6n de la poblaci6n

652 Catania et at (A-14) obtuvieron datos respecto al comportamiento sexual de una muestra de hombres y mujeres solteros con edades entre 20 y 44 residentes en areas geoijfaficas caracshyterizadas por tasas altas de enfermedades de transmision sexual e ingreso a programas de drogas De 1229 encuestados 50 por ciento respondieron que nunca utilizaron preservatishyvos Construya un intervalo de confianza de 95 por ciento para la proporcion de la poblaci6n que nunca utiliza preservativos

653 Rothberg y Lits (A-I 5 ) estudiaron el efecto del estres de la maternidad durante el embarazo en el peso del producto Los individuos eran 86 mujeres blancas con antecedentes de estres que no tenfan faetores de riesgo medico u obstetrico conoddo de peso bajo del producto Los investigadores eneontraron que 128 por dento de las madres estudiadas dieron a luz bebes que cubrfan el criterio de peso bajo Construya un intervalo de confianza de 99 por ciento para la proporci6n de la poblaci6n

654 En una muestra aleatoria simple de 125 varones desempleados quienes desertaron de la escuela preparatoria entre las edades de 16 y 21 anos inclusive 88 declararon que eran consumidores regulares de bebidas alcoh6litas Construya un intervalo de eonfianza de 95 por ciento para la proporcion de la poblacion

66 INTERVALO DE CONFIANZA PARA lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS POBlACIONES

A menudo se tiene interes en conocer la magnitud de la diferencia entre las proporcioshynes de dospoblaciones Es posible que se quiera comparar por ejemplo entre hombres y mujeres dos grupos de edades dos grupos socioecon6micos 0 dos grupos de diagshynostico con respecto a la proporcion que posee alguna caractenstica de interes Un estimador puntual insesgado de la diferencia entre dos proporciones de las poblacioshynes se obtieneal calcular la diferencia de las proporciones de las muestras PI P2 Tal como Se ha visto cuando n1 Yn2 son de gran tamano y las proporciones de la poblacion no estan muy cerca de 0 0 de 1 es posible aplicar el teorema del limite central y utilizar la teona de la distribucion normal para obtener los intervalos de conshyfianza EI error estandar de la estimacion se calcula mediante la siguiente formula

dado que como regIa se desconocen las proporciones de Ia poblacion Un intervashy10 de confianza de 100(1 - a) por ciento para PI P2 se obtiene as

(661)

Es posible interpretar este intervalo desde elpunto de vista probabiHstico y practico

EJERCICIOS 179

EJEMPLO 661

Borst et al (A-16) investigaron la relaci6n de desarrollo del ego edad sexo y diagshyn6stico de suicidio entre los internos adolescentes de la unidad de psiquiatria La muestra consistia en 96 varones y 123 niiias con edades entre 12 y 16 aiios seleccioshynados de entre los internados en la unidad de adolescentes y niiios de un hospital psiquiatrico privado Se reportaron 18 niiios y 60 niiias con intento de suicidio Cons ishyderese el comportamiento de las niiias como el de una muestra aleatoria simple a partir de una poblaci6n similar de niiias y que los j6venes igualmente pueden considerarse como una muestra aleatoria simple extraida de una poblaci6n similar de niiios Para estas dos poblaciones se pretende construir un intervalo de confianshyza de 99 por ciento para la diferencia entre las proporciones de los individuos con intento de suicidio

Soluci6n Las proporciones para las niiias y niiios respectivamente son Pc = 601 123 = A878y PB = 1896 1875 La diferencia entre las proporciones de lasmuestrases Pc PB = 4878 1875 = 3003 El error estandar estimado de la diferenda entre las proporciones de las muestras es

(4878)(5122) (1875)(8125) ---~~-~ +-------shy

123 96

El factor de confiabilidad a partir de la tabla D es 258 de modo que el intervalo de confianza con la f6rmula 661 es

3003 plusmn 258(0602) 14504556

Se dene la confianza de 99 por dento de que para las poblaciones muestteadas la ptopord6n de intentos de suiddio entre las niiias exceshyde a lapropord6n de intentosde suiddio entre los varones por 1450 y 4556

Puesto que el intervalo no incluye al cero se concluye que las dos proporciones de pobladones son diferentes bull

FJERCICIOS

Para cada uno de los siguientes ejercicios establezca las interpretaciones pnicticas y probabishylisticas de los intervalos que se pide construir Identifique cada componente del intervalo la estimaci6n puntual el coeficiente de confiabilidad y el error estandar Explique por que los coeficientes de confiabilidad no son el mismo para todos los ejercicios

661 Hargers et al (A-17) del departamento de Salud PUblica y Ambieptal en Amsterdam condushyjeron un estudio en el que los individuos eran consumidores de drogasinyectables (CDI) En una muestrade 194 consumidores de metadona regular de largo plazo (MLP) 145 eran varones En una muestra de 189 CDIque no consmiddotumian MLP 133 eran varones Establezca las consideraciones necesarias acerca de las muestras ypoblaciones representadas y construshy

180 CAPITULO 6 ESTlMACI6N

ya un intervalo de confianza de 95 por ciemo para la diferenda entre las proporciones de varones en las dos poblaciones

662 Una investigaci6n de Lane et ai (A-I8) valor6las diferencias en las pnicticas de deteccion de cancer de seno entre muestras de mujeres predominantemente de bajos ingresos con edashydes de 50 a 75 anos que lltilizan los servicios de c1inicas de sailld para todo el estado y mlljeres de la misma edad residentes en ciudades donde las c1inicas de salud son locales De las 404 encuestadas seleccionadas en toda la comunidad 592 por ciento estuvo de acuerdo con el siguiente comentario acerca del cancer de pecho las mujeres prolongan su vida si detectan el cancer desde el inicio De entre 795 usuarias de clinicas de salud en la mllestra 449 por ciento estuvo de acuerdo Establezca las suposiciones apropiadas para elaborar un intervalo de confianzade 99 por ciento para la diferencia entre las dos proporciones de las poblaciones de interes

663 Williams et at (A-19) encuestaron a una muestra de 67 medicos y 133 enfermeras con famishyliares farmacodependientes EI prop6sito del estudio era evaluar la influencia en los medishyEOS y enfermeras de estar estrechamente involucrados con una 0 mas personas farmaco dependientes Cincuenta y dos medicos y 89 enfermeras dijeron que vivian con personas farmacoldependientes que adversamente afectaban 8U trabajo E8tablezca todas las consideshyraciones que crea necesarias para construir un intervalo de confianza de 95 por ciento para la diferencia entre las proporciones en las dos poblaciones de trabajadores que se espera esten adversamente afectados por vivir con personas farmacodependientes

664 Aronow y Kronzon (A-20) identificaron los factores de riesgo coronado entre hombres y mujeres en una dinica de cuidados de la salud a largo plazo De los 215 individuos negros 58 tienen diabetes mellitus al igual que 217 individuos blancos de 1140 Elabore un intervalo de confianza de 90 por ciento de confianzapara la diferencia entre las proporciones de las dos poblaciones tCuaies son las poblaciones correspondientes ~Que consideraciones son necesarias para hacer valido el procedimiento de inferencia

67 DETEHMINAUON DEL TAMANO DE LA MUESTRA PARA LA ESTIMACIONDEIAS MEDIAS

La pregunta de que tan grande debe ser una muestra surge inmediatamente al inicio del planteamiento de cualquier encuesta 0 experimento Esta es una pregunshyta importante y no se debe tratara la ligera Tomar una muestra mas grande de 10 necesario para obtener los resultados deseados es un desperdicio de recursos mienshytras que por otro lado las muestras demasiado pequenas con frecuencia dan resulshytados que carecen de uso practico En esta secci6n se estudia c6mo determinar el tamano de la muestra de acuerdo con la situaci6n A continuaci6n se proporciona un metodo para determinar el tamano de la muestra que se requiere para estimar Ia media de la poblaci6n yen la siguiente secci6n se aplica este metodo para detershyminar el tamano de la milestra cuando se desea estimar la proporci6n de una poshyblaci6n Mediante extensiltmes directas de estos metodos es posible determinar el tamano necesario de las muestras para situaciones mas complicadas

Objetivos El objetivo de la estimaci6n porintervalos es el de obtener intervalos estrechos con alta confiabilidad Si se observan los componentes ~e un intervalo de confianzase veque 8U dimension esta determinada por la magnitud de la cantidad

(coeficiente de confiabilidad) x (error estandar)

131 67 DETERMINACION DEL TAMANO PARA LA l-IUESTRAmiddot

ya que lamagnitud total del intervalo de confIanza es eldoble de esta cantidad Se aprendi6 que a esta cantidad generalmente se Ie llama precisi6n de la estimaci6n o margen de error Para un error estandar dado incrementar la confIabilidad signishyfIca un coefIciente con mayor confIabilidad Y un coefIciente con mayor confIabilidad produce unintervalo mas amplio

Por otra parte si se ftia el coefIciente de confIabilidad la unica manera de redudr la amplitud del intervalo es la reducci6n del error estandar Dado que el error estandar es igual a (J IJ y como (J es una constante la unica forma de obtener un error estandar menor es tomar una muestra grande ~Que tan grande debeser la muestra Esto depende del tamafio de (J la desviad6n estandar de la poblaci6n asi como del grado de confIabilidad y dimensi6n del intervalo deseados

Suponga que se desea obtener un intervalo que se extienda d unidades hacia uno y otro lado del estimador Ellose enuncia

d (coefIciente de confIabilidad) X (error estandar) (671)

Si el muestreo es con reemplazos a partir de una poblaci6n infInita 0 de una que sea 10 sufIcientemente grande como para ignorar la correcci6n por poblaci6n fInita la ecuaci6n 671 se transforma en

(J

d z- (672)-r la cual cuando se despeja n nos da

(673)d2

Cuando el nmestreo se hacesin reemplazos a partir de una poblaci6n fInita y peshyquefia se requiere de la correcci6n por poblaci6n fInita y la ecuaci6n 671 se transforma en

(J~d (674)fN~

que al despejar n resulta en

n-----shy (675)d 2(N 1) + Z2(J2

Si puede omitirse la correcci6n por poblad6n fInita la ecuaci6n 675 se reshyduce a la ecuaci6n 673

Estillluci6n de (J 2 Las f6rmulas para el tamafio de la muestra requieren del conocimiento de (J2 pero como ya se ha sefialado la varian cia de la poblaci6n casi

132 CAPITULO 6 ESTlMACION

siempre sedesconoce Como resultado esnecesarioestimar (J2 Las fuentes de estishymaci6n de(J2 que se utilizan con mas frecuencia son las siguientes

1 Se extrae una muestrapilato 0 prel~l11inar de lapoblaci6n y se puede utilizar la variancia calculada a partir de esta muestra como unaestimaci6n de (J2 Las observaciones uti lizadas en la muestra piloto se toman como parte de la muesshytrafinal de modo que n (el tamaiio calculado de la muestra) n

1 (el tamaiio

de la muestra piloto) n2 (el numero de observaciones necesarias para satisfacer el requerimiento total del tamaiio de la muestra)

2 A partir de estudios anteriores osimilares es posible obtener estimaciones de (J2

3Si se cree que la poblaci6n de lacual se extrae la muestraposee una distribushyci6n aproximadamente nqrmal se puede aprovechar el hecho de que la amshyplitud es aproximadamente igual a 6 desviaciones estandar y calcular (J R6 Este metodo requiere aIglin conocimiento acerca de los valores minimo y maximo de la variable en la poblaci6n

EJEMPLO 671

Un nutri6logo del departamento de salud al efectuar una encuesta entre una poshyblacien de muchachas adolescentes con e1 fin de determinitr su ingesti6n diaria promedio de proteinas (medidas en gramos) busc6 el consejo de un bioestadistico con respecto al tamaiio de la muestra que deberfa tomar

~Que procedimiento debe seguir el bioestadistico para asesorar al nutri610go Antes de que el estadistico pueda ayudar el nutri6logo este debe proporcionar tres elementos de informaci6n h dimensi6n deseada del intervalo de confianza el nivel de confianza deseado y la magnitud de la variancia de la poblaci6n

Soludon Suponga que el nutri6logo requiere un intervalo con una dimensi6n de aprQximadamente 10 gramos es decir la estimaci6n se deberfa enconshytrar alrededor de 5 gramos de la media de la poblaci6n en ambas direcshyciones En otras palabras se desea un margen de error de 5 gramos Suponga que se decide por un coeficiente de confian7a de 95 y que con base en su experiencia previa el nutri6logo percibe que la desviaci6n estandar de la poblaci6n es probablemente de alrededor de 20 gramos EI estadfstico dispone ya de la informaci6n necesaria para calcular el tamaiio de la muestra z 196 (J = 20 y d 5 Suponga que el tamaiio de la poblaci6n es grande asf queel estadistico puede ignorar la correcshyci6n por poblaci6n finita y utilizar la ecuaci6n 673 Con las sustitucioshynes adecuadas el valor de n se calcula como

Se recomienda que el nutri610go tome una muestra de tamafio 62 AI calcular el tamaiio de una muestra a partir de las ecuaciones 673 0 675 el resultado se redondea al siguiente nurnero entero mayor si los calculosdan un numerocon decimales bull

183 68 DETERMINACION DEL TAl1ANO PARA LAS PROPORCIONES

EJERCICIOS

671 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su hospital Si se desea un intervalo de confianza de 99 por dento con una amplitud de 1 libra ~que tan grande debe ser la muestra de los registros de nacimiento Suponga que un estimashy

dor razonable para (J es 1 libra ~De que tamano debe ser la muestra si el coeficiente de confiabilidad se hace descender a 95

672 El director de la secdon de control dela rabia del departamento de salud publica desea extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso del ano anterior para estimar la edad media de las personas mordidas Requiere un intervalo de confianza de 95 por dento decide utilizar un valor de 25 para d y a partir de estudios anteriores estima que la desviacion estandar de la poblacion esta alrededor de los 15 anos ~Que tan grande debe ser el tamano de la muestra

673 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mglOO ml) de pacientes atendidos en una clinica para diabeticos durante el transcurso de los ultimos 10 anos Determine el numero de registros que el medico debe examinar para obtener un intershyvalo de confianza de 90 por ciento para 11 si la dimension requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varian cia de 60

674 Se deseaestimar la edad media en la que a los padentes de esclerosis multiple se les diagnosshytico el padecimiento por primera vez Se requiere un intervalo de confianza de 95 por dento con una dimension de 10 anos Si la variancia de la poblaci6n es de 90 ~que tan grande debera ser la muestra

68 DETERMINACION DELTAMANO DE lA MUESTRA PARA lA ESIDIACION DE lAS PROPORCIONES

EI metodo para estimar el tamafio de la muestra cuando se requiere estimar la proshyporcion de una poblacion es esencialmente el mismo que se describio para estimar la media de una poblacion Se aprovecha el hecho de que la mitad del intervalo deseashydo d se puede igualar al producto del coeficiente de confiabilidad y el error estandar

Si se supone que el muestreo ha sido hecho de manera aleatoria y que existen condiciones que garanticen que la distribuci6n de psea aproximadamente normal se obtiene la siguiente formula para n cuando el muestreo es con reemplazo cuanshydo se realizaa partir de una poblacion infinita 0 ruando la poblacion muestreada es 10 suficientemente grande como para hacer innecesario el uso de la correcci6n por poblacion finita

n (681)

dondeq = I-p Si la correccion por poblacion finita no puede descartarse la formula adecuashy

da paran es

(682)n d 2 (N -1)+z2pq

euan do N es grande en comparacion con n (es decir n IN 05) se puede pasar por alto la correccion por poblacion finita y la ecuacion 682 se reduce a la ecuacion 681

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

154 CAPiTULO 6 ESTIMACIOl

zon para creer que el material utilizado no es representativo de la poblacion de la que se desea hacer inferencias

En muchos proyectos de investigacion en el area de la salud se utilizan muestras de conveniencia en lugar de muestras aleatorias Puede ser que los investigadores tengan que confiar en voluntarios 0 en personas disponibles como los estudiantes de su clase Nuevamente se debe hacer generalizaciones con base en consideraciones no estadisticas Sin embargo las consecuencias de dichas generalizaciones pueden ser utiles 0 pueden clasificarse desde erroneas hasta desastrosas

En algunos casos puede aplicarse aleatoriedad en un experimento aun cuanshydo los individuos disponibles no sean seleccionados aleatoriamente de alguna poshyblacion bien definida Al comparar dos tratamientos por ejemplo a cada individuo se Ie puede asignar aleatoriamente uno u otro de los tratamientos Las inferencias en tales casos se aplican a los tratamientos y no a los individuos y en consecuencia dichas inferencias son vaUdas

62 INTERVALO DE CONFIANZAPARA LI MEDIA DE UNA POBLICION

Suponga que un grupo de investigadores quiene estimar la media de una poblaci6n que sigue una distribucion normal Para ello extraen una muestra aleatoria de tamafio n de la poblacion y ca1culan el valor de x el cual utilizan como una estimashycion puntual de 11 Aunque este estimador de 11 posee todas las cualidades de un buen estimador se sabe que debido a los caprichos del muestreo aleatorio no se puede esperar que x sea igual a 11

Por 10 tanto serfa mucho mas significativo estimar 11 mediante un intervalo que de alguna forma muestre su probable magnitud 11

DistribuciOn muestral y estimaci6n Para obtener dicha estimacion por intervalos se debe aprovechar el conocimiento acerca de las distribuciones muestrales En este caso puesto que el interes esta en la media de la muestra como estimador de la media de una poblacion es necesario recordar 10 que se sabe resshypecto a la distribucion muestral de la media de la muestra

En el capitulo anterior se aprendio qu~ si el muestreo se realiza a partir de una pohlacion con distribucion normal la distribucion muestral de la media de la muestra presenta una distribucion normal con una media Ilx igual a la media de la poblacion 11 y variancia cr igual a cron Se podrfa graficar la distribucion muestral si se supiera en que lugar del eje xse localiza Con base en el conocimiento adquishyrido acerca de la distribucion normal en general se sabe aun mas sobre la distribushyci6n de xpara estecaso Por ejemplo se sabe que sin irilportar d6nde se localizan aproximadamente 95por ciento de los valores posibles de que constituyen la distribuci6n estan ados desviaciones estandarrespecto a la media Los dos puntos que estan ados desviaciones estandar de la media son 1l-2crx y 1l+2crx de tal manera que el intervalo de 11 plusmn2cr contendra aproxil11adamente 95 por ciento dex los valores posibles de x Aunque 11 y Ilx son desconocidas arbitrariamente se puede poner la distribuci6n muestral de x sobre eleje x

Dado que se desconoce el valor de 11 la expresion )i plusmn 2crx no dice mucho Sin embargo se tiene una estimaci6n puntual de 11 que es x (Resultaria uti obtener un intervalo en tomo a esta estimaci611 puntual de Il La respuesta es S1 Suponga

62 INTERVALO DE CONFIANZA PARA LA MEDIA DE UNAPOBLACION 155

a2 a2

FIGUR4 621 Intervalo de confianza de 95 por dento para l

que se forman intervalos a partir de todos los valores posibles de x cakulados a partir de todas las niuestras posibles de tamafio n de la poblacion de interes De esa forma se tendrfa un gran numerode intervalos de la forma xplusmn2crx con amplitushydes todas igtiales a la del intervalo en torno a lall desconocida Aproximadamente 95 por ciento de estos intervalos tendria centros que caen dentro del intervalo plusmn2crx en torno a 11 Cada uno de estos intervalos que caen dentro de 2cr en torno a 11 pueden contener ala misma 11 Estas ideas se muestran en la figura 621 En dicha figura se observa que xl XiY x4 caen dentro del intervalo 2cr en torno allY en consecuencia los intervalos 2cr alrededor de las medias de la muestra induyen el valor de IJ Las medias muestrales y Xs no caen derttro del intervalo 2cr en torno a IJ y los intervalos de 2crx en torno a ellas no incluyen a IJ

FJElIPLO 621 Suponga que un investigador interesado en obtener una estimacion del nivel promeshydio de alguna enzima en cierta poblacion de seres humano toma una muestra de 10 individuos determina elnivel de la enzima en cada uno de elIos y calcula la media de la muestra x 22 Ademas que la variable de interes sigue una distribucion aproximashydamente normal con una variancia de 45 Se desea estimar el valor de 11

Solucion Un intervalo de confianza de aproximadamente 95 por dento para 11 esta dado por

xplusmn2cr 22plusmn2 Gi10 22 plusmn2(21213) 17762624 bull

156 CAPITULO 6 ESTIMACION

Componentes para la estimaciOn del intervalo Examine la composishycion para la estimacion del intervalo elaborada en el ejemplo 621 Este contiene en su centro la estimacion puntual para 11 Se identifica a 2 como un valor de la distribucion normal estandar que indica a cuantos errores estandar estan aproxishymadamente 95 por ciento de los valores posibles de x Este valor de Z se conoce como coeficiente de confiabilidad EI ultimo componente (ix es el error estandar 0

desviacion estandar de la distribucion muestral de x En general una estimacion por intervalos se expresa como sigue

estimador plusmn (coeficiente de confiabilidad) x (error estandar) (621)

En particular cuando el muestreo se realiza a partir de una distribucion norshymal con variancia conocida una estimacion por intervalos para Jl se expresa como

donde z(l_lt12) es el valor de Z a la izquierda de donde esta 1 rtJ2 y ala derecha en que se encuentra rtJ2 del area bajo la curva

Interpretacion del intervalo de conftarua ~Como se interpreta el intershyvalo de la ecuacion 622 En este ejemplo donde el coeficiente de confiabilidad es igual a 2 se dice que al repetirel muestreo aproximadamente 95 por ciento de los intervalos construidos mediantela formula 622 induyen la media de la poblacion Esta interpretacion se basa en la probabilidad de ocurrencia de diferentes valores de x Es posible generalizar esta interpretacion si se designael area total blttio la curva de x que queda fuera del intervalo Jl plusmn 2(ix como ex y eIarea dentro del intervalo como 1 - ex y dar la siguiente interpretaciOn probabilistica de la formula 622

Interpretaci6n probabilistica

En el muestreo repetido de una poblaci6n condistribuci6n normal y desviaci6n estdndafmiddot conocida 100(1- a) por ciento de todos los intervalos de la forma Xplusmn Z(I_amOx incluyen a la larga la media de la poblaci6n 11

Ala cantidad 1 - (X en este caso 95se Ie conoce como eoeficiente (0 nivel) de conjianza y al intervalo XplusmnZ(1_12)(ix se Ie conoce comointervalo de conjianza para Jl Cuando (1 ex) =95 al intervalo se Ie llama intervalo de confianza de 95 por ciento para Jl En este ejemplo se dice que existe 95 por ciento de confianza d~ que la media de Ia poblacion este entre 1776 y 2624 A esto se Ie llama interpretacion practica de la formula 622 En general se puede expresar de la siguiente manera

Interpretaci6n practica

Cuando se hace un muestreo a partir de poblaciones que siguen una distribuci6n normal y con desviaci6n estdndar conocida existe un 100(1 - a) por ciento de confianza de que el intervalo calculado xplusmn z(l_aI2)Ox contiene la media de la poblaci6n Jl

62 INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACION 157

En el ejemplo 621 es preferible en lugar de 2un valor mas exacto para z 196 que corresponde al coeficiente de confianza de95 Los investigadores pueshyden utilizar cualquier coeficiente de confianza los mas utilizados son 90 95 Y 99 a los cuales se asocian factores de confiabilidad de 1645 196 Y 258 respectivashymente

Precision A la cantidad que se obtiene al multiplicar el factor de confiabilidad por el error estandar de la media se Ie llama precision de la estimaci6n Tambien se Ie llama margen de error

EJEMPLO 622

Un fisioterapeuta desea estimar con 99 por ciento de confianza la media de fuerza maxima de un musculo particular en cierto grupo de individuos Se inc1ina a suposhyner que los valores de dicha fuerza muestran una distribucion aproximadamente normal con una variancia de 144 Una muestra de 15 individuos que participaron en el experimento presento una media de 843

Soluci6n En latabla D el valor para z que corresponde a un coeficiente de conshyfianza de 99 es 258 Este es el coeficiente de confiabilidad El error estandar es de ax 12fl5 =30984 Por 10 tanto el intervalo de conshyfianza de 99 por ciento para ~ es

843 plusmn258(30984) 843 plusmn 80 763923

Se dice que se tiene 99 por ciento de confianza de que la media de la poblacion este entre 763 y 923 porque al repetirel muestreo 99 por ciento de todos los intervalos que pueden construirse en la forma descrishyta inc1uyen a la media de la poblacion bull

Situaciones en las que la variable de interes sigue una distribucion aproximadashymentenormal con una variancia conocida son muy raras y casi nunca se presentan en la practica El prop6sito de los ejemplos anteriores en los que se supone que existe esta condici6n ideal fue el de formar las bases teoricas para construir intershyvalos de confianza para las medias de la poblacion En la mayorf de los casos practicos las variables no siguen una distribuci6n aproximadamente normal 0 no se conocen las variancias de la poblaci6n 0 suceden ambas cosas En el ejemplo 623 y en la secci6n 63 se explican los procedimientos que se utilizan en situaciones menos ideales pero mas comunes

Muestreo a partir de pobluciunes que no presenlan una distribucion normal No siempre es posible 0 prudente suponer que la poblaci6n de interes muesshytra una distribuci6n normal Gracias al teOlema del limite central esto no sera un problema si se puede seleccionar una muestra 10 suficientemente grande Se ha dicho que para muestras grandes la distribucion muestral de Xi presenta una distribuci6n aproximadamente normal sin importar como esta distribuida la poblacion original

158 CAPiTULO 6 ESTIMACION

EJEMPLO 623

Un equipo de investigadores esta interesado en la puntualidad de los pacientes en las citas concertadas En un estudio de flqjo depacientes en los consultorios de medicos generales se encontr6 que una muestra de 35 pacientes llegaba 172 minutos tarde a las citas en promedio Una investigaci6n previa habia demostrado que la desviaci6n estandar era de 8 minutos aproximadamente Se tuvo la sensaci6n de que la distribushyci6n de la poblaci6n no era normal ~Cual es el intervalo de confianza de 90 por ciento para 11 que es el promedio real de impuntualidad en las citas

Soluci6n Dado que el tamafio de la muestra es bastante grande (mayor que 30) y se conoce la desviaci6n estandar de la poblaci6n la situaci6n se aproxishyrna al teorema del limite central y se supone que la distribuci6n muestral de xpresenta una distribud6n aproximadamente normal AI consultar la tabla D se encuentra que el coeficiente de confiabilidad que corresponshyde a uri coeficiente de confianza de 90se aproxima a 1645 si se interpola El error estandar es de C5z 8-35 13522 de modo que el intervalo de confianza de 90 por ciento para 11 es

172 plusmn 1645(13522) 172 plusmn 22 150 194 bull

Con frecuencia cuando la muestra es 10 suficientemente grande para aplicar el teorema dellfmite central la variancia de la poblacion se desconoce En ese caso se sustituye esta variancia conla de la muestra en la f6rmula para construir el intervashy10 de confianza para la media de la poblacion

Andlisispor computadora Cuando se requiere de los intervalos de confianza se economiza una buena cantidad de tiempo mediante el uso de una computadora la cual puede ser programada para construir los intervalos de datos no procesados

EJEMPLO 624

Los siguientes datos corresponden a los valores de la actividad (micromoles por minuto por gramo de tejido) de cierta enzima medida en el tejido gastrico normal de 35 pacientes con carcinoma gastrico

60 1189 614 788 273 2464 571 1827 537 374 449 262 448 971

372 898 411 348 1925 550 622

610 319 406 413 767 385 674

521 603 533 662 1177 307 1499

Mediante el uso del paquete de software para computadora MINITAB se pretenshyde construirun intervalo de confianza de 95 por ciento para la media de la poblashycion Suponga que la variancia de la poblaci6n es iguala 36 No es necesario suponer que la poblaci6n muestreada de val ores sigue una distribuci6n normal porque el tamafio de la muestra es losuficientemente grande para aplicar el teoreshyrna del limite central

159 62 INTERV ALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACION

Caja de dialogo Comandos de la sesi6n

Statgt Basic Statisticsgt 1-Sample z MTB gt ZINTERVAl 95 6 C1

Teclear Cl en Variables Se1ecdonar Confidence interval y teclear 95 en la caja de texto Teclear6 en Sigma Clic OK

Resultados

Confidence Intervals

The assumed sigma = 0600

Variable MicMoles

N 35

Mean 0718

StDev 0511

SE Mean 0101

950 Cr (0519 0917)

FIGURA 622 Procedimiento del paquete MINITAB para construir un intrevalo de conshyfianza de 95 por ciento para la media de la poblacion ejemplo 624

Solucion Se introducen los datos en lacolumna 1 y se procede como se muestra en la figura 622 Estas instrucdones indican a la computadora que e1 factor de confiabilidad es z que se necesita unintervalo de conshyfianza de 95 por dento que la desviaci6n estandarde la poblaci6n es de 6 y que los datos estan en la columna 1 El resultado indica que la media de la muestra es 718 la desviad6n estandar es 511 y e1 error estandar de la media af es 6J35 101

Se tiene 95 pordento middotde confianza de que la media de la poblashyci6n se encuentra entre 519y 917 bull

Puede obtenerse los intervalos de confianza a traves de otros paquetes de sofuvare Por ejemplo SASreg puede construir intervalos de confianza a traves de PROC MEANS o PROC UNIVARIATE

Otras eslimaciones de La tendencia central Tal como se ha visto la meshydia es muy sensible a los val ores extremos es dedr aquellos que se desvfan consideshyrablemente de la mayorfa de las mediciones en el con junto de datos A dichos valores se les conoce como sesgos Tambien se puede apreciar que lamediana que no es sensible a las mediciones extremas algunas veces se utiliza en lugar de la media como medida de tendenda central cuando los sesgos estan presentes Por la misshyrna raz6n quiza se prefiera el uso de la mediana de la muestra comomiddotestimador de la rnediana de la poblaci6n cuando se requiere realizar inferencias acerca de la tendenda central de la poblaci6n No solamente se utiliza la mediana de la muestra

160 CAPITULO 6 ESTlMACION

como una estimacion puntual para la mediana de la poblacion sino que tambien es posible construir un intervalo de confianza para la mediana de la poblacion En esta obra no se proporciona la formula pero esta se puede encontrar en la obra de Rice (1)

Media ajustada Los estimadores que son insensibles a los sesgos se Haman estimadores eficaces Otra medida y estimador eficaz de tendencia central es la media ajustada Para un conjunto de datos que contiene n mediciones se calcula el 1000 por ciento de la media ajustada como sigue

1 Ordenar las mediciones

2 Descartar las medici ones mas pequeiias y mas grandes que 100a por ciento de las mediciones El valor recomendado para a esta entre 1 y 2

3 Calcular la media aritmetica de las mediciones restantes

Observe que la mediana podrfa considerarse como 50 por ciento de la media ajusshytada Se debe recordar que la media ajustada para el conjunto de datos es una de las medidas descriptivas que puede calcular MINITAB

FJERCICIOS

Construya para cada uno de los siguientes ejercicios los intervalos de confianza al 90 95 Y 99 por ciento para la media de la poblacion y establezca para cada uno la interpretacion probabilistica y practica Indique cualinterpretacion puede ser mas aderuada para utilizar ruando se trata sobre intervalos de confianza con alguien que no conoce de estadfstica y establezca eI razonamientode por que se eUgi6 Explique por que los tres intervalos no tjenen la misma amplitud Indique cual de los tres intervalos es preferible como estimador de la media de la poblacion y establezca el razonamiento de la elecci6n

621 Se pretende estimar el numero promedio de latidos del coraz6n por minuto para cierta poblaci6n Se encontr6 que el numero promedio de latidos por minuto para 49 personas era de YO Considere que esos 49 pacientes constituyen una muestra aleatoria y que la poblacion sigue una distribucion normal con una desviaci6n estandar de 10

622 Se pretende estimar la concentraci6n media de bilirrubina indirecta en el suero en nmos de cuatro dias de nacidos La media para una muestra de 16 ninos es de 598 mglOO cc Conshysiderese que la concentraci6n de bilirrubina en los ninos de cuatro dfas de nacidos sigue una distribucion aproximadamente normal con una desviaci6n estandar de 35 mgIOO cc

623 En un estudio acerca de la duraci6n de la hospitalizacion dirigido por vados hospitales en cooperacion se extrajo una muestra aleatoria de 64 individuos con ulcera peptica de la lista de todos los pacientes con esa enfermedad internados alguna vez en los hospitales particishypantes Se determin6 para cada uno de eUos el tiempo de hospitalizaci6n Se encontr6 que la duraci6n media de hospitalizaci6n fue de 825 dfas y se sabe que la desviaci6n estandar de la poblaci6n es de tres dfas

624 Una muestrade 100 hombres adultos aparentemente sanos de 25 anos de edad muestra una presi6n sist61ica sangufnea media de 125 Considere que la desviaci6n estandar de la poblaci6n es de 15

161 63 DISTRIBUCI6N

625 Algunos estudios acerca de la enfermedad Alzheimer (EA)han mostrado un incremento en la producci6n de 14C0

2 en pacientes con ese padecimiento Durante un estudio se obtuvieshy

ron los siguientes valores de 14C02

a partir de 16 biopsias de neocorteza de pacientes con la enfermedad (EA)

1009 1280 1180 12551547 2352 1956 1080

1776 1767 1680 2050 1452 2857 3100 1621

Considereseque la poblaci6n sigue una distribuci6n normal con una desviaci6n estandar de 350

63 DISTRIBUCION t

En la seccion 62 se describe un procedimiento para obtener un intervalo de conshyfianza para la media de una poblaci6n EI procedimiento requiere del conodmiento de la varianda de la poblacion de la que se extrae la muestra Puede parecer un tanto extrafio que se tenga conocimiento de lavariancia de la poblacion y no se conozca elvalor de la media de la poblacion De hecho es comun en situacioshynes como las que se han presentado que se deSconozca tanto la variancia como la media de la poblacion Esta situacionpresenta un problema respecto a la construcshycion delos intervalos de confianza Por ejemplo aun cuando la estadfstica

x J1shyZ=---

crJn presenta una distribudon normal cuando la poblacion tambien tiene una distribuci6n normal y sigue una distribuci6n aproximadamente normal cuando n es muy grande independientemenle de la forma funcional de la poblacion no se puede hacer uso de este hecho porque cr se desconoce Sin embargo no todo esrn perdido y la soluci6n mas logica para este problema es utilizar la desviacion estandar de ~muestra

s = ~L(Xi - x)2(n-l)

para sustituir cr Por ejemplo cuando el tamafio de la muestra es mayor que 30 la confianza en s como una aproximacion de cr es por 10 general sustancial por 10 que se justifica la utilizacion de la teorfa de la distribudon normal para construir un intervalo de confianza para la media de la poblacion En tal caso se procede como se indica en la seccion 62

Cuando se tienen muestras pequefias es imprescindible encontrar otro proceshydimiento para construir intervalos de confianza

Como resultado del trabajo de Gosset (2) escrito bajo el seudonimo de Student se dispone de otra alternativa conocida como distribuci6n t de Student con frecuenda abreviada como distribuci6n t

La cantidad

sigue esta distribucion

162 CAPiTULO 6 ESTIMACION

Propiedades de la distribucion t La distribuci6n t tiene las siguientes proshypiedades

1 Tiene una media de O

2 Es simetrica con respecto a la media

3 En general tiene una variancia mayor que 1 pero esta tiende a I a medida que aumenta el tamaiio de la muestra Para dfgt 2 la variancia de la distribushyci6n t es dfl(df - 2) donde df representa los grados de libertad En forma alterna puesto que df n - 1 para n gt 3 se puede escribir la variancia de la distribuci6n t como (n l)(n 3)

4 La variable t va de - hasta + 00DO

5 La distribuci6n t es realmente una familia de distribuciones puesto que hay una distribuci6n diferente por cada valor de la muestra de n - 1 que es el divisor que se utiliza para ca1cular S2 Recuerde que n - 1 representa los grados de libertad En la figura 631 se muestran las distribuciones t correspondienshytes a algunos valores de los grados de libertad

6 Comparada con la distribuci6n normal ladistribuci6n t es menos espigada en el centro y tiene colas mas largas En la figura 632 se com para la distribushyci6n t con la distribuci6n normal

7 La distribuci6n t se aproxima ala distribuci6n normal a medida que n - 1 se aproxima al infinito

La distribuci6n t al igual quela distribuci6n normal estandar se ha tabulado ampliamente Una de estas tablas es la tabla E del apendice Tal como se puede apreciar se debe tomar en cuenta eLcoeficiente de confianza y los grados de libershytad cuando se utiliza la tabla de la distribuci6n t

FIGUR- 631 Distribuci6n t para diferentes grados de libertad

-----

163 63 DISTRIBUCION

__ Distribucion normal

- - - Dislribucion I

x

FIGURA 632 Comparaci6n de las distribuciones normal yt

Es posible utilizar el paquete MINITAB para graficar la distribuci6n t (para grados espedficos de libertad) y otras distribuciones Despues de asignar el eje horizontal y las siguientes direcciones en el cuadro de Set Patterned Data seleccioshyne del menu Calc y despues Probability Distributions Utilice el cuadro de diashylogo Plot para generar la grafica

Inlervalos de conJiQllia qllR uJilban fa dislribucion t El procedimien to general para construir interval os de confianza no se ve afectado por la necesidad de utilizar la distribuci6n t en lugar de la distribuci6n normal estandar Aun es necesario usar la relaci6n expresada por

estimador plusmn (coeficiente de confiabiIidad) x (error estandar)

Lo que es diferente es el origen del coeficiente de confiabilidad Este se obtiene a partir de la tabla de la distribucion t en lugar de la tabla de la distribuci6n normal estandar Para ser mas especfficos cuando se obtienen muestras a partir de una distribushycion normal cuya desviaci6n estdndi17 a se desconoce ell OO( 1 - a) por ciento del intervalo de confianza para la media de la poblaci6n J1 estd dado por

(631 )

Es importante aclarar que el requisito para el uso valido de la distribucion t es que la muestra debe ser extrafda de una poblad6n con distribucion normal Sin embarshygo la experiencia ha demostrado que se pueden tolerar desviaciones moderadas de esterequisito Como consecuencia la distribucion t se utiliza incluso cuando se sabe que la poblaci6n original se desvia de la normalidad Lltl mayorfa de los invesshytigadores requieren que al menos pueda sostenerse el supuesto de una distribushyd6n de poblacion en forma de montfculo

EJEMPLO 631

Maureen McCauley (A-I) realiz6 un estudio para evaluar los efectos de un conjunto de instrucciones de mecanica en ellugar de labores sobre el desempeno laboral de obreros jovenes recientemente contratados Se utilizaron dos grupos de individuos elegidos aleatoriamente uno de los grupos para aplicar el experimento y el otro

164 CAPITULO 6 ESTlMACI6N

como grupo de control EI grupo con el que se experimento recibio una hora de capacitacion impartida por un terapeuta ocupacional EI grupo de control no recishybio esta capacitacion Para evaluar el esfuerzo de cada obrero para levan tar bajar jalar y transportar objetos dentro del entorno laboral se utilizo una lista de cotejo para la evaluacion de trabajo mecanico que inclufa criterios de referencia Una tarea bien hecha recibio una calificacion de 1 EI grupo de control formado por 15 individuos alcanzo una calificacion media de 1153 en la evaluacion con una desshyviacion estandar de 3681 Se supone que el grupo de control se comporto como una muestra aleatoria extraida de una poblacion similar de individuos Se pretende utilizar los datos de la muestra para estimar la calificacion media para la poblacion

Soluci6n Se puede utilizar la media de la muestra 1153 como una estimacion puntualde la media de la poblacion sin embargo debido a que se descoshynoce la desviacion estandar de la poblacion se debe considerar que los valores siguen una distribucion aproximadamente normal antes de consshytruir los intervalos de confianza para l Se considera que esta suposicion es razonable y que se necesita un intervalo de confianza de ~or cienshyto el estimador es i y el error estandar es s -r 681 15 =9504 Ahora es necesario conocer el coeficiente de confiabilidad el valor de t asodado al coeficiente de confianza de 95 y a los n 1 = 14 grados de libertad Puesto que el intervalo de confianza de 95 por ciento deja 05 del area bajo la curva de t para dividirse en dos colas iguales se necesita el valor de tala derecha del cual esta el 025 del area Este valor se localiza en la tabla E enla columna encabezada por t

975 bull Este es el valor

para tala izquierda delcual esta 975 del area bajo la curva EI area a la derechade este valor es igual al 025 deseado Ahora sobre la columna de grados de libertad se localiza el numero 14 EI valor para t se encuentra en la interseccion del renglon con la etiqueta 14 y la columna con la etiqueta t975 bull Se encuentra que este valqr para t que representa al coeficiente de confiabilidad es 21448 Finalmente el intervalo de confianza de 95 por ciento se construye como sigue

1153 plusmn 21448(9504) 1153 plusmn 204 949 1357 bull

Este intervalo puede interpretarse con ambos puntos de vista probabiHstico y practico Puede asegurarse en un 95 por dento que 1a media l correcta de la poblacion se encuentra entre 949 y 1357 porque al repetir el muestreo 95 por dento de los intervalos construidos deigual manera incluyen a l

Decidir entre z r t Cuando se obtiene un intervalo de confianza para la media de una poblacion se debe decidir si se utiliza un valor de z6 de t como factor de confiabilidad Para hacer una elecci6n adecuada se debe considerar el tamafto de la muestra si la poblacion muestreada sigue una distribucion normal y si la varian cia de la poblacion es conocida La figura 633 muestra un diagrama de flujo que se puede utilizar para decidir rapidamente si el factor de confiabilidad debe ser Z 0 t

EJERCICIOS 165

EJERCICIOS

Sa aplica al leorema dellfmile central

FIGURA 633 Diagrama de flujo para deddir entre utililizar z y t cuando se hagan inferencias respecto a las medias de la poblaci6n (Para utilizar un procedimiento no parametrico vease el capitulo 13)

Analisis par computadara Si el proposito es construir un intervalo de conshyfianza con el programa MINITAB para la media de la poblacion cuando el estadfsshytico t es el factor de confiabilidad adecuado el comando se inicia con la palabra TINTERVAL Seleccione en Windows I-Sample t desde el menu de Basic Statistics

631 Utilice la distribud6n t para encontrar el factor de confiabilidad para el intervalo de confianshyza basado en los siguientes coeficientes de confianza y tamafiosde las muestras

a b c d

Coefidente de confianza 95 99 90 95 Tamafio de la muestra 15 24 8 30

632 En una investigacion acerca de la dependencia del flujo y volumen de todo el sistema respishyratorio en un grupo de pacientes con enfermedad obstructiva pulmonar cronica conectados a respiradores artificiales Tantucci et ai (A-2) registraron los siguientes valores de linea de

166 CAPITULO 6 ESTIMACION

base del flUjD continuo inspiratDriD (Us) 90 97 103110 104 100 CDnsidere que una muestra aleatDria simple esta cDnfDrmada pDr seis individuDs a partir de una pDblacion que sigue una distribuci6n nDrmal CDn individuDs CDn la misma enfermedad

a) ~Cuat es la estimaci6n puntual de la media de la pDblaci6n

b) ~Cuil es la desviacion estandar de la muestra

c) ~Cultll es la estimacion del error estandar para la media de la muestra

d) CDnstruya un intervalD de cDnfianza de 95 pDr ciento para el flUjD mediD cDntinuD inspishyratDriD de la pDblaci6n

e) ~Cual es la precision de la estimacion

f) Explique la interpretaci6n prDbabilistica para este intervalD de confianza

g) Explique la interpretacion practica para este intervalD de cDnfianza

633 LlDyd y MaillDux (A-3) informaron IDS siguientes datDs acerca del peso de la glandula pituitaria en una muestra de cuatrD ratas de Wistar Furth

media = 90 mg error estandar para la media = 3

FUEJTE Ricardo V Lloyd y Joe Mailloux Analysis ofSshy100 Protein Positive Folliculo Stellate Cells in Rat Pituitary Tissues AmericanJournal ofPathology 133 338-346

a) ~Cual es la desviadon estandar de la muestra

b) CDnstruya un intervalD de confianza de 95 pDr ciento para el peso medio de la glandula pituitaria para una pDblacion similar de ratas

c) ~Que supDsiciDnes se necesitan para que sea validD el intervalo de cDnfianza del inciso b

d) ~Que interpretacion puede ser la mas indicada cuandD se trata sDbre intervalos de conshyfianzacon alguien que no sabe de estadfstica Explique pDrque es la mas cDnveniente

e) 5i fuera necesario elabDrar un intervalD de cDnfianza de 90 pDr cientD para la media de la pDblaci6n ~el intervalD de cDnfianza serta mayDr 0 menor que el intervalD de 95 pDr dentD Explique su respuesta sin construir realmente el intervalD de cDnfianza

f) 5i [uera necesariD considerar un intervalo de CDnfianza de 99 pDr cientDpara lamedia de la poblacion ~el intervalo de cDnfianza serra mayDr 0 menDr que el intervalD de 95 pDr dentD Explique su respuesta sin cDnstruir realmentt el intervalD de cDnfianza

634 Kaminski y Rechberger (A-4) encontrarDn en un estudio sDbre la preeclampsia que la media de la presi6n sistolica sangufnea en 10 mujeres sanas y que no estan embarazadas es de 119 CDn una desviacion estandar de 21

a) 2Cual es el errDr estandar estimadD para la media

b) CDnstruya un intervalD de confianza de 99 pDr cientD para la media de la poblaci6n a partir de la cual puede considerarse que IDS 10 individuos conforman una muestra aleatoria

c) ~CUlil es la precisi6n estimada

d) ~Que consideraciones deben hacerse para comprobar la validez del intervalo de confiahza

635 Unamuestra de 16nifias de 10 afiDS pesan en promediD 715 con una desviacion estandar de 12libras CDnsidere el calculD de intervalDs de cDnfianza de 9095 y 99 pDr ciento para I-L

167 64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS

636 Una muestra aleatoria simple conformada por 16 individuos aparentemente sanos presenta los siguientes valores de arsenico eliminado en la orina (miligramos por dfa)

Individuo Valor Individuo Valor

1 007 9 012 2 030 10 006 3 025 11 010 4 008 12 032 5 030 13 006 6 038 14 009 7 007 15 014 8 005 16 011

Elabore un intervalo de confianza de 95 por ciento para la media de la poblaci6n

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES

En ocasiones se presentan casos en los que se desea estimar 1a diferencia entre 1a media de dos poblaciones A partir de cada poblacion se extrae una muestra aleatoria independiente y de los datos de cada una se calculan las medias muestrales XI y x2

respectivamente En el capitulo anterior se dijo que el estimador XI - x2 ofrece una estimacion insesgada de la diferencia entre las medias de las poblaciones III shy11 2 bull La variancia del estimador es (cr~ n l ) + (cr~ n 2 ) Tambien se menciono que seglin las condiciones la distribucion muestral de XI - x2 puede presentar una distribution al menos aproximadamente normal de modo que en muchos casos se utiliza la teorfa adecuada para las distribuciones normales en el calculo de un intershyvalo de confianza para III - 11 2 bull Cuando se conocen las variancias de la poblacion el intervalo de confianza del 100(1 - ex) por ciento para III - 112 esta dado por

(641)

El anal isis del intervalo de confianza para la diferencia entre las medias poblacionales ofrece informacion util para decidir si es 0 no probable que las medias de las dos poblaciones sean iguales Cuando el intervalo no incluye al cero se dice que el intervalo ofrece evidencia de que las dos poblaciones tienen medias diferentes Cuando el intervalo incluye al cero se dice que las poblaciones pueden tener meshydias iguales

Esto se ilustra a continuacion para el caso donde el muestreo se realiza a partir de una distribucion normal

168 CAPITULO 6 ESTlMACI6N

EJEMPLO 641

A un equipo de investigacion Ie interesa conocer la diferencia entre las concentracioshynes de acido urico en pacientes con y sin el sfndrome de Down En un gran hospital para el tratamiento de pacientes con retardo mental una muestra de 12 individuos con el sindrome presenta una media de XI = 45 mgll00 mL En un hospital general se encontro que una muestra de 15 individuos normales de la misma edad y sexo presenta un nivel medio de x2= 34 Si es razonable suponer que las dos poblaciones de valores muestran una distribucion normal y sus variancias son iguales a 1 y 15 calcule el intervalo de confianza de 95 por ciento para ~l - ~2

Soluci6n Para una estimacion puntual de III 112 se udliza Xl X2= 45 34 11 EI coeficiente de confiabilidad que corresponde a 95 localizado en la tabla D es 196 EI error estandar es

Por 10 tanto el intervalo de confianza de 95 por ciento es

11 plusmn 196(4282) 11plusmn84 26 194

Se dice que se dene una confianza de 95 por ciento de que la difeshyrencia real 111 - 112 este entre 26 y 194 porque en muestreos repetidos 95 por ciento de los intervalos construidos de esa manera incluiria la diferencia entre las medias reales

Puesto que el intervalo no incluye al cero se concluye que las dos poblaciones tienen diferentes medias bull

Muestreo a partir de poblaciones que no signen una distribuci6n ItOrmal La construccion de un intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando el muestreo se realiza a partir de poblaciones no normales se lleva a cabo en la forma descrita en el ejemplo 641 si las muestras n l y n

2 son grandes Una vez mas este es un resultado del teorema del limite central

Si se desconocen las variancias de la poblacion se utili zan las variancias de las muestras para estimarlas

IUEMPLO 642

Motivados por d conocimiento de la existencia de una gran cantidad de textos polemicos que sugieren que el estres la ansiedad y la depresion son dafiinos para el sistema inmunologico Gormanet ai (4-5) condujeron un estudio en el que se conshysider6 a individuos varoneshomosexuales algunos con VIH (virus de inmunodefishyciencia humana) positivo y otros con VIH negativo Los datos fueron registrados con una amplia vltJriedad de mediciones medicas inmunologicas psiquiatricas y neurol6gicas una de las cuales corresponde al numero de celulas CD4+ en la sanshy

64 INTERV ALO DE CONFIANZA PAHALA DIFERENCIA ENTRE DOS MEDIAS 169

gre El numero promedio de celulas CD4+ para middot112 individuos con infecci6n por VIR fue de 4018 con una desviaci6n estandar de 2264 Para los 75 individuos sin la infecci6n por VIR la media y la desviaci6n estandar fueron de 8282 y 2749 respectivamente Se pretende elaborar un intervalo de confianza de 99 por ciento para la diferencia de las medias de las poblaciones

Soluci6n No hay informaci6n con respecto a la forma de la distribuci6n de las celulas CD4+ Sin embargo como el tamafto de las muestras es grande el teorema del limite central asegura que la distribuci6n muestral de las diferencias entre las medias de la muestra siguen una distribuci6n aproxishymadamente normal independientemente de que la distribuci6n de la variable en las poblaciones no siga una distribuci6n normal Se puede utilizar este hecho para justificar el uso de la estadistica z como factor de confiabilidad en la construcci6n del intervalo de confianza Tampoco hay informaci6n acerca de las desviaciones estandar por 10 que puede emplearse las desviaciones estandar de las muestras para estimarlas La estimaci6n puntual para la diferencia entre las medias de las poblacioshynes es la diferencia entre las medias de las muestras 8282 - 4018 = 4264 En la tabla D se encuentra que el factor de confiabilidad es 258 La estimaci6n del error estandar es

s __ = 27492

+ 22642 =382786

Xl-X 75 112

Por la ecuaci6n 641 el intervalo de confianza de 99 por ciento para la diferencia entre las medias de la poblaci6n es

4264 plusmn 258(382786) 3276 5252

Se tiene la seguridad de 99 por ciento de que el promedio de celulas CD4+ en varones con VIR positivo difieren de la media para los varoshynes con VIR negativo por 3276 a 5252 bull

Distribuci6n t y la diferencia entre las medias Cuando no se conocen las variancias y se pretende estimar la diferencia entre las medias de dos poblacioshynes con un intervalo de confianza es posible utilizar la distribuci6n t para suminisshytrar el factor de confiabilidad si se conocen ciertas suposiciones se debe saber 0

suponer de buena fe que las dos poblaciones muestreadas siguen una distribuci6n normal Respecto a las variancias de las poblaciones se debe distinguir entre dos situaciones 1) la situaci6n en la que las variancias son iguales y 2) la situaci6n en la que no 10 son A continuaci6n se consideranambas sitpaciones por separado

Varianciaspoblacifmales iguales Si la suposici6n sobre igualdad de las variancias de las poblaciones esta justificada las dos variancias de las muestras calculadas a partir de las muestras independientes pueden considerarse como estishymaciones de 10 mismo es decir la variancia comun Parece 16gico entonces aproshyvechar este hecho en el anal isis en cuesti6n Esto es precisamente 10 que se hace para establecer una estimaci6n conjunta para la variancia comun Esta variancia se obtiene mediante el caIculo promedio ponderado de las dos variancias de las muesshy

170 CAPITULO 6 ESTlMACI6N

tras Cada variancia de la muestra es ponderada con base en sus grados de libertad Si los tamafios de las muestras son iguales este promedio ponderado es la media aritmetica de las variancias de las dos muestras Si el tamano de las dos muestras es distinto el promedio ponderado aprovecha la informacion adicional proporcionada por la muestra mayor La estimacion con junta se obtiene con la fOrmula

S2 = (nl _1)SI2 + (n2 l)s~ p (642)

+n2 -2nl

Asf la estimacion del error estandar esta dada por

(643)

y el intervalo de confianza de 100(1 a) por ciento para III 112 esta dada por

(644)

El nfunero de grados de libertad utilizado para determinar el valor de t que se usa para construir el intervalo es n

1 + n

2 2 que es el denominador de la ecuacion

642 Este intervalo se interpreta en la forma habitual Los metodos que pueden emplearse para tomar la decision acerca de la igualshy

dad de las variancias de las poblaciones se estudian en la seccion 610 y 78

EJEMPLO 643

Uno de los estudios de Stone et al (A-6) tuvo como objetivo determinar los efectos del ejercicio por un tiempo prolongado en los ejecutivos de una compania inscritos en un programa supervisado de acondicionamiento fisico Se registraron datos de 13 individuos (el grupo deportista) que voluntariamente se inscribieron el programa y que permanecieron activos por 13 anos en promedio y de 17 individuos (el segunshydo grupo el sedentario) que decidieron no inscribirse Entre los datos que se regisshytraron acerca de los individuos esta el mlmero maximo de sentadillas realizadas en 30 segundos El grupo deportista obtuvo una media y una desviacion estandar de 210 y 49 respectivamente La media y la desviacion estandar para el grupo sedenshytario fueron 121 y 56 respectivamente Se considera que las dos poblaciones de medici ones de acondicionamiento muscular siguen una distribuci6n aproxirnadashymente normal y que las variancias para ambas poblacionesson iguales Se pretenshyde elaborar un intervalo de confianza de 95 por ciento para Ja diferencia entre las medias de as poblaciones representadas por las dos muestras Soluci6n Primero se utiliza la ecuaci6n 642 para calcular la estimaci6n conjunta

de la variancia comtin de las poblaciones

(13-1)(49 2 )+(17 1)(562 ) =2821

13+17-2 Cuando se consulta la tabla E con 13 + 17 - 2= 28 grados de libertad y el nivel de confianza de 95 se encuentra que eLfactor de confiabilidad es 20484 Con la ecuacion 644 se calcula el intervalo de confianza de

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS 171

95 por ciento para la diferencia entre las medias de las poblaciones de la siguiente manera

2821 2821(210-121)plusmn20484 --+-shy

13 17 89 plusmn 40085

49129

Se tiene una confianza de 95 por ciento de que la diferencia entre las medias de las poblaciones estan entre 49 y 129 Se puede decir esto porque se sabe quesi se repite el amilisis muchfsimas veces y se calculan los intervalos de confianza de la misma manera cerca de 95 por ciento de los intervalos de confianza induiran la diferencia entre las medias de las poblaciones

Debido a que los intervalos no induyen al cerose conduye que las medias de las poblaciones son diferentes bull

Variancias poblacionales distintas Cuando no se puede conduir que las variancias de dos poblaciones de interes son iguales aun ruando pueda suponerse que las dos poblaciones presentan distribuciones normales no es adecuado utilizar la distribucion t como se acaba de describir para construir los intervalos de confianza

Una solucion al problema de variancias distintas fue propuesta por Behrens (3) y posteriormente fue verificada y generalizada por Fisher (4 5) Neyman (6) Scheffe (7 8) Y Welch (9 10) tambien proponen soluciones EI problema es analizashydo en detalle por Cochran (11)

EI problema gira en tomo al hecho de que la cantidad

no sigue una distribuci6n t con nj + n 2 grados de libertad ruando las variancias 2 shy

de las poblaciones son distintas Consecuentemente la distribucion t no se puede utilizar en la forma habitual pata obtener el factor de confiabilidad del intervalo de confianza para la diferencia entre las medias de dos poblaciones que tienen variancias diferentes La solucion propuesta por Cochran consiste en el calculo del factor de confiabilidad mediante la siguiente formula

wltj + w2tZ t l

f

-0f2 = (645) WI +w2

donde WI 512

np W 2 = s~ n2 tl = tl _ para nj - 1 grados de libertad y t2 = t l

_w2aI2

para n2

- 1 grados de libertad Un intervalo aproximado de confianza del 100(1 shya) por ciento para III - 112 esta dado por

(646)

172

EJERCICIOS

CAPITULO 6 ESTlMACION

FJEIUPLO 644

En la investigacion de Stone et al (A-6) descrita en el ejercicio 643 los investigashydores tambien informaron los siguientes datos de las medici ones referentes a todas las calificaciones del acondicionamiento muscular logradas por los individuos

Muestra n Media Desviaci6n estimdar

Grupo deportista 13 45 3

Grupo sedentario 17 37 10

Se considera que las dos poblaciones de todas las calificaciones de acondicionashymiento muscular siguen una distribuci6n aproximadamente normal Sin embargo no debe suponerse que las dos variancias poblacionales son iguales Se pretende construir un intervalo de confianza de 95 por ciento para la diferencia entre las medias de todas las calificaciones de acondicionamiento muscular para las dos poshyblaciones representadas por las muestras

Soluci6n Se utiliza t de la ecuaci6n 645 para calcular el factor de confiabilidad En la tabla E se muestra que con 12 grados de libertad y 1 - 052 = 975 t( 21788 Analogamente con 16 grados de libertad y 1- 052 = 975 t2 = 21199 Ahora Sf calcula

(3 2 13)(21788) + (102 17)(21199) 139784 t= =

(3 2 13)+(102 17) 065747

=21261

Con la ecuaci6n 646 ahora se construye el intervalo de confianza de 95 por ciento para la diferencia entre las medias de las dos poblaciones

2 2

(45 37)plusmn21261 3 + 10 13 17

8 plusmn 21261 (25641101) 25134

Puesto que el intervalo no incluye acero se concluye que las medias de las dos poblaciones son diferentes bull

Cuando se construyen intervalos de confianza para la diferencia entre las medias de dos poblaciones es posible utilizar la figura 641 para decidir rapidashymente si el factor de confiabilidad debe ser z t 0 tf

Para cada uno de los siguientes ejercicios construya intervalos de confianza de 90 95 y 99 par ciento para las diferencias entre las medias poblacionales Establezca consideraciones que hagan que el metodo sea valido Determine las interpretaciones practica y probabilistica

clJ clJ FIGURA 541 Diagrama de flujo para decidir si e1 factor de confiabilidad debe ser z tot cuando se realizan inferencia inferencias acerca de la diferencia entre las medias de dos pobladones (Para usar un procedimiento no parametrico ver el capitulo 11)

174 CAPiTULO 6 ESTlMACION

para cad a intervalo construido Suponga las variables bajo considerati6n en cad a ejercicio y establezca para que pueden servir a los investigadores esos resultados

641 EI objetivo de un experimento de Buckner et al (A-7) consisti6 en estudiar los efectos del relajamiento muscular inducido por el pancuronium en el volumen del plasma circulante Los individuos estudiados son recien nacidos con un peso mayor a 1700 gramos que necesishytaron de ayuda para respirar durante las primeras 24 horas despues de nacer y cumplieron con otros criterios cHnicos Cinco recien nacidos paraIizados con el pancuronium y siete recien nacidos no tratados presentaron las siguientes estadisticas en la segunda de las tres mediciones del volumen de plasma (ml) hecha durante la respiraci6n mecanica

Paralizados 480 81 No tratados 567 81

La segunda medici6n para el grupo tratado ocurri6 de 12 a 24 horas despues de la primera dosis de pancuronium Para el grupo no tratado las mediciones se hicieron de 12 a 24 horas despues de iniciar la respiracion mecanica

642 Zuckery Archer (A-8) afirman que la N-nitrosobis (2-oxopropyl)amina (BOP) y las nitrosaminas 3-oxidizadas producen una alta incidencia de tumores de conductos pancreaticos en el hamster dorado sirio Estudiaron los efectos en el peso sangufneo en la glucosa del plasma en la insulina yen los niveles de transamina glutamico-oxaloacetica del plasma (GOT) de los hamsters expuestos in vivo a la BOP Los investigadores reportaron los siguientes resultados en ocho animales tratados y 12 sin tratamiento

Variable Sin tratamiento Con tratamiento

Glucosa del plasma (mglgl) 101 plusmn 5 74plusmn 6

FUENTE Peter F Zucker y Michael C Archer Alterations Pancreatic Islet Function Produced by Carcinogenic Nitrosamines in the Syrian Hamster AmericanJournal oPathology 133 573-577

Los datos son la media de la muestra plusmn la estimaci6n del error estandar de la media de la muestra

643 Los objetivos de un estudio de Davis et al (A-g) son evaluar 1) la eficacia del programa auto ayuda momento para dejar de fumar cuando se utiliza con base de uno a uno en el hogar y 2) la viabilidad de ensefiar temicas para abandonar el habito de fumar a los estudiantes de enfermerfa en bachillerato A estudiantes graduados de enfermerfa inscritos en dos cursos de metodologia de la investigacion de la Universidad de Ottawa se les invit6 a participar en el proyecto Se aplic6 un cuestionario de opcion multiple para abandonar el habito de fumar a 120 estudiantes de enfermeria que participaron y a otros 42 estudiantes que no participashyron antes ni despues del estudio Se calcularon las diferencias entre las calificaciones antes y despues del estudio as como las siguientes estadisticas a partir de las diferencias

EJERCICIOS 175

Grupo Media Desviaci6n estandar

Participantes (A) 214444 15392 No participantes (B) 33333 14595

644 El doctor Ali Khraibi (A-IO) de la CHnica y Fundaci6n Mayo condujo una serie de experishymentos con el fin de evaluar las respuestas diureticas y natiureticas de ratas Okamoto esponshytaneamente hipertensivas (REB) y ratas Wistar-Kyoto (WRY) para dirigir incrementos en la presion hidrostatica renal intersticial (PBRI) Para aumentar la PBRI se utiIiz6 la expansi6n directa del volumen renal intersticial (DRIVE) a traves de una matriz implantada cronicamente en el rinOn Entre los datos registrados durante el estudio estan las siguientes mediciones de excreci6n de sodio a traves de la orina (UNa V) durante el periodo de DRIVE

Grupo

REB 632572796483527 2WKY 420469482 108210

FUENTE Publicada con autorizaci6n del Dr Ali A Khraibi

645 Osberg y Di Scala (A-II) realizaron un estudio centrado en la eficacia de los cinturones de seguridad para reducir 1esiones entre sobrevivientes de accidentes automoviHsticos internashydos en hospitales con edades de 4 a 14 afios El estudio compar610s resultados de 123 ninos que utilizaron el cintur6n contra 290 que no 10 utilizaron entre aquellos que se vieton enshyvueltos en tales accidentes y que fueron hospitalizados El informe con tenia la siguiente estadistica del numero de dfas en la unidad de cuidados intensivos

Grupo Media Error estandar estimado

Utiliz6 el cintur6n 83 16 No utiliz6 el cintur6n 139 18

646 La medicion del diametro transversal del coraz6n de hombres y mujeres adultos presenta los siguientes resultados

sx Grupo Tamafto de Ia muestra (cm) (cm)

Varones 12 1321 105 Mujeres 9 IIOO 101

Considere que las poblaciones siguen una distribucion normal con variancias iguales

176 CAPITULO 6 ESTIMACION

647 Veintiruatro animales de laboratorio con deficiencia de vitamina D fueron divididos en dos grupos iguales EI grupo 1 recibi6 un tratamiento consistente en una dieta que proporcionashyba vitamina D EI segundo grupo no fue tratado AI termino del periodo experimental se midieron las concentraciones de calcio ensuero obteniendose los siguientes resultados

Grupo tratado X 111 mg 100 mls = 15 Grupo sin tratamiento x= 78 mg 100 ml s = 20

Considere que las poblaciones siguen una distribuci6n normal con variancias iguales

648 Ados grupos de nifios se les hicieron pruebas de agudeza vi~ual El grupo 1 estuvo formado por 11 nifios que recibieron la atenci6n de medicos privados La calificaci6n media para este grupo fue de 26 con una desviaci6n estandar de 5 El segundogrupo que incluy6 14 nifios que recibieron atenci6n medica por parte del departamento de salud publica tuvo una calishyficaci6n promedio de 21 con una desviaci6n estandar de 6 Suponga que las poblaciones siguen una distribuci6n normal con variancias iguales

649 El tiempo promedio de estancia de una muestra de 20 pacientes dados de alta de un hospital general es de siete dras con una desviaci6n estaildar de dos dras Una muestra de 24 padenshytes dados de alta de un hospital de enfermedades cr6nicas tuvo un tiempo promedio de estancia de 36 dfas con una desviaci6n estindar de 10 dias Suponga que la poblaci6n sigue una distribuci6n normal con variancias desiguales

6410 En un estudio de factores que se consideran responsables de los efectos adversos del tabashyquismo sobre la reproducci6n humana se midieron los niveles de cadmio (nanogramos por gramo) en el tejido de la placenta de una muestra de 14 madres que fumaban y una muestra aleatoria independiente de 18 mujeres no fumadoras Los resultados fueron los siguientes

No fumadoras toO 84 128250 118 98 125 154 235

94251 1952559875 118122150

Fumadoras 300301150241305178168148

134285 175 144 125204

ms probable que el nivel medio de cadmio registrado sea mayor entre las fumadoras que entre las no fumadoras ~Por que se llegarfa a esta conclusi6n

65 INTERVALO DE CONFIANZA PARA IA PROPORCION DE UNA POBIACION

Muchas preguntas de interes para que el tecnico en salud tienen relacion con las proporciones de poblacion ~Que propordon de padentes que redben un tipo espeshycial de tratamiento se recuperan ~Que proporcion de alguna poblacion tiene cierta enfermedad ~Que propordon de una poblacion es inmune a derta enfermedad

Para estimar la proporcion de una poblacion se procede en la misma forma que cuando se estima la media de una poblacion Se extrae una muestra de la poblacion de interes y se calcula su proporcion p Esta se utiliza como el estimador puntual para la proporcion de la pobladon Un intervalo de confianza se obtiene mediante la siguiente formula general

estimador plusmn (coefidente de confiabilidad) X (error estandar)

EJERCICIOS

EJERCICIOS 177

En el capitulo anterior se vio que cuando np y n(1 - p) son mayores que 5 se puede considerar que la distribuci6n muestral de pse aproxima bastante a una distribuci6n normal Cuando se cumple con esta condici6n el coeficiente de confiabilidad es algUn valor de z de la distribuci6n normal estandar Esta visto que el error estandar es igual a (J p =fi(l-p) n Puesto que p que es el parametro que se trata de calcular se desconoce se debe utilizar pcomo una estimaci6n Asf se estima (J j por medio de ~p(l Pn y el intervalo de confianza de 100(1 - 0) por ciento para pesta dado por

pplusmn Z(I-1J2)~P(l- P) Fn (651)

Este intervalo se interpreta tanto desde el punto de vista practico como probabilistico

FJEMPLO 651

Mathers et al (A-12) encontraron queen una muestra de 591 pacientes internados en un hospital psiquiatrico 204 admitieron que consuniieron marihuana al meshynos una vez durante su vida Se pretende construir un intervalo de confianza de 95 por ciento para la proporcion de individuos que consumieron marihuana durante su vida en la poblaci6n muestreada de los internos del hospital psiquiatrico

Solucion La mejor estima~i6n puntual para la proporci6Il de la poblaci6nes p== 204591 3452 El tamafio de la muestra y hiestimacion de p tienen una magnitud suficiente parajustifKar el empleo de la distribucion norshymal estandar paraelaborar un intervalo de confianza EI coeficiente de corifiabilidad que corresponde alnivel de confianza de 95 es 196 la estimacion del errorestandar (Jp es ~p(l-pgtn = (3452)(6548)591

0 1956El intervalo de confianza para p de acuerdo con estos datos es

3452 plusmn 196(01956) 3452 plusmn 0383 3069 3835

Se puede decir que se tiene 95 por ciento de confianza de que la proporshycionpeste entre 3069 y 3835 ya que al repetir el muestreo casi 95 por ciento de los intervalos construidos en la forma de este intervalo inclushyyen a la proporcion p real Con base en estos resultados se espera con una confianza de 95 por ciento encontrar que entre 3069 y 3835 por ciento de los internados en el hospital psiquiatrico tiene antecedentes de consumo de marihuana bull

Para cada uno de los siguientes ejercicios establezca la interpretacion prictica yprobabilistica de los intervalos que se pide construir Identifique cada componente del intervalo la estimashycion puntual el coeficiente de confiabilidad yel error estandar Explique por que los coefishycientes de confiabilidad no son los misInos para todos los ejercicios

178 CAPITULO 6 ESTIIlACI6N

651 En una investigaci6nde ninos maltratados en pacientes psiquiatricos Brown y Anderson (A-IS) encontraron 166 pacientes en una muestra de 947 con antecedentes de abuso sexual y maltrato flsico Construya un intervalo de confianza de 90 por dento para la proporci6n de la poblaci6n

652 Catania et at (A-14) obtuvieron datos respecto al comportamiento sexual de una muestra de hombres y mujeres solteros con edades entre 20 y 44 residentes en areas geoijfaficas caracshyterizadas por tasas altas de enfermedades de transmision sexual e ingreso a programas de drogas De 1229 encuestados 50 por ciento respondieron que nunca utilizaron preservatishyvos Construya un intervalo de confianza de 95 por ciento para la proporcion de la poblaci6n que nunca utiliza preservativos

653 Rothberg y Lits (A-I 5 ) estudiaron el efecto del estres de la maternidad durante el embarazo en el peso del producto Los individuos eran 86 mujeres blancas con antecedentes de estres que no tenfan faetores de riesgo medico u obstetrico conoddo de peso bajo del producto Los investigadores eneontraron que 128 por dento de las madres estudiadas dieron a luz bebes que cubrfan el criterio de peso bajo Construya un intervalo de confianza de 99 por ciento para la proporci6n de la poblaci6n

654 En una muestra aleatoria simple de 125 varones desempleados quienes desertaron de la escuela preparatoria entre las edades de 16 y 21 anos inclusive 88 declararon que eran consumidores regulares de bebidas alcoh6litas Construya un intervalo de eonfianza de 95 por ciento para la proporcion de la poblacion

66 INTERVALO DE CONFIANZA PARA lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS POBlACIONES

A menudo se tiene interes en conocer la magnitud de la diferencia entre las proporcioshynes de dospoblaciones Es posible que se quiera comparar por ejemplo entre hombres y mujeres dos grupos de edades dos grupos socioecon6micos 0 dos grupos de diagshynostico con respecto a la proporcion que posee alguna caractenstica de interes Un estimador puntual insesgado de la diferencia entre dos proporciones de las poblacioshynes se obtieneal calcular la diferencia de las proporciones de las muestras PI P2 Tal como Se ha visto cuando n1 Yn2 son de gran tamano y las proporciones de la poblacion no estan muy cerca de 0 0 de 1 es posible aplicar el teorema del limite central y utilizar la teona de la distribucion normal para obtener los intervalos de conshyfianza EI error estandar de la estimacion se calcula mediante la siguiente formula

dado que como regIa se desconocen las proporciones de Ia poblacion Un intervashy10 de confianza de 100(1 - a) por ciento para PI P2 se obtiene as

(661)

Es posible interpretar este intervalo desde elpunto de vista probabiHstico y practico

EJERCICIOS 179

EJEMPLO 661

Borst et al (A-16) investigaron la relaci6n de desarrollo del ego edad sexo y diagshyn6stico de suicidio entre los internos adolescentes de la unidad de psiquiatria La muestra consistia en 96 varones y 123 niiias con edades entre 12 y 16 aiios seleccioshynados de entre los internados en la unidad de adolescentes y niiios de un hospital psiquiatrico privado Se reportaron 18 niiios y 60 niiias con intento de suicidio Cons ishyderese el comportamiento de las niiias como el de una muestra aleatoria simple a partir de una poblaci6n similar de niiias y que los j6venes igualmente pueden considerarse como una muestra aleatoria simple extraida de una poblaci6n similar de niiios Para estas dos poblaciones se pretende construir un intervalo de confianshyza de 99 por ciento para la diferencia entre las proporciones de los individuos con intento de suicidio

Soluci6n Las proporciones para las niiias y niiios respectivamente son Pc = 601 123 = A878y PB = 1896 1875 La diferencia entre las proporciones de lasmuestrases Pc PB = 4878 1875 = 3003 El error estandar estimado de la diferenda entre las proporciones de las muestras es

(4878)(5122) (1875)(8125) ---~~-~ +-------shy

123 96

El factor de confiabilidad a partir de la tabla D es 258 de modo que el intervalo de confianza con la f6rmula 661 es

3003 plusmn 258(0602) 14504556

Se dene la confianza de 99 por dento de que para las poblaciones muestteadas la ptopord6n de intentos de suiddio entre las niiias exceshyde a lapropord6n de intentosde suiddio entre los varones por 1450 y 4556

Puesto que el intervalo no incluye al cero se concluye que las dos proporciones de pobladones son diferentes bull

FJERCICIOS

Para cada uno de los siguientes ejercicios establezca las interpretaciones pnicticas y probabishylisticas de los intervalos que se pide construir Identifique cada componente del intervalo la estimaci6n puntual el coeficiente de confiabilidad y el error estandar Explique por que los coeficientes de confiabilidad no son el mismo para todos los ejercicios

661 Hargers et al (A-17) del departamento de Salud PUblica y Ambieptal en Amsterdam condushyjeron un estudio en el que los individuos eran consumidores de drogasinyectables (CDI) En una muestrade 194 consumidores de metadona regular de largo plazo (MLP) 145 eran varones En una muestra de 189 CDIque no consmiddotumian MLP 133 eran varones Establezca las consideraciones necesarias acerca de las muestras ypoblaciones representadas y construshy

180 CAPITULO 6 ESTlMACI6N

ya un intervalo de confianza de 95 por ciemo para la diferenda entre las proporciones de varones en las dos poblaciones

662 Una investigaci6n de Lane et ai (A-I8) valor6las diferencias en las pnicticas de deteccion de cancer de seno entre muestras de mujeres predominantemente de bajos ingresos con edashydes de 50 a 75 anos que lltilizan los servicios de c1inicas de sailld para todo el estado y mlljeres de la misma edad residentes en ciudades donde las c1inicas de salud son locales De las 404 encuestadas seleccionadas en toda la comunidad 592 por ciento estuvo de acuerdo con el siguiente comentario acerca del cancer de pecho las mujeres prolongan su vida si detectan el cancer desde el inicio De entre 795 usuarias de clinicas de salud en la mllestra 449 por ciento estuvo de acuerdo Establezca las suposiciones apropiadas para elaborar un intervalo de confianzade 99 por ciento para la diferencia entre las dos proporciones de las poblaciones de interes

663 Williams et at (A-19) encuestaron a una muestra de 67 medicos y 133 enfermeras con famishyliares farmacodependientes EI prop6sito del estudio era evaluar la influencia en los medishyEOS y enfermeras de estar estrechamente involucrados con una 0 mas personas farmaco dependientes Cincuenta y dos medicos y 89 enfermeras dijeron que vivian con personas farmacoldependientes que adversamente afectaban 8U trabajo E8tablezca todas las consideshyraciones que crea necesarias para construir un intervalo de confianza de 95 por ciento para la diferencia entre las proporciones en las dos poblaciones de trabajadores que se espera esten adversamente afectados por vivir con personas farmacodependientes

664 Aronow y Kronzon (A-20) identificaron los factores de riesgo coronado entre hombres y mujeres en una dinica de cuidados de la salud a largo plazo De los 215 individuos negros 58 tienen diabetes mellitus al igual que 217 individuos blancos de 1140 Elabore un intervalo de confianza de 90 por ciento de confianzapara la diferencia entre las proporciones de las dos poblaciones tCuaies son las poblaciones correspondientes ~Que consideraciones son necesarias para hacer valido el procedimiento de inferencia

67 DETEHMINAUON DEL TAMANO DE LA MUESTRA PARA LA ESTIMACIONDEIAS MEDIAS

La pregunta de que tan grande debe ser una muestra surge inmediatamente al inicio del planteamiento de cualquier encuesta 0 experimento Esta es una pregunshyta importante y no se debe tratara la ligera Tomar una muestra mas grande de 10 necesario para obtener los resultados deseados es un desperdicio de recursos mienshytras que por otro lado las muestras demasiado pequenas con frecuencia dan resulshytados que carecen de uso practico En esta secci6n se estudia c6mo determinar el tamano de la muestra de acuerdo con la situaci6n A continuaci6n se proporciona un metodo para determinar el tamano de la muestra que se requiere para estimar Ia media de la poblaci6n yen la siguiente secci6n se aplica este metodo para detershyminar el tamano de la milestra cuando se desea estimar la proporci6n de una poshyblaci6n Mediante extensiltmes directas de estos metodos es posible determinar el tamano necesario de las muestras para situaciones mas complicadas

Objetivos El objetivo de la estimaci6n porintervalos es el de obtener intervalos estrechos con alta confiabilidad Si se observan los componentes ~e un intervalo de confianzase veque 8U dimension esta determinada por la magnitud de la cantidad

(coeficiente de confiabilidad) x (error estandar)

131 67 DETERMINACION DEL TAMANO PARA LA l-IUESTRAmiddot

ya que lamagnitud total del intervalo de confIanza es eldoble de esta cantidad Se aprendi6 que a esta cantidad generalmente se Ie llama precisi6n de la estimaci6n o margen de error Para un error estandar dado incrementar la confIabilidad signishyfIca un coefIciente con mayor confIabilidad Y un coefIciente con mayor confIabilidad produce unintervalo mas amplio

Por otra parte si se ftia el coefIciente de confIabilidad la unica manera de redudr la amplitud del intervalo es la reducci6n del error estandar Dado que el error estandar es igual a (J IJ y como (J es una constante la unica forma de obtener un error estandar menor es tomar una muestra grande ~Que tan grande debeser la muestra Esto depende del tamafio de (J la desviad6n estandar de la poblaci6n asi como del grado de confIabilidad y dimensi6n del intervalo deseados

Suponga que se desea obtener un intervalo que se extienda d unidades hacia uno y otro lado del estimador Ellose enuncia

d (coefIciente de confIabilidad) X (error estandar) (671)

Si el muestreo es con reemplazos a partir de una poblaci6n infInita 0 de una que sea 10 sufIcientemente grande como para ignorar la correcci6n por poblaci6n fInita la ecuaci6n 671 se transforma en

(J

d z- (672)-r la cual cuando se despeja n nos da

(673)d2

Cuando el nmestreo se hacesin reemplazos a partir de una poblaci6n fInita y peshyquefia se requiere de la correcci6n por poblaci6n fInita y la ecuaci6n 671 se transforma en

(J~d (674)fN~

que al despejar n resulta en

n-----shy (675)d 2(N 1) + Z2(J2

Si puede omitirse la correcci6n por poblad6n fInita la ecuaci6n 675 se reshyduce a la ecuaci6n 673

Estillluci6n de (J 2 Las f6rmulas para el tamafio de la muestra requieren del conocimiento de (J2 pero como ya se ha sefialado la varian cia de la poblaci6n casi

132 CAPITULO 6 ESTlMACION

siempre sedesconoce Como resultado esnecesarioestimar (J2 Las fuentes de estishymaci6n de(J2 que se utilizan con mas frecuencia son las siguientes

1 Se extrae una muestrapilato 0 prel~l11inar de lapoblaci6n y se puede utilizar la variancia calculada a partir de esta muestra como unaestimaci6n de (J2 Las observaciones uti lizadas en la muestra piloto se toman como parte de la muesshytrafinal de modo que n (el tamaiio calculado de la muestra) n

1 (el tamaiio

de la muestra piloto) n2 (el numero de observaciones necesarias para satisfacer el requerimiento total del tamaiio de la muestra)

2 A partir de estudios anteriores osimilares es posible obtener estimaciones de (J2

3Si se cree que la poblaci6n de lacual se extrae la muestraposee una distribushyci6n aproximadamente nqrmal se puede aprovechar el hecho de que la amshyplitud es aproximadamente igual a 6 desviaciones estandar y calcular (J R6 Este metodo requiere aIglin conocimiento acerca de los valores minimo y maximo de la variable en la poblaci6n

EJEMPLO 671

Un nutri6logo del departamento de salud al efectuar una encuesta entre una poshyblacien de muchachas adolescentes con e1 fin de determinitr su ingesti6n diaria promedio de proteinas (medidas en gramos) busc6 el consejo de un bioestadistico con respecto al tamaiio de la muestra que deberfa tomar

~Que procedimiento debe seguir el bioestadistico para asesorar al nutri610go Antes de que el estadistico pueda ayudar el nutri6logo este debe proporcionar tres elementos de informaci6n h dimensi6n deseada del intervalo de confianza el nivel de confianza deseado y la magnitud de la variancia de la poblaci6n

Soludon Suponga que el nutri6logo requiere un intervalo con una dimensi6n de aprQximadamente 10 gramos es decir la estimaci6n se deberfa enconshytrar alrededor de 5 gramos de la media de la poblaci6n en ambas direcshyciones En otras palabras se desea un margen de error de 5 gramos Suponga que se decide por un coeficiente de confian7a de 95 y que con base en su experiencia previa el nutri6logo percibe que la desviaci6n estandar de la poblaci6n es probablemente de alrededor de 20 gramos EI estadfstico dispone ya de la informaci6n necesaria para calcular el tamaiio de la muestra z 196 (J = 20 y d 5 Suponga que el tamaiio de la poblaci6n es grande asf queel estadistico puede ignorar la correcshyci6n por poblaci6n finita y utilizar la ecuaci6n 673 Con las sustitucioshynes adecuadas el valor de n se calcula como

Se recomienda que el nutri610go tome una muestra de tamafio 62 AI calcular el tamaiio de una muestra a partir de las ecuaciones 673 0 675 el resultado se redondea al siguiente nurnero entero mayor si los calculosdan un numerocon decimales bull

183 68 DETERMINACION DEL TAl1ANO PARA LAS PROPORCIONES

EJERCICIOS

671 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su hospital Si se desea un intervalo de confianza de 99 por dento con una amplitud de 1 libra ~que tan grande debe ser la muestra de los registros de nacimiento Suponga que un estimashy

dor razonable para (J es 1 libra ~De que tamano debe ser la muestra si el coeficiente de confiabilidad se hace descender a 95

672 El director de la secdon de control dela rabia del departamento de salud publica desea extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso del ano anterior para estimar la edad media de las personas mordidas Requiere un intervalo de confianza de 95 por dento decide utilizar un valor de 25 para d y a partir de estudios anteriores estima que la desviacion estandar de la poblacion esta alrededor de los 15 anos ~Que tan grande debe ser el tamano de la muestra

673 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mglOO ml) de pacientes atendidos en una clinica para diabeticos durante el transcurso de los ultimos 10 anos Determine el numero de registros que el medico debe examinar para obtener un intershyvalo de confianza de 90 por ciento para 11 si la dimension requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varian cia de 60

674 Se deseaestimar la edad media en la que a los padentes de esclerosis multiple se les diagnosshytico el padecimiento por primera vez Se requiere un intervalo de confianza de 95 por dento con una dimension de 10 anos Si la variancia de la poblaci6n es de 90 ~que tan grande debera ser la muestra

68 DETERMINACION DELTAMANO DE lA MUESTRA PARA lA ESIDIACION DE lAS PROPORCIONES

EI metodo para estimar el tamafio de la muestra cuando se requiere estimar la proshyporcion de una poblacion es esencialmente el mismo que se describio para estimar la media de una poblacion Se aprovecha el hecho de que la mitad del intervalo deseashydo d se puede igualar al producto del coeficiente de confiabilidad y el error estandar

Si se supone que el muestreo ha sido hecho de manera aleatoria y que existen condiciones que garanticen que la distribuci6n de psea aproximadamente normal se obtiene la siguiente formula para n cuando el muestreo es con reemplazo cuanshydo se realizaa partir de una poblacion infinita 0 ruando la poblacion muestreada es 10 suficientemente grande como para hacer innecesario el uso de la correcci6n por poblacion finita

n (681)

dondeq = I-p Si la correccion por poblacion finita no puede descartarse la formula adecuashy

da paran es

(682)n d 2 (N -1)+z2pq

euan do N es grande en comparacion con n (es decir n IN 05) se puede pasar por alto la correccion por poblacion finita y la ecuacion 682 se reduce a la ecuacion 681

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

62 INTERVALO DE CONFIANZA PARA LA MEDIA DE UNAPOBLACION 155

a2 a2

FIGUR4 621 Intervalo de confianza de 95 por dento para l

que se forman intervalos a partir de todos los valores posibles de x cakulados a partir de todas las niuestras posibles de tamafio n de la poblacion de interes De esa forma se tendrfa un gran numerode intervalos de la forma xplusmn2crx con amplitushydes todas igtiales a la del intervalo en torno a lall desconocida Aproximadamente 95 por ciento de estos intervalos tendria centros que caen dentro del intervalo plusmn2crx en torno a 11 Cada uno de estos intervalos que caen dentro de 2cr en torno a 11 pueden contener ala misma 11 Estas ideas se muestran en la figura 621 En dicha figura se observa que xl XiY x4 caen dentro del intervalo 2cr en torno allY en consecuencia los intervalos 2cr alrededor de las medias de la muestra induyen el valor de IJ Las medias muestrales y Xs no caen derttro del intervalo 2cr en torno a IJ y los intervalos de 2crx en torno a ellas no incluyen a IJ

FJElIPLO 621 Suponga que un investigador interesado en obtener una estimacion del nivel promeshydio de alguna enzima en cierta poblacion de seres humano toma una muestra de 10 individuos determina elnivel de la enzima en cada uno de elIos y calcula la media de la muestra x 22 Ademas que la variable de interes sigue una distribucion aproximashydamente normal con una variancia de 45 Se desea estimar el valor de 11

Solucion Un intervalo de confianza de aproximadamente 95 por dento para 11 esta dado por

xplusmn2cr 22plusmn2 Gi10 22 plusmn2(21213) 17762624 bull

156 CAPITULO 6 ESTIMACION

Componentes para la estimaciOn del intervalo Examine la composishycion para la estimacion del intervalo elaborada en el ejemplo 621 Este contiene en su centro la estimacion puntual para 11 Se identifica a 2 como un valor de la distribucion normal estandar que indica a cuantos errores estandar estan aproxishymadamente 95 por ciento de los valores posibles de x Este valor de Z se conoce como coeficiente de confiabilidad EI ultimo componente (ix es el error estandar 0

desviacion estandar de la distribucion muestral de x En general una estimacion por intervalos se expresa como sigue

estimador plusmn (coeficiente de confiabilidad) x (error estandar) (621)

En particular cuando el muestreo se realiza a partir de una distribucion norshymal con variancia conocida una estimacion por intervalos para Jl se expresa como

donde z(l_lt12) es el valor de Z a la izquierda de donde esta 1 rtJ2 y ala derecha en que se encuentra rtJ2 del area bajo la curva

Interpretacion del intervalo de conftarua ~Como se interpreta el intershyvalo de la ecuacion 622 En este ejemplo donde el coeficiente de confiabilidad es igual a 2 se dice que al repetirel muestreo aproximadamente 95 por ciento de los intervalos construidos mediantela formula 622 induyen la media de la poblacion Esta interpretacion se basa en la probabilidad de ocurrencia de diferentes valores de x Es posible generalizar esta interpretacion si se designael area total blttio la curva de x que queda fuera del intervalo Jl plusmn 2(ix como ex y eIarea dentro del intervalo como 1 - ex y dar la siguiente interpretaciOn probabilistica de la formula 622

Interpretaci6n probabilistica

En el muestreo repetido de una poblaci6n condistribuci6n normal y desviaci6n estdndafmiddot conocida 100(1- a) por ciento de todos los intervalos de la forma Xplusmn Z(I_amOx incluyen a la larga la media de la poblaci6n 11

Ala cantidad 1 - (X en este caso 95se Ie conoce como eoeficiente (0 nivel) de conjianza y al intervalo XplusmnZ(1_12)(ix se Ie conoce comointervalo de conjianza para Jl Cuando (1 ex) =95 al intervalo se Ie llama intervalo de confianza de 95 por ciento para Jl En este ejemplo se dice que existe 95 por ciento de confianza d~ que la media de Ia poblacion este entre 1776 y 2624 A esto se Ie llama interpretacion practica de la formula 622 En general se puede expresar de la siguiente manera

Interpretaci6n practica

Cuando se hace un muestreo a partir de poblaciones que siguen una distribuci6n normal y con desviaci6n estdndar conocida existe un 100(1 - a) por ciento de confianza de que el intervalo calculado xplusmn z(l_aI2)Ox contiene la media de la poblaci6n Jl

62 INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACION 157

En el ejemplo 621 es preferible en lugar de 2un valor mas exacto para z 196 que corresponde al coeficiente de confianza de95 Los investigadores pueshyden utilizar cualquier coeficiente de confianza los mas utilizados son 90 95 Y 99 a los cuales se asocian factores de confiabilidad de 1645 196 Y 258 respectivashymente

Precision A la cantidad que se obtiene al multiplicar el factor de confiabilidad por el error estandar de la media se Ie llama precision de la estimaci6n Tambien se Ie llama margen de error

EJEMPLO 622

Un fisioterapeuta desea estimar con 99 por ciento de confianza la media de fuerza maxima de un musculo particular en cierto grupo de individuos Se inc1ina a suposhyner que los valores de dicha fuerza muestran una distribucion aproximadamente normal con una variancia de 144 Una muestra de 15 individuos que participaron en el experimento presento una media de 843

Soluci6n En latabla D el valor para z que corresponde a un coeficiente de conshyfianza de 99 es 258 Este es el coeficiente de confiabilidad El error estandar es de ax 12fl5 =30984 Por 10 tanto el intervalo de conshyfianza de 99 por ciento para ~ es

843 plusmn258(30984) 843 plusmn 80 763923

Se dice que se tiene 99 por ciento de confianza de que la media de la poblacion este entre 763 y 923 porque al repetirel muestreo 99 por ciento de todos los intervalos que pueden construirse en la forma descrishyta inc1uyen a la media de la poblacion bull

Situaciones en las que la variable de interes sigue una distribucion aproximadashymentenormal con una variancia conocida son muy raras y casi nunca se presentan en la practica El prop6sito de los ejemplos anteriores en los que se supone que existe esta condici6n ideal fue el de formar las bases teoricas para construir intershyvalos de confianza para las medias de la poblacion En la mayorf de los casos practicos las variables no siguen una distribuci6n aproximadamente normal 0 no se conocen las variancias de la poblaci6n 0 suceden ambas cosas En el ejemplo 623 y en la secci6n 63 se explican los procedimientos que se utilizan en situaciones menos ideales pero mas comunes

Muestreo a partir de pobluciunes que no presenlan una distribucion normal No siempre es posible 0 prudente suponer que la poblaci6n de interes muesshytra una distribuci6n normal Gracias al teOlema del limite central esto no sera un problema si se puede seleccionar una muestra 10 suficientemente grande Se ha dicho que para muestras grandes la distribucion muestral de Xi presenta una distribuci6n aproximadamente normal sin importar como esta distribuida la poblacion original

158 CAPiTULO 6 ESTIMACION

EJEMPLO 623

Un equipo de investigadores esta interesado en la puntualidad de los pacientes en las citas concertadas En un estudio de flqjo depacientes en los consultorios de medicos generales se encontr6 que una muestra de 35 pacientes llegaba 172 minutos tarde a las citas en promedio Una investigaci6n previa habia demostrado que la desviaci6n estandar era de 8 minutos aproximadamente Se tuvo la sensaci6n de que la distribushyci6n de la poblaci6n no era normal ~Cual es el intervalo de confianza de 90 por ciento para 11 que es el promedio real de impuntualidad en las citas

Soluci6n Dado que el tamafio de la muestra es bastante grande (mayor que 30) y se conoce la desviaci6n estandar de la poblaci6n la situaci6n se aproxishyrna al teorema del limite central y se supone que la distribuci6n muestral de xpresenta una distribud6n aproximadamente normal AI consultar la tabla D se encuentra que el coeficiente de confiabilidad que corresponshyde a uri coeficiente de confianza de 90se aproxima a 1645 si se interpola El error estandar es de C5z 8-35 13522 de modo que el intervalo de confianza de 90 por ciento para 11 es

172 plusmn 1645(13522) 172 plusmn 22 150 194 bull

Con frecuencia cuando la muestra es 10 suficientemente grande para aplicar el teorema dellfmite central la variancia de la poblacion se desconoce En ese caso se sustituye esta variancia conla de la muestra en la f6rmula para construir el intervashy10 de confianza para la media de la poblacion

Andlisispor computadora Cuando se requiere de los intervalos de confianza se economiza una buena cantidad de tiempo mediante el uso de una computadora la cual puede ser programada para construir los intervalos de datos no procesados

EJEMPLO 624

Los siguientes datos corresponden a los valores de la actividad (micromoles por minuto por gramo de tejido) de cierta enzima medida en el tejido gastrico normal de 35 pacientes con carcinoma gastrico

60 1189 614 788 273 2464 571 1827 537 374 449 262 448 971

372 898 411 348 1925 550 622

610 319 406 413 767 385 674

521 603 533 662 1177 307 1499

Mediante el uso del paquete de software para computadora MINITAB se pretenshyde construirun intervalo de confianza de 95 por ciento para la media de la poblashycion Suponga que la variancia de la poblaci6n es iguala 36 No es necesario suponer que la poblaci6n muestreada de val ores sigue una distribuci6n normal porque el tamafio de la muestra es losuficientemente grande para aplicar el teoreshyrna del limite central

159 62 INTERV ALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACION

Caja de dialogo Comandos de la sesi6n

Statgt Basic Statisticsgt 1-Sample z MTB gt ZINTERVAl 95 6 C1

Teclear Cl en Variables Se1ecdonar Confidence interval y teclear 95 en la caja de texto Teclear6 en Sigma Clic OK

Resultados

Confidence Intervals

The assumed sigma = 0600

Variable MicMoles

N 35

Mean 0718

StDev 0511

SE Mean 0101

950 Cr (0519 0917)

FIGURA 622 Procedimiento del paquete MINITAB para construir un intrevalo de conshyfianza de 95 por ciento para la media de la poblacion ejemplo 624

Solucion Se introducen los datos en lacolumna 1 y se procede como se muestra en la figura 622 Estas instrucdones indican a la computadora que e1 factor de confiabilidad es z que se necesita unintervalo de conshyfianza de 95 por dento que la desviaci6n estandarde la poblaci6n es de 6 y que los datos estan en la columna 1 El resultado indica que la media de la muestra es 718 la desviad6n estandar es 511 y e1 error estandar de la media af es 6J35 101

Se tiene 95 pordento middotde confianza de que la media de la poblashyci6n se encuentra entre 519y 917 bull

Puede obtenerse los intervalos de confianza a traves de otros paquetes de sofuvare Por ejemplo SASreg puede construir intervalos de confianza a traves de PROC MEANS o PROC UNIVARIATE

Otras eslimaciones de La tendencia central Tal como se ha visto la meshydia es muy sensible a los val ores extremos es dedr aquellos que se desvfan consideshyrablemente de la mayorfa de las mediciones en el con junto de datos A dichos valores se les conoce como sesgos Tambien se puede apreciar que lamediana que no es sensible a las mediciones extremas algunas veces se utiliza en lugar de la media como medida de tendenda central cuando los sesgos estan presentes Por la misshyrna raz6n quiza se prefiera el uso de la mediana de la muestra comomiddotestimador de la rnediana de la poblaci6n cuando se requiere realizar inferencias acerca de la tendenda central de la poblaci6n No solamente se utiliza la mediana de la muestra

160 CAPITULO 6 ESTlMACION

como una estimacion puntual para la mediana de la poblacion sino que tambien es posible construir un intervalo de confianza para la mediana de la poblacion En esta obra no se proporciona la formula pero esta se puede encontrar en la obra de Rice (1)

Media ajustada Los estimadores que son insensibles a los sesgos se Haman estimadores eficaces Otra medida y estimador eficaz de tendencia central es la media ajustada Para un conjunto de datos que contiene n mediciones se calcula el 1000 por ciento de la media ajustada como sigue

1 Ordenar las mediciones

2 Descartar las medici ones mas pequeiias y mas grandes que 100a por ciento de las mediciones El valor recomendado para a esta entre 1 y 2

3 Calcular la media aritmetica de las mediciones restantes

Observe que la mediana podrfa considerarse como 50 por ciento de la media ajusshytada Se debe recordar que la media ajustada para el conjunto de datos es una de las medidas descriptivas que puede calcular MINITAB

FJERCICIOS

Construya para cada uno de los siguientes ejercicios los intervalos de confianza al 90 95 Y 99 por ciento para la media de la poblacion y establezca para cada uno la interpretacion probabilistica y practica Indique cualinterpretacion puede ser mas aderuada para utilizar ruando se trata sobre intervalos de confianza con alguien que no conoce de estadfstica y establezca eI razonamientode por que se eUgi6 Explique por que los tres intervalos no tjenen la misma amplitud Indique cual de los tres intervalos es preferible como estimador de la media de la poblacion y establezca el razonamiento de la elecci6n

621 Se pretende estimar el numero promedio de latidos del coraz6n por minuto para cierta poblaci6n Se encontr6 que el numero promedio de latidos por minuto para 49 personas era de YO Considere que esos 49 pacientes constituyen una muestra aleatoria y que la poblacion sigue una distribucion normal con una desviaci6n estandar de 10

622 Se pretende estimar la concentraci6n media de bilirrubina indirecta en el suero en nmos de cuatro dias de nacidos La media para una muestra de 16 ninos es de 598 mglOO cc Conshysiderese que la concentraci6n de bilirrubina en los ninos de cuatro dfas de nacidos sigue una distribucion aproximadamente normal con una desviaci6n estandar de 35 mgIOO cc

623 En un estudio acerca de la duraci6n de la hospitalizacion dirigido por vados hospitales en cooperacion se extrajo una muestra aleatoria de 64 individuos con ulcera peptica de la lista de todos los pacientes con esa enfermedad internados alguna vez en los hospitales particishypantes Se determin6 para cada uno de eUos el tiempo de hospitalizaci6n Se encontr6 que la duraci6n media de hospitalizaci6n fue de 825 dfas y se sabe que la desviaci6n estandar de la poblaci6n es de tres dfas

624 Una muestrade 100 hombres adultos aparentemente sanos de 25 anos de edad muestra una presi6n sist61ica sangufnea media de 125 Considere que la desviaci6n estandar de la poblaci6n es de 15

161 63 DISTRIBUCI6N

625 Algunos estudios acerca de la enfermedad Alzheimer (EA)han mostrado un incremento en la producci6n de 14C0

2 en pacientes con ese padecimiento Durante un estudio se obtuvieshy

ron los siguientes valores de 14C02

a partir de 16 biopsias de neocorteza de pacientes con la enfermedad (EA)

1009 1280 1180 12551547 2352 1956 1080

1776 1767 1680 2050 1452 2857 3100 1621

Considereseque la poblaci6n sigue una distribuci6n normal con una desviaci6n estandar de 350

63 DISTRIBUCION t

En la seccion 62 se describe un procedimiento para obtener un intervalo de conshyfianza para la media de una poblaci6n EI procedimiento requiere del conodmiento de la varianda de la poblacion de la que se extrae la muestra Puede parecer un tanto extrafio que se tenga conocimiento de lavariancia de la poblacion y no se conozca elvalor de la media de la poblacion De hecho es comun en situacioshynes como las que se han presentado que se deSconozca tanto la variancia como la media de la poblacion Esta situacionpresenta un problema respecto a la construcshycion delos intervalos de confianza Por ejemplo aun cuando la estadfstica

x J1shyZ=---

crJn presenta una distribudon normal cuando la poblacion tambien tiene una distribuci6n normal y sigue una distribuci6n aproximadamente normal cuando n es muy grande independientemenle de la forma funcional de la poblacion no se puede hacer uso de este hecho porque cr se desconoce Sin embargo no todo esrn perdido y la soluci6n mas logica para este problema es utilizar la desviacion estandar de ~muestra

s = ~L(Xi - x)2(n-l)

para sustituir cr Por ejemplo cuando el tamafio de la muestra es mayor que 30 la confianza en s como una aproximacion de cr es por 10 general sustancial por 10 que se justifica la utilizacion de la teorfa de la distribudon normal para construir un intervalo de confianza para la media de la poblacion En tal caso se procede como se indica en la seccion 62

Cuando se tienen muestras pequefias es imprescindible encontrar otro proceshydimiento para construir intervalos de confianza

Como resultado del trabajo de Gosset (2) escrito bajo el seudonimo de Student se dispone de otra alternativa conocida como distribuci6n t de Student con frecuenda abreviada como distribuci6n t

La cantidad

sigue esta distribucion

162 CAPiTULO 6 ESTIMACION

Propiedades de la distribucion t La distribuci6n t tiene las siguientes proshypiedades

1 Tiene una media de O

2 Es simetrica con respecto a la media

3 En general tiene una variancia mayor que 1 pero esta tiende a I a medida que aumenta el tamaiio de la muestra Para dfgt 2 la variancia de la distribushyci6n t es dfl(df - 2) donde df representa los grados de libertad En forma alterna puesto que df n - 1 para n gt 3 se puede escribir la variancia de la distribuci6n t como (n l)(n 3)

4 La variable t va de - hasta + 00DO

5 La distribuci6n t es realmente una familia de distribuciones puesto que hay una distribuci6n diferente por cada valor de la muestra de n - 1 que es el divisor que se utiliza para ca1cular S2 Recuerde que n - 1 representa los grados de libertad En la figura 631 se muestran las distribuciones t correspondienshytes a algunos valores de los grados de libertad

6 Comparada con la distribuci6n normal ladistribuci6n t es menos espigada en el centro y tiene colas mas largas En la figura 632 se com para la distribushyci6n t con la distribuci6n normal

7 La distribuci6n t se aproxima ala distribuci6n normal a medida que n - 1 se aproxima al infinito

La distribuci6n t al igual quela distribuci6n normal estandar se ha tabulado ampliamente Una de estas tablas es la tabla E del apendice Tal como se puede apreciar se debe tomar en cuenta eLcoeficiente de confianza y los grados de libershytad cuando se utiliza la tabla de la distribuci6n t

FIGUR- 631 Distribuci6n t para diferentes grados de libertad

-----

163 63 DISTRIBUCION

__ Distribucion normal

- - - Dislribucion I

x

FIGURA 632 Comparaci6n de las distribuciones normal yt

Es posible utilizar el paquete MINITAB para graficar la distribuci6n t (para grados espedficos de libertad) y otras distribuciones Despues de asignar el eje horizontal y las siguientes direcciones en el cuadro de Set Patterned Data seleccioshyne del menu Calc y despues Probability Distributions Utilice el cuadro de diashylogo Plot para generar la grafica

Inlervalos de conJiQllia qllR uJilban fa dislribucion t El procedimien to general para construir interval os de confianza no se ve afectado por la necesidad de utilizar la distribuci6n t en lugar de la distribuci6n normal estandar Aun es necesario usar la relaci6n expresada por

estimador plusmn (coeficiente de confiabiIidad) x (error estandar)

Lo que es diferente es el origen del coeficiente de confiabilidad Este se obtiene a partir de la tabla de la distribucion t en lugar de la tabla de la distribuci6n normal estandar Para ser mas especfficos cuando se obtienen muestras a partir de una distribushycion normal cuya desviaci6n estdndi17 a se desconoce ell OO( 1 - a) por ciento del intervalo de confianza para la media de la poblaci6n J1 estd dado por

(631 )

Es importante aclarar que el requisito para el uso valido de la distribucion t es que la muestra debe ser extrafda de una poblad6n con distribucion normal Sin embarshygo la experiencia ha demostrado que se pueden tolerar desviaciones moderadas de esterequisito Como consecuencia la distribucion t se utiliza incluso cuando se sabe que la poblaci6n original se desvia de la normalidad Lltl mayorfa de los invesshytigadores requieren que al menos pueda sostenerse el supuesto de una distribushyd6n de poblacion en forma de montfculo

EJEMPLO 631

Maureen McCauley (A-I) realiz6 un estudio para evaluar los efectos de un conjunto de instrucciones de mecanica en ellugar de labores sobre el desempeno laboral de obreros jovenes recientemente contratados Se utilizaron dos grupos de individuos elegidos aleatoriamente uno de los grupos para aplicar el experimento y el otro

164 CAPITULO 6 ESTlMACI6N

como grupo de control EI grupo con el que se experimento recibio una hora de capacitacion impartida por un terapeuta ocupacional EI grupo de control no recishybio esta capacitacion Para evaluar el esfuerzo de cada obrero para levan tar bajar jalar y transportar objetos dentro del entorno laboral se utilizo una lista de cotejo para la evaluacion de trabajo mecanico que inclufa criterios de referencia Una tarea bien hecha recibio una calificacion de 1 EI grupo de control formado por 15 individuos alcanzo una calificacion media de 1153 en la evaluacion con una desshyviacion estandar de 3681 Se supone que el grupo de control se comporto como una muestra aleatoria extraida de una poblacion similar de individuos Se pretende utilizar los datos de la muestra para estimar la calificacion media para la poblacion

Soluci6n Se puede utilizar la media de la muestra 1153 como una estimacion puntualde la media de la poblacion sin embargo debido a que se descoshynoce la desviacion estandar de la poblacion se debe considerar que los valores siguen una distribucion aproximadamente normal antes de consshytruir los intervalos de confianza para l Se considera que esta suposicion es razonable y que se necesita un intervalo de confianza de ~or cienshyto el estimador es i y el error estandar es s -r 681 15 =9504 Ahora es necesario conocer el coeficiente de confiabilidad el valor de t asodado al coeficiente de confianza de 95 y a los n 1 = 14 grados de libertad Puesto que el intervalo de confianza de 95 por ciento deja 05 del area bajo la curva de t para dividirse en dos colas iguales se necesita el valor de tala derecha del cual esta el 025 del area Este valor se localiza en la tabla E enla columna encabezada por t

975 bull Este es el valor

para tala izquierda delcual esta 975 del area bajo la curva EI area a la derechade este valor es igual al 025 deseado Ahora sobre la columna de grados de libertad se localiza el numero 14 EI valor para t se encuentra en la interseccion del renglon con la etiqueta 14 y la columna con la etiqueta t975 bull Se encuentra que este valqr para t que representa al coeficiente de confiabilidad es 21448 Finalmente el intervalo de confianza de 95 por ciento se construye como sigue

1153 plusmn 21448(9504) 1153 plusmn 204 949 1357 bull

Este intervalo puede interpretarse con ambos puntos de vista probabiHstico y practico Puede asegurarse en un 95 por dento que 1a media l correcta de la poblacion se encuentra entre 949 y 1357 porque al repetir el muestreo 95 por dento de los intervalos construidos deigual manera incluyen a l

Decidir entre z r t Cuando se obtiene un intervalo de confianza para la media de una poblacion se debe decidir si se utiliza un valor de z6 de t como factor de confiabilidad Para hacer una elecci6n adecuada se debe considerar el tamafto de la muestra si la poblacion muestreada sigue una distribucion normal y si la varian cia de la poblacion es conocida La figura 633 muestra un diagrama de flujo que se puede utilizar para decidir rapidamente si el factor de confiabilidad debe ser Z 0 t

EJERCICIOS 165

EJERCICIOS

Sa aplica al leorema dellfmile central

FIGURA 633 Diagrama de flujo para deddir entre utililizar z y t cuando se hagan inferencias respecto a las medias de la poblaci6n (Para utilizar un procedimiento no parametrico vease el capitulo 13)

Analisis par computadara Si el proposito es construir un intervalo de conshyfianza con el programa MINITAB para la media de la poblacion cuando el estadfsshytico t es el factor de confiabilidad adecuado el comando se inicia con la palabra TINTERVAL Seleccione en Windows I-Sample t desde el menu de Basic Statistics

631 Utilice la distribud6n t para encontrar el factor de confiabilidad para el intervalo de confianshyza basado en los siguientes coeficientes de confianza y tamafiosde las muestras

a b c d

Coefidente de confianza 95 99 90 95 Tamafio de la muestra 15 24 8 30

632 En una investigacion acerca de la dependencia del flujo y volumen de todo el sistema respishyratorio en un grupo de pacientes con enfermedad obstructiva pulmonar cronica conectados a respiradores artificiales Tantucci et ai (A-2) registraron los siguientes valores de linea de

166 CAPITULO 6 ESTIMACION

base del flUjD continuo inspiratDriD (Us) 90 97 103110 104 100 CDnsidere que una muestra aleatDria simple esta cDnfDrmada pDr seis individuDs a partir de una pDblacion que sigue una distribuci6n nDrmal CDn individuDs CDn la misma enfermedad

a) ~Cuat es la estimaci6n puntual de la media de la pDblaci6n

b) ~Cuil es la desviacion estandar de la muestra

c) ~Cultll es la estimacion del error estandar para la media de la muestra

d) CDnstruya un intervalD de cDnfianza de 95 pDr ciento para el flUjD mediD cDntinuD inspishyratDriD de la pDblaci6n

e) ~Cual es la precision de la estimacion

f) Explique la interpretaci6n prDbabilistica para este intervalD de confianza

g) Explique la interpretacion practica para este intervalD de cDnfianza

633 LlDyd y MaillDux (A-3) informaron IDS siguientes datDs acerca del peso de la glandula pituitaria en una muestra de cuatrD ratas de Wistar Furth

media = 90 mg error estandar para la media = 3

FUEJTE Ricardo V Lloyd y Joe Mailloux Analysis ofSshy100 Protein Positive Folliculo Stellate Cells in Rat Pituitary Tissues AmericanJournal ofPathology 133 338-346

a) ~Cual es la desviadon estandar de la muestra

b) CDnstruya un intervalD de confianza de 95 pDr ciento para el peso medio de la glandula pituitaria para una pDblacion similar de ratas

c) ~Que supDsiciDnes se necesitan para que sea validD el intervalo de cDnfianza del inciso b

d) ~Que interpretacion puede ser la mas indicada cuandD se trata sDbre intervalos de conshyfianzacon alguien que no sabe de estadfstica Explique pDrque es la mas cDnveniente

e) 5i fuera necesario elabDrar un intervalD de cDnfianza de 90 pDr cientD para la media de la pDblaci6n ~el intervalD de cDnfianza serta mayDr 0 menor que el intervalD de 95 pDr dentD Explique su respuesta sin construir realmente el intervalD de cDnfianza

f) 5i [uera necesariD considerar un intervalo de CDnfianza de 99 pDr cientDpara lamedia de la poblacion ~el intervalo de cDnfianza serra mayDr 0 menDr que el intervalD de 95 pDr dentD Explique su respuesta sin cDnstruir realmentt el intervalD de cDnfianza

634 Kaminski y Rechberger (A-4) encontrarDn en un estudio sDbre la preeclampsia que la media de la presi6n sistolica sangufnea en 10 mujeres sanas y que no estan embarazadas es de 119 CDn una desviacion estandar de 21

a) 2Cual es el errDr estandar estimadD para la media

b) CDnstruya un intervalD de confianza de 99 pDr cientD para la media de la poblaci6n a partir de la cual puede considerarse que IDS 10 individuos conforman una muestra aleatoria

c) ~CUlil es la precisi6n estimada

d) ~Que consideraciones deben hacerse para comprobar la validez del intervalo de confiahza

635 Unamuestra de 16nifias de 10 afiDS pesan en promediD 715 con una desviacion estandar de 12libras CDnsidere el calculD de intervalDs de cDnfianza de 9095 y 99 pDr ciento para I-L

167 64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS

636 Una muestra aleatoria simple conformada por 16 individuos aparentemente sanos presenta los siguientes valores de arsenico eliminado en la orina (miligramos por dfa)

Individuo Valor Individuo Valor

1 007 9 012 2 030 10 006 3 025 11 010 4 008 12 032 5 030 13 006 6 038 14 009 7 007 15 014 8 005 16 011

Elabore un intervalo de confianza de 95 por ciento para la media de la poblaci6n

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES

En ocasiones se presentan casos en los que se desea estimar 1a diferencia entre 1a media de dos poblaciones A partir de cada poblacion se extrae una muestra aleatoria independiente y de los datos de cada una se calculan las medias muestrales XI y x2

respectivamente En el capitulo anterior se dijo que el estimador XI - x2 ofrece una estimacion insesgada de la diferencia entre las medias de las poblaciones III shy11 2 bull La variancia del estimador es (cr~ n l ) + (cr~ n 2 ) Tambien se menciono que seglin las condiciones la distribucion muestral de XI - x2 puede presentar una distribution al menos aproximadamente normal de modo que en muchos casos se utiliza la teorfa adecuada para las distribuciones normales en el calculo de un intershyvalo de confianza para III - 11 2 bull Cuando se conocen las variancias de la poblacion el intervalo de confianza del 100(1 - ex) por ciento para III - 112 esta dado por

(641)

El anal isis del intervalo de confianza para la diferencia entre las medias poblacionales ofrece informacion util para decidir si es 0 no probable que las medias de las dos poblaciones sean iguales Cuando el intervalo no incluye al cero se dice que el intervalo ofrece evidencia de que las dos poblaciones tienen medias diferentes Cuando el intervalo incluye al cero se dice que las poblaciones pueden tener meshydias iguales

Esto se ilustra a continuacion para el caso donde el muestreo se realiza a partir de una distribucion normal

168 CAPITULO 6 ESTlMACI6N

EJEMPLO 641

A un equipo de investigacion Ie interesa conocer la diferencia entre las concentracioshynes de acido urico en pacientes con y sin el sfndrome de Down En un gran hospital para el tratamiento de pacientes con retardo mental una muestra de 12 individuos con el sindrome presenta una media de XI = 45 mgll00 mL En un hospital general se encontro que una muestra de 15 individuos normales de la misma edad y sexo presenta un nivel medio de x2= 34 Si es razonable suponer que las dos poblaciones de valores muestran una distribucion normal y sus variancias son iguales a 1 y 15 calcule el intervalo de confianza de 95 por ciento para ~l - ~2

Soluci6n Para una estimacion puntual de III 112 se udliza Xl X2= 45 34 11 EI coeficiente de confiabilidad que corresponde a 95 localizado en la tabla D es 196 EI error estandar es

Por 10 tanto el intervalo de confianza de 95 por ciento es

11 plusmn 196(4282) 11plusmn84 26 194

Se dice que se dene una confianza de 95 por ciento de que la difeshyrencia real 111 - 112 este entre 26 y 194 porque en muestreos repetidos 95 por ciento de los intervalos construidos de esa manera incluiria la diferencia entre las medias reales

Puesto que el intervalo no incluye al cero se concluye que las dos poblaciones tienen diferentes medias bull

Muestreo a partir de poblaciones que no signen una distribuci6n ItOrmal La construccion de un intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando el muestreo se realiza a partir de poblaciones no normales se lleva a cabo en la forma descrita en el ejemplo 641 si las muestras n l y n

2 son grandes Una vez mas este es un resultado del teorema del limite central

Si se desconocen las variancias de la poblacion se utili zan las variancias de las muestras para estimarlas

IUEMPLO 642

Motivados por d conocimiento de la existencia de una gran cantidad de textos polemicos que sugieren que el estres la ansiedad y la depresion son dafiinos para el sistema inmunologico Gormanet ai (4-5) condujeron un estudio en el que se conshysider6 a individuos varoneshomosexuales algunos con VIH (virus de inmunodefishyciencia humana) positivo y otros con VIH negativo Los datos fueron registrados con una amplia vltJriedad de mediciones medicas inmunologicas psiquiatricas y neurol6gicas una de las cuales corresponde al numero de celulas CD4+ en la sanshy

64 INTERV ALO DE CONFIANZA PAHALA DIFERENCIA ENTRE DOS MEDIAS 169

gre El numero promedio de celulas CD4+ para middot112 individuos con infecci6n por VIR fue de 4018 con una desviaci6n estandar de 2264 Para los 75 individuos sin la infecci6n por VIR la media y la desviaci6n estandar fueron de 8282 y 2749 respectivamente Se pretende elaborar un intervalo de confianza de 99 por ciento para la diferencia de las medias de las poblaciones

Soluci6n No hay informaci6n con respecto a la forma de la distribuci6n de las celulas CD4+ Sin embargo como el tamafto de las muestras es grande el teorema del limite central asegura que la distribuci6n muestral de las diferencias entre las medias de la muestra siguen una distribuci6n aproxishymadamente normal independientemente de que la distribuci6n de la variable en las poblaciones no siga una distribuci6n normal Se puede utilizar este hecho para justificar el uso de la estadistica z como factor de confiabilidad en la construcci6n del intervalo de confianza Tampoco hay informaci6n acerca de las desviaciones estandar por 10 que puede emplearse las desviaciones estandar de las muestras para estimarlas La estimaci6n puntual para la diferencia entre las medias de las poblacioshynes es la diferencia entre las medias de las muestras 8282 - 4018 = 4264 En la tabla D se encuentra que el factor de confiabilidad es 258 La estimaci6n del error estandar es

s __ = 27492

+ 22642 =382786

Xl-X 75 112

Por la ecuaci6n 641 el intervalo de confianza de 99 por ciento para la diferencia entre las medias de la poblaci6n es

4264 plusmn 258(382786) 3276 5252

Se tiene la seguridad de 99 por ciento de que el promedio de celulas CD4+ en varones con VIR positivo difieren de la media para los varoshynes con VIR negativo por 3276 a 5252 bull

Distribuci6n t y la diferencia entre las medias Cuando no se conocen las variancias y se pretende estimar la diferencia entre las medias de dos poblacioshynes con un intervalo de confianza es posible utilizar la distribuci6n t para suminisshytrar el factor de confiabilidad si se conocen ciertas suposiciones se debe saber 0

suponer de buena fe que las dos poblaciones muestreadas siguen una distribuci6n normal Respecto a las variancias de las poblaciones se debe distinguir entre dos situaciones 1) la situaci6n en la que las variancias son iguales y 2) la situaci6n en la que no 10 son A continuaci6n se consideranambas sitpaciones por separado

Varianciaspoblacifmales iguales Si la suposici6n sobre igualdad de las variancias de las poblaciones esta justificada las dos variancias de las muestras calculadas a partir de las muestras independientes pueden considerarse como estishymaciones de 10 mismo es decir la variancia comun Parece 16gico entonces aproshyvechar este hecho en el anal isis en cuesti6n Esto es precisamente 10 que se hace para establecer una estimaci6n conjunta para la variancia comun Esta variancia se obtiene mediante el caIculo promedio ponderado de las dos variancias de las muesshy

170 CAPITULO 6 ESTlMACI6N

tras Cada variancia de la muestra es ponderada con base en sus grados de libertad Si los tamafios de las muestras son iguales este promedio ponderado es la media aritmetica de las variancias de las dos muestras Si el tamano de las dos muestras es distinto el promedio ponderado aprovecha la informacion adicional proporcionada por la muestra mayor La estimacion con junta se obtiene con la fOrmula

S2 = (nl _1)SI2 + (n2 l)s~ p (642)

+n2 -2nl

Asf la estimacion del error estandar esta dada por

(643)

y el intervalo de confianza de 100(1 a) por ciento para III 112 esta dada por

(644)

El nfunero de grados de libertad utilizado para determinar el valor de t que se usa para construir el intervalo es n

1 + n

2 2 que es el denominador de la ecuacion

642 Este intervalo se interpreta en la forma habitual Los metodos que pueden emplearse para tomar la decision acerca de la igualshy

dad de las variancias de las poblaciones se estudian en la seccion 610 y 78

EJEMPLO 643

Uno de los estudios de Stone et al (A-6) tuvo como objetivo determinar los efectos del ejercicio por un tiempo prolongado en los ejecutivos de una compania inscritos en un programa supervisado de acondicionamiento fisico Se registraron datos de 13 individuos (el grupo deportista) que voluntariamente se inscribieron el programa y que permanecieron activos por 13 anos en promedio y de 17 individuos (el segunshydo grupo el sedentario) que decidieron no inscribirse Entre los datos que se regisshytraron acerca de los individuos esta el mlmero maximo de sentadillas realizadas en 30 segundos El grupo deportista obtuvo una media y una desviacion estandar de 210 y 49 respectivamente La media y la desviacion estandar para el grupo sedenshytario fueron 121 y 56 respectivamente Se considera que las dos poblaciones de medici ones de acondicionamiento muscular siguen una distribuci6n aproxirnadashymente normal y que las variancias para ambas poblacionesson iguales Se pretenshyde elaborar un intervalo de confianza de 95 por ciento para Ja diferencia entre las medias de as poblaciones representadas por las dos muestras Soluci6n Primero se utiliza la ecuaci6n 642 para calcular la estimaci6n conjunta

de la variancia comtin de las poblaciones

(13-1)(49 2 )+(17 1)(562 ) =2821

13+17-2 Cuando se consulta la tabla E con 13 + 17 - 2= 28 grados de libertad y el nivel de confianza de 95 se encuentra que eLfactor de confiabilidad es 20484 Con la ecuacion 644 se calcula el intervalo de confianza de

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS 171

95 por ciento para la diferencia entre las medias de las poblaciones de la siguiente manera

2821 2821(210-121)plusmn20484 --+-shy

13 17 89 plusmn 40085

49129

Se tiene una confianza de 95 por ciento de que la diferencia entre las medias de las poblaciones estan entre 49 y 129 Se puede decir esto porque se sabe quesi se repite el amilisis muchfsimas veces y se calculan los intervalos de confianza de la misma manera cerca de 95 por ciento de los intervalos de confianza induiran la diferencia entre las medias de las poblaciones

Debido a que los intervalos no induyen al cerose conduye que las medias de las poblaciones son diferentes bull

Variancias poblacionales distintas Cuando no se puede conduir que las variancias de dos poblaciones de interes son iguales aun ruando pueda suponerse que las dos poblaciones presentan distribuciones normales no es adecuado utilizar la distribucion t como se acaba de describir para construir los intervalos de confianza

Una solucion al problema de variancias distintas fue propuesta por Behrens (3) y posteriormente fue verificada y generalizada por Fisher (4 5) Neyman (6) Scheffe (7 8) Y Welch (9 10) tambien proponen soluciones EI problema es analizashydo en detalle por Cochran (11)

EI problema gira en tomo al hecho de que la cantidad

no sigue una distribuci6n t con nj + n 2 grados de libertad ruando las variancias 2 shy

de las poblaciones son distintas Consecuentemente la distribucion t no se puede utilizar en la forma habitual pata obtener el factor de confiabilidad del intervalo de confianza para la diferencia entre las medias de dos poblaciones que tienen variancias diferentes La solucion propuesta por Cochran consiste en el calculo del factor de confiabilidad mediante la siguiente formula

wltj + w2tZ t l

f

-0f2 = (645) WI +w2

donde WI 512

np W 2 = s~ n2 tl = tl _ para nj - 1 grados de libertad y t2 = t l

_w2aI2

para n2

- 1 grados de libertad Un intervalo aproximado de confianza del 100(1 shya) por ciento para III - 112 esta dado por

(646)

172

EJERCICIOS

CAPITULO 6 ESTlMACION

FJEIUPLO 644

En la investigacion de Stone et al (A-6) descrita en el ejercicio 643 los investigashydores tambien informaron los siguientes datos de las medici ones referentes a todas las calificaciones del acondicionamiento muscular logradas por los individuos

Muestra n Media Desviaci6n estimdar

Grupo deportista 13 45 3

Grupo sedentario 17 37 10

Se considera que las dos poblaciones de todas las calificaciones de acondicionashymiento muscular siguen una distribuci6n aproximadamente normal Sin embargo no debe suponerse que las dos variancias poblacionales son iguales Se pretende construir un intervalo de confianza de 95 por ciento para la diferencia entre las medias de todas las calificaciones de acondicionamiento muscular para las dos poshyblaciones representadas por las muestras

Soluci6n Se utiliza t de la ecuaci6n 645 para calcular el factor de confiabilidad En la tabla E se muestra que con 12 grados de libertad y 1 - 052 = 975 t( 21788 Analogamente con 16 grados de libertad y 1- 052 = 975 t2 = 21199 Ahora Sf calcula

(3 2 13)(21788) + (102 17)(21199) 139784 t= =

(3 2 13)+(102 17) 065747

=21261

Con la ecuaci6n 646 ahora se construye el intervalo de confianza de 95 por ciento para la diferencia entre las medias de las dos poblaciones

2 2

(45 37)plusmn21261 3 + 10 13 17

8 plusmn 21261 (25641101) 25134

Puesto que el intervalo no incluye acero se concluye que las medias de las dos poblaciones son diferentes bull

Cuando se construyen intervalos de confianza para la diferencia entre las medias de dos poblaciones es posible utilizar la figura 641 para decidir rapidashymente si el factor de confiabilidad debe ser z t 0 tf

Para cada uno de los siguientes ejercicios construya intervalos de confianza de 90 95 y 99 par ciento para las diferencias entre las medias poblacionales Establezca consideraciones que hagan que el metodo sea valido Determine las interpretaciones practica y probabilistica

clJ clJ FIGURA 541 Diagrama de flujo para decidir si e1 factor de confiabilidad debe ser z tot cuando se realizan inferencia inferencias acerca de la diferencia entre las medias de dos pobladones (Para usar un procedimiento no parametrico ver el capitulo 11)

174 CAPiTULO 6 ESTlMACION

para cad a intervalo construido Suponga las variables bajo considerati6n en cad a ejercicio y establezca para que pueden servir a los investigadores esos resultados

641 EI objetivo de un experimento de Buckner et al (A-7) consisti6 en estudiar los efectos del relajamiento muscular inducido por el pancuronium en el volumen del plasma circulante Los individuos estudiados son recien nacidos con un peso mayor a 1700 gramos que necesishytaron de ayuda para respirar durante las primeras 24 horas despues de nacer y cumplieron con otros criterios cHnicos Cinco recien nacidos paraIizados con el pancuronium y siete recien nacidos no tratados presentaron las siguientes estadisticas en la segunda de las tres mediciones del volumen de plasma (ml) hecha durante la respiraci6n mecanica

Paralizados 480 81 No tratados 567 81

La segunda medici6n para el grupo tratado ocurri6 de 12 a 24 horas despues de la primera dosis de pancuronium Para el grupo no tratado las mediciones se hicieron de 12 a 24 horas despues de iniciar la respiracion mecanica

642 Zuckery Archer (A-8) afirman que la N-nitrosobis (2-oxopropyl)amina (BOP) y las nitrosaminas 3-oxidizadas producen una alta incidencia de tumores de conductos pancreaticos en el hamster dorado sirio Estudiaron los efectos en el peso sangufneo en la glucosa del plasma en la insulina yen los niveles de transamina glutamico-oxaloacetica del plasma (GOT) de los hamsters expuestos in vivo a la BOP Los investigadores reportaron los siguientes resultados en ocho animales tratados y 12 sin tratamiento

Variable Sin tratamiento Con tratamiento

Glucosa del plasma (mglgl) 101 plusmn 5 74plusmn 6

FUENTE Peter F Zucker y Michael C Archer Alterations Pancreatic Islet Function Produced by Carcinogenic Nitrosamines in the Syrian Hamster AmericanJournal oPathology 133 573-577

Los datos son la media de la muestra plusmn la estimaci6n del error estandar de la media de la muestra

643 Los objetivos de un estudio de Davis et al (A-g) son evaluar 1) la eficacia del programa auto ayuda momento para dejar de fumar cuando se utiliza con base de uno a uno en el hogar y 2) la viabilidad de ensefiar temicas para abandonar el habito de fumar a los estudiantes de enfermerfa en bachillerato A estudiantes graduados de enfermerfa inscritos en dos cursos de metodologia de la investigacion de la Universidad de Ottawa se les invit6 a participar en el proyecto Se aplic6 un cuestionario de opcion multiple para abandonar el habito de fumar a 120 estudiantes de enfermeria que participaron y a otros 42 estudiantes que no participashyron antes ni despues del estudio Se calcularon las diferencias entre las calificaciones antes y despues del estudio as como las siguientes estadisticas a partir de las diferencias

EJERCICIOS 175

Grupo Media Desviaci6n estandar

Participantes (A) 214444 15392 No participantes (B) 33333 14595

644 El doctor Ali Khraibi (A-IO) de la CHnica y Fundaci6n Mayo condujo una serie de experishymentos con el fin de evaluar las respuestas diureticas y natiureticas de ratas Okamoto esponshytaneamente hipertensivas (REB) y ratas Wistar-Kyoto (WRY) para dirigir incrementos en la presion hidrostatica renal intersticial (PBRI) Para aumentar la PBRI se utiIiz6 la expansi6n directa del volumen renal intersticial (DRIVE) a traves de una matriz implantada cronicamente en el rinOn Entre los datos registrados durante el estudio estan las siguientes mediciones de excreci6n de sodio a traves de la orina (UNa V) durante el periodo de DRIVE

Grupo

REB 632572796483527 2WKY 420469482 108210

FUENTE Publicada con autorizaci6n del Dr Ali A Khraibi

645 Osberg y Di Scala (A-II) realizaron un estudio centrado en la eficacia de los cinturones de seguridad para reducir 1esiones entre sobrevivientes de accidentes automoviHsticos internashydos en hospitales con edades de 4 a 14 afios El estudio compar610s resultados de 123 ninos que utilizaron el cintur6n contra 290 que no 10 utilizaron entre aquellos que se vieton enshyvueltos en tales accidentes y que fueron hospitalizados El informe con tenia la siguiente estadistica del numero de dfas en la unidad de cuidados intensivos

Grupo Media Error estandar estimado

Utiliz6 el cintur6n 83 16 No utiliz6 el cintur6n 139 18

646 La medicion del diametro transversal del coraz6n de hombres y mujeres adultos presenta los siguientes resultados

sx Grupo Tamafto de Ia muestra (cm) (cm)

Varones 12 1321 105 Mujeres 9 IIOO 101

Considere que las poblaciones siguen una distribucion normal con variancias iguales

176 CAPITULO 6 ESTIMACION

647 Veintiruatro animales de laboratorio con deficiencia de vitamina D fueron divididos en dos grupos iguales EI grupo 1 recibi6 un tratamiento consistente en una dieta que proporcionashyba vitamina D EI segundo grupo no fue tratado AI termino del periodo experimental se midieron las concentraciones de calcio ensuero obteniendose los siguientes resultados

Grupo tratado X 111 mg 100 mls = 15 Grupo sin tratamiento x= 78 mg 100 ml s = 20

Considere que las poblaciones siguen una distribuci6n normal con variancias iguales

648 Ados grupos de nifios se les hicieron pruebas de agudeza vi~ual El grupo 1 estuvo formado por 11 nifios que recibieron la atenci6n de medicos privados La calificaci6n media para este grupo fue de 26 con una desviaci6n estandar de 5 El segundogrupo que incluy6 14 nifios que recibieron atenci6n medica por parte del departamento de salud publica tuvo una calishyficaci6n promedio de 21 con una desviaci6n estandar de 6 Suponga que las poblaciones siguen una distribuci6n normal con variancias iguales

649 El tiempo promedio de estancia de una muestra de 20 pacientes dados de alta de un hospital general es de siete dras con una desviaci6n estaildar de dos dras Una muestra de 24 padenshytes dados de alta de un hospital de enfermedades cr6nicas tuvo un tiempo promedio de estancia de 36 dfas con una desviaci6n estindar de 10 dias Suponga que la poblaci6n sigue una distribuci6n normal con variancias desiguales

6410 En un estudio de factores que se consideran responsables de los efectos adversos del tabashyquismo sobre la reproducci6n humana se midieron los niveles de cadmio (nanogramos por gramo) en el tejido de la placenta de una muestra de 14 madres que fumaban y una muestra aleatoria independiente de 18 mujeres no fumadoras Los resultados fueron los siguientes

No fumadoras toO 84 128250 118 98 125 154 235

94251 1952559875 118122150

Fumadoras 300301150241305178168148

134285 175 144 125204

ms probable que el nivel medio de cadmio registrado sea mayor entre las fumadoras que entre las no fumadoras ~Por que se llegarfa a esta conclusi6n

65 INTERVALO DE CONFIANZA PARA IA PROPORCION DE UNA POBIACION

Muchas preguntas de interes para que el tecnico en salud tienen relacion con las proporciones de poblacion ~Que propordon de padentes que redben un tipo espeshycial de tratamiento se recuperan ~Que proporcion de alguna poblacion tiene cierta enfermedad ~Que propordon de una poblacion es inmune a derta enfermedad

Para estimar la proporcion de una poblacion se procede en la misma forma que cuando se estima la media de una poblacion Se extrae una muestra de la poblacion de interes y se calcula su proporcion p Esta se utiliza como el estimador puntual para la proporcion de la pobladon Un intervalo de confianza se obtiene mediante la siguiente formula general

estimador plusmn (coefidente de confiabilidad) X (error estandar)

EJERCICIOS

EJERCICIOS 177

En el capitulo anterior se vio que cuando np y n(1 - p) son mayores que 5 se puede considerar que la distribuci6n muestral de pse aproxima bastante a una distribuci6n normal Cuando se cumple con esta condici6n el coeficiente de confiabilidad es algUn valor de z de la distribuci6n normal estandar Esta visto que el error estandar es igual a (J p =fi(l-p) n Puesto que p que es el parametro que se trata de calcular se desconoce se debe utilizar pcomo una estimaci6n Asf se estima (J j por medio de ~p(l Pn y el intervalo de confianza de 100(1 - 0) por ciento para pesta dado por

pplusmn Z(I-1J2)~P(l- P) Fn (651)

Este intervalo se interpreta tanto desde el punto de vista practico como probabilistico

FJEMPLO 651

Mathers et al (A-12) encontraron queen una muestra de 591 pacientes internados en un hospital psiquiatrico 204 admitieron que consuniieron marihuana al meshynos una vez durante su vida Se pretende construir un intervalo de confianza de 95 por ciento para la proporcion de individuos que consumieron marihuana durante su vida en la poblaci6n muestreada de los internos del hospital psiquiatrico

Solucion La mejor estima~i6n puntual para la proporci6Il de la poblaci6nes p== 204591 3452 El tamafio de la muestra y hiestimacion de p tienen una magnitud suficiente parajustifKar el empleo de la distribucion norshymal estandar paraelaborar un intervalo de confianza EI coeficiente de corifiabilidad que corresponde alnivel de confianza de 95 es 196 la estimacion del errorestandar (Jp es ~p(l-pgtn = (3452)(6548)591

0 1956El intervalo de confianza para p de acuerdo con estos datos es

3452 plusmn 196(01956) 3452 plusmn 0383 3069 3835

Se puede decir que se tiene 95 por ciento de confianza de que la proporshycionpeste entre 3069 y 3835 ya que al repetir el muestreo casi 95 por ciento de los intervalos construidos en la forma de este intervalo inclushyyen a la proporcion p real Con base en estos resultados se espera con una confianza de 95 por ciento encontrar que entre 3069 y 3835 por ciento de los internados en el hospital psiquiatrico tiene antecedentes de consumo de marihuana bull

Para cada uno de los siguientes ejercicios establezca la interpretacion prictica yprobabilistica de los intervalos que se pide construir Identifique cada componente del intervalo la estimashycion puntual el coeficiente de confiabilidad yel error estandar Explique por que los coefishycientes de confiabilidad no son los misInos para todos los ejercicios

178 CAPITULO 6 ESTIIlACI6N

651 En una investigaci6nde ninos maltratados en pacientes psiquiatricos Brown y Anderson (A-IS) encontraron 166 pacientes en una muestra de 947 con antecedentes de abuso sexual y maltrato flsico Construya un intervalo de confianza de 90 por dento para la proporci6n de la poblaci6n

652 Catania et at (A-14) obtuvieron datos respecto al comportamiento sexual de una muestra de hombres y mujeres solteros con edades entre 20 y 44 residentes en areas geoijfaficas caracshyterizadas por tasas altas de enfermedades de transmision sexual e ingreso a programas de drogas De 1229 encuestados 50 por ciento respondieron que nunca utilizaron preservatishyvos Construya un intervalo de confianza de 95 por ciento para la proporcion de la poblaci6n que nunca utiliza preservativos

653 Rothberg y Lits (A-I 5 ) estudiaron el efecto del estres de la maternidad durante el embarazo en el peso del producto Los individuos eran 86 mujeres blancas con antecedentes de estres que no tenfan faetores de riesgo medico u obstetrico conoddo de peso bajo del producto Los investigadores eneontraron que 128 por dento de las madres estudiadas dieron a luz bebes que cubrfan el criterio de peso bajo Construya un intervalo de confianza de 99 por ciento para la proporci6n de la poblaci6n

654 En una muestra aleatoria simple de 125 varones desempleados quienes desertaron de la escuela preparatoria entre las edades de 16 y 21 anos inclusive 88 declararon que eran consumidores regulares de bebidas alcoh6litas Construya un intervalo de eonfianza de 95 por ciento para la proporcion de la poblacion

66 INTERVALO DE CONFIANZA PARA lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS POBlACIONES

A menudo se tiene interes en conocer la magnitud de la diferencia entre las proporcioshynes de dospoblaciones Es posible que se quiera comparar por ejemplo entre hombres y mujeres dos grupos de edades dos grupos socioecon6micos 0 dos grupos de diagshynostico con respecto a la proporcion que posee alguna caractenstica de interes Un estimador puntual insesgado de la diferencia entre dos proporciones de las poblacioshynes se obtieneal calcular la diferencia de las proporciones de las muestras PI P2 Tal como Se ha visto cuando n1 Yn2 son de gran tamano y las proporciones de la poblacion no estan muy cerca de 0 0 de 1 es posible aplicar el teorema del limite central y utilizar la teona de la distribucion normal para obtener los intervalos de conshyfianza EI error estandar de la estimacion se calcula mediante la siguiente formula

dado que como regIa se desconocen las proporciones de Ia poblacion Un intervashy10 de confianza de 100(1 - a) por ciento para PI P2 se obtiene as

(661)

Es posible interpretar este intervalo desde elpunto de vista probabiHstico y practico

EJERCICIOS 179

EJEMPLO 661

Borst et al (A-16) investigaron la relaci6n de desarrollo del ego edad sexo y diagshyn6stico de suicidio entre los internos adolescentes de la unidad de psiquiatria La muestra consistia en 96 varones y 123 niiias con edades entre 12 y 16 aiios seleccioshynados de entre los internados en la unidad de adolescentes y niiios de un hospital psiquiatrico privado Se reportaron 18 niiios y 60 niiias con intento de suicidio Cons ishyderese el comportamiento de las niiias como el de una muestra aleatoria simple a partir de una poblaci6n similar de niiias y que los j6venes igualmente pueden considerarse como una muestra aleatoria simple extraida de una poblaci6n similar de niiios Para estas dos poblaciones se pretende construir un intervalo de confianshyza de 99 por ciento para la diferencia entre las proporciones de los individuos con intento de suicidio

Soluci6n Las proporciones para las niiias y niiios respectivamente son Pc = 601 123 = A878y PB = 1896 1875 La diferencia entre las proporciones de lasmuestrases Pc PB = 4878 1875 = 3003 El error estandar estimado de la diferenda entre las proporciones de las muestras es

(4878)(5122) (1875)(8125) ---~~-~ +-------shy

123 96

El factor de confiabilidad a partir de la tabla D es 258 de modo que el intervalo de confianza con la f6rmula 661 es

3003 plusmn 258(0602) 14504556

Se dene la confianza de 99 por dento de que para las poblaciones muestteadas la ptopord6n de intentos de suiddio entre las niiias exceshyde a lapropord6n de intentosde suiddio entre los varones por 1450 y 4556

Puesto que el intervalo no incluye al cero se concluye que las dos proporciones de pobladones son diferentes bull

FJERCICIOS

Para cada uno de los siguientes ejercicios establezca las interpretaciones pnicticas y probabishylisticas de los intervalos que se pide construir Identifique cada componente del intervalo la estimaci6n puntual el coeficiente de confiabilidad y el error estandar Explique por que los coeficientes de confiabilidad no son el mismo para todos los ejercicios

661 Hargers et al (A-17) del departamento de Salud PUblica y Ambieptal en Amsterdam condushyjeron un estudio en el que los individuos eran consumidores de drogasinyectables (CDI) En una muestrade 194 consumidores de metadona regular de largo plazo (MLP) 145 eran varones En una muestra de 189 CDIque no consmiddotumian MLP 133 eran varones Establezca las consideraciones necesarias acerca de las muestras ypoblaciones representadas y construshy

180 CAPITULO 6 ESTlMACI6N

ya un intervalo de confianza de 95 por ciemo para la diferenda entre las proporciones de varones en las dos poblaciones

662 Una investigaci6n de Lane et ai (A-I8) valor6las diferencias en las pnicticas de deteccion de cancer de seno entre muestras de mujeres predominantemente de bajos ingresos con edashydes de 50 a 75 anos que lltilizan los servicios de c1inicas de sailld para todo el estado y mlljeres de la misma edad residentes en ciudades donde las c1inicas de salud son locales De las 404 encuestadas seleccionadas en toda la comunidad 592 por ciento estuvo de acuerdo con el siguiente comentario acerca del cancer de pecho las mujeres prolongan su vida si detectan el cancer desde el inicio De entre 795 usuarias de clinicas de salud en la mllestra 449 por ciento estuvo de acuerdo Establezca las suposiciones apropiadas para elaborar un intervalo de confianzade 99 por ciento para la diferencia entre las dos proporciones de las poblaciones de interes

663 Williams et at (A-19) encuestaron a una muestra de 67 medicos y 133 enfermeras con famishyliares farmacodependientes EI prop6sito del estudio era evaluar la influencia en los medishyEOS y enfermeras de estar estrechamente involucrados con una 0 mas personas farmaco dependientes Cincuenta y dos medicos y 89 enfermeras dijeron que vivian con personas farmacoldependientes que adversamente afectaban 8U trabajo E8tablezca todas las consideshyraciones que crea necesarias para construir un intervalo de confianza de 95 por ciento para la diferencia entre las proporciones en las dos poblaciones de trabajadores que se espera esten adversamente afectados por vivir con personas farmacodependientes

664 Aronow y Kronzon (A-20) identificaron los factores de riesgo coronado entre hombres y mujeres en una dinica de cuidados de la salud a largo plazo De los 215 individuos negros 58 tienen diabetes mellitus al igual que 217 individuos blancos de 1140 Elabore un intervalo de confianza de 90 por ciento de confianzapara la diferencia entre las proporciones de las dos poblaciones tCuaies son las poblaciones correspondientes ~Que consideraciones son necesarias para hacer valido el procedimiento de inferencia

67 DETEHMINAUON DEL TAMANO DE LA MUESTRA PARA LA ESTIMACIONDEIAS MEDIAS

La pregunta de que tan grande debe ser una muestra surge inmediatamente al inicio del planteamiento de cualquier encuesta 0 experimento Esta es una pregunshyta importante y no se debe tratara la ligera Tomar una muestra mas grande de 10 necesario para obtener los resultados deseados es un desperdicio de recursos mienshytras que por otro lado las muestras demasiado pequenas con frecuencia dan resulshytados que carecen de uso practico En esta secci6n se estudia c6mo determinar el tamano de la muestra de acuerdo con la situaci6n A continuaci6n se proporciona un metodo para determinar el tamano de la muestra que se requiere para estimar Ia media de la poblaci6n yen la siguiente secci6n se aplica este metodo para detershyminar el tamano de la milestra cuando se desea estimar la proporci6n de una poshyblaci6n Mediante extensiltmes directas de estos metodos es posible determinar el tamano necesario de las muestras para situaciones mas complicadas

Objetivos El objetivo de la estimaci6n porintervalos es el de obtener intervalos estrechos con alta confiabilidad Si se observan los componentes ~e un intervalo de confianzase veque 8U dimension esta determinada por la magnitud de la cantidad

(coeficiente de confiabilidad) x (error estandar)

131 67 DETERMINACION DEL TAMANO PARA LA l-IUESTRAmiddot

ya que lamagnitud total del intervalo de confIanza es eldoble de esta cantidad Se aprendi6 que a esta cantidad generalmente se Ie llama precisi6n de la estimaci6n o margen de error Para un error estandar dado incrementar la confIabilidad signishyfIca un coefIciente con mayor confIabilidad Y un coefIciente con mayor confIabilidad produce unintervalo mas amplio

Por otra parte si se ftia el coefIciente de confIabilidad la unica manera de redudr la amplitud del intervalo es la reducci6n del error estandar Dado que el error estandar es igual a (J IJ y como (J es una constante la unica forma de obtener un error estandar menor es tomar una muestra grande ~Que tan grande debeser la muestra Esto depende del tamafio de (J la desviad6n estandar de la poblaci6n asi como del grado de confIabilidad y dimensi6n del intervalo deseados

Suponga que se desea obtener un intervalo que se extienda d unidades hacia uno y otro lado del estimador Ellose enuncia

d (coefIciente de confIabilidad) X (error estandar) (671)

Si el muestreo es con reemplazos a partir de una poblaci6n infInita 0 de una que sea 10 sufIcientemente grande como para ignorar la correcci6n por poblaci6n fInita la ecuaci6n 671 se transforma en

(J

d z- (672)-r la cual cuando se despeja n nos da

(673)d2

Cuando el nmestreo se hacesin reemplazos a partir de una poblaci6n fInita y peshyquefia se requiere de la correcci6n por poblaci6n fInita y la ecuaci6n 671 se transforma en

(J~d (674)fN~

que al despejar n resulta en

n-----shy (675)d 2(N 1) + Z2(J2

Si puede omitirse la correcci6n por poblad6n fInita la ecuaci6n 675 se reshyduce a la ecuaci6n 673

Estillluci6n de (J 2 Las f6rmulas para el tamafio de la muestra requieren del conocimiento de (J2 pero como ya se ha sefialado la varian cia de la poblaci6n casi

132 CAPITULO 6 ESTlMACION

siempre sedesconoce Como resultado esnecesarioestimar (J2 Las fuentes de estishymaci6n de(J2 que se utilizan con mas frecuencia son las siguientes

1 Se extrae una muestrapilato 0 prel~l11inar de lapoblaci6n y se puede utilizar la variancia calculada a partir de esta muestra como unaestimaci6n de (J2 Las observaciones uti lizadas en la muestra piloto se toman como parte de la muesshytrafinal de modo que n (el tamaiio calculado de la muestra) n

1 (el tamaiio

de la muestra piloto) n2 (el numero de observaciones necesarias para satisfacer el requerimiento total del tamaiio de la muestra)

2 A partir de estudios anteriores osimilares es posible obtener estimaciones de (J2

3Si se cree que la poblaci6n de lacual se extrae la muestraposee una distribushyci6n aproximadamente nqrmal se puede aprovechar el hecho de que la amshyplitud es aproximadamente igual a 6 desviaciones estandar y calcular (J R6 Este metodo requiere aIglin conocimiento acerca de los valores minimo y maximo de la variable en la poblaci6n

EJEMPLO 671

Un nutri6logo del departamento de salud al efectuar una encuesta entre una poshyblacien de muchachas adolescentes con e1 fin de determinitr su ingesti6n diaria promedio de proteinas (medidas en gramos) busc6 el consejo de un bioestadistico con respecto al tamaiio de la muestra que deberfa tomar

~Que procedimiento debe seguir el bioestadistico para asesorar al nutri610go Antes de que el estadistico pueda ayudar el nutri6logo este debe proporcionar tres elementos de informaci6n h dimensi6n deseada del intervalo de confianza el nivel de confianza deseado y la magnitud de la variancia de la poblaci6n

Soludon Suponga que el nutri6logo requiere un intervalo con una dimensi6n de aprQximadamente 10 gramos es decir la estimaci6n se deberfa enconshytrar alrededor de 5 gramos de la media de la poblaci6n en ambas direcshyciones En otras palabras se desea un margen de error de 5 gramos Suponga que se decide por un coeficiente de confian7a de 95 y que con base en su experiencia previa el nutri6logo percibe que la desviaci6n estandar de la poblaci6n es probablemente de alrededor de 20 gramos EI estadfstico dispone ya de la informaci6n necesaria para calcular el tamaiio de la muestra z 196 (J = 20 y d 5 Suponga que el tamaiio de la poblaci6n es grande asf queel estadistico puede ignorar la correcshyci6n por poblaci6n finita y utilizar la ecuaci6n 673 Con las sustitucioshynes adecuadas el valor de n se calcula como

Se recomienda que el nutri610go tome una muestra de tamafio 62 AI calcular el tamaiio de una muestra a partir de las ecuaciones 673 0 675 el resultado se redondea al siguiente nurnero entero mayor si los calculosdan un numerocon decimales bull

183 68 DETERMINACION DEL TAl1ANO PARA LAS PROPORCIONES

EJERCICIOS

671 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su hospital Si se desea un intervalo de confianza de 99 por dento con una amplitud de 1 libra ~que tan grande debe ser la muestra de los registros de nacimiento Suponga que un estimashy

dor razonable para (J es 1 libra ~De que tamano debe ser la muestra si el coeficiente de confiabilidad se hace descender a 95

672 El director de la secdon de control dela rabia del departamento de salud publica desea extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso del ano anterior para estimar la edad media de las personas mordidas Requiere un intervalo de confianza de 95 por dento decide utilizar un valor de 25 para d y a partir de estudios anteriores estima que la desviacion estandar de la poblacion esta alrededor de los 15 anos ~Que tan grande debe ser el tamano de la muestra

673 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mglOO ml) de pacientes atendidos en una clinica para diabeticos durante el transcurso de los ultimos 10 anos Determine el numero de registros que el medico debe examinar para obtener un intershyvalo de confianza de 90 por ciento para 11 si la dimension requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varian cia de 60

674 Se deseaestimar la edad media en la que a los padentes de esclerosis multiple se les diagnosshytico el padecimiento por primera vez Se requiere un intervalo de confianza de 95 por dento con una dimension de 10 anos Si la variancia de la poblaci6n es de 90 ~que tan grande debera ser la muestra

68 DETERMINACION DELTAMANO DE lA MUESTRA PARA lA ESIDIACION DE lAS PROPORCIONES

EI metodo para estimar el tamafio de la muestra cuando se requiere estimar la proshyporcion de una poblacion es esencialmente el mismo que se describio para estimar la media de una poblacion Se aprovecha el hecho de que la mitad del intervalo deseashydo d se puede igualar al producto del coeficiente de confiabilidad y el error estandar

Si se supone que el muestreo ha sido hecho de manera aleatoria y que existen condiciones que garanticen que la distribuci6n de psea aproximadamente normal se obtiene la siguiente formula para n cuando el muestreo es con reemplazo cuanshydo se realizaa partir de una poblacion infinita 0 ruando la poblacion muestreada es 10 suficientemente grande como para hacer innecesario el uso de la correcci6n por poblacion finita

n (681)

dondeq = I-p Si la correccion por poblacion finita no puede descartarse la formula adecuashy

da paran es

(682)n d 2 (N -1)+z2pq

euan do N es grande en comparacion con n (es decir n IN 05) se puede pasar por alto la correccion por poblacion finita y la ecuacion 682 se reduce a la ecuacion 681

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

156 CAPITULO 6 ESTIMACION

Componentes para la estimaciOn del intervalo Examine la composishycion para la estimacion del intervalo elaborada en el ejemplo 621 Este contiene en su centro la estimacion puntual para 11 Se identifica a 2 como un valor de la distribucion normal estandar que indica a cuantos errores estandar estan aproxishymadamente 95 por ciento de los valores posibles de x Este valor de Z se conoce como coeficiente de confiabilidad EI ultimo componente (ix es el error estandar 0

desviacion estandar de la distribucion muestral de x En general una estimacion por intervalos se expresa como sigue

estimador plusmn (coeficiente de confiabilidad) x (error estandar) (621)

En particular cuando el muestreo se realiza a partir de una distribucion norshymal con variancia conocida una estimacion por intervalos para Jl se expresa como

donde z(l_lt12) es el valor de Z a la izquierda de donde esta 1 rtJ2 y ala derecha en que se encuentra rtJ2 del area bajo la curva

Interpretacion del intervalo de conftarua ~Como se interpreta el intershyvalo de la ecuacion 622 En este ejemplo donde el coeficiente de confiabilidad es igual a 2 se dice que al repetirel muestreo aproximadamente 95 por ciento de los intervalos construidos mediantela formula 622 induyen la media de la poblacion Esta interpretacion se basa en la probabilidad de ocurrencia de diferentes valores de x Es posible generalizar esta interpretacion si se designael area total blttio la curva de x que queda fuera del intervalo Jl plusmn 2(ix como ex y eIarea dentro del intervalo como 1 - ex y dar la siguiente interpretaciOn probabilistica de la formula 622

Interpretaci6n probabilistica

En el muestreo repetido de una poblaci6n condistribuci6n normal y desviaci6n estdndafmiddot conocida 100(1- a) por ciento de todos los intervalos de la forma Xplusmn Z(I_amOx incluyen a la larga la media de la poblaci6n 11

Ala cantidad 1 - (X en este caso 95se Ie conoce como eoeficiente (0 nivel) de conjianza y al intervalo XplusmnZ(1_12)(ix se Ie conoce comointervalo de conjianza para Jl Cuando (1 ex) =95 al intervalo se Ie llama intervalo de confianza de 95 por ciento para Jl En este ejemplo se dice que existe 95 por ciento de confianza d~ que la media de Ia poblacion este entre 1776 y 2624 A esto se Ie llama interpretacion practica de la formula 622 En general se puede expresar de la siguiente manera

Interpretaci6n practica

Cuando se hace un muestreo a partir de poblaciones que siguen una distribuci6n normal y con desviaci6n estdndar conocida existe un 100(1 - a) por ciento de confianza de que el intervalo calculado xplusmn z(l_aI2)Ox contiene la media de la poblaci6n Jl

62 INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACION 157

En el ejemplo 621 es preferible en lugar de 2un valor mas exacto para z 196 que corresponde al coeficiente de confianza de95 Los investigadores pueshyden utilizar cualquier coeficiente de confianza los mas utilizados son 90 95 Y 99 a los cuales se asocian factores de confiabilidad de 1645 196 Y 258 respectivashymente

Precision A la cantidad que se obtiene al multiplicar el factor de confiabilidad por el error estandar de la media se Ie llama precision de la estimaci6n Tambien se Ie llama margen de error

EJEMPLO 622

Un fisioterapeuta desea estimar con 99 por ciento de confianza la media de fuerza maxima de un musculo particular en cierto grupo de individuos Se inc1ina a suposhyner que los valores de dicha fuerza muestran una distribucion aproximadamente normal con una variancia de 144 Una muestra de 15 individuos que participaron en el experimento presento una media de 843

Soluci6n En latabla D el valor para z que corresponde a un coeficiente de conshyfianza de 99 es 258 Este es el coeficiente de confiabilidad El error estandar es de ax 12fl5 =30984 Por 10 tanto el intervalo de conshyfianza de 99 por ciento para ~ es

843 plusmn258(30984) 843 plusmn 80 763923

Se dice que se tiene 99 por ciento de confianza de que la media de la poblacion este entre 763 y 923 porque al repetirel muestreo 99 por ciento de todos los intervalos que pueden construirse en la forma descrishyta inc1uyen a la media de la poblacion bull

Situaciones en las que la variable de interes sigue una distribucion aproximadashymentenormal con una variancia conocida son muy raras y casi nunca se presentan en la practica El prop6sito de los ejemplos anteriores en los que se supone que existe esta condici6n ideal fue el de formar las bases teoricas para construir intershyvalos de confianza para las medias de la poblacion En la mayorf de los casos practicos las variables no siguen una distribuci6n aproximadamente normal 0 no se conocen las variancias de la poblaci6n 0 suceden ambas cosas En el ejemplo 623 y en la secci6n 63 se explican los procedimientos que se utilizan en situaciones menos ideales pero mas comunes

Muestreo a partir de pobluciunes que no presenlan una distribucion normal No siempre es posible 0 prudente suponer que la poblaci6n de interes muesshytra una distribuci6n normal Gracias al teOlema del limite central esto no sera un problema si se puede seleccionar una muestra 10 suficientemente grande Se ha dicho que para muestras grandes la distribucion muestral de Xi presenta una distribuci6n aproximadamente normal sin importar como esta distribuida la poblacion original

158 CAPiTULO 6 ESTIMACION

EJEMPLO 623

Un equipo de investigadores esta interesado en la puntualidad de los pacientes en las citas concertadas En un estudio de flqjo depacientes en los consultorios de medicos generales se encontr6 que una muestra de 35 pacientes llegaba 172 minutos tarde a las citas en promedio Una investigaci6n previa habia demostrado que la desviaci6n estandar era de 8 minutos aproximadamente Se tuvo la sensaci6n de que la distribushyci6n de la poblaci6n no era normal ~Cual es el intervalo de confianza de 90 por ciento para 11 que es el promedio real de impuntualidad en las citas

Soluci6n Dado que el tamafio de la muestra es bastante grande (mayor que 30) y se conoce la desviaci6n estandar de la poblaci6n la situaci6n se aproxishyrna al teorema del limite central y se supone que la distribuci6n muestral de xpresenta una distribud6n aproximadamente normal AI consultar la tabla D se encuentra que el coeficiente de confiabilidad que corresponshyde a uri coeficiente de confianza de 90se aproxima a 1645 si se interpola El error estandar es de C5z 8-35 13522 de modo que el intervalo de confianza de 90 por ciento para 11 es

172 plusmn 1645(13522) 172 plusmn 22 150 194 bull

Con frecuencia cuando la muestra es 10 suficientemente grande para aplicar el teorema dellfmite central la variancia de la poblacion se desconoce En ese caso se sustituye esta variancia conla de la muestra en la f6rmula para construir el intervashy10 de confianza para la media de la poblacion

Andlisispor computadora Cuando se requiere de los intervalos de confianza se economiza una buena cantidad de tiempo mediante el uso de una computadora la cual puede ser programada para construir los intervalos de datos no procesados

EJEMPLO 624

Los siguientes datos corresponden a los valores de la actividad (micromoles por minuto por gramo de tejido) de cierta enzima medida en el tejido gastrico normal de 35 pacientes con carcinoma gastrico

60 1189 614 788 273 2464 571 1827 537 374 449 262 448 971

372 898 411 348 1925 550 622

610 319 406 413 767 385 674

521 603 533 662 1177 307 1499

Mediante el uso del paquete de software para computadora MINITAB se pretenshyde construirun intervalo de confianza de 95 por ciento para la media de la poblashycion Suponga que la variancia de la poblaci6n es iguala 36 No es necesario suponer que la poblaci6n muestreada de val ores sigue una distribuci6n normal porque el tamafio de la muestra es losuficientemente grande para aplicar el teoreshyrna del limite central

159 62 INTERV ALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACION

Caja de dialogo Comandos de la sesi6n

Statgt Basic Statisticsgt 1-Sample z MTB gt ZINTERVAl 95 6 C1

Teclear Cl en Variables Se1ecdonar Confidence interval y teclear 95 en la caja de texto Teclear6 en Sigma Clic OK

Resultados

Confidence Intervals

The assumed sigma = 0600

Variable MicMoles

N 35

Mean 0718

StDev 0511

SE Mean 0101

950 Cr (0519 0917)

FIGURA 622 Procedimiento del paquete MINITAB para construir un intrevalo de conshyfianza de 95 por ciento para la media de la poblacion ejemplo 624

Solucion Se introducen los datos en lacolumna 1 y se procede como se muestra en la figura 622 Estas instrucdones indican a la computadora que e1 factor de confiabilidad es z que se necesita unintervalo de conshyfianza de 95 por dento que la desviaci6n estandarde la poblaci6n es de 6 y que los datos estan en la columna 1 El resultado indica que la media de la muestra es 718 la desviad6n estandar es 511 y e1 error estandar de la media af es 6J35 101

Se tiene 95 pordento middotde confianza de que la media de la poblashyci6n se encuentra entre 519y 917 bull

Puede obtenerse los intervalos de confianza a traves de otros paquetes de sofuvare Por ejemplo SASreg puede construir intervalos de confianza a traves de PROC MEANS o PROC UNIVARIATE

Otras eslimaciones de La tendencia central Tal como se ha visto la meshydia es muy sensible a los val ores extremos es dedr aquellos que se desvfan consideshyrablemente de la mayorfa de las mediciones en el con junto de datos A dichos valores se les conoce como sesgos Tambien se puede apreciar que lamediana que no es sensible a las mediciones extremas algunas veces se utiliza en lugar de la media como medida de tendenda central cuando los sesgos estan presentes Por la misshyrna raz6n quiza se prefiera el uso de la mediana de la muestra comomiddotestimador de la rnediana de la poblaci6n cuando se requiere realizar inferencias acerca de la tendenda central de la poblaci6n No solamente se utiliza la mediana de la muestra

160 CAPITULO 6 ESTlMACION

como una estimacion puntual para la mediana de la poblacion sino que tambien es posible construir un intervalo de confianza para la mediana de la poblacion En esta obra no se proporciona la formula pero esta se puede encontrar en la obra de Rice (1)

Media ajustada Los estimadores que son insensibles a los sesgos se Haman estimadores eficaces Otra medida y estimador eficaz de tendencia central es la media ajustada Para un conjunto de datos que contiene n mediciones se calcula el 1000 por ciento de la media ajustada como sigue

1 Ordenar las mediciones

2 Descartar las medici ones mas pequeiias y mas grandes que 100a por ciento de las mediciones El valor recomendado para a esta entre 1 y 2

3 Calcular la media aritmetica de las mediciones restantes

Observe que la mediana podrfa considerarse como 50 por ciento de la media ajusshytada Se debe recordar que la media ajustada para el conjunto de datos es una de las medidas descriptivas que puede calcular MINITAB

FJERCICIOS

Construya para cada uno de los siguientes ejercicios los intervalos de confianza al 90 95 Y 99 por ciento para la media de la poblacion y establezca para cada uno la interpretacion probabilistica y practica Indique cualinterpretacion puede ser mas aderuada para utilizar ruando se trata sobre intervalos de confianza con alguien que no conoce de estadfstica y establezca eI razonamientode por que se eUgi6 Explique por que los tres intervalos no tjenen la misma amplitud Indique cual de los tres intervalos es preferible como estimador de la media de la poblacion y establezca el razonamiento de la elecci6n

621 Se pretende estimar el numero promedio de latidos del coraz6n por minuto para cierta poblaci6n Se encontr6 que el numero promedio de latidos por minuto para 49 personas era de YO Considere que esos 49 pacientes constituyen una muestra aleatoria y que la poblacion sigue una distribucion normal con una desviaci6n estandar de 10

622 Se pretende estimar la concentraci6n media de bilirrubina indirecta en el suero en nmos de cuatro dias de nacidos La media para una muestra de 16 ninos es de 598 mglOO cc Conshysiderese que la concentraci6n de bilirrubina en los ninos de cuatro dfas de nacidos sigue una distribucion aproximadamente normal con una desviaci6n estandar de 35 mgIOO cc

623 En un estudio acerca de la duraci6n de la hospitalizacion dirigido por vados hospitales en cooperacion se extrajo una muestra aleatoria de 64 individuos con ulcera peptica de la lista de todos los pacientes con esa enfermedad internados alguna vez en los hospitales particishypantes Se determin6 para cada uno de eUos el tiempo de hospitalizaci6n Se encontr6 que la duraci6n media de hospitalizaci6n fue de 825 dfas y se sabe que la desviaci6n estandar de la poblaci6n es de tres dfas

624 Una muestrade 100 hombres adultos aparentemente sanos de 25 anos de edad muestra una presi6n sist61ica sangufnea media de 125 Considere que la desviaci6n estandar de la poblaci6n es de 15

161 63 DISTRIBUCI6N

625 Algunos estudios acerca de la enfermedad Alzheimer (EA)han mostrado un incremento en la producci6n de 14C0

2 en pacientes con ese padecimiento Durante un estudio se obtuvieshy

ron los siguientes valores de 14C02

a partir de 16 biopsias de neocorteza de pacientes con la enfermedad (EA)

1009 1280 1180 12551547 2352 1956 1080

1776 1767 1680 2050 1452 2857 3100 1621

Considereseque la poblaci6n sigue una distribuci6n normal con una desviaci6n estandar de 350

63 DISTRIBUCION t

En la seccion 62 se describe un procedimiento para obtener un intervalo de conshyfianza para la media de una poblaci6n EI procedimiento requiere del conodmiento de la varianda de la poblacion de la que se extrae la muestra Puede parecer un tanto extrafio que se tenga conocimiento de lavariancia de la poblacion y no se conozca elvalor de la media de la poblacion De hecho es comun en situacioshynes como las que se han presentado que se deSconozca tanto la variancia como la media de la poblacion Esta situacionpresenta un problema respecto a la construcshycion delos intervalos de confianza Por ejemplo aun cuando la estadfstica

x J1shyZ=---

crJn presenta una distribudon normal cuando la poblacion tambien tiene una distribuci6n normal y sigue una distribuci6n aproximadamente normal cuando n es muy grande independientemenle de la forma funcional de la poblacion no se puede hacer uso de este hecho porque cr se desconoce Sin embargo no todo esrn perdido y la soluci6n mas logica para este problema es utilizar la desviacion estandar de ~muestra

s = ~L(Xi - x)2(n-l)

para sustituir cr Por ejemplo cuando el tamafio de la muestra es mayor que 30 la confianza en s como una aproximacion de cr es por 10 general sustancial por 10 que se justifica la utilizacion de la teorfa de la distribudon normal para construir un intervalo de confianza para la media de la poblacion En tal caso se procede como se indica en la seccion 62

Cuando se tienen muestras pequefias es imprescindible encontrar otro proceshydimiento para construir intervalos de confianza

Como resultado del trabajo de Gosset (2) escrito bajo el seudonimo de Student se dispone de otra alternativa conocida como distribuci6n t de Student con frecuenda abreviada como distribuci6n t

La cantidad

sigue esta distribucion

162 CAPiTULO 6 ESTIMACION

Propiedades de la distribucion t La distribuci6n t tiene las siguientes proshypiedades

1 Tiene una media de O

2 Es simetrica con respecto a la media

3 En general tiene una variancia mayor que 1 pero esta tiende a I a medida que aumenta el tamaiio de la muestra Para dfgt 2 la variancia de la distribushyci6n t es dfl(df - 2) donde df representa los grados de libertad En forma alterna puesto que df n - 1 para n gt 3 se puede escribir la variancia de la distribuci6n t como (n l)(n 3)

4 La variable t va de - hasta + 00DO

5 La distribuci6n t es realmente una familia de distribuciones puesto que hay una distribuci6n diferente por cada valor de la muestra de n - 1 que es el divisor que se utiliza para ca1cular S2 Recuerde que n - 1 representa los grados de libertad En la figura 631 se muestran las distribuciones t correspondienshytes a algunos valores de los grados de libertad

6 Comparada con la distribuci6n normal ladistribuci6n t es menos espigada en el centro y tiene colas mas largas En la figura 632 se com para la distribushyci6n t con la distribuci6n normal

7 La distribuci6n t se aproxima ala distribuci6n normal a medida que n - 1 se aproxima al infinito

La distribuci6n t al igual quela distribuci6n normal estandar se ha tabulado ampliamente Una de estas tablas es la tabla E del apendice Tal como se puede apreciar se debe tomar en cuenta eLcoeficiente de confianza y los grados de libershytad cuando se utiliza la tabla de la distribuci6n t

FIGUR- 631 Distribuci6n t para diferentes grados de libertad

-----

163 63 DISTRIBUCION

__ Distribucion normal

- - - Dislribucion I

x

FIGURA 632 Comparaci6n de las distribuciones normal yt

Es posible utilizar el paquete MINITAB para graficar la distribuci6n t (para grados espedficos de libertad) y otras distribuciones Despues de asignar el eje horizontal y las siguientes direcciones en el cuadro de Set Patterned Data seleccioshyne del menu Calc y despues Probability Distributions Utilice el cuadro de diashylogo Plot para generar la grafica

Inlervalos de conJiQllia qllR uJilban fa dislribucion t El procedimien to general para construir interval os de confianza no se ve afectado por la necesidad de utilizar la distribuci6n t en lugar de la distribuci6n normal estandar Aun es necesario usar la relaci6n expresada por

estimador plusmn (coeficiente de confiabiIidad) x (error estandar)

Lo que es diferente es el origen del coeficiente de confiabilidad Este se obtiene a partir de la tabla de la distribucion t en lugar de la tabla de la distribuci6n normal estandar Para ser mas especfficos cuando se obtienen muestras a partir de una distribushycion normal cuya desviaci6n estdndi17 a se desconoce ell OO( 1 - a) por ciento del intervalo de confianza para la media de la poblaci6n J1 estd dado por

(631 )

Es importante aclarar que el requisito para el uso valido de la distribucion t es que la muestra debe ser extrafda de una poblad6n con distribucion normal Sin embarshygo la experiencia ha demostrado que se pueden tolerar desviaciones moderadas de esterequisito Como consecuencia la distribucion t se utiliza incluso cuando se sabe que la poblaci6n original se desvia de la normalidad Lltl mayorfa de los invesshytigadores requieren que al menos pueda sostenerse el supuesto de una distribushyd6n de poblacion en forma de montfculo

EJEMPLO 631

Maureen McCauley (A-I) realiz6 un estudio para evaluar los efectos de un conjunto de instrucciones de mecanica en ellugar de labores sobre el desempeno laboral de obreros jovenes recientemente contratados Se utilizaron dos grupos de individuos elegidos aleatoriamente uno de los grupos para aplicar el experimento y el otro

164 CAPITULO 6 ESTlMACI6N

como grupo de control EI grupo con el que se experimento recibio una hora de capacitacion impartida por un terapeuta ocupacional EI grupo de control no recishybio esta capacitacion Para evaluar el esfuerzo de cada obrero para levan tar bajar jalar y transportar objetos dentro del entorno laboral se utilizo una lista de cotejo para la evaluacion de trabajo mecanico que inclufa criterios de referencia Una tarea bien hecha recibio una calificacion de 1 EI grupo de control formado por 15 individuos alcanzo una calificacion media de 1153 en la evaluacion con una desshyviacion estandar de 3681 Se supone que el grupo de control se comporto como una muestra aleatoria extraida de una poblacion similar de individuos Se pretende utilizar los datos de la muestra para estimar la calificacion media para la poblacion

Soluci6n Se puede utilizar la media de la muestra 1153 como una estimacion puntualde la media de la poblacion sin embargo debido a que se descoshynoce la desviacion estandar de la poblacion se debe considerar que los valores siguen una distribucion aproximadamente normal antes de consshytruir los intervalos de confianza para l Se considera que esta suposicion es razonable y que se necesita un intervalo de confianza de ~or cienshyto el estimador es i y el error estandar es s -r 681 15 =9504 Ahora es necesario conocer el coeficiente de confiabilidad el valor de t asodado al coeficiente de confianza de 95 y a los n 1 = 14 grados de libertad Puesto que el intervalo de confianza de 95 por ciento deja 05 del area bajo la curva de t para dividirse en dos colas iguales se necesita el valor de tala derecha del cual esta el 025 del area Este valor se localiza en la tabla E enla columna encabezada por t

975 bull Este es el valor

para tala izquierda delcual esta 975 del area bajo la curva EI area a la derechade este valor es igual al 025 deseado Ahora sobre la columna de grados de libertad se localiza el numero 14 EI valor para t se encuentra en la interseccion del renglon con la etiqueta 14 y la columna con la etiqueta t975 bull Se encuentra que este valqr para t que representa al coeficiente de confiabilidad es 21448 Finalmente el intervalo de confianza de 95 por ciento se construye como sigue

1153 plusmn 21448(9504) 1153 plusmn 204 949 1357 bull

Este intervalo puede interpretarse con ambos puntos de vista probabiHstico y practico Puede asegurarse en un 95 por dento que 1a media l correcta de la poblacion se encuentra entre 949 y 1357 porque al repetir el muestreo 95 por dento de los intervalos construidos deigual manera incluyen a l

Decidir entre z r t Cuando se obtiene un intervalo de confianza para la media de una poblacion se debe decidir si se utiliza un valor de z6 de t como factor de confiabilidad Para hacer una elecci6n adecuada se debe considerar el tamafto de la muestra si la poblacion muestreada sigue una distribucion normal y si la varian cia de la poblacion es conocida La figura 633 muestra un diagrama de flujo que se puede utilizar para decidir rapidamente si el factor de confiabilidad debe ser Z 0 t

EJERCICIOS 165

EJERCICIOS

Sa aplica al leorema dellfmile central

FIGURA 633 Diagrama de flujo para deddir entre utililizar z y t cuando se hagan inferencias respecto a las medias de la poblaci6n (Para utilizar un procedimiento no parametrico vease el capitulo 13)

Analisis par computadara Si el proposito es construir un intervalo de conshyfianza con el programa MINITAB para la media de la poblacion cuando el estadfsshytico t es el factor de confiabilidad adecuado el comando se inicia con la palabra TINTERVAL Seleccione en Windows I-Sample t desde el menu de Basic Statistics

631 Utilice la distribud6n t para encontrar el factor de confiabilidad para el intervalo de confianshyza basado en los siguientes coeficientes de confianza y tamafiosde las muestras

a b c d

Coefidente de confianza 95 99 90 95 Tamafio de la muestra 15 24 8 30

632 En una investigacion acerca de la dependencia del flujo y volumen de todo el sistema respishyratorio en un grupo de pacientes con enfermedad obstructiva pulmonar cronica conectados a respiradores artificiales Tantucci et ai (A-2) registraron los siguientes valores de linea de

166 CAPITULO 6 ESTIMACION

base del flUjD continuo inspiratDriD (Us) 90 97 103110 104 100 CDnsidere que una muestra aleatDria simple esta cDnfDrmada pDr seis individuDs a partir de una pDblacion que sigue una distribuci6n nDrmal CDn individuDs CDn la misma enfermedad

a) ~Cuat es la estimaci6n puntual de la media de la pDblaci6n

b) ~Cuil es la desviacion estandar de la muestra

c) ~Cultll es la estimacion del error estandar para la media de la muestra

d) CDnstruya un intervalD de cDnfianza de 95 pDr ciento para el flUjD mediD cDntinuD inspishyratDriD de la pDblaci6n

e) ~Cual es la precision de la estimacion

f) Explique la interpretaci6n prDbabilistica para este intervalD de confianza

g) Explique la interpretacion practica para este intervalD de cDnfianza

633 LlDyd y MaillDux (A-3) informaron IDS siguientes datDs acerca del peso de la glandula pituitaria en una muestra de cuatrD ratas de Wistar Furth

media = 90 mg error estandar para la media = 3

FUEJTE Ricardo V Lloyd y Joe Mailloux Analysis ofSshy100 Protein Positive Folliculo Stellate Cells in Rat Pituitary Tissues AmericanJournal ofPathology 133 338-346

a) ~Cual es la desviadon estandar de la muestra

b) CDnstruya un intervalD de confianza de 95 pDr ciento para el peso medio de la glandula pituitaria para una pDblacion similar de ratas

c) ~Que supDsiciDnes se necesitan para que sea validD el intervalo de cDnfianza del inciso b

d) ~Que interpretacion puede ser la mas indicada cuandD se trata sDbre intervalos de conshyfianzacon alguien que no sabe de estadfstica Explique pDrque es la mas cDnveniente

e) 5i fuera necesario elabDrar un intervalD de cDnfianza de 90 pDr cientD para la media de la pDblaci6n ~el intervalD de cDnfianza serta mayDr 0 menor que el intervalD de 95 pDr dentD Explique su respuesta sin construir realmente el intervalD de cDnfianza

f) 5i [uera necesariD considerar un intervalo de CDnfianza de 99 pDr cientDpara lamedia de la poblacion ~el intervalo de cDnfianza serra mayDr 0 menDr que el intervalD de 95 pDr dentD Explique su respuesta sin cDnstruir realmentt el intervalD de cDnfianza

634 Kaminski y Rechberger (A-4) encontrarDn en un estudio sDbre la preeclampsia que la media de la presi6n sistolica sangufnea en 10 mujeres sanas y que no estan embarazadas es de 119 CDn una desviacion estandar de 21

a) 2Cual es el errDr estandar estimadD para la media

b) CDnstruya un intervalD de confianza de 99 pDr cientD para la media de la poblaci6n a partir de la cual puede considerarse que IDS 10 individuos conforman una muestra aleatoria

c) ~CUlil es la precisi6n estimada

d) ~Que consideraciones deben hacerse para comprobar la validez del intervalo de confiahza

635 Unamuestra de 16nifias de 10 afiDS pesan en promediD 715 con una desviacion estandar de 12libras CDnsidere el calculD de intervalDs de cDnfianza de 9095 y 99 pDr ciento para I-L

167 64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS

636 Una muestra aleatoria simple conformada por 16 individuos aparentemente sanos presenta los siguientes valores de arsenico eliminado en la orina (miligramos por dfa)

Individuo Valor Individuo Valor

1 007 9 012 2 030 10 006 3 025 11 010 4 008 12 032 5 030 13 006 6 038 14 009 7 007 15 014 8 005 16 011

Elabore un intervalo de confianza de 95 por ciento para la media de la poblaci6n

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES

En ocasiones se presentan casos en los que se desea estimar 1a diferencia entre 1a media de dos poblaciones A partir de cada poblacion se extrae una muestra aleatoria independiente y de los datos de cada una se calculan las medias muestrales XI y x2

respectivamente En el capitulo anterior se dijo que el estimador XI - x2 ofrece una estimacion insesgada de la diferencia entre las medias de las poblaciones III shy11 2 bull La variancia del estimador es (cr~ n l ) + (cr~ n 2 ) Tambien se menciono que seglin las condiciones la distribucion muestral de XI - x2 puede presentar una distribution al menos aproximadamente normal de modo que en muchos casos se utiliza la teorfa adecuada para las distribuciones normales en el calculo de un intershyvalo de confianza para III - 11 2 bull Cuando se conocen las variancias de la poblacion el intervalo de confianza del 100(1 - ex) por ciento para III - 112 esta dado por

(641)

El anal isis del intervalo de confianza para la diferencia entre las medias poblacionales ofrece informacion util para decidir si es 0 no probable que las medias de las dos poblaciones sean iguales Cuando el intervalo no incluye al cero se dice que el intervalo ofrece evidencia de que las dos poblaciones tienen medias diferentes Cuando el intervalo incluye al cero se dice que las poblaciones pueden tener meshydias iguales

Esto se ilustra a continuacion para el caso donde el muestreo se realiza a partir de una distribucion normal

168 CAPITULO 6 ESTlMACI6N

EJEMPLO 641

A un equipo de investigacion Ie interesa conocer la diferencia entre las concentracioshynes de acido urico en pacientes con y sin el sfndrome de Down En un gran hospital para el tratamiento de pacientes con retardo mental una muestra de 12 individuos con el sindrome presenta una media de XI = 45 mgll00 mL En un hospital general se encontro que una muestra de 15 individuos normales de la misma edad y sexo presenta un nivel medio de x2= 34 Si es razonable suponer que las dos poblaciones de valores muestran una distribucion normal y sus variancias son iguales a 1 y 15 calcule el intervalo de confianza de 95 por ciento para ~l - ~2

Soluci6n Para una estimacion puntual de III 112 se udliza Xl X2= 45 34 11 EI coeficiente de confiabilidad que corresponde a 95 localizado en la tabla D es 196 EI error estandar es

Por 10 tanto el intervalo de confianza de 95 por ciento es

11 plusmn 196(4282) 11plusmn84 26 194

Se dice que se dene una confianza de 95 por ciento de que la difeshyrencia real 111 - 112 este entre 26 y 194 porque en muestreos repetidos 95 por ciento de los intervalos construidos de esa manera incluiria la diferencia entre las medias reales

Puesto que el intervalo no incluye al cero se concluye que las dos poblaciones tienen diferentes medias bull

Muestreo a partir de poblaciones que no signen una distribuci6n ItOrmal La construccion de un intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando el muestreo se realiza a partir de poblaciones no normales se lleva a cabo en la forma descrita en el ejemplo 641 si las muestras n l y n

2 son grandes Una vez mas este es un resultado del teorema del limite central

Si se desconocen las variancias de la poblacion se utili zan las variancias de las muestras para estimarlas

IUEMPLO 642

Motivados por d conocimiento de la existencia de una gran cantidad de textos polemicos que sugieren que el estres la ansiedad y la depresion son dafiinos para el sistema inmunologico Gormanet ai (4-5) condujeron un estudio en el que se conshysider6 a individuos varoneshomosexuales algunos con VIH (virus de inmunodefishyciencia humana) positivo y otros con VIH negativo Los datos fueron registrados con una amplia vltJriedad de mediciones medicas inmunologicas psiquiatricas y neurol6gicas una de las cuales corresponde al numero de celulas CD4+ en la sanshy

64 INTERV ALO DE CONFIANZA PAHALA DIFERENCIA ENTRE DOS MEDIAS 169

gre El numero promedio de celulas CD4+ para middot112 individuos con infecci6n por VIR fue de 4018 con una desviaci6n estandar de 2264 Para los 75 individuos sin la infecci6n por VIR la media y la desviaci6n estandar fueron de 8282 y 2749 respectivamente Se pretende elaborar un intervalo de confianza de 99 por ciento para la diferencia de las medias de las poblaciones

Soluci6n No hay informaci6n con respecto a la forma de la distribuci6n de las celulas CD4+ Sin embargo como el tamafto de las muestras es grande el teorema del limite central asegura que la distribuci6n muestral de las diferencias entre las medias de la muestra siguen una distribuci6n aproxishymadamente normal independientemente de que la distribuci6n de la variable en las poblaciones no siga una distribuci6n normal Se puede utilizar este hecho para justificar el uso de la estadistica z como factor de confiabilidad en la construcci6n del intervalo de confianza Tampoco hay informaci6n acerca de las desviaciones estandar por 10 que puede emplearse las desviaciones estandar de las muestras para estimarlas La estimaci6n puntual para la diferencia entre las medias de las poblacioshynes es la diferencia entre las medias de las muestras 8282 - 4018 = 4264 En la tabla D se encuentra que el factor de confiabilidad es 258 La estimaci6n del error estandar es

s __ = 27492

+ 22642 =382786

Xl-X 75 112

Por la ecuaci6n 641 el intervalo de confianza de 99 por ciento para la diferencia entre las medias de la poblaci6n es

4264 plusmn 258(382786) 3276 5252

Se tiene la seguridad de 99 por ciento de que el promedio de celulas CD4+ en varones con VIR positivo difieren de la media para los varoshynes con VIR negativo por 3276 a 5252 bull

Distribuci6n t y la diferencia entre las medias Cuando no se conocen las variancias y se pretende estimar la diferencia entre las medias de dos poblacioshynes con un intervalo de confianza es posible utilizar la distribuci6n t para suminisshytrar el factor de confiabilidad si se conocen ciertas suposiciones se debe saber 0

suponer de buena fe que las dos poblaciones muestreadas siguen una distribuci6n normal Respecto a las variancias de las poblaciones se debe distinguir entre dos situaciones 1) la situaci6n en la que las variancias son iguales y 2) la situaci6n en la que no 10 son A continuaci6n se consideranambas sitpaciones por separado

Varianciaspoblacifmales iguales Si la suposici6n sobre igualdad de las variancias de las poblaciones esta justificada las dos variancias de las muestras calculadas a partir de las muestras independientes pueden considerarse como estishymaciones de 10 mismo es decir la variancia comun Parece 16gico entonces aproshyvechar este hecho en el anal isis en cuesti6n Esto es precisamente 10 que se hace para establecer una estimaci6n conjunta para la variancia comun Esta variancia se obtiene mediante el caIculo promedio ponderado de las dos variancias de las muesshy

170 CAPITULO 6 ESTlMACI6N

tras Cada variancia de la muestra es ponderada con base en sus grados de libertad Si los tamafios de las muestras son iguales este promedio ponderado es la media aritmetica de las variancias de las dos muestras Si el tamano de las dos muestras es distinto el promedio ponderado aprovecha la informacion adicional proporcionada por la muestra mayor La estimacion con junta se obtiene con la fOrmula

S2 = (nl _1)SI2 + (n2 l)s~ p (642)

+n2 -2nl

Asf la estimacion del error estandar esta dada por

(643)

y el intervalo de confianza de 100(1 a) por ciento para III 112 esta dada por

(644)

El nfunero de grados de libertad utilizado para determinar el valor de t que se usa para construir el intervalo es n

1 + n

2 2 que es el denominador de la ecuacion

642 Este intervalo se interpreta en la forma habitual Los metodos que pueden emplearse para tomar la decision acerca de la igualshy

dad de las variancias de las poblaciones se estudian en la seccion 610 y 78

EJEMPLO 643

Uno de los estudios de Stone et al (A-6) tuvo como objetivo determinar los efectos del ejercicio por un tiempo prolongado en los ejecutivos de una compania inscritos en un programa supervisado de acondicionamiento fisico Se registraron datos de 13 individuos (el grupo deportista) que voluntariamente se inscribieron el programa y que permanecieron activos por 13 anos en promedio y de 17 individuos (el segunshydo grupo el sedentario) que decidieron no inscribirse Entre los datos que se regisshytraron acerca de los individuos esta el mlmero maximo de sentadillas realizadas en 30 segundos El grupo deportista obtuvo una media y una desviacion estandar de 210 y 49 respectivamente La media y la desviacion estandar para el grupo sedenshytario fueron 121 y 56 respectivamente Se considera que las dos poblaciones de medici ones de acondicionamiento muscular siguen una distribuci6n aproxirnadashymente normal y que las variancias para ambas poblacionesson iguales Se pretenshyde elaborar un intervalo de confianza de 95 por ciento para Ja diferencia entre las medias de as poblaciones representadas por las dos muestras Soluci6n Primero se utiliza la ecuaci6n 642 para calcular la estimaci6n conjunta

de la variancia comtin de las poblaciones

(13-1)(49 2 )+(17 1)(562 ) =2821

13+17-2 Cuando se consulta la tabla E con 13 + 17 - 2= 28 grados de libertad y el nivel de confianza de 95 se encuentra que eLfactor de confiabilidad es 20484 Con la ecuacion 644 se calcula el intervalo de confianza de

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS 171

95 por ciento para la diferencia entre las medias de las poblaciones de la siguiente manera

2821 2821(210-121)plusmn20484 --+-shy

13 17 89 plusmn 40085

49129

Se tiene una confianza de 95 por ciento de que la diferencia entre las medias de las poblaciones estan entre 49 y 129 Se puede decir esto porque se sabe quesi se repite el amilisis muchfsimas veces y se calculan los intervalos de confianza de la misma manera cerca de 95 por ciento de los intervalos de confianza induiran la diferencia entre las medias de las poblaciones

Debido a que los intervalos no induyen al cerose conduye que las medias de las poblaciones son diferentes bull

Variancias poblacionales distintas Cuando no se puede conduir que las variancias de dos poblaciones de interes son iguales aun ruando pueda suponerse que las dos poblaciones presentan distribuciones normales no es adecuado utilizar la distribucion t como se acaba de describir para construir los intervalos de confianza

Una solucion al problema de variancias distintas fue propuesta por Behrens (3) y posteriormente fue verificada y generalizada por Fisher (4 5) Neyman (6) Scheffe (7 8) Y Welch (9 10) tambien proponen soluciones EI problema es analizashydo en detalle por Cochran (11)

EI problema gira en tomo al hecho de que la cantidad

no sigue una distribuci6n t con nj + n 2 grados de libertad ruando las variancias 2 shy

de las poblaciones son distintas Consecuentemente la distribucion t no se puede utilizar en la forma habitual pata obtener el factor de confiabilidad del intervalo de confianza para la diferencia entre las medias de dos poblaciones que tienen variancias diferentes La solucion propuesta por Cochran consiste en el calculo del factor de confiabilidad mediante la siguiente formula

wltj + w2tZ t l

f

-0f2 = (645) WI +w2

donde WI 512

np W 2 = s~ n2 tl = tl _ para nj - 1 grados de libertad y t2 = t l

_w2aI2

para n2

- 1 grados de libertad Un intervalo aproximado de confianza del 100(1 shya) por ciento para III - 112 esta dado por

(646)

172

EJERCICIOS

CAPITULO 6 ESTlMACION

FJEIUPLO 644

En la investigacion de Stone et al (A-6) descrita en el ejercicio 643 los investigashydores tambien informaron los siguientes datos de las medici ones referentes a todas las calificaciones del acondicionamiento muscular logradas por los individuos

Muestra n Media Desviaci6n estimdar

Grupo deportista 13 45 3

Grupo sedentario 17 37 10

Se considera que las dos poblaciones de todas las calificaciones de acondicionashymiento muscular siguen una distribuci6n aproximadamente normal Sin embargo no debe suponerse que las dos variancias poblacionales son iguales Se pretende construir un intervalo de confianza de 95 por ciento para la diferencia entre las medias de todas las calificaciones de acondicionamiento muscular para las dos poshyblaciones representadas por las muestras

Soluci6n Se utiliza t de la ecuaci6n 645 para calcular el factor de confiabilidad En la tabla E se muestra que con 12 grados de libertad y 1 - 052 = 975 t( 21788 Analogamente con 16 grados de libertad y 1- 052 = 975 t2 = 21199 Ahora Sf calcula

(3 2 13)(21788) + (102 17)(21199) 139784 t= =

(3 2 13)+(102 17) 065747

=21261

Con la ecuaci6n 646 ahora se construye el intervalo de confianza de 95 por ciento para la diferencia entre las medias de las dos poblaciones

2 2

(45 37)plusmn21261 3 + 10 13 17

8 plusmn 21261 (25641101) 25134

Puesto que el intervalo no incluye acero se concluye que las medias de las dos poblaciones son diferentes bull

Cuando se construyen intervalos de confianza para la diferencia entre las medias de dos poblaciones es posible utilizar la figura 641 para decidir rapidashymente si el factor de confiabilidad debe ser z t 0 tf

Para cada uno de los siguientes ejercicios construya intervalos de confianza de 90 95 y 99 par ciento para las diferencias entre las medias poblacionales Establezca consideraciones que hagan que el metodo sea valido Determine las interpretaciones practica y probabilistica

clJ clJ FIGURA 541 Diagrama de flujo para decidir si e1 factor de confiabilidad debe ser z tot cuando se realizan inferencia inferencias acerca de la diferencia entre las medias de dos pobladones (Para usar un procedimiento no parametrico ver el capitulo 11)

174 CAPiTULO 6 ESTlMACION

para cad a intervalo construido Suponga las variables bajo considerati6n en cad a ejercicio y establezca para que pueden servir a los investigadores esos resultados

641 EI objetivo de un experimento de Buckner et al (A-7) consisti6 en estudiar los efectos del relajamiento muscular inducido por el pancuronium en el volumen del plasma circulante Los individuos estudiados son recien nacidos con un peso mayor a 1700 gramos que necesishytaron de ayuda para respirar durante las primeras 24 horas despues de nacer y cumplieron con otros criterios cHnicos Cinco recien nacidos paraIizados con el pancuronium y siete recien nacidos no tratados presentaron las siguientes estadisticas en la segunda de las tres mediciones del volumen de plasma (ml) hecha durante la respiraci6n mecanica

Paralizados 480 81 No tratados 567 81

La segunda medici6n para el grupo tratado ocurri6 de 12 a 24 horas despues de la primera dosis de pancuronium Para el grupo no tratado las mediciones se hicieron de 12 a 24 horas despues de iniciar la respiracion mecanica

642 Zuckery Archer (A-8) afirman que la N-nitrosobis (2-oxopropyl)amina (BOP) y las nitrosaminas 3-oxidizadas producen una alta incidencia de tumores de conductos pancreaticos en el hamster dorado sirio Estudiaron los efectos en el peso sangufneo en la glucosa del plasma en la insulina yen los niveles de transamina glutamico-oxaloacetica del plasma (GOT) de los hamsters expuestos in vivo a la BOP Los investigadores reportaron los siguientes resultados en ocho animales tratados y 12 sin tratamiento

Variable Sin tratamiento Con tratamiento

Glucosa del plasma (mglgl) 101 plusmn 5 74plusmn 6

FUENTE Peter F Zucker y Michael C Archer Alterations Pancreatic Islet Function Produced by Carcinogenic Nitrosamines in the Syrian Hamster AmericanJournal oPathology 133 573-577

Los datos son la media de la muestra plusmn la estimaci6n del error estandar de la media de la muestra

643 Los objetivos de un estudio de Davis et al (A-g) son evaluar 1) la eficacia del programa auto ayuda momento para dejar de fumar cuando se utiliza con base de uno a uno en el hogar y 2) la viabilidad de ensefiar temicas para abandonar el habito de fumar a los estudiantes de enfermerfa en bachillerato A estudiantes graduados de enfermerfa inscritos en dos cursos de metodologia de la investigacion de la Universidad de Ottawa se les invit6 a participar en el proyecto Se aplic6 un cuestionario de opcion multiple para abandonar el habito de fumar a 120 estudiantes de enfermeria que participaron y a otros 42 estudiantes que no participashyron antes ni despues del estudio Se calcularon las diferencias entre las calificaciones antes y despues del estudio as como las siguientes estadisticas a partir de las diferencias

EJERCICIOS 175

Grupo Media Desviaci6n estandar

Participantes (A) 214444 15392 No participantes (B) 33333 14595

644 El doctor Ali Khraibi (A-IO) de la CHnica y Fundaci6n Mayo condujo una serie de experishymentos con el fin de evaluar las respuestas diureticas y natiureticas de ratas Okamoto esponshytaneamente hipertensivas (REB) y ratas Wistar-Kyoto (WRY) para dirigir incrementos en la presion hidrostatica renal intersticial (PBRI) Para aumentar la PBRI se utiIiz6 la expansi6n directa del volumen renal intersticial (DRIVE) a traves de una matriz implantada cronicamente en el rinOn Entre los datos registrados durante el estudio estan las siguientes mediciones de excreci6n de sodio a traves de la orina (UNa V) durante el periodo de DRIVE

Grupo

REB 632572796483527 2WKY 420469482 108210

FUENTE Publicada con autorizaci6n del Dr Ali A Khraibi

645 Osberg y Di Scala (A-II) realizaron un estudio centrado en la eficacia de los cinturones de seguridad para reducir 1esiones entre sobrevivientes de accidentes automoviHsticos internashydos en hospitales con edades de 4 a 14 afios El estudio compar610s resultados de 123 ninos que utilizaron el cintur6n contra 290 que no 10 utilizaron entre aquellos que se vieton enshyvueltos en tales accidentes y que fueron hospitalizados El informe con tenia la siguiente estadistica del numero de dfas en la unidad de cuidados intensivos

Grupo Media Error estandar estimado

Utiliz6 el cintur6n 83 16 No utiliz6 el cintur6n 139 18

646 La medicion del diametro transversal del coraz6n de hombres y mujeres adultos presenta los siguientes resultados

sx Grupo Tamafto de Ia muestra (cm) (cm)

Varones 12 1321 105 Mujeres 9 IIOO 101

Considere que las poblaciones siguen una distribucion normal con variancias iguales

176 CAPITULO 6 ESTIMACION

647 Veintiruatro animales de laboratorio con deficiencia de vitamina D fueron divididos en dos grupos iguales EI grupo 1 recibi6 un tratamiento consistente en una dieta que proporcionashyba vitamina D EI segundo grupo no fue tratado AI termino del periodo experimental se midieron las concentraciones de calcio ensuero obteniendose los siguientes resultados

Grupo tratado X 111 mg 100 mls = 15 Grupo sin tratamiento x= 78 mg 100 ml s = 20

Considere que las poblaciones siguen una distribuci6n normal con variancias iguales

648 Ados grupos de nifios se les hicieron pruebas de agudeza vi~ual El grupo 1 estuvo formado por 11 nifios que recibieron la atenci6n de medicos privados La calificaci6n media para este grupo fue de 26 con una desviaci6n estandar de 5 El segundogrupo que incluy6 14 nifios que recibieron atenci6n medica por parte del departamento de salud publica tuvo una calishyficaci6n promedio de 21 con una desviaci6n estandar de 6 Suponga que las poblaciones siguen una distribuci6n normal con variancias iguales

649 El tiempo promedio de estancia de una muestra de 20 pacientes dados de alta de un hospital general es de siete dras con una desviaci6n estaildar de dos dras Una muestra de 24 padenshytes dados de alta de un hospital de enfermedades cr6nicas tuvo un tiempo promedio de estancia de 36 dfas con una desviaci6n estindar de 10 dias Suponga que la poblaci6n sigue una distribuci6n normal con variancias desiguales

6410 En un estudio de factores que se consideran responsables de los efectos adversos del tabashyquismo sobre la reproducci6n humana se midieron los niveles de cadmio (nanogramos por gramo) en el tejido de la placenta de una muestra de 14 madres que fumaban y una muestra aleatoria independiente de 18 mujeres no fumadoras Los resultados fueron los siguientes

No fumadoras toO 84 128250 118 98 125 154 235

94251 1952559875 118122150

Fumadoras 300301150241305178168148

134285 175 144 125204

ms probable que el nivel medio de cadmio registrado sea mayor entre las fumadoras que entre las no fumadoras ~Por que se llegarfa a esta conclusi6n

65 INTERVALO DE CONFIANZA PARA IA PROPORCION DE UNA POBIACION

Muchas preguntas de interes para que el tecnico en salud tienen relacion con las proporciones de poblacion ~Que propordon de padentes que redben un tipo espeshycial de tratamiento se recuperan ~Que proporcion de alguna poblacion tiene cierta enfermedad ~Que propordon de una poblacion es inmune a derta enfermedad

Para estimar la proporcion de una poblacion se procede en la misma forma que cuando se estima la media de una poblacion Se extrae una muestra de la poblacion de interes y se calcula su proporcion p Esta se utiliza como el estimador puntual para la proporcion de la pobladon Un intervalo de confianza se obtiene mediante la siguiente formula general

estimador plusmn (coefidente de confiabilidad) X (error estandar)

EJERCICIOS

EJERCICIOS 177

En el capitulo anterior se vio que cuando np y n(1 - p) son mayores que 5 se puede considerar que la distribuci6n muestral de pse aproxima bastante a una distribuci6n normal Cuando se cumple con esta condici6n el coeficiente de confiabilidad es algUn valor de z de la distribuci6n normal estandar Esta visto que el error estandar es igual a (J p =fi(l-p) n Puesto que p que es el parametro que se trata de calcular se desconoce se debe utilizar pcomo una estimaci6n Asf se estima (J j por medio de ~p(l Pn y el intervalo de confianza de 100(1 - 0) por ciento para pesta dado por

pplusmn Z(I-1J2)~P(l- P) Fn (651)

Este intervalo se interpreta tanto desde el punto de vista practico como probabilistico

FJEMPLO 651

Mathers et al (A-12) encontraron queen una muestra de 591 pacientes internados en un hospital psiquiatrico 204 admitieron que consuniieron marihuana al meshynos una vez durante su vida Se pretende construir un intervalo de confianza de 95 por ciento para la proporcion de individuos que consumieron marihuana durante su vida en la poblaci6n muestreada de los internos del hospital psiquiatrico

Solucion La mejor estima~i6n puntual para la proporci6Il de la poblaci6nes p== 204591 3452 El tamafio de la muestra y hiestimacion de p tienen una magnitud suficiente parajustifKar el empleo de la distribucion norshymal estandar paraelaborar un intervalo de confianza EI coeficiente de corifiabilidad que corresponde alnivel de confianza de 95 es 196 la estimacion del errorestandar (Jp es ~p(l-pgtn = (3452)(6548)591

0 1956El intervalo de confianza para p de acuerdo con estos datos es

3452 plusmn 196(01956) 3452 plusmn 0383 3069 3835

Se puede decir que se tiene 95 por ciento de confianza de que la proporshycionpeste entre 3069 y 3835 ya que al repetir el muestreo casi 95 por ciento de los intervalos construidos en la forma de este intervalo inclushyyen a la proporcion p real Con base en estos resultados se espera con una confianza de 95 por ciento encontrar que entre 3069 y 3835 por ciento de los internados en el hospital psiquiatrico tiene antecedentes de consumo de marihuana bull

Para cada uno de los siguientes ejercicios establezca la interpretacion prictica yprobabilistica de los intervalos que se pide construir Identifique cada componente del intervalo la estimashycion puntual el coeficiente de confiabilidad yel error estandar Explique por que los coefishycientes de confiabilidad no son los misInos para todos los ejercicios

178 CAPITULO 6 ESTIIlACI6N

651 En una investigaci6nde ninos maltratados en pacientes psiquiatricos Brown y Anderson (A-IS) encontraron 166 pacientes en una muestra de 947 con antecedentes de abuso sexual y maltrato flsico Construya un intervalo de confianza de 90 por dento para la proporci6n de la poblaci6n

652 Catania et at (A-14) obtuvieron datos respecto al comportamiento sexual de una muestra de hombres y mujeres solteros con edades entre 20 y 44 residentes en areas geoijfaficas caracshyterizadas por tasas altas de enfermedades de transmision sexual e ingreso a programas de drogas De 1229 encuestados 50 por ciento respondieron que nunca utilizaron preservatishyvos Construya un intervalo de confianza de 95 por ciento para la proporcion de la poblaci6n que nunca utiliza preservativos

653 Rothberg y Lits (A-I 5 ) estudiaron el efecto del estres de la maternidad durante el embarazo en el peso del producto Los individuos eran 86 mujeres blancas con antecedentes de estres que no tenfan faetores de riesgo medico u obstetrico conoddo de peso bajo del producto Los investigadores eneontraron que 128 por dento de las madres estudiadas dieron a luz bebes que cubrfan el criterio de peso bajo Construya un intervalo de confianza de 99 por ciento para la proporci6n de la poblaci6n

654 En una muestra aleatoria simple de 125 varones desempleados quienes desertaron de la escuela preparatoria entre las edades de 16 y 21 anos inclusive 88 declararon que eran consumidores regulares de bebidas alcoh6litas Construya un intervalo de eonfianza de 95 por ciento para la proporcion de la poblacion

66 INTERVALO DE CONFIANZA PARA lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS POBlACIONES

A menudo se tiene interes en conocer la magnitud de la diferencia entre las proporcioshynes de dospoblaciones Es posible que se quiera comparar por ejemplo entre hombres y mujeres dos grupos de edades dos grupos socioecon6micos 0 dos grupos de diagshynostico con respecto a la proporcion que posee alguna caractenstica de interes Un estimador puntual insesgado de la diferencia entre dos proporciones de las poblacioshynes se obtieneal calcular la diferencia de las proporciones de las muestras PI P2 Tal como Se ha visto cuando n1 Yn2 son de gran tamano y las proporciones de la poblacion no estan muy cerca de 0 0 de 1 es posible aplicar el teorema del limite central y utilizar la teona de la distribucion normal para obtener los intervalos de conshyfianza EI error estandar de la estimacion se calcula mediante la siguiente formula

dado que como regIa se desconocen las proporciones de Ia poblacion Un intervashy10 de confianza de 100(1 - a) por ciento para PI P2 se obtiene as

(661)

Es posible interpretar este intervalo desde elpunto de vista probabiHstico y practico

EJERCICIOS 179

EJEMPLO 661

Borst et al (A-16) investigaron la relaci6n de desarrollo del ego edad sexo y diagshyn6stico de suicidio entre los internos adolescentes de la unidad de psiquiatria La muestra consistia en 96 varones y 123 niiias con edades entre 12 y 16 aiios seleccioshynados de entre los internados en la unidad de adolescentes y niiios de un hospital psiquiatrico privado Se reportaron 18 niiios y 60 niiias con intento de suicidio Cons ishyderese el comportamiento de las niiias como el de una muestra aleatoria simple a partir de una poblaci6n similar de niiias y que los j6venes igualmente pueden considerarse como una muestra aleatoria simple extraida de una poblaci6n similar de niiios Para estas dos poblaciones se pretende construir un intervalo de confianshyza de 99 por ciento para la diferencia entre las proporciones de los individuos con intento de suicidio

Soluci6n Las proporciones para las niiias y niiios respectivamente son Pc = 601 123 = A878y PB = 1896 1875 La diferencia entre las proporciones de lasmuestrases Pc PB = 4878 1875 = 3003 El error estandar estimado de la diferenda entre las proporciones de las muestras es

(4878)(5122) (1875)(8125) ---~~-~ +-------shy

123 96

El factor de confiabilidad a partir de la tabla D es 258 de modo que el intervalo de confianza con la f6rmula 661 es

3003 plusmn 258(0602) 14504556

Se dene la confianza de 99 por dento de que para las poblaciones muestteadas la ptopord6n de intentos de suiddio entre las niiias exceshyde a lapropord6n de intentosde suiddio entre los varones por 1450 y 4556

Puesto que el intervalo no incluye al cero se concluye que las dos proporciones de pobladones son diferentes bull

FJERCICIOS

Para cada uno de los siguientes ejercicios establezca las interpretaciones pnicticas y probabishylisticas de los intervalos que se pide construir Identifique cada componente del intervalo la estimaci6n puntual el coeficiente de confiabilidad y el error estandar Explique por que los coeficientes de confiabilidad no son el mismo para todos los ejercicios

661 Hargers et al (A-17) del departamento de Salud PUblica y Ambieptal en Amsterdam condushyjeron un estudio en el que los individuos eran consumidores de drogasinyectables (CDI) En una muestrade 194 consumidores de metadona regular de largo plazo (MLP) 145 eran varones En una muestra de 189 CDIque no consmiddotumian MLP 133 eran varones Establezca las consideraciones necesarias acerca de las muestras ypoblaciones representadas y construshy

180 CAPITULO 6 ESTlMACI6N

ya un intervalo de confianza de 95 por ciemo para la diferenda entre las proporciones de varones en las dos poblaciones

662 Una investigaci6n de Lane et ai (A-I8) valor6las diferencias en las pnicticas de deteccion de cancer de seno entre muestras de mujeres predominantemente de bajos ingresos con edashydes de 50 a 75 anos que lltilizan los servicios de c1inicas de sailld para todo el estado y mlljeres de la misma edad residentes en ciudades donde las c1inicas de salud son locales De las 404 encuestadas seleccionadas en toda la comunidad 592 por ciento estuvo de acuerdo con el siguiente comentario acerca del cancer de pecho las mujeres prolongan su vida si detectan el cancer desde el inicio De entre 795 usuarias de clinicas de salud en la mllestra 449 por ciento estuvo de acuerdo Establezca las suposiciones apropiadas para elaborar un intervalo de confianzade 99 por ciento para la diferencia entre las dos proporciones de las poblaciones de interes

663 Williams et at (A-19) encuestaron a una muestra de 67 medicos y 133 enfermeras con famishyliares farmacodependientes EI prop6sito del estudio era evaluar la influencia en los medishyEOS y enfermeras de estar estrechamente involucrados con una 0 mas personas farmaco dependientes Cincuenta y dos medicos y 89 enfermeras dijeron que vivian con personas farmacoldependientes que adversamente afectaban 8U trabajo E8tablezca todas las consideshyraciones que crea necesarias para construir un intervalo de confianza de 95 por ciento para la diferencia entre las proporciones en las dos poblaciones de trabajadores que se espera esten adversamente afectados por vivir con personas farmacodependientes

664 Aronow y Kronzon (A-20) identificaron los factores de riesgo coronado entre hombres y mujeres en una dinica de cuidados de la salud a largo plazo De los 215 individuos negros 58 tienen diabetes mellitus al igual que 217 individuos blancos de 1140 Elabore un intervalo de confianza de 90 por ciento de confianzapara la diferencia entre las proporciones de las dos poblaciones tCuaies son las poblaciones correspondientes ~Que consideraciones son necesarias para hacer valido el procedimiento de inferencia

67 DETEHMINAUON DEL TAMANO DE LA MUESTRA PARA LA ESTIMACIONDEIAS MEDIAS

La pregunta de que tan grande debe ser una muestra surge inmediatamente al inicio del planteamiento de cualquier encuesta 0 experimento Esta es una pregunshyta importante y no se debe tratara la ligera Tomar una muestra mas grande de 10 necesario para obtener los resultados deseados es un desperdicio de recursos mienshytras que por otro lado las muestras demasiado pequenas con frecuencia dan resulshytados que carecen de uso practico En esta secci6n se estudia c6mo determinar el tamano de la muestra de acuerdo con la situaci6n A continuaci6n se proporciona un metodo para determinar el tamano de la muestra que se requiere para estimar Ia media de la poblaci6n yen la siguiente secci6n se aplica este metodo para detershyminar el tamano de la milestra cuando se desea estimar la proporci6n de una poshyblaci6n Mediante extensiltmes directas de estos metodos es posible determinar el tamano necesario de las muestras para situaciones mas complicadas

Objetivos El objetivo de la estimaci6n porintervalos es el de obtener intervalos estrechos con alta confiabilidad Si se observan los componentes ~e un intervalo de confianzase veque 8U dimension esta determinada por la magnitud de la cantidad

(coeficiente de confiabilidad) x (error estandar)

131 67 DETERMINACION DEL TAMANO PARA LA l-IUESTRAmiddot

ya que lamagnitud total del intervalo de confIanza es eldoble de esta cantidad Se aprendi6 que a esta cantidad generalmente se Ie llama precisi6n de la estimaci6n o margen de error Para un error estandar dado incrementar la confIabilidad signishyfIca un coefIciente con mayor confIabilidad Y un coefIciente con mayor confIabilidad produce unintervalo mas amplio

Por otra parte si se ftia el coefIciente de confIabilidad la unica manera de redudr la amplitud del intervalo es la reducci6n del error estandar Dado que el error estandar es igual a (J IJ y como (J es una constante la unica forma de obtener un error estandar menor es tomar una muestra grande ~Que tan grande debeser la muestra Esto depende del tamafio de (J la desviad6n estandar de la poblaci6n asi como del grado de confIabilidad y dimensi6n del intervalo deseados

Suponga que se desea obtener un intervalo que se extienda d unidades hacia uno y otro lado del estimador Ellose enuncia

d (coefIciente de confIabilidad) X (error estandar) (671)

Si el muestreo es con reemplazos a partir de una poblaci6n infInita 0 de una que sea 10 sufIcientemente grande como para ignorar la correcci6n por poblaci6n fInita la ecuaci6n 671 se transforma en

(J

d z- (672)-r la cual cuando se despeja n nos da

(673)d2

Cuando el nmestreo se hacesin reemplazos a partir de una poblaci6n fInita y peshyquefia se requiere de la correcci6n por poblaci6n fInita y la ecuaci6n 671 se transforma en

(J~d (674)fN~

que al despejar n resulta en

n-----shy (675)d 2(N 1) + Z2(J2

Si puede omitirse la correcci6n por poblad6n fInita la ecuaci6n 675 se reshyduce a la ecuaci6n 673

Estillluci6n de (J 2 Las f6rmulas para el tamafio de la muestra requieren del conocimiento de (J2 pero como ya se ha sefialado la varian cia de la poblaci6n casi

132 CAPITULO 6 ESTlMACION

siempre sedesconoce Como resultado esnecesarioestimar (J2 Las fuentes de estishymaci6n de(J2 que se utilizan con mas frecuencia son las siguientes

1 Se extrae una muestrapilato 0 prel~l11inar de lapoblaci6n y se puede utilizar la variancia calculada a partir de esta muestra como unaestimaci6n de (J2 Las observaciones uti lizadas en la muestra piloto se toman como parte de la muesshytrafinal de modo que n (el tamaiio calculado de la muestra) n

1 (el tamaiio

de la muestra piloto) n2 (el numero de observaciones necesarias para satisfacer el requerimiento total del tamaiio de la muestra)

2 A partir de estudios anteriores osimilares es posible obtener estimaciones de (J2

3Si se cree que la poblaci6n de lacual se extrae la muestraposee una distribushyci6n aproximadamente nqrmal se puede aprovechar el hecho de que la amshyplitud es aproximadamente igual a 6 desviaciones estandar y calcular (J R6 Este metodo requiere aIglin conocimiento acerca de los valores minimo y maximo de la variable en la poblaci6n

EJEMPLO 671

Un nutri6logo del departamento de salud al efectuar una encuesta entre una poshyblacien de muchachas adolescentes con e1 fin de determinitr su ingesti6n diaria promedio de proteinas (medidas en gramos) busc6 el consejo de un bioestadistico con respecto al tamaiio de la muestra que deberfa tomar

~Que procedimiento debe seguir el bioestadistico para asesorar al nutri610go Antes de que el estadistico pueda ayudar el nutri6logo este debe proporcionar tres elementos de informaci6n h dimensi6n deseada del intervalo de confianza el nivel de confianza deseado y la magnitud de la variancia de la poblaci6n

Soludon Suponga que el nutri6logo requiere un intervalo con una dimensi6n de aprQximadamente 10 gramos es decir la estimaci6n se deberfa enconshytrar alrededor de 5 gramos de la media de la poblaci6n en ambas direcshyciones En otras palabras se desea un margen de error de 5 gramos Suponga que se decide por un coeficiente de confian7a de 95 y que con base en su experiencia previa el nutri6logo percibe que la desviaci6n estandar de la poblaci6n es probablemente de alrededor de 20 gramos EI estadfstico dispone ya de la informaci6n necesaria para calcular el tamaiio de la muestra z 196 (J = 20 y d 5 Suponga que el tamaiio de la poblaci6n es grande asf queel estadistico puede ignorar la correcshyci6n por poblaci6n finita y utilizar la ecuaci6n 673 Con las sustitucioshynes adecuadas el valor de n se calcula como

Se recomienda que el nutri610go tome una muestra de tamafio 62 AI calcular el tamaiio de una muestra a partir de las ecuaciones 673 0 675 el resultado se redondea al siguiente nurnero entero mayor si los calculosdan un numerocon decimales bull

183 68 DETERMINACION DEL TAl1ANO PARA LAS PROPORCIONES

EJERCICIOS

671 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su hospital Si se desea un intervalo de confianza de 99 por dento con una amplitud de 1 libra ~que tan grande debe ser la muestra de los registros de nacimiento Suponga que un estimashy

dor razonable para (J es 1 libra ~De que tamano debe ser la muestra si el coeficiente de confiabilidad se hace descender a 95

672 El director de la secdon de control dela rabia del departamento de salud publica desea extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso del ano anterior para estimar la edad media de las personas mordidas Requiere un intervalo de confianza de 95 por dento decide utilizar un valor de 25 para d y a partir de estudios anteriores estima que la desviacion estandar de la poblacion esta alrededor de los 15 anos ~Que tan grande debe ser el tamano de la muestra

673 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mglOO ml) de pacientes atendidos en una clinica para diabeticos durante el transcurso de los ultimos 10 anos Determine el numero de registros que el medico debe examinar para obtener un intershyvalo de confianza de 90 por ciento para 11 si la dimension requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varian cia de 60

674 Se deseaestimar la edad media en la que a los padentes de esclerosis multiple se les diagnosshytico el padecimiento por primera vez Se requiere un intervalo de confianza de 95 por dento con una dimension de 10 anos Si la variancia de la poblaci6n es de 90 ~que tan grande debera ser la muestra

68 DETERMINACION DELTAMANO DE lA MUESTRA PARA lA ESIDIACION DE lAS PROPORCIONES

EI metodo para estimar el tamafio de la muestra cuando se requiere estimar la proshyporcion de una poblacion es esencialmente el mismo que se describio para estimar la media de una poblacion Se aprovecha el hecho de que la mitad del intervalo deseashydo d se puede igualar al producto del coeficiente de confiabilidad y el error estandar

Si se supone que el muestreo ha sido hecho de manera aleatoria y que existen condiciones que garanticen que la distribuci6n de psea aproximadamente normal se obtiene la siguiente formula para n cuando el muestreo es con reemplazo cuanshydo se realizaa partir de una poblacion infinita 0 ruando la poblacion muestreada es 10 suficientemente grande como para hacer innecesario el uso de la correcci6n por poblacion finita

n (681)

dondeq = I-p Si la correccion por poblacion finita no puede descartarse la formula adecuashy

da paran es

(682)n d 2 (N -1)+z2pq

euan do N es grande en comparacion con n (es decir n IN 05) se puede pasar por alto la correccion por poblacion finita y la ecuacion 682 se reduce a la ecuacion 681

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

62 INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACION 157

En el ejemplo 621 es preferible en lugar de 2un valor mas exacto para z 196 que corresponde al coeficiente de confianza de95 Los investigadores pueshyden utilizar cualquier coeficiente de confianza los mas utilizados son 90 95 Y 99 a los cuales se asocian factores de confiabilidad de 1645 196 Y 258 respectivashymente

Precision A la cantidad que se obtiene al multiplicar el factor de confiabilidad por el error estandar de la media se Ie llama precision de la estimaci6n Tambien se Ie llama margen de error

EJEMPLO 622

Un fisioterapeuta desea estimar con 99 por ciento de confianza la media de fuerza maxima de un musculo particular en cierto grupo de individuos Se inc1ina a suposhyner que los valores de dicha fuerza muestran una distribucion aproximadamente normal con una variancia de 144 Una muestra de 15 individuos que participaron en el experimento presento una media de 843

Soluci6n En latabla D el valor para z que corresponde a un coeficiente de conshyfianza de 99 es 258 Este es el coeficiente de confiabilidad El error estandar es de ax 12fl5 =30984 Por 10 tanto el intervalo de conshyfianza de 99 por ciento para ~ es

843 plusmn258(30984) 843 plusmn 80 763923

Se dice que se tiene 99 por ciento de confianza de que la media de la poblacion este entre 763 y 923 porque al repetirel muestreo 99 por ciento de todos los intervalos que pueden construirse en la forma descrishyta inc1uyen a la media de la poblacion bull

Situaciones en las que la variable de interes sigue una distribucion aproximadashymentenormal con una variancia conocida son muy raras y casi nunca se presentan en la practica El prop6sito de los ejemplos anteriores en los que se supone que existe esta condici6n ideal fue el de formar las bases teoricas para construir intershyvalos de confianza para las medias de la poblacion En la mayorf de los casos practicos las variables no siguen una distribuci6n aproximadamente normal 0 no se conocen las variancias de la poblaci6n 0 suceden ambas cosas En el ejemplo 623 y en la secci6n 63 se explican los procedimientos que se utilizan en situaciones menos ideales pero mas comunes

Muestreo a partir de pobluciunes que no presenlan una distribucion normal No siempre es posible 0 prudente suponer que la poblaci6n de interes muesshytra una distribuci6n normal Gracias al teOlema del limite central esto no sera un problema si se puede seleccionar una muestra 10 suficientemente grande Se ha dicho que para muestras grandes la distribucion muestral de Xi presenta una distribuci6n aproximadamente normal sin importar como esta distribuida la poblacion original

158 CAPiTULO 6 ESTIMACION

EJEMPLO 623

Un equipo de investigadores esta interesado en la puntualidad de los pacientes en las citas concertadas En un estudio de flqjo depacientes en los consultorios de medicos generales se encontr6 que una muestra de 35 pacientes llegaba 172 minutos tarde a las citas en promedio Una investigaci6n previa habia demostrado que la desviaci6n estandar era de 8 minutos aproximadamente Se tuvo la sensaci6n de que la distribushyci6n de la poblaci6n no era normal ~Cual es el intervalo de confianza de 90 por ciento para 11 que es el promedio real de impuntualidad en las citas

Soluci6n Dado que el tamafio de la muestra es bastante grande (mayor que 30) y se conoce la desviaci6n estandar de la poblaci6n la situaci6n se aproxishyrna al teorema del limite central y se supone que la distribuci6n muestral de xpresenta una distribud6n aproximadamente normal AI consultar la tabla D se encuentra que el coeficiente de confiabilidad que corresponshyde a uri coeficiente de confianza de 90se aproxima a 1645 si se interpola El error estandar es de C5z 8-35 13522 de modo que el intervalo de confianza de 90 por ciento para 11 es

172 plusmn 1645(13522) 172 plusmn 22 150 194 bull

Con frecuencia cuando la muestra es 10 suficientemente grande para aplicar el teorema dellfmite central la variancia de la poblacion se desconoce En ese caso se sustituye esta variancia conla de la muestra en la f6rmula para construir el intervashy10 de confianza para la media de la poblacion

Andlisispor computadora Cuando se requiere de los intervalos de confianza se economiza una buena cantidad de tiempo mediante el uso de una computadora la cual puede ser programada para construir los intervalos de datos no procesados

EJEMPLO 624

Los siguientes datos corresponden a los valores de la actividad (micromoles por minuto por gramo de tejido) de cierta enzima medida en el tejido gastrico normal de 35 pacientes con carcinoma gastrico

60 1189 614 788 273 2464 571 1827 537 374 449 262 448 971

372 898 411 348 1925 550 622

610 319 406 413 767 385 674

521 603 533 662 1177 307 1499

Mediante el uso del paquete de software para computadora MINITAB se pretenshyde construirun intervalo de confianza de 95 por ciento para la media de la poblashycion Suponga que la variancia de la poblaci6n es iguala 36 No es necesario suponer que la poblaci6n muestreada de val ores sigue una distribuci6n normal porque el tamafio de la muestra es losuficientemente grande para aplicar el teoreshyrna del limite central

159 62 INTERV ALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACION

Caja de dialogo Comandos de la sesi6n

Statgt Basic Statisticsgt 1-Sample z MTB gt ZINTERVAl 95 6 C1

Teclear Cl en Variables Se1ecdonar Confidence interval y teclear 95 en la caja de texto Teclear6 en Sigma Clic OK

Resultados

Confidence Intervals

The assumed sigma = 0600

Variable MicMoles

N 35

Mean 0718

StDev 0511

SE Mean 0101

950 Cr (0519 0917)

FIGURA 622 Procedimiento del paquete MINITAB para construir un intrevalo de conshyfianza de 95 por ciento para la media de la poblacion ejemplo 624

Solucion Se introducen los datos en lacolumna 1 y se procede como se muestra en la figura 622 Estas instrucdones indican a la computadora que e1 factor de confiabilidad es z que se necesita unintervalo de conshyfianza de 95 por dento que la desviaci6n estandarde la poblaci6n es de 6 y que los datos estan en la columna 1 El resultado indica que la media de la muestra es 718 la desviad6n estandar es 511 y e1 error estandar de la media af es 6J35 101

Se tiene 95 pordento middotde confianza de que la media de la poblashyci6n se encuentra entre 519y 917 bull

Puede obtenerse los intervalos de confianza a traves de otros paquetes de sofuvare Por ejemplo SASreg puede construir intervalos de confianza a traves de PROC MEANS o PROC UNIVARIATE

Otras eslimaciones de La tendencia central Tal como se ha visto la meshydia es muy sensible a los val ores extremos es dedr aquellos que se desvfan consideshyrablemente de la mayorfa de las mediciones en el con junto de datos A dichos valores se les conoce como sesgos Tambien se puede apreciar que lamediana que no es sensible a las mediciones extremas algunas veces se utiliza en lugar de la media como medida de tendenda central cuando los sesgos estan presentes Por la misshyrna raz6n quiza se prefiera el uso de la mediana de la muestra comomiddotestimador de la rnediana de la poblaci6n cuando se requiere realizar inferencias acerca de la tendenda central de la poblaci6n No solamente se utiliza la mediana de la muestra

160 CAPITULO 6 ESTlMACION

como una estimacion puntual para la mediana de la poblacion sino que tambien es posible construir un intervalo de confianza para la mediana de la poblacion En esta obra no se proporciona la formula pero esta se puede encontrar en la obra de Rice (1)

Media ajustada Los estimadores que son insensibles a los sesgos se Haman estimadores eficaces Otra medida y estimador eficaz de tendencia central es la media ajustada Para un conjunto de datos que contiene n mediciones se calcula el 1000 por ciento de la media ajustada como sigue

1 Ordenar las mediciones

2 Descartar las medici ones mas pequeiias y mas grandes que 100a por ciento de las mediciones El valor recomendado para a esta entre 1 y 2

3 Calcular la media aritmetica de las mediciones restantes

Observe que la mediana podrfa considerarse como 50 por ciento de la media ajusshytada Se debe recordar que la media ajustada para el conjunto de datos es una de las medidas descriptivas que puede calcular MINITAB

FJERCICIOS

Construya para cada uno de los siguientes ejercicios los intervalos de confianza al 90 95 Y 99 por ciento para la media de la poblacion y establezca para cada uno la interpretacion probabilistica y practica Indique cualinterpretacion puede ser mas aderuada para utilizar ruando se trata sobre intervalos de confianza con alguien que no conoce de estadfstica y establezca eI razonamientode por que se eUgi6 Explique por que los tres intervalos no tjenen la misma amplitud Indique cual de los tres intervalos es preferible como estimador de la media de la poblacion y establezca el razonamiento de la elecci6n

621 Se pretende estimar el numero promedio de latidos del coraz6n por minuto para cierta poblaci6n Se encontr6 que el numero promedio de latidos por minuto para 49 personas era de YO Considere que esos 49 pacientes constituyen una muestra aleatoria y que la poblacion sigue una distribucion normal con una desviaci6n estandar de 10

622 Se pretende estimar la concentraci6n media de bilirrubina indirecta en el suero en nmos de cuatro dias de nacidos La media para una muestra de 16 ninos es de 598 mglOO cc Conshysiderese que la concentraci6n de bilirrubina en los ninos de cuatro dfas de nacidos sigue una distribucion aproximadamente normal con una desviaci6n estandar de 35 mgIOO cc

623 En un estudio acerca de la duraci6n de la hospitalizacion dirigido por vados hospitales en cooperacion se extrajo una muestra aleatoria de 64 individuos con ulcera peptica de la lista de todos los pacientes con esa enfermedad internados alguna vez en los hospitales particishypantes Se determin6 para cada uno de eUos el tiempo de hospitalizaci6n Se encontr6 que la duraci6n media de hospitalizaci6n fue de 825 dfas y se sabe que la desviaci6n estandar de la poblaci6n es de tres dfas

624 Una muestrade 100 hombres adultos aparentemente sanos de 25 anos de edad muestra una presi6n sist61ica sangufnea media de 125 Considere que la desviaci6n estandar de la poblaci6n es de 15

161 63 DISTRIBUCI6N

625 Algunos estudios acerca de la enfermedad Alzheimer (EA)han mostrado un incremento en la producci6n de 14C0

2 en pacientes con ese padecimiento Durante un estudio se obtuvieshy

ron los siguientes valores de 14C02

a partir de 16 biopsias de neocorteza de pacientes con la enfermedad (EA)

1009 1280 1180 12551547 2352 1956 1080

1776 1767 1680 2050 1452 2857 3100 1621

Considereseque la poblaci6n sigue una distribuci6n normal con una desviaci6n estandar de 350

63 DISTRIBUCION t

En la seccion 62 se describe un procedimiento para obtener un intervalo de conshyfianza para la media de una poblaci6n EI procedimiento requiere del conodmiento de la varianda de la poblacion de la que se extrae la muestra Puede parecer un tanto extrafio que se tenga conocimiento de lavariancia de la poblacion y no se conozca elvalor de la media de la poblacion De hecho es comun en situacioshynes como las que se han presentado que se deSconozca tanto la variancia como la media de la poblacion Esta situacionpresenta un problema respecto a la construcshycion delos intervalos de confianza Por ejemplo aun cuando la estadfstica

x J1shyZ=---

crJn presenta una distribudon normal cuando la poblacion tambien tiene una distribuci6n normal y sigue una distribuci6n aproximadamente normal cuando n es muy grande independientemenle de la forma funcional de la poblacion no se puede hacer uso de este hecho porque cr se desconoce Sin embargo no todo esrn perdido y la soluci6n mas logica para este problema es utilizar la desviacion estandar de ~muestra

s = ~L(Xi - x)2(n-l)

para sustituir cr Por ejemplo cuando el tamafio de la muestra es mayor que 30 la confianza en s como una aproximacion de cr es por 10 general sustancial por 10 que se justifica la utilizacion de la teorfa de la distribudon normal para construir un intervalo de confianza para la media de la poblacion En tal caso se procede como se indica en la seccion 62

Cuando se tienen muestras pequefias es imprescindible encontrar otro proceshydimiento para construir intervalos de confianza

Como resultado del trabajo de Gosset (2) escrito bajo el seudonimo de Student se dispone de otra alternativa conocida como distribuci6n t de Student con frecuenda abreviada como distribuci6n t

La cantidad

sigue esta distribucion

162 CAPiTULO 6 ESTIMACION

Propiedades de la distribucion t La distribuci6n t tiene las siguientes proshypiedades

1 Tiene una media de O

2 Es simetrica con respecto a la media

3 En general tiene una variancia mayor que 1 pero esta tiende a I a medida que aumenta el tamaiio de la muestra Para dfgt 2 la variancia de la distribushyci6n t es dfl(df - 2) donde df representa los grados de libertad En forma alterna puesto que df n - 1 para n gt 3 se puede escribir la variancia de la distribuci6n t como (n l)(n 3)

4 La variable t va de - hasta + 00DO

5 La distribuci6n t es realmente una familia de distribuciones puesto que hay una distribuci6n diferente por cada valor de la muestra de n - 1 que es el divisor que se utiliza para ca1cular S2 Recuerde que n - 1 representa los grados de libertad En la figura 631 se muestran las distribuciones t correspondienshytes a algunos valores de los grados de libertad

6 Comparada con la distribuci6n normal ladistribuci6n t es menos espigada en el centro y tiene colas mas largas En la figura 632 se com para la distribushyci6n t con la distribuci6n normal

7 La distribuci6n t se aproxima ala distribuci6n normal a medida que n - 1 se aproxima al infinito

La distribuci6n t al igual quela distribuci6n normal estandar se ha tabulado ampliamente Una de estas tablas es la tabla E del apendice Tal como se puede apreciar se debe tomar en cuenta eLcoeficiente de confianza y los grados de libershytad cuando se utiliza la tabla de la distribuci6n t

FIGUR- 631 Distribuci6n t para diferentes grados de libertad

-----

163 63 DISTRIBUCION

__ Distribucion normal

- - - Dislribucion I

x

FIGURA 632 Comparaci6n de las distribuciones normal yt

Es posible utilizar el paquete MINITAB para graficar la distribuci6n t (para grados espedficos de libertad) y otras distribuciones Despues de asignar el eje horizontal y las siguientes direcciones en el cuadro de Set Patterned Data seleccioshyne del menu Calc y despues Probability Distributions Utilice el cuadro de diashylogo Plot para generar la grafica

Inlervalos de conJiQllia qllR uJilban fa dislribucion t El procedimien to general para construir interval os de confianza no se ve afectado por la necesidad de utilizar la distribuci6n t en lugar de la distribuci6n normal estandar Aun es necesario usar la relaci6n expresada por

estimador plusmn (coeficiente de confiabiIidad) x (error estandar)

Lo que es diferente es el origen del coeficiente de confiabilidad Este se obtiene a partir de la tabla de la distribucion t en lugar de la tabla de la distribuci6n normal estandar Para ser mas especfficos cuando se obtienen muestras a partir de una distribushycion normal cuya desviaci6n estdndi17 a se desconoce ell OO( 1 - a) por ciento del intervalo de confianza para la media de la poblaci6n J1 estd dado por

(631 )

Es importante aclarar que el requisito para el uso valido de la distribucion t es que la muestra debe ser extrafda de una poblad6n con distribucion normal Sin embarshygo la experiencia ha demostrado que se pueden tolerar desviaciones moderadas de esterequisito Como consecuencia la distribucion t se utiliza incluso cuando se sabe que la poblaci6n original se desvia de la normalidad Lltl mayorfa de los invesshytigadores requieren que al menos pueda sostenerse el supuesto de una distribushyd6n de poblacion en forma de montfculo

EJEMPLO 631

Maureen McCauley (A-I) realiz6 un estudio para evaluar los efectos de un conjunto de instrucciones de mecanica en ellugar de labores sobre el desempeno laboral de obreros jovenes recientemente contratados Se utilizaron dos grupos de individuos elegidos aleatoriamente uno de los grupos para aplicar el experimento y el otro

164 CAPITULO 6 ESTlMACI6N

como grupo de control EI grupo con el que se experimento recibio una hora de capacitacion impartida por un terapeuta ocupacional EI grupo de control no recishybio esta capacitacion Para evaluar el esfuerzo de cada obrero para levan tar bajar jalar y transportar objetos dentro del entorno laboral se utilizo una lista de cotejo para la evaluacion de trabajo mecanico que inclufa criterios de referencia Una tarea bien hecha recibio una calificacion de 1 EI grupo de control formado por 15 individuos alcanzo una calificacion media de 1153 en la evaluacion con una desshyviacion estandar de 3681 Se supone que el grupo de control se comporto como una muestra aleatoria extraida de una poblacion similar de individuos Se pretende utilizar los datos de la muestra para estimar la calificacion media para la poblacion

Soluci6n Se puede utilizar la media de la muestra 1153 como una estimacion puntualde la media de la poblacion sin embargo debido a que se descoshynoce la desviacion estandar de la poblacion se debe considerar que los valores siguen una distribucion aproximadamente normal antes de consshytruir los intervalos de confianza para l Se considera que esta suposicion es razonable y que se necesita un intervalo de confianza de ~or cienshyto el estimador es i y el error estandar es s -r 681 15 =9504 Ahora es necesario conocer el coeficiente de confiabilidad el valor de t asodado al coeficiente de confianza de 95 y a los n 1 = 14 grados de libertad Puesto que el intervalo de confianza de 95 por ciento deja 05 del area bajo la curva de t para dividirse en dos colas iguales se necesita el valor de tala derecha del cual esta el 025 del area Este valor se localiza en la tabla E enla columna encabezada por t

975 bull Este es el valor

para tala izquierda delcual esta 975 del area bajo la curva EI area a la derechade este valor es igual al 025 deseado Ahora sobre la columna de grados de libertad se localiza el numero 14 EI valor para t se encuentra en la interseccion del renglon con la etiqueta 14 y la columna con la etiqueta t975 bull Se encuentra que este valqr para t que representa al coeficiente de confiabilidad es 21448 Finalmente el intervalo de confianza de 95 por ciento se construye como sigue

1153 plusmn 21448(9504) 1153 plusmn 204 949 1357 bull

Este intervalo puede interpretarse con ambos puntos de vista probabiHstico y practico Puede asegurarse en un 95 por dento que 1a media l correcta de la poblacion se encuentra entre 949 y 1357 porque al repetir el muestreo 95 por dento de los intervalos construidos deigual manera incluyen a l

Decidir entre z r t Cuando se obtiene un intervalo de confianza para la media de una poblacion se debe decidir si se utiliza un valor de z6 de t como factor de confiabilidad Para hacer una elecci6n adecuada se debe considerar el tamafto de la muestra si la poblacion muestreada sigue una distribucion normal y si la varian cia de la poblacion es conocida La figura 633 muestra un diagrama de flujo que se puede utilizar para decidir rapidamente si el factor de confiabilidad debe ser Z 0 t

EJERCICIOS 165

EJERCICIOS

Sa aplica al leorema dellfmile central

FIGURA 633 Diagrama de flujo para deddir entre utililizar z y t cuando se hagan inferencias respecto a las medias de la poblaci6n (Para utilizar un procedimiento no parametrico vease el capitulo 13)

Analisis par computadara Si el proposito es construir un intervalo de conshyfianza con el programa MINITAB para la media de la poblacion cuando el estadfsshytico t es el factor de confiabilidad adecuado el comando se inicia con la palabra TINTERVAL Seleccione en Windows I-Sample t desde el menu de Basic Statistics

631 Utilice la distribud6n t para encontrar el factor de confiabilidad para el intervalo de confianshyza basado en los siguientes coeficientes de confianza y tamafiosde las muestras

a b c d

Coefidente de confianza 95 99 90 95 Tamafio de la muestra 15 24 8 30

632 En una investigacion acerca de la dependencia del flujo y volumen de todo el sistema respishyratorio en un grupo de pacientes con enfermedad obstructiva pulmonar cronica conectados a respiradores artificiales Tantucci et ai (A-2) registraron los siguientes valores de linea de

166 CAPITULO 6 ESTIMACION

base del flUjD continuo inspiratDriD (Us) 90 97 103110 104 100 CDnsidere que una muestra aleatDria simple esta cDnfDrmada pDr seis individuDs a partir de una pDblacion que sigue una distribuci6n nDrmal CDn individuDs CDn la misma enfermedad

a) ~Cuat es la estimaci6n puntual de la media de la pDblaci6n

b) ~Cuil es la desviacion estandar de la muestra

c) ~Cultll es la estimacion del error estandar para la media de la muestra

d) CDnstruya un intervalD de cDnfianza de 95 pDr ciento para el flUjD mediD cDntinuD inspishyratDriD de la pDblaci6n

e) ~Cual es la precision de la estimacion

f) Explique la interpretaci6n prDbabilistica para este intervalD de confianza

g) Explique la interpretacion practica para este intervalD de cDnfianza

633 LlDyd y MaillDux (A-3) informaron IDS siguientes datDs acerca del peso de la glandula pituitaria en una muestra de cuatrD ratas de Wistar Furth

media = 90 mg error estandar para la media = 3

FUEJTE Ricardo V Lloyd y Joe Mailloux Analysis ofSshy100 Protein Positive Folliculo Stellate Cells in Rat Pituitary Tissues AmericanJournal ofPathology 133 338-346

a) ~Cual es la desviadon estandar de la muestra

b) CDnstruya un intervalD de confianza de 95 pDr ciento para el peso medio de la glandula pituitaria para una pDblacion similar de ratas

c) ~Que supDsiciDnes se necesitan para que sea validD el intervalo de cDnfianza del inciso b

d) ~Que interpretacion puede ser la mas indicada cuandD se trata sDbre intervalos de conshyfianzacon alguien que no sabe de estadfstica Explique pDrque es la mas cDnveniente

e) 5i fuera necesario elabDrar un intervalD de cDnfianza de 90 pDr cientD para la media de la pDblaci6n ~el intervalD de cDnfianza serta mayDr 0 menor que el intervalD de 95 pDr dentD Explique su respuesta sin construir realmente el intervalD de cDnfianza

f) 5i [uera necesariD considerar un intervalo de CDnfianza de 99 pDr cientDpara lamedia de la poblacion ~el intervalo de cDnfianza serra mayDr 0 menDr que el intervalD de 95 pDr dentD Explique su respuesta sin cDnstruir realmentt el intervalD de cDnfianza

634 Kaminski y Rechberger (A-4) encontrarDn en un estudio sDbre la preeclampsia que la media de la presi6n sistolica sangufnea en 10 mujeres sanas y que no estan embarazadas es de 119 CDn una desviacion estandar de 21

a) 2Cual es el errDr estandar estimadD para la media

b) CDnstruya un intervalD de confianza de 99 pDr cientD para la media de la poblaci6n a partir de la cual puede considerarse que IDS 10 individuos conforman una muestra aleatoria

c) ~CUlil es la precisi6n estimada

d) ~Que consideraciones deben hacerse para comprobar la validez del intervalo de confiahza

635 Unamuestra de 16nifias de 10 afiDS pesan en promediD 715 con una desviacion estandar de 12libras CDnsidere el calculD de intervalDs de cDnfianza de 9095 y 99 pDr ciento para I-L

167 64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS

636 Una muestra aleatoria simple conformada por 16 individuos aparentemente sanos presenta los siguientes valores de arsenico eliminado en la orina (miligramos por dfa)

Individuo Valor Individuo Valor

1 007 9 012 2 030 10 006 3 025 11 010 4 008 12 032 5 030 13 006 6 038 14 009 7 007 15 014 8 005 16 011

Elabore un intervalo de confianza de 95 por ciento para la media de la poblaci6n

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES

En ocasiones se presentan casos en los que se desea estimar 1a diferencia entre 1a media de dos poblaciones A partir de cada poblacion se extrae una muestra aleatoria independiente y de los datos de cada una se calculan las medias muestrales XI y x2

respectivamente En el capitulo anterior se dijo que el estimador XI - x2 ofrece una estimacion insesgada de la diferencia entre las medias de las poblaciones III shy11 2 bull La variancia del estimador es (cr~ n l ) + (cr~ n 2 ) Tambien se menciono que seglin las condiciones la distribucion muestral de XI - x2 puede presentar una distribution al menos aproximadamente normal de modo que en muchos casos se utiliza la teorfa adecuada para las distribuciones normales en el calculo de un intershyvalo de confianza para III - 11 2 bull Cuando se conocen las variancias de la poblacion el intervalo de confianza del 100(1 - ex) por ciento para III - 112 esta dado por

(641)

El anal isis del intervalo de confianza para la diferencia entre las medias poblacionales ofrece informacion util para decidir si es 0 no probable que las medias de las dos poblaciones sean iguales Cuando el intervalo no incluye al cero se dice que el intervalo ofrece evidencia de que las dos poblaciones tienen medias diferentes Cuando el intervalo incluye al cero se dice que las poblaciones pueden tener meshydias iguales

Esto se ilustra a continuacion para el caso donde el muestreo se realiza a partir de una distribucion normal

168 CAPITULO 6 ESTlMACI6N

EJEMPLO 641

A un equipo de investigacion Ie interesa conocer la diferencia entre las concentracioshynes de acido urico en pacientes con y sin el sfndrome de Down En un gran hospital para el tratamiento de pacientes con retardo mental una muestra de 12 individuos con el sindrome presenta una media de XI = 45 mgll00 mL En un hospital general se encontro que una muestra de 15 individuos normales de la misma edad y sexo presenta un nivel medio de x2= 34 Si es razonable suponer que las dos poblaciones de valores muestran una distribucion normal y sus variancias son iguales a 1 y 15 calcule el intervalo de confianza de 95 por ciento para ~l - ~2

Soluci6n Para una estimacion puntual de III 112 se udliza Xl X2= 45 34 11 EI coeficiente de confiabilidad que corresponde a 95 localizado en la tabla D es 196 EI error estandar es

Por 10 tanto el intervalo de confianza de 95 por ciento es

11 plusmn 196(4282) 11plusmn84 26 194

Se dice que se dene una confianza de 95 por ciento de que la difeshyrencia real 111 - 112 este entre 26 y 194 porque en muestreos repetidos 95 por ciento de los intervalos construidos de esa manera incluiria la diferencia entre las medias reales

Puesto que el intervalo no incluye al cero se concluye que las dos poblaciones tienen diferentes medias bull

Muestreo a partir de poblaciones que no signen una distribuci6n ItOrmal La construccion de un intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando el muestreo se realiza a partir de poblaciones no normales se lleva a cabo en la forma descrita en el ejemplo 641 si las muestras n l y n

2 son grandes Una vez mas este es un resultado del teorema del limite central

Si se desconocen las variancias de la poblacion se utili zan las variancias de las muestras para estimarlas

IUEMPLO 642

Motivados por d conocimiento de la existencia de una gran cantidad de textos polemicos que sugieren que el estres la ansiedad y la depresion son dafiinos para el sistema inmunologico Gormanet ai (4-5) condujeron un estudio en el que se conshysider6 a individuos varoneshomosexuales algunos con VIH (virus de inmunodefishyciencia humana) positivo y otros con VIH negativo Los datos fueron registrados con una amplia vltJriedad de mediciones medicas inmunologicas psiquiatricas y neurol6gicas una de las cuales corresponde al numero de celulas CD4+ en la sanshy

64 INTERV ALO DE CONFIANZA PAHALA DIFERENCIA ENTRE DOS MEDIAS 169

gre El numero promedio de celulas CD4+ para middot112 individuos con infecci6n por VIR fue de 4018 con una desviaci6n estandar de 2264 Para los 75 individuos sin la infecci6n por VIR la media y la desviaci6n estandar fueron de 8282 y 2749 respectivamente Se pretende elaborar un intervalo de confianza de 99 por ciento para la diferencia de las medias de las poblaciones

Soluci6n No hay informaci6n con respecto a la forma de la distribuci6n de las celulas CD4+ Sin embargo como el tamafto de las muestras es grande el teorema del limite central asegura que la distribuci6n muestral de las diferencias entre las medias de la muestra siguen una distribuci6n aproxishymadamente normal independientemente de que la distribuci6n de la variable en las poblaciones no siga una distribuci6n normal Se puede utilizar este hecho para justificar el uso de la estadistica z como factor de confiabilidad en la construcci6n del intervalo de confianza Tampoco hay informaci6n acerca de las desviaciones estandar por 10 que puede emplearse las desviaciones estandar de las muestras para estimarlas La estimaci6n puntual para la diferencia entre las medias de las poblacioshynes es la diferencia entre las medias de las muestras 8282 - 4018 = 4264 En la tabla D se encuentra que el factor de confiabilidad es 258 La estimaci6n del error estandar es

s __ = 27492

+ 22642 =382786

Xl-X 75 112

Por la ecuaci6n 641 el intervalo de confianza de 99 por ciento para la diferencia entre las medias de la poblaci6n es

4264 plusmn 258(382786) 3276 5252

Se tiene la seguridad de 99 por ciento de que el promedio de celulas CD4+ en varones con VIR positivo difieren de la media para los varoshynes con VIR negativo por 3276 a 5252 bull

Distribuci6n t y la diferencia entre las medias Cuando no se conocen las variancias y se pretende estimar la diferencia entre las medias de dos poblacioshynes con un intervalo de confianza es posible utilizar la distribuci6n t para suminisshytrar el factor de confiabilidad si se conocen ciertas suposiciones se debe saber 0

suponer de buena fe que las dos poblaciones muestreadas siguen una distribuci6n normal Respecto a las variancias de las poblaciones se debe distinguir entre dos situaciones 1) la situaci6n en la que las variancias son iguales y 2) la situaci6n en la que no 10 son A continuaci6n se consideranambas sitpaciones por separado

Varianciaspoblacifmales iguales Si la suposici6n sobre igualdad de las variancias de las poblaciones esta justificada las dos variancias de las muestras calculadas a partir de las muestras independientes pueden considerarse como estishymaciones de 10 mismo es decir la variancia comun Parece 16gico entonces aproshyvechar este hecho en el anal isis en cuesti6n Esto es precisamente 10 que se hace para establecer una estimaci6n conjunta para la variancia comun Esta variancia se obtiene mediante el caIculo promedio ponderado de las dos variancias de las muesshy

170 CAPITULO 6 ESTlMACI6N

tras Cada variancia de la muestra es ponderada con base en sus grados de libertad Si los tamafios de las muestras son iguales este promedio ponderado es la media aritmetica de las variancias de las dos muestras Si el tamano de las dos muestras es distinto el promedio ponderado aprovecha la informacion adicional proporcionada por la muestra mayor La estimacion con junta se obtiene con la fOrmula

S2 = (nl _1)SI2 + (n2 l)s~ p (642)

+n2 -2nl

Asf la estimacion del error estandar esta dada por

(643)

y el intervalo de confianza de 100(1 a) por ciento para III 112 esta dada por

(644)

El nfunero de grados de libertad utilizado para determinar el valor de t que se usa para construir el intervalo es n

1 + n

2 2 que es el denominador de la ecuacion

642 Este intervalo se interpreta en la forma habitual Los metodos que pueden emplearse para tomar la decision acerca de la igualshy

dad de las variancias de las poblaciones se estudian en la seccion 610 y 78

EJEMPLO 643

Uno de los estudios de Stone et al (A-6) tuvo como objetivo determinar los efectos del ejercicio por un tiempo prolongado en los ejecutivos de una compania inscritos en un programa supervisado de acondicionamiento fisico Se registraron datos de 13 individuos (el grupo deportista) que voluntariamente se inscribieron el programa y que permanecieron activos por 13 anos en promedio y de 17 individuos (el segunshydo grupo el sedentario) que decidieron no inscribirse Entre los datos que se regisshytraron acerca de los individuos esta el mlmero maximo de sentadillas realizadas en 30 segundos El grupo deportista obtuvo una media y una desviacion estandar de 210 y 49 respectivamente La media y la desviacion estandar para el grupo sedenshytario fueron 121 y 56 respectivamente Se considera que las dos poblaciones de medici ones de acondicionamiento muscular siguen una distribuci6n aproxirnadashymente normal y que las variancias para ambas poblacionesson iguales Se pretenshyde elaborar un intervalo de confianza de 95 por ciento para Ja diferencia entre las medias de as poblaciones representadas por las dos muestras Soluci6n Primero se utiliza la ecuaci6n 642 para calcular la estimaci6n conjunta

de la variancia comtin de las poblaciones

(13-1)(49 2 )+(17 1)(562 ) =2821

13+17-2 Cuando se consulta la tabla E con 13 + 17 - 2= 28 grados de libertad y el nivel de confianza de 95 se encuentra que eLfactor de confiabilidad es 20484 Con la ecuacion 644 se calcula el intervalo de confianza de

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS 171

95 por ciento para la diferencia entre las medias de las poblaciones de la siguiente manera

2821 2821(210-121)plusmn20484 --+-shy

13 17 89 plusmn 40085

49129

Se tiene una confianza de 95 por ciento de que la diferencia entre las medias de las poblaciones estan entre 49 y 129 Se puede decir esto porque se sabe quesi se repite el amilisis muchfsimas veces y se calculan los intervalos de confianza de la misma manera cerca de 95 por ciento de los intervalos de confianza induiran la diferencia entre las medias de las poblaciones

Debido a que los intervalos no induyen al cerose conduye que las medias de las poblaciones son diferentes bull

Variancias poblacionales distintas Cuando no se puede conduir que las variancias de dos poblaciones de interes son iguales aun ruando pueda suponerse que las dos poblaciones presentan distribuciones normales no es adecuado utilizar la distribucion t como se acaba de describir para construir los intervalos de confianza

Una solucion al problema de variancias distintas fue propuesta por Behrens (3) y posteriormente fue verificada y generalizada por Fisher (4 5) Neyman (6) Scheffe (7 8) Y Welch (9 10) tambien proponen soluciones EI problema es analizashydo en detalle por Cochran (11)

EI problema gira en tomo al hecho de que la cantidad

no sigue una distribuci6n t con nj + n 2 grados de libertad ruando las variancias 2 shy

de las poblaciones son distintas Consecuentemente la distribucion t no se puede utilizar en la forma habitual pata obtener el factor de confiabilidad del intervalo de confianza para la diferencia entre las medias de dos poblaciones que tienen variancias diferentes La solucion propuesta por Cochran consiste en el calculo del factor de confiabilidad mediante la siguiente formula

wltj + w2tZ t l

f

-0f2 = (645) WI +w2

donde WI 512

np W 2 = s~ n2 tl = tl _ para nj - 1 grados de libertad y t2 = t l

_w2aI2

para n2

- 1 grados de libertad Un intervalo aproximado de confianza del 100(1 shya) por ciento para III - 112 esta dado por

(646)

172

EJERCICIOS

CAPITULO 6 ESTlMACION

FJEIUPLO 644

En la investigacion de Stone et al (A-6) descrita en el ejercicio 643 los investigashydores tambien informaron los siguientes datos de las medici ones referentes a todas las calificaciones del acondicionamiento muscular logradas por los individuos

Muestra n Media Desviaci6n estimdar

Grupo deportista 13 45 3

Grupo sedentario 17 37 10

Se considera que las dos poblaciones de todas las calificaciones de acondicionashymiento muscular siguen una distribuci6n aproximadamente normal Sin embargo no debe suponerse que las dos variancias poblacionales son iguales Se pretende construir un intervalo de confianza de 95 por ciento para la diferencia entre las medias de todas las calificaciones de acondicionamiento muscular para las dos poshyblaciones representadas por las muestras

Soluci6n Se utiliza t de la ecuaci6n 645 para calcular el factor de confiabilidad En la tabla E se muestra que con 12 grados de libertad y 1 - 052 = 975 t( 21788 Analogamente con 16 grados de libertad y 1- 052 = 975 t2 = 21199 Ahora Sf calcula

(3 2 13)(21788) + (102 17)(21199) 139784 t= =

(3 2 13)+(102 17) 065747

=21261

Con la ecuaci6n 646 ahora se construye el intervalo de confianza de 95 por ciento para la diferencia entre las medias de las dos poblaciones

2 2

(45 37)plusmn21261 3 + 10 13 17

8 plusmn 21261 (25641101) 25134

Puesto que el intervalo no incluye acero se concluye que las medias de las dos poblaciones son diferentes bull

Cuando se construyen intervalos de confianza para la diferencia entre las medias de dos poblaciones es posible utilizar la figura 641 para decidir rapidashymente si el factor de confiabilidad debe ser z t 0 tf

Para cada uno de los siguientes ejercicios construya intervalos de confianza de 90 95 y 99 par ciento para las diferencias entre las medias poblacionales Establezca consideraciones que hagan que el metodo sea valido Determine las interpretaciones practica y probabilistica

clJ clJ FIGURA 541 Diagrama de flujo para decidir si e1 factor de confiabilidad debe ser z tot cuando se realizan inferencia inferencias acerca de la diferencia entre las medias de dos pobladones (Para usar un procedimiento no parametrico ver el capitulo 11)

174 CAPiTULO 6 ESTlMACION

para cad a intervalo construido Suponga las variables bajo considerati6n en cad a ejercicio y establezca para que pueden servir a los investigadores esos resultados

641 EI objetivo de un experimento de Buckner et al (A-7) consisti6 en estudiar los efectos del relajamiento muscular inducido por el pancuronium en el volumen del plasma circulante Los individuos estudiados son recien nacidos con un peso mayor a 1700 gramos que necesishytaron de ayuda para respirar durante las primeras 24 horas despues de nacer y cumplieron con otros criterios cHnicos Cinco recien nacidos paraIizados con el pancuronium y siete recien nacidos no tratados presentaron las siguientes estadisticas en la segunda de las tres mediciones del volumen de plasma (ml) hecha durante la respiraci6n mecanica

Paralizados 480 81 No tratados 567 81

La segunda medici6n para el grupo tratado ocurri6 de 12 a 24 horas despues de la primera dosis de pancuronium Para el grupo no tratado las mediciones se hicieron de 12 a 24 horas despues de iniciar la respiracion mecanica

642 Zuckery Archer (A-8) afirman que la N-nitrosobis (2-oxopropyl)amina (BOP) y las nitrosaminas 3-oxidizadas producen una alta incidencia de tumores de conductos pancreaticos en el hamster dorado sirio Estudiaron los efectos en el peso sangufneo en la glucosa del plasma en la insulina yen los niveles de transamina glutamico-oxaloacetica del plasma (GOT) de los hamsters expuestos in vivo a la BOP Los investigadores reportaron los siguientes resultados en ocho animales tratados y 12 sin tratamiento

Variable Sin tratamiento Con tratamiento

Glucosa del plasma (mglgl) 101 plusmn 5 74plusmn 6

FUENTE Peter F Zucker y Michael C Archer Alterations Pancreatic Islet Function Produced by Carcinogenic Nitrosamines in the Syrian Hamster AmericanJournal oPathology 133 573-577

Los datos son la media de la muestra plusmn la estimaci6n del error estandar de la media de la muestra

643 Los objetivos de un estudio de Davis et al (A-g) son evaluar 1) la eficacia del programa auto ayuda momento para dejar de fumar cuando se utiliza con base de uno a uno en el hogar y 2) la viabilidad de ensefiar temicas para abandonar el habito de fumar a los estudiantes de enfermerfa en bachillerato A estudiantes graduados de enfermerfa inscritos en dos cursos de metodologia de la investigacion de la Universidad de Ottawa se les invit6 a participar en el proyecto Se aplic6 un cuestionario de opcion multiple para abandonar el habito de fumar a 120 estudiantes de enfermeria que participaron y a otros 42 estudiantes que no participashyron antes ni despues del estudio Se calcularon las diferencias entre las calificaciones antes y despues del estudio as como las siguientes estadisticas a partir de las diferencias

EJERCICIOS 175

Grupo Media Desviaci6n estandar

Participantes (A) 214444 15392 No participantes (B) 33333 14595

644 El doctor Ali Khraibi (A-IO) de la CHnica y Fundaci6n Mayo condujo una serie de experishymentos con el fin de evaluar las respuestas diureticas y natiureticas de ratas Okamoto esponshytaneamente hipertensivas (REB) y ratas Wistar-Kyoto (WRY) para dirigir incrementos en la presion hidrostatica renal intersticial (PBRI) Para aumentar la PBRI se utiIiz6 la expansi6n directa del volumen renal intersticial (DRIVE) a traves de una matriz implantada cronicamente en el rinOn Entre los datos registrados durante el estudio estan las siguientes mediciones de excreci6n de sodio a traves de la orina (UNa V) durante el periodo de DRIVE

Grupo

REB 632572796483527 2WKY 420469482 108210

FUENTE Publicada con autorizaci6n del Dr Ali A Khraibi

645 Osberg y Di Scala (A-II) realizaron un estudio centrado en la eficacia de los cinturones de seguridad para reducir 1esiones entre sobrevivientes de accidentes automoviHsticos internashydos en hospitales con edades de 4 a 14 afios El estudio compar610s resultados de 123 ninos que utilizaron el cintur6n contra 290 que no 10 utilizaron entre aquellos que se vieton enshyvueltos en tales accidentes y que fueron hospitalizados El informe con tenia la siguiente estadistica del numero de dfas en la unidad de cuidados intensivos

Grupo Media Error estandar estimado

Utiliz6 el cintur6n 83 16 No utiliz6 el cintur6n 139 18

646 La medicion del diametro transversal del coraz6n de hombres y mujeres adultos presenta los siguientes resultados

sx Grupo Tamafto de Ia muestra (cm) (cm)

Varones 12 1321 105 Mujeres 9 IIOO 101

Considere que las poblaciones siguen una distribucion normal con variancias iguales

176 CAPITULO 6 ESTIMACION

647 Veintiruatro animales de laboratorio con deficiencia de vitamina D fueron divididos en dos grupos iguales EI grupo 1 recibi6 un tratamiento consistente en una dieta que proporcionashyba vitamina D EI segundo grupo no fue tratado AI termino del periodo experimental se midieron las concentraciones de calcio ensuero obteniendose los siguientes resultados

Grupo tratado X 111 mg 100 mls = 15 Grupo sin tratamiento x= 78 mg 100 ml s = 20

Considere que las poblaciones siguen una distribuci6n normal con variancias iguales

648 Ados grupos de nifios se les hicieron pruebas de agudeza vi~ual El grupo 1 estuvo formado por 11 nifios que recibieron la atenci6n de medicos privados La calificaci6n media para este grupo fue de 26 con una desviaci6n estandar de 5 El segundogrupo que incluy6 14 nifios que recibieron atenci6n medica por parte del departamento de salud publica tuvo una calishyficaci6n promedio de 21 con una desviaci6n estandar de 6 Suponga que las poblaciones siguen una distribuci6n normal con variancias iguales

649 El tiempo promedio de estancia de una muestra de 20 pacientes dados de alta de un hospital general es de siete dras con una desviaci6n estaildar de dos dras Una muestra de 24 padenshytes dados de alta de un hospital de enfermedades cr6nicas tuvo un tiempo promedio de estancia de 36 dfas con una desviaci6n estindar de 10 dias Suponga que la poblaci6n sigue una distribuci6n normal con variancias desiguales

6410 En un estudio de factores que se consideran responsables de los efectos adversos del tabashyquismo sobre la reproducci6n humana se midieron los niveles de cadmio (nanogramos por gramo) en el tejido de la placenta de una muestra de 14 madres que fumaban y una muestra aleatoria independiente de 18 mujeres no fumadoras Los resultados fueron los siguientes

No fumadoras toO 84 128250 118 98 125 154 235

94251 1952559875 118122150

Fumadoras 300301150241305178168148

134285 175 144 125204

ms probable que el nivel medio de cadmio registrado sea mayor entre las fumadoras que entre las no fumadoras ~Por que se llegarfa a esta conclusi6n

65 INTERVALO DE CONFIANZA PARA IA PROPORCION DE UNA POBIACION

Muchas preguntas de interes para que el tecnico en salud tienen relacion con las proporciones de poblacion ~Que propordon de padentes que redben un tipo espeshycial de tratamiento se recuperan ~Que proporcion de alguna poblacion tiene cierta enfermedad ~Que propordon de una poblacion es inmune a derta enfermedad

Para estimar la proporcion de una poblacion se procede en la misma forma que cuando se estima la media de una poblacion Se extrae una muestra de la poblacion de interes y se calcula su proporcion p Esta se utiliza como el estimador puntual para la proporcion de la pobladon Un intervalo de confianza se obtiene mediante la siguiente formula general

estimador plusmn (coefidente de confiabilidad) X (error estandar)

EJERCICIOS

EJERCICIOS 177

En el capitulo anterior se vio que cuando np y n(1 - p) son mayores que 5 se puede considerar que la distribuci6n muestral de pse aproxima bastante a una distribuci6n normal Cuando se cumple con esta condici6n el coeficiente de confiabilidad es algUn valor de z de la distribuci6n normal estandar Esta visto que el error estandar es igual a (J p =fi(l-p) n Puesto que p que es el parametro que se trata de calcular se desconoce se debe utilizar pcomo una estimaci6n Asf se estima (J j por medio de ~p(l Pn y el intervalo de confianza de 100(1 - 0) por ciento para pesta dado por

pplusmn Z(I-1J2)~P(l- P) Fn (651)

Este intervalo se interpreta tanto desde el punto de vista practico como probabilistico

FJEMPLO 651

Mathers et al (A-12) encontraron queen una muestra de 591 pacientes internados en un hospital psiquiatrico 204 admitieron que consuniieron marihuana al meshynos una vez durante su vida Se pretende construir un intervalo de confianza de 95 por ciento para la proporcion de individuos que consumieron marihuana durante su vida en la poblaci6n muestreada de los internos del hospital psiquiatrico

Solucion La mejor estima~i6n puntual para la proporci6Il de la poblaci6nes p== 204591 3452 El tamafio de la muestra y hiestimacion de p tienen una magnitud suficiente parajustifKar el empleo de la distribucion norshymal estandar paraelaborar un intervalo de confianza EI coeficiente de corifiabilidad que corresponde alnivel de confianza de 95 es 196 la estimacion del errorestandar (Jp es ~p(l-pgtn = (3452)(6548)591

0 1956El intervalo de confianza para p de acuerdo con estos datos es

3452 plusmn 196(01956) 3452 plusmn 0383 3069 3835

Se puede decir que se tiene 95 por ciento de confianza de que la proporshycionpeste entre 3069 y 3835 ya que al repetir el muestreo casi 95 por ciento de los intervalos construidos en la forma de este intervalo inclushyyen a la proporcion p real Con base en estos resultados se espera con una confianza de 95 por ciento encontrar que entre 3069 y 3835 por ciento de los internados en el hospital psiquiatrico tiene antecedentes de consumo de marihuana bull

Para cada uno de los siguientes ejercicios establezca la interpretacion prictica yprobabilistica de los intervalos que se pide construir Identifique cada componente del intervalo la estimashycion puntual el coeficiente de confiabilidad yel error estandar Explique por que los coefishycientes de confiabilidad no son los misInos para todos los ejercicios

178 CAPITULO 6 ESTIIlACI6N

651 En una investigaci6nde ninos maltratados en pacientes psiquiatricos Brown y Anderson (A-IS) encontraron 166 pacientes en una muestra de 947 con antecedentes de abuso sexual y maltrato flsico Construya un intervalo de confianza de 90 por dento para la proporci6n de la poblaci6n

652 Catania et at (A-14) obtuvieron datos respecto al comportamiento sexual de una muestra de hombres y mujeres solteros con edades entre 20 y 44 residentes en areas geoijfaficas caracshyterizadas por tasas altas de enfermedades de transmision sexual e ingreso a programas de drogas De 1229 encuestados 50 por ciento respondieron que nunca utilizaron preservatishyvos Construya un intervalo de confianza de 95 por ciento para la proporcion de la poblaci6n que nunca utiliza preservativos

653 Rothberg y Lits (A-I 5 ) estudiaron el efecto del estres de la maternidad durante el embarazo en el peso del producto Los individuos eran 86 mujeres blancas con antecedentes de estres que no tenfan faetores de riesgo medico u obstetrico conoddo de peso bajo del producto Los investigadores eneontraron que 128 por dento de las madres estudiadas dieron a luz bebes que cubrfan el criterio de peso bajo Construya un intervalo de confianza de 99 por ciento para la proporci6n de la poblaci6n

654 En una muestra aleatoria simple de 125 varones desempleados quienes desertaron de la escuela preparatoria entre las edades de 16 y 21 anos inclusive 88 declararon que eran consumidores regulares de bebidas alcoh6litas Construya un intervalo de eonfianza de 95 por ciento para la proporcion de la poblacion

66 INTERVALO DE CONFIANZA PARA lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS POBlACIONES

A menudo se tiene interes en conocer la magnitud de la diferencia entre las proporcioshynes de dospoblaciones Es posible que se quiera comparar por ejemplo entre hombres y mujeres dos grupos de edades dos grupos socioecon6micos 0 dos grupos de diagshynostico con respecto a la proporcion que posee alguna caractenstica de interes Un estimador puntual insesgado de la diferencia entre dos proporciones de las poblacioshynes se obtieneal calcular la diferencia de las proporciones de las muestras PI P2 Tal como Se ha visto cuando n1 Yn2 son de gran tamano y las proporciones de la poblacion no estan muy cerca de 0 0 de 1 es posible aplicar el teorema del limite central y utilizar la teona de la distribucion normal para obtener los intervalos de conshyfianza EI error estandar de la estimacion se calcula mediante la siguiente formula

dado que como regIa se desconocen las proporciones de Ia poblacion Un intervashy10 de confianza de 100(1 - a) por ciento para PI P2 se obtiene as

(661)

Es posible interpretar este intervalo desde elpunto de vista probabiHstico y practico

EJERCICIOS 179

EJEMPLO 661

Borst et al (A-16) investigaron la relaci6n de desarrollo del ego edad sexo y diagshyn6stico de suicidio entre los internos adolescentes de la unidad de psiquiatria La muestra consistia en 96 varones y 123 niiias con edades entre 12 y 16 aiios seleccioshynados de entre los internados en la unidad de adolescentes y niiios de un hospital psiquiatrico privado Se reportaron 18 niiios y 60 niiias con intento de suicidio Cons ishyderese el comportamiento de las niiias como el de una muestra aleatoria simple a partir de una poblaci6n similar de niiias y que los j6venes igualmente pueden considerarse como una muestra aleatoria simple extraida de una poblaci6n similar de niiios Para estas dos poblaciones se pretende construir un intervalo de confianshyza de 99 por ciento para la diferencia entre las proporciones de los individuos con intento de suicidio

Soluci6n Las proporciones para las niiias y niiios respectivamente son Pc = 601 123 = A878y PB = 1896 1875 La diferencia entre las proporciones de lasmuestrases Pc PB = 4878 1875 = 3003 El error estandar estimado de la diferenda entre las proporciones de las muestras es

(4878)(5122) (1875)(8125) ---~~-~ +-------shy

123 96

El factor de confiabilidad a partir de la tabla D es 258 de modo que el intervalo de confianza con la f6rmula 661 es

3003 plusmn 258(0602) 14504556

Se dene la confianza de 99 por dento de que para las poblaciones muestteadas la ptopord6n de intentos de suiddio entre las niiias exceshyde a lapropord6n de intentosde suiddio entre los varones por 1450 y 4556

Puesto que el intervalo no incluye al cero se concluye que las dos proporciones de pobladones son diferentes bull

FJERCICIOS

Para cada uno de los siguientes ejercicios establezca las interpretaciones pnicticas y probabishylisticas de los intervalos que se pide construir Identifique cada componente del intervalo la estimaci6n puntual el coeficiente de confiabilidad y el error estandar Explique por que los coeficientes de confiabilidad no son el mismo para todos los ejercicios

661 Hargers et al (A-17) del departamento de Salud PUblica y Ambieptal en Amsterdam condushyjeron un estudio en el que los individuos eran consumidores de drogasinyectables (CDI) En una muestrade 194 consumidores de metadona regular de largo plazo (MLP) 145 eran varones En una muestra de 189 CDIque no consmiddotumian MLP 133 eran varones Establezca las consideraciones necesarias acerca de las muestras ypoblaciones representadas y construshy

180 CAPITULO 6 ESTlMACI6N

ya un intervalo de confianza de 95 por ciemo para la diferenda entre las proporciones de varones en las dos poblaciones

662 Una investigaci6n de Lane et ai (A-I8) valor6las diferencias en las pnicticas de deteccion de cancer de seno entre muestras de mujeres predominantemente de bajos ingresos con edashydes de 50 a 75 anos que lltilizan los servicios de c1inicas de sailld para todo el estado y mlljeres de la misma edad residentes en ciudades donde las c1inicas de salud son locales De las 404 encuestadas seleccionadas en toda la comunidad 592 por ciento estuvo de acuerdo con el siguiente comentario acerca del cancer de pecho las mujeres prolongan su vida si detectan el cancer desde el inicio De entre 795 usuarias de clinicas de salud en la mllestra 449 por ciento estuvo de acuerdo Establezca las suposiciones apropiadas para elaborar un intervalo de confianzade 99 por ciento para la diferencia entre las dos proporciones de las poblaciones de interes

663 Williams et at (A-19) encuestaron a una muestra de 67 medicos y 133 enfermeras con famishyliares farmacodependientes EI prop6sito del estudio era evaluar la influencia en los medishyEOS y enfermeras de estar estrechamente involucrados con una 0 mas personas farmaco dependientes Cincuenta y dos medicos y 89 enfermeras dijeron que vivian con personas farmacoldependientes que adversamente afectaban 8U trabajo E8tablezca todas las consideshyraciones que crea necesarias para construir un intervalo de confianza de 95 por ciento para la diferencia entre las proporciones en las dos poblaciones de trabajadores que se espera esten adversamente afectados por vivir con personas farmacodependientes

664 Aronow y Kronzon (A-20) identificaron los factores de riesgo coronado entre hombres y mujeres en una dinica de cuidados de la salud a largo plazo De los 215 individuos negros 58 tienen diabetes mellitus al igual que 217 individuos blancos de 1140 Elabore un intervalo de confianza de 90 por ciento de confianzapara la diferencia entre las proporciones de las dos poblaciones tCuaies son las poblaciones correspondientes ~Que consideraciones son necesarias para hacer valido el procedimiento de inferencia

67 DETEHMINAUON DEL TAMANO DE LA MUESTRA PARA LA ESTIMACIONDEIAS MEDIAS

La pregunta de que tan grande debe ser una muestra surge inmediatamente al inicio del planteamiento de cualquier encuesta 0 experimento Esta es una pregunshyta importante y no se debe tratara la ligera Tomar una muestra mas grande de 10 necesario para obtener los resultados deseados es un desperdicio de recursos mienshytras que por otro lado las muestras demasiado pequenas con frecuencia dan resulshytados que carecen de uso practico En esta secci6n se estudia c6mo determinar el tamano de la muestra de acuerdo con la situaci6n A continuaci6n se proporciona un metodo para determinar el tamano de la muestra que se requiere para estimar Ia media de la poblaci6n yen la siguiente secci6n se aplica este metodo para detershyminar el tamano de la milestra cuando se desea estimar la proporci6n de una poshyblaci6n Mediante extensiltmes directas de estos metodos es posible determinar el tamano necesario de las muestras para situaciones mas complicadas

Objetivos El objetivo de la estimaci6n porintervalos es el de obtener intervalos estrechos con alta confiabilidad Si se observan los componentes ~e un intervalo de confianzase veque 8U dimension esta determinada por la magnitud de la cantidad

(coeficiente de confiabilidad) x (error estandar)

131 67 DETERMINACION DEL TAMANO PARA LA l-IUESTRAmiddot

ya que lamagnitud total del intervalo de confIanza es eldoble de esta cantidad Se aprendi6 que a esta cantidad generalmente se Ie llama precisi6n de la estimaci6n o margen de error Para un error estandar dado incrementar la confIabilidad signishyfIca un coefIciente con mayor confIabilidad Y un coefIciente con mayor confIabilidad produce unintervalo mas amplio

Por otra parte si se ftia el coefIciente de confIabilidad la unica manera de redudr la amplitud del intervalo es la reducci6n del error estandar Dado que el error estandar es igual a (J IJ y como (J es una constante la unica forma de obtener un error estandar menor es tomar una muestra grande ~Que tan grande debeser la muestra Esto depende del tamafio de (J la desviad6n estandar de la poblaci6n asi como del grado de confIabilidad y dimensi6n del intervalo deseados

Suponga que se desea obtener un intervalo que se extienda d unidades hacia uno y otro lado del estimador Ellose enuncia

d (coefIciente de confIabilidad) X (error estandar) (671)

Si el muestreo es con reemplazos a partir de una poblaci6n infInita 0 de una que sea 10 sufIcientemente grande como para ignorar la correcci6n por poblaci6n fInita la ecuaci6n 671 se transforma en

(J

d z- (672)-r la cual cuando se despeja n nos da

(673)d2

Cuando el nmestreo se hacesin reemplazos a partir de una poblaci6n fInita y peshyquefia se requiere de la correcci6n por poblaci6n fInita y la ecuaci6n 671 se transforma en

(J~d (674)fN~

que al despejar n resulta en

n-----shy (675)d 2(N 1) + Z2(J2

Si puede omitirse la correcci6n por poblad6n fInita la ecuaci6n 675 se reshyduce a la ecuaci6n 673

Estillluci6n de (J 2 Las f6rmulas para el tamafio de la muestra requieren del conocimiento de (J2 pero como ya se ha sefialado la varian cia de la poblaci6n casi

132 CAPITULO 6 ESTlMACION

siempre sedesconoce Como resultado esnecesarioestimar (J2 Las fuentes de estishymaci6n de(J2 que se utilizan con mas frecuencia son las siguientes

1 Se extrae una muestrapilato 0 prel~l11inar de lapoblaci6n y se puede utilizar la variancia calculada a partir de esta muestra como unaestimaci6n de (J2 Las observaciones uti lizadas en la muestra piloto se toman como parte de la muesshytrafinal de modo que n (el tamaiio calculado de la muestra) n

1 (el tamaiio

de la muestra piloto) n2 (el numero de observaciones necesarias para satisfacer el requerimiento total del tamaiio de la muestra)

2 A partir de estudios anteriores osimilares es posible obtener estimaciones de (J2

3Si se cree que la poblaci6n de lacual se extrae la muestraposee una distribushyci6n aproximadamente nqrmal se puede aprovechar el hecho de que la amshyplitud es aproximadamente igual a 6 desviaciones estandar y calcular (J R6 Este metodo requiere aIglin conocimiento acerca de los valores minimo y maximo de la variable en la poblaci6n

EJEMPLO 671

Un nutri6logo del departamento de salud al efectuar una encuesta entre una poshyblacien de muchachas adolescentes con e1 fin de determinitr su ingesti6n diaria promedio de proteinas (medidas en gramos) busc6 el consejo de un bioestadistico con respecto al tamaiio de la muestra que deberfa tomar

~Que procedimiento debe seguir el bioestadistico para asesorar al nutri610go Antes de que el estadistico pueda ayudar el nutri6logo este debe proporcionar tres elementos de informaci6n h dimensi6n deseada del intervalo de confianza el nivel de confianza deseado y la magnitud de la variancia de la poblaci6n

Soludon Suponga que el nutri6logo requiere un intervalo con una dimensi6n de aprQximadamente 10 gramos es decir la estimaci6n se deberfa enconshytrar alrededor de 5 gramos de la media de la poblaci6n en ambas direcshyciones En otras palabras se desea un margen de error de 5 gramos Suponga que se decide por un coeficiente de confian7a de 95 y que con base en su experiencia previa el nutri6logo percibe que la desviaci6n estandar de la poblaci6n es probablemente de alrededor de 20 gramos EI estadfstico dispone ya de la informaci6n necesaria para calcular el tamaiio de la muestra z 196 (J = 20 y d 5 Suponga que el tamaiio de la poblaci6n es grande asf queel estadistico puede ignorar la correcshyci6n por poblaci6n finita y utilizar la ecuaci6n 673 Con las sustitucioshynes adecuadas el valor de n se calcula como

Se recomienda que el nutri610go tome una muestra de tamafio 62 AI calcular el tamaiio de una muestra a partir de las ecuaciones 673 0 675 el resultado se redondea al siguiente nurnero entero mayor si los calculosdan un numerocon decimales bull

183 68 DETERMINACION DEL TAl1ANO PARA LAS PROPORCIONES

EJERCICIOS

671 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su hospital Si se desea un intervalo de confianza de 99 por dento con una amplitud de 1 libra ~que tan grande debe ser la muestra de los registros de nacimiento Suponga que un estimashy

dor razonable para (J es 1 libra ~De que tamano debe ser la muestra si el coeficiente de confiabilidad se hace descender a 95

672 El director de la secdon de control dela rabia del departamento de salud publica desea extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso del ano anterior para estimar la edad media de las personas mordidas Requiere un intervalo de confianza de 95 por dento decide utilizar un valor de 25 para d y a partir de estudios anteriores estima que la desviacion estandar de la poblacion esta alrededor de los 15 anos ~Que tan grande debe ser el tamano de la muestra

673 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mglOO ml) de pacientes atendidos en una clinica para diabeticos durante el transcurso de los ultimos 10 anos Determine el numero de registros que el medico debe examinar para obtener un intershyvalo de confianza de 90 por ciento para 11 si la dimension requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varian cia de 60

674 Se deseaestimar la edad media en la que a los padentes de esclerosis multiple se les diagnosshytico el padecimiento por primera vez Se requiere un intervalo de confianza de 95 por dento con una dimension de 10 anos Si la variancia de la poblaci6n es de 90 ~que tan grande debera ser la muestra

68 DETERMINACION DELTAMANO DE lA MUESTRA PARA lA ESIDIACION DE lAS PROPORCIONES

EI metodo para estimar el tamafio de la muestra cuando se requiere estimar la proshyporcion de una poblacion es esencialmente el mismo que se describio para estimar la media de una poblacion Se aprovecha el hecho de que la mitad del intervalo deseashydo d se puede igualar al producto del coeficiente de confiabilidad y el error estandar

Si se supone que el muestreo ha sido hecho de manera aleatoria y que existen condiciones que garanticen que la distribuci6n de psea aproximadamente normal se obtiene la siguiente formula para n cuando el muestreo es con reemplazo cuanshydo se realizaa partir de una poblacion infinita 0 ruando la poblacion muestreada es 10 suficientemente grande como para hacer innecesario el uso de la correcci6n por poblacion finita

n (681)

dondeq = I-p Si la correccion por poblacion finita no puede descartarse la formula adecuashy

da paran es

(682)n d 2 (N -1)+z2pq

euan do N es grande en comparacion con n (es decir n IN 05) se puede pasar por alto la correccion por poblacion finita y la ecuacion 682 se reduce a la ecuacion 681

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

158 CAPiTULO 6 ESTIMACION

EJEMPLO 623

Un equipo de investigadores esta interesado en la puntualidad de los pacientes en las citas concertadas En un estudio de flqjo depacientes en los consultorios de medicos generales se encontr6 que una muestra de 35 pacientes llegaba 172 minutos tarde a las citas en promedio Una investigaci6n previa habia demostrado que la desviaci6n estandar era de 8 minutos aproximadamente Se tuvo la sensaci6n de que la distribushyci6n de la poblaci6n no era normal ~Cual es el intervalo de confianza de 90 por ciento para 11 que es el promedio real de impuntualidad en las citas

Soluci6n Dado que el tamafio de la muestra es bastante grande (mayor que 30) y se conoce la desviaci6n estandar de la poblaci6n la situaci6n se aproxishyrna al teorema del limite central y se supone que la distribuci6n muestral de xpresenta una distribud6n aproximadamente normal AI consultar la tabla D se encuentra que el coeficiente de confiabilidad que corresponshyde a uri coeficiente de confianza de 90se aproxima a 1645 si se interpola El error estandar es de C5z 8-35 13522 de modo que el intervalo de confianza de 90 por ciento para 11 es

172 plusmn 1645(13522) 172 plusmn 22 150 194 bull

Con frecuencia cuando la muestra es 10 suficientemente grande para aplicar el teorema dellfmite central la variancia de la poblacion se desconoce En ese caso se sustituye esta variancia conla de la muestra en la f6rmula para construir el intervashy10 de confianza para la media de la poblacion

Andlisispor computadora Cuando se requiere de los intervalos de confianza se economiza una buena cantidad de tiempo mediante el uso de una computadora la cual puede ser programada para construir los intervalos de datos no procesados

EJEMPLO 624

Los siguientes datos corresponden a los valores de la actividad (micromoles por minuto por gramo de tejido) de cierta enzima medida en el tejido gastrico normal de 35 pacientes con carcinoma gastrico

60 1189 614 788 273 2464 571 1827 537 374 449 262 448 971

372 898 411 348 1925 550 622

610 319 406 413 767 385 674

521 603 533 662 1177 307 1499

Mediante el uso del paquete de software para computadora MINITAB se pretenshyde construirun intervalo de confianza de 95 por ciento para la media de la poblashycion Suponga que la variancia de la poblaci6n es iguala 36 No es necesario suponer que la poblaci6n muestreada de val ores sigue una distribuci6n normal porque el tamafio de la muestra es losuficientemente grande para aplicar el teoreshyrna del limite central

159 62 INTERV ALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACION

Caja de dialogo Comandos de la sesi6n

Statgt Basic Statisticsgt 1-Sample z MTB gt ZINTERVAl 95 6 C1

Teclear Cl en Variables Se1ecdonar Confidence interval y teclear 95 en la caja de texto Teclear6 en Sigma Clic OK

Resultados

Confidence Intervals

The assumed sigma = 0600

Variable MicMoles

N 35

Mean 0718

StDev 0511

SE Mean 0101

950 Cr (0519 0917)

FIGURA 622 Procedimiento del paquete MINITAB para construir un intrevalo de conshyfianza de 95 por ciento para la media de la poblacion ejemplo 624

Solucion Se introducen los datos en lacolumna 1 y se procede como se muestra en la figura 622 Estas instrucdones indican a la computadora que e1 factor de confiabilidad es z que se necesita unintervalo de conshyfianza de 95 por dento que la desviaci6n estandarde la poblaci6n es de 6 y que los datos estan en la columna 1 El resultado indica que la media de la muestra es 718 la desviad6n estandar es 511 y e1 error estandar de la media af es 6J35 101

Se tiene 95 pordento middotde confianza de que la media de la poblashyci6n se encuentra entre 519y 917 bull

Puede obtenerse los intervalos de confianza a traves de otros paquetes de sofuvare Por ejemplo SASreg puede construir intervalos de confianza a traves de PROC MEANS o PROC UNIVARIATE

Otras eslimaciones de La tendencia central Tal como se ha visto la meshydia es muy sensible a los val ores extremos es dedr aquellos que se desvfan consideshyrablemente de la mayorfa de las mediciones en el con junto de datos A dichos valores se les conoce como sesgos Tambien se puede apreciar que lamediana que no es sensible a las mediciones extremas algunas veces se utiliza en lugar de la media como medida de tendenda central cuando los sesgos estan presentes Por la misshyrna raz6n quiza se prefiera el uso de la mediana de la muestra comomiddotestimador de la rnediana de la poblaci6n cuando se requiere realizar inferencias acerca de la tendenda central de la poblaci6n No solamente se utiliza la mediana de la muestra

160 CAPITULO 6 ESTlMACION

como una estimacion puntual para la mediana de la poblacion sino que tambien es posible construir un intervalo de confianza para la mediana de la poblacion En esta obra no se proporciona la formula pero esta se puede encontrar en la obra de Rice (1)

Media ajustada Los estimadores que son insensibles a los sesgos se Haman estimadores eficaces Otra medida y estimador eficaz de tendencia central es la media ajustada Para un conjunto de datos que contiene n mediciones se calcula el 1000 por ciento de la media ajustada como sigue

1 Ordenar las mediciones

2 Descartar las medici ones mas pequeiias y mas grandes que 100a por ciento de las mediciones El valor recomendado para a esta entre 1 y 2

3 Calcular la media aritmetica de las mediciones restantes

Observe que la mediana podrfa considerarse como 50 por ciento de la media ajusshytada Se debe recordar que la media ajustada para el conjunto de datos es una de las medidas descriptivas que puede calcular MINITAB

FJERCICIOS

Construya para cada uno de los siguientes ejercicios los intervalos de confianza al 90 95 Y 99 por ciento para la media de la poblacion y establezca para cada uno la interpretacion probabilistica y practica Indique cualinterpretacion puede ser mas aderuada para utilizar ruando se trata sobre intervalos de confianza con alguien que no conoce de estadfstica y establezca eI razonamientode por que se eUgi6 Explique por que los tres intervalos no tjenen la misma amplitud Indique cual de los tres intervalos es preferible como estimador de la media de la poblacion y establezca el razonamiento de la elecci6n

621 Se pretende estimar el numero promedio de latidos del coraz6n por minuto para cierta poblaci6n Se encontr6 que el numero promedio de latidos por minuto para 49 personas era de YO Considere que esos 49 pacientes constituyen una muestra aleatoria y que la poblacion sigue una distribucion normal con una desviaci6n estandar de 10

622 Se pretende estimar la concentraci6n media de bilirrubina indirecta en el suero en nmos de cuatro dias de nacidos La media para una muestra de 16 ninos es de 598 mglOO cc Conshysiderese que la concentraci6n de bilirrubina en los ninos de cuatro dfas de nacidos sigue una distribucion aproximadamente normal con una desviaci6n estandar de 35 mgIOO cc

623 En un estudio acerca de la duraci6n de la hospitalizacion dirigido por vados hospitales en cooperacion se extrajo una muestra aleatoria de 64 individuos con ulcera peptica de la lista de todos los pacientes con esa enfermedad internados alguna vez en los hospitales particishypantes Se determin6 para cada uno de eUos el tiempo de hospitalizaci6n Se encontr6 que la duraci6n media de hospitalizaci6n fue de 825 dfas y se sabe que la desviaci6n estandar de la poblaci6n es de tres dfas

624 Una muestrade 100 hombres adultos aparentemente sanos de 25 anos de edad muestra una presi6n sist61ica sangufnea media de 125 Considere que la desviaci6n estandar de la poblaci6n es de 15

161 63 DISTRIBUCI6N

625 Algunos estudios acerca de la enfermedad Alzheimer (EA)han mostrado un incremento en la producci6n de 14C0

2 en pacientes con ese padecimiento Durante un estudio se obtuvieshy

ron los siguientes valores de 14C02

a partir de 16 biopsias de neocorteza de pacientes con la enfermedad (EA)

1009 1280 1180 12551547 2352 1956 1080

1776 1767 1680 2050 1452 2857 3100 1621

Considereseque la poblaci6n sigue una distribuci6n normal con una desviaci6n estandar de 350

63 DISTRIBUCION t

En la seccion 62 se describe un procedimiento para obtener un intervalo de conshyfianza para la media de una poblaci6n EI procedimiento requiere del conodmiento de la varianda de la poblacion de la que se extrae la muestra Puede parecer un tanto extrafio que se tenga conocimiento de lavariancia de la poblacion y no se conozca elvalor de la media de la poblacion De hecho es comun en situacioshynes como las que se han presentado que se deSconozca tanto la variancia como la media de la poblacion Esta situacionpresenta un problema respecto a la construcshycion delos intervalos de confianza Por ejemplo aun cuando la estadfstica

x J1shyZ=---

crJn presenta una distribudon normal cuando la poblacion tambien tiene una distribuci6n normal y sigue una distribuci6n aproximadamente normal cuando n es muy grande independientemenle de la forma funcional de la poblacion no se puede hacer uso de este hecho porque cr se desconoce Sin embargo no todo esrn perdido y la soluci6n mas logica para este problema es utilizar la desviacion estandar de ~muestra

s = ~L(Xi - x)2(n-l)

para sustituir cr Por ejemplo cuando el tamafio de la muestra es mayor que 30 la confianza en s como una aproximacion de cr es por 10 general sustancial por 10 que se justifica la utilizacion de la teorfa de la distribudon normal para construir un intervalo de confianza para la media de la poblacion En tal caso se procede como se indica en la seccion 62

Cuando se tienen muestras pequefias es imprescindible encontrar otro proceshydimiento para construir intervalos de confianza

Como resultado del trabajo de Gosset (2) escrito bajo el seudonimo de Student se dispone de otra alternativa conocida como distribuci6n t de Student con frecuenda abreviada como distribuci6n t

La cantidad

sigue esta distribucion

162 CAPiTULO 6 ESTIMACION

Propiedades de la distribucion t La distribuci6n t tiene las siguientes proshypiedades

1 Tiene una media de O

2 Es simetrica con respecto a la media

3 En general tiene una variancia mayor que 1 pero esta tiende a I a medida que aumenta el tamaiio de la muestra Para dfgt 2 la variancia de la distribushyci6n t es dfl(df - 2) donde df representa los grados de libertad En forma alterna puesto que df n - 1 para n gt 3 se puede escribir la variancia de la distribuci6n t como (n l)(n 3)

4 La variable t va de - hasta + 00DO

5 La distribuci6n t es realmente una familia de distribuciones puesto que hay una distribuci6n diferente por cada valor de la muestra de n - 1 que es el divisor que se utiliza para ca1cular S2 Recuerde que n - 1 representa los grados de libertad En la figura 631 se muestran las distribuciones t correspondienshytes a algunos valores de los grados de libertad

6 Comparada con la distribuci6n normal ladistribuci6n t es menos espigada en el centro y tiene colas mas largas En la figura 632 se com para la distribushyci6n t con la distribuci6n normal

7 La distribuci6n t se aproxima ala distribuci6n normal a medida que n - 1 se aproxima al infinito

La distribuci6n t al igual quela distribuci6n normal estandar se ha tabulado ampliamente Una de estas tablas es la tabla E del apendice Tal como se puede apreciar se debe tomar en cuenta eLcoeficiente de confianza y los grados de libershytad cuando se utiliza la tabla de la distribuci6n t

FIGUR- 631 Distribuci6n t para diferentes grados de libertad

-----

163 63 DISTRIBUCION

__ Distribucion normal

- - - Dislribucion I

x

FIGURA 632 Comparaci6n de las distribuciones normal yt

Es posible utilizar el paquete MINITAB para graficar la distribuci6n t (para grados espedficos de libertad) y otras distribuciones Despues de asignar el eje horizontal y las siguientes direcciones en el cuadro de Set Patterned Data seleccioshyne del menu Calc y despues Probability Distributions Utilice el cuadro de diashylogo Plot para generar la grafica

Inlervalos de conJiQllia qllR uJilban fa dislribucion t El procedimien to general para construir interval os de confianza no se ve afectado por la necesidad de utilizar la distribuci6n t en lugar de la distribuci6n normal estandar Aun es necesario usar la relaci6n expresada por

estimador plusmn (coeficiente de confiabiIidad) x (error estandar)

Lo que es diferente es el origen del coeficiente de confiabilidad Este se obtiene a partir de la tabla de la distribucion t en lugar de la tabla de la distribuci6n normal estandar Para ser mas especfficos cuando se obtienen muestras a partir de una distribushycion normal cuya desviaci6n estdndi17 a se desconoce ell OO( 1 - a) por ciento del intervalo de confianza para la media de la poblaci6n J1 estd dado por

(631 )

Es importante aclarar que el requisito para el uso valido de la distribucion t es que la muestra debe ser extrafda de una poblad6n con distribucion normal Sin embarshygo la experiencia ha demostrado que se pueden tolerar desviaciones moderadas de esterequisito Como consecuencia la distribucion t se utiliza incluso cuando se sabe que la poblaci6n original se desvia de la normalidad Lltl mayorfa de los invesshytigadores requieren que al menos pueda sostenerse el supuesto de una distribushyd6n de poblacion en forma de montfculo

EJEMPLO 631

Maureen McCauley (A-I) realiz6 un estudio para evaluar los efectos de un conjunto de instrucciones de mecanica en ellugar de labores sobre el desempeno laboral de obreros jovenes recientemente contratados Se utilizaron dos grupos de individuos elegidos aleatoriamente uno de los grupos para aplicar el experimento y el otro

164 CAPITULO 6 ESTlMACI6N

como grupo de control EI grupo con el que se experimento recibio una hora de capacitacion impartida por un terapeuta ocupacional EI grupo de control no recishybio esta capacitacion Para evaluar el esfuerzo de cada obrero para levan tar bajar jalar y transportar objetos dentro del entorno laboral se utilizo una lista de cotejo para la evaluacion de trabajo mecanico que inclufa criterios de referencia Una tarea bien hecha recibio una calificacion de 1 EI grupo de control formado por 15 individuos alcanzo una calificacion media de 1153 en la evaluacion con una desshyviacion estandar de 3681 Se supone que el grupo de control se comporto como una muestra aleatoria extraida de una poblacion similar de individuos Se pretende utilizar los datos de la muestra para estimar la calificacion media para la poblacion

Soluci6n Se puede utilizar la media de la muestra 1153 como una estimacion puntualde la media de la poblacion sin embargo debido a que se descoshynoce la desviacion estandar de la poblacion se debe considerar que los valores siguen una distribucion aproximadamente normal antes de consshytruir los intervalos de confianza para l Se considera que esta suposicion es razonable y que se necesita un intervalo de confianza de ~or cienshyto el estimador es i y el error estandar es s -r 681 15 =9504 Ahora es necesario conocer el coeficiente de confiabilidad el valor de t asodado al coeficiente de confianza de 95 y a los n 1 = 14 grados de libertad Puesto que el intervalo de confianza de 95 por ciento deja 05 del area bajo la curva de t para dividirse en dos colas iguales se necesita el valor de tala derecha del cual esta el 025 del area Este valor se localiza en la tabla E enla columna encabezada por t

975 bull Este es el valor

para tala izquierda delcual esta 975 del area bajo la curva EI area a la derechade este valor es igual al 025 deseado Ahora sobre la columna de grados de libertad se localiza el numero 14 EI valor para t se encuentra en la interseccion del renglon con la etiqueta 14 y la columna con la etiqueta t975 bull Se encuentra que este valqr para t que representa al coeficiente de confiabilidad es 21448 Finalmente el intervalo de confianza de 95 por ciento se construye como sigue

1153 plusmn 21448(9504) 1153 plusmn 204 949 1357 bull

Este intervalo puede interpretarse con ambos puntos de vista probabiHstico y practico Puede asegurarse en un 95 por dento que 1a media l correcta de la poblacion se encuentra entre 949 y 1357 porque al repetir el muestreo 95 por dento de los intervalos construidos deigual manera incluyen a l

Decidir entre z r t Cuando se obtiene un intervalo de confianza para la media de una poblacion se debe decidir si se utiliza un valor de z6 de t como factor de confiabilidad Para hacer una elecci6n adecuada se debe considerar el tamafto de la muestra si la poblacion muestreada sigue una distribucion normal y si la varian cia de la poblacion es conocida La figura 633 muestra un diagrama de flujo que se puede utilizar para decidir rapidamente si el factor de confiabilidad debe ser Z 0 t

EJERCICIOS 165

EJERCICIOS

Sa aplica al leorema dellfmile central

FIGURA 633 Diagrama de flujo para deddir entre utililizar z y t cuando se hagan inferencias respecto a las medias de la poblaci6n (Para utilizar un procedimiento no parametrico vease el capitulo 13)

Analisis par computadara Si el proposito es construir un intervalo de conshyfianza con el programa MINITAB para la media de la poblacion cuando el estadfsshytico t es el factor de confiabilidad adecuado el comando se inicia con la palabra TINTERVAL Seleccione en Windows I-Sample t desde el menu de Basic Statistics

631 Utilice la distribud6n t para encontrar el factor de confiabilidad para el intervalo de confianshyza basado en los siguientes coeficientes de confianza y tamafiosde las muestras

a b c d

Coefidente de confianza 95 99 90 95 Tamafio de la muestra 15 24 8 30

632 En una investigacion acerca de la dependencia del flujo y volumen de todo el sistema respishyratorio en un grupo de pacientes con enfermedad obstructiva pulmonar cronica conectados a respiradores artificiales Tantucci et ai (A-2) registraron los siguientes valores de linea de

166 CAPITULO 6 ESTIMACION

base del flUjD continuo inspiratDriD (Us) 90 97 103110 104 100 CDnsidere que una muestra aleatDria simple esta cDnfDrmada pDr seis individuDs a partir de una pDblacion que sigue una distribuci6n nDrmal CDn individuDs CDn la misma enfermedad

a) ~Cuat es la estimaci6n puntual de la media de la pDblaci6n

b) ~Cuil es la desviacion estandar de la muestra

c) ~Cultll es la estimacion del error estandar para la media de la muestra

d) CDnstruya un intervalD de cDnfianza de 95 pDr ciento para el flUjD mediD cDntinuD inspishyratDriD de la pDblaci6n

e) ~Cual es la precision de la estimacion

f) Explique la interpretaci6n prDbabilistica para este intervalD de confianza

g) Explique la interpretacion practica para este intervalD de cDnfianza

633 LlDyd y MaillDux (A-3) informaron IDS siguientes datDs acerca del peso de la glandula pituitaria en una muestra de cuatrD ratas de Wistar Furth

media = 90 mg error estandar para la media = 3

FUEJTE Ricardo V Lloyd y Joe Mailloux Analysis ofSshy100 Protein Positive Folliculo Stellate Cells in Rat Pituitary Tissues AmericanJournal ofPathology 133 338-346

a) ~Cual es la desviadon estandar de la muestra

b) CDnstruya un intervalD de confianza de 95 pDr ciento para el peso medio de la glandula pituitaria para una pDblacion similar de ratas

c) ~Que supDsiciDnes se necesitan para que sea validD el intervalo de cDnfianza del inciso b

d) ~Que interpretacion puede ser la mas indicada cuandD se trata sDbre intervalos de conshyfianzacon alguien que no sabe de estadfstica Explique pDrque es la mas cDnveniente

e) 5i fuera necesario elabDrar un intervalD de cDnfianza de 90 pDr cientD para la media de la pDblaci6n ~el intervalD de cDnfianza serta mayDr 0 menor que el intervalD de 95 pDr dentD Explique su respuesta sin construir realmente el intervalD de cDnfianza

f) 5i [uera necesariD considerar un intervalo de CDnfianza de 99 pDr cientDpara lamedia de la poblacion ~el intervalo de cDnfianza serra mayDr 0 menDr que el intervalD de 95 pDr dentD Explique su respuesta sin cDnstruir realmentt el intervalD de cDnfianza

634 Kaminski y Rechberger (A-4) encontrarDn en un estudio sDbre la preeclampsia que la media de la presi6n sistolica sangufnea en 10 mujeres sanas y que no estan embarazadas es de 119 CDn una desviacion estandar de 21

a) 2Cual es el errDr estandar estimadD para la media

b) CDnstruya un intervalD de confianza de 99 pDr cientD para la media de la poblaci6n a partir de la cual puede considerarse que IDS 10 individuos conforman una muestra aleatoria

c) ~CUlil es la precisi6n estimada

d) ~Que consideraciones deben hacerse para comprobar la validez del intervalo de confiahza

635 Unamuestra de 16nifias de 10 afiDS pesan en promediD 715 con una desviacion estandar de 12libras CDnsidere el calculD de intervalDs de cDnfianza de 9095 y 99 pDr ciento para I-L

167 64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS

636 Una muestra aleatoria simple conformada por 16 individuos aparentemente sanos presenta los siguientes valores de arsenico eliminado en la orina (miligramos por dfa)

Individuo Valor Individuo Valor

1 007 9 012 2 030 10 006 3 025 11 010 4 008 12 032 5 030 13 006 6 038 14 009 7 007 15 014 8 005 16 011

Elabore un intervalo de confianza de 95 por ciento para la media de la poblaci6n

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES

En ocasiones se presentan casos en los que se desea estimar 1a diferencia entre 1a media de dos poblaciones A partir de cada poblacion se extrae una muestra aleatoria independiente y de los datos de cada una se calculan las medias muestrales XI y x2

respectivamente En el capitulo anterior se dijo que el estimador XI - x2 ofrece una estimacion insesgada de la diferencia entre las medias de las poblaciones III shy11 2 bull La variancia del estimador es (cr~ n l ) + (cr~ n 2 ) Tambien se menciono que seglin las condiciones la distribucion muestral de XI - x2 puede presentar una distribution al menos aproximadamente normal de modo que en muchos casos se utiliza la teorfa adecuada para las distribuciones normales en el calculo de un intershyvalo de confianza para III - 11 2 bull Cuando se conocen las variancias de la poblacion el intervalo de confianza del 100(1 - ex) por ciento para III - 112 esta dado por

(641)

El anal isis del intervalo de confianza para la diferencia entre las medias poblacionales ofrece informacion util para decidir si es 0 no probable que las medias de las dos poblaciones sean iguales Cuando el intervalo no incluye al cero se dice que el intervalo ofrece evidencia de que las dos poblaciones tienen medias diferentes Cuando el intervalo incluye al cero se dice que las poblaciones pueden tener meshydias iguales

Esto se ilustra a continuacion para el caso donde el muestreo se realiza a partir de una distribucion normal

168 CAPITULO 6 ESTlMACI6N

EJEMPLO 641

A un equipo de investigacion Ie interesa conocer la diferencia entre las concentracioshynes de acido urico en pacientes con y sin el sfndrome de Down En un gran hospital para el tratamiento de pacientes con retardo mental una muestra de 12 individuos con el sindrome presenta una media de XI = 45 mgll00 mL En un hospital general se encontro que una muestra de 15 individuos normales de la misma edad y sexo presenta un nivel medio de x2= 34 Si es razonable suponer que las dos poblaciones de valores muestran una distribucion normal y sus variancias son iguales a 1 y 15 calcule el intervalo de confianza de 95 por ciento para ~l - ~2

Soluci6n Para una estimacion puntual de III 112 se udliza Xl X2= 45 34 11 EI coeficiente de confiabilidad que corresponde a 95 localizado en la tabla D es 196 EI error estandar es

Por 10 tanto el intervalo de confianza de 95 por ciento es

11 plusmn 196(4282) 11plusmn84 26 194

Se dice que se dene una confianza de 95 por ciento de que la difeshyrencia real 111 - 112 este entre 26 y 194 porque en muestreos repetidos 95 por ciento de los intervalos construidos de esa manera incluiria la diferencia entre las medias reales

Puesto que el intervalo no incluye al cero se concluye que las dos poblaciones tienen diferentes medias bull

Muestreo a partir de poblaciones que no signen una distribuci6n ItOrmal La construccion de un intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando el muestreo se realiza a partir de poblaciones no normales se lleva a cabo en la forma descrita en el ejemplo 641 si las muestras n l y n

2 son grandes Una vez mas este es un resultado del teorema del limite central

Si se desconocen las variancias de la poblacion se utili zan las variancias de las muestras para estimarlas

IUEMPLO 642

Motivados por d conocimiento de la existencia de una gran cantidad de textos polemicos que sugieren que el estres la ansiedad y la depresion son dafiinos para el sistema inmunologico Gormanet ai (4-5) condujeron un estudio en el que se conshysider6 a individuos varoneshomosexuales algunos con VIH (virus de inmunodefishyciencia humana) positivo y otros con VIH negativo Los datos fueron registrados con una amplia vltJriedad de mediciones medicas inmunologicas psiquiatricas y neurol6gicas una de las cuales corresponde al numero de celulas CD4+ en la sanshy

64 INTERV ALO DE CONFIANZA PAHALA DIFERENCIA ENTRE DOS MEDIAS 169

gre El numero promedio de celulas CD4+ para middot112 individuos con infecci6n por VIR fue de 4018 con una desviaci6n estandar de 2264 Para los 75 individuos sin la infecci6n por VIR la media y la desviaci6n estandar fueron de 8282 y 2749 respectivamente Se pretende elaborar un intervalo de confianza de 99 por ciento para la diferencia de las medias de las poblaciones

Soluci6n No hay informaci6n con respecto a la forma de la distribuci6n de las celulas CD4+ Sin embargo como el tamafto de las muestras es grande el teorema del limite central asegura que la distribuci6n muestral de las diferencias entre las medias de la muestra siguen una distribuci6n aproxishymadamente normal independientemente de que la distribuci6n de la variable en las poblaciones no siga una distribuci6n normal Se puede utilizar este hecho para justificar el uso de la estadistica z como factor de confiabilidad en la construcci6n del intervalo de confianza Tampoco hay informaci6n acerca de las desviaciones estandar por 10 que puede emplearse las desviaciones estandar de las muestras para estimarlas La estimaci6n puntual para la diferencia entre las medias de las poblacioshynes es la diferencia entre las medias de las muestras 8282 - 4018 = 4264 En la tabla D se encuentra que el factor de confiabilidad es 258 La estimaci6n del error estandar es

s __ = 27492

+ 22642 =382786

Xl-X 75 112

Por la ecuaci6n 641 el intervalo de confianza de 99 por ciento para la diferencia entre las medias de la poblaci6n es

4264 plusmn 258(382786) 3276 5252

Se tiene la seguridad de 99 por ciento de que el promedio de celulas CD4+ en varones con VIR positivo difieren de la media para los varoshynes con VIR negativo por 3276 a 5252 bull

Distribuci6n t y la diferencia entre las medias Cuando no se conocen las variancias y se pretende estimar la diferencia entre las medias de dos poblacioshynes con un intervalo de confianza es posible utilizar la distribuci6n t para suminisshytrar el factor de confiabilidad si se conocen ciertas suposiciones se debe saber 0

suponer de buena fe que las dos poblaciones muestreadas siguen una distribuci6n normal Respecto a las variancias de las poblaciones se debe distinguir entre dos situaciones 1) la situaci6n en la que las variancias son iguales y 2) la situaci6n en la que no 10 son A continuaci6n se consideranambas sitpaciones por separado

Varianciaspoblacifmales iguales Si la suposici6n sobre igualdad de las variancias de las poblaciones esta justificada las dos variancias de las muestras calculadas a partir de las muestras independientes pueden considerarse como estishymaciones de 10 mismo es decir la variancia comun Parece 16gico entonces aproshyvechar este hecho en el anal isis en cuesti6n Esto es precisamente 10 que se hace para establecer una estimaci6n conjunta para la variancia comun Esta variancia se obtiene mediante el caIculo promedio ponderado de las dos variancias de las muesshy

170 CAPITULO 6 ESTlMACI6N

tras Cada variancia de la muestra es ponderada con base en sus grados de libertad Si los tamafios de las muestras son iguales este promedio ponderado es la media aritmetica de las variancias de las dos muestras Si el tamano de las dos muestras es distinto el promedio ponderado aprovecha la informacion adicional proporcionada por la muestra mayor La estimacion con junta se obtiene con la fOrmula

S2 = (nl _1)SI2 + (n2 l)s~ p (642)

+n2 -2nl

Asf la estimacion del error estandar esta dada por

(643)

y el intervalo de confianza de 100(1 a) por ciento para III 112 esta dada por

(644)

El nfunero de grados de libertad utilizado para determinar el valor de t que se usa para construir el intervalo es n

1 + n

2 2 que es el denominador de la ecuacion

642 Este intervalo se interpreta en la forma habitual Los metodos que pueden emplearse para tomar la decision acerca de la igualshy

dad de las variancias de las poblaciones se estudian en la seccion 610 y 78

EJEMPLO 643

Uno de los estudios de Stone et al (A-6) tuvo como objetivo determinar los efectos del ejercicio por un tiempo prolongado en los ejecutivos de una compania inscritos en un programa supervisado de acondicionamiento fisico Se registraron datos de 13 individuos (el grupo deportista) que voluntariamente se inscribieron el programa y que permanecieron activos por 13 anos en promedio y de 17 individuos (el segunshydo grupo el sedentario) que decidieron no inscribirse Entre los datos que se regisshytraron acerca de los individuos esta el mlmero maximo de sentadillas realizadas en 30 segundos El grupo deportista obtuvo una media y una desviacion estandar de 210 y 49 respectivamente La media y la desviacion estandar para el grupo sedenshytario fueron 121 y 56 respectivamente Se considera que las dos poblaciones de medici ones de acondicionamiento muscular siguen una distribuci6n aproxirnadashymente normal y que las variancias para ambas poblacionesson iguales Se pretenshyde elaborar un intervalo de confianza de 95 por ciento para Ja diferencia entre las medias de as poblaciones representadas por las dos muestras Soluci6n Primero se utiliza la ecuaci6n 642 para calcular la estimaci6n conjunta

de la variancia comtin de las poblaciones

(13-1)(49 2 )+(17 1)(562 ) =2821

13+17-2 Cuando se consulta la tabla E con 13 + 17 - 2= 28 grados de libertad y el nivel de confianza de 95 se encuentra que eLfactor de confiabilidad es 20484 Con la ecuacion 644 se calcula el intervalo de confianza de

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS 171

95 por ciento para la diferencia entre las medias de las poblaciones de la siguiente manera

2821 2821(210-121)plusmn20484 --+-shy

13 17 89 plusmn 40085

49129

Se tiene una confianza de 95 por ciento de que la diferencia entre las medias de las poblaciones estan entre 49 y 129 Se puede decir esto porque se sabe quesi se repite el amilisis muchfsimas veces y se calculan los intervalos de confianza de la misma manera cerca de 95 por ciento de los intervalos de confianza induiran la diferencia entre las medias de las poblaciones

Debido a que los intervalos no induyen al cerose conduye que las medias de las poblaciones son diferentes bull

Variancias poblacionales distintas Cuando no se puede conduir que las variancias de dos poblaciones de interes son iguales aun ruando pueda suponerse que las dos poblaciones presentan distribuciones normales no es adecuado utilizar la distribucion t como se acaba de describir para construir los intervalos de confianza

Una solucion al problema de variancias distintas fue propuesta por Behrens (3) y posteriormente fue verificada y generalizada por Fisher (4 5) Neyman (6) Scheffe (7 8) Y Welch (9 10) tambien proponen soluciones EI problema es analizashydo en detalle por Cochran (11)

EI problema gira en tomo al hecho de que la cantidad

no sigue una distribuci6n t con nj + n 2 grados de libertad ruando las variancias 2 shy

de las poblaciones son distintas Consecuentemente la distribucion t no se puede utilizar en la forma habitual pata obtener el factor de confiabilidad del intervalo de confianza para la diferencia entre las medias de dos poblaciones que tienen variancias diferentes La solucion propuesta por Cochran consiste en el calculo del factor de confiabilidad mediante la siguiente formula

wltj + w2tZ t l

f

-0f2 = (645) WI +w2

donde WI 512

np W 2 = s~ n2 tl = tl _ para nj - 1 grados de libertad y t2 = t l

_w2aI2

para n2

- 1 grados de libertad Un intervalo aproximado de confianza del 100(1 shya) por ciento para III - 112 esta dado por

(646)

172

EJERCICIOS

CAPITULO 6 ESTlMACION

FJEIUPLO 644

En la investigacion de Stone et al (A-6) descrita en el ejercicio 643 los investigashydores tambien informaron los siguientes datos de las medici ones referentes a todas las calificaciones del acondicionamiento muscular logradas por los individuos

Muestra n Media Desviaci6n estimdar

Grupo deportista 13 45 3

Grupo sedentario 17 37 10

Se considera que las dos poblaciones de todas las calificaciones de acondicionashymiento muscular siguen una distribuci6n aproximadamente normal Sin embargo no debe suponerse que las dos variancias poblacionales son iguales Se pretende construir un intervalo de confianza de 95 por ciento para la diferencia entre las medias de todas las calificaciones de acondicionamiento muscular para las dos poshyblaciones representadas por las muestras

Soluci6n Se utiliza t de la ecuaci6n 645 para calcular el factor de confiabilidad En la tabla E se muestra que con 12 grados de libertad y 1 - 052 = 975 t( 21788 Analogamente con 16 grados de libertad y 1- 052 = 975 t2 = 21199 Ahora Sf calcula

(3 2 13)(21788) + (102 17)(21199) 139784 t= =

(3 2 13)+(102 17) 065747

=21261

Con la ecuaci6n 646 ahora se construye el intervalo de confianza de 95 por ciento para la diferencia entre las medias de las dos poblaciones

2 2

(45 37)plusmn21261 3 + 10 13 17

8 plusmn 21261 (25641101) 25134

Puesto que el intervalo no incluye acero se concluye que las medias de las dos poblaciones son diferentes bull

Cuando se construyen intervalos de confianza para la diferencia entre las medias de dos poblaciones es posible utilizar la figura 641 para decidir rapidashymente si el factor de confiabilidad debe ser z t 0 tf

Para cada uno de los siguientes ejercicios construya intervalos de confianza de 90 95 y 99 par ciento para las diferencias entre las medias poblacionales Establezca consideraciones que hagan que el metodo sea valido Determine las interpretaciones practica y probabilistica

clJ clJ FIGURA 541 Diagrama de flujo para decidir si e1 factor de confiabilidad debe ser z tot cuando se realizan inferencia inferencias acerca de la diferencia entre las medias de dos pobladones (Para usar un procedimiento no parametrico ver el capitulo 11)

174 CAPiTULO 6 ESTlMACION

para cad a intervalo construido Suponga las variables bajo considerati6n en cad a ejercicio y establezca para que pueden servir a los investigadores esos resultados

641 EI objetivo de un experimento de Buckner et al (A-7) consisti6 en estudiar los efectos del relajamiento muscular inducido por el pancuronium en el volumen del plasma circulante Los individuos estudiados son recien nacidos con un peso mayor a 1700 gramos que necesishytaron de ayuda para respirar durante las primeras 24 horas despues de nacer y cumplieron con otros criterios cHnicos Cinco recien nacidos paraIizados con el pancuronium y siete recien nacidos no tratados presentaron las siguientes estadisticas en la segunda de las tres mediciones del volumen de plasma (ml) hecha durante la respiraci6n mecanica

Paralizados 480 81 No tratados 567 81

La segunda medici6n para el grupo tratado ocurri6 de 12 a 24 horas despues de la primera dosis de pancuronium Para el grupo no tratado las mediciones se hicieron de 12 a 24 horas despues de iniciar la respiracion mecanica

642 Zuckery Archer (A-8) afirman que la N-nitrosobis (2-oxopropyl)amina (BOP) y las nitrosaminas 3-oxidizadas producen una alta incidencia de tumores de conductos pancreaticos en el hamster dorado sirio Estudiaron los efectos en el peso sangufneo en la glucosa del plasma en la insulina yen los niveles de transamina glutamico-oxaloacetica del plasma (GOT) de los hamsters expuestos in vivo a la BOP Los investigadores reportaron los siguientes resultados en ocho animales tratados y 12 sin tratamiento

Variable Sin tratamiento Con tratamiento

Glucosa del plasma (mglgl) 101 plusmn 5 74plusmn 6

FUENTE Peter F Zucker y Michael C Archer Alterations Pancreatic Islet Function Produced by Carcinogenic Nitrosamines in the Syrian Hamster AmericanJournal oPathology 133 573-577

Los datos son la media de la muestra plusmn la estimaci6n del error estandar de la media de la muestra

643 Los objetivos de un estudio de Davis et al (A-g) son evaluar 1) la eficacia del programa auto ayuda momento para dejar de fumar cuando se utiliza con base de uno a uno en el hogar y 2) la viabilidad de ensefiar temicas para abandonar el habito de fumar a los estudiantes de enfermerfa en bachillerato A estudiantes graduados de enfermerfa inscritos en dos cursos de metodologia de la investigacion de la Universidad de Ottawa se les invit6 a participar en el proyecto Se aplic6 un cuestionario de opcion multiple para abandonar el habito de fumar a 120 estudiantes de enfermeria que participaron y a otros 42 estudiantes que no participashyron antes ni despues del estudio Se calcularon las diferencias entre las calificaciones antes y despues del estudio as como las siguientes estadisticas a partir de las diferencias

EJERCICIOS 175

Grupo Media Desviaci6n estandar

Participantes (A) 214444 15392 No participantes (B) 33333 14595

644 El doctor Ali Khraibi (A-IO) de la CHnica y Fundaci6n Mayo condujo una serie de experishymentos con el fin de evaluar las respuestas diureticas y natiureticas de ratas Okamoto esponshytaneamente hipertensivas (REB) y ratas Wistar-Kyoto (WRY) para dirigir incrementos en la presion hidrostatica renal intersticial (PBRI) Para aumentar la PBRI se utiIiz6 la expansi6n directa del volumen renal intersticial (DRIVE) a traves de una matriz implantada cronicamente en el rinOn Entre los datos registrados durante el estudio estan las siguientes mediciones de excreci6n de sodio a traves de la orina (UNa V) durante el periodo de DRIVE

Grupo

REB 632572796483527 2WKY 420469482 108210

FUENTE Publicada con autorizaci6n del Dr Ali A Khraibi

645 Osberg y Di Scala (A-II) realizaron un estudio centrado en la eficacia de los cinturones de seguridad para reducir 1esiones entre sobrevivientes de accidentes automoviHsticos internashydos en hospitales con edades de 4 a 14 afios El estudio compar610s resultados de 123 ninos que utilizaron el cintur6n contra 290 que no 10 utilizaron entre aquellos que se vieton enshyvueltos en tales accidentes y que fueron hospitalizados El informe con tenia la siguiente estadistica del numero de dfas en la unidad de cuidados intensivos

Grupo Media Error estandar estimado

Utiliz6 el cintur6n 83 16 No utiliz6 el cintur6n 139 18

646 La medicion del diametro transversal del coraz6n de hombres y mujeres adultos presenta los siguientes resultados

sx Grupo Tamafto de Ia muestra (cm) (cm)

Varones 12 1321 105 Mujeres 9 IIOO 101

Considere que las poblaciones siguen una distribucion normal con variancias iguales

176 CAPITULO 6 ESTIMACION

647 Veintiruatro animales de laboratorio con deficiencia de vitamina D fueron divididos en dos grupos iguales EI grupo 1 recibi6 un tratamiento consistente en una dieta que proporcionashyba vitamina D EI segundo grupo no fue tratado AI termino del periodo experimental se midieron las concentraciones de calcio ensuero obteniendose los siguientes resultados

Grupo tratado X 111 mg 100 mls = 15 Grupo sin tratamiento x= 78 mg 100 ml s = 20

Considere que las poblaciones siguen una distribuci6n normal con variancias iguales

648 Ados grupos de nifios se les hicieron pruebas de agudeza vi~ual El grupo 1 estuvo formado por 11 nifios que recibieron la atenci6n de medicos privados La calificaci6n media para este grupo fue de 26 con una desviaci6n estandar de 5 El segundogrupo que incluy6 14 nifios que recibieron atenci6n medica por parte del departamento de salud publica tuvo una calishyficaci6n promedio de 21 con una desviaci6n estandar de 6 Suponga que las poblaciones siguen una distribuci6n normal con variancias iguales

649 El tiempo promedio de estancia de una muestra de 20 pacientes dados de alta de un hospital general es de siete dras con una desviaci6n estaildar de dos dras Una muestra de 24 padenshytes dados de alta de un hospital de enfermedades cr6nicas tuvo un tiempo promedio de estancia de 36 dfas con una desviaci6n estindar de 10 dias Suponga que la poblaci6n sigue una distribuci6n normal con variancias desiguales

6410 En un estudio de factores que se consideran responsables de los efectos adversos del tabashyquismo sobre la reproducci6n humana se midieron los niveles de cadmio (nanogramos por gramo) en el tejido de la placenta de una muestra de 14 madres que fumaban y una muestra aleatoria independiente de 18 mujeres no fumadoras Los resultados fueron los siguientes

No fumadoras toO 84 128250 118 98 125 154 235

94251 1952559875 118122150

Fumadoras 300301150241305178168148

134285 175 144 125204

ms probable que el nivel medio de cadmio registrado sea mayor entre las fumadoras que entre las no fumadoras ~Por que se llegarfa a esta conclusi6n

65 INTERVALO DE CONFIANZA PARA IA PROPORCION DE UNA POBIACION

Muchas preguntas de interes para que el tecnico en salud tienen relacion con las proporciones de poblacion ~Que propordon de padentes que redben un tipo espeshycial de tratamiento se recuperan ~Que proporcion de alguna poblacion tiene cierta enfermedad ~Que propordon de una poblacion es inmune a derta enfermedad

Para estimar la proporcion de una poblacion se procede en la misma forma que cuando se estima la media de una poblacion Se extrae una muestra de la poblacion de interes y se calcula su proporcion p Esta se utiliza como el estimador puntual para la proporcion de la pobladon Un intervalo de confianza se obtiene mediante la siguiente formula general

estimador plusmn (coefidente de confiabilidad) X (error estandar)

EJERCICIOS

EJERCICIOS 177

En el capitulo anterior se vio que cuando np y n(1 - p) son mayores que 5 se puede considerar que la distribuci6n muestral de pse aproxima bastante a una distribuci6n normal Cuando se cumple con esta condici6n el coeficiente de confiabilidad es algUn valor de z de la distribuci6n normal estandar Esta visto que el error estandar es igual a (J p =fi(l-p) n Puesto que p que es el parametro que se trata de calcular se desconoce se debe utilizar pcomo una estimaci6n Asf se estima (J j por medio de ~p(l Pn y el intervalo de confianza de 100(1 - 0) por ciento para pesta dado por

pplusmn Z(I-1J2)~P(l- P) Fn (651)

Este intervalo se interpreta tanto desde el punto de vista practico como probabilistico

FJEMPLO 651

Mathers et al (A-12) encontraron queen una muestra de 591 pacientes internados en un hospital psiquiatrico 204 admitieron que consuniieron marihuana al meshynos una vez durante su vida Se pretende construir un intervalo de confianza de 95 por ciento para la proporcion de individuos que consumieron marihuana durante su vida en la poblaci6n muestreada de los internos del hospital psiquiatrico

Solucion La mejor estima~i6n puntual para la proporci6Il de la poblaci6nes p== 204591 3452 El tamafio de la muestra y hiestimacion de p tienen una magnitud suficiente parajustifKar el empleo de la distribucion norshymal estandar paraelaborar un intervalo de confianza EI coeficiente de corifiabilidad que corresponde alnivel de confianza de 95 es 196 la estimacion del errorestandar (Jp es ~p(l-pgtn = (3452)(6548)591

0 1956El intervalo de confianza para p de acuerdo con estos datos es

3452 plusmn 196(01956) 3452 plusmn 0383 3069 3835

Se puede decir que se tiene 95 por ciento de confianza de que la proporshycionpeste entre 3069 y 3835 ya que al repetir el muestreo casi 95 por ciento de los intervalos construidos en la forma de este intervalo inclushyyen a la proporcion p real Con base en estos resultados se espera con una confianza de 95 por ciento encontrar que entre 3069 y 3835 por ciento de los internados en el hospital psiquiatrico tiene antecedentes de consumo de marihuana bull

Para cada uno de los siguientes ejercicios establezca la interpretacion prictica yprobabilistica de los intervalos que se pide construir Identifique cada componente del intervalo la estimashycion puntual el coeficiente de confiabilidad yel error estandar Explique por que los coefishycientes de confiabilidad no son los misInos para todos los ejercicios

178 CAPITULO 6 ESTIIlACI6N

651 En una investigaci6nde ninos maltratados en pacientes psiquiatricos Brown y Anderson (A-IS) encontraron 166 pacientes en una muestra de 947 con antecedentes de abuso sexual y maltrato flsico Construya un intervalo de confianza de 90 por dento para la proporci6n de la poblaci6n

652 Catania et at (A-14) obtuvieron datos respecto al comportamiento sexual de una muestra de hombres y mujeres solteros con edades entre 20 y 44 residentes en areas geoijfaficas caracshyterizadas por tasas altas de enfermedades de transmision sexual e ingreso a programas de drogas De 1229 encuestados 50 por ciento respondieron que nunca utilizaron preservatishyvos Construya un intervalo de confianza de 95 por ciento para la proporcion de la poblaci6n que nunca utiliza preservativos

653 Rothberg y Lits (A-I 5 ) estudiaron el efecto del estres de la maternidad durante el embarazo en el peso del producto Los individuos eran 86 mujeres blancas con antecedentes de estres que no tenfan faetores de riesgo medico u obstetrico conoddo de peso bajo del producto Los investigadores eneontraron que 128 por dento de las madres estudiadas dieron a luz bebes que cubrfan el criterio de peso bajo Construya un intervalo de confianza de 99 por ciento para la proporci6n de la poblaci6n

654 En una muestra aleatoria simple de 125 varones desempleados quienes desertaron de la escuela preparatoria entre las edades de 16 y 21 anos inclusive 88 declararon que eran consumidores regulares de bebidas alcoh6litas Construya un intervalo de eonfianza de 95 por ciento para la proporcion de la poblacion

66 INTERVALO DE CONFIANZA PARA lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS POBlACIONES

A menudo se tiene interes en conocer la magnitud de la diferencia entre las proporcioshynes de dospoblaciones Es posible que se quiera comparar por ejemplo entre hombres y mujeres dos grupos de edades dos grupos socioecon6micos 0 dos grupos de diagshynostico con respecto a la proporcion que posee alguna caractenstica de interes Un estimador puntual insesgado de la diferencia entre dos proporciones de las poblacioshynes se obtieneal calcular la diferencia de las proporciones de las muestras PI P2 Tal como Se ha visto cuando n1 Yn2 son de gran tamano y las proporciones de la poblacion no estan muy cerca de 0 0 de 1 es posible aplicar el teorema del limite central y utilizar la teona de la distribucion normal para obtener los intervalos de conshyfianza EI error estandar de la estimacion se calcula mediante la siguiente formula

dado que como regIa se desconocen las proporciones de Ia poblacion Un intervashy10 de confianza de 100(1 - a) por ciento para PI P2 se obtiene as

(661)

Es posible interpretar este intervalo desde elpunto de vista probabiHstico y practico

EJERCICIOS 179

EJEMPLO 661

Borst et al (A-16) investigaron la relaci6n de desarrollo del ego edad sexo y diagshyn6stico de suicidio entre los internos adolescentes de la unidad de psiquiatria La muestra consistia en 96 varones y 123 niiias con edades entre 12 y 16 aiios seleccioshynados de entre los internados en la unidad de adolescentes y niiios de un hospital psiquiatrico privado Se reportaron 18 niiios y 60 niiias con intento de suicidio Cons ishyderese el comportamiento de las niiias como el de una muestra aleatoria simple a partir de una poblaci6n similar de niiias y que los j6venes igualmente pueden considerarse como una muestra aleatoria simple extraida de una poblaci6n similar de niiios Para estas dos poblaciones se pretende construir un intervalo de confianshyza de 99 por ciento para la diferencia entre las proporciones de los individuos con intento de suicidio

Soluci6n Las proporciones para las niiias y niiios respectivamente son Pc = 601 123 = A878y PB = 1896 1875 La diferencia entre las proporciones de lasmuestrases Pc PB = 4878 1875 = 3003 El error estandar estimado de la diferenda entre las proporciones de las muestras es

(4878)(5122) (1875)(8125) ---~~-~ +-------shy

123 96

El factor de confiabilidad a partir de la tabla D es 258 de modo que el intervalo de confianza con la f6rmula 661 es

3003 plusmn 258(0602) 14504556

Se dene la confianza de 99 por dento de que para las poblaciones muestteadas la ptopord6n de intentos de suiddio entre las niiias exceshyde a lapropord6n de intentosde suiddio entre los varones por 1450 y 4556

Puesto que el intervalo no incluye al cero se concluye que las dos proporciones de pobladones son diferentes bull

FJERCICIOS

Para cada uno de los siguientes ejercicios establezca las interpretaciones pnicticas y probabishylisticas de los intervalos que se pide construir Identifique cada componente del intervalo la estimaci6n puntual el coeficiente de confiabilidad y el error estandar Explique por que los coeficientes de confiabilidad no son el mismo para todos los ejercicios

661 Hargers et al (A-17) del departamento de Salud PUblica y Ambieptal en Amsterdam condushyjeron un estudio en el que los individuos eran consumidores de drogasinyectables (CDI) En una muestrade 194 consumidores de metadona regular de largo plazo (MLP) 145 eran varones En una muestra de 189 CDIque no consmiddotumian MLP 133 eran varones Establezca las consideraciones necesarias acerca de las muestras ypoblaciones representadas y construshy

180 CAPITULO 6 ESTlMACI6N

ya un intervalo de confianza de 95 por ciemo para la diferenda entre las proporciones de varones en las dos poblaciones

662 Una investigaci6n de Lane et ai (A-I8) valor6las diferencias en las pnicticas de deteccion de cancer de seno entre muestras de mujeres predominantemente de bajos ingresos con edashydes de 50 a 75 anos que lltilizan los servicios de c1inicas de sailld para todo el estado y mlljeres de la misma edad residentes en ciudades donde las c1inicas de salud son locales De las 404 encuestadas seleccionadas en toda la comunidad 592 por ciento estuvo de acuerdo con el siguiente comentario acerca del cancer de pecho las mujeres prolongan su vida si detectan el cancer desde el inicio De entre 795 usuarias de clinicas de salud en la mllestra 449 por ciento estuvo de acuerdo Establezca las suposiciones apropiadas para elaborar un intervalo de confianzade 99 por ciento para la diferencia entre las dos proporciones de las poblaciones de interes

663 Williams et at (A-19) encuestaron a una muestra de 67 medicos y 133 enfermeras con famishyliares farmacodependientes EI prop6sito del estudio era evaluar la influencia en los medishyEOS y enfermeras de estar estrechamente involucrados con una 0 mas personas farmaco dependientes Cincuenta y dos medicos y 89 enfermeras dijeron que vivian con personas farmacoldependientes que adversamente afectaban 8U trabajo E8tablezca todas las consideshyraciones que crea necesarias para construir un intervalo de confianza de 95 por ciento para la diferencia entre las proporciones en las dos poblaciones de trabajadores que se espera esten adversamente afectados por vivir con personas farmacodependientes

664 Aronow y Kronzon (A-20) identificaron los factores de riesgo coronado entre hombres y mujeres en una dinica de cuidados de la salud a largo plazo De los 215 individuos negros 58 tienen diabetes mellitus al igual que 217 individuos blancos de 1140 Elabore un intervalo de confianza de 90 por ciento de confianzapara la diferencia entre las proporciones de las dos poblaciones tCuaies son las poblaciones correspondientes ~Que consideraciones son necesarias para hacer valido el procedimiento de inferencia

67 DETEHMINAUON DEL TAMANO DE LA MUESTRA PARA LA ESTIMACIONDEIAS MEDIAS

La pregunta de que tan grande debe ser una muestra surge inmediatamente al inicio del planteamiento de cualquier encuesta 0 experimento Esta es una pregunshyta importante y no se debe tratara la ligera Tomar una muestra mas grande de 10 necesario para obtener los resultados deseados es un desperdicio de recursos mienshytras que por otro lado las muestras demasiado pequenas con frecuencia dan resulshytados que carecen de uso practico En esta secci6n se estudia c6mo determinar el tamano de la muestra de acuerdo con la situaci6n A continuaci6n se proporciona un metodo para determinar el tamano de la muestra que se requiere para estimar Ia media de la poblaci6n yen la siguiente secci6n se aplica este metodo para detershyminar el tamano de la milestra cuando se desea estimar la proporci6n de una poshyblaci6n Mediante extensiltmes directas de estos metodos es posible determinar el tamano necesario de las muestras para situaciones mas complicadas

Objetivos El objetivo de la estimaci6n porintervalos es el de obtener intervalos estrechos con alta confiabilidad Si se observan los componentes ~e un intervalo de confianzase veque 8U dimension esta determinada por la magnitud de la cantidad

(coeficiente de confiabilidad) x (error estandar)

131 67 DETERMINACION DEL TAMANO PARA LA l-IUESTRAmiddot

ya que lamagnitud total del intervalo de confIanza es eldoble de esta cantidad Se aprendi6 que a esta cantidad generalmente se Ie llama precisi6n de la estimaci6n o margen de error Para un error estandar dado incrementar la confIabilidad signishyfIca un coefIciente con mayor confIabilidad Y un coefIciente con mayor confIabilidad produce unintervalo mas amplio

Por otra parte si se ftia el coefIciente de confIabilidad la unica manera de redudr la amplitud del intervalo es la reducci6n del error estandar Dado que el error estandar es igual a (J IJ y como (J es una constante la unica forma de obtener un error estandar menor es tomar una muestra grande ~Que tan grande debeser la muestra Esto depende del tamafio de (J la desviad6n estandar de la poblaci6n asi como del grado de confIabilidad y dimensi6n del intervalo deseados

Suponga que se desea obtener un intervalo que se extienda d unidades hacia uno y otro lado del estimador Ellose enuncia

d (coefIciente de confIabilidad) X (error estandar) (671)

Si el muestreo es con reemplazos a partir de una poblaci6n infInita 0 de una que sea 10 sufIcientemente grande como para ignorar la correcci6n por poblaci6n fInita la ecuaci6n 671 se transforma en

(J

d z- (672)-r la cual cuando se despeja n nos da

(673)d2

Cuando el nmestreo se hacesin reemplazos a partir de una poblaci6n fInita y peshyquefia se requiere de la correcci6n por poblaci6n fInita y la ecuaci6n 671 se transforma en

(J~d (674)fN~

que al despejar n resulta en

n-----shy (675)d 2(N 1) + Z2(J2

Si puede omitirse la correcci6n por poblad6n fInita la ecuaci6n 675 se reshyduce a la ecuaci6n 673

Estillluci6n de (J 2 Las f6rmulas para el tamafio de la muestra requieren del conocimiento de (J2 pero como ya se ha sefialado la varian cia de la poblaci6n casi

132 CAPITULO 6 ESTlMACION

siempre sedesconoce Como resultado esnecesarioestimar (J2 Las fuentes de estishymaci6n de(J2 que se utilizan con mas frecuencia son las siguientes

1 Se extrae una muestrapilato 0 prel~l11inar de lapoblaci6n y se puede utilizar la variancia calculada a partir de esta muestra como unaestimaci6n de (J2 Las observaciones uti lizadas en la muestra piloto se toman como parte de la muesshytrafinal de modo que n (el tamaiio calculado de la muestra) n

1 (el tamaiio

de la muestra piloto) n2 (el numero de observaciones necesarias para satisfacer el requerimiento total del tamaiio de la muestra)

2 A partir de estudios anteriores osimilares es posible obtener estimaciones de (J2

3Si se cree que la poblaci6n de lacual se extrae la muestraposee una distribushyci6n aproximadamente nqrmal se puede aprovechar el hecho de que la amshyplitud es aproximadamente igual a 6 desviaciones estandar y calcular (J R6 Este metodo requiere aIglin conocimiento acerca de los valores minimo y maximo de la variable en la poblaci6n

EJEMPLO 671

Un nutri6logo del departamento de salud al efectuar una encuesta entre una poshyblacien de muchachas adolescentes con e1 fin de determinitr su ingesti6n diaria promedio de proteinas (medidas en gramos) busc6 el consejo de un bioestadistico con respecto al tamaiio de la muestra que deberfa tomar

~Que procedimiento debe seguir el bioestadistico para asesorar al nutri610go Antes de que el estadistico pueda ayudar el nutri6logo este debe proporcionar tres elementos de informaci6n h dimensi6n deseada del intervalo de confianza el nivel de confianza deseado y la magnitud de la variancia de la poblaci6n

Soludon Suponga que el nutri6logo requiere un intervalo con una dimensi6n de aprQximadamente 10 gramos es decir la estimaci6n se deberfa enconshytrar alrededor de 5 gramos de la media de la poblaci6n en ambas direcshyciones En otras palabras se desea un margen de error de 5 gramos Suponga que se decide por un coeficiente de confian7a de 95 y que con base en su experiencia previa el nutri6logo percibe que la desviaci6n estandar de la poblaci6n es probablemente de alrededor de 20 gramos EI estadfstico dispone ya de la informaci6n necesaria para calcular el tamaiio de la muestra z 196 (J = 20 y d 5 Suponga que el tamaiio de la poblaci6n es grande asf queel estadistico puede ignorar la correcshyci6n por poblaci6n finita y utilizar la ecuaci6n 673 Con las sustitucioshynes adecuadas el valor de n se calcula como

Se recomienda que el nutri610go tome una muestra de tamafio 62 AI calcular el tamaiio de una muestra a partir de las ecuaciones 673 0 675 el resultado se redondea al siguiente nurnero entero mayor si los calculosdan un numerocon decimales bull

183 68 DETERMINACION DEL TAl1ANO PARA LAS PROPORCIONES

EJERCICIOS

671 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su hospital Si se desea un intervalo de confianza de 99 por dento con una amplitud de 1 libra ~que tan grande debe ser la muestra de los registros de nacimiento Suponga que un estimashy

dor razonable para (J es 1 libra ~De que tamano debe ser la muestra si el coeficiente de confiabilidad se hace descender a 95

672 El director de la secdon de control dela rabia del departamento de salud publica desea extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso del ano anterior para estimar la edad media de las personas mordidas Requiere un intervalo de confianza de 95 por dento decide utilizar un valor de 25 para d y a partir de estudios anteriores estima que la desviacion estandar de la poblacion esta alrededor de los 15 anos ~Que tan grande debe ser el tamano de la muestra

673 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mglOO ml) de pacientes atendidos en una clinica para diabeticos durante el transcurso de los ultimos 10 anos Determine el numero de registros que el medico debe examinar para obtener un intershyvalo de confianza de 90 por ciento para 11 si la dimension requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varian cia de 60

674 Se deseaestimar la edad media en la que a los padentes de esclerosis multiple se les diagnosshytico el padecimiento por primera vez Se requiere un intervalo de confianza de 95 por dento con una dimension de 10 anos Si la variancia de la poblaci6n es de 90 ~que tan grande debera ser la muestra

68 DETERMINACION DELTAMANO DE lA MUESTRA PARA lA ESIDIACION DE lAS PROPORCIONES

EI metodo para estimar el tamafio de la muestra cuando se requiere estimar la proshyporcion de una poblacion es esencialmente el mismo que se describio para estimar la media de una poblacion Se aprovecha el hecho de que la mitad del intervalo deseashydo d se puede igualar al producto del coeficiente de confiabilidad y el error estandar

Si se supone que el muestreo ha sido hecho de manera aleatoria y que existen condiciones que garanticen que la distribuci6n de psea aproximadamente normal se obtiene la siguiente formula para n cuando el muestreo es con reemplazo cuanshydo se realizaa partir de una poblacion infinita 0 ruando la poblacion muestreada es 10 suficientemente grande como para hacer innecesario el uso de la correcci6n por poblacion finita

n (681)

dondeq = I-p Si la correccion por poblacion finita no puede descartarse la formula adecuashy

da paran es

(682)n d 2 (N -1)+z2pq

euan do N es grande en comparacion con n (es decir n IN 05) se puede pasar por alto la correccion por poblacion finita y la ecuacion 682 se reduce a la ecuacion 681

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

159 62 INTERV ALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACION

Caja de dialogo Comandos de la sesi6n

Statgt Basic Statisticsgt 1-Sample z MTB gt ZINTERVAl 95 6 C1

Teclear Cl en Variables Se1ecdonar Confidence interval y teclear 95 en la caja de texto Teclear6 en Sigma Clic OK

Resultados

Confidence Intervals

The assumed sigma = 0600

Variable MicMoles

N 35

Mean 0718

StDev 0511

SE Mean 0101

950 Cr (0519 0917)

FIGURA 622 Procedimiento del paquete MINITAB para construir un intrevalo de conshyfianza de 95 por ciento para la media de la poblacion ejemplo 624

Solucion Se introducen los datos en lacolumna 1 y se procede como se muestra en la figura 622 Estas instrucdones indican a la computadora que e1 factor de confiabilidad es z que se necesita unintervalo de conshyfianza de 95 por dento que la desviaci6n estandarde la poblaci6n es de 6 y que los datos estan en la columna 1 El resultado indica que la media de la muestra es 718 la desviad6n estandar es 511 y e1 error estandar de la media af es 6J35 101

Se tiene 95 pordento middotde confianza de que la media de la poblashyci6n se encuentra entre 519y 917 bull

Puede obtenerse los intervalos de confianza a traves de otros paquetes de sofuvare Por ejemplo SASreg puede construir intervalos de confianza a traves de PROC MEANS o PROC UNIVARIATE

Otras eslimaciones de La tendencia central Tal como se ha visto la meshydia es muy sensible a los val ores extremos es dedr aquellos que se desvfan consideshyrablemente de la mayorfa de las mediciones en el con junto de datos A dichos valores se les conoce como sesgos Tambien se puede apreciar que lamediana que no es sensible a las mediciones extremas algunas veces se utiliza en lugar de la media como medida de tendenda central cuando los sesgos estan presentes Por la misshyrna raz6n quiza se prefiera el uso de la mediana de la muestra comomiddotestimador de la rnediana de la poblaci6n cuando se requiere realizar inferencias acerca de la tendenda central de la poblaci6n No solamente se utiliza la mediana de la muestra

160 CAPITULO 6 ESTlMACION

como una estimacion puntual para la mediana de la poblacion sino que tambien es posible construir un intervalo de confianza para la mediana de la poblacion En esta obra no se proporciona la formula pero esta se puede encontrar en la obra de Rice (1)

Media ajustada Los estimadores que son insensibles a los sesgos se Haman estimadores eficaces Otra medida y estimador eficaz de tendencia central es la media ajustada Para un conjunto de datos que contiene n mediciones se calcula el 1000 por ciento de la media ajustada como sigue

1 Ordenar las mediciones

2 Descartar las medici ones mas pequeiias y mas grandes que 100a por ciento de las mediciones El valor recomendado para a esta entre 1 y 2

3 Calcular la media aritmetica de las mediciones restantes

Observe que la mediana podrfa considerarse como 50 por ciento de la media ajusshytada Se debe recordar que la media ajustada para el conjunto de datos es una de las medidas descriptivas que puede calcular MINITAB

FJERCICIOS

Construya para cada uno de los siguientes ejercicios los intervalos de confianza al 90 95 Y 99 por ciento para la media de la poblacion y establezca para cada uno la interpretacion probabilistica y practica Indique cualinterpretacion puede ser mas aderuada para utilizar ruando se trata sobre intervalos de confianza con alguien que no conoce de estadfstica y establezca eI razonamientode por que se eUgi6 Explique por que los tres intervalos no tjenen la misma amplitud Indique cual de los tres intervalos es preferible como estimador de la media de la poblacion y establezca el razonamiento de la elecci6n

621 Se pretende estimar el numero promedio de latidos del coraz6n por minuto para cierta poblaci6n Se encontr6 que el numero promedio de latidos por minuto para 49 personas era de YO Considere que esos 49 pacientes constituyen una muestra aleatoria y que la poblacion sigue una distribucion normal con una desviaci6n estandar de 10

622 Se pretende estimar la concentraci6n media de bilirrubina indirecta en el suero en nmos de cuatro dias de nacidos La media para una muestra de 16 ninos es de 598 mglOO cc Conshysiderese que la concentraci6n de bilirrubina en los ninos de cuatro dfas de nacidos sigue una distribucion aproximadamente normal con una desviaci6n estandar de 35 mgIOO cc

623 En un estudio acerca de la duraci6n de la hospitalizacion dirigido por vados hospitales en cooperacion se extrajo una muestra aleatoria de 64 individuos con ulcera peptica de la lista de todos los pacientes con esa enfermedad internados alguna vez en los hospitales particishypantes Se determin6 para cada uno de eUos el tiempo de hospitalizaci6n Se encontr6 que la duraci6n media de hospitalizaci6n fue de 825 dfas y se sabe que la desviaci6n estandar de la poblaci6n es de tres dfas

624 Una muestrade 100 hombres adultos aparentemente sanos de 25 anos de edad muestra una presi6n sist61ica sangufnea media de 125 Considere que la desviaci6n estandar de la poblaci6n es de 15

161 63 DISTRIBUCI6N

625 Algunos estudios acerca de la enfermedad Alzheimer (EA)han mostrado un incremento en la producci6n de 14C0

2 en pacientes con ese padecimiento Durante un estudio se obtuvieshy

ron los siguientes valores de 14C02

a partir de 16 biopsias de neocorteza de pacientes con la enfermedad (EA)

1009 1280 1180 12551547 2352 1956 1080

1776 1767 1680 2050 1452 2857 3100 1621

Considereseque la poblaci6n sigue una distribuci6n normal con una desviaci6n estandar de 350

63 DISTRIBUCION t

En la seccion 62 se describe un procedimiento para obtener un intervalo de conshyfianza para la media de una poblaci6n EI procedimiento requiere del conodmiento de la varianda de la poblacion de la que se extrae la muestra Puede parecer un tanto extrafio que se tenga conocimiento de lavariancia de la poblacion y no se conozca elvalor de la media de la poblacion De hecho es comun en situacioshynes como las que se han presentado que se deSconozca tanto la variancia como la media de la poblacion Esta situacionpresenta un problema respecto a la construcshycion delos intervalos de confianza Por ejemplo aun cuando la estadfstica

x J1shyZ=---

crJn presenta una distribudon normal cuando la poblacion tambien tiene una distribuci6n normal y sigue una distribuci6n aproximadamente normal cuando n es muy grande independientemenle de la forma funcional de la poblacion no se puede hacer uso de este hecho porque cr se desconoce Sin embargo no todo esrn perdido y la soluci6n mas logica para este problema es utilizar la desviacion estandar de ~muestra

s = ~L(Xi - x)2(n-l)

para sustituir cr Por ejemplo cuando el tamafio de la muestra es mayor que 30 la confianza en s como una aproximacion de cr es por 10 general sustancial por 10 que se justifica la utilizacion de la teorfa de la distribudon normal para construir un intervalo de confianza para la media de la poblacion En tal caso se procede como se indica en la seccion 62

Cuando se tienen muestras pequefias es imprescindible encontrar otro proceshydimiento para construir intervalos de confianza

Como resultado del trabajo de Gosset (2) escrito bajo el seudonimo de Student se dispone de otra alternativa conocida como distribuci6n t de Student con frecuenda abreviada como distribuci6n t

La cantidad

sigue esta distribucion

162 CAPiTULO 6 ESTIMACION

Propiedades de la distribucion t La distribuci6n t tiene las siguientes proshypiedades

1 Tiene una media de O

2 Es simetrica con respecto a la media

3 En general tiene una variancia mayor que 1 pero esta tiende a I a medida que aumenta el tamaiio de la muestra Para dfgt 2 la variancia de la distribushyci6n t es dfl(df - 2) donde df representa los grados de libertad En forma alterna puesto que df n - 1 para n gt 3 se puede escribir la variancia de la distribuci6n t como (n l)(n 3)

4 La variable t va de - hasta + 00DO

5 La distribuci6n t es realmente una familia de distribuciones puesto que hay una distribuci6n diferente por cada valor de la muestra de n - 1 que es el divisor que se utiliza para ca1cular S2 Recuerde que n - 1 representa los grados de libertad En la figura 631 se muestran las distribuciones t correspondienshytes a algunos valores de los grados de libertad

6 Comparada con la distribuci6n normal ladistribuci6n t es menos espigada en el centro y tiene colas mas largas En la figura 632 se com para la distribushyci6n t con la distribuci6n normal

7 La distribuci6n t se aproxima ala distribuci6n normal a medida que n - 1 se aproxima al infinito

La distribuci6n t al igual quela distribuci6n normal estandar se ha tabulado ampliamente Una de estas tablas es la tabla E del apendice Tal como se puede apreciar se debe tomar en cuenta eLcoeficiente de confianza y los grados de libershytad cuando se utiliza la tabla de la distribuci6n t

FIGUR- 631 Distribuci6n t para diferentes grados de libertad

-----

163 63 DISTRIBUCION

__ Distribucion normal

- - - Dislribucion I

x

FIGURA 632 Comparaci6n de las distribuciones normal yt

Es posible utilizar el paquete MINITAB para graficar la distribuci6n t (para grados espedficos de libertad) y otras distribuciones Despues de asignar el eje horizontal y las siguientes direcciones en el cuadro de Set Patterned Data seleccioshyne del menu Calc y despues Probability Distributions Utilice el cuadro de diashylogo Plot para generar la grafica

Inlervalos de conJiQllia qllR uJilban fa dislribucion t El procedimien to general para construir interval os de confianza no se ve afectado por la necesidad de utilizar la distribuci6n t en lugar de la distribuci6n normal estandar Aun es necesario usar la relaci6n expresada por

estimador plusmn (coeficiente de confiabiIidad) x (error estandar)

Lo que es diferente es el origen del coeficiente de confiabilidad Este se obtiene a partir de la tabla de la distribucion t en lugar de la tabla de la distribuci6n normal estandar Para ser mas especfficos cuando se obtienen muestras a partir de una distribushycion normal cuya desviaci6n estdndi17 a se desconoce ell OO( 1 - a) por ciento del intervalo de confianza para la media de la poblaci6n J1 estd dado por

(631 )

Es importante aclarar que el requisito para el uso valido de la distribucion t es que la muestra debe ser extrafda de una poblad6n con distribucion normal Sin embarshygo la experiencia ha demostrado que se pueden tolerar desviaciones moderadas de esterequisito Como consecuencia la distribucion t se utiliza incluso cuando se sabe que la poblaci6n original se desvia de la normalidad Lltl mayorfa de los invesshytigadores requieren que al menos pueda sostenerse el supuesto de una distribushyd6n de poblacion en forma de montfculo

EJEMPLO 631

Maureen McCauley (A-I) realiz6 un estudio para evaluar los efectos de un conjunto de instrucciones de mecanica en ellugar de labores sobre el desempeno laboral de obreros jovenes recientemente contratados Se utilizaron dos grupos de individuos elegidos aleatoriamente uno de los grupos para aplicar el experimento y el otro

164 CAPITULO 6 ESTlMACI6N

como grupo de control EI grupo con el que se experimento recibio una hora de capacitacion impartida por un terapeuta ocupacional EI grupo de control no recishybio esta capacitacion Para evaluar el esfuerzo de cada obrero para levan tar bajar jalar y transportar objetos dentro del entorno laboral se utilizo una lista de cotejo para la evaluacion de trabajo mecanico que inclufa criterios de referencia Una tarea bien hecha recibio una calificacion de 1 EI grupo de control formado por 15 individuos alcanzo una calificacion media de 1153 en la evaluacion con una desshyviacion estandar de 3681 Se supone que el grupo de control se comporto como una muestra aleatoria extraida de una poblacion similar de individuos Se pretende utilizar los datos de la muestra para estimar la calificacion media para la poblacion

Soluci6n Se puede utilizar la media de la muestra 1153 como una estimacion puntualde la media de la poblacion sin embargo debido a que se descoshynoce la desviacion estandar de la poblacion se debe considerar que los valores siguen una distribucion aproximadamente normal antes de consshytruir los intervalos de confianza para l Se considera que esta suposicion es razonable y que se necesita un intervalo de confianza de ~or cienshyto el estimador es i y el error estandar es s -r 681 15 =9504 Ahora es necesario conocer el coeficiente de confiabilidad el valor de t asodado al coeficiente de confianza de 95 y a los n 1 = 14 grados de libertad Puesto que el intervalo de confianza de 95 por ciento deja 05 del area bajo la curva de t para dividirse en dos colas iguales se necesita el valor de tala derecha del cual esta el 025 del area Este valor se localiza en la tabla E enla columna encabezada por t

975 bull Este es el valor

para tala izquierda delcual esta 975 del area bajo la curva EI area a la derechade este valor es igual al 025 deseado Ahora sobre la columna de grados de libertad se localiza el numero 14 EI valor para t se encuentra en la interseccion del renglon con la etiqueta 14 y la columna con la etiqueta t975 bull Se encuentra que este valqr para t que representa al coeficiente de confiabilidad es 21448 Finalmente el intervalo de confianza de 95 por ciento se construye como sigue

1153 plusmn 21448(9504) 1153 plusmn 204 949 1357 bull

Este intervalo puede interpretarse con ambos puntos de vista probabiHstico y practico Puede asegurarse en un 95 por dento que 1a media l correcta de la poblacion se encuentra entre 949 y 1357 porque al repetir el muestreo 95 por dento de los intervalos construidos deigual manera incluyen a l

Decidir entre z r t Cuando se obtiene un intervalo de confianza para la media de una poblacion se debe decidir si se utiliza un valor de z6 de t como factor de confiabilidad Para hacer una elecci6n adecuada se debe considerar el tamafto de la muestra si la poblacion muestreada sigue una distribucion normal y si la varian cia de la poblacion es conocida La figura 633 muestra un diagrama de flujo que se puede utilizar para decidir rapidamente si el factor de confiabilidad debe ser Z 0 t

EJERCICIOS 165

EJERCICIOS

Sa aplica al leorema dellfmile central

FIGURA 633 Diagrama de flujo para deddir entre utililizar z y t cuando se hagan inferencias respecto a las medias de la poblaci6n (Para utilizar un procedimiento no parametrico vease el capitulo 13)

Analisis par computadara Si el proposito es construir un intervalo de conshyfianza con el programa MINITAB para la media de la poblacion cuando el estadfsshytico t es el factor de confiabilidad adecuado el comando se inicia con la palabra TINTERVAL Seleccione en Windows I-Sample t desde el menu de Basic Statistics

631 Utilice la distribud6n t para encontrar el factor de confiabilidad para el intervalo de confianshyza basado en los siguientes coeficientes de confianza y tamafiosde las muestras

a b c d

Coefidente de confianza 95 99 90 95 Tamafio de la muestra 15 24 8 30

632 En una investigacion acerca de la dependencia del flujo y volumen de todo el sistema respishyratorio en un grupo de pacientes con enfermedad obstructiva pulmonar cronica conectados a respiradores artificiales Tantucci et ai (A-2) registraron los siguientes valores de linea de

166 CAPITULO 6 ESTIMACION

base del flUjD continuo inspiratDriD (Us) 90 97 103110 104 100 CDnsidere que una muestra aleatDria simple esta cDnfDrmada pDr seis individuDs a partir de una pDblacion que sigue una distribuci6n nDrmal CDn individuDs CDn la misma enfermedad

a) ~Cuat es la estimaci6n puntual de la media de la pDblaci6n

b) ~Cuil es la desviacion estandar de la muestra

c) ~Cultll es la estimacion del error estandar para la media de la muestra

d) CDnstruya un intervalD de cDnfianza de 95 pDr ciento para el flUjD mediD cDntinuD inspishyratDriD de la pDblaci6n

e) ~Cual es la precision de la estimacion

f) Explique la interpretaci6n prDbabilistica para este intervalD de confianza

g) Explique la interpretacion practica para este intervalD de cDnfianza

633 LlDyd y MaillDux (A-3) informaron IDS siguientes datDs acerca del peso de la glandula pituitaria en una muestra de cuatrD ratas de Wistar Furth

media = 90 mg error estandar para la media = 3

FUEJTE Ricardo V Lloyd y Joe Mailloux Analysis ofSshy100 Protein Positive Folliculo Stellate Cells in Rat Pituitary Tissues AmericanJournal ofPathology 133 338-346

a) ~Cual es la desviadon estandar de la muestra

b) CDnstruya un intervalD de confianza de 95 pDr ciento para el peso medio de la glandula pituitaria para una pDblacion similar de ratas

c) ~Que supDsiciDnes se necesitan para que sea validD el intervalo de cDnfianza del inciso b

d) ~Que interpretacion puede ser la mas indicada cuandD se trata sDbre intervalos de conshyfianzacon alguien que no sabe de estadfstica Explique pDrque es la mas cDnveniente

e) 5i fuera necesario elabDrar un intervalD de cDnfianza de 90 pDr cientD para la media de la pDblaci6n ~el intervalD de cDnfianza serta mayDr 0 menor que el intervalD de 95 pDr dentD Explique su respuesta sin construir realmente el intervalD de cDnfianza

f) 5i [uera necesariD considerar un intervalo de CDnfianza de 99 pDr cientDpara lamedia de la poblacion ~el intervalo de cDnfianza serra mayDr 0 menDr que el intervalD de 95 pDr dentD Explique su respuesta sin cDnstruir realmentt el intervalD de cDnfianza

634 Kaminski y Rechberger (A-4) encontrarDn en un estudio sDbre la preeclampsia que la media de la presi6n sistolica sangufnea en 10 mujeres sanas y que no estan embarazadas es de 119 CDn una desviacion estandar de 21

a) 2Cual es el errDr estandar estimadD para la media

b) CDnstruya un intervalD de confianza de 99 pDr cientD para la media de la poblaci6n a partir de la cual puede considerarse que IDS 10 individuos conforman una muestra aleatoria

c) ~CUlil es la precisi6n estimada

d) ~Que consideraciones deben hacerse para comprobar la validez del intervalo de confiahza

635 Unamuestra de 16nifias de 10 afiDS pesan en promediD 715 con una desviacion estandar de 12libras CDnsidere el calculD de intervalDs de cDnfianza de 9095 y 99 pDr ciento para I-L

167 64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS

636 Una muestra aleatoria simple conformada por 16 individuos aparentemente sanos presenta los siguientes valores de arsenico eliminado en la orina (miligramos por dfa)

Individuo Valor Individuo Valor

1 007 9 012 2 030 10 006 3 025 11 010 4 008 12 032 5 030 13 006 6 038 14 009 7 007 15 014 8 005 16 011

Elabore un intervalo de confianza de 95 por ciento para la media de la poblaci6n

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES

En ocasiones se presentan casos en los que se desea estimar 1a diferencia entre 1a media de dos poblaciones A partir de cada poblacion se extrae una muestra aleatoria independiente y de los datos de cada una se calculan las medias muestrales XI y x2

respectivamente En el capitulo anterior se dijo que el estimador XI - x2 ofrece una estimacion insesgada de la diferencia entre las medias de las poblaciones III shy11 2 bull La variancia del estimador es (cr~ n l ) + (cr~ n 2 ) Tambien se menciono que seglin las condiciones la distribucion muestral de XI - x2 puede presentar una distribution al menos aproximadamente normal de modo que en muchos casos se utiliza la teorfa adecuada para las distribuciones normales en el calculo de un intershyvalo de confianza para III - 11 2 bull Cuando se conocen las variancias de la poblacion el intervalo de confianza del 100(1 - ex) por ciento para III - 112 esta dado por

(641)

El anal isis del intervalo de confianza para la diferencia entre las medias poblacionales ofrece informacion util para decidir si es 0 no probable que las medias de las dos poblaciones sean iguales Cuando el intervalo no incluye al cero se dice que el intervalo ofrece evidencia de que las dos poblaciones tienen medias diferentes Cuando el intervalo incluye al cero se dice que las poblaciones pueden tener meshydias iguales

Esto se ilustra a continuacion para el caso donde el muestreo se realiza a partir de una distribucion normal

168 CAPITULO 6 ESTlMACI6N

EJEMPLO 641

A un equipo de investigacion Ie interesa conocer la diferencia entre las concentracioshynes de acido urico en pacientes con y sin el sfndrome de Down En un gran hospital para el tratamiento de pacientes con retardo mental una muestra de 12 individuos con el sindrome presenta una media de XI = 45 mgll00 mL En un hospital general se encontro que una muestra de 15 individuos normales de la misma edad y sexo presenta un nivel medio de x2= 34 Si es razonable suponer que las dos poblaciones de valores muestran una distribucion normal y sus variancias son iguales a 1 y 15 calcule el intervalo de confianza de 95 por ciento para ~l - ~2

Soluci6n Para una estimacion puntual de III 112 se udliza Xl X2= 45 34 11 EI coeficiente de confiabilidad que corresponde a 95 localizado en la tabla D es 196 EI error estandar es

Por 10 tanto el intervalo de confianza de 95 por ciento es

11 plusmn 196(4282) 11plusmn84 26 194

Se dice que se dene una confianza de 95 por ciento de que la difeshyrencia real 111 - 112 este entre 26 y 194 porque en muestreos repetidos 95 por ciento de los intervalos construidos de esa manera incluiria la diferencia entre las medias reales

Puesto que el intervalo no incluye al cero se concluye que las dos poblaciones tienen diferentes medias bull

Muestreo a partir de poblaciones que no signen una distribuci6n ItOrmal La construccion de un intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando el muestreo se realiza a partir de poblaciones no normales se lleva a cabo en la forma descrita en el ejemplo 641 si las muestras n l y n

2 son grandes Una vez mas este es un resultado del teorema del limite central

Si se desconocen las variancias de la poblacion se utili zan las variancias de las muestras para estimarlas

IUEMPLO 642

Motivados por d conocimiento de la existencia de una gran cantidad de textos polemicos que sugieren que el estres la ansiedad y la depresion son dafiinos para el sistema inmunologico Gormanet ai (4-5) condujeron un estudio en el que se conshysider6 a individuos varoneshomosexuales algunos con VIH (virus de inmunodefishyciencia humana) positivo y otros con VIH negativo Los datos fueron registrados con una amplia vltJriedad de mediciones medicas inmunologicas psiquiatricas y neurol6gicas una de las cuales corresponde al numero de celulas CD4+ en la sanshy

64 INTERV ALO DE CONFIANZA PAHALA DIFERENCIA ENTRE DOS MEDIAS 169

gre El numero promedio de celulas CD4+ para middot112 individuos con infecci6n por VIR fue de 4018 con una desviaci6n estandar de 2264 Para los 75 individuos sin la infecci6n por VIR la media y la desviaci6n estandar fueron de 8282 y 2749 respectivamente Se pretende elaborar un intervalo de confianza de 99 por ciento para la diferencia de las medias de las poblaciones

Soluci6n No hay informaci6n con respecto a la forma de la distribuci6n de las celulas CD4+ Sin embargo como el tamafto de las muestras es grande el teorema del limite central asegura que la distribuci6n muestral de las diferencias entre las medias de la muestra siguen una distribuci6n aproxishymadamente normal independientemente de que la distribuci6n de la variable en las poblaciones no siga una distribuci6n normal Se puede utilizar este hecho para justificar el uso de la estadistica z como factor de confiabilidad en la construcci6n del intervalo de confianza Tampoco hay informaci6n acerca de las desviaciones estandar por 10 que puede emplearse las desviaciones estandar de las muestras para estimarlas La estimaci6n puntual para la diferencia entre las medias de las poblacioshynes es la diferencia entre las medias de las muestras 8282 - 4018 = 4264 En la tabla D se encuentra que el factor de confiabilidad es 258 La estimaci6n del error estandar es

s __ = 27492

+ 22642 =382786

Xl-X 75 112

Por la ecuaci6n 641 el intervalo de confianza de 99 por ciento para la diferencia entre las medias de la poblaci6n es

4264 plusmn 258(382786) 3276 5252

Se tiene la seguridad de 99 por ciento de que el promedio de celulas CD4+ en varones con VIR positivo difieren de la media para los varoshynes con VIR negativo por 3276 a 5252 bull

Distribuci6n t y la diferencia entre las medias Cuando no se conocen las variancias y se pretende estimar la diferencia entre las medias de dos poblacioshynes con un intervalo de confianza es posible utilizar la distribuci6n t para suminisshytrar el factor de confiabilidad si se conocen ciertas suposiciones se debe saber 0

suponer de buena fe que las dos poblaciones muestreadas siguen una distribuci6n normal Respecto a las variancias de las poblaciones se debe distinguir entre dos situaciones 1) la situaci6n en la que las variancias son iguales y 2) la situaci6n en la que no 10 son A continuaci6n se consideranambas sitpaciones por separado

Varianciaspoblacifmales iguales Si la suposici6n sobre igualdad de las variancias de las poblaciones esta justificada las dos variancias de las muestras calculadas a partir de las muestras independientes pueden considerarse como estishymaciones de 10 mismo es decir la variancia comun Parece 16gico entonces aproshyvechar este hecho en el anal isis en cuesti6n Esto es precisamente 10 que se hace para establecer una estimaci6n conjunta para la variancia comun Esta variancia se obtiene mediante el caIculo promedio ponderado de las dos variancias de las muesshy

170 CAPITULO 6 ESTlMACI6N

tras Cada variancia de la muestra es ponderada con base en sus grados de libertad Si los tamafios de las muestras son iguales este promedio ponderado es la media aritmetica de las variancias de las dos muestras Si el tamano de las dos muestras es distinto el promedio ponderado aprovecha la informacion adicional proporcionada por la muestra mayor La estimacion con junta se obtiene con la fOrmula

S2 = (nl _1)SI2 + (n2 l)s~ p (642)

+n2 -2nl

Asf la estimacion del error estandar esta dada por

(643)

y el intervalo de confianza de 100(1 a) por ciento para III 112 esta dada por

(644)

El nfunero de grados de libertad utilizado para determinar el valor de t que se usa para construir el intervalo es n

1 + n

2 2 que es el denominador de la ecuacion

642 Este intervalo se interpreta en la forma habitual Los metodos que pueden emplearse para tomar la decision acerca de la igualshy

dad de las variancias de las poblaciones se estudian en la seccion 610 y 78

EJEMPLO 643

Uno de los estudios de Stone et al (A-6) tuvo como objetivo determinar los efectos del ejercicio por un tiempo prolongado en los ejecutivos de una compania inscritos en un programa supervisado de acondicionamiento fisico Se registraron datos de 13 individuos (el grupo deportista) que voluntariamente se inscribieron el programa y que permanecieron activos por 13 anos en promedio y de 17 individuos (el segunshydo grupo el sedentario) que decidieron no inscribirse Entre los datos que se regisshytraron acerca de los individuos esta el mlmero maximo de sentadillas realizadas en 30 segundos El grupo deportista obtuvo una media y una desviacion estandar de 210 y 49 respectivamente La media y la desviacion estandar para el grupo sedenshytario fueron 121 y 56 respectivamente Se considera que las dos poblaciones de medici ones de acondicionamiento muscular siguen una distribuci6n aproxirnadashymente normal y que las variancias para ambas poblacionesson iguales Se pretenshyde elaborar un intervalo de confianza de 95 por ciento para Ja diferencia entre las medias de as poblaciones representadas por las dos muestras Soluci6n Primero se utiliza la ecuaci6n 642 para calcular la estimaci6n conjunta

de la variancia comtin de las poblaciones

(13-1)(49 2 )+(17 1)(562 ) =2821

13+17-2 Cuando se consulta la tabla E con 13 + 17 - 2= 28 grados de libertad y el nivel de confianza de 95 se encuentra que eLfactor de confiabilidad es 20484 Con la ecuacion 644 se calcula el intervalo de confianza de

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS 171

95 por ciento para la diferencia entre las medias de las poblaciones de la siguiente manera

2821 2821(210-121)plusmn20484 --+-shy

13 17 89 plusmn 40085

49129

Se tiene una confianza de 95 por ciento de que la diferencia entre las medias de las poblaciones estan entre 49 y 129 Se puede decir esto porque se sabe quesi se repite el amilisis muchfsimas veces y se calculan los intervalos de confianza de la misma manera cerca de 95 por ciento de los intervalos de confianza induiran la diferencia entre las medias de las poblaciones

Debido a que los intervalos no induyen al cerose conduye que las medias de las poblaciones son diferentes bull

Variancias poblacionales distintas Cuando no se puede conduir que las variancias de dos poblaciones de interes son iguales aun ruando pueda suponerse que las dos poblaciones presentan distribuciones normales no es adecuado utilizar la distribucion t como se acaba de describir para construir los intervalos de confianza

Una solucion al problema de variancias distintas fue propuesta por Behrens (3) y posteriormente fue verificada y generalizada por Fisher (4 5) Neyman (6) Scheffe (7 8) Y Welch (9 10) tambien proponen soluciones EI problema es analizashydo en detalle por Cochran (11)

EI problema gira en tomo al hecho de que la cantidad

no sigue una distribuci6n t con nj + n 2 grados de libertad ruando las variancias 2 shy

de las poblaciones son distintas Consecuentemente la distribucion t no se puede utilizar en la forma habitual pata obtener el factor de confiabilidad del intervalo de confianza para la diferencia entre las medias de dos poblaciones que tienen variancias diferentes La solucion propuesta por Cochran consiste en el calculo del factor de confiabilidad mediante la siguiente formula

wltj + w2tZ t l

f

-0f2 = (645) WI +w2

donde WI 512

np W 2 = s~ n2 tl = tl _ para nj - 1 grados de libertad y t2 = t l

_w2aI2

para n2

- 1 grados de libertad Un intervalo aproximado de confianza del 100(1 shya) por ciento para III - 112 esta dado por

(646)

172

EJERCICIOS

CAPITULO 6 ESTlMACION

FJEIUPLO 644

En la investigacion de Stone et al (A-6) descrita en el ejercicio 643 los investigashydores tambien informaron los siguientes datos de las medici ones referentes a todas las calificaciones del acondicionamiento muscular logradas por los individuos

Muestra n Media Desviaci6n estimdar

Grupo deportista 13 45 3

Grupo sedentario 17 37 10

Se considera que las dos poblaciones de todas las calificaciones de acondicionashymiento muscular siguen una distribuci6n aproximadamente normal Sin embargo no debe suponerse que las dos variancias poblacionales son iguales Se pretende construir un intervalo de confianza de 95 por ciento para la diferencia entre las medias de todas las calificaciones de acondicionamiento muscular para las dos poshyblaciones representadas por las muestras

Soluci6n Se utiliza t de la ecuaci6n 645 para calcular el factor de confiabilidad En la tabla E se muestra que con 12 grados de libertad y 1 - 052 = 975 t( 21788 Analogamente con 16 grados de libertad y 1- 052 = 975 t2 = 21199 Ahora Sf calcula

(3 2 13)(21788) + (102 17)(21199) 139784 t= =

(3 2 13)+(102 17) 065747

=21261

Con la ecuaci6n 646 ahora se construye el intervalo de confianza de 95 por ciento para la diferencia entre las medias de las dos poblaciones

2 2

(45 37)plusmn21261 3 + 10 13 17

8 plusmn 21261 (25641101) 25134

Puesto que el intervalo no incluye acero se concluye que las medias de las dos poblaciones son diferentes bull

Cuando se construyen intervalos de confianza para la diferencia entre las medias de dos poblaciones es posible utilizar la figura 641 para decidir rapidashymente si el factor de confiabilidad debe ser z t 0 tf

Para cada uno de los siguientes ejercicios construya intervalos de confianza de 90 95 y 99 par ciento para las diferencias entre las medias poblacionales Establezca consideraciones que hagan que el metodo sea valido Determine las interpretaciones practica y probabilistica

clJ clJ FIGURA 541 Diagrama de flujo para decidir si e1 factor de confiabilidad debe ser z tot cuando se realizan inferencia inferencias acerca de la diferencia entre las medias de dos pobladones (Para usar un procedimiento no parametrico ver el capitulo 11)

174 CAPiTULO 6 ESTlMACION

para cad a intervalo construido Suponga las variables bajo considerati6n en cad a ejercicio y establezca para que pueden servir a los investigadores esos resultados

641 EI objetivo de un experimento de Buckner et al (A-7) consisti6 en estudiar los efectos del relajamiento muscular inducido por el pancuronium en el volumen del plasma circulante Los individuos estudiados son recien nacidos con un peso mayor a 1700 gramos que necesishytaron de ayuda para respirar durante las primeras 24 horas despues de nacer y cumplieron con otros criterios cHnicos Cinco recien nacidos paraIizados con el pancuronium y siete recien nacidos no tratados presentaron las siguientes estadisticas en la segunda de las tres mediciones del volumen de plasma (ml) hecha durante la respiraci6n mecanica

Paralizados 480 81 No tratados 567 81

La segunda medici6n para el grupo tratado ocurri6 de 12 a 24 horas despues de la primera dosis de pancuronium Para el grupo no tratado las mediciones se hicieron de 12 a 24 horas despues de iniciar la respiracion mecanica

642 Zuckery Archer (A-8) afirman que la N-nitrosobis (2-oxopropyl)amina (BOP) y las nitrosaminas 3-oxidizadas producen una alta incidencia de tumores de conductos pancreaticos en el hamster dorado sirio Estudiaron los efectos en el peso sangufneo en la glucosa del plasma en la insulina yen los niveles de transamina glutamico-oxaloacetica del plasma (GOT) de los hamsters expuestos in vivo a la BOP Los investigadores reportaron los siguientes resultados en ocho animales tratados y 12 sin tratamiento

Variable Sin tratamiento Con tratamiento

Glucosa del plasma (mglgl) 101 plusmn 5 74plusmn 6

FUENTE Peter F Zucker y Michael C Archer Alterations Pancreatic Islet Function Produced by Carcinogenic Nitrosamines in the Syrian Hamster AmericanJournal oPathology 133 573-577

Los datos son la media de la muestra plusmn la estimaci6n del error estandar de la media de la muestra

643 Los objetivos de un estudio de Davis et al (A-g) son evaluar 1) la eficacia del programa auto ayuda momento para dejar de fumar cuando se utiliza con base de uno a uno en el hogar y 2) la viabilidad de ensefiar temicas para abandonar el habito de fumar a los estudiantes de enfermerfa en bachillerato A estudiantes graduados de enfermerfa inscritos en dos cursos de metodologia de la investigacion de la Universidad de Ottawa se les invit6 a participar en el proyecto Se aplic6 un cuestionario de opcion multiple para abandonar el habito de fumar a 120 estudiantes de enfermeria que participaron y a otros 42 estudiantes que no participashyron antes ni despues del estudio Se calcularon las diferencias entre las calificaciones antes y despues del estudio as como las siguientes estadisticas a partir de las diferencias

EJERCICIOS 175

Grupo Media Desviaci6n estandar

Participantes (A) 214444 15392 No participantes (B) 33333 14595

644 El doctor Ali Khraibi (A-IO) de la CHnica y Fundaci6n Mayo condujo una serie de experishymentos con el fin de evaluar las respuestas diureticas y natiureticas de ratas Okamoto esponshytaneamente hipertensivas (REB) y ratas Wistar-Kyoto (WRY) para dirigir incrementos en la presion hidrostatica renal intersticial (PBRI) Para aumentar la PBRI se utiIiz6 la expansi6n directa del volumen renal intersticial (DRIVE) a traves de una matriz implantada cronicamente en el rinOn Entre los datos registrados durante el estudio estan las siguientes mediciones de excreci6n de sodio a traves de la orina (UNa V) durante el periodo de DRIVE

Grupo

REB 632572796483527 2WKY 420469482 108210

FUENTE Publicada con autorizaci6n del Dr Ali A Khraibi

645 Osberg y Di Scala (A-II) realizaron un estudio centrado en la eficacia de los cinturones de seguridad para reducir 1esiones entre sobrevivientes de accidentes automoviHsticos internashydos en hospitales con edades de 4 a 14 afios El estudio compar610s resultados de 123 ninos que utilizaron el cintur6n contra 290 que no 10 utilizaron entre aquellos que se vieton enshyvueltos en tales accidentes y que fueron hospitalizados El informe con tenia la siguiente estadistica del numero de dfas en la unidad de cuidados intensivos

Grupo Media Error estandar estimado

Utiliz6 el cintur6n 83 16 No utiliz6 el cintur6n 139 18

646 La medicion del diametro transversal del coraz6n de hombres y mujeres adultos presenta los siguientes resultados

sx Grupo Tamafto de Ia muestra (cm) (cm)

Varones 12 1321 105 Mujeres 9 IIOO 101

Considere que las poblaciones siguen una distribucion normal con variancias iguales

176 CAPITULO 6 ESTIMACION

647 Veintiruatro animales de laboratorio con deficiencia de vitamina D fueron divididos en dos grupos iguales EI grupo 1 recibi6 un tratamiento consistente en una dieta que proporcionashyba vitamina D EI segundo grupo no fue tratado AI termino del periodo experimental se midieron las concentraciones de calcio ensuero obteniendose los siguientes resultados

Grupo tratado X 111 mg 100 mls = 15 Grupo sin tratamiento x= 78 mg 100 ml s = 20

Considere que las poblaciones siguen una distribuci6n normal con variancias iguales

648 Ados grupos de nifios se les hicieron pruebas de agudeza vi~ual El grupo 1 estuvo formado por 11 nifios que recibieron la atenci6n de medicos privados La calificaci6n media para este grupo fue de 26 con una desviaci6n estandar de 5 El segundogrupo que incluy6 14 nifios que recibieron atenci6n medica por parte del departamento de salud publica tuvo una calishyficaci6n promedio de 21 con una desviaci6n estandar de 6 Suponga que las poblaciones siguen una distribuci6n normal con variancias iguales

649 El tiempo promedio de estancia de una muestra de 20 pacientes dados de alta de un hospital general es de siete dras con una desviaci6n estaildar de dos dras Una muestra de 24 padenshytes dados de alta de un hospital de enfermedades cr6nicas tuvo un tiempo promedio de estancia de 36 dfas con una desviaci6n estindar de 10 dias Suponga que la poblaci6n sigue una distribuci6n normal con variancias desiguales

6410 En un estudio de factores que se consideran responsables de los efectos adversos del tabashyquismo sobre la reproducci6n humana se midieron los niveles de cadmio (nanogramos por gramo) en el tejido de la placenta de una muestra de 14 madres que fumaban y una muestra aleatoria independiente de 18 mujeres no fumadoras Los resultados fueron los siguientes

No fumadoras toO 84 128250 118 98 125 154 235

94251 1952559875 118122150

Fumadoras 300301150241305178168148

134285 175 144 125204

ms probable que el nivel medio de cadmio registrado sea mayor entre las fumadoras que entre las no fumadoras ~Por que se llegarfa a esta conclusi6n

65 INTERVALO DE CONFIANZA PARA IA PROPORCION DE UNA POBIACION

Muchas preguntas de interes para que el tecnico en salud tienen relacion con las proporciones de poblacion ~Que propordon de padentes que redben un tipo espeshycial de tratamiento se recuperan ~Que proporcion de alguna poblacion tiene cierta enfermedad ~Que propordon de una poblacion es inmune a derta enfermedad

Para estimar la proporcion de una poblacion se procede en la misma forma que cuando se estima la media de una poblacion Se extrae una muestra de la poblacion de interes y se calcula su proporcion p Esta se utiliza como el estimador puntual para la proporcion de la pobladon Un intervalo de confianza se obtiene mediante la siguiente formula general

estimador plusmn (coefidente de confiabilidad) X (error estandar)

EJERCICIOS

EJERCICIOS 177

En el capitulo anterior se vio que cuando np y n(1 - p) son mayores que 5 se puede considerar que la distribuci6n muestral de pse aproxima bastante a una distribuci6n normal Cuando se cumple con esta condici6n el coeficiente de confiabilidad es algUn valor de z de la distribuci6n normal estandar Esta visto que el error estandar es igual a (J p =fi(l-p) n Puesto que p que es el parametro que se trata de calcular se desconoce se debe utilizar pcomo una estimaci6n Asf se estima (J j por medio de ~p(l Pn y el intervalo de confianza de 100(1 - 0) por ciento para pesta dado por

pplusmn Z(I-1J2)~P(l- P) Fn (651)

Este intervalo se interpreta tanto desde el punto de vista practico como probabilistico

FJEMPLO 651

Mathers et al (A-12) encontraron queen una muestra de 591 pacientes internados en un hospital psiquiatrico 204 admitieron que consuniieron marihuana al meshynos una vez durante su vida Se pretende construir un intervalo de confianza de 95 por ciento para la proporcion de individuos que consumieron marihuana durante su vida en la poblaci6n muestreada de los internos del hospital psiquiatrico

Solucion La mejor estima~i6n puntual para la proporci6Il de la poblaci6nes p== 204591 3452 El tamafio de la muestra y hiestimacion de p tienen una magnitud suficiente parajustifKar el empleo de la distribucion norshymal estandar paraelaborar un intervalo de confianza EI coeficiente de corifiabilidad que corresponde alnivel de confianza de 95 es 196 la estimacion del errorestandar (Jp es ~p(l-pgtn = (3452)(6548)591

0 1956El intervalo de confianza para p de acuerdo con estos datos es

3452 plusmn 196(01956) 3452 plusmn 0383 3069 3835

Se puede decir que se tiene 95 por ciento de confianza de que la proporshycionpeste entre 3069 y 3835 ya que al repetir el muestreo casi 95 por ciento de los intervalos construidos en la forma de este intervalo inclushyyen a la proporcion p real Con base en estos resultados se espera con una confianza de 95 por ciento encontrar que entre 3069 y 3835 por ciento de los internados en el hospital psiquiatrico tiene antecedentes de consumo de marihuana bull

Para cada uno de los siguientes ejercicios establezca la interpretacion prictica yprobabilistica de los intervalos que se pide construir Identifique cada componente del intervalo la estimashycion puntual el coeficiente de confiabilidad yel error estandar Explique por que los coefishycientes de confiabilidad no son los misInos para todos los ejercicios

178 CAPITULO 6 ESTIIlACI6N

651 En una investigaci6nde ninos maltratados en pacientes psiquiatricos Brown y Anderson (A-IS) encontraron 166 pacientes en una muestra de 947 con antecedentes de abuso sexual y maltrato flsico Construya un intervalo de confianza de 90 por dento para la proporci6n de la poblaci6n

652 Catania et at (A-14) obtuvieron datos respecto al comportamiento sexual de una muestra de hombres y mujeres solteros con edades entre 20 y 44 residentes en areas geoijfaficas caracshyterizadas por tasas altas de enfermedades de transmision sexual e ingreso a programas de drogas De 1229 encuestados 50 por ciento respondieron que nunca utilizaron preservatishyvos Construya un intervalo de confianza de 95 por ciento para la proporcion de la poblaci6n que nunca utiliza preservativos

653 Rothberg y Lits (A-I 5 ) estudiaron el efecto del estres de la maternidad durante el embarazo en el peso del producto Los individuos eran 86 mujeres blancas con antecedentes de estres que no tenfan faetores de riesgo medico u obstetrico conoddo de peso bajo del producto Los investigadores eneontraron que 128 por dento de las madres estudiadas dieron a luz bebes que cubrfan el criterio de peso bajo Construya un intervalo de confianza de 99 por ciento para la proporci6n de la poblaci6n

654 En una muestra aleatoria simple de 125 varones desempleados quienes desertaron de la escuela preparatoria entre las edades de 16 y 21 anos inclusive 88 declararon que eran consumidores regulares de bebidas alcoh6litas Construya un intervalo de eonfianza de 95 por ciento para la proporcion de la poblacion

66 INTERVALO DE CONFIANZA PARA lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS POBlACIONES

A menudo se tiene interes en conocer la magnitud de la diferencia entre las proporcioshynes de dospoblaciones Es posible que se quiera comparar por ejemplo entre hombres y mujeres dos grupos de edades dos grupos socioecon6micos 0 dos grupos de diagshynostico con respecto a la proporcion que posee alguna caractenstica de interes Un estimador puntual insesgado de la diferencia entre dos proporciones de las poblacioshynes se obtieneal calcular la diferencia de las proporciones de las muestras PI P2 Tal como Se ha visto cuando n1 Yn2 son de gran tamano y las proporciones de la poblacion no estan muy cerca de 0 0 de 1 es posible aplicar el teorema del limite central y utilizar la teona de la distribucion normal para obtener los intervalos de conshyfianza EI error estandar de la estimacion se calcula mediante la siguiente formula

dado que como regIa se desconocen las proporciones de Ia poblacion Un intervashy10 de confianza de 100(1 - a) por ciento para PI P2 se obtiene as

(661)

Es posible interpretar este intervalo desde elpunto de vista probabiHstico y practico

EJERCICIOS 179

EJEMPLO 661

Borst et al (A-16) investigaron la relaci6n de desarrollo del ego edad sexo y diagshyn6stico de suicidio entre los internos adolescentes de la unidad de psiquiatria La muestra consistia en 96 varones y 123 niiias con edades entre 12 y 16 aiios seleccioshynados de entre los internados en la unidad de adolescentes y niiios de un hospital psiquiatrico privado Se reportaron 18 niiios y 60 niiias con intento de suicidio Cons ishyderese el comportamiento de las niiias como el de una muestra aleatoria simple a partir de una poblaci6n similar de niiias y que los j6venes igualmente pueden considerarse como una muestra aleatoria simple extraida de una poblaci6n similar de niiios Para estas dos poblaciones se pretende construir un intervalo de confianshyza de 99 por ciento para la diferencia entre las proporciones de los individuos con intento de suicidio

Soluci6n Las proporciones para las niiias y niiios respectivamente son Pc = 601 123 = A878y PB = 1896 1875 La diferencia entre las proporciones de lasmuestrases Pc PB = 4878 1875 = 3003 El error estandar estimado de la diferenda entre las proporciones de las muestras es

(4878)(5122) (1875)(8125) ---~~-~ +-------shy

123 96

El factor de confiabilidad a partir de la tabla D es 258 de modo que el intervalo de confianza con la f6rmula 661 es

3003 plusmn 258(0602) 14504556

Se dene la confianza de 99 por dento de que para las poblaciones muestteadas la ptopord6n de intentos de suiddio entre las niiias exceshyde a lapropord6n de intentosde suiddio entre los varones por 1450 y 4556

Puesto que el intervalo no incluye al cero se concluye que las dos proporciones de pobladones son diferentes bull

FJERCICIOS

Para cada uno de los siguientes ejercicios establezca las interpretaciones pnicticas y probabishylisticas de los intervalos que se pide construir Identifique cada componente del intervalo la estimaci6n puntual el coeficiente de confiabilidad y el error estandar Explique por que los coeficientes de confiabilidad no son el mismo para todos los ejercicios

661 Hargers et al (A-17) del departamento de Salud PUblica y Ambieptal en Amsterdam condushyjeron un estudio en el que los individuos eran consumidores de drogasinyectables (CDI) En una muestrade 194 consumidores de metadona regular de largo plazo (MLP) 145 eran varones En una muestra de 189 CDIque no consmiddotumian MLP 133 eran varones Establezca las consideraciones necesarias acerca de las muestras ypoblaciones representadas y construshy

180 CAPITULO 6 ESTlMACI6N

ya un intervalo de confianza de 95 por ciemo para la diferenda entre las proporciones de varones en las dos poblaciones

662 Una investigaci6n de Lane et ai (A-I8) valor6las diferencias en las pnicticas de deteccion de cancer de seno entre muestras de mujeres predominantemente de bajos ingresos con edashydes de 50 a 75 anos que lltilizan los servicios de c1inicas de sailld para todo el estado y mlljeres de la misma edad residentes en ciudades donde las c1inicas de salud son locales De las 404 encuestadas seleccionadas en toda la comunidad 592 por ciento estuvo de acuerdo con el siguiente comentario acerca del cancer de pecho las mujeres prolongan su vida si detectan el cancer desde el inicio De entre 795 usuarias de clinicas de salud en la mllestra 449 por ciento estuvo de acuerdo Establezca las suposiciones apropiadas para elaborar un intervalo de confianzade 99 por ciento para la diferencia entre las dos proporciones de las poblaciones de interes

663 Williams et at (A-19) encuestaron a una muestra de 67 medicos y 133 enfermeras con famishyliares farmacodependientes EI prop6sito del estudio era evaluar la influencia en los medishyEOS y enfermeras de estar estrechamente involucrados con una 0 mas personas farmaco dependientes Cincuenta y dos medicos y 89 enfermeras dijeron que vivian con personas farmacoldependientes que adversamente afectaban 8U trabajo E8tablezca todas las consideshyraciones que crea necesarias para construir un intervalo de confianza de 95 por ciento para la diferencia entre las proporciones en las dos poblaciones de trabajadores que se espera esten adversamente afectados por vivir con personas farmacodependientes

664 Aronow y Kronzon (A-20) identificaron los factores de riesgo coronado entre hombres y mujeres en una dinica de cuidados de la salud a largo plazo De los 215 individuos negros 58 tienen diabetes mellitus al igual que 217 individuos blancos de 1140 Elabore un intervalo de confianza de 90 por ciento de confianzapara la diferencia entre las proporciones de las dos poblaciones tCuaies son las poblaciones correspondientes ~Que consideraciones son necesarias para hacer valido el procedimiento de inferencia

67 DETEHMINAUON DEL TAMANO DE LA MUESTRA PARA LA ESTIMACIONDEIAS MEDIAS

La pregunta de que tan grande debe ser una muestra surge inmediatamente al inicio del planteamiento de cualquier encuesta 0 experimento Esta es una pregunshyta importante y no se debe tratara la ligera Tomar una muestra mas grande de 10 necesario para obtener los resultados deseados es un desperdicio de recursos mienshytras que por otro lado las muestras demasiado pequenas con frecuencia dan resulshytados que carecen de uso practico En esta secci6n se estudia c6mo determinar el tamano de la muestra de acuerdo con la situaci6n A continuaci6n se proporciona un metodo para determinar el tamano de la muestra que se requiere para estimar Ia media de la poblaci6n yen la siguiente secci6n se aplica este metodo para detershyminar el tamano de la milestra cuando se desea estimar la proporci6n de una poshyblaci6n Mediante extensiltmes directas de estos metodos es posible determinar el tamano necesario de las muestras para situaciones mas complicadas

Objetivos El objetivo de la estimaci6n porintervalos es el de obtener intervalos estrechos con alta confiabilidad Si se observan los componentes ~e un intervalo de confianzase veque 8U dimension esta determinada por la magnitud de la cantidad

(coeficiente de confiabilidad) x (error estandar)

131 67 DETERMINACION DEL TAMANO PARA LA l-IUESTRAmiddot

ya que lamagnitud total del intervalo de confIanza es eldoble de esta cantidad Se aprendi6 que a esta cantidad generalmente se Ie llama precisi6n de la estimaci6n o margen de error Para un error estandar dado incrementar la confIabilidad signishyfIca un coefIciente con mayor confIabilidad Y un coefIciente con mayor confIabilidad produce unintervalo mas amplio

Por otra parte si se ftia el coefIciente de confIabilidad la unica manera de redudr la amplitud del intervalo es la reducci6n del error estandar Dado que el error estandar es igual a (J IJ y como (J es una constante la unica forma de obtener un error estandar menor es tomar una muestra grande ~Que tan grande debeser la muestra Esto depende del tamafio de (J la desviad6n estandar de la poblaci6n asi como del grado de confIabilidad y dimensi6n del intervalo deseados

Suponga que se desea obtener un intervalo que se extienda d unidades hacia uno y otro lado del estimador Ellose enuncia

d (coefIciente de confIabilidad) X (error estandar) (671)

Si el muestreo es con reemplazos a partir de una poblaci6n infInita 0 de una que sea 10 sufIcientemente grande como para ignorar la correcci6n por poblaci6n fInita la ecuaci6n 671 se transforma en

(J

d z- (672)-r la cual cuando se despeja n nos da

(673)d2

Cuando el nmestreo se hacesin reemplazos a partir de una poblaci6n fInita y peshyquefia se requiere de la correcci6n por poblaci6n fInita y la ecuaci6n 671 se transforma en

(J~d (674)fN~

que al despejar n resulta en

n-----shy (675)d 2(N 1) + Z2(J2

Si puede omitirse la correcci6n por poblad6n fInita la ecuaci6n 675 se reshyduce a la ecuaci6n 673

Estillluci6n de (J 2 Las f6rmulas para el tamafio de la muestra requieren del conocimiento de (J2 pero como ya se ha sefialado la varian cia de la poblaci6n casi

132 CAPITULO 6 ESTlMACION

siempre sedesconoce Como resultado esnecesarioestimar (J2 Las fuentes de estishymaci6n de(J2 que se utilizan con mas frecuencia son las siguientes

1 Se extrae una muestrapilato 0 prel~l11inar de lapoblaci6n y se puede utilizar la variancia calculada a partir de esta muestra como unaestimaci6n de (J2 Las observaciones uti lizadas en la muestra piloto se toman como parte de la muesshytrafinal de modo que n (el tamaiio calculado de la muestra) n

1 (el tamaiio

de la muestra piloto) n2 (el numero de observaciones necesarias para satisfacer el requerimiento total del tamaiio de la muestra)

2 A partir de estudios anteriores osimilares es posible obtener estimaciones de (J2

3Si se cree que la poblaci6n de lacual se extrae la muestraposee una distribushyci6n aproximadamente nqrmal se puede aprovechar el hecho de que la amshyplitud es aproximadamente igual a 6 desviaciones estandar y calcular (J R6 Este metodo requiere aIglin conocimiento acerca de los valores minimo y maximo de la variable en la poblaci6n

EJEMPLO 671

Un nutri6logo del departamento de salud al efectuar una encuesta entre una poshyblacien de muchachas adolescentes con e1 fin de determinitr su ingesti6n diaria promedio de proteinas (medidas en gramos) busc6 el consejo de un bioestadistico con respecto al tamaiio de la muestra que deberfa tomar

~Que procedimiento debe seguir el bioestadistico para asesorar al nutri610go Antes de que el estadistico pueda ayudar el nutri6logo este debe proporcionar tres elementos de informaci6n h dimensi6n deseada del intervalo de confianza el nivel de confianza deseado y la magnitud de la variancia de la poblaci6n

Soludon Suponga que el nutri6logo requiere un intervalo con una dimensi6n de aprQximadamente 10 gramos es decir la estimaci6n se deberfa enconshytrar alrededor de 5 gramos de la media de la poblaci6n en ambas direcshyciones En otras palabras se desea un margen de error de 5 gramos Suponga que se decide por un coeficiente de confian7a de 95 y que con base en su experiencia previa el nutri6logo percibe que la desviaci6n estandar de la poblaci6n es probablemente de alrededor de 20 gramos EI estadfstico dispone ya de la informaci6n necesaria para calcular el tamaiio de la muestra z 196 (J = 20 y d 5 Suponga que el tamaiio de la poblaci6n es grande asf queel estadistico puede ignorar la correcshyci6n por poblaci6n finita y utilizar la ecuaci6n 673 Con las sustitucioshynes adecuadas el valor de n se calcula como

Se recomienda que el nutri610go tome una muestra de tamafio 62 AI calcular el tamaiio de una muestra a partir de las ecuaciones 673 0 675 el resultado se redondea al siguiente nurnero entero mayor si los calculosdan un numerocon decimales bull

183 68 DETERMINACION DEL TAl1ANO PARA LAS PROPORCIONES

EJERCICIOS

671 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su hospital Si se desea un intervalo de confianza de 99 por dento con una amplitud de 1 libra ~que tan grande debe ser la muestra de los registros de nacimiento Suponga que un estimashy

dor razonable para (J es 1 libra ~De que tamano debe ser la muestra si el coeficiente de confiabilidad se hace descender a 95

672 El director de la secdon de control dela rabia del departamento de salud publica desea extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso del ano anterior para estimar la edad media de las personas mordidas Requiere un intervalo de confianza de 95 por dento decide utilizar un valor de 25 para d y a partir de estudios anteriores estima que la desviacion estandar de la poblacion esta alrededor de los 15 anos ~Que tan grande debe ser el tamano de la muestra

673 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mglOO ml) de pacientes atendidos en una clinica para diabeticos durante el transcurso de los ultimos 10 anos Determine el numero de registros que el medico debe examinar para obtener un intershyvalo de confianza de 90 por ciento para 11 si la dimension requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varian cia de 60

674 Se deseaestimar la edad media en la que a los padentes de esclerosis multiple se les diagnosshytico el padecimiento por primera vez Se requiere un intervalo de confianza de 95 por dento con una dimension de 10 anos Si la variancia de la poblaci6n es de 90 ~que tan grande debera ser la muestra

68 DETERMINACION DELTAMANO DE lA MUESTRA PARA lA ESIDIACION DE lAS PROPORCIONES

EI metodo para estimar el tamafio de la muestra cuando se requiere estimar la proshyporcion de una poblacion es esencialmente el mismo que se describio para estimar la media de una poblacion Se aprovecha el hecho de que la mitad del intervalo deseashydo d se puede igualar al producto del coeficiente de confiabilidad y el error estandar

Si se supone que el muestreo ha sido hecho de manera aleatoria y que existen condiciones que garanticen que la distribuci6n de psea aproximadamente normal se obtiene la siguiente formula para n cuando el muestreo es con reemplazo cuanshydo se realizaa partir de una poblacion infinita 0 ruando la poblacion muestreada es 10 suficientemente grande como para hacer innecesario el uso de la correcci6n por poblacion finita

n (681)

dondeq = I-p Si la correccion por poblacion finita no puede descartarse la formula adecuashy

da paran es

(682)n d 2 (N -1)+z2pq

euan do N es grande en comparacion con n (es decir n IN 05) se puede pasar por alto la correccion por poblacion finita y la ecuacion 682 se reduce a la ecuacion 681

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

160 CAPITULO 6 ESTlMACION

como una estimacion puntual para la mediana de la poblacion sino que tambien es posible construir un intervalo de confianza para la mediana de la poblacion En esta obra no se proporciona la formula pero esta se puede encontrar en la obra de Rice (1)

Media ajustada Los estimadores que son insensibles a los sesgos se Haman estimadores eficaces Otra medida y estimador eficaz de tendencia central es la media ajustada Para un conjunto de datos que contiene n mediciones se calcula el 1000 por ciento de la media ajustada como sigue

1 Ordenar las mediciones

2 Descartar las medici ones mas pequeiias y mas grandes que 100a por ciento de las mediciones El valor recomendado para a esta entre 1 y 2

3 Calcular la media aritmetica de las mediciones restantes

Observe que la mediana podrfa considerarse como 50 por ciento de la media ajusshytada Se debe recordar que la media ajustada para el conjunto de datos es una de las medidas descriptivas que puede calcular MINITAB

FJERCICIOS

Construya para cada uno de los siguientes ejercicios los intervalos de confianza al 90 95 Y 99 por ciento para la media de la poblacion y establezca para cada uno la interpretacion probabilistica y practica Indique cualinterpretacion puede ser mas aderuada para utilizar ruando se trata sobre intervalos de confianza con alguien que no conoce de estadfstica y establezca eI razonamientode por que se eUgi6 Explique por que los tres intervalos no tjenen la misma amplitud Indique cual de los tres intervalos es preferible como estimador de la media de la poblacion y establezca el razonamiento de la elecci6n

621 Se pretende estimar el numero promedio de latidos del coraz6n por minuto para cierta poblaci6n Se encontr6 que el numero promedio de latidos por minuto para 49 personas era de YO Considere que esos 49 pacientes constituyen una muestra aleatoria y que la poblacion sigue una distribucion normal con una desviaci6n estandar de 10

622 Se pretende estimar la concentraci6n media de bilirrubina indirecta en el suero en nmos de cuatro dias de nacidos La media para una muestra de 16 ninos es de 598 mglOO cc Conshysiderese que la concentraci6n de bilirrubina en los ninos de cuatro dfas de nacidos sigue una distribucion aproximadamente normal con una desviaci6n estandar de 35 mgIOO cc

623 En un estudio acerca de la duraci6n de la hospitalizacion dirigido por vados hospitales en cooperacion se extrajo una muestra aleatoria de 64 individuos con ulcera peptica de la lista de todos los pacientes con esa enfermedad internados alguna vez en los hospitales particishypantes Se determin6 para cada uno de eUos el tiempo de hospitalizaci6n Se encontr6 que la duraci6n media de hospitalizaci6n fue de 825 dfas y se sabe que la desviaci6n estandar de la poblaci6n es de tres dfas

624 Una muestrade 100 hombres adultos aparentemente sanos de 25 anos de edad muestra una presi6n sist61ica sangufnea media de 125 Considere que la desviaci6n estandar de la poblaci6n es de 15

161 63 DISTRIBUCI6N

625 Algunos estudios acerca de la enfermedad Alzheimer (EA)han mostrado un incremento en la producci6n de 14C0

2 en pacientes con ese padecimiento Durante un estudio se obtuvieshy

ron los siguientes valores de 14C02

a partir de 16 biopsias de neocorteza de pacientes con la enfermedad (EA)

1009 1280 1180 12551547 2352 1956 1080

1776 1767 1680 2050 1452 2857 3100 1621

Considereseque la poblaci6n sigue una distribuci6n normal con una desviaci6n estandar de 350

63 DISTRIBUCION t

En la seccion 62 se describe un procedimiento para obtener un intervalo de conshyfianza para la media de una poblaci6n EI procedimiento requiere del conodmiento de la varianda de la poblacion de la que se extrae la muestra Puede parecer un tanto extrafio que se tenga conocimiento de lavariancia de la poblacion y no se conozca elvalor de la media de la poblacion De hecho es comun en situacioshynes como las que se han presentado que se deSconozca tanto la variancia como la media de la poblacion Esta situacionpresenta un problema respecto a la construcshycion delos intervalos de confianza Por ejemplo aun cuando la estadfstica

x J1shyZ=---

crJn presenta una distribudon normal cuando la poblacion tambien tiene una distribuci6n normal y sigue una distribuci6n aproximadamente normal cuando n es muy grande independientemenle de la forma funcional de la poblacion no se puede hacer uso de este hecho porque cr se desconoce Sin embargo no todo esrn perdido y la soluci6n mas logica para este problema es utilizar la desviacion estandar de ~muestra

s = ~L(Xi - x)2(n-l)

para sustituir cr Por ejemplo cuando el tamafio de la muestra es mayor que 30 la confianza en s como una aproximacion de cr es por 10 general sustancial por 10 que se justifica la utilizacion de la teorfa de la distribudon normal para construir un intervalo de confianza para la media de la poblacion En tal caso se procede como se indica en la seccion 62

Cuando se tienen muestras pequefias es imprescindible encontrar otro proceshydimiento para construir intervalos de confianza

Como resultado del trabajo de Gosset (2) escrito bajo el seudonimo de Student se dispone de otra alternativa conocida como distribuci6n t de Student con frecuenda abreviada como distribuci6n t

La cantidad

sigue esta distribucion

162 CAPiTULO 6 ESTIMACION

Propiedades de la distribucion t La distribuci6n t tiene las siguientes proshypiedades

1 Tiene una media de O

2 Es simetrica con respecto a la media

3 En general tiene una variancia mayor que 1 pero esta tiende a I a medida que aumenta el tamaiio de la muestra Para dfgt 2 la variancia de la distribushyci6n t es dfl(df - 2) donde df representa los grados de libertad En forma alterna puesto que df n - 1 para n gt 3 se puede escribir la variancia de la distribuci6n t como (n l)(n 3)

4 La variable t va de - hasta + 00DO

5 La distribuci6n t es realmente una familia de distribuciones puesto que hay una distribuci6n diferente por cada valor de la muestra de n - 1 que es el divisor que se utiliza para ca1cular S2 Recuerde que n - 1 representa los grados de libertad En la figura 631 se muestran las distribuciones t correspondienshytes a algunos valores de los grados de libertad

6 Comparada con la distribuci6n normal ladistribuci6n t es menos espigada en el centro y tiene colas mas largas En la figura 632 se com para la distribushyci6n t con la distribuci6n normal

7 La distribuci6n t se aproxima ala distribuci6n normal a medida que n - 1 se aproxima al infinito

La distribuci6n t al igual quela distribuci6n normal estandar se ha tabulado ampliamente Una de estas tablas es la tabla E del apendice Tal como se puede apreciar se debe tomar en cuenta eLcoeficiente de confianza y los grados de libershytad cuando se utiliza la tabla de la distribuci6n t

FIGUR- 631 Distribuci6n t para diferentes grados de libertad

-----

163 63 DISTRIBUCION

__ Distribucion normal

- - - Dislribucion I

x

FIGURA 632 Comparaci6n de las distribuciones normal yt

Es posible utilizar el paquete MINITAB para graficar la distribuci6n t (para grados espedficos de libertad) y otras distribuciones Despues de asignar el eje horizontal y las siguientes direcciones en el cuadro de Set Patterned Data seleccioshyne del menu Calc y despues Probability Distributions Utilice el cuadro de diashylogo Plot para generar la grafica

Inlervalos de conJiQllia qllR uJilban fa dislribucion t El procedimien to general para construir interval os de confianza no se ve afectado por la necesidad de utilizar la distribuci6n t en lugar de la distribuci6n normal estandar Aun es necesario usar la relaci6n expresada por

estimador plusmn (coeficiente de confiabiIidad) x (error estandar)

Lo que es diferente es el origen del coeficiente de confiabilidad Este se obtiene a partir de la tabla de la distribucion t en lugar de la tabla de la distribuci6n normal estandar Para ser mas especfficos cuando se obtienen muestras a partir de una distribushycion normal cuya desviaci6n estdndi17 a se desconoce ell OO( 1 - a) por ciento del intervalo de confianza para la media de la poblaci6n J1 estd dado por

(631 )

Es importante aclarar que el requisito para el uso valido de la distribucion t es que la muestra debe ser extrafda de una poblad6n con distribucion normal Sin embarshygo la experiencia ha demostrado que se pueden tolerar desviaciones moderadas de esterequisito Como consecuencia la distribucion t se utiliza incluso cuando se sabe que la poblaci6n original se desvia de la normalidad Lltl mayorfa de los invesshytigadores requieren que al menos pueda sostenerse el supuesto de una distribushyd6n de poblacion en forma de montfculo

EJEMPLO 631

Maureen McCauley (A-I) realiz6 un estudio para evaluar los efectos de un conjunto de instrucciones de mecanica en ellugar de labores sobre el desempeno laboral de obreros jovenes recientemente contratados Se utilizaron dos grupos de individuos elegidos aleatoriamente uno de los grupos para aplicar el experimento y el otro

164 CAPITULO 6 ESTlMACI6N

como grupo de control EI grupo con el que se experimento recibio una hora de capacitacion impartida por un terapeuta ocupacional EI grupo de control no recishybio esta capacitacion Para evaluar el esfuerzo de cada obrero para levan tar bajar jalar y transportar objetos dentro del entorno laboral se utilizo una lista de cotejo para la evaluacion de trabajo mecanico que inclufa criterios de referencia Una tarea bien hecha recibio una calificacion de 1 EI grupo de control formado por 15 individuos alcanzo una calificacion media de 1153 en la evaluacion con una desshyviacion estandar de 3681 Se supone que el grupo de control se comporto como una muestra aleatoria extraida de una poblacion similar de individuos Se pretende utilizar los datos de la muestra para estimar la calificacion media para la poblacion

Soluci6n Se puede utilizar la media de la muestra 1153 como una estimacion puntualde la media de la poblacion sin embargo debido a que se descoshynoce la desviacion estandar de la poblacion se debe considerar que los valores siguen una distribucion aproximadamente normal antes de consshytruir los intervalos de confianza para l Se considera que esta suposicion es razonable y que se necesita un intervalo de confianza de ~or cienshyto el estimador es i y el error estandar es s -r 681 15 =9504 Ahora es necesario conocer el coeficiente de confiabilidad el valor de t asodado al coeficiente de confianza de 95 y a los n 1 = 14 grados de libertad Puesto que el intervalo de confianza de 95 por ciento deja 05 del area bajo la curva de t para dividirse en dos colas iguales se necesita el valor de tala derecha del cual esta el 025 del area Este valor se localiza en la tabla E enla columna encabezada por t

975 bull Este es el valor

para tala izquierda delcual esta 975 del area bajo la curva EI area a la derechade este valor es igual al 025 deseado Ahora sobre la columna de grados de libertad se localiza el numero 14 EI valor para t se encuentra en la interseccion del renglon con la etiqueta 14 y la columna con la etiqueta t975 bull Se encuentra que este valqr para t que representa al coeficiente de confiabilidad es 21448 Finalmente el intervalo de confianza de 95 por ciento se construye como sigue

1153 plusmn 21448(9504) 1153 plusmn 204 949 1357 bull

Este intervalo puede interpretarse con ambos puntos de vista probabiHstico y practico Puede asegurarse en un 95 por dento que 1a media l correcta de la poblacion se encuentra entre 949 y 1357 porque al repetir el muestreo 95 por dento de los intervalos construidos deigual manera incluyen a l

Decidir entre z r t Cuando se obtiene un intervalo de confianza para la media de una poblacion se debe decidir si se utiliza un valor de z6 de t como factor de confiabilidad Para hacer una elecci6n adecuada se debe considerar el tamafto de la muestra si la poblacion muestreada sigue una distribucion normal y si la varian cia de la poblacion es conocida La figura 633 muestra un diagrama de flujo que se puede utilizar para decidir rapidamente si el factor de confiabilidad debe ser Z 0 t

EJERCICIOS 165

EJERCICIOS

Sa aplica al leorema dellfmile central

FIGURA 633 Diagrama de flujo para deddir entre utililizar z y t cuando se hagan inferencias respecto a las medias de la poblaci6n (Para utilizar un procedimiento no parametrico vease el capitulo 13)

Analisis par computadara Si el proposito es construir un intervalo de conshyfianza con el programa MINITAB para la media de la poblacion cuando el estadfsshytico t es el factor de confiabilidad adecuado el comando se inicia con la palabra TINTERVAL Seleccione en Windows I-Sample t desde el menu de Basic Statistics

631 Utilice la distribud6n t para encontrar el factor de confiabilidad para el intervalo de confianshyza basado en los siguientes coeficientes de confianza y tamafiosde las muestras

a b c d

Coefidente de confianza 95 99 90 95 Tamafio de la muestra 15 24 8 30

632 En una investigacion acerca de la dependencia del flujo y volumen de todo el sistema respishyratorio en un grupo de pacientes con enfermedad obstructiva pulmonar cronica conectados a respiradores artificiales Tantucci et ai (A-2) registraron los siguientes valores de linea de

166 CAPITULO 6 ESTIMACION

base del flUjD continuo inspiratDriD (Us) 90 97 103110 104 100 CDnsidere que una muestra aleatDria simple esta cDnfDrmada pDr seis individuDs a partir de una pDblacion que sigue una distribuci6n nDrmal CDn individuDs CDn la misma enfermedad

a) ~Cuat es la estimaci6n puntual de la media de la pDblaci6n

b) ~Cuil es la desviacion estandar de la muestra

c) ~Cultll es la estimacion del error estandar para la media de la muestra

d) CDnstruya un intervalD de cDnfianza de 95 pDr ciento para el flUjD mediD cDntinuD inspishyratDriD de la pDblaci6n

e) ~Cual es la precision de la estimacion

f) Explique la interpretaci6n prDbabilistica para este intervalD de confianza

g) Explique la interpretacion practica para este intervalD de cDnfianza

633 LlDyd y MaillDux (A-3) informaron IDS siguientes datDs acerca del peso de la glandula pituitaria en una muestra de cuatrD ratas de Wistar Furth

media = 90 mg error estandar para la media = 3

FUEJTE Ricardo V Lloyd y Joe Mailloux Analysis ofSshy100 Protein Positive Folliculo Stellate Cells in Rat Pituitary Tissues AmericanJournal ofPathology 133 338-346

a) ~Cual es la desviadon estandar de la muestra

b) CDnstruya un intervalD de confianza de 95 pDr ciento para el peso medio de la glandula pituitaria para una pDblacion similar de ratas

c) ~Que supDsiciDnes se necesitan para que sea validD el intervalo de cDnfianza del inciso b

d) ~Que interpretacion puede ser la mas indicada cuandD se trata sDbre intervalos de conshyfianzacon alguien que no sabe de estadfstica Explique pDrque es la mas cDnveniente

e) 5i fuera necesario elabDrar un intervalD de cDnfianza de 90 pDr cientD para la media de la pDblaci6n ~el intervalD de cDnfianza serta mayDr 0 menor que el intervalD de 95 pDr dentD Explique su respuesta sin construir realmente el intervalD de cDnfianza

f) 5i [uera necesariD considerar un intervalo de CDnfianza de 99 pDr cientDpara lamedia de la poblacion ~el intervalo de cDnfianza serra mayDr 0 menDr que el intervalD de 95 pDr dentD Explique su respuesta sin cDnstruir realmentt el intervalD de cDnfianza

634 Kaminski y Rechberger (A-4) encontrarDn en un estudio sDbre la preeclampsia que la media de la presi6n sistolica sangufnea en 10 mujeres sanas y que no estan embarazadas es de 119 CDn una desviacion estandar de 21

a) 2Cual es el errDr estandar estimadD para la media

b) CDnstruya un intervalD de confianza de 99 pDr cientD para la media de la poblaci6n a partir de la cual puede considerarse que IDS 10 individuos conforman una muestra aleatoria

c) ~CUlil es la precisi6n estimada

d) ~Que consideraciones deben hacerse para comprobar la validez del intervalo de confiahza

635 Unamuestra de 16nifias de 10 afiDS pesan en promediD 715 con una desviacion estandar de 12libras CDnsidere el calculD de intervalDs de cDnfianza de 9095 y 99 pDr ciento para I-L

167 64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS

636 Una muestra aleatoria simple conformada por 16 individuos aparentemente sanos presenta los siguientes valores de arsenico eliminado en la orina (miligramos por dfa)

Individuo Valor Individuo Valor

1 007 9 012 2 030 10 006 3 025 11 010 4 008 12 032 5 030 13 006 6 038 14 009 7 007 15 014 8 005 16 011

Elabore un intervalo de confianza de 95 por ciento para la media de la poblaci6n

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES

En ocasiones se presentan casos en los que se desea estimar 1a diferencia entre 1a media de dos poblaciones A partir de cada poblacion se extrae una muestra aleatoria independiente y de los datos de cada una se calculan las medias muestrales XI y x2

respectivamente En el capitulo anterior se dijo que el estimador XI - x2 ofrece una estimacion insesgada de la diferencia entre las medias de las poblaciones III shy11 2 bull La variancia del estimador es (cr~ n l ) + (cr~ n 2 ) Tambien se menciono que seglin las condiciones la distribucion muestral de XI - x2 puede presentar una distribution al menos aproximadamente normal de modo que en muchos casos se utiliza la teorfa adecuada para las distribuciones normales en el calculo de un intershyvalo de confianza para III - 11 2 bull Cuando se conocen las variancias de la poblacion el intervalo de confianza del 100(1 - ex) por ciento para III - 112 esta dado por

(641)

El anal isis del intervalo de confianza para la diferencia entre las medias poblacionales ofrece informacion util para decidir si es 0 no probable que las medias de las dos poblaciones sean iguales Cuando el intervalo no incluye al cero se dice que el intervalo ofrece evidencia de que las dos poblaciones tienen medias diferentes Cuando el intervalo incluye al cero se dice que las poblaciones pueden tener meshydias iguales

Esto se ilustra a continuacion para el caso donde el muestreo se realiza a partir de una distribucion normal

168 CAPITULO 6 ESTlMACI6N

EJEMPLO 641

A un equipo de investigacion Ie interesa conocer la diferencia entre las concentracioshynes de acido urico en pacientes con y sin el sfndrome de Down En un gran hospital para el tratamiento de pacientes con retardo mental una muestra de 12 individuos con el sindrome presenta una media de XI = 45 mgll00 mL En un hospital general se encontro que una muestra de 15 individuos normales de la misma edad y sexo presenta un nivel medio de x2= 34 Si es razonable suponer que las dos poblaciones de valores muestran una distribucion normal y sus variancias son iguales a 1 y 15 calcule el intervalo de confianza de 95 por ciento para ~l - ~2

Soluci6n Para una estimacion puntual de III 112 se udliza Xl X2= 45 34 11 EI coeficiente de confiabilidad que corresponde a 95 localizado en la tabla D es 196 EI error estandar es

Por 10 tanto el intervalo de confianza de 95 por ciento es

11 plusmn 196(4282) 11plusmn84 26 194

Se dice que se dene una confianza de 95 por ciento de que la difeshyrencia real 111 - 112 este entre 26 y 194 porque en muestreos repetidos 95 por ciento de los intervalos construidos de esa manera incluiria la diferencia entre las medias reales

Puesto que el intervalo no incluye al cero se concluye que las dos poblaciones tienen diferentes medias bull

Muestreo a partir de poblaciones que no signen una distribuci6n ItOrmal La construccion de un intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando el muestreo se realiza a partir de poblaciones no normales se lleva a cabo en la forma descrita en el ejemplo 641 si las muestras n l y n

2 son grandes Una vez mas este es un resultado del teorema del limite central

Si se desconocen las variancias de la poblacion se utili zan las variancias de las muestras para estimarlas

IUEMPLO 642

Motivados por d conocimiento de la existencia de una gran cantidad de textos polemicos que sugieren que el estres la ansiedad y la depresion son dafiinos para el sistema inmunologico Gormanet ai (4-5) condujeron un estudio en el que se conshysider6 a individuos varoneshomosexuales algunos con VIH (virus de inmunodefishyciencia humana) positivo y otros con VIH negativo Los datos fueron registrados con una amplia vltJriedad de mediciones medicas inmunologicas psiquiatricas y neurol6gicas una de las cuales corresponde al numero de celulas CD4+ en la sanshy

64 INTERV ALO DE CONFIANZA PAHALA DIFERENCIA ENTRE DOS MEDIAS 169

gre El numero promedio de celulas CD4+ para middot112 individuos con infecci6n por VIR fue de 4018 con una desviaci6n estandar de 2264 Para los 75 individuos sin la infecci6n por VIR la media y la desviaci6n estandar fueron de 8282 y 2749 respectivamente Se pretende elaborar un intervalo de confianza de 99 por ciento para la diferencia de las medias de las poblaciones

Soluci6n No hay informaci6n con respecto a la forma de la distribuci6n de las celulas CD4+ Sin embargo como el tamafto de las muestras es grande el teorema del limite central asegura que la distribuci6n muestral de las diferencias entre las medias de la muestra siguen una distribuci6n aproxishymadamente normal independientemente de que la distribuci6n de la variable en las poblaciones no siga una distribuci6n normal Se puede utilizar este hecho para justificar el uso de la estadistica z como factor de confiabilidad en la construcci6n del intervalo de confianza Tampoco hay informaci6n acerca de las desviaciones estandar por 10 que puede emplearse las desviaciones estandar de las muestras para estimarlas La estimaci6n puntual para la diferencia entre las medias de las poblacioshynes es la diferencia entre las medias de las muestras 8282 - 4018 = 4264 En la tabla D se encuentra que el factor de confiabilidad es 258 La estimaci6n del error estandar es

s __ = 27492

+ 22642 =382786

Xl-X 75 112

Por la ecuaci6n 641 el intervalo de confianza de 99 por ciento para la diferencia entre las medias de la poblaci6n es

4264 plusmn 258(382786) 3276 5252

Se tiene la seguridad de 99 por ciento de que el promedio de celulas CD4+ en varones con VIR positivo difieren de la media para los varoshynes con VIR negativo por 3276 a 5252 bull

Distribuci6n t y la diferencia entre las medias Cuando no se conocen las variancias y se pretende estimar la diferencia entre las medias de dos poblacioshynes con un intervalo de confianza es posible utilizar la distribuci6n t para suminisshytrar el factor de confiabilidad si se conocen ciertas suposiciones se debe saber 0

suponer de buena fe que las dos poblaciones muestreadas siguen una distribuci6n normal Respecto a las variancias de las poblaciones se debe distinguir entre dos situaciones 1) la situaci6n en la que las variancias son iguales y 2) la situaci6n en la que no 10 son A continuaci6n se consideranambas sitpaciones por separado

Varianciaspoblacifmales iguales Si la suposici6n sobre igualdad de las variancias de las poblaciones esta justificada las dos variancias de las muestras calculadas a partir de las muestras independientes pueden considerarse como estishymaciones de 10 mismo es decir la variancia comun Parece 16gico entonces aproshyvechar este hecho en el anal isis en cuesti6n Esto es precisamente 10 que se hace para establecer una estimaci6n conjunta para la variancia comun Esta variancia se obtiene mediante el caIculo promedio ponderado de las dos variancias de las muesshy

170 CAPITULO 6 ESTlMACI6N

tras Cada variancia de la muestra es ponderada con base en sus grados de libertad Si los tamafios de las muestras son iguales este promedio ponderado es la media aritmetica de las variancias de las dos muestras Si el tamano de las dos muestras es distinto el promedio ponderado aprovecha la informacion adicional proporcionada por la muestra mayor La estimacion con junta se obtiene con la fOrmula

S2 = (nl _1)SI2 + (n2 l)s~ p (642)

+n2 -2nl

Asf la estimacion del error estandar esta dada por

(643)

y el intervalo de confianza de 100(1 a) por ciento para III 112 esta dada por

(644)

El nfunero de grados de libertad utilizado para determinar el valor de t que se usa para construir el intervalo es n

1 + n

2 2 que es el denominador de la ecuacion

642 Este intervalo se interpreta en la forma habitual Los metodos que pueden emplearse para tomar la decision acerca de la igualshy

dad de las variancias de las poblaciones se estudian en la seccion 610 y 78

EJEMPLO 643

Uno de los estudios de Stone et al (A-6) tuvo como objetivo determinar los efectos del ejercicio por un tiempo prolongado en los ejecutivos de una compania inscritos en un programa supervisado de acondicionamiento fisico Se registraron datos de 13 individuos (el grupo deportista) que voluntariamente se inscribieron el programa y que permanecieron activos por 13 anos en promedio y de 17 individuos (el segunshydo grupo el sedentario) que decidieron no inscribirse Entre los datos que se regisshytraron acerca de los individuos esta el mlmero maximo de sentadillas realizadas en 30 segundos El grupo deportista obtuvo una media y una desviacion estandar de 210 y 49 respectivamente La media y la desviacion estandar para el grupo sedenshytario fueron 121 y 56 respectivamente Se considera que las dos poblaciones de medici ones de acondicionamiento muscular siguen una distribuci6n aproxirnadashymente normal y que las variancias para ambas poblacionesson iguales Se pretenshyde elaborar un intervalo de confianza de 95 por ciento para Ja diferencia entre las medias de as poblaciones representadas por las dos muestras Soluci6n Primero se utiliza la ecuaci6n 642 para calcular la estimaci6n conjunta

de la variancia comtin de las poblaciones

(13-1)(49 2 )+(17 1)(562 ) =2821

13+17-2 Cuando se consulta la tabla E con 13 + 17 - 2= 28 grados de libertad y el nivel de confianza de 95 se encuentra que eLfactor de confiabilidad es 20484 Con la ecuacion 644 se calcula el intervalo de confianza de

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS 171

95 por ciento para la diferencia entre las medias de las poblaciones de la siguiente manera

2821 2821(210-121)plusmn20484 --+-shy

13 17 89 plusmn 40085

49129

Se tiene una confianza de 95 por ciento de que la diferencia entre las medias de las poblaciones estan entre 49 y 129 Se puede decir esto porque se sabe quesi se repite el amilisis muchfsimas veces y se calculan los intervalos de confianza de la misma manera cerca de 95 por ciento de los intervalos de confianza induiran la diferencia entre las medias de las poblaciones

Debido a que los intervalos no induyen al cerose conduye que las medias de las poblaciones son diferentes bull

Variancias poblacionales distintas Cuando no se puede conduir que las variancias de dos poblaciones de interes son iguales aun ruando pueda suponerse que las dos poblaciones presentan distribuciones normales no es adecuado utilizar la distribucion t como se acaba de describir para construir los intervalos de confianza

Una solucion al problema de variancias distintas fue propuesta por Behrens (3) y posteriormente fue verificada y generalizada por Fisher (4 5) Neyman (6) Scheffe (7 8) Y Welch (9 10) tambien proponen soluciones EI problema es analizashydo en detalle por Cochran (11)

EI problema gira en tomo al hecho de que la cantidad

no sigue una distribuci6n t con nj + n 2 grados de libertad ruando las variancias 2 shy

de las poblaciones son distintas Consecuentemente la distribucion t no se puede utilizar en la forma habitual pata obtener el factor de confiabilidad del intervalo de confianza para la diferencia entre las medias de dos poblaciones que tienen variancias diferentes La solucion propuesta por Cochran consiste en el calculo del factor de confiabilidad mediante la siguiente formula

wltj + w2tZ t l

f

-0f2 = (645) WI +w2

donde WI 512

np W 2 = s~ n2 tl = tl _ para nj - 1 grados de libertad y t2 = t l

_w2aI2

para n2

- 1 grados de libertad Un intervalo aproximado de confianza del 100(1 shya) por ciento para III - 112 esta dado por

(646)

172

EJERCICIOS

CAPITULO 6 ESTlMACION

FJEIUPLO 644

En la investigacion de Stone et al (A-6) descrita en el ejercicio 643 los investigashydores tambien informaron los siguientes datos de las medici ones referentes a todas las calificaciones del acondicionamiento muscular logradas por los individuos

Muestra n Media Desviaci6n estimdar

Grupo deportista 13 45 3

Grupo sedentario 17 37 10

Se considera que las dos poblaciones de todas las calificaciones de acondicionashymiento muscular siguen una distribuci6n aproximadamente normal Sin embargo no debe suponerse que las dos variancias poblacionales son iguales Se pretende construir un intervalo de confianza de 95 por ciento para la diferencia entre las medias de todas las calificaciones de acondicionamiento muscular para las dos poshyblaciones representadas por las muestras

Soluci6n Se utiliza t de la ecuaci6n 645 para calcular el factor de confiabilidad En la tabla E se muestra que con 12 grados de libertad y 1 - 052 = 975 t( 21788 Analogamente con 16 grados de libertad y 1- 052 = 975 t2 = 21199 Ahora Sf calcula

(3 2 13)(21788) + (102 17)(21199) 139784 t= =

(3 2 13)+(102 17) 065747

=21261

Con la ecuaci6n 646 ahora se construye el intervalo de confianza de 95 por ciento para la diferencia entre las medias de las dos poblaciones

2 2

(45 37)plusmn21261 3 + 10 13 17

8 plusmn 21261 (25641101) 25134

Puesto que el intervalo no incluye acero se concluye que las medias de las dos poblaciones son diferentes bull

Cuando se construyen intervalos de confianza para la diferencia entre las medias de dos poblaciones es posible utilizar la figura 641 para decidir rapidashymente si el factor de confiabilidad debe ser z t 0 tf

Para cada uno de los siguientes ejercicios construya intervalos de confianza de 90 95 y 99 par ciento para las diferencias entre las medias poblacionales Establezca consideraciones que hagan que el metodo sea valido Determine las interpretaciones practica y probabilistica

clJ clJ FIGURA 541 Diagrama de flujo para decidir si e1 factor de confiabilidad debe ser z tot cuando se realizan inferencia inferencias acerca de la diferencia entre las medias de dos pobladones (Para usar un procedimiento no parametrico ver el capitulo 11)

174 CAPiTULO 6 ESTlMACION

para cad a intervalo construido Suponga las variables bajo considerati6n en cad a ejercicio y establezca para que pueden servir a los investigadores esos resultados

641 EI objetivo de un experimento de Buckner et al (A-7) consisti6 en estudiar los efectos del relajamiento muscular inducido por el pancuronium en el volumen del plasma circulante Los individuos estudiados son recien nacidos con un peso mayor a 1700 gramos que necesishytaron de ayuda para respirar durante las primeras 24 horas despues de nacer y cumplieron con otros criterios cHnicos Cinco recien nacidos paraIizados con el pancuronium y siete recien nacidos no tratados presentaron las siguientes estadisticas en la segunda de las tres mediciones del volumen de plasma (ml) hecha durante la respiraci6n mecanica

Paralizados 480 81 No tratados 567 81

La segunda medici6n para el grupo tratado ocurri6 de 12 a 24 horas despues de la primera dosis de pancuronium Para el grupo no tratado las mediciones se hicieron de 12 a 24 horas despues de iniciar la respiracion mecanica

642 Zuckery Archer (A-8) afirman que la N-nitrosobis (2-oxopropyl)amina (BOP) y las nitrosaminas 3-oxidizadas producen una alta incidencia de tumores de conductos pancreaticos en el hamster dorado sirio Estudiaron los efectos en el peso sangufneo en la glucosa del plasma en la insulina yen los niveles de transamina glutamico-oxaloacetica del plasma (GOT) de los hamsters expuestos in vivo a la BOP Los investigadores reportaron los siguientes resultados en ocho animales tratados y 12 sin tratamiento

Variable Sin tratamiento Con tratamiento

Glucosa del plasma (mglgl) 101 plusmn 5 74plusmn 6

FUENTE Peter F Zucker y Michael C Archer Alterations Pancreatic Islet Function Produced by Carcinogenic Nitrosamines in the Syrian Hamster AmericanJournal oPathology 133 573-577

Los datos son la media de la muestra plusmn la estimaci6n del error estandar de la media de la muestra

643 Los objetivos de un estudio de Davis et al (A-g) son evaluar 1) la eficacia del programa auto ayuda momento para dejar de fumar cuando se utiliza con base de uno a uno en el hogar y 2) la viabilidad de ensefiar temicas para abandonar el habito de fumar a los estudiantes de enfermerfa en bachillerato A estudiantes graduados de enfermerfa inscritos en dos cursos de metodologia de la investigacion de la Universidad de Ottawa se les invit6 a participar en el proyecto Se aplic6 un cuestionario de opcion multiple para abandonar el habito de fumar a 120 estudiantes de enfermeria que participaron y a otros 42 estudiantes que no participashyron antes ni despues del estudio Se calcularon las diferencias entre las calificaciones antes y despues del estudio as como las siguientes estadisticas a partir de las diferencias

EJERCICIOS 175

Grupo Media Desviaci6n estandar

Participantes (A) 214444 15392 No participantes (B) 33333 14595

644 El doctor Ali Khraibi (A-IO) de la CHnica y Fundaci6n Mayo condujo una serie de experishymentos con el fin de evaluar las respuestas diureticas y natiureticas de ratas Okamoto esponshytaneamente hipertensivas (REB) y ratas Wistar-Kyoto (WRY) para dirigir incrementos en la presion hidrostatica renal intersticial (PBRI) Para aumentar la PBRI se utiIiz6 la expansi6n directa del volumen renal intersticial (DRIVE) a traves de una matriz implantada cronicamente en el rinOn Entre los datos registrados durante el estudio estan las siguientes mediciones de excreci6n de sodio a traves de la orina (UNa V) durante el periodo de DRIVE

Grupo

REB 632572796483527 2WKY 420469482 108210

FUENTE Publicada con autorizaci6n del Dr Ali A Khraibi

645 Osberg y Di Scala (A-II) realizaron un estudio centrado en la eficacia de los cinturones de seguridad para reducir 1esiones entre sobrevivientes de accidentes automoviHsticos internashydos en hospitales con edades de 4 a 14 afios El estudio compar610s resultados de 123 ninos que utilizaron el cintur6n contra 290 que no 10 utilizaron entre aquellos que se vieton enshyvueltos en tales accidentes y que fueron hospitalizados El informe con tenia la siguiente estadistica del numero de dfas en la unidad de cuidados intensivos

Grupo Media Error estandar estimado

Utiliz6 el cintur6n 83 16 No utiliz6 el cintur6n 139 18

646 La medicion del diametro transversal del coraz6n de hombres y mujeres adultos presenta los siguientes resultados

sx Grupo Tamafto de Ia muestra (cm) (cm)

Varones 12 1321 105 Mujeres 9 IIOO 101

Considere que las poblaciones siguen una distribucion normal con variancias iguales

176 CAPITULO 6 ESTIMACION

647 Veintiruatro animales de laboratorio con deficiencia de vitamina D fueron divididos en dos grupos iguales EI grupo 1 recibi6 un tratamiento consistente en una dieta que proporcionashyba vitamina D EI segundo grupo no fue tratado AI termino del periodo experimental se midieron las concentraciones de calcio ensuero obteniendose los siguientes resultados

Grupo tratado X 111 mg 100 mls = 15 Grupo sin tratamiento x= 78 mg 100 ml s = 20

Considere que las poblaciones siguen una distribuci6n normal con variancias iguales

648 Ados grupos de nifios se les hicieron pruebas de agudeza vi~ual El grupo 1 estuvo formado por 11 nifios que recibieron la atenci6n de medicos privados La calificaci6n media para este grupo fue de 26 con una desviaci6n estandar de 5 El segundogrupo que incluy6 14 nifios que recibieron atenci6n medica por parte del departamento de salud publica tuvo una calishyficaci6n promedio de 21 con una desviaci6n estandar de 6 Suponga que las poblaciones siguen una distribuci6n normal con variancias iguales

649 El tiempo promedio de estancia de una muestra de 20 pacientes dados de alta de un hospital general es de siete dras con una desviaci6n estaildar de dos dras Una muestra de 24 padenshytes dados de alta de un hospital de enfermedades cr6nicas tuvo un tiempo promedio de estancia de 36 dfas con una desviaci6n estindar de 10 dias Suponga que la poblaci6n sigue una distribuci6n normal con variancias desiguales

6410 En un estudio de factores que se consideran responsables de los efectos adversos del tabashyquismo sobre la reproducci6n humana se midieron los niveles de cadmio (nanogramos por gramo) en el tejido de la placenta de una muestra de 14 madres que fumaban y una muestra aleatoria independiente de 18 mujeres no fumadoras Los resultados fueron los siguientes

No fumadoras toO 84 128250 118 98 125 154 235

94251 1952559875 118122150

Fumadoras 300301150241305178168148

134285 175 144 125204

ms probable que el nivel medio de cadmio registrado sea mayor entre las fumadoras que entre las no fumadoras ~Por que se llegarfa a esta conclusi6n

65 INTERVALO DE CONFIANZA PARA IA PROPORCION DE UNA POBIACION

Muchas preguntas de interes para que el tecnico en salud tienen relacion con las proporciones de poblacion ~Que propordon de padentes que redben un tipo espeshycial de tratamiento se recuperan ~Que proporcion de alguna poblacion tiene cierta enfermedad ~Que propordon de una poblacion es inmune a derta enfermedad

Para estimar la proporcion de una poblacion se procede en la misma forma que cuando se estima la media de una poblacion Se extrae una muestra de la poblacion de interes y se calcula su proporcion p Esta se utiliza como el estimador puntual para la proporcion de la pobladon Un intervalo de confianza se obtiene mediante la siguiente formula general

estimador plusmn (coefidente de confiabilidad) X (error estandar)

EJERCICIOS

EJERCICIOS 177

En el capitulo anterior se vio que cuando np y n(1 - p) son mayores que 5 se puede considerar que la distribuci6n muestral de pse aproxima bastante a una distribuci6n normal Cuando se cumple con esta condici6n el coeficiente de confiabilidad es algUn valor de z de la distribuci6n normal estandar Esta visto que el error estandar es igual a (J p =fi(l-p) n Puesto que p que es el parametro que se trata de calcular se desconoce se debe utilizar pcomo una estimaci6n Asf se estima (J j por medio de ~p(l Pn y el intervalo de confianza de 100(1 - 0) por ciento para pesta dado por

pplusmn Z(I-1J2)~P(l- P) Fn (651)

Este intervalo se interpreta tanto desde el punto de vista practico como probabilistico

FJEMPLO 651

Mathers et al (A-12) encontraron queen una muestra de 591 pacientes internados en un hospital psiquiatrico 204 admitieron que consuniieron marihuana al meshynos una vez durante su vida Se pretende construir un intervalo de confianza de 95 por ciento para la proporcion de individuos que consumieron marihuana durante su vida en la poblaci6n muestreada de los internos del hospital psiquiatrico

Solucion La mejor estima~i6n puntual para la proporci6Il de la poblaci6nes p== 204591 3452 El tamafio de la muestra y hiestimacion de p tienen una magnitud suficiente parajustifKar el empleo de la distribucion norshymal estandar paraelaborar un intervalo de confianza EI coeficiente de corifiabilidad que corresponde alnivel de confianza de 95 es 196 la estimacion del errorestandar (Jp es ~p(l-pgtn = (3452)(6548)591

0 1956El intervalo de confianza para p de acuerdo con estos datos es

3452 plusmn 196(01956) 3452 plusmn 0383 3069 3835

Se puede decir que se tiene 95 por ciento de confianza de que la proporshycionpeste entre 3069 y 3835 ya que al repetir el muestreo casi 95 por ciento de los intervalos construidos en la forma de este intervalo inclushyyen a la proporcion p real Con base en estos resultados se espera con una confianza de 95 por ciento encontrar que entre 3069 y 3835 por ciento de los internados en el hospital psiquiatrico tiene antecedentes de consumo de marihuana bull

Para cada uno de los siguientes ejercicios establezca la interpretacion prictica yprobabilistica de los intervalos que se pide construir Identifique cada componente del intervalo la estimashycion puntual el coeficiente de confiabilidad yel error estandar Explique por que los coefishycientes de confiabilidad no son los misInos para todos los ejercicios

178 CAPITULO 6 ESTIIlACI6N

651 En una investigaci6nde ninos maltratados en pacientes psiquiatricos Brown y Anderson (A-IS) encontraron 166 pacientes en una muestra de 947 con antecedentes de abuso sexual y maltrato flsico Construya un intervalo de confianza de 90 por dento para la proporci6n de la poblaci6n

652 Catania et at (A-14) obtuvieron datos respecto al comportamiento sexual de una muestra de hombres y mujeres solteros con edades entre 20 y 44 residentes en areas geoijfaficas caracshyterizadas por tasas altas de enfermedades de transmision sexual e ingreso a programas de drogas De 1229 encuestados 50 por ciento respondieron que nunca utilizaron preservatishyvos Construya un intervalo de confianza de 95 por ciento para la proporcion de la poblaci6n que nunca utiliza preservativos

653 Rothberg y Lits (A-I 5 ) estudiaron el efecto del estres de la maternidad durante el embarazo en el peso del producto Los individuos eran 86 mujeres blancas con antecedentes de estres que no tenfan faetores de riesgo medico u obstetrico conoddo de peso bajo del producto Los investigadores eneontraron que 128 por dento de las madres estudiadas dieron a luz bebes que cubrfan el criterio de peso bajo Construya un intervalo de confianza de 99 por ciento para la proporci6n de la poblaci6n

654 En una muestra aleatoria simple de 125 varones desempleados quienes desertaron de la escuela preparatoria entre las edades de 16 y 21 anos inclusive 88 declararon que eran consumidores regulares de bebidas alcoh6litas Construya un intervalo de eonfianza de 95 por ciento para la proporcion de la poblacion

66 INTERVALO DE CONFIANZA PARA lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS POBlACIONES

A menudo se tiene interes en conocer la magnitud de la diferencia entre las proporcioshynes de dospoblaciones Es posible que se quiera comparar por ejemplo entre hombres y mujeres dos grupos de edades dos grupos socioecon6micos 0 dos grupos de diagshynostico con respecto a la proporcion que posee alguna caractenstica de interes Un estimador puntual insesgado de la diferencia entre dos proporciones de las poblacioshynes se obtieneal calcular la diferencia de las proporciones de las muestras PI P2 Tal como Se ha visto cuando n1 Yn2 son de gran tamano y las proporciones de la poblacion no estan muy cerca de 0 0 de 1 es posible aplicar el teorema del limite central y utilizar la teona de la distribucion normal para obtener los intervalos de conshyfianza EI error estandar de la estimacion se calcula mediante la siguiente formula

dado que como regIa se desconocen las proporciones de Ia poblacion Un intervashy10 de confianza de 100(1 - a) por ciento para PI P2 se obtiene as

(661)

Es posible interpretar este intervalo desde elpunto de vista probabiHstico y practico

EJERCICIOS 179

EJEMPLO 661

Borst et al (A-16) investigaron la relaci6n de desarrollo del ego edad sexo y diagshyn6stico de suicidio entre los internos adolescentes de la unidad de psiquiatria La muestra consistia en 96 varones y 123 niiias con edades entre 12 y 16 aiios seleccioshynados de entre los internados en la unidad de adolescentes y niiios de un hospital psiquiatrico privado Se reportaron 18 niiios y 60 niiias con intento de suicidio Cons ishyderese el comportamiento de las niiias como el de una muestra aleatoria simple a partir de una poblaci6n similar de niiias y que los j6venes igualmente pueden considerarse como una muestra aleatoria simple extraida de una poblaci6n similar de niiios Para estas dos poblaciones se pretende construir un intervalo de confianshyza de 99 por ciento para la diferencia entre las proporciones de los individuos con intento de suicidio

Soluci6n Las proporciones para las niiias y niiios respectivamente son Pc = 601 123 = A878y PB = 1896 1875 La diferencia entre las proporciones de lasmuestrases Pc PB = 4878 1875 = 3003 El error estandar estimado de la diferenda entre las proporciones de las muestras es

(4878)(5122) (1875)(8125) ---~~-~ +-------shy

123 96

El factor de confiabilidad a partir de la tabla D es 258 de modo que el intervalo de confianza con la f6rmula 661 es

3003 plusmn 258(0602) 14504556

Se dene la confianza de 99 por dento de que para las poblaciones muestteadas la ptopord6n de intentos de suiddio entre las niiias exceshyde a lapropord6n de intentosde suiddio entre los varones por 1450 y 4556

Puesto que el intervalo no incluye al cero se concluye que las dos proporciones de pobladones son diferentes bull

FJERCICIOS

Para cada uno de los siguientes ejercicios establezca las interpretaciones pnicticas y probabishylisticas de los intervalos que se pide construir Identifique cada componente del intervalo la estimaci6n puntual el coeficiente de confiabilidad y el error estandar Explique por que los coeficientes de confiabilidad no son el mismo para todos los ejercicios

661 Hargers et al (A-17) del departamento de Salud PUblica y Ambieptal en Amsterdam condushyjeron un estudio en el que los individuos eran consumidores de drogasinyectables (CDI) En una muestrade 194 consumidores de metadona regular de largo plazo (MLP) 145 eran varones En una muestra de 189 CDIque no consmiddotumian MLP 133 eran varones Establezca las consideraciones necesarias acerca de las muestras ypoblaciones representadas y construshy

180 CAPITULO 6 ESTlMACI6N

ya un intervalo de confianza de 95 por ciemo para la diferenda entre las proporciones de varones en las dos poblaciones

662 Una investigaci6n de Lane et ai (A-I8) valor6las diferencias en las pnicticas de deteccion de cancer de seno entre muestras de mujeres predominantemente de bajos ingresos con edashydes de 50 a 75 anos que lltilizan los servicios de c1inicas de sailld para todo el estado y mlljeres de la misma edad residentes en ciudades donde las c1inicas de salud son locales De las 404 encuestadas seleccionadas en toda la comunidad 592 por ciento estuvo de acuerdo con el siguiente comentario acerca del cancer de pecho las mujeres prolongan su vida si detectan el cancer desde el inicio De entre 795 usuarias de clinicas de salud en la mllestra 449 por ciento estuvo de acuerdo Establezca las suposiciones apropiadas para elaborar un intervalo de confianzade 99 por ciento para la diferencia entre las dos proporciones de las poblaciones de interes

663 Williams et at (A-19) encuestaron a una muestra de 67 medicos y 133 enfermeras con famishyliares farmacodependientes EI prop6sito del estudio era evaluar la influencia en los medishyEOS y enfermeras de estar estrechamente involucrados con una 0 mas personas farmaco dependientes Cincuenta y dos medicos y 89 enfermeras dijeron que vivian con personas farmacoldependientes que adversamente afectaban 8U trabajo E8tablezca todas las consideshyraciones que crea necesarias para construir un intervalo de confianza de 95 por ciento para la diferencia entre las proporciones en las dos poblaciones de trabajadores que se espera esten adversamente afectados por vivir con personas farmacodependientes

664 Aronow y Kronzon (A-20) identificaron los factores de riesgo coronado entre hombres y mujeres en una dinica de cuidados de la salud a largo plazo De los 215 individuos negros 58 tienen diabetes mellitus al igual que 217 individuos blancos de 1140 Elabore un intervalo de confianza de 90 por ciento de confianzapara la diferencia entre las proporciones de las dos poblaciones tCuaies son las poblaciones correspondientes ~Que consideraciones son necesarias para hacer valido el procedimiento de inferencia

67 DETEHMINAUON DEL TAMANO DE LA MUESTRA PARA LA ESTIMACIONDEIAS MEDIAS

La pregunta de que tan grande debe ser una muestra surge inmediatamente al inicio del planteamiento de cualquier encuesta 0 experimento Esta es una pregunshyta importante y no se debe tratara la ligera Tomar una muestra mas grande de 10 necesario para obtener los resultados deseados es un desperdicio de recursos mienshytras que por otro lado las muestras demasiado pequenas con frecuencia dan resulshytados que carecen de uso practico En esta secci6n se estudia c6mo determinar el tamano de la muestra de acuerdo con la situaci6n A continuaci6n se proporciona un metodo para determinar el tamano de la muestra que se requiere para estimar Ia media de la poblaci6n yen la siguiente secci6n se aplica este metodo para detershyminar el tamano de la milestra cuando se desea estimar la proporci6n de una poshyblaci6n Mediante extensiltmes directas de estos metodos es posible determinar el tamano necesario de las muestras para situaciones mas complicadas

Objetivos El objetivo de la estimaci6n porintervalos es el de obtener intervalos estrechos con alta confiabilidad Si se observan los componentes ~e un intervalo de confianzase veque 8U dimension esta determinada por la magnitud de la cantidad

(coeficiente de confiabilidad) x (error estandar)

131 67 DETERMINACION DEL TAMANO PARA LA l-IUESTRAmiddot

ya que lamagnitud total del intervalo de confIanza es eldoble de esta cantidad Se aprendi6 que a esta cantidad generalmente se Ie llama precisi6n de la estimaci6n o margen de error Para un error estandar dado incrementar la confIabilidad signishyfIca un coefIciente con mayor confIabilidad Y un coefIciente con mayor confIabilidad produce unintervalo mas amplio

Por otra parte si se ftia el coefIciente de confIabilidad la unica manera de redudr la amplitud del intervalo es la reducci6n del error estandar Dado que el error estandar es igual a (J IJ y como (J es una constante la unica forma de obtener un error estandar menor es tomar una muestra grande ~Que tan grande debeser la muestra Esto depende del tamafio de (J la desviad6n estandar de la poblaci6n asi como del grado de confIabilidad y dimensi6n del intervalo deseados

Suponga que se desea obtener un intervalo que se extienda d unidades hacia uno y otro lado del estimador Ellose enuncia

d (coefIciente de confIabilidad) X (error estandar) (671)

Si el muestreo es con reemplazos a partir de una poblaci6n infInita 0 de una que sea 10 sufIcientemente grande como para ignorar la correcci6n por poblaci6n fInita la ecuaci6n 671 se transforma en

(J

d z- (672)-r la cual cuando se despeja n nos da

(673)d2

Cuando el nmestreo se hacesin reemplazos a partir de una poblaci6n fInita y peshyquefia se requiere de la correcci6n por poblaci6n fInita y la ecuaci6n 671 se transforma en

(J~d (674)fN~

que al despejar n resulta en

n-----shy (675)d 2(N 1) + Z2(J2

Si puede omitirse la correcci6n por poblad6n fInita la ecuaci6n 675 se reshyduce a la ecuaci6n 673

Estillluci6n de (J 2 Las f6rmulas para el tamafio de la muestra requieren del conocimiento de (J2 pero como ya se ha sefialado la varian cia de la poblaci6n casi

132 CAPITULO 6 ESTlMACION

siempre sedesconoce Como resultado esnecesarioestimar (J2 Las fuentes de estishymaci6n de(J2 que se utilizan con mas frecuencia son las siguientes

1 Se extrae una muestrapilato 0 prel~l11inar de lapoblaci6n y se puede utilizar la variancia calculada a partir de esta muestra como unaestimaci6n de (J2 Las observaciones uti lizadas en la muestra piloto se toman como parte de la muesshytrafinal de modo que n (el tamaiio calculado de la muestra) n

1 (el tamaiio

de la muestra piloto) n2 (el numero de observaciones necesarias para satisfacer el requerimiento total del tamaiio de la muestra)

2 A partir de estudios anteriores osimilares es posible obtener estimaciones de (J2

3Si se cree que la poblaci6n de lacual se extrae la muestraposee una distribushyci6n aproximadamente nqrmal se puede aprovechar el hecho de que la amshyplitud es aproximadamente igual a 6 desviaciones estandar y calcular (J R6 Este metodo requiere aIglin conocimiento acerca de los valores minimo y maximo de la variable en la poblaci6n

EJEMPLO 671

Un nutri6logo del departamento de salud al efectuar una encuesta entre una poshyblacien de muchachas adolescentes con e1 fin de determinitr su ingesti6n diaria promedio de proteinas (medidas en gramos) busc6 el consejo de un bioestadistico con respecto al tamaiio de la muestra que deberfa tomar

~Que procedimiento debe seguir el bioestadistico para asesorar al nutri610go Antes de que el estadistico pueda ayudar el nutri6logo este debe proporcionar tres elementos de informaci6n h dimensi6n deseada del intervalo de confianza el nivel de confianza deseado y la magnitud de la variancia de la poblaci6n

Soludon Suponga que el nutri6logo requiere un intervalo con una dimensi6n de aprQximadamente 10 gramos es decir la estimaci6n se deberfa enconshytrar alrededor de 5 gramos de la media de la poblaci6n en ambas direcshyciones En otras palabras se desea un margen de error de 5 gramos Suponga que se decide por un coeficiente de confian7a de 95 y que con base en su experiencia previa el nutri6logo percibe que la desviaci6n estandar de la poblaci6n es probablemente de alrededor de 20 gramos EI estadfstico dispone ya de la informaci6n necesaria para calcular el tamaiio de la muestra z 196 (J = 20 y d 5 Suponga que el tamaiio de la poblaci6n es grande asf queel estadistico puede ignorar la correcshyci6n por poblaci6n finita y utilizar la ecuaci6n 673 Con las sustitucioshynes adecuadas el valor de n se calcula como

Se recomienda que el nutri610go tome una muestra de tamafio 62 AI calcular el tamaiio de una muestra a partir de las ecuaciones 673 0 675 el resultado se redondea al siguiente nurnero entero mayor si los calculosdan un numerocon decimales bull

183 68 DETERMINACION DEL TAl1ANO PARA LAS PROPORCIONES

EJERCICIOS

671 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su hospital Si se desea un intervalo de confianza de 99 por dento con una amplitud de 1 libra ~que tan grande debe ser la muestra de los registros de nacimiento Suponga que un estimashy

dor razonable para (J es 1 libra ~De que tamano debe ser la muestra si el coeficiente de confiabilidad se hace descender a 95

672 El director de la secdon de control dela rabia del departamento de salud publica desea extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso del ano anterior para estimar la edad media de las personas mordidas Requiere un intervalo de confianza de 95 por dento decide utilizar un valor de 25 para d y a partir de estudios anteriores estima que la desviacion estandar de la poblacion esta alrededor de los 15 anos ~Que tan grande debe ser el tamano de la muestra

673 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mglOO ml) de pacientes atendidos en una clinica para diabeticos durante el transcurso de los ultimos 10 anos Determine el numero de registros que el medico debe examinar para obtener un intershyvalo de confianza de 90 por ciento para 11 si la dimension requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varian cia de 60

674 Se deseaestimar la edad media en la que a los padentes de esclerosis multiple se les diagnosshytico el padecimiento por primera vez Se requiere un intervalo de confianza de 95 por dento con una dimension de 10 anos Si la variancia de la poblaci6n es de 90 ~que tan grande debera ser la muestra

68 DETERMINACION DELTAMANO DE lA MUESTRA PARA lA ESIDIACION DE lAS PROPORCIONES

EI metodo para estimar el tamafio de la muestra cuando se requiere estimar la proshyporcion de una poblacion es esencialmente el mismo que se describio para estimar la media de una poblacion Se aprovecha el hecho de que la mitad del intervalo deseashydo d se puede igualar al producto del coeficiente de confiabilidad y el error estandar

Si se supone que el muestreo ha sido hecho de manera aleatoria y que existen condiciones que garanticen que la distribuci6n de psea aproximadamente normal se obtiene la siguiente formula para n cuando el muestreo es con reemplazo cuanshydo se realizaa partir de una poblacion infinita 0 ruando la poblacion muestreada es 10 suficientemente grande como para hacer innecesario el uso de la correcci6n por poblacion finita

n (681)

dondeq = I-p Si la correccion por poblacion finita no puede descartarse la formula adecuashy

da paran es

(682)n d 2 (N -1)+z2pq

euan do N es grande en comparacion con n (es decir n IN 05) se puede pasar por alto la correccion por poblacion finita y la ecuacion 682 se reduce a la ecuacion 681

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

161 63 DISTRIBUCI6N

625 Algunos estudios acerca de la enfermedad Alzheimer (EA)han mostrado un incremento en la producci6n de 14C0

2 en pacientes con ese padecimiento Durante un estudio se obtuvieshy

ron los siguientes valores de 14C02

a partir de 16 biopsias de neocorteza de pacientes con la enfermedad (EA)

1009 1280 1180 12551547 2352 1956 1080

1776 1767 1680 2050 1452 2857 3100 1621

Considereseque la poblaci6n sigue una distribuci6n normal con una desviaci6n estandar de 350

63 DISTRIBUCION t

En la seccion 62 se describe un procedimiento para obtener un intervalo de conshyfianza para la media de una poblaci6n EI procedimiento requiere del conodmiento de la varianda de la poblacion de la que se extrae la muestra Puede parecer un tanto extrafio que se tenga conocimiento de lavariancia de la poblacion y no se conozca elvalor de la media de la poblacion De hecho es comun en situacioshynes como las que se han presentado que se deSconozca tanto la variancia como la media de la poblacion Esta situacionpresenta un problema respecto a la construcshycion delos intervalos de confianza Por ejemplo aun cuando la estadfstica

x J1shyZ=---

crJn presenta una distribudon normal cuando la poblacion tambien tiene una distribuci6n normal y sigue una distribuci6n aproximadamente normal cuando n es muy grande independientemenle de la forma funcional de la poblacion no se puede hacer uso de este hecho porque cr se desconoce Sin embargo no todo esrn perdido y la soluci6n mas logica para este problema es utilizar la desviacion estandar de ~muestra

s = ~L(Xi - x)2(n-l)

para sustituir cr Por ejemplo cuando el tamafio de la muestra es mayor que 30 la confianza en s como una aproximacion de cr es por 10 general sustancial por 10 que se justifica la utilizacion de la teorfa de la distribudon normal para construir un intervalo de confianza para la media de la poblacion En tal caso se procede como se indica en la seccion 62

Cuando se tienen muestras pequefias es imprescindible encontrar otro proceshydimiento para construir intervalos de confianza

Como resultado del trabajo de Gosset (2) escrito bajo el seudonimo de Student se dispone de otra alternativa conocida como distribuci6n t de Student con frecuenda abreviada como distribuci6n t

La cantidad

sigue esta distribucion

162 CAPiTULO 6 ESTIMACION

Propiedades de la distribucion t La distribuci6n t tiene las siguientes proshypiedades

1 Tiene una media de O

2 Es simetrica con respecto a la media

3 En general tiene una variancia mayor que 1 pero esta tiende a I a medida que aumenta el tamaiio de la muestra Para dfgt 2 la variancia de la distribushyci6n t es dfl(df - 2) donde df representa los grados de libertad En forma alterna puesto que df n - 1 para n gt 3 se puede escribir la variancia de la distribuci6n t como (n l)(n 3)

4 La variable t va de - hasta + 00DO

5 La distribuci6n t es realmente una familia de distribuciones puesto que hay una distribuci6n diferente por cada valor de la muestra de n - 1 que es el divisor que se utiliza para ca1cular S2 Recuerde que n - 1 representa los grados de libertad En la figura 631 se muestran las distribuciones t correspondienshytes a algunos valores de los grados de libertad

6 Comparada con la distribuci6n normal ladistribuci6n t es menos espigada en el centro y tiene colas mas largas En la figura 632 se com para la distribushyci6n t con la distribuci6n normal

7 La distribuci6n t se aproxima ala distribuci6n normal a medida que n - 1 se aproxima al infinito

La distribuci6n t al igual quela distribuci6n normal estandar se ha tabulado ampliamente Una de estas tablas es la tabla E del apendice Tal como se puede apreciar se debe tomar en cuenta eLcoeficiente de confianza y los grados de libershytad cuando se utiliza la tabla de la distribuci6n t

FIGUR- 631 Distribuci6n t para diferentes grados de libertad

-----

163 63 DISTRIBUCION

__ Distribucion normal

- - - Dislribucion I

x

FIGURA 632 Comparaci6n de las distribuciones normal yt

Es posible utilizar el paquete MINITAB para graficar la distribuci6n t (para grados espedficos de libertad) y otras distribuciones Despues de asignar el eje horizontal y las siguientes direcciones en el cuadro de Set Patterned Data seleccioshyne del menu Calc y despues Probability Distributions Utilice el cuadro de diashylogo Plot para generar la grafica

Inlervalos de conJiQllia qllR uJilban fa dislribucion t El procedimien to general para construir interval os de confianza no se ve afectado por la necesidad de utilizar la distribuci6n t en lugar de la distribuci6n normal estandar Aun es necesario usar la relaci6n expresada por

estimador plusmn (coeficiente de confiabiIidad) x (error estandar)

Lo que es diferente es el origen del coeficiente de confiabilidad Este se obtiene a partir de la tabla de la distribucion t en lugar de la tabla de la distribuci6n normal estandar Para ser mas especfficos cuando se obtienen muestras a partir de una distribushycion normal cuya desviaci6n estdndi17 a se desconoce ell OO( 1 - a) por ciento del intervalo de confianza para la media de la poblaci6n J1 estd dado por

(631 )

Es importante aclarar que el requisito para el uso valido de la distribucion t es que la muestra debe ser extrafda de una poblad6n con distribucion normal Sin embarshygo la experiencia ha demostrado que se pueden tolerar desviaciones moderadas de esterequisito Como consecuencia la distribucion t se utiliza incluso cuando se sabe que la poblaci6n original se desvia de la normalidad Lltl mayorfa de los invesshytigadores requieren que al menos pueda sostenerse el supuesto de una distribushyd6n de poblacion en forma de montfculo

EJEMPLO 631

Maureen McCauley (A-I) realiz6 un estudio para evaluar los efectos de un conjunto de instrucciones de mecanica en ellugar de labores sobre el desempeno laboral de obreros jovenes recientemente contratados Se utilizaron dos grupos de individuos elegidos aleatoriamente uno de los grupos para aplicar el experimento y el otro

164 CAPITULO 6 ESTlMACI6N

como grupo de control EI grupo con el que se experimento recibio una hora de capacitacion impartida por un terapeuta ocupacional EI grupo de control no recishybio esta capacitacion Para evaluar el esfuerzo de cada obrero para levan tar bajar jalar y transportar objetos dentro del entorno laboral se utilizo una lista de cotejo para la evaluacion de trabajo mecanico que inclufa criterios de referencia Una tarea bien hecha recibio una calificacion de 1 EI grupo de control formado por 15 individuos alcanzo una calificacion media de 1153 en la evaluacion con una desshyviacion estandar de 3681 Se supone que el grupo de control se comporto como una muestra aleatoria extraida de una poblacion similar de individuos Se pretende utilizar los datos de la muestra para estimar la calificacion media para la poblacion

Soluci6n Se puede utilizar la media de la muestra 1153 como una estimacion puntualde la media de la poblacion sin embargo debido a que se descoshynoce la desviacion estandar de la poblacion se debe considerar que los valores siguen una distribucion aproximadamente normal antes de consshytruir los intervalos de confianza para l Se considera que esta suposicion es razonable y que se necesita un intervalo de confianza de ~or cienshyto el estimador es i y el error estandar es s -r 681 15 =9504 Ahora es necesario conocer el coeficiente de confiabilidad el valor de t asodado al coeficiente de confianza de 95 y a los n 1 = 14 grados de libertad Puesto que el intervalo de confianza de 95 por ciento deja 05 del area bajo la curva de t para dividirse en dos colas iguales se necesita el valor de tala derecha del cual esta el 025 del area Este valor se localiza en la tabla E enla columna encabezada por t

975 bull Este es el valor

para tala izquierda delcual esta 975 del area bajo la curva EI area a la derechade este valor es igual al 025 deseado Ahora sobre la columna de grados de libertad se localiza el numero 14 EI valor para t se encuentra en la interseccion del renglon con la etiqueta 14 y la columna con la etiqueta t975 bull Se encuentra que este valqr para t que representa al coeficiente de confiabilidad es 21448 Finalmente el intervalo de confianza de 95 por ciento se construye como sigue

1153 plusmn 21448(9504) 1153 plusmn 204 949 1357 bull

Este intervalo puede interpretarse con ambos puntos de vista probabiHstico y practico Puede asegurarse en un 95 por dento que 1a media l correcta de la poblacion se encuentra entre 949 y 1357 porque al repetir el muestreo 95 por dento de los intervalos construidos deigual manera incluyen a l

Decidir entre z r t Cuando se obtiene un intervalo de confianza para la media de una poblacion se debe decidir si se utiliza un valor de z6 de t como factor de confiabilidad Para hacer una elecci6n adecuada se debe considerar el tamafto de la muestra si la poblacion muestreada sigue una distribucion normal y si la varian cia de la poblacion es conocida La figura 633 muestra un diagrama de flujo que se puede utilizar para decidir rapidamente si el factor de confiabilidad debe ser Z 0 t

EJERCICIOS 165

EJERCICIOS

Sa aplica al leorema dellfmile central

FIGURA 633 Diagrama de flujo para deddir entre utililizar z y t cuando se hagan inferencias respecto a las medias de la poblaci6n (Para utilizar un procedimiento no parametrico vease el capitulo 13)

Analisis par computadara Si el proposito es construir un intervalo de conshyfianza con el programa MINITAB para la media de la poblacion cuando el estadfsshytico t es el factor de confiabilidad adecuado el comando se inicia con la palabra TINTERVAL Seleccione en Windows I-Sample t desde el menu de Basic Statistics

631 Utilice la distribud6n t para encontrar el factor de confiabilidad para el intervalo de confianshyza basado en los siguientes coeficientes de confianza y tamafiosde las muestras

a b c d

Coefidente de confianza 95 99 90 95 Tamafio de la muestra 15 24 8 30

632 En una investigacion acerca de la dependencia del flujo y volumen de todo el sistema respishyratorio en un grupo de pacientes con enfermedad obstructiva pulmonar cronica conectados a respiradores artificiales Tantucci et ai (A-2) registraron los siguientes valores de linea de

166 CAPITULO 6 ESTIMACION

base del flUjD continuo inspiratDriD (Us) 90 97 103110 104 100 CDnsidere que una muestra aleatDria simple esta cDnfDrmada pDr seis individuDs a partir de una pDblacion que sigue una distribuci6n nDrmal CDn individuDs CDn la misma enfermedad

a) ~Cuat es la estimaci6n puntual de la media de la pDblaci6n

b) ~Cuil es la desviacion estandar de la muestra

c) ~Cultll es la estimacion del error estandar para la media de la muestra

d) CDnstruya un intervalD de cDnfianza de 95 pDr ciento para el flUjD mediD cDntinuD inspishyratDriD de la pDblaci6n

e) ~Cual es la precision de la estimacion

f) Explique la interpretaci6n prDbabilistica para este intervalD de confianza

g) Explique la interpretacion practica para este intervalD de cDnfianza

633 LlDyd y MaillDux (A-3) informaron IDS siguientes datDs acerca del peso de la glandula pituitaria en una muestra de cuatrD ratas de Wistar Furth

media = 90 mg error estandar para la media = 3

FUEJTE Ricardo V Lloyd y Joe Mailloux Analysis ofSshy100 Protein Positive Folliculo Stellate Cells in Rat Pituitary Tissues AmericanJournal ofPathology 133 338-346

a) ~Cual es la desviadon estandar de la muestra

b) CDnstruya un intervalD de confianza de 95 pDr ciento para el peso medio de la glandula pituitaria para una pDblacion similar de ratas

c) ~Que supDsiciDnes se necesitan para que sea validD el intervalo de cDnfianza del inciso b

d) ~Que interpretacion puede ser la mas indicada cuandD se trata sDbre intervalos de conshyfianzacon alguien que no sabe de estadfstica Explique pDrque es la mas cDnveniente

e) 5i fuera necesario elabDrar un intervalD de cDnfianza de 90 pDr cientD para la media de la pDblaci6n ~el intervalD de cDnfianza serta mayDr 0 menor que el intervalD de 95 pDr dentD Explique su respuesta sin construir realmente el intervalD de cDnfianza

f) 5i [uera necesariD considerar un intervalo de CDnfianza de 99 pDr cientDpara lamedia de la poblacion ~el intervalo de cDnfianza serra mayDr 0 menDr que el intervalD de 95 pDr dentD Explique su respuesta sin cDnstruir realmentt el intervalD de cDnfianza

634 Kaminski y Rechberger (A-4) encontrarDn en un estudio sDbre la preeclampsia que la media de la presi6n sistolica sangufnea en 10 mujeres sanas y que no estan embarazadas es de 119 CDn una desviacion estandar de 21

a) 2Cual es el errDr estandar estimadD para la media

b) CDnstruya un intervalD de confianza de 99 pDr cientD para la media de la poblaci6n a partir de la cual puede considerarse que IDS 10 individuos conforman una muestra aleatoria

c) ~CUlil es la precisi6n estimada

d) ~Que consideraciones deben hacerse para comprobar la validez del intervalo de confiahza

635 Unamuestra de 16nifias de 10 afiDS pesan en promediD 715 con una desviacion estandar de 12libras CDnsidere el calculD de intervalDs de cDnfianza de 9095 y 99 pDr ciento para I-L

167 64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS

636 Una muestra aleatoria simple conformada por 16 individuos aparentemente sanos presenta los siguientes valores de arsenico eliminado en la orina (miligramos por dfa)

Individuo Valor Individuo Valor

1 007 9 012 2 030 10 006 3 025 11 010 4 008 12 032 5 030 13 006 6 038 14 009 7 007 15 014 8 005 16 011

Elabore un intervalo de confianza de 95 por ciento para la media de la poblaci6n

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES

En ocasiones se presentan casos en los que se desea estimar 1a diferencia entre 1a media de dos poblaciones A partir de cada poblacion se extrae una muestra aleatoria independiente y de los datos de cada una se calculan las medias muestrales XI y x2

respectivamente En el capitulo anterior se dijo que el estimador XI - x2 ofrece una estimacion insesgada de la diferencia entre las medias de las poblaciones III shy11 2 bull La variancia del estimador es (cr~ n l ) + (cr~ n 2 ) Tambien se menciono que seglin las condiciones la distribucion muestral de XI - x2 puede presentar una distribution al menos aproximadamente normal de modo que en muchos casos se utiliza la teorfa adecuada para las distribuciones normales en el calculo de un intershyvalo de confianza para III - 11 2 bull Cuando se conocen las variancias de la poblacion el intervalo de confianza del 100(1 - ex) por ciento para III - 112 esta dado por

(641)

El anal isis del intervalo de confianza para la diferencia entre las medias poblacionales ofrece informacion util para decidir si es 0 no probable que las medias de las dos poblaciones sean iguales Cuando el intervalo no incluye al cero se dice que el intervalo ofrece evidencia de que las dos poblaciones tienen medias diferentes Cuando el intervalo incluye al cero se dice que las poblaciones pueden tener meshydias iguales

Esto se ilustra a continuacion para el caso donde el muestreo se realiza a partir de una distribucion normal

168 CAPITULO 6 ESTlMACI6N

EJEMPLO 641

A un equipo de investigacion Ie interesa conocer la diferencia entre las concentracioshynes de acido urico en pacientes con y sin el sfndrome de Down En un gran hospital para el tratamiento de pacientes con retardo mental una muestra de 12 individuos con el sindrome presenta una media de XI = 45 mgll00 mL En un hospital general se encontro que una muestra de 15 individuos normales de la misma edad y sexo presenta un nivel medio de x2= 34 Si es razonable suponer que las dos poblaciones de valores muestran una distribucion normal y sus variancias son iguales a 1 y 15 calcule el intervalo de confianza de 95 por ciento para ~l - ~2

Soluci6n Para una estimacion puntual de III 112 se udliza Xl X2= 45 34 11 EI coeficiente de confiabilidad que corresponde a 95 localizado en la tabla D es 196 EI error estandar es

Por 10 tanto el intervalo de confianza de 95 por ciento es

11 plusmn 196(4282) 11plusmn84 26 194

Se dice que se dene una confianza de 95 por ciento de que la difeshyrencia real 111 - 112 este entre 26 y 194 porque en muestreos repetidos 95 por ciento de los intervalos construidos de esa manera incluiria la diferencia entre las medias reales

Puesto que el intervalo no incluye al cero se concluye que las dos poblaciones tienen diferentes medias bull

Muestreo a partir de poblaciones que no signen una distribuci6n ItOrmal La construccion de un intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando el muestreo se realiza a partir de poblaciones no normales se lleva a cabo en la forma descrita en el ejemplo 641 si las muestras n l y n

2 son grandes Una vez mas este es un resultado del teorema del limite central

Si se desconocen las variancias de la poblacion se utili zan las variancias de las muestras para estimarlas

IUEMPLO 642

Motivados por d conocimiento de la existencia de una gran cantidad de textos polemicos que sugieren que el estres la ansiedad y la depresion son dafiinos para el sistema inmunologico Gormanet ai (4-5) condujeron un estudio en el que se conshysider6 a individuos varoneshomosexuales algunos con VIH (virus de inmunodefishyciencia humana) positivo y otros con VIH negativo Los datos fueron registrados con una amplia vltJriedad de mediciones medicas inmunologicas psiquiatricas y neurol6gicas una de las cuales corresponde al numero de celulas CD4+ en la sanshy

64 INTERV ALO DE CONFIANZA PAHALA DIFERENCIA ENTRE DOS MEDIAS 169

gre El numero promedio de celulas CD4+ para middot112 individuos con infecci6n por VIR fue de 4018 con una desviaci6n estandar de 2264 Para los 75 individuos sin la infecci6n por VIR la media y la desviaci6n estandar fueron de 8282 y 2749 respectivamente Se pretende elaborar un intervalo de confianza de 99 por ciento para la diferencia de las medias de las poblaciones

Soluci6n No hay informaci6n con respecto a la forma de la distribuci6n de las celulas CD4+ Sin embargo como el tamafto de las muestras es grande el teorema del limite central asegura que la distribuci6n muestral de las diferencias entre las medias de la muestra siguen una distribuci6n aproxishymadamente normal independientemente de que la distribuci6n de la variable en las poblaciones no siga una distribuci6n normal Se puede utilizar este hecho para justificar el uso de la estadistica z como factor de confiabilidad en la construcci6n del intervalo de confianza Tampoco hay informaci6n acerca de las desviaciones estandar por 10 que puede emplearse las desviaciones estandar de las muestras para estimarlas La estimaci6n puntual para la diferencia entre las medias de las poblacioshynes es la diferencia entre las medias de las muestras 8282 - 4018 = 4264 En la tabla D se encuentra que el factor de confiabilidad es 258 La estimaci6n del error estandar es

s __ = 27492

+ 22642 =382786

Xl-X 75 112

Por la ecuaci6n 641 el intervalo de confianza de 99 por ciento para la diferencia entre las medias de la poblaci6n es

4264 plusmn 258(382786) 3276 5252

Se tiene la seguridad de 99 por ciento de que el promedio de celulas CD4+ en varones con VIR positivo difieren de la media para los varoshynes con VIR negativo por 3276 a 5252 bull

Distribuci6n t y la diferencia entre las medias Cuando no se conocen las variancias y se pretende estimar la diferencia entre las medias de dos poblacioshynes con un intervalo de confianza es posible utilizar la distribuci6n t para suminisshytrar el factor de confiabilidad si se conocen ciertas suposiciones se debe saber 0

suponer de buena fe que las dos poblaciones muestreadas siguen una distribuci6n normal Respecto a las variancias de las poblaciones se debe distinguir entre dos situaciones 1) la situaci6n en la que las variancias son iguales y 2) la situaci6n en la que no 10 son A continuaci6n se consideranambas sitpaciones por separado

Varianciaspoblacifmales iguales Si la suposici6n sobre igualdad de las variancias de las poblaciones esta justificada las dos variancias de las muestras calculadas a partir de las muestras independientes pueden considerarse como estishymaciones de 10 mismo es decir la variancia comun Parece 16gico entonces aproshyvechar este hecho en el anal isis en cuesti6n Esto es precisamente 10 que se hace para establecer una estimaci6n conjunta para la variancia comun Esta variancia se obtiene mediante el caIculo promedio ponderado de las dos variancias de las muesshy

170 CAPITULO 6 ESTlMACI6N

tras Cada variancia de la muestra es ponderada con base en sus grados de libertad Si los tamafios de las muestras son iguales este promedio ponderado es la media aritmetica de las variancias de las dos muestras Si el tamano de las dos muestras es distinto el promedio ponderado aprovecha la informacion adicional proporcionada por la muestra mayor La estimacion con junta se obtiene con la fOrmula

S2 = (nl _1)SI2 + (n2 l)s~ p (642)

+n2 -2nl

Asf la estimacion del error estandar esta dada por

(643)

y el intervalo de confianza de 100(1 a) por ciento para III 112 esta dada por

(644)

El nfunero de grados de libertad utilizado para determinar el valor de t que se usa para construir el intervalo es n

1 + n

2 2 que es el denominador de la ecuacion

642 Este intervalo se interpreta en la forma habitual Los metodos que pueden emplearse para tomar la decision acerca de la igualshy

dad de las variancias de las poblaciones se estudian en la seccion 610 y 78

EJEMPLO 643

Uno de los estudios de Stone et al (A-6) tuvo como objetivo determinar los efectos del ejercicio por un tiempo prolongado en los ejecutivos de una compania inscritos en un programa supervisado de acondicionamiento fisico Se registraron datos de 13 individuos (el grupo deportista) que voluntariamente se inscribieron el programa y que permanecieron activos por 13 anos en promedio y de 17 individuos (el segunshydo grupo el sedentario) que decidieron no inscribirse Entre los datos que se regisshytraron acerca de los individuos esta el mlmero maximo de sentadillas realizadas en 30 segundos El grupo deportista obtuvo una media y una desviacion estandar de 210 y 49 respectivamente La media y la desviacion estandar para el grupo sedenshytario fueron 121 y 56 respectivamente Se considera que las dos poblaciones de medici ones de acondicionamiento muscular siguen una distribuci6n aproxirnadashymente normal y que las variancias para ambas poblacionesson iguales Se pretenshyde elaborar un intervalo de confianza de 95 por ciento para Ja diferencia entre las medias de as poblaciones representadas por las dos muestras Soluci6n Primero se utiliza la ecuaci6n 642 para calcular la estimaci6n conjunta

de la variancia comtin de las poblaciones

(13-1)(49 2 )+(17 1)(562 ) =2821

13+17-2 Cuando se consulta la tabla E con 13 + 17 - 2= 28 grados de libertad y el nivel de confianza de 95 se encuentra que eLfactor de confiabilidad es 20484 Con la ecuacion 644 se calcula el intervalo de confianza de

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS 171

95 por ciento para la diferencia entre las medias de las poblaciones de la siguiente manera

2821 2821(210-121)plusmn20484 --+-shy

13 17 89 plusmn 40085

49129

Se tiene una confianza de 95 por ciento de que la diferencia entre las medias de las poblaciones estan entre 49 y 129 Se puede decir esto porque se sabe quesi se repite el amilisis muchfsimas veces y se calculan los intervalos de confianza de la misma manera cerca de 95 por ciento de los intervalos de confianza induiran la diferencia entre las medias de las poblaciones

Debido a que los intervalos no induyen al cerose conduye que las medias de las poblaciones son diferentes bull

Variancias poblacionales distintas Cuando no se puede conduir que las variancias de dos poblaciones de interes son iguales aun ruando pueda suponerse que las dos poblaciones presentan distribuciones normales no es adecuado utilizar la distribucion t como se acaba de describir para construir los intervalos de confianza

Una solucion al problema de variancias distintas fue propuesta por Behrens (3) y posteriormente fue verificada y generalizada por Fisher (4 5) Neyman (6) Scheffe (7 8) Y Welch (9 10) tambien proponen soluciones EI problema es analizashydo en detalle por Cochran (11)

EI problema gira en tomo al hecho de que la cantidad

no sigue una distribuci6n t con nj + n 2 grados de libertad ruando las variancias 2 shy

de las poblaciones son distintas Consecuentemente la distribucion t no se puede utilizar en la forma habitual pata obtener el factor de confiabilidad del intervalo de confianza para la diferencia entre las medias de dos poblaciones que tienen variancias diferentes La solucion propuesta por Cochran consiste en el calculo del factor de confiabilidad mediante la siguiente formula

wltj + w2tZ t l

f

-0f2 = (645) WI +w2

donde WI 512

np W 2 = s~ n2 tl = tl _ para nj - 1 grados de libertad y t2 = t l

_w2aI2

para n2

- 1 grados de libertad Un intervalo aproximado de confianza del 100(1 shya) por ciento para III - 112 esta dado por

(646)

172

EJERCICIOS

CAPITULO 6 ESTlMACION

FJEIUPLO 644

En la investigacion de Stone et al (A-6) descrita en el ejercicio 643 los investigashydores tambien informaron los siguientes datos de las medici ones referentes a todas las calificaciones del acondicionamiento muscular logradas por los individuos

Muestra n Media Desviaci6n estimdar

Grupo deportista 13 45 3

Grupo sedentario 17 37 10

Se considera que las dos poblaciones de todas las calificaciones de acondicionashymiento muscular siguen una distribuci6n aproximadamente normal Sin embargo no debe suponerse que las dos variancias poblacionales son iguales Se pretende construir un intervalo de confianza de 95 por ciento para la diferencia entre las medias de todas las calificaciones de acondicionamiento muscular para las dos poshyblaciones representadas por las muestras

Soluci6n Se utiliza t de la ecuaci6n 645 para calcular el factor de confiabilidad En la tabla E se muestra que con 12 grados de libertad y 1 - 052 = 975 t( 21788 Analogamente con 16 grados de libertad y 1- 052 = 975 t2 = 21199 Ahora Sf calcula

(3 2 13)(21788) + (102 17)(21199) 139784 t= =

(3 2 13)+(102 17) 065747

=21261

Con la ecuaci6n 646 ahora se construye el intervalo de confianza de 95 por ciento para la diferencia entre las medias de las dos poblaciones

2 2

(45 37)plusmn21261 3 + 10 13 17

8 plusmn 21261 (25641101) 25134

Puesto que el intervalo no incluye acero se concluye que las medias de las dos poblaciones son diferentes bull

Cuando se construyen intervalos de confianza para la diferencia entre las medias de dos poblaciones es posible utilizar la figura 641 para decidir rapidashymente si el factor de confiabilidad debe ser z t 0 tf

Para cada uno de los siguientes ejercicios construya intervalos de confianza de 90 95 y 99 par ciento para las diferencias entre las medias poblacionales Establezca consideraciones que hagan que el metodo sea valido Determine las interpretaciones practica y probabilistica

clJ clJ FIGURA 541 Diagrama de flujo para decidir si e1 factor de confiabilidad debe ser z tot cuando se realizan inferencia inferencias acerca de la diferencia entre las medias de dos pobladones (Para usar un procedimiento no parametrico ver el capitulo 11)

174 CAPiTULO 6 ESTlMACION

para cad a intervalo construido Suponga las variables bajo considerati6n en cad a ejercicio y establezca para que pueden servir a los investigadores esos resultados

641 EI objetivo de un experimento de Buckner et al (A-7) consisti6 en estudiar los efectos del relajamiento muscular inducido por el pancuronium en el volumen del plasma circulante Los individuos estudiados son recien nacidos con un peso mayor a 1700 gramos que necesishytaron de ayuda para respirar durante las primeras 24 horas despues de nacer y cumplieron con otros criterios cHnicos Cinco recien nacidos paraIizados con el pancuronium y siete recien nacidos no tratados presentaron las siguientes estadisticas en la segunda de las tres mediciones del volumen de plasma (ml) hecha durante la respiraci6n mecanica

Paralizados 480 81 No tratados 567 81

La segunda medici6n para el grupo tratado ocurri6 de 12 a 24 horas despues de la primera dosis de pancuronium Para el grupo no tratado las mediciones se hicieron de 12 a 24 horas despues de iniciar la respiracion mecanica

642 Zuckery Archer (A-8) afirman que la N-nitrosobis (2-oxopropyl)amina (BOP) y las nitrosaminas 3-oxidizadas producen una alta incidencia de tumores de conductos pancreaticos en el hamster dorado sirio Estudiaron los efectos en el peso sangufneo en la glucosa del plasma en la insulina yen los niveles de transamina glutamico-oxaloacetica del plasma (GOT) de los hamsters expuestos in vivo a la BOP Los investigadores reportaron los siguientes resultados en ocho animales tratados y 12 sin tratamiento

Variable Sin tratamiento Con tratamiento

Glucosa del plasma (mglgl) 101 plusmn 5 74plusmn 6

FUENTE Peter F Zucker y Michael C Archer Alterations Pancreatic Islet Function Produced by Carcinogenic Nitrosamines in the Syrian Hamster AmericanJournal oPathology 133 573-577

Los datos son la media de la muestra plusmn la estimaci6n del error estandar de la media de la muestra

643 Los objetivos de un estudio de Davis et al (A-g) son evaluar 1) la eficacia del programa auto ayuda momento para dejar de fumar cuando se utiliza con base de uno a uno en el hogar y 2) la viabilidad de ensefiar temicas para abandonar el habito de fumar a los estudiantes de enfermerfa en bachillerato A estudiantes graduados de enfermerfa inscritos en dos cursos de metodologia de la investigacion de la Universidad de Ottawa se les invit6 a participar en el proyecto Se aplic6 un cuestionario de opcion multiple para abandonar el habito de fumar a 120 estudiantes de enfermeria que participaron y a otros 42 estudiantes que no participashyron antes ni despues del estudio Se calcularon las diferencias entre las calificaciones antes y despues del estudio as como las siguientes estadisticas a partir de las diferencias

EJERCICIOS 175

Grupo Media Desviaci6n estandar

Participantes (A) 214444 15392 No participantes (B) 33333 14595

644 El doctor Ali Khraibi (A-IO) de la CHnica y Fundaci6n Mayo condujo una serie de experishymentos con el fin de evaluar las respuestas diureticas y natiureticas de ratas Okamoto esponshytaneamente hipertensivas (REB) y ratas Wistar-Kyoto (WRY) para dirigir incrementos en la presion hidrostatica renal intersticial (PBRI) Para aumentar la PBRI se utiIiz6 la expansi6n directa del volumen renal intersticial (DRIVE) a traves de una matriz implantada cronicamente en el rinOn Entre los datos registrados durante el estudio estan las siguientes mediciones de excreci6n de sodio a traves de la orina (UNa V) durante el periodo de DRIVE

Grupo

REB 632572796483527 2WKY 420469482 108210

FUENTE Publicada con autorizaci6n del Dr Ali A Khraibi

645 Osberg y Di Scala (A-II) realizaron un estudio centrado en la eficacia de los cinturones de seguridad para reducir 1esiones entre sobrevivientes de accidentes automoviHsticos internashydos en hospitales con edades de 4 a 14 afios El estudio compar610s resultados de 123 ninos que utilizaron el cintur6n contra 290 que no 10 utilizaron entre aquellos que se vieton enshyvueltos en tales accidentes y que fueron hospitalizados El informe con tenia la siguiente estadistica del numero de dfas en la unidad de cuidados intensivos

Grupo Media Error estandar estimado

Utiliz6 el cintur6n 83 16 No utiliz6 el cintur6n 139 18

646 La medicion del diametro transversal del coraz6n de hombres y mujeres adultos presenta los siguientes resultados

sx Grupo Tamafto de Ia muestra (cm) (cm)

Varones 12 1321 105 Mujeres 9 IIOO 101

Considere que las poblaciones siguen una distribucion normal con variancias iguales

176 CAPITULO 6 ESTIMACION

647 Veintiruatro animales de laboratorio con deficiencia de vitamina D fueron divididos en dos grupos iguales EI grupo 1 recibi6 un tratamiento consistente en una dieta que proporcionashyba vitamina D EI segundo grupo no fue tratado AI termino del periodo experimental se midieron las concentraciones de calcio ensuero obteniendose los siguientes resultados

Grupo tratado X 111 mg 100 mls = 15 Grupo sin tratamiento x= 78 mg 100 ml s = 20

Considere que las poblaciones siguen una distribuci6n normal con variancias iguales

648 Ados grupos de nifios se les hicieron pruebas de agudeza vi~ual El grupo 1 estuvo formado por 11 nifios que recibieron la atenci6n de medicos privados La calificaci6n media para este grupo fue de 26 con una desviaci6n estandar de 5 El segundogrupo que incluy6 14 nifios que recibieron atenci6n medica por parte del departamento de salud publica tuvo una calishyficaci6n promedio de 21 con una desviaci6n estandar de 6 Suponga que las poblaciones siguen una distribuci6n normal con variancias iguales

649 El tiempo promedio de estancia de una muestra de 20 pacientes dados de alta de un hospital general es de siete dras con una desviaci6n estaildar de dos dras Una muestra de 24 padenshytes dados de alta de un hospital de enfermedades cr6nicas tuvo un tiempo promedio de estancia de 36 dfas con una desviaci6n estindar de 10 dias Suponga que la poblaci6n sigue una distribuci6n normal con variancias desiguales

6410 En un estudio de factores que se consideran responsables de los efectos adversos del tabashyquismo sobre la reproducci6n humana se midieron los niveles de cadmio (nanogramos por gramo) en el tejido de la placenta de una muestra de 14 madres que fumaban y una muestra aleatoria independiente de 18 mujeres no fumadoras Los resultados fueron los siguientes

No fumadoras toO 84 128250 118 98 125 154 235

94251 1952559875 118122150

Fumadoras 300301150241305178168148

134285 175 144 125204

ms probable que el nivel medio de cadmio registrado sea mayor entre las fumadoras que entre las no fumadoras ~Por que se llegarfa a esta conclusi6n

65 INTERVALO DE CONFIANZA PARA IA PROPORCION DE UNA POBIACION

Muchas preguntas de interes para que el tecnico en salud tienen relacion con las proporciones de poblacion ~Que propordon de padentes que redben un tipo espeshycial de tratamiento se recuperan ~Que proporcion de alguna poblacion tiene cierta enfermedad ~Que propordon de una poblacion es inmune a derta enfermedad

Para estimar la proporcion de una poblacion se procede en la misma forma que cuando se estima la media de una poblacion Se extrae una muestra de la poblacion de interes y se calcula su proporcion p Esta se utiliza como el estimador puntual para la proporcion de la pobladon Un intervalo de confianza se obtiene mediante la siguiente formula general

estimador plusmn (coefidente de confiabilidad) X (error estandar)

EJERCICIOS

EJERCICIOS 177

En el capitulo anterior se vio que cuando np y n(1 - p) son mayores que 5 se puede considerar que la distribuci6n muestral de pse aproxima bastante a una distribuci6n normal Cuando se cumple con esta condici6n el coeficiente de confiabilidad es algUn valor de z de la distribuci6n normal estandar Esta visto que el error estandar es igual a (J p =fi(l-p) n Puesto que p que es el parametro que se trata de calcular se desconoce se debe utilizar pcomo una estimaci6n Asf se estima (J j por medio de ~p(l Pn y el intervalo de confianza de 100(1 - 0) por ciento para pesta dado por

pplusmn Z(I-1J2)~P(l- P) Fn (651)

Este intervalo se interpreta tanto desde el punto de vista practico como probabilistico

FJEMPLO 651

Mathers et al (A-12) encontraron queen una muestra de 591 pacientes internados en un hospital psiquiatrico 204 admitieron que consuniieron marihuana al meshynos una vez durante su vida Se pretende construir un intervalo de confianza de 95 por ciento para la proporcion de individuos que consumieron marihuana durante su vida en la poblaci6n muestreada de los internos del hospital psiquiatrico

Solucion La mejor estima~i6n puntual para la proporci6Il de la poblaci6nes p== 204591 3452 El tamafio de la muestra y hiestimacion de p tienen una magnitud suficiente parajustifKar el empleo de la distribucion norshymal estandar paraelaborar un intervalo de confianza EI coeficiente de corifiabilidad que corresponde alnivel de confianza de 95 es 196 la estimacion del errorestandar (Jp es ~p(l-pgtn = (3452)(6548)591

0 1956El intervalo de confianza para p de acuerdo con estos datos es

3452 plusmn 196(01956) 3452 plusmn 0383 3069 3835

Se puede decir que se tiene 95 por ciento de confianza de que la proporshycionpeste entre 3069 y 3835 ya que al repetir el muestreo casi 95 por ciento de los intervalos construidos en la forma de este intervalo inclushyyen a la proporcion p real Con base en estos resultados se espera con una confianza de 95 por ciento encontrar que entre 3069 y 3835 por ciento de los internados en el hospital psiquiatrico tiene antecedentes de consumo de marihuana bull

Para cada uno de los siguientes ejercicios establezca la interpretacion prictica yprobabilistica de los intervalos que se pide construir Identifique cada componente del intervalo la estimashycion puntual el coeficiente de confiabilidad yel error estandar Explique por que los coefishycientes de confiabilidad no son los misInos para todos los ejercicios

178 CAPITULO 6 ESTIIlACI6N

651 En una investigaci6nde ninos maltratados en pacientes psiquiatricos Brown y Anderson (A-IS) encontraron 166 pacientes en una muestra de 947 con antecedentes de abuso sexual y maltrato flsico Construya un intervalo de confianza de 90 por dento para la proporci6n de la poblaci6n

652 Catania et at (A-14) obtuvieron datos respecto al comportamiento sexual de una muestra de hombres y mujeres solteros con edades entre 20 y 44 residentes en areas geoijfaficas caracshyterizadas por tasas altas de enfermedades de transmision sexual e ingreso a programas de drogas De 1229 encuestados 50 por ciento respondieron que nunca utilizaron preservatishyvos Construya un intervalo de confianza de 95 por ciento para la proporcion de la poblaci6n que nunca utiliza preservativos

653 Rothberg y Lits (A-I 5 ) estudiaron el efecto del estres de la maternidad durante el embarazo en el peso del producto Los individuos eran 86 mujeres blancas con antecedentes de estres que no tenfan faetores de riesgo medico u obstetrico conoddo de peso bajo del producto Los investigadores eneontraron que 128 por dento de las madres estudiadas dieron a luz bebes que cubrfan el criterio de peso bajo Construya un intervalo de confianza de 99 por ciento para la proporci6n de la poblaci6n

654 En una muestra aleatoria simple de 125 varones desempleados quienes desertaron de la escuela preparatoria entre las edades de 16 y 21 anos inclusive 88 declararon que eran consumidores regulares de bebidas alcoh6litas Construya un intervalo de eonfianza de 95 por ciento para la proporcion de la poblacion

66 INTERVALO DE CONFIANZA PARA lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS POBlACIONES

A menudo se tiene interes en conocer la magnitud de la diferencia entre las proporcioshynes de dospoblaciones Es posible que se quiera comparar por ejemplo entre hombres y mujeres dos grupos de edades dos grupos socioecon6micos 0 dos grupos de diagshynostico con respecto a la proporcion que posee alguna caractenstica de interes Un estimador puntual insesgado de la diferencia entre dos proporciones de las poblacioshynes se obtieneal calcular la diferencia de las proporciones de las muestras PI P2 Tal como Se ha visto cuando n1 Yn2 son de gran tamano y las proporciones de la poblacion no estan muy cerca de 0 0 de 1 es posible aplicar el teorema del limite central y utilizar la teona de la distribucion normal para obtener los intervalos de conshyfianza EI error estandar de la estimacion se calcula mediante la siguiente formula

dado que como regIa se desconocen las proporciones de Ia poblacion Un intervashy10 de confianza de 100(1 - a) por ciento para PI P2 se obtiene as

(661)

Es posible interpretar este intervalo desde elpunto de vista probabiHstico y practico

EJERCICIOS 179

EJEMPLO 661

Borst et al (A-16) investigaron la relaci6n de desarrollo del ego edad sexo y diagshyn6stico de suicidio entre los internos adolescentes de la unidad de psiquiatria La muestra consistia en 96 varones y 123 niiias con edades entre 12 y 16 aiios seleccioshynados de entre los internados en la unidad de adolescentes y niiios de un hospital psiquiatrico privado Se reportaron 18 niiios y 60 niiias con intento de suicidio Cons ishyderese el comportamiento de las niiias como el de una muestra aleatoria simple a partir de una poblaci6n similar de niiias y que los j6venes igualmente pueden considerarse como una muestra aleatoria simple extraida de una poblaci6n similar de niiios Para estas dos poblaciones se pretende construir un intervalo de confianshyza de 99 por ciento para la diferencia entre las proporciones de los individuos con intento de suicidio

Soluci6n Las proporciones para las niiias y niiios respectivamente son Pc = 601 123 = A878y PB = 1896 1875 La diferencia entre las proporciones de lasmuestrases Pc PB = 4878 1875 = 3003 El error estandar estimado de la diferenda entre las proporciones de las muestras es

(4878)(5122) (1875)(8125) ---~~-~ +-------shy

123 96

El factor de confiabilidad a partir de la tabla D es 258 de modo que el intervalo de confianza con la f6rmula 661 es

3003 plusmn 258(0602) 14504556

Se dene la confianza de 99 por dento de que para las poblaciones muestteadas la ptopord6n de intentos de suiddio entre las niiias exceshyde a lapropord6n de intentosde suiddio entre los varones por 1450 y 4556

Puesto que el intervalo no incluye al cero se concluye que las dos proporciones de pobladones son diferentes bull

FJERCICIOS

Para cada uno de los siguientes ejercicios establezca las interpretaciones pnicticas y probabishylisticas de los intervalos que se pide construir Identifique cada componente del intervalo la estimaci6n puntual el coeficiente de confiabilidad y el error estandar Explique por que los coeficientes de confiabilidad no son el mismo para todos los ejercicios

661 Hargers et al (A-17) del departamento de Salud PUblica y Ambieptal en Amsterdam condushyjeron un estudio en el que los individuos eran consumidores de drogasinyectables (CDI) En una muestrade 194 consumidores de metadona regular de largo plazo (MLP) 145 eran varones En una muestra de 189 CDIque no consmiddotumian MLP 133 eran varones Establezca las consideraciones necesarias acerca de las muestras ypoblaciones representadas y construshy

180 CAPITULO 6 ESTlMACI6N

ya un intervalo de confianza de 95 por ciemo para la diferenda entre las proporciones de varones en las dos poblaciones

662 Una investigaci6n de Lane et ai (A-I8) valor6las diferencias en las pnicticas de deteccion de cancer de seno entre muestras de mujeres predominantemente de bajos ingresos con edashydes de 50 a 75 anos que lltilizan los servicios de c1inicas de sailld para todo el estado y mlljeres de la misma edad residentes en ciudades donde las c1inicas de salud son locales De las 404 encuestadas seleccionadas en toda la comunidad 592 por ciento estuvo de acuerdo con el siguiente comentario acerca del cancer de pecho las mujeres prolongan su vida si detectan el cancer desde el inicio De entre 795 usuarias de clinicas de salud en la mllestra 449 por ciento estuvo de acuerdo Establezca las suposiciones apropiadas para elaborar un intervalo de confianzade 99 por ciento para la diferencia entre las dos proporciones de las poblaciones de interes

663 Williams et at (A-19) encuestaron a una muestra de 67 medicos y 133 enfermeras con famishyliares farmacodependientes EI prop6sito del estudio era evaluar la influencia en los medishyEOS y enfermeras de estar estrechamente involucrados con una 0 mas personas farmaco dependientes Cincuenta y dos medicos y 89 enfermeras dijeron que vivian con personas farmacoldependientes que adversamente afectaban 8U trabajo E8tablezca todas las consideshyraciones que crea necesarias para construir un intervalo de confianza de 95 por ciento para la diferencia entre las proporciones en las dos poblaciones de trabajadores que se espera esten adversamente afectados por vivir con personas farmacodependientes

664 Aronow y Kronzon (A-20) identificaron los factores de riesgo coronado entre hombres y mujeres en una dinica de cuidados de la salud a largo plazo De los 215 individuos negros 58 tienen diabetes mellitus al igual que 217 individuos blancos de 1140 Elabore un intervalo de confianza de 90 por ciento de confianzapara la diferencia entre las proporciones de las dos poblaciones tCuaies son las poblaciones correspondientes ~Que consideraciones son necesarias para hacer valido el procedimiento de inferencia

67 DETEHMINAUON DEL TAMANO DE LA MUESTRA PARA LA ESTIMACIONDEIAS MEDIAS

La pregunta de que tan grande debe ser una muestra surge inmediatamente al inicio del planteamiento de cualquier encuesta 0 experimento Esta es una pregunshyta importante y no se debe tratara la ligera Tomar una muestra mas grande de 10 necesario para obtener los resultados deseados es un desperdicio de recursos mienshytras que por otro lado las muestras demasiado pequenas con frecuencia dan resulshytados que carecen de uso practico En esta secci6n se estudia c6mo determinar el tamano de la muestra de acuerdo con la situaci6n A continuaci6n se proporciona un metodo para determinar el tamano de la muestra que se requiere para estimar Ia media de la poblaci6n yen la siguiente secci6n se aplica este metodo para detershyminar el tamano de la milestra cuando se desea estimar la proporci6n de una poshyblaci6n Mediante extensiltmes directas de estos metodos es posible determinar el tamano necesario de las muestras para situaciones mas complicadas

Objetivos El objetivo de la estimaci6n porintervalos es el de obtener intervalos estrechos con alta confiabilidad Si se observan los componentes ~e un intervalo de confianzase veque 8U dimension esta determinada por la magnitud de la cantidad

(coeficiente de confiabilidad) x (error estandar)

131 67 DETERMINACION DEL TAMANO PARA LA l-IUESTRAmiddot

ya que lamagnitud total del intervalo de confIanza es eldoble de esta cantidad Se aprendi6 que a esta cantidad generalmente se Ie llama precisi6n de la estimaci6n o margen de error Para un error estandar dado incrementar la confIabilidad signishyfIca un coefIciente con mayor confIabilidad Y un coefIciente con mayor confIabilidad produce unintervalo mas amplio

Por otra parte si se ftia el coefIciente de confIabilidad la unica manera de redudr la amplitud del intervalo es la reducci6n del error estandar Dado que el error estandar es igual a (J IJ y como (J es una constante la unica forma de obtener un error estandar menor es tomar una muestra grande ~Que tan grande debeser la muestra Esto depende del tamafio de (J la desviad6n estandar de la poblaci6n asi como del grado de confIabilidad y dimensi6n del intervalo deseados

Suponga que se desea obtener un intervalo que se extienda d unidades hacia uno y otro lado del estimador Ellose enuncia

d (coefIciente de confIabilidad) X (error estandar) (671)

Si el muestreo es con reemplazos a partir de una poblaci6n infInita 0 de una que sea 10 sufIcientemente grande como para ignorar la correcci6n por poblaci6n fInita la ecuaci6n 671 se transforma en

(J

d z- (672)-r la cual cuando se despeja n nos da

(673)d2

Cuando el nmestreo se hacesin reemplazos a partir de una poblaci6n fInita y peshyquefia se requiere de la correcci6n por poblaci6n fInita y la ecuaci6n 671 se transforma en

(J~d (674)fN~

que al despejar n resulta en

n-----shy (675)d 2(N 1) + Z2(J2

Si puede omitirse la correcci6n por poblad6n fInita la ecuaci6n 675 se reshyduce a la ecuaci6n 673

Estillluci6n de (J 2 Las f6rmulas para el tamafio de la muestra requieren del conocimiento de (J2 pero como ya se ha sefialado la varian cia de la poblaci6n casi

132 CAPITULO 6 ESTlMACION

siempre sedesconoce Como resultado esnecesarioestimar (J2 Las fuentes de estishymaci6n de(J2 que se utilizan con mas frecuencia son las siguientes

1 Se extrae una muestrapilato 0 prel~l11inar de lapoblaci6n y se puede utilizar la variancia calculada a partir de esta muestra como unaestimaci6n de (J2 Las observaciones uti lizadas en la muestra piloto se toman como parte de la muesshytrafinal de modo que n (el tamaiio calculado de la muestra) n

1 (el tamaiio

de la muestra piloto) n2 (el numero de observaciones necesarias para satisfacer el requerimiento total del tamaiio de la muestra)

2 A partir de estudios anteriores osimilares es posible obtener estimaciones de (J2

3Si se cree que la poblaci6n de lacual se extrae la muestraposee una distribushyci6n aproximadamente nqrmal se puede aprovechar el hecho de que la amshyplitud es aproximadamente igual a 6 desviaciones estandar y calcular (J R6 Este metodo requiere aIglin conocimiento acerca de los valores minimo y maximo de la variable en la poblaci6n

EJEMPLO 671

Un nutri6logo del departamento de salud al efectuar una encuesta entre una poshyblacien de muchachas adolescentes con e1 fin de determinitr su ingesti6n diaria promedio de proteinas (medidas en gramos) busc6 el consejo de un bioestadistico con respecto al tamaiio de la muestra que deberfa tomar

~Que procedimiento debe seguir el bioestadistico para asesorar al nutri610go Antes de que el estadistico pueda ayudar el nutri6logo este debe proporcionar tres elementos de informaci6n h dimensi6n deseada del intervalo de confianza el nivel de confianza deseado y la magnitud de la variancia de la poblaci6n

Soludon Suponga que el nutri6logo requiere un intervalo con una dimensi6n de aprQximadamente 10 gramos es decir la estimaci6n se deberfa enconshytrar alrededor de 5 gramos de la media de la poblaci6n en ambas direcshyciones En otras palabras se desea un margen de error de 5 gramos Suponga que se decide por un coeficiente de confian7a de 95 y que con base en su experiencia previa el nutri6logo percibe que la desviaci6n estandar de la poblaci6n es probablemente de alrededor de 20 gramos EI estadfstico dispone ya de la informaci6n necesaria para calcular el tamaiio de la muestra z 196 (J = 20 y d 5 Suponga que el tamaiio de la poblaci6n es grande asf queel estadistico puede ignorar la correcshyci6n por poblaci6n finita y utilizar la ecuaci6n 673 Con las sustitucioshynes adecuadas el valor de n se calcula como

Se recomienda que el nutri610go tome una muestra de tamafio 62 AI calcular el tamaiio de una muestra a partir de las ecuaciones 673 0 675 el resultado se redondea al siguiente nurnero entero mayor si los calculosdan un numerocon decimales bull

183 68 DETERMINACION DEL TAl1ANO PARA LAS PROPORCIONES

EJERCICIOS

671 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su hospital Si se desea un intervalo de confianza de 99 por dento con una amplitud de 1 libra ~que tan grande debe ser la muestra de los registros de nacimiento Suponga que un estimashy

dor razonable para (J es 1 libra ~De que tamano debe ser la muestra si el coeficiente de confiabilidad se hace descender a 95

672 El director de la secdon de control dela rabia del departamento de salud publica desea extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso del ano anterior para estimar la edad media de las personas mordidas Requiere un intervalo de confianza de 95 por dento decide utilizar un valor de 25 para d y a partir de estudios anteriores estima que la desviacion estandar de la poblacion esta alrededor de los 15 anos ~Que tan grande debe ser el tamano de la muestra

673 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mglOO ml) de pacientes atendidos en una clinica para diabeticos durante el transcurso de los ultimos 10 anos Determine el numero de registros que el medico debe examinar para obtener un intershyvalo de confianza de 90 por ciento para 11 si la dimension requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varian cia de 60

674 Se deseaestimar la edad media en la que a los padentes de esclerosis multiple se les diagnosshytico el padecimiento por primera vez Se requiere un intervalo de confianza de 95 por dento con una dimension de 10 anos Si la variancia de la poblaci6n es de 90 ~que tan grande debera ser la muestra

68 DETERMINACION DELTAMANO DE lA MUESTRA PARA lA ESIDIACION DE lAS PROPORCIONES

EI metodo para estimar el tamafio de la muestra cuando se requiere estimar la proshyporcion de una poblacion es esencialmente el mismo que se describio para estimar la media de una poblacion Se aprovecha el hecho de que la mitad del intervalo deseashydo d se puede igualar al producto del coeficiente de confiabilidad y el error estandar

Si se supone que el muestreo ha sido hecho de manera aleatoria y que existen condiciones que garanticen que la distribuci6n de psea aproximadamente normal se obtiene la siguiente formula para n cuando el muestreo es con reemplazo cuanshydo se realizaa partir de una poblacion infinita 0 ruando la poblacion muestreada es 10 suficientemente grande como para hacer innecesario el uso de la correcci6n por poblacion finita

n (681)

dondeq = I-p Si la correccion por poblacion finita no puede descartarse la formula adecuashy

da paran es

(682)n d 2 (N -1)+z2pq

euan do N es grande en comparacion con n (es decir n IN 05) se puede pasar por alto la correccion por poblacion finita y la ecuacion 682 se reduce a la ecuacion 681

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

162 CAPiTULO 6 ESTIMACION

Propiedades de la distribucion t La distribuci6n t tiene las siguientes proshypiedades

1 Tiene una media de O

2 Es simetrica con respecto a la media

3 En general tiene una variancia mayor que 1 pero esta tiende a I a medida que aumenta el tamaiio de la muestra Para dfgt 2 la variancia de la distribushyci6n t es dfl(df - 2) donde df representa los grados de libertad En forma alterna puesto que df n - 1 para n gt 3 se puede escribir la variancia de la distribuci6n t como (n l)(n 3)

4 La variable t va de - hasta + 00DO

5 La distribuci6n t es realmente una familia de distribuciones puesto que hay una distribuci6n diferente por cada valor de la muestra de n - 1 que es el divisor que se utiliza para ca1cular S2 Recuerde que n - 1 representa los grados de libertad En la figura 631 se muestran las distribuciones t correspondienshytes a algunos valores de los grados de libertad

6 Comparada con la distribuci6n normal ladistribuci6n t es menos espigada en el centro y tiene colas mas largas En la figura 632 se com para la distribushyci6n t con la distribuci6n normal

7 La distribuci6n t se aproxima ala distribuci6n normal a medida que n - 1 se aproxima al infinito

La distribuci6n t al igual quela distribuci6n normal estandar se ha tabulado ampliamente Una de estas tablas es la tabla E del apendice Tal como se puede apreciar se debe tomar en cuenta eLcoeficiente de confianza y los grados de libershytad cuando se utiliza la tabla de la distribuci6n t

FIGUR- 631 Distribuci6n t para diferentes grados de libertad

-----

163 63 DISTRIBUCION

__ Distribucion normal

- - - Dislribucion I

x

FIGURA 632 Comparaci6n de las distribuciones normal yt

Es posible utilizar el paquete MINITAB para graficar la distribuci6n t (para grados espedficos de libertad) y otras distribuciones Despues de asignar el eje horizontal y las siguientes direcciones en el cuadro de Set Patterned Data seleccioshyne del menu Calc y despues Probability Distributions Utilice el cuadro de diashylogo Plot para generar la grafica

Inlervalos de conJiQllia qllR uJilban fa dislribucion t El procedimien to general para construir interval os de confianza no se ve afectado por la necesidad de utilizar la distribuci6n t en lugar de la distribuci6n normal estandar Aun es necesario usar la relaci6n expresada por

estimador plusmn (coeficiente de confiabiIidad) x (error estandar)

Lo que es diferente es el origen del coeficiente de confiabilidad Este se obtiene a partir de la tabla de la distribucion t en lugar de la tabla de la distribuci6n normal estandar Para ser mas especfficos cuando se obtienen muestras a partir de una distribushycion normal cuya desviaci6n estdndi17 a se desconoce ell OO( 1 - a) por ciento del intervalo de confianza para la media de la poblaci6n J1 estd dado por

(631 )

Es importante aclarar que el requisito para el uso valido de la distribucion t es que la muestra debe ser extrafda de una poblad6n con distribucion normal Sin embarshygo la experiencia ha demostrado que se pueden tolerar desviaciones moderadas de esterequisito Como consecuencia la distribucion t se utiliza incluso cuando se sabe que la poblaci6n original se desvia de la normalidad Lltl mayorfa de los invesshytigadores requieren que al menos pueda sostenerse el supuesto de una distribushyd6n de poblacion en forma de montfculo

EJEMPLO 631

Maureen McCauley (A-I) realiz6 un estudio para evaluar los efectos de un conjunto de instrucciones de mecanica en ellugar de labores sobre el desempeno laboral de obreros jovenes recientemente contratados Se utilizaron dos grupos de individuos elegidos aleatoriamente uno de los grupos para aplicar el experimento y el otro

164 CAPITULO 6 ESTlMACI6N

como grupo de control EI grupo con el que se experimento recibio una hora de capacitacion impartida por un terapeuta ocupacional EI grupo de control no recishybio esta capacitacion Para evaluar el esfuerzo de cada obrero para levan tar bajar jalar y transportar objetos dentro del entorno laboral se utilizo una lista de cotejo para la evaluacion de trabajo mecanico que inclufa criterios de referencia Una tarea bien hecha recibio una calificacion de 1 EI grupo de control formado por 15 individuos alcanzo una calificacion media de 1153 en la evaluacion con una desshyviacion estandar de 3681 Se supone que el grupo de control se comporto como una muestra aleatoria extraida de una poblacion similar de individuos Se pretende utilizar los datos de la muestra para estimar la calificacion media para la poblacion

Soluci6n Se puede utilizar la media de la muestra 1153 como una estimacion puntualde la media de la poblacion sin embargo debido a que se descoshynoce la desviacion estandar de la poblacion se debe considerar que los valores siguen una distribucion aproximadamente normal antes de consshytruir los intervalos de confianza para l Se considera que esta suposicion es razonable y que se necesita un intervalo de confianza de ~or cienshyto el estimador es i y el error estandar es s -r 681 15 =9504 Ahora es necesario conocer el coeficiente de confiabilidad el valor de t asodado al coeficiente de confianza de 95 y a los n 1 = 14 grados de libertad Puesto que el intervalo de confianza de 95 por ciento deja 05 del area bajo la curva de t para dividirse en dos colas iguales se necesita el valor de tala derecha del cual esta el 025 del area Este valor se localiza en la tabla E enla columna encabezada por t

975 bull Este es el valor

para tala izquierda delcual esta 975 del area bajo la curva EI area a la derechade este valor es igual al 025 deseado Ahora sobre la columna de grados de libertad se localiza el numero 14 EI valor para t se encuentra en la interseccion del renglon con la etiqueta 14 y la columna con la etiqueta t975 bull Se encuentra que este valqr para t que representa al coeficiente de confiabilidad es 21448 Finalmente el intervalo de confianza de 95 por ciento se construye como sigue

1153 plusmn 21448(9504) 1153 plusmn 204 949 1357 bull

Este intervalo puede interpretarse con ambos puntos de vista probabiHstico y practico Puede asegurarse en un 95 por dento que 1a media l correcta de la poblacion se encuentra entre 949 y 1357 porque al repetir el muestreo 95 por dento de los intervalos construidos deigual manera incluyen a l

Decidir entre z r t Cuando se obtiene un intervalo de confianza para la media de una poblacion se debe decidir si se utiliza un valor de z6 de t como factor de confiabilidad Para hacer una elecci6n adecuada se debe considerar el tamafto de la muestra si la poblacion muestreada sigue una distribucion normal y si la varian cia de la poblacion es conocida La figura 633 muestra un diagrama de flujo que se puede utilizar para decidir rapidamente si el factor de confiabilidad debe ser Z 0 t

EJERCICIOS 165

EJERCICIOS

Sa aplica al leorema dellfmile central

FIGURA 633 Diagrama de flujo para deddir entre utililizar z y t cuando se hagan inferencias respecto a las medias de la poblaci6n (Para utilizar un procedimiento no parametrico vease el capitulo 13)

Analisis par computadara Si el proposito es construir un intervalo de conshyfianza con el programa MINITAB para la media de la poblacion cuando el estadfsshytico t es el factor de confiabilidad adecuado el comando se inicia con la palabra TINTERVAL Seleccione en Windows I-Sample t desde el menu de Basic Statistics

631 Utilice la distribud6n t para encontrar el factor de confiabilidad para el intervalo de confianshyza basado en los siguientes coeficientes de confianza y tamafiosde las muestras

a b c d

Coefidente de confianza 95 99 90 95 Tamafio de la muestra 15 24 8 30

632 En una investigacion acerca de la dependencia del flujo y volumen de todo el sistema respishyratorio en un grupo de pacientes con enfermedad obstructiva pulmonar cronica conectados a respiradores artificiales Tantucci et ai (A-2) registraron los siguientes valores de linea de

166 CAPITULO 6 ESTIMACION

base del flUjD continuo inspiratDriD (Us) 90 97 103110 104 100 CDnsidere que una muestra aleatDria simple esta cDnfDrmada pDr seis individuDs a partir de una pDblacion que sigue una distribuci6n nDrmal CDn individuDs CDn la misma enfermedad

a) ~Cuat es la estimaci6n puntual de la media de la pDblaci6n

b) ~Cuil es la desviacion estandar de la muestra

c) ~Cultll es la estimacion del error estandar para la media de la muestra

d) CDnstruya un intervalD de cDnfianza de 95 pDr ciento para el flUjD mediD cDntinuD inspishyratDriD de la pDblaci6n

e) ~Cual es la precision de la estimacion

f) Explique la interpretaci6n prDbabilistica para este intervalD de confianza

g) Explique la interpretacion practica para este intervalD de cDnfianza

633 LlDyd y MaillDux (A-3) informaron IDS siguientes datDs acerca del peso de la glandula pituitaria en una muestra de cuatrD ratas de Wistar Furth

media = 90 mg error estandar para la media = 3

FUEJTE Ricardo V Lloyd y Joe Mailloux Analysis ofSshy100 Protein Positive Folliculo Stellate Cells in Rat Pituitary Tissues AmericanJournal ofPathology 133 338-346

a) ~Cual es la desviadon estandar de la muestra

b) CDnstruya un intervalD de confianza de 95 pDr ciento para el peso medio de la glandula pituitaria para una pDblacion similar de ratas

c) ~Que supDsiciDnes se necesitan para que sea validD el intervalo de cDnfianza del inciso b

d) ~Que interpretacion puede ser la mas indicada cuandD se trata sDbre intervalos de conshyfianzacon alguien que no sabe de estadfstica Explique pDrque es la mas cDnveniente

e) 5i fuera necesario elabDrar un intervalD de cDnfianza de 90 pDr cientD para la media de la pDblaci6n ~el intervalD de cDnfianza serta mayDr 0 menor que el intervalD de 95 pDr dentD Explique su respuesta sin construir realmente el intervalD de cDnfianza

f) 5i [uera necesariD considerar un intervalo de CDnfianza de 99 pDr cientDpara lamedia de la poblacion ~el intervalo de cDnfianza serra mayDr 0 menDr que el intervalD de 95 pDr dentD Explique su respuesta sin cDnstruir realmentt el intervalD de cDnfianza

634 Kaminski y Rechberger (A-4) encontrarDn en un estudio sDbre la preeclampsia que la media de la presi6n sistolica sangufnea en 10 mujeres sanas y que no estan embarazadas es de 119 CDn una desviacion estandar de 21

a) 2Cual es el errDr estandar estimadD para la media

b) CDnstruya un intervalD de confianza de 99 pDr cientD para la media de la poblaci6n a partir de la cual puede considerarse que IDS 10 individuos conforman una muestra aleatoria

c) ~CUlil es la precisi6n estimada

d) ~Que consideraciones deben hacerse para comprobar la validez del intervalo de confiahza

635 Unamuestra de 16nifias de 10 afiDS pesan en promediD 715 con una desviacion estandar de 12libras CDnsidere el calculD de intervalDs de cDnfianza de 9095 y 99 pDr ciento para I-L

167 64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS

636 Una muestra aleatoria simple conformada por 16 individuos aparentemente sanos presenta los siguientes valores de arsenico eliminado en la orina (miligramos por dfa)

Individuo Valor Individuo Valor

1 007 9 012 2 030 10 006 3 025 11 010 4 008 12 032 5 030 13 006 6 038 14 009 7 007 15 014 8 005 16 011

Elabore un intervalo de confianza de 95 por ciento para la media de la poblaci6n

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES

En ocasiones se presentan casos en los que se desea estimar 1a diferencia entre 1a media de dos poblaciones A partir de cada poblacion se extrae una muestra aleatoria independiente y de los datos de cada una se calculan las medias muestrales XI y x2

respectivamente En el capitulo anterior se dijo que el estimador XI - x2 ofrece una estimacion insesgada de la diferencia entre las medias de las poblaciones III shy11 2 bull La variancia del estimador es (cr~ n l ) + (cr~ n 2 ) Tambien se menciono que seglin las condiciones la distribucion muestral de XI - x2 puede presentar una distribution al menos aproximadamente normal de modo que en muchos casos se utiliza la teorfa adecuada para las distribuciones normales en el calculo de un intershyvalo de confianza para III - 11 2 bull Cuando se conocen las variancias de la poblacion el intervalo de confianza del 100(1 - ex) por ciento para III - 112 esta dado por

(641)

El anal isis del intervalo de confianza para la diferencia entre las medias poblacionales ofrece informacion util para decidir si es 0 no probable que las medias de las dos poblaciones sean iguales Cuando el intervalo no incluye al cero se dice que el intervalo ofrece evidencia de que las dos poblaciones tienen medias diferentes Cuando el intervalo incluye al cero se dice que las poblaciones pueden tener meshydias iguales

Esto se ilustra a continuacion para el caso donde el muestreo se realiza a partir de una distribucion normal

168 CAPITULO 6 ESTlMACI6N

EJEMPLO 641

A un equipo de investigacion Ie interesa conocer la diferencia entre las concentracioshynes de acido urico en pacientes con y sin el sfndrome de Down En un gran hospital para el tratamiento de pacientes con retardo mental una muestra de 12 individuos con el sindrome presenta una media de XI = 45 mgll00 mL En un hospital general se encontro que una muestra de 15 individuos normales de la misma edad y sexo presenta un nivel medio de x2= 34 Si es razonable suponer que las dos poblaciones de valores muestran una distribucion normal y sus variancias son iguales a 1 y 15 calcule el intervalo de confianza de 95 por ciento para ~l - ~2

Soluci6n Para una estimacion puntual de III 112 se udliza Xl X2= 45 34 11 EI coeficiente de confiabilidad que corresponde a 95 localizado en la tabla D es 196 EI error estandar es

Por 10 tanto el intervalo de confianza de 95 por ciento es

11 plusmn 196(4282) 11plusmn84 26 194

Se dice que se dene una confianza de 95 por ciento de que la difeshyrencia real 111 - 112 este entre 26 y 194 porque en muestreos repetidos 95 por ciento de los intervalos construidos de esa manera incluiria la diferencia entre las medias reales

Puesto que el intervalo no incluye al cero se concluye que las dos poblaciones tienen diferentes medias bull

Muestreo a partir de poblaciones que no signen una distribuci6n ItOrmal La construccion de un intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando el muestreo se realiza a partir de poblaciones no normales se lleva a cabo en la forma descrita en el ejemplo 641 si las muestras n l y n

2 son grandes Una vez mas este es un resultado del teorema del limite central

Si se desconocen las variancias de la poblacion se utili zan las variancias de las muestras para estimarlas

IUEMPLO 642

Motivados por d conocimiento de la existencia de una gran cantidad de textos polemicos que sugieren que el estres la ansiedad y la depresion son dafiinos para el sistema inmunologico Gormanet ai (4-5) condujeron un estudio en el que se conshysider6 a individuos varoneshomosexuales algunos con VIH (virus de inmunodefishyciencia humana) positivo y otros con VIH negativo Los datos fueron registrados con una amplia vltJriedad de mediciones medicas inmunologicas psiquiatricas y neurol6gicas una de las cuales corresponde al numero de celulas CD4+ en la sanshy

64 INTERV ALO DE CONFIANZA PAHALA DIFERENCIA ENTRE DOS MEDIAS 169

gre El numero promedio de celulas CD4+ para middot112 individuos con infecci6n por VIR fue de 4018 con una desviaci6n estandar de 2264 Para los 75 individuos sin la infecci6n por VIR la media y la desviaci6n estandar fueron de 8282 y 2749 respectivamente Se pretende elaborar un intervalo de confianza de 99 por ciento para la diferencia de las medias de las poblaciones

Soluci6n No hay informaci6n con respecto a la forma de la distribuci6n de las celulas CD4+ Sin embargo como el tamafto de las muestras es grande el teorema del limite central asegura que la distribuci6n muestral de las diferencias entre las medias de la muestra siguen una distribuci6n aproxishymadamente normal independientemente de que la distribuci6n de la variable en las poblaciones no siga una distribuci6n normal Se puede utilizar este hecho para justificar el uso de la estadistica z como factor de confiabilidad en la construcci6n del intervalo de confianza Tampoco hay informaci6n acerca de las desviaciones estandar por 10 que puede emplearse las desviaciones estandar de las muestras para estimarlas La estimaci6n puntual para la diferencia entre las medias de las poblacioshynes es la diferencia entre las medias de las muestras 8282 - 4018 = 4264 En la tabla D se encuentra que el factor de confiabilidad es 258 La estimaci6n del error estandar es

s __ = 27492

+ 22642 =382786

Xl-X 75 112

Por la ecuaci6n 641 el intervalo de confianza de 99 por ciento para la diferencia entre las medias de la poblaci6n es

4264 plusmn 258(382786) 3276 5252

Se tiene la seguridad de 99 por ciento de que el promedio de celulas CD4+ en varones con VIR positivo difieren de la media para los varoshynes con VIR negativo por 3276 a 5252 bull

Distribuci6n t y la diferencia entre las medias Cuando no se conocen las variancias y se pretende estimar la diferencia entre las medias de dos poblacioshynes con un intervalo de confianza es posible utilizar la distribuci6n t para suminisshytrar el factor de confiabilidad si se conocen ciertas suposiciones se debe saber 0

suponer de buena fe que las dos poblaciones muestreadas siguen una distribuci6n normal Respecto a las variancias de las poblaciones se debe distinguir entre dos situaciones 1) la situaci6n en la que las variancias son iguales y 2) la situaci6n en la que no 10 son A continuaci6n se consideranambas sitpaciones por separado

Varianciaspoblacifmales iguales Si la suposici6n sobre igualdad de las variancias de las poblaciones esta justificada las dos variancias de las muestras calculadas a partir de las muestras independientes pueden considerarse como estishymaciones de 10 mismo es decir la variancia comun Parece 16gico entonces aproshyvechar este hecho en el anal isis en cuesti6n Esto es precisamente 10 que se hace para establecer una estimaci6n conjunta para la variancia comun Esta variancia se obtiene mediante el caIculo promedio ponderado de las dos variancias de las muesshy

170 CAPITULO 6 ESTlMACI6N

tras Cada variancia de la muestra es ponderada con base en sus grados de libertad Si los tamafios de las muestras son iguales este promedio ponderado es la media aritmetica de las variancias de las dos muestras Si el tamano de las dos muestras es distinto el promedio ponderado aprovecha la informacion adicional proporcionada por la muestra mayor La estimacion con junta se obtiene con la fOrmula

S2 = (nl _1)SI2 + (n2 l)s~ p (642)

+n2 -2nl

Asf la estimacion del error estandar esta dada por

(643)

y el intervalo de confianza de 100(1 a) por ciento para III 112 esta dada por

(644)

El nfunero de grados de libertad utilizado para determinar el valor de t que se usa para construir el intervalo es n

1 + n

2 2 que es el denominador de la ecuacion

642 Este intervalo se interpreta en la forma habitual Los metodos que pueden emplearse para tomar la decision acerca de la igualshy

dad de las variancias de las poblaciones se estudian en la seccion 610 y 78

EJEMPLO 643

Uno de los estudios de Stone et al (A-6) tuvo como objetivo determinar los efectos del ejercicio por un tiempo prolongado en los ejecutivos de una compania inscritos en un programa supervisado de acondicionamiento fisico Se registraron datos de 13 individuos (el grupo deportista) que voluntariamente se inscribieron el programa y que permanecieron activos por 13 anos en promedio y de 17 individuos (el segunshydo grupo el sedentario) que decidieron no inscribirse Entre los datos que se regisshytraron acerca de los individuos esta el mlmero maximo de sentadillas realizadas en 30 segundos El grupo deportista obtuvo una media y una desviacion estandar de 210 y 49 respectivamente La media y la desviacion estandar para el grupo sedenshytario fueron 121 y 56 respectivamente Se considera que las dos poblaciones de medici ones de acondicionamiento muscular siguen una distribuci6n aproxirnadashymente normal y que las variancias para ambas poblacionesson iguales Se pretenshyde elaborar un intervalo de confianza de 95 por ciento para Ja diferencia entre las medias de as poblaciones representadas por las dos muestras Soluci6n Primero se utiliza la ecuaci6n 642 para calcular la estimaci6n conjunta

de la variancia comtin de las poblaciones

(13-1)(49 2 )+(17 1)(562 ) =2821

13+17-2 Cuando se consulta la tabla E con 13 + 17 - 2= 28 grados de libertad y el nivel de confianza de 95 se encuentra que eLfactor de confiabilidad es 20484 Con la ecuacion 644 se calcula el intervalo de confianza de

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS 171

95 por ciento para la diferencia entre las medias de las poblaciones de la siguiente manera

2821 2821(210-121)plusmn20484 --+-shy

13 17 89 plusmn 40085

49129

Se tiene una confianza de 95 por ciento de que la diferencia entre las medias de las poblaciones estan entre 49 y 129 Se puede decir esto porque se sabe quesi se repite el amilisis muchfsimas veces y se calculan los intervalos de confianza de la misma manera cerca de 95 por ciento de los intervalos de confianza induiran la diferencia entre las medias de las poblaciones

Debido a que los intervalos no induyen al cerose conduye que las medias de las poblaciones son diferentes bull

Variancias poblacionales distintas Cuando no se puede conduir que las variancias de dos poblaciones de interes son iguales aun ruando pueda suponerse que las dos poblaciones presentan distribuciones normales no es adecuado utilizar la distribucion t como se acaba de describir para construir los intervalos de confianza

Una solucion al problema de variancias distintas fue propuesta por Behrens (3) y posteriormente fue verificada y generalizada por Fisher (4 5) Neyman (6) Scheffe (7 8) Y Welch (9 10) tambien proponen soluciones EI problema es analizashydo en detalle por Cochran (11)

EI problema gira en tomo al hecho de que la cantidad

no sigue una distribuci6n t con nj + n 2 grados de libertad ruando las variancias 2 shy

de las poblaciones son distintas Consecuentemente la distribucion t no se puede utilizar en la forma habitual pata obtener el factor de confiabilidad del intervalo de confianza para la diferencia entre las medias de dos poblaciones que tienen variancias diferentes La solucion propuesta por Cochran consiste en el calculo del factor de confiabilidad mediante la siguiente formula

wltj + w2tZ t l

f

-0f2 = (645) WI +w2

donde WI 512

np W 2 = s~ n2 tl = tl _ para nj - 1 grados de libertad y t2 = t l

_w2aI2

para n2

- 1 grados de libertad Un intervalo aproximado de confianza del 100(1 shya) por ciento para III - 112 esta dado por

(646)

172

EJERCICIOS

CAPITULO 6 ESTlMACION

FJEIUPLO 644

En la investigacion de Stone et al (A-6) descrita en el ejercicio 643 los investigashydores tambien informaron los siguientes datos de las medici ones referentes a todas las calificaciones del acondicionamiento muscular logradas por los individuos

Muestra n Media Desviaci6n estimdar

Grupo deportista 13 45 3

Grupo sedentario 17 37 10

Se considera que las dos poblaciones de todas las calificaciones de acondicionashymiento muscular siguen una distribuci6n aproximadamente normal Sin embargo no debe suponerse que las dos variancias poblacionales son iguales Se pretende construir un intervalo de confianza de 95 por ciento para la diferencia entre las medias de todas las calificaciones de acondicionamiento muscular para las dos poshyblaciones representadas por las muestras

Soluci6n Se utiliza t de la ecuaci6n 645 para calcular el factor de confiabilidad En la tabla E se muestra que con 12 grados de libertad y 1 - 052 = 975 t( 21788 Analogamente con 16 grados de libertad y 1- 052 = 975 t2 = 21199 Ahora Sf calcula

(3 2 13)(21788) + (102 17)(21199) 139784 t= =

(3 2 13)+(102 17) 065747

=21261

Con la ecuaci6n 646 ahora se construye el intervalo de confianza de 95 por ciento para la diferencia entre las medias de las dos poblaciones

2 2

(45 37)plusmn21261 3 + 10 13 17

8 plusmn 21261 (25641101) 25134

Puesto que el intervalo no incluye acero se concluye que las medias de las dos poblaciones son diferentes bull

Cuando se construyen intervalos de confianza para la diferencia entre las medias de dos poblaciones es posible utilizar la figura 641 para decidir rapidashymente si el factor de confiabilidad debe ser z t 0 tf

Para cada uno de los siguientes ejercicios construya intervalos de confianza de 90 95 y 99 par ciento para las diferencias entre las medias poblacionales Establezca consideraciones que hagan que el metodo sea valido Determine las interpretaciones practica y probabilistica

clJ clJ FIGURA 541 Diagrama de flujo para decidir si e1 factor de confiabilidad debe ser z tot cuando se realizan inferencia inferencias acerca de la diferencia entre las medias de dos pobladones (Para usar un procedimiento no parametrico ver el capitulo 11)

174 CAPiTULO 6 ESTlMACION

para cad a intervalo construido Suponga las variables bajo considerati6n en cad a ejercicio y establezca para que pueden servir a los investigadores esos resultados

641 EI objetivo de un experimento de Buckner et al (A-7) consisti6 en estudiar los efectos del relajamiento muscular inducido por el pancuronium en el volumen del plasma circulante Los individuos estudiados son recien nacidos con un peso mayor a 1700 gramos que necesishytaron de ayuda para respirar durante las primeras 24 horas despues de nacer y cumplieron con otros criterios cHnicos Cinco recien nacidos paraIizados con el pancuronium y siete recien nacidos no tratados presentaron las siguientes estadisticas en la segunda de las tres mediciones del volumen de plasma (ml) hecha durante la respiraci6n mecanica

Paralizados 480 81 No tratados 567 81

La segunda medici6n para el grupo tratado ocurri6 de 12 a 24 horas despues de la primera dosis de pancuronium Para el grupo no tratado las mediciones se hicieron de 12 a 24 horas despues de iniciar la respiracion mecanica

642 Zuckery Archer (A-8) afirman que la N-nitrosobis (2-oxopropyl)amina (BOP) y las nitrosaminas 3-oxidizadas producen una alta incidencia de tumores de conductos pancreaticos en el hamster dorado sirio Estudiaron los efectos en el peso sangufneo en la glucosa del plasma en la insulina yen los niveles de transamina glutamico-oxaloacetica del plasma (GOT) de los hamsters expuestos in vivo a la BOP Los investigadores reportaron los siguientes resultados en ocho animales tratados y 12 sin tratamiento

Variable Sin tratamiento Con tratamiento

Glucosa del plasma (mglgl) 101 plusmn 5 74plusmn 6

FUENTE Peter F Zucker y Michael C Archer Alterations Pancreatic Islet Function Produced by Carcinogenic Nitrosamines in the Syrian Hamster AmericanJournal oPathology 133 573-577

Los datos son la media de la muestra plusmn la estimaci6n del error estandar de la media de la muestra

643 Los objetivos de un estudio de Davis et al (A-g) son evaluar 1) la eficacia del programa auto ayuda momento para dejar de fumar cuando se utiliza con base de uno a uno en el hogar y 2) la viabilidad de ensefiar temicas para abandonar el habito de fumar a los estudiantes de enfermerfa en bachillerato A estudiantes graduados de enfermerfa inscritos en dos cursos de metodologia de la investigacion de la Universidad de Ottawa se les invit6 a participar en el proyecto Se aplic6 un cuestionario de opcion multiple para abandonar el habito de fumar a 120 estudiantes de enfermeria que participaron y a otros 42 estudiantes que no participashyron antes ni despues del estudio Se calcularon las diferencias entre las calificaciones antes y despues del estudio as como las siguientes estadisticas a partir de las diferencias

EJERCICIOS 175

Grupo Media Desviaci6n estandar

Participantes (A) 214444 15392 No participantes (B) 33333 14595

644 El doctor Ali Khraibi (A-IO) de la CHnica y Fundaci6n Mayo condujo una serie de experishymentos con el fin de evaluar las respuestas diureticas y natiureticas de ratas Okamoto esponshytaneamente hipertensivas (REB) y ratas Wistar-Kyoto (WRY) para dirigir incrementos en la presion hidrostatica renal intersticial (PBRI) Para aumentar la PBRI se utiIiz6 la expansi6n directa del volumen renal intersticial (DRIVE) a traves de una matriz implantada cronicamente en el rinOn Entre los datos registrados durante el estudio estan las siguientes mediciones de excreci6n de sodio a traves de la orina (UNa V) durante el periodo de DRIVE

Grupo

REB 632572796483527 2WKY 420469482 108210

FUENTE Publicada con autorizaci6n del Dr Ali A Khraibi

645 Osberg y Di Scala (A-II) realizaron un estudio centrado en la eficacia de los cinturones de seguridad para reducir 1esiones entre sobrevivientes de accidentes automoviHsticos internashydos en hospitales con edades de 4 a 14 afios El estudio compar610s resultados de 123 ninos que utilizaron el cintur6n contra 290 que no 10 utilizaron entre aquellos que se vieton enshyvueltos en tales accidentes y que fueron hospitalizados El informe con tenia la siguiente estadistica del numero de dfas en la unidad de cuidados intensivos

Grupo Media Error estandar estimado

Utiliz6 el cintur6n 83 16 No utiliz6 el cintur6n 139 18

646 La medicion del diametro transversal del coraz6n de hombres y mujeres adultos presenta los siguientes resultados

sx Grupo Tamafto de Ia muestra (cm) (cm)

Varones 12 1321 105 Mujeres 9 IIOO 101

Considere que las poblaciones siguen una distribucion normal con variancias iguales

176 CAPITULO 6 ESTIMACION

647 Veintiruatro animales de laboratorio con deficiencia de vitamina D fueron divididos en dos grupos iguales EI grupo 1 recibi6 un tratamiento consistente en una dieta que proporcionashyba vitamina D EI segundo grupo no fue tratado AI termino del periodo experimental se midieron las concentraciones de calcio ensuero obteniendose los siguientes resultados

Grupo tratado X 111 mg 100 mls = 15 Grupo sin tratamiento x= 78 mg 100 ml s = 20

Considere que las poblaciones siguen una distribuci6n normal con variancias iguales

648 Ados grupos de nifios se les hicieron pruebas de agudeza vi~ual El grupo 1 estuvo formado por 11 nifios que recibieron la atenci6n de medicos privados La calificaci6n media para este grupo fue de 26 con una desviaci6n estandar de 5 El segundogrupo que incluy6 14 nifios que recibieron atenci6n medica por parte del departamento de salud publica tuvo una calishyficaci6n promedio de 21 con una desviaci6n estandar de 6 Suponga que las poblaciones siguen una distribuci6n normal con variancias iguales

649 El tiempo promedio de estancia de una muestra de 20 pacientes dados de alta de un hospital general es de siete dras con una desviaci6n estaildar de dos dras Una muestra de 24 padenshytes dados de alta de un hospital de enfermedades cr6nicas tuvo un tiempo promedio de estancia de 36 dfas con una desviaci6n estindar de 10 dias Suponga que la poblaci6n sigue una distribuci6n normal con variancias desiguales

6410 En un estudio de factores que se consideran responsables de los efectos adversos del tabashyquismo sobre la reproducci6n humana se midieron los niveles de cadmio (nanogramos por gramo) en el tejido de la placenta de una muestra de 14 madres que fumaban y una muestra aleatoria independiente de 18 mujeres no fumadoras Los resultados fueron los siguientes

No fumadoras toO 84 128250 118 98 125 154 235

94251 1952559875 118122150

Fumadoras 300301150241305178168148

134285 175 144 125204

ms probable que el nivel medio de cadmio registrado sea mayor entre las fumadoras que entre las no fumadoras ~Por que se llegarfa a esta conclusi6n

65 INTERVALO DE CONFIANZA PARA IA PROPORCION DE UNA POBIACION

Muchas preguntas de interes para que el tecnico en salud tienen relacion con las proporciones de poblacion ~Que propordon de padentes que redben un tipo espeshycial de tratamiento se recuperan ~Que proporcion de alguna poblacion tiene cierta enfermedad ~Que propordon de una poblacion es inmune a derta enfermedad

Para estimar la proporcion de una poblacion se procede en la misma forma que cuando se estima la media de una poblacion Se extrae una muestra de la poblacion de interes y se calcula su proporcion p Esta se utiliza como el estimador puntual para la proporcion de la pobladon Un intervalo de confianza se obtiene mediante la siguiente formula general

estimador plusmn (coefidente de confiabilidad) X (error estandar)

EJERCICIOS

EJERCICIOS 177

En el capitulo anterior se vio que cuando np y n(1 - p) son mayores que 5 se puede considerar que la distribuci6n muestral de pse aproxima bastante a una distribuci6n normal Cuando se cumple con esta condici6n el coeficiente de confiabilidad es algUn valor de z de la distribuci6n normal estandar Esta visto que el error estandar es igual a (J p =fi(l-p) n Puesto que p que es el parametro que se trata de calcular se desconoce se debe utilizar pcomo una estimaci6n Asf se estima (J j por medio de ~p(l Pn y el intervalo de confianza de 100(1 - 0) por ciento para pesta dado por

pplusmn Z(I-1J2)~P(l- P) Fn (651)

Este intervalo se interpreta tanto desde el punto de vista practico como probabilistico

FJEMPLO 651

Mathers et al (A-12) encontraron queen una muestra de 591 pacientes internados en un hospital psiquiatrico 204 admitieron que consuniieron marihuana al meshynos una vez durante su vida Se pretende construir un intervalo de confianza de 95 por ciento para la proporcion de individuos que consumieron marihuana durante su vida en la poblaci6n muestreada de los internos del hospital psiquiatrico

Solucion La mejor estima~i6n puntual para la proporci6Il de la poblaci6nes p== 204591 3452 El tamafio de la muestra y hiestimacion de p tienen una magnitud suficiente parajustifKar el empleo de la distribucion norshymal estandar paraelaborar un intervalo de confianza EI coeficiente de corifiabilidad que corresponde alnivel de confianza de 95 es 196 la estimacion del errorestandar (Jp es ~p(l-pgtn = (3452)(6548)591

0 1956El intervalo de confianza para p de acuerdo con estos datos es

3452 plusmn 196(01956) 3452 plusmn 0383 3069 3835

Se puede decir que se tiene 95 por ciento de confianza de que la proporshycionpeste entre 3069 y 3835 ya que al repetir el muestreo casi 95 por ciento de los intervalos construidos en la forma de este intervalo inclushyyen a la proporcion p real Con base en estos resultados se espera con una confianza de 95 por ciento encontrar que entre 3069 y 3835 por ciento de los internados en el hospital psiquiatrico tiene antecedentes de consumo de marihuana bull

Para cada uno de los siguientes ejercicios establezca la interpretacion prictica yprobabilistica de los intervalos que se pide construir Identifique cada componente del intervalo la estimashycion puntual el coeficiente de confiabilidad yel error estandar Explique por que los coefishycientes de confiabilidad no son los misInos para todos los ejercicios

178 CAPITULO 6 ESTIIlACI6N

651 En una investigaci6nde ninos maltratados en pacientes psiquiatricos Brown y Anderson (A-IS) encontraron 166 pacientes en una muestra de 947 con antecedentes de abuso sexual y maltrato flsico Construya un intervalo de confianza de 90 por dento para la proporci6n de la poblaci6n

652 Catania et at (A-14) obtuvieron datos respecto al comportamiento sexual de una muestra de hombres y mujeres solteros con edades entre 20 y 44 residentes en areas geoijfaficas caracshyterizadas por tasas altas de enfermedades de transmision sexual e ingreso a programas de drogas De 1229 encuestados 50 por ciento respondieron que nunca utilizaron preservatishyvos Construya un intervalo de confianza de 95 por ciento para la proporcion de la poblaci6n que nunca utiliza preservativos

653 Rothberg y Lits (A-I 5 ) estudiaron el efecto del estres de la maternidad durante el embarazo en el peso del producto Los individuos eran 86 mujeres blancas con antecedentes de estres que no tenfan faetores de riesgo medico u obstetrico conoddo de peso bajo del producto Los investigadores eneontraron que 128 por dento de las madres estudiadas dieron a luz bebes que cubrfan el criterio de peso bajo Construya un intervalo de confianza de 99 por ciento para la proporci6n de la poblaci6n

654 En una muestra aleatoria simple de 125 varones desempleados quienes desertaron de la escuela preparatoria entre las edades de 16 y 21 anos inclusive 88 declararon que eran consumidores regulares de bebidas alcoh6litas Construya un intervalo de eonfianza de 95 por ciento para la proporcion de la poblacion

66 INTERVALO DE CONFIANZA PARA lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS POBlACIONES

A menudo se tiene interes en conocer la magnitud de la diferencia entre las proporcioshynes de dospoblaciones Es posible que se quiera comparar por ejemplo entre hombres y mujeres dos grupos de edades dos grupos socioecon6micos 0 dos grupos de diagshynostico con respecto a la proporcion que posee alguna caractenstica de interes Un estimador puntual insesgado de la diferencia entre dos proporciones de las poblacioshynes se obtieneal calcular la diferencia de las proporciones de las muestras PI P2 Tal como Se ha visto cuando n1 Yn2 son de gran tamano y las proporciones de la poblacion no estan muy cerca de 0 0 de 1 es posible aplicar el teorema del limite central y utilizar la teona de la distribucion normal para obtener los intervalos de conshyfianza EI error estandar de la estimacion se calcula mediante la siguiente formula

dado que como regIa se desconocen las proporciones de Ia poblacion Un intervashy10 de confianza de 100(1 - a) por ciento para PI P2 se obtiene as

(661)

Es posible interpretar este intervalo desde elpunto de vista probabiHstico y practico

EJERCICIOS 179

EJEMPLO 661

Borst et al (A-16) investigaron la relaci6n de desarrollo del ego edad sexo y diagshyn6stico de suicidio entre los internos adolescentes de la unidad de psiquiatria La muestra consistia en 96 varones y 123 niiias con edades entre 12 y 16 aiios seleccioshynados de entre los internados en la unidad de adolescentes y niiios de un hospital psiquiatrico privado Se reportaron 18 niiios y 60 niiias con intento de suicidio Cons ishyderese el comportamiento de las niiias como el de una muestra aleatoria simple a partir de una poblaci6n similar de niiias y que los j6venes igualmente pueden considerarse como una muestra aleatoria simple extraida de una poblaci6n similar de niiios Para estas dos poblaciones se pretende construir un intervalo de confianshyza de 99 por ciento para la diferencia entre las proporciones de los individuos con intento de suicidio

Soluci6n Las proporciones para las niiias y niiios respectivamente son Pc = 601 123 = A878y PB = 1896 1875 La diferencia entre las proporciones de lasmuestrases Pc PB = 4878 1875 = 3003 El error estandar estimado de la diferenda entre las proporciones de las muestras es

(4878)(5122) (1875)(8125) ---~~-~ +-------shy

123 96

El factor de confiabilidad a partir de la tabla D es 258 de modo que el intervalo de confianza con la f6rmula 661 es

3003 plusmn 258(0602) 14504556

Se dene la confianza de 99 por dento de que para las poblaciones muestteadas la ptopord6n de intentos de suiddio entre las niiias exceshyde a lapropord6n de intentosde suiddio entre los varones por 1450 y 4556

Puesto que el intervalo no incluye al cero se concluye que las dos proporciones de pobladones son diferentes bull

FJERCICIOS

Para cada uno de los siguientes ejercicios establezca las interpretaciones pnicticas y probabishylisticas de los intervalos que se pide construir Identifique cada componente del intervalo la estimaci6n puntual el coeficiente de confiabilidad y el error estandar Explique por que los coeficientes de confiabilidad no son el mismo para todos los ejercicios

661 Hargers et al (A-17) del departamento de Salud PUblica y Ambieptal en Amsterdam condushyjeron un estudio en el que los individuos eran consumidores de drogasinyectables (CDI) En una muestrade 194 consumidores de metadona regular de largo plazo (MLP) 145 eran varones En una muestra de 189 CDIque no consmiddotumian MLP 133 eran varones Establezca las consideraciones necesarias acerca de las muestras ypoblaciones representadas y construshy

180 CAPITULO 6 ESTlMACI6N

ya un intervalo de confianza de 95 por ciemo para la diferenda entre las proporciones de varones en las dos poblaciones

662 Una investigaci6n de Lane et ai (A-I8) valor6las diferencias en las pnicticas de deteccion de cancer de seno entre muestras de mujeres predominantemente de bajos ingresos con edashydes de 50 a 75 anos que lltilizan los servicios de c1inicas de sailld para todo el estado y mlljeres de la misma edad residentes en ciudades donde las c1inicas de salud son locales De las 404 encuestadas seleccionadas en toda la comunidad 592 por ciento estuvo de acuerdo con el siguiente comentario acerca del cancer de pecho las mujeres prolongan su vida si detectan el cancer desde el inicio De entre 795 usuarias de clinicas de salud en la mllestra 449 por ciento estuvo de acuerdo Establezca las suposiciones apropiadas para elaborar un intervalo de confianzade 99 por ciento para la diferencia entre las dos proporciones de las poblaciones de interes

663 Williams et at (A-19) encuestaron a una muestra de 67 medicos y 133 enfermeras con famishyliares farmacodependientes EI prop6sito del estudio era evaluar la influencia en los medishyEOS y enfermeras de estar estrechamente involucrados con una 0 mas personas farmaco dependientes Cincuenta y dos medicos y 89 enfermeras dijeron que vivian con personas farmacoldependientes que adversamente afectaban 8U trabajo E8tablezca todas las consideshyraciones que crea necesarias para construir un intervalo de confianza de 95 por ciento para la diferencia entre las proporciones en las dos poblaciones de trabajadores que se espera esten adversamente afectados por vivir con personas farmacodependientes

664 Aronow y Kronzon (A-20) identificaron los factores de riesgo coronado entre hombres y mujeres en una dinica de cuidados de la salud a largo plazo De los 215 individuos negros 58 tienen diabetes mellitus al igual que 217 individuos blancos de 1140 Elabore un intervalo de confianza de 90 por ciento de confianzapara la diferencia entre las proporciones de las dos poblaciones tCuaies son las poblaciones correspondientes ~Que consideraciones son necesarias para hacer valido el procedimiento de inferencia

67 DETEHMINAUON DEL TAMANO DE LA MUESTRA PARA LA ESTIMACIONDEIAS MEDIAS

La pregunta de que tan grande debe ser una muestra surge inmediatamente al inicio del planteamiento de cualquier encuesta 0 experimento Esta es una pregunshyta importante y no se debe tratara la ligera Tomar una muestra mas grande de 10 necesario para obtener los resultados deseados es un desperdicio de recursos mienshytras que por otro lado las muestras demasiado pequenas con frecuencia dan resulshytados que carecen de uso practico En esta secci6n se estudia c6mo determinar el tamano de la muestra de acuerdo con la situaci6n A continuaci6n se proporciona un metodo para determinar el tamano de la muestra que se requiere para estimar Ia media de la poblaci6n yen la siguiente secci6n se aplica este metodo para detershyminar el tamano de la milestra cuando se desea estimar la proporci6n de una poshyblaci6n Mediante extensiltmes directas de estos metodos es posible determinar el tamano necesario de las muestras para situaciones mas complicadas

Objetivos El objetivo de la estimaci6n porintervalos es el de obtener intervalos estrechos con alta confiabilidad Si se observan los componentes ~e un intervalo de confianzase veque 8U dimension esta determinada por la magnitud de la cantidad

(coeficiente de confiabilidad) x (error estandar)

131 67 DETERMINACION DEL TAMANO PARA LA l-IUESTRAmiddot

ya que lamagnitud total del intervalo de confIanza es eldoble de esta cantidad Se aprendi6 que a esta cantidad generalmente se Ie llama precisi6n de la estimaci6n o margen de error Para un error estandar dado incrementar la confIabilidad signishyfIca un coefIciente con mayor confIabilidad Y un coefIciente con mayor confIabilidad produce unintervalo mas amplio

Por otra parte si se ftia el coefIciente de confIabilidad la unica manera de redudr la amplitud del intervalo es la reducci6n del error estandar Dado que el error estandar es igual a (J IJ y como (J es una constante la unica forma de obtener un error estandar menor es tomar una muestra grande ~Que tan grande debeser la muestra Esto depende del tamafio de (J la desviad6n estandar de la poblaci6n asi como del grado de confIabilidad y dimensi6n del intervalo deseados

Suponga que se desea obtener un intervalo que se extienda d unidades hacia uno y otro lado del estimador Ellose enuncia

d (coefIciente de confIabilidad) X (error estandar) (671)

Si el muestreo es con reemplazos a partir de una poblaci6n infInita 0 de una que sea 10 sufIcientemente grande como para ignorar la correcci6n por poblaci6n fInita la ecuaci6n 671 se transforma en

(J

d z- (672)-r la cual cuando se despeja n nos da

(673)d2

Cuando el nmestreo se hacesin reemplazos a partir de una poblaci6n fInita y peshyquefia se requiere de la correcci6n por poblaci6n fInita y la ecuaci6n 671 se transforma en

(J~d (674)fN~

que al despejar n resulta en

n-----shy (675)d 2(N 1) + Z2(J2

Si puede omitirse la correcci6n por poblad6n fInita la ecuaci6n 675 se reshyduce a la ecuaci6n 673

Estillluci6n de (J 2 Las f6rmulas para el tamafio de la muestra requieren del conocimiento de (J2 pero como ya se ha sefialado la varian cia de la poblaci6n casi

132 CAPITULO 6 ESTlMACION

siempre sedesconoce Como resultado esnecesarioestimar (J2 Las fuentes de estishymaci6n de(J2 que se utilizan con mas frecuencia son las siguientes

1 Se extrae una muestrapilato 0 prel~l11inar de lapoblaci6n y se puede utilizar la variancia calculada a partir de esta muestra como unaestimaci6n de (J2 Las observaciones uti lizadas en la muestra piloto se toman como parte de la muesshytrafinal de modo que n (el tamaiio calculado de la muestra) n

1 (el tamaiio

de la muestra piloto) n2 (el numero de observaciones necesarias para satisfacer el requerimiento total del tamaiio de la muestra)

2 A partir de estudios anteriores osimilares es posible obtener estimaciones de (J2

3Si se cree que la poblaci6n de lacual se extrae la muestraposee una distribushyci6n aproximadamente nqrmal se puede aprovechar el hecho de que la amshyplitud es aproximadamente igual a 6 desviaciones estandar y calcular (J R6 Este metodo requiere aIglin conocimiento acerca de los valores minimo y maximo de la variable en la poblaci6n

EJEMPLO 671

Un nutri6logo del departamento de salud al efectuar una encuesta entre una poshyblacien de muchachas adolescentes con e1 fin de determinitr su ingesti6n diaria promedio de proteinas (medidas en gramos) busc6 el consejo de un bioestadistico con respecto al tamaiio de la muestra que deberfa tomar

~Que procedimiento debe seguir el bioestadistico para asesorar al nutri610go Antes de que el estadistico pueda ayudar el nutri6logo este debe proporcionar tres elementos de informaci6n h dimensi6n deseada del intervalo de confianza el nivel de confianza deseado y la magnitud de la variancia de la poblaci6n

Soludon Suponga que el nutri6logo requiere un intervalo con una dimensi6n de aprQximadamente 10 gramos es decir la estimaci6n se deberfa enconshytrar alrededor de 5 gramos de la media de la poblaci6n en ambas direcshyciones En otras palabras se desea un margen de error de 5 gramos Suponga que se decide por un coeficiente de confian7a de 95 y que con base en su experiencia previa el nutri6logo percibe que la desviaci6n estandar de la poblaci6n es probablemente de alrededor de 20 gramos EI estadfstico dispone ya de la informaci6n necesaria para calcular el tamaiio de la muestra z 196 (J = 20 y d 5 Suponga que el tamaiio de la poblaci6n es grande asf queel estadistico puede ignorar la correcshyci6n por poblaci6n finita y utilizar la ecuaci6n 673 Con las sustitucioshynes adecuadas el valor de n se calcula como

Se recomienda que el nutri610go tome una muestra de tamafio 62 AI calcular el tamaiio de una muestra a partir de las ecuaciones 673 0 675 el resultado se redondea al siguiente nurnero entero mayor si los calculosdan un numerocon decimales bull

183 68 DETERMINACION DEL TAl1ANO PARA LAS PROPORCIONES

EJERCICIOS

671 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su hospital Si se desea un intervalo de confianza de 99 por dento con una amplitud de 1 libra ~que tan grande debe ser la muestra de los registros de nacimiento Suponga que un estimashy

dor razonable para (J es 1 libra ~De que tamano debe ser la muestra si el coeficiente de confiabilidad se hace descender a 95

672 El director de la secdon de control dela rabia del departamento de salud publica desea extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso del ano anterior para estimar la edad media de las personas mordidas Requiere un intervalo de confianza de 95 por dento decide utilizar un valor de 25 para d y a partir de estudios anteriores estima que la desviacion estandar de la poblacion esta alrededor de los 15 anos ~Que tan grande debe ser el tamano de la muestra

673 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mglOO ml) de pacientes atendidos en una clinica para diabeticos durante el transcurso de los ultimos 10 anos Determine el numero de registros que el medico debe examinar para obtener un intershyvalo de confianza de 90 por ciento para 11 si la dimension requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varian cia de 60

674 Se deseaestimar la edad media en la que a los padentes de esclerosis multiple se les diagnosshytico el padecimiento por primera vez Se requiere un intervalo de confianza de 95 por dento con una dimension de 10 anos Si la variancia de la poblaci6n es de 90 ~que tan grande debera ser la muestra

68 DETERMINACION DELTAMANO DE lA MUESTRA PARA lA ESIDIACION DE lAS PROPORCIONES

EI metodo para estimar el tamafio de la muestra cuando se requiere estimar la proshyporcion de una poblacion es esencialmente el mismo que se describio para estimar la media de una poblacion Se aprovecha el hecho de que la mitad del intervalo deseashydo d se puede igualar al producto del coeficiente de confiabilidad y el error estandar

Si se supone que el muestreo ha sido hecho de manera aleatoria y que existen condiciones que garanticen que la distribuci6n de psea aproximadamente normal se obtiene la siguiente formula para n cuando el muestreo es con reemplazo cuanshydo se realizaa partir de una poblacion infinita 0 ruando la poblacion muestreada es 10 suficientemente grande como para hacer innecesario el uso de la correcci6n por poblacion finita

n (681)

dondeq = I-p Si la correccion por poblacion finita no puede descartarse la formula adecuashy

da paran es

(682)n d 2 (N -1)+z2pq

euan do N es grande en comparacion con n (es decir n IN 05) se puede pasar por alto la correccion por poblacion finita y la ecuacion 682 se reduce a la ecuacion 681

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

-----

163 63 DISTRIBUCION

__ Distribucion normal

- - - Dislribucion I

x

FIGURA 632 Comparaci6n de las distribuciones normal yt

Es posible utilizar el paquete MINITAB para graficar la distribuci6n t (para grados espedficos de libertad) y otras distribuciones Despues de asignar el eje horizontal y las siguientes direcciones en el cuadro de Set Patterned Data seleccioshyne del menu Calc y despues Probability Distributions Utilice el cuadro de diashylogo Plot para generar la grafica

Inlervalos de conJiQllia qllR uJilban fa dislribucion t El procedimien to general para construir interval os de confianza no se ve afectado por la necesidad de utilizar la distribuci6n t en lugar de la distribuci6n normal estandar Aun es necesario usar la relaci6n expresada por

estimador plusmn (coeficiente de confiabiIidad) x (error estandar)

Lo que es diferente es el origen del coeficiente de confiabilidad Este se obtiene a partir de la tabla de la distribucion t en lugar de la tabla de la distribuci6n normal estandar Para ser mas especfficos cuando se obtienen muestras a partir de una distribushycion normal cuya desviaci6n estdndi17 a se desconoce ell OO( 1 - a) por ciento del intervalo de confianza para la media de la poblaci6n J1 estd dado por

(631 )

Es importante aclarar que el requisito para el uso valido de la distribucion t es que la muestra debe ser extrafda de una poblad6n con distribucion normal Sin embarshygo la experiencia ha demostrado que se pueden tolerar desviaciones moderadas de esterequisito Como consecuencia la distribucion t se utiliza incluso cuando se sabe que la poblaci6n original se desvia de la normalidad Lltl mayorfa de los invesshytigadores requieren que al menos pueda sostenerse el supuesto de una distribushyd6n de poblacion en forma de montfculo

EJEMPLO 631

Maureen McCauley (A-I) realiz6 un estudio para evaluar los efectos de un conjunto de instrucciones de mecanica en ellugar de labores sobre el desempeno laboral de obreros jovenes recientemente contratados Se utilizaron dos grupos de individuos elegidos aleatoriamente uno de los grupos para aplicar el experimento y el otro

164 CAPITULO 6 ESTlMACI6N

como grupo de control EI grupo con el que se experimento recibio una hora de capacitacion impartida por un terapeuta ocupacional EI grupo de control no recishybio esta capacitacion Para evaluar el esfuerzo de cada obrero para levan tar bajar jalar y transportar objetos dentro del entorno laboral se utilizo una lista de cotejo para la evaluacion de trabajo mecanico que inclufa criterios de referencia Una tarea bien hecha recibio una calificacion de 1 EI grupo de control formado por 15 individuos alcanzo una calificacion media de 1153 en la evaluacion con una desshyviacion estandar de 3681 Se supone que el grupo de control se comporto como una muestra aleatoria extraida de una poblacion similar de individuos Se pretende utilizar los datos de la muestra para estimar la calificacion media para la poblacion

Soluci6n Se puede utilizar la media de la muestra 1153 como una estimacion puntualde la media de la poblacion sin embargo debido a que se descoshynoce la desviacion estandar de la poblacion se debe considerar que los valores siguen una distribucion aproximadamente normal antes de consshytruir los intervalos de confianza para l Se considera que esta suposicion es razonable y que se necesita un intervalo de confianza de ~or cienshyto el estimador es i y el error estandar es s -r 681 15 =9504 Ahora es necesario conocer el coeficiente de confiabilidad el valor de t asodado al coeficiente de confianza de 95 y a los n 1 = 14 grados de libertad Puesto que el intervalo de confianza de 95 por ciento deja 05 del area bajo la curva de t para dividirse en dos colas iguales se necesita el valor de tala derecha del cual esta el 025 del area Este valor se localiza en la tabla E enla columna encabezada por t

975 bull Este es el valor

para tala izquierda delcual esta 975 del area bajo la curva EI area a la derechade este valor es igual al 025 deseado Ahora sobre la columna de grados de libertad se localiza el numero 14 EI valor para t se encuentra en la interseccion del renglon con la etiqueta 14 y la columna con la etiqueta t975 bull Se encuentra que este valqr para t que representa al coeficiente de confiabilidad es 21448 Finalmente el intervalo de confianza de 95 por ciento se construye como sigue

1153 plusmn 21448(9504) 1153 plusmn 204 949 1357 bull

Este intervalo puede interpretarse con ambos puntos de vista probabiHstico y practico Puede asegurarse en un 95 por dento que 1a media l correcta de la poblacion se encuentra entre 949 y 1357 porque al repetir el muestreo 95 por dento de los intervalos construidos deigual manera incluyen a l

Decidir entre z r t Cuando se obtiene un intervalo de confianza para la media de una poblacion se debe decidir si se utiliza un valor de z6 de t como factor de confiabilidad Para hacer una elecci6n adecuada se debe considerar el tamafto de la muestra si la poblacion muestreada sigue una distribucion normal y si la varian cia de la poblacion es conocida La figura 633 muestra un diagrama de flujo que se puede utilizar para decidir rapidamente si el factor de confiabilidad debe ser Z 0 t

EJERCICIOS 165

EJERCICIOS

Sa aplica al leorema dellfmile central

FIGURA 633 Diagrama de flujo para deddir entre utililizar z y t cuando se hagan inferencias respecto a las medias de la poblaci6n (Para utilizar un procedimiento no parametrico vease el capitulo 13)

Analisis par computadara Si el proposito es construir un intervalo de conshyfianza con el programa MINITAB para la media de la poblacion cuando el estadfsshytico t es el factor de confiabilidad adecuado el comando se inicia con la palabra TINTERVAL Seleccione en Windows I-Sample t desde el menu de Basic Statistics

631 Utilice la distribud6n t para encontrar el factor de confiabilidad para el intervalo de confianshyza basado en los siguientes coeficientes de confianza y tamafiosde las muestras

a b c d

Coefidente de confianza 95 99 90 95 Tamafio de la muestra 15 24 8 30

632 En una investigacion acerca de la dependencia del flujo y volumen de todo el sistema respishyratorio en un grupo de pacientes con enfermedad obstructiva pulmonar cronica conectados a respiradores artificiales Tantucci et ai (A-2) registraron los siguientes valores de linea de

166 CAPITULO 6 ESTIMACION

base del flUjD continuo inspiratDriD (Us) 90 97 103110 104 100 CDnsidere que una muestra aleatDria simple esta cDnfDrmada pDr seis individuDs a partir de una pDblacion que sigue una distribuci6n nDrmal CDn individuDs CDn la misma enfermedad

a) ~Cuat es la estimaci6n puntual de la media de la pDblaci6n

b) ~Cuil es la desviacion estandar de la muestra

c) ~Cultll es la estimacion del error estandar para la media de la muestra

d) CDnstruya un intervalD de cDnfianza de 95 pDr ciento para el flUjD mediD cDntinuD inspishyratDriD de la pDblaci6n

e) ~Cual es la precision de la estimacion

f) Explique la interpretaci6n prDbabilistica para este intervalD de confianza

g) Explique la interpretacion practica para este intervalD de cDnfianza

633 LlDyd y MaillDux (A-3) informaron IDS siguientes datDs acerca del peso de la glandula pituitaria en una muestra de cuatrD ratas de Wistar Furth

media = 90 mg error estandar para la media = 3

FUEJTE Ricardo V Lloyd y Joe Mailloux Analysis ofSshy100 Protein Positive Folliculo Stellate Cells in Rat Pituitary Tissues AmericanJournal ofPathology 133 338-346

a) ~Cual es la desviadon estandar de la muestra

b) CDnstruya un intervalD de confianza de 95 pDr ciento para el peso medio de la glandula pituitaria para una pDblacion similar de ratas

c) ~Que supDsiciDnes se necesitan para que sea validD el intervalo de cDnfianza del inciso b

d) ~Que interpretacion puede ser la mas indicada cuandD se trata sDbre intervalos de conshyfianzacon alguien que no sabe de estadfstica Explique pDrque es la mas cDnveniente

e) 5i fuera necesario elabDrar un intervalD de cDnfianza de 90 pDr cientD para la media de la pDblaci6n ~el intervalD de cDnfianza serta mayDr 0 menor que el intervalD de 95 pDr dentD Explique su respuesta sin construir realmente el intervalD de cDnfianza

f) 5i [uera necesariD considerar un intervalo de CDnfianza de 99 pDr cientDpara lamedia de la poblacion ~el intervalo de cDnfianza serra mayDr 0 menDr que el intervalD de 95 pDr dentD Explique su respuesta sin cDnstruir realmentt el intervalD de cDnfianza

634 Kaminski y Rechberger (A-4) encontrarDn en un estudio sDbre la preeclampsia que la media de la presi6n sistolica sangufnea en 10 mujeres sanas y que no estan embarazadas es de 119 CDn una desviacion estandar de 21

a) 2Cual es el errDr estandar estimadD para la media

b) CDnstruya un intervalD de confianza de 99 pDr cientD para la media de la poblaci6n a partir de la cual puede considerarse que IDS 10 individuos conforman una muestra aleatoria

c) ~CUlil es la precisi6n estimada

d) ~Que consideraciones deben hacerse para comprobar la validez del intervalo de confiahza

635 Unamuestra de 16nifias de 10 afiDS pesan en promediD 715 con una desviacion estandar de 12libras CDnsidere el calculD de intervalDs de cDnfianza de 9095 y 99 pDr ciento para I-L

167 64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS

636 Una muestra aleatoria simple conformada por 16 individuos aparentemente sanos presenta los siguientes valores de arsenico eliminado en la orina (miligramos por dfa)

Individuo Valor Individuo Valor

1 007 9 012 2 030 10 006 3 025 11 010 4 008 12 032 5 030 13 006 6 038 14 009 7 007 15 014 8 005 16 011

Elabore un intervalo de confianza de 95 por ciento para la media de la poblaci6n

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES

En ocasiones se presentan casos en los que se desea estimar 1a diferencia entre 1a media de dos poblaciones A partir de cada poblacion se extrae una muestra aleatoria independiente y de los datos de cada una se calculan las medias muestrales XI y x2

respectivamente En el capitulo anterior se dijo que el estimador XI - x2 ofrece una estimacion insesgada de la diferencia entre las medias de las poblaciones III shy11 2 bull La variancia del estimador es (cr~ n l ) + (cr~ n 2 ) Tambien se menciono que seglin las condiciones la distribucion muestral de XI - x2 puede presentar una distribution al menos aproximadamente normal de modo que en muchos casos se utiliza la teorfa adecuada para las distribuciones normales en el calculo de un intershyvalo de confianza para III - 11 2 bull Cuando se conocen las variancias de la poblacion el intervalo de confianza del 100(1 - ex) por ciento para III - 112 esta dado por

(641)

El anal isis del intervalo de confianza para la diferencia entre las medias poblacionales ofrece informacion util para decidir si es 0 no probable que las medias de las dos poblaciones sean iguales Cuando el intervalo no incluye al cero se dice que el intervalo ofrece evidencia de que las dos poblaciones tienen medias diferentes Cuando el intervalo incluye al cero se dice que las poblaciones pueden tener meshydias iguales

Esto se ilustra a continuacion para el caso donde el muestreo se realiza a partir de una distribucion normal

168 CAPITULO 6 ESTlMACI6N

EJEMPLO 641

A un equipo de investigacion Ie interesa conocer la diferencia entre las concentracioshynes de acido urico en pacientes con y sin el sfndrome de Down En un gran hospital para el tratamiento de pacientes con retardo mental una muestra de 12 individuos con el sindrome presenta una media de XI = 45 mgll00 mL En un hospital general se encontro que una muestra de 15 individuos normales de la misma edad y sexo presenta un nivel medio de x2= 34 Si es razonable suponer que las dos poblaciones de valores muestran una distribucion normal y sus variancias son iguales a 1 y 15 calcule el intervalo de confianza de 95 por ciento para ~l - ~2

Soluci6n Para una estimacion puntual de III 112 se udliza Xl X2= 45 34 11 EI coeficiente de confiabilidad que corresponde a 95 localizado en la tabla D es 196 EI error estandar es

Por 10 tanto el intervalo de confianza de 95 por ciento es

11 plusmn 196(4282) 11plusmn84 26 194

Se dice que se dene una confianza de 95 por ciento de que la difeshyrencia real 111 - 112 este entre 26 y 194 porque en muestreos repetidos 95 por ciento de los intervalos construidos de esa manera incluiria la diferencia entre las medias reales

Puesto que el intervalo no incluye al cero se concluye que las dos poblaciones tienen diferentes medias bull

Muestreo a partir de poblaciones que no signen una distribuci6n ItOrmal La construccion de un intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando el muestreo se realiza a partir de poblaciones no normales se lleva a cabo en la forma descrita en el ejemplo 641 si las muestras n l y n

2 son grandes Una vez mas este es un resultado del teorema del limite central

Si se desconocen las variancias de la poblacion se utili zan las variancias de las muestras para estimarlas

IUEMPLO 642

Motivados por d conocimiento de la existencia de una gran cantidad de textos polemicos que sugieren que el estres la ansiedad y la depresion son dafiinos para el sistema inmunologico Gormanet ai (4-5) condujeron un estudio en el que se conshysider6 a individuos varoneshomosexuales algunos con VIH (virus de inmunodefishyciencia humana) positivo y otros con VIH negativo Los datos fueron registrados con una amplia vltJriedad de mediciones medicas inmunologicas psiquiatricas y neurol6gicas una de las cuales corresponde al numero de celulas CD4+ en la sanshy

64 INTERV ALO DE CONFIANZA PAHALA DIFERENCIA ENTRE DOS MEDIAS 169

gre El numero promedio de celulas CD4+ para middot112 individuos con infecci6n por VIR fue de 4018 con una desviaci6n estandar de 2264 Para los 75 individuos sin la infecci6n por VIR la media y la desviaci6n estandar fueron de 8282 y 2749 respectivamente Se pretende elaborar un intervalo de confianza de 99 por ciento para la diferencia de las medias de las poblaciones

Soluci6n No hay informaci6n con respecto a la forma de la distribuci6n de las celulas CD4+ Sin embargo como el tamafto de las muestras es grande el teorema del limite central asegura que la distribuci6n muestral de las diferencias entre las medias de la muestra siguen una distribuci6n aproxishymadamente normal independientemente de que la distribuci6n de la variable en las poblaciones no siga una distribuci6n normal Se puede utilizar este hecho para justificar el uso de la estadistica z como factor de confiabilidad en la construcci6n del intervalo de confianza Tampoco hay informaci6n acerca de las desviaciones estandar por 10 que puede emplearse las desviaciones estandar de las muestras para estimarlas La estimaci6n puntual para la diferencia entre las medias de las poblacioshynes es la diferencia entre las medias de las muestras 8282 - 4018 = 4264 En la tabla D se encuentra que el factor de confiabilidad es 258 La estimaci6n del error estandar es

s __ = 27492

+ 22642 =382786

Xl-X 75 112

Por la ecuaci6n 641 el intervalo de confianza de 99 por ciento para la diferencia entre las medias de la poblaci6n es

4264 plusmn 258(382786) 3276 5252

Se tiene la seguridad de 99 por ciento de que el promedio de celulas CD4+ en varones con VIR positivo difieren de la media para los varoshynes con VIR negativo por 3276 a 5252 bull

Distribuci6n t y la diferencia entre las medias Cuando no se conocen las variancias y se pretende estimar la diferencia entre las medias de dos poblacioshynes con un intervalo de confianza es posible utilizar la distribuci6n t para suminisshytrar el factor de confiabilidad si se conocen ciertas suposiciones se debe saber 0

suponer de buena fe que las dos poblaciones muestreadas siguen una distribuci6n normal Respecto a las variancias de las poblaciones se debe distinguir entre dos situaciones 1) la situaci6n en la que las variancias son iguales y 2) la situaci6n en la que no 10 son A continuaci6n se consideranambas sitpaciones por separado

Varianciaspoblacifmales iguales Si la suposici6n sobre igualdad de las variancias de las poblaciones esta justificada las dos variancias de las muestras calculadas a partir de las muestras independientes pueden considerarse como estishymaciones de 10 mismo es decir la variancia comun Parece 16gico entonces aproshyvechar este hecho en el anal isis en cuesti6n Esto es precisamente 10 que se hace para establecer una estimaci6n conjunta para la variancia comun Esta variancia se obtiene mediante el caIculo promedio ponderado de las dos variancias de las muesshy

170 CAPITULO 6 ESTlMACI6N

tras Cada variancia de la muestra es ponderada con base en sus grados de libertad Si los tamafios de las muestras son iguales este promedio ponderado es la media aritmetica de las variancias de las dos muestras Si el tamano de las dos muestras es distinto el promedio ponderado aprovecha la informacion adicional proporcionada por la muestra mayor La estimacion con junta se obtiene con la fOrmula

S2 = (nl _1)SI2 + (n2 l)s~ p (642)

+n2 -2nl

Asf la estimacion del error estandar esta dada por

(643)

y el intervalo de confianza de 100(1 a) por ciento para III 112 esta dada por

(644)

El nfunero de grados de libertad utilizado para determinar el valor de t que se usa para construir el intervalo es n

1 + n

2 2 que es el denominador de la ecuacion

642 Este intervalo se interpreta en la forma habitual Los metodos que pueden emplearse para tomar la decision acerca de la igualshy

dad de las variancias de las poblaciones se estudian en la seccion 610 y 78

EJEMPLO 643

Uno de los estudios de Stone et al (A-6) tuvo como objetivo determinar los efectos del ejercicio por un tiempo prolongado en los ejecutivos de una compania inscritos en un programa supervisado de acondicionamiento fisico Se registraron datos de 13 individuos (el grupo deportista) que voluntariamente se inscribieron el programa y que permanecieron activos por 13 anos en promedio y de 17 individuos (el segunshydo grupo el sedentario) que decidieron no inscribirse Entre los datos que se regisshytraron acerca de los individuos esta el mlmero maximo de sentadillas realizadas en 30 segundos El grupo deportista obtuvo una media y una desviacion estandar de 210 y 49 respectivamente La media y la desviacion estandar para el grupo sedenshytario fueron 121 y 56 respectivamente Se considera que las dos poblaciones de medici ones de acondicionamiento muscular siguen una distribuci6n aproxirnadashymente normal y que las variancias para ambas poblacionesson iguales Se pretenshyde elaborar un intervalo de confianza de 95 por ciento para Ja diferencia entre las medias de as poblaciones representadas por las dos muestras Soluci6n Primero se utiliza la ecuaci6n 642 para calcular la estimaci6n conjunta

de la variancia comtin de las poblaciones

(13-1)(49 2 )+(17 1)(562 ) =2821

13+17-2 Cuando se consulta la tabla E con 13 + 17 - 2= 28 grados de libertad y el nivel de confianza de 95 se encuentra que eLfactor de confiabilidad es 20484 Con la ecuacion 644 se calcula el intervalo de confianza de

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS 171

95 por ciento para la diferencia entre las medias de las poblaciones de la siguiente manera

2821 2821(210-121)plusmn20484 --+-shy

13 17 89 plusmn 40085

49129

Se tiene una confianza de 95 por ciento de que la diferencia entre las medias de las poblaciones estan entre 49 y 129 Se puede decir esto porque se sabe quesi se repite el amilisis muchfsimas veces y se calculan los intervalos de confianza de la misma manera cerca de 95 por ciento de los intervalos de confianza induiran la diferencia entre las medias de las poblaciones

Debido a que los intervalos no induyen al cerose conduye que las medias de las poblaciones son diferentes bull

Variancias poblacionales distintas Cuando no se puede conduir que las variancias de dos poblaciones de interes son iguales aun ruando pueda suponerse que las dos poblaciones presentan distribuciones normales no es adecuado utilizar la distribucion t como se acaba de describir para construir los intervalos de confianza

Una solucion al problema de variancias distintas fue propuesta por Behrens (3) y posteriormente fue verificada y generalizada por Fisher (4 5) Neyman (6) Scheffe (7 8) Y Welch (9 10) tambien proponen soluciones EI problema es analizashydo en detalle por Cochran (11)

EI problema gira en tomo al hecho de que la cantidad

no sigue una distribuci6n t con nj + n 2 grados de libertad ruando las variancias 2 shy

de las poblaciones son distintas Consecuentemente la distribucion t no se puede utilizar en la forma habitual pata obtener el factor de confiabilidad del intervalo de confianza para la diferencia entre las medias de dos poblaciones que tienen variancias diferentes La solucion propuesta por Cochran consiste en el calculo del factor de confiabilidad mediante la siguiente formula

wltj + w2tZ t l

f

-0f2 = (645) WI +w2

donde WI 512

np W 2 = s~ n2 tl = tl _ para nj - 1 grados de libertad y t2 = t l

_w2aI2

para n2

- 1 grados de libertad Un intervalo aproximado de confianza del 100(1 shya) por ciento para III - 112 esta dado por

(646)

172

EJERCICIOS

CAPITULO 6 ESTlMACION

FJEIUPLO 644

En la investigacion de Stone et al (A-6) descrita en el ejercicio 643 los investigashydores tambien informaron los siguientes datos de las medici ones referentes a todas las calificaciones del acondicionamiento muscular logradas por los individuos

Muestra n Media Desviaci6n estimdar

Grupo deportista 13 45 3

Grupo sedentario 17 37 10

Se considera que las dos poblaciones de todas las calificaciones de acondicionashymiento muscular siguen una distribuci6n aproximadamente normal Sin embargo no debe suponerse que las dos variancias poblacionales son iguales Se pretende construir un intervalo de confianza de 95 por ciento para la diferencia entre las medias de todas las calificaciones de acondicionamiento muscular para las dos poshyblaciones representadas por las muestras

Soluci6n Se utiliza t de la ecuaci6n 645 para calcular el factor de confiabilidad En la tabla E se muestra que con 12 grados de libertad y 1 - 052 = 975 t( 21788 Analogamente con 16 grados de libertad y 1- 052 = 975 t2 = 21199 Ahora Sf calcula

(3 2 13)(21788) + (102 17)(21199) 139784 t= =

(3 2 13)+(102 17) 065747

=21261

Con la ecuaci6n 646 ahora se construye el intervalo de confianza de 95 por ciento para la diferencia entre las medias de las dos poblaciones

2 2

(45 37)plusmn21261 3 + 10 13 17

8 plusmn 21261 (25641101) 25134

Puesto que el intervalo no incluye acero se concluye que las medias de las dos poblaciones son diferentes bull

Cuando se construyen intervalos de confianza para la diferencia entre las medias de dos poblaciones es posible utilizar la figura 641 para decidir rapidashymente si el factor de confiabilidad debe ser z t 0 tf

Para cada uno de los siguientes ejercicios construya intervalos de confianza de 90 95 y 99 par ciento para las diferencias entre las medias poblacionales Establezca consideraciones que hagan que el metodo sea valido Determine las interpretaciones practica y probabilistica

clJ clJ FIGURA 541 Diagrama de flujo para decidir si e1 factor de confiabilidad debe ser z tot cuando se realizan inferencia inferencias acerca de la diferencia entre las medias de dos pobladones (Para usar un procedimiento no parametrico ver el capitulo 11)

174 CAPiTULO 6 ESTlMACION

para cad a intervalo construido Suponga las variables bajo considerati6n en cad a ejercicio y establezca para que pueden servir a los investigadores esos resultados

641 EI objetivo de un experimento de Buckner et al (A-7) consisti6 en estudiar los efectos del relajamiento muscular inducido por el pancuronium en el volumen del plasma circulante Los individuos estudiados son recien nacidos con un peso mayor a 1700 gramos que necesishytaron de ayuda para respirar durante las primeras 24 horas despues de nacer y cumplieron con otros criterios cHnicos Cinco recien nacidos paraIizados con el pancuronium y siete recien nacidos no tratados presentaron las siguientes estadisticas en la segunda de las tres mediciones del volumen de plasma (ml) hecha durante la respiraci6n mecanica

Paralizados 480 81 No tratados 567 81

La segunda medici6n para el grupo tratado ocurri6 de 12 a 24 horas despues de la primera dosis de pancuronium Para el grupo no tratado las mediciones se hicieron de 12 a 24 horas despues de iniciar la respiracion mecanica

642 Zuckery Archer (A-8) afirman que la N-nitrosobis (2-oxopropyl)amina (BOP) y las nitrosaminas 3-oxidizadas producen una alta incidencia de tumores de conductos pancreaticos en el hamster dorado sirio Estudiaron los efectos en el peso sangufneo en la glucosa del plasma en la insulina yen los niveles de transamina glutamico-oxaloacetica del plasma (GOT) de los hamsters expuestos in vivo a la BOP Los investigadores reportaron los siguientes resultados en ocho animales tratados y 12 sin tratamiento

Variable Sin tratamiento Con tratamiento

Glucosa del plasma (mglgl) 101 plusmn 5 74plusmn 6

FUENTE Peter F Zucker y Michael C Archer Alterations Pancreatic Islet Function Produced by Carcinogenic Nitrosamines in the Syrian Hamster AmericanJournal oPathology 133 573-577

Los datos son la media de la muestra plusmn la estimaci6n del error estandar de la media de la muestra

643 Los objetivos de un estudio de Davis et al (A-g) son evaluar 1) la eficacia del programa auto ayuda momento para dejar de fumar cuando se utiliza con base de uno a uno en el hogar y 2) la viabilidad de ensefiar temicas para abandonar el habito de fumar a los estudiantes de enfermerfa en bachillerato A estudiantes graduados de enfermerfa inscritos en dos cursos de metodologia de la investigacion de la Universidad de Ottawa se les invit6 a participar en el proyecto Se aplic6 un cuestionario de opcion multiple para abandonar el habito de fumar a 120 estudiantes de enfermeria que participaron y a otros 42 estudiantes que no participashyron antes ni despues del estudio Se calcularon las diferencias entre las calificaciones antes y despues del estudio as como las siguientes estadisticas a partir de las diferencias

EJERCICIOS 175

Grupo Media Desviaci6n estandar

Participantes (A) 214444 15392 No participantes (B) 33333 14595

644 El doctor Ali Khraibi (A-IO) de la CHnica y Fundaci6n Mayo condujo una serie de experishymentos con el fin de evaluar las respuestas diureticas y natiureticas de ratas Okamoto esponshytaneamente hipertensivas (REB) y ratas Wistar-Kyoto (WRY) para dirigir incrementos en la presion hidrostatica renal intersticial (PBRI) Para aumentar la PBRI se utiIiz6 la expansi6n directa del volumen renal intersticial (DRIVE) a traves de una matriz implantada cronicamente en el rinOn Entre los datos registrados durante el estudio estan las siguientes mediciones de excreci6n de sodio a traves de la orina (UNa V) durante el periodo de DRIVE

Grupo

REB 632572796483527 2WKY 420469482 108210

FUENTE Publicada con autorizaci6n del Dr Ali A Khraibi

645 Osberg y Di Scala (A-II) realizaron un estudio centrado en la eficacia de los cinturones de seguridad para reducir 1esiones entre sobrevivientes de accidentes automoviHsticos internashydos en hospitales con edades de 4 a 14 afios El estudio compar610s resultados de 123 ninos que utilizaron el cintur6n contra 290 que no 10 utilizaron entre aquellos que se vieton enshyvueltos en tales accidentes y que fueron hospitalizados El informe con tenia la siguiente estadistica del numero de dfas en la unidad de cuidados intensivos

Grupo Media Error estandar estimado

Utiliz6 el cintur6n 83 16 No utiliz6 el cintur6n 139 18

646 La medicion del diametro transversal del coraz6n de hombres y mujeres adultos presenta los siguientes resultados

sx Grupo Tamafto de Ia muestra (cm) (cm)

Varones 12 1321 105 Mujeres 9 IIOO 101

Considere que las poblaciones siguen una distribucion normal con variancias iguales

176 CAPITULO 6 ESTIMACION

647 Veintiruatro animales de laboratorio con deficiencia de vitamina D fueron divididos en dos grupos iguales EI grupo 1 recibi6 un tratamiento consistente en una dieta que proporcionashyba vitamina D EI segundo grupo no fue tratado AI termino del periodo experimental se midieron las concentraciones de calcio ensuero obteniendose los siguientes resultados

Grupo tratado X 111 mg 100 mls = 15 Grupo sin tratamiento x= 78 mg 100 ml s = 20

Considere que las poblaciones siguen una distribuci6n normal con variancias iguales

648 Ados grupos de nifios se les hicieron pruebas de agudeza vi~ual El grupo 1 estuvo formado por 11 nifios que recibieron la atenci6n de medicos privados La calificaci6n media para este grupo fue de 26 con una desviaci6n estandar de 5 El segundogrupo que incluy6 14 nifios que recibieron atenci6n medica por parte del departamento de salud publica tuvo una calishyficaci6n promedio de 21 con una desviaci6n estandar de 6 Suponga que las poblaciones siguen una distribuci6n normal con variancias iguales

649 El tiempo promedio de estancia de una muestra de 20 pacientes dados de alta de un hospital general es de siete dras con una desviaci6n estaildar de dos dras Una muestra de 24 padenshytes dados de alta de un hospital de enfermedades cr6nicas tuvo un tiempo promedio de estancia de 36 dfas con una desviaci6n estindar de 10 dias Suponga que la poblaci6n sigue una distribuci6n normal con variancias desiguales

6410 En un estudio de factores que se consideran responsables de los efectos adversos del tabashyquismo sobre la reproducci6n humana se midieron los niveles de cadmio (nanogramos por gramo) en el tejido de la placenta de una muestra de 14 madres que fumaban y una muestra aleatoria independiente de 18 mujeres no fumadoras Los resultados fueron los siguientes

No fumadoras toO 84 128250 118 98 125 154 235

94251 1952559875 118122150

Fumadoras 300301150241305178168148

134285 175 144 125204

ms probable que el nivel medio de cadmio registrado sea mayor entre las fumadoras que entre las no fumadoras ~Por que se llegarfa a esta conclusi6n

65 INTERVALO DE CONFIANZA PARA IA PROPORCION DE UNA POBIACION

Muchas preguntas de interes para que el tecnico en salud tienen relacion con las proporciones de poblacion ~Que propordon de padentes que redben un tipo espeshycial de tratamiento se recuperan ~Que proporcion de alguna poblacion tiene cierta enfermedad ~Que propordon de una poblacion es inmune a derta enfermedad

Para estimar la proporcion de una poblacion se procede en la misma forma que cuando se estima la media de una poblacion Se extrae una muestra de la poblacion de interes y se calcula su proporcion p Esta se utiliza como el estimador puntual para la proporcion de la pobladon Un intervalo de confianza se obtiene mediante la siguiente formula general

estimador plusmn (coefidente de confiabilidad) X (error estandar)

EJERCICIOS

EJERCICIOS 177

En el capitulo anterior se vio que cuando np y n(1 - p) son mayores que 5 se puede considerar que la distribuci6n muestral de pse aproxima bastante a una distribuci6n normal Cuando se cumple con esta condici6n el coeficiente de confiabilidad es algUn valor de z de la distribuci6n normal estandar Esta visto que el error estandar es igual a (J p =fi(l-p) n Puesto que p que es el parametro que se trata de calcular se desconoce se debe utilizar pcomo una estimaci6n Asf se estima (J j por medio de ~p(l Pn y el intervalo de confianza de 100(1 - 0) por ciento para pesta dado por

pplusmn Z(I-1J2)~P(l- P) Fn (651)

Este intervalo se interpreta tanto desde el punto de vista practico como probabilistico

FJEMPLO 651

Mathers et al (A-12) encontraron queen una muestra de 591 pacientes internados en un hospital psiquiatrico 204 admitieron que consuniieron marihuana al meshynos una vez durante su vida Se pretende construir un intervalo de confianza de 95 por ciento para la proporcion de individuos que consumieron marihuana durante su vida en la poblaci6n muestreada de los internos del hospital psiquiatrico

Solucion La mejor estima~i6n puntual para la proporci6Il de la poblaci6nes p== 204591 3452 El tamafio de la muestra y hiestimacion de p tienen una magnitud suficiente parajustifKar el empleo de la distribucion norshymal estandar paraelaborar un intervalo de confianza EI coeficiente de corifiabilidad que corresponde alnivel de confianza de 95 es 196 la estimacion del errorestandar (Jp es ~p(l-pgtn = (3452)(6548)591

0 1956El intervalo de confianza para p de acuerdo con estos datos es

3452 plusmn 196(01956) 3452 plusmn 0383 3069 3835

Se puede decir que se tiene 95 por ciento de confianza de que la proporshycionpeste entre 3069 y 3835 ya que al repetir el muestreo casi 95 por ciento de los intervalos construidos en la forma de este intervalo inclushyyen a la proporcion p real Con base en estos resultados se espera con una confianza de 95 por ciento encontrar que entre 3069 y 3835 por ciento de los internados en el hospital psiquiatrico tiene antecedentes de consumo de marihuana bull

Para cada uno de los siguientes ejercicios establezca la interpretacion prictica yprobabilistica de los intervalos que se pide construir Identifique cada componente del intervalo la estimashycion puntual el coeficiente de confiabilidad yel error estandar Explique por que los coefishycientes de confiabilidad no son los misInos para todos los ejercicios

178 CAPITULO 6 ESTIIlACI6N

651 En una investigaci6nde ninos maltratados en pacientes psiquiatricos Brown y Anderson (A-IS) encontraron 166 pacientes en una muestra de 947 con antecedentes de abuso sexual y maltrato flsico Construya un intervalo de confianza de 90 por dento para la proporci6n de la poblaci6n

652 Catania et at (A-14) obtuvieron datos respecto al comportamiento sexual de una muestra de hombres y mujeres solteros con edades entre 20 y 44 residentes en areas geoijfaficas caracshyterizadas por tasas altas de enfermedades de transmision sexual e ingreso a programas de drogas De 1229 encuestados 50 por ciento respondieron que nunca utilizaron preservatishyvos Construya un intervalo de confianza de 95 por ciento para la proporcion de la poblaci6n que nunca utiliza preservativos

653 Rothberg y Lits (A-I 5 ) estudiaron el efecto del estres de la maternidad durante el embarazo en el peso del producto Los individuos eran 86 mujeres blancas con antecedentes de estres que no tenfan faetores de riesgo medico u obstetrico conoddo de peso bajo del producto Los investigadores eneontraron que 128 por dento de las madres estudiadas dieron a luz bebes que cubrfan el criterio de peso bajo Construya un intervalo de confianza de 99 por ciento para la proporci6n de la poblaci6n

654 En una muestra aleatoria simple de 125 varones desempleados quienes desertaron de la escuela preparatoria entre las edades de 16 y 21 anos inclusive 88 declararon que eran consumidores regulares de bebidas alcoh6litas Construya un intervalo de eonfianza de 95 por ciento para la proporcion de la poblacion

66 INTERVALO DE CONFIANZA PARA lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS POBlACIONES

A menudo se tiene interes en conocer la magnitud de la diferencia entre las proporcioshynes de dospoblaciones Es posible que se quiera comparar por ejemplo entre hombres y mujeres dos grupos de edades dos grupos socioecon6micos 0 dos grupos de diagshynostico con respecto a la proporcion que posee alguna caractenstica de interes Un estimador puntual insesgado de la diferencia entre dos proporciones de las poblacioshynes se obtieneal calcular la diferencia de las proporciones de las muestras PI P2 Tal como Se ha visto cuando n1 Yn2 son de gran tamano y las proporciones de la poblacion no estan muy cerca de 0 0 de 1 es posible aplicar el teorema del limite central y utilizar la teona de la distribucion normal para obtener los intervalos de conshyfianza EI error estandar de la estimacion se calcula mediante la siguiente formula

dado que como regIa se desconocen las proporciones de Ia poblacion Un intervashy10 de confianza de 100(1 - a) por ciento para PI P2 se obtiene as

(661)

Es posible interpretar este intervalo desde elpunto de vista probabiHstico y practico

EJERCICIOS 179

EJEMPLO 661

Borst et al (A-16) investigaron la relaci6n de desarrollo del ego edad sexo y diagshyn6stico de suicidio entre los internos adolescentes de la unidad de psiquiatria La muestra consistia en 96 varones y 123 niiias con edades entre 12 y 16 aiios seleccioshynados de entre los internados en la unidad de adolescentes y niiios de un hospital psiquiatrico privado Se reportaron 18 niiios y 60 niiias con intento de suicidio Cons ishyderese el comportamiento de las niiias como el de una muestra aleatoria simple a partir de una poblaci6n similar de niiias y que los j6venes igualmente pueden considerarse como una muestra aleatoria simple extraida de una poblaci6n similar de niiios Para estas dos poblaciones se pretende construir un intervalo de confianshyza de 99 por ciento para la diferencia entre las proporciones de los individuos con intento de suicidio

Soluci6n Las proporciones para las niiias y niiios respectivamente son Pc = 601 123 = A878y PB = 1896 1875 La diferencia entre las proporciones de lasmuestrases Pc PB = 4878 1875 = 3003 El error estandar estimado de la diferenda entre las proporciones de las muestras es

(4878)(5122) (1875)(8125) ---~~-~ +-------shy

123 96

El factor de confiabilidad a partir de la tabla D es 258 de modo que el intervalo de confianza con la f6rmula 661 es

3003 plusmn 258(0602) 14504556

Se dene la confianza de 99 por dento de que para las poblaciones muestteadas la ptopord6n de intentos de suiddio entre las niiias exceshyde a lapropord6n de intentosde suiddio entre los varones por 1450 y 4556

Puesto que el intervalo no incluye al cero se concluye que las dos proporciones de pobladones son diferentes bull

FJERCICIOS

Para cada uno de los siguientes ejercicios establezca las interpretaciones pnicticas y probabishylisticas de los intervalos que se pide construir Identifique cada componente del intervalo la estimaci6n puntual el coeficiente de confiabilidad y el error estandar Explique por que los coeficientes de confiabilidad no son el mismo para todos los ejercicios

661 Hargers et al (A-17) del departamento de Salud PUblica y Ambieptal en Amsterdam condushyjeron un estudio en el que los individuos eran consumidores de drogasinyectables (CDI) En una muestrade 194 consumidores de metadona regular de largo plazo (MLP) 145 eran varones En una muestra de 189 CDIque no consmiddotumian MLP 133 eran varones Establezca las consideraciones necesarias acerca de las muestras ypoblaciones representadas y construshy

180 CAPITULO 6 ESTlMACI6N

ya un intervalo de confianza de 95 por ciemo para la diferenda entre las proporciones de varones en las dos poblaciones

662 Una investigaci6n de Lane et ai (A-I8) valor6las diferencias en las pnicticas de deteccion de cancer de seno entre muestras de mujeres predominantemente de bajos ingresos con edashydes de 50 a 75 anos que lltilizan los servicios de c1inicas de sailld para todo el estado y mlljeres de la misma edad residentes en ciudades donde las c1inicas de salud son locales De las 404 encuestadas seleccionadas en toda la comunidad 592 por ciento estuvo de acuerdo con el siguiente comentario acerca del cancer de pecho las mujeres prolongan su vida si detectan el cancer desde el inicio De entre 795 usuarias de clinicas de salud en la mllestra 449 por ciento estuvo de acuerdo Establezca las suposiciones apropiadas para elaborar un intervalo de confianzade 99 por ciento para la diferencia entre las dos proporciones de las poblaciones de interes

663 Williams et at (A-19) encuestaron a una muestra de 67 medicos y 133 enfermeras con famishyliares farmacodependientes EI prop6sito del estudio era evaluar la influencia en los medishyEOS y enfermeras de estar estrechamente involucrados con una 0 mas personas farmaco dependientes Cincuenta y dos medicos y 89 enfermeras dijeron que vivian con personas farmacoldependientes que adversamente afectaban 8U trabajo E8tablezca todas las consideshyraciones que crea necesarias para construir un intervalo de confianza de 95 por ciento para la diferencia entre las proporciones en las dos poblaciones de trabajadores que se espera esten adversamente afectados por vivir con personas farmacodependientes

664 Aronow y Kronzon (A-20) identificaron los factores de riesgo coronado entre hombres y mujeres en una dinica de cuidados de la salud a largo plazo De los 215 individuos negros 58 tienen diabetes mellitus al igual que 217 individuos blancos de 1140 Elabore un intervalo de confianza de 90 por ciento de confianzapara la diferencia entre las proporciones de las dos poblaciones tCuaies son las poblaciones correspondientes ~Que consideraciones son necesarias para hacer valido el procedimiento de inferencia

67 DETEHMINAUON DEL TAMANO DE LA MUESTRA PARA LA ESTIMACIONDEIAS MEDIAS

La pregunta de que tan grande debe ser una muestra surge inmediatamente al inicio del planteamiento de cualquier encuesta 0 experimento Esta es una pregunshyta importante y no se debe tratara la ligera Tomar una muestra mas grande de 10 necesario para obtener los resultados deseados es un desperdicio de recursos mienshytras que por otro lado las muestras demasiado pequenas con frecuencia dan resulshytados que carecen de uso practico En esta secci6n se estudia c6mo determinar el tamano de la muestra de acuerdo con la situaci6n A continuaci6n se proporciona un metodo para determinar el tamano de la muestra que se requiere para estimar Ia media de la poblaci6n yen la siguiente secci6n se aplica este metodo para detershyminar el tamano de la milestra cuando se desea estimar la proporci6n de una poshyblaci6n Mediante extensiltmes directas de estos metodos es posible determinar el tamano necesario de las muestras para situaciones mas complicadas

Objetivos El objetivo de la estimaci6n porintervalos es el de obtener intervalos estrechos con alta confiabilidad Si se observan los componentes ~e un intervalo de confianzase veque 8U dimension esta determinada por la magnitud de la cantidad

(coeficiente de confiabilidad) x (error estandar)

131 67 DETERMINACION DEL TAMANO PARA LA l-IUESTRAmiddot

ya que lamagnitud total del intervalo de confIanza es eldoble de esta cantidad Se aprendi6 que a esta cantidad generalmente se Ie llama precisi6n de la estimaci6n o margen de error Para un error estandar dado incrementar la confIabilidad signishyfIca un coefIciente con mayor confIabilidad Y un coefIciente con mayor confIabilidad produce unintervalo mas amplio

Por otra parte si se ftia el coefIciente de confIabilidad la unica manera de redudr la amplitud del intervalo es la reducci6n del error estandar Dado que el error estandar es igual a (J IJ y como (J es una constante la unica forma de obtener un error estandar menor es tomar una muestra grande ~Que tan grande debeser la muestra Esto depende del tamafio de (J la desviad6n estandar de la poblaci6n asi como del grado de confIabilidad y dimensi6n del intervalo deseados

Suponga que se desea obtener un intervalo que se extienda d unidades hacia uno y otro lado del estimador Ellose enuncia

d (coefIciente de confIabilidad) X (error estandar) (671)

Si el muestreo es con reemplazos a partir de una poblaci6n infInita 0 de una que sea 10 sufIcientemente grande como para ignorar la correcci6n por poblaci6n fInita la ecuaci6n 671 se transforma en

(J

d z- (672)-r la cual cuando se despeja n nos da

(673)d2

Cuando el nmestreo se hacesin reemplazos a partir de una poblaci6n fInita y peshyquefia se requiere de la correcci6n por poblaci6n fInita y la ecuaci6n 671 se transforma en

(J~d (674)fN~

que al despejar n resulta en

n-----shy (675)d 2(N 1) + Z2(J2

Si puede omitirse la correcci6n por poblad6n fInita la ecuaci6n 675 se reshyduce a la ecuaci6n 673

Estillluci6n de (J 2 Las f6rmulas para el tamafio de la muestra requieren del conocimiento de (J2 pero como ya se ha sefialado la varian cia de la poblaci6n casi

132 CAPITULO 6 ESTlMACION

siempre sedesconoce Como resultado esnecesarioestimar (J2 Las fuentes de estishymaci6n de(J2 que se utilizan con mas frecuencia son las siguientes

1 Se extrae una muestrapilato 0 prel~l11inar de lapoblaci6n y se puede utilizar la variancia calculada a partir de esta muestra como unaestimaci6n de (J2 Las observaciones uti lizadas en la muestra piloto se toman como parte de la muesshytrafinal de modo que n (el tamaiio calculado de la muestra) n

1 (el tamaiio

de la muestra piloto) n2 (el numero de observaciones necesarias para satisfacer el requerimiento total del tamaiio de la muestra)

2 A partir de estudios anteriores osimilares es posible obtener estimaciones de (J2

3Si se cree que la poblaci6n de lacual se extrae la muestraposee una distribushyci6n aproximadamente nqrmal se puede aprovechar el hecho de que la amshyplitud es aproximadamente igual a 6 desviaciones estandar y calcular (J R6 Este metodo requiere aIglin conocimiento acerca de los valores minimo y maximo de la variable en la poblaci6n

EJEMPLO 671

Un nutri6logo del departamento de salud al efectuar una encuesta entre una poshyblacien de muchachas adolescentes con e1 fin de determinitr su ingesti6n diaria promedio de proteinas (medidas en gramos) busc6 el consejo de un bioestadistico con respecto al tamaiio de la muestra que deberfa tomar

~Que procedimiento debe seguir el bioestadistico para asesorar al nutri610go Antes de que el estadistico pueda ayudar el nutri6logo este debe proporcionar tres elementos de informaci6n h dimensi6n deseada del intervalo de confianza el nivel de confianza deseado y la magnitud de la variancia de la poblaci6n

Soludon Suponga que el nutri6logo requiere un intervalo con una dimensi6n de aprQximadamente 10 gramos es decir la estimaci6n se deberfa enconshytrar alrededor de 5 gramos de la media de la poblaci6n en ambas direcshyciones En otras palabras se desea un margen de error de 5 gramos Suponga que se decide por un coeficiente de confian7a de 95 y que con base en su experiencia previa el nutri6logo percibe que la desviaci6n estandar de la poblaci6n es probablemente de alrededor de 20 gramos EI estadfstico dispone ya de la informaci6n necesaria para calcular el tamaiio de la muestra z 196 (J = 20 y d 5 Suponga que el tamaiio de la poblaci6n es grande asf queel estadistico puede ignorar la correcshyci6n por poblaci6n finita y utilizar la ecuaci6n 673 Con las sustitucioshynes adecuadas el valor de n se calcula como

Se recomienda que el nutri610go tome una muestra de tamafio 62 AI calcular el tamaiio de una muestra a partir de las ecuaciones 673 0 675 el resultado se redondea al siguiente nurnero entero mayor si los calculosdan un numerocon decimales bull

183 68 DETERMINACION DEL TAl1ANO PARA LAS PROPORCIONES

EJERCICIOS

671 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su hospital Si se desea un intervalo de confianza de 99 por dento con una amplitud de 1 libra ~que tan grande debe ser la muestra de los registros de nacimiento Suponga que un estimashy

dor razonable para (J es 1 libra ~De que tamano debe ser la muestra si el coeficiente de confiabilidad se hace descender a 95

672 El director de la secdon de control dela rabia del departamento de salud publica desea extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso del ano anterior para estimar la edad media de las personas mordidas Requiere un intervalo de confianza de 95 por dento decide utilizar un valor de 25 para d y a partir de estudios anteriores estima que la desviacion estandar de la poblacion esta alrededor de los 15 anos ~Que tan grande debe ser el tamano de la muestra

673 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mglOO ml) de pacientes atendidos en una clinica para diabeticos durante el transcurso de los ultimos 10 anos Determine el numero de registros que el medico debe examinar para obtener un intershyvalo de confianza de 90 por ciento para 11 si la dimension requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varian cia de 60

674 Se deseaestimar la edad media en la que a los padentes de esclerosis multiple se les diagnosshytico el padecimiento por primera vez Se requiere un intervalo de confianza de 95 por dento con una dimension de 10 anos Si la variancia de la poblaci6n es de 90 ~que tan grande debera ser la muestra

68 DETERMINACION DELTAMANO DE lA MUESTRA PARA lA ESIDIACION DE lAS PROPORCIONES

EI metodo para estimar el tamafio de la muestra cuando se requiere estimar la proshyporcion de una poblacion es esencialmente el mismo que se describio para estimar la media de una poblacion Se aprovecha el hecho de que la mitad del intervalo deseashydo d se puede igualar al producto del coeficiente de confiabilidad y el error estandar

Si se supone que el muestreo ha sido hecho de manera aleatoria y que existen condiciones que garanticen que la distribuci6n de psea aproximadamente normal se obtiene la siguiente formula para n cuando el muestreo es con reemplazo cuanshydo se realizaa partir de una poblacion infinita 0 ruando la poblacion muestreada es 10 suficientemente grande como para hacer innecesario el uso de la correcci6n por poblacion finita

n (681)

dondeq = I-p Si la correccion por poblacion finita no puede descartarse la formula adecuashy

da paran es

(682)n d 2 (N -1)+z2pq

euan do N es grande en comparacion con n (es decir n IN 05) se puede pasar por alto la correccion por poblacion finita y la ecuacion 682 se reduce a la ecuacion 681

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

164 CAPITULO 6 ESTlMACI6N

como grupo de control EI grupo con el que se experimento recibio una hora de capacitacion impartida por un terapeuta ocupacional EI grupo de control no recishybio esta capacitacion Para evaluar el esfuerzo de cada obrero para levan tar bajar jalar y transportar objetos dentro del entorno laboral se utilizo una lista de cotejo para la evaluacion de trabajo mecanico que inclufa criterios de referencia Una tarea bien hecha recibio una calificacion de 1 EI grupo de control formado por 15 individuos alcanzo una calificacion media de 1153 en la evaluacion con una desshyviacion estandar de 3681 Se supone que el grupo de control se comporto como una muestra aleatoria extraida de una poblacion similar de individuos Se pretende utilizar los datos de la muestra para estimar la calificacion media para la poblacion

Soluci6n Se puede utilizar la media de la muestra 1153 como una estimacion puntualde la media de la poblacion sin embargo debido a que se descoshynoce la desviacion estandar de la poblacion se debe considerar que los valores siguen una distribucion aproximadamente normal antes de consshytruir los intervalos de confianza para l Se considera que esta suposicion es razonable y que se necesita un intervalo de confianza de ~or cienshyto el estimador es i y el error estandar es s -r 681 15 =9504 Ahora es necesario conocer el coeficiente de confiabilidad el valor de t asodado al coeficiente de confianza de 95 y a los n 1 = 14 grados de libertad Puesto que el intervalo de confianza de 95 por ciento deja 05 del area bajo la curva de t para dividirse en dos colas iguales se necesita el valor de tala derecha del cual esta el 025 del area Este valor se localiza en la tabla E enla columna encabezada por t

975 bull Este es el valor

para tala izquierda delcual esta 975 del area bajo la curva EI area a la derechade este valor es igual al 025 deseado Ahora sobre la columna de grados de libertad se localiza el numero 14 EI valor para t se encuentra en la interseccion del renglon con la etiqueta 14 y la columna con la etiqueta t975 bull Se encuentra que este valqr para t que representa al coeficiente de confiabilidad es 21448 Finalmente el intervalo de confianza de 95 por ciento se construye como sigue

1153 plusmn 21448(9504) 1153 plusmn 204 949 1357 bull

Este intervalo puede interpretarse con ambos puntos de vista probabiHstico y practico Puede asegurarse en un 95 por dento que 1a media l correcta de la poblacion se encuentra entre 949 y 1357 porque al repetir el muestreo 95 por dento de los intervalos construidos deigual manera incluyen a l

Decidir entre z r t Cuando se obtiene un intervalo de confianza para la media de una poblacion se debe decidir si se utiliza un valor de z6 de t como factor de confiabilidad Para hacer una elecci6n adecuada se debe considerar el tamafto de la muestra si la poblacion muestreada sigue una distribucion normal y si la varian cia de la poblacion es conocida La figura 633 muestra un diagrama de flujo que se puede utilizar para decidir rapidamente si el factor de confiabilidad debe ser Z 0 t

EJERCICIOS 165

EJERCICIOS

Sa aplica al leorema dellfmile central

FIGURA 633 Diagrama de flujo para deddir entre utililizar z y t cuando se hagan inferencias respecto a las medias de la poblaci6n (Para utilizar un procedimiento no parametrico vease el capitulo 13)

Analisis par computadara Si el proposito es construir un intervalo de conshyfianza con el programa MINITAB para la media de la poblacion cuando el estadfsshytico t es el factor de confiabilidad adecuado el comando se inicia con la palabra TINTERVAL Seleccione en Windows I-Sample t desde el menu de Basic Statistics

631 Utilice la distribud6n t para encontrar el factor de confiabilidad para el intervalo de confianshyza basado en los siguientes coeficientes de confianza y tamafiosde las muestras

a b c d

Coefidente de confianza 95 99 90 95 Tamafio de la muestra 15 24 8 30

632 En una investigacion acerca de la dependencia del flujo y volumen de todo el sistema respishyratorio en un grupo de pacientes con enfermedad obstructiva pulmonar cronica conectados a respiradores artificiales Tantucci et ai (A-2) registraron los siguientes valores de linea de

166 CAPITULO 6 ESTIMACION

base del flUjD continuo inspiratDriD (Us) 90 97 103110 104 100 CDnsidere que una muestra aleatDria simple esta cDnfDrmada pDr seis individuDs a partir de una pDblacion que sigue una distribuci6n nDrmal CDn individuDs CDn la misma enfermedad

a) ~Cuat es la estimaci6n puntual de la media de la pDblaci6n

b) ~Cuil es la desviacion estandar de la muestra

c) ~Cultll es la estimacion del error estandar para la media de la muestra

d) CDnstruya un intervalD de cDnfianza de 95 pDr ciento para el flUjD mediD cDntinuD inspishyratDriD de la pDblaci6n

e) ~Cual es la precision de la estimacion

f) Explique la interpretaci6n prDbabilistica para este intervalD de confianza

g) Explique la interpretacion practica para este intervalD de cDnfianza

633 LlDyd y MaillDux (A-3) informaron IDS siguientes datDs acerca del peso de la glandula pituitaria en una muestra de cuatrD ratas de Wistar Furth

media = 90 mg error estandar para la media = 3

FUEJTE Ricardo V Lloyd y Joe Mailloux Analysis ofSshy100 Protein Positive Folliculo Stellate Cells in Rat Pituitary Tissues AmericanJournal ofPathology 133 338-346

a) ~Cual es la desviadon estandar de la muestra

b) CDnstruya un intervalD de confianza de 95 pDr ciento para el peso medio de la glandula pituitaria para una pDblacion similar de ratas

c) ~Que supDsiciDnes se necesitan para que sea validD el intervalo de cDnfianza del inciso b

d) ~Que interpretacion puede ser la mas indicada cuandD se trata sDbre intervalos de conshyfianzacon alguien que no sabe de estadfstica Explique pDrque es la mas cDnveniente

e) 5i fuera necesario elabDrar un intervalD de cDnfianza de 90 pDr cientD para la media de la pDblaci6n ~el intervalD de cDnfianza serta mayDr 0 menor que el intervalD de 95 pDr dentD Explique su respuesta sin construir realmente el intervalD de cDnfianza

f) 5i [uera necesariD considerar un intervalo de CDnfianza de 99 pDr cientDpara lamedia de la poblacion ~el intervalo de cDnfianza serra mayDr 0 menDr que el intervalD de 95 pDr dentD Explique su respuesta sin cDnstruir realmentt el intervalD de cDnfianza

634 Kaminski y Rechberger (A-4) encontrarDn en un estudio sDbre la preeclampsia que la media de la presi6n sistolica sangufnea en 10 mujeres sanas y que no estan embarazadas es de 119 CDn una desviacion estandar de 21

a) 2Cual es el errDr estandar estimadD para la media

b) CDnstruya un intervalD de confianza de 99 pDr cientD para la media de la poblaci6n a partir de la cual puede considerarse que IDS 10 individuos conforman una muestra aleatoria

c) ~CUlil es la precisi6n estimada

d) ~Que consideraciones deben hacerse para comprobar la validez del intervalo de confiahza

635 Unamuestra de 16nifias de 10 afiDS pesan en promediD 715 con una desviacion estandar de 12libras CDnsidere el calculD de intervalDs de cDnfianza de 9095 y 99 pDr ciento para I-L

167 64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS

636 Una muestra aleatoria simple conformada por 16 individuos aparentemente sanos presenta los siguientes valores de arsenico eliminado en la orina (miligramos por dfa)

Individuo Valor Individuo Valor

1 007 9 012 2 030 10 006 3 025 11 010 4 008 12 032 5 030 13 006 6 038 14 009 7 007 15 014 8 005 16 011

Elabore un intervalo de confianza de 95 por ciento para la media de la poblaci6n

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES

En ocasiones se presentan casos en los que se desea estimar 1a diferencia entre 1a media de dos poblaciones A partir de cada poblacion se extrae una muestra aleatoria independiente y de los datos de cada una se calculan las medias muestrales XI y x2

respectivamente En el capitulo anterior se dijo que el estimador XI - x2 ofrece una estimacion insesgada de la diferencia entre las medias de las poblaciones III shy11 2 bull La variancia del estimador es (cr~ n l ) + (cr~ n 2 ) Tambien se menciono que seglin las condiciones la distribucion muestral de XI - x2 puede presentar una distribution al menos aproximadamente normal de modo que en muchos casos se utiliza la teorfa adecuada para las distribuciones normales en el calculo de un intershyvalo de confianza para III - 11 2 bull Cuando se conocen las variancias de la poblacion el intervalo de confianza del 100(1 - ex) por ciento para III - 112 esta dado por

(641)

El anal isis del intervalo de confianza para la diferencia entre las medias poblacionales ofrece informacion util para decidir si es 0 no probable que las medias de las dos poblaciones sean iguales Cuando el intervalo no incluye al cero se dice que el intervalo ofrece evidencia de que las dos poblaciones tienen medias diferentes Cuando el intervalo incluye al cero se dice que las poblaciones pueden tener meshydias iguales

Esto se ilustra a continuacion para el caso donde el muestreo se realiza a partir de una distribucion normal

168 CAPITULO 6 ESTlMACI6N

EJEMPLO 641

A un equipo de investigacion Ie interesa conocer la diferencia entre las concentracioshynes de acido urico en pacientes con y sin el sfndrome de Down En un gran hospital para el tratamiento de pacientes con retardo mental una muestra de 12 individuos con el sindrome presenta una media de XI = 45 mgll00 mL En un hospital general se encontro que una muestra de 15 individuos normales de la misma edad y sexo presenta un nivel medio de x2= 34 Si es razonable suponer que las dos poblaciones de valores muestran una distribucion normal y sus variancias son iguales a 1 y 15 calcule el intervalo de confianza de 95 por ciento para ~l - ~2

Soluci6n Para una estimacion puntual de III 112 se udliza Xl X2= 45 34 11 EI coeficiente de confiabilidad que corresponde a 95 localizado en la tabla D es 196 EI error estandar es

Por 10 tanto el intervalo de confianza de 95 por ciento es

11 plusmn 196(4282) 11plusmn84 26 194

Se dice que se dene una confianza de 95 por ciento de que la difeshyrencia real 111 - 112 este entre 26 y 194 porque en muestreos repetidos 95 por ciento de los intervalos construidos de esa manera incluiria la diferencia entre las medias reales

Puesto que el intervalo no incluye al cero se concluye que las dos poblaciones tienen diferentes medias bull

Muestreo a partir de poblaciones que no signen una distribuci6n ItOrmal La construccion de un intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando el muestreo se realiza a partir de poblaciones no normales se lleva a cabo en la forma descrita en el ejemplo 641 si las muestras n l y n

2 son grandes Una vez mas este es un resultado del teorema del limite central

Si se desconocen las variancias de la poblacion se utili zan las variancias de las muestras para estimarlas

IUEMPLO 642

Motivados por d conocimiento de la existencia de una gran cantidad de textos polemicos que sugieren que el estres la ansiedad y la depresion son dafiinos para el sistema inmunologico Gormanet ai (4-5) condujeron un estudio en el que se conshysider6 a individuos varoneshomosexuales algunos con VIH (virus de inmunodefishyciencia humana) positivo y otros con VIH negativo Los datos fueron registrados con una amplia vltJriedad de mediciones medicas inmunologicas psiquiatricas y neurol6gicas una de las cuales corresponde al numero de celulas CD4+ en la sanshy

64 INTERV ALO DE CONFIANZA PAHALA DIFERENCIA ENTRE DOS MEDIAS 169

gre El numero promedio de celulas CD4+ para middot112 individuos con infecci6n por VIR fue de 4018 con una desviaci6n estandar de 2264 Para los 75 individuos sin la infecci6n por VIR la media y la desviaci6n estandar fueron de 8282 y 2749 respectivamente Se pretende elaborar un intervalo de confianza de 99 por ciento para la diferencia de las medias de las poblaciones

Soluci6n No hay informaci6n con respecto a la forma de la distribuci6n de las celulas CD4+ Sin embargo como el tamafto de las muestras es grande el teorema del limite central asegura que la distribuci6n muestral de las diferencias entre las medias de la muestra siguen una distribuci6n aproxishymadamente normal independientemente de que la distribuci6n de la variable en las poblaciones no siga una distribuci6n normal Se puede utilizar este hecho para justificar el uso de la estadistica z como factor de confiabilidad en la construcci6n del intervalo de confianza Tampoco hay informaci6n acerca de las desviaciones estandar por 10 que puede emplearse las desviaciones estandar de las muestras para estimarlas La estimaci6n puntual para la diferencia entre las medias de las poblacioshynes es la diferencia entre las medias de las muestras 8282 - 4018 = 4264 En la tabla D se encuentra que el factor de confiabilidad es 258 La estimaci6n del error estandar es

s __ = 27492

+ 22642 =382786

Xl-X 75 112

Por la ecuaci6n 641 el intervalo de confianza de 99 por ciento para la diferencia entre las medias de la poblaci6n es

4264 plusmn 258(382786) 3276 5252

Se tiene la seguridad de 99 por ciento de que el promedio de celulas CD4+ en varones con VIR positivo difieren de la media para los varoshynes con VIR negativo por 3276 a 5252 bull

Distribuci6n t y la diferencia entre las medias Cuando no se conocen las variancias y se pretende estimar la diferencia entre las medias de dos poblacioshynes con un intervalo de confianza es posible utilizar la distribuci6n t para suminisshytrar el factor de confiabilidad si se conocen ciertas suposiciones se debe saber 0

suponer de buena fe que las dos poblaciones muestreadas siguen una distribuci6n normal Respecto a las variancias de las poblaciones se debe distinguir entre dos situaciones 1) la situaci6n en la que las variancias son iguales y 2) la situaci6n en la que no 10 son A continuaci6n se consideranambas sitpaciones por separado

Varianciaspoblacifmales iguales Si la suposici6n sobre igualdad de las variancias de las poblaciones esta justificada las dos variancias de las muestras calculadas a partir de las muestras independientes pueden considerarse como estishymaciones de 10 mismo es decir la variancia comun Parece 16gico entonces aproshyvechar este hecho en el anal isis en cuesti6n Esto es precisamente 10 que se hace para establecer una estimaci6n conjunta para la variancia comun Esta variancia se obtiene mediante el caIculo promedio ponderado de las dos variancias de las muesshy

170 CAPITULO 6 ESTlMACI6N

tras Cada variancia de la muestra es ponderada con base en sus grados de libertad Si los tamafios de las muestras son iguales este promedio ponderado es la media aritmetica de las variancias de las dos muestras Si el tamano de las dos muestras es distinto el promedio ponderado aprovecha la informacion adicional proporcionada por la muestra mayor La estimacion con junta se obtiene con la fOrmula

S2 = (nl _1)SI2 + (n2 l)s~ p (642)

+n2 -2nl

Asf la estimacion del error estandar esta dada por

(643)

y el intervalo de confianza de 100(1 a) por ciento para III 112 esta dada por

(644)

El nfunero de grados de libertad utilizado para determinar el valor de t que se usa para construir el intervalo es n

1 + n

2 2 que es el denominador de la ecuacion

642 Este intervalo se interpreta en la forma habitual Los metodos que pueden emplearse para tomar la decision acerca de la igualshy

dad de las variancias de las poblaciones se estudian en la seccion 610 y 78

EJEMPLO 643

Uno de los estudios de Stone et al (A-6) tuvo como objetivo determinar los efectos del ejercicio por un tiempo prolongado en los ejecutivos de una compania inscritos en un programa supervisado de acondicionamiento fisico Se registraron datos de 13 individuos (el grupo deportista) que voluntariamente se inscribieron el programa y que permanecieron activos por 13 anos en promedio y de 17 individuos (el segunshydo grupo el sedentario) que decidieron no inscribirse Entre los datos que se regisshytraron acerca de los individuos esta el mlmero maximo de sentadillas realizadas en 30 segundos El grupo deportista obtuvo una media y una desviacion estandar de 210 y 49 respectivamente La media y la desviacion estandar para el grupo sedenshytario fueron 121 y 56 respectivamente Se considera que las dos poblaciones de medici ones de acondicionamiento muscular siguen una distribuci6n aproxirnadashymente normal y que las variancias para ambas poblacionesson iguales Se pretenshyde elaborar un intervalo de confianza de 95 por ciento para Ja diferencia entre las medias de as poblaciones representadas por las dos muestras Soluci6n Primero se utiliza la ecuaci6n 642 para calcular la estimaci6n conjunta

de la variancia comtin de las poblaciones

(13-1)(49 2 )+(17 1)(562 ) =2821

13+17-2 Cuando se consulta la tabla E con 13 + 17 - 2= 28 grados de libertad y el nivel de confianza de 95 se encuentra que eLfactor de confiabilidad es 20484 Con la ecuacion 644 se calcula el intervalo de confianza de

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS 171

95 por ciento para la diferencia entre las medias de las poblaciones de la siguiente manera

2821 2821(210-121)plusmn20484 --+-shy

13 17 89 plusmn 40085

49129

Se tiene una confianza de 95 por ciento de que la diferencia entre las medias de las poblaciones estan entre 49 y 129 Se puede decir esto porque se sabe quesi se repite el amilisis muchfsimas veces y se calculan los intervalos de confianza de la misma manera cerca de 95 por ciento de los intervalos de confianza induiran la diferencia entre las medias de las poblaciones

Debido a que los intervalos no induyen al cerose conduye que las medias de las poblaciones son diferentes bull

Variancias poblacionales distintas Cuando no se puede conduir que las variancias de dos poblaciones de interes son iguales aun ruando pueda suponerse que las dos poblaciones presentan distribuciones normales no es adecuado utilizar la distribucion t como se acaba de describir para construir los intervalos de confianza

Una solucion al problema de variancias distintas fue propuesta por Behrens (3) y posteriormente fue verificada y generalizada por Fisher (4 5) Neyman (6) Scheffe (7 8) Y Welch (9 10) tambien proponen soluciones EI problema es analizashydo en detalle por Cochran (11)

EI problema gira en tomo al hecho de que la cantidad

no sigue una distribuci6n t con nj + n 2 grados de libertad ruando las variancias 2 shy

de las poblaciones son distintas Consecuentemente la distribucion t no se puede utilizar en la forma habitual pata obtener el factor de confiabilidad del intervalo de confianza para la diferencia entre las medias de dos poblaciones que tienen variancias diferentes La solucion propuesta por Cochran consiste en el calculo del factor de confiabilidad mediante la siguiente formula

wltj + w2tZ t l

f

-0f2 = (645) WI +w2

donde WI 512

np W 2 = s~ n2 tl = tl _ para nj - 1 grados de libertad y t2 = t l

_w2aI2

para n2

- 1 grados de libertad Un intervalo aproximado de confianza del 100(1 shya) por ciento para III - 112 esta dado por

(646)

172

EJERCICIOS

CAPITULO 6 ESTlMACION

FJEIUPLO 644

En la investigacion de Stone et al (A-6) descrita en el ejercicio 643 los investigashydores tambien informaron los siguientes datos de las medici ones referentes a todas las calificaciones del acondicionamiento muscular logradas por los individuos

Muestra n Media Desviaci6n estimdar

Grupo deportista 13 45 3

Grupo sedentario 17 37 10

Se considera que las dos poblaciones de todas las calificaciones de acondicionashymiento muscular siguen una distribuci6n aproximadamente normal Sin embargo no debe suponerse que las dos variancias poblacionales son iguales Se pretende construir un intervalo de confianza de 95 por ciento para la diferencia entre las medias de todas las calificaciones de acondicionamiento muscular para las dos poshyblaciones representadas por las muestras

Soluci6n Se utiliza t de la ecuaci6n 645 para calcular el factor de confiabilidad En la tabla E se muestra que con 12 grados de libertad y 1 - 052 = 975 t( 21788 Analogamente con 16 grados de libertad y 1- 052 = 975 t2 = 21199 Ahora Sf calcula

(3 2 13)(21788) + (102 17)(21199) 139784 t= =

(3 2 13)+(102 17) 065747

=21261

Con la ecuaci6n 646 ahora se construye el intervalo de confianza de 95 por ciento para la diferencia entre las medias de las dos poblaciones

2 2

(45 37)plusmn21261 3 + 10 13 17

8 plusmn 21261 (25641101) 25134

Puesto que el intervalo no incluye acero se concluye que las medias de las dos poblaciones son diferentes bull

Cuando se construyen intervalos de confianza para la diferencia entre las medias de dos poblaciones es posible utilizar la figura 641 para decidir rapidashymente si el factor de confiabilidad debe ser z t 0 tf

Para cada uno de los siguientes ejercicios construya intervalos de confianza de 90 95 y 99 par ciento para las diferencias entre las medias poblacionales Establezca consideraciones que hagan que el metodo sea valido Determine las interpretaciones practica y probabilistica

clJ clJ FIGURA 541 Diagrama de flujo para decidir si e1 factor de confiabilidad debe ser z tot cuando se realizan inferencia inferencias acerca de la diferencia entre las medias de dos pobladones (Para usar un procedimiento no parametrico ver el capitulo 11)

174 CAPiTULO 6 ESTlMACION

para cad a intervalo construido Suponga las variables bajo considerati6n en cad a ejercicio y establezca para que pueden servir a los investigadores esos resultados

641 EI objetivo de un experimento de Buckner et al (A-7) consisti6 en estudiar los efectos del relajamiento muscular inducido por el pancuronium en el volumen del plasma circulante Los individuos estudiados son recien nacidos con un peso mayor a 1700 gramos que necesishytaron de ayuda para respirar durante las primeras 24 horas despues de nacer y cumplieron con otros criterios cHnicos Cinco recien nacidos paraIizados con el pancuronium y siete recien nacidos no tratados presentaron las siguientes estadisticas en la segunda de las tres mediciones del volumen de plasma (ml) hecha durante la respiraci6n mecanica

Paralizados 480 81 No tratados 567 81

La segunda medici6n para el grupo tratado ocurri6 de 12 a 24 horas despues de la primera dosis de pancuronium Para el grupo no tratado las mediciones se hicieron de 12 a 24 horas despues de iniciar la respiracion mecanica

642 Zuckery Archer (A-8) afirman que la N-nitrosobis (2-oxopropyl)amina (BOP) y las nitrosaminas 3-oxidizadas producen una alta incidencia de tumores de conductos pancreaticos en el hamster dorado sirio Estudiaron los efectos en el peso sangufneo en la glucosa del plasma en la insulina yen los niveles de transamina glutamico-oxaloacetica del plasma (GOT) de los hamsters expuestos in vivo a la BOP Los investigadores reportaron los siguientes resultados en ocho animales tratados y 12 sin tratamiento

Variable Sin tratamiento Con tratamiento

Glucosa del plasma (mglgl) 101 plusmn 5 74plusmn 6

FUENTE Peter F Zucker y Michael C Archer Alterations Pancreatic Islet Function Produced by Carcinogenic Nitrosamines in the Syrian Hamster AmericanJournal oPathology 133 573-577

Los datos son la media de la muestra plusmn la estimaci6n del error estandar de la media de la muestra

643 Los objetivos de un estudio de Davis et al (A-g) son evaluar 1) la eficacia del programa auto ayuda momento para dejar de fumar cuando se utiliza con base de uno a uno en el hogar y 2) la viabilidad de ensefiar temicas para abandonar el habito de fumar a los estudiantes de enfermerfa en bachillerato A estudiantes graduados de enfermerfa inscritos en dos cursos de metodologia de la investigacion de la Universidad de Ottawa se les invit6 a participar en el proyecto Se aplic6 un cuestionario de opcion multiple para abandonar el habito de fumar a 120 estudiantes de enfermeria que participaron y a otros 42 estudiantes que no participashyron antes ni despues del estudio Se calcularon las diferencias entre las calificaciones antes y despues del estudio as como las siguientes estadisticas a partir de las diferencias

EJERCICIOS 175

Grupo Media Desviaci6n estandar

Participantes (A) 214444 15392 No participantes (B) 33333 14595

644 El doctor Ali Khraibi (A-IO) de la CHnica y Fundaci6n Mayo condujo una serie de experishymentos con el fin de evaluar las respuestas diureticas y natiureticas de ratas Okamoto esponshytaneamente hipertensivas (REB) y ratas Wistar-Kyoto (WRY) para dirigir incrementos en la presion hidrostatica renal intersticial (PBRI) Para aumentar la PBRI se utiIiz6 la expansi6n directa del volumen renal intersticial (DRIVE) a traves de una matriz implantada cronicamente en el rinOn Entre los datos registrados durante el estudio estan las siguientes mediciones de excreci6n de sodio a traves de la orina (UNa V) durante el periodo de DRIVE

Grupo

REB 632572796483527 2WKY 420469482 108210

FUENTE Publicada con autorizaci6n del Dr Ali A Khraibi

645 Osberg y Di Scala (A-II) realizaron un estudio centrado en la eficacia de los cinturones de seguridad para reducir 1esiones entre sobrevivientes de accidentes automoviHsticos internashydos en hospitales con edades de 4 a 14 afios El estudio compar610s resultados de 123 ninos que utilizaron el cintur6n contra 290 que no 10 utilizaron entre aquellos que se vieton enshyvueltos en tales accidentes y que fueron hospitalizados El informe con tenia la siguiente estadistica del numero de dfas en la unidad de cuidados intensivos

Grupo Media Error estandar estimado

Utiliz6 el cintur6n 83 16 No utiliz6 el cintur6n 139 18

646 La medicion del diametro transversal del coraz6n de hombres y mujeres adultos presenta los siguientes resultados

sx Grupo Tamafto de Ia muestra (cm) (cm)

Varones 12 1321 105 Mujeres 9 IIOO 101

Considere que las poblaciones siguen una distribucion normal con variancias iguales

176 CAPITULO 6 ESTIMACION

647 Veintiruatro animales de laboratorio con deficiencia de vitamina D fueron divididos en dos grupos iguales EI grupo 1 recibi6 un tratamiento consistente en una dieta que proporcionashyba vitamina D EI segundo grupo no fue tratado AI termino del periodo experimental se midieron las concentraciones de calcio ensuero obteniendose los siguientes resultados

Grupo tratado X 111 mg 100 mls = 15 Grupo sin tratamiento x= 78 mg 100 ml s = 20

Considere que las poblaciones siguen una distribuci6n normal con variancias iguales

648 Ados grupos de nifios se les hicieron pruebas de agudeza vi~ual El grupo 1 estuvo formado por 11 nifios que recibieron la atenci6n de medicos privados La calificaci6n media para este grupo fue de 26 con una desviaci6n estandar de 5 El segundogrupo que incluy6 14 nifios que recibieron atenci6n medica por parte del departamento de salud publica tuvo una calishyficaci6n promedio de 21 con una desviaci6n estandar de 6 Suponga que las poblaciones siguen una distribuci6n normal con variancias iguales

649 El tiempo promedio de estancia de una muestra de 20 pacientes dados de alta de un hospital general es de siete dras con una desviaci6n estaildar de dos dras Una muestra de 24 padenshytes dados de alta de un hospital de enfermedades cr6nicas tuvo un tiempo promedio de estancia de 36 dfas con una desviaci6n estindar de 10 dias Suponga que la poblaci6n sigue una distribuci6n normal con variancias desiguales

6410 En un estudio de factores que se consideran responsables de los efectos adversos del tabashyquismo sobre la reproducci6n humana se midieron los niveles de cadmio (nanogramos por gramo) en el tejido de la placenta de una muestra de 14 madres que fumaban y una muestra aleatoria independiente de 18 mujeres no fumadoras Los resultados fueron los siguientes

No fumadoras toO 84 128250 118 98 125 154 235

94251 1952559875 118122150

Fumadoras 300301150241305178168148

134285 175 144 125204

ms probable que el nivel medio de cadmio registrado sea mayor entre las fumadoras que entre las no fumadoras ~Por que se llegarfa a esta conclusi6n

65 INTERVALO DE CONFIANZA PARA IA PROPORCION DE UNA POBIACION

Muchas preguntas de interes para que el tecnico en salud tienen relacion con las proporciones de poblacion ~Que propordon de padentes que redben un tipo espeshycial de tratamiento se recuperan ~Que proporcion de alguna poblacion tiene cierta enfermedad ~Que propordon de una poblacion es inmune a derta enfermedad

Para estimar la proporcion de una poblacion se procede en la misma forma que cuando se estima la media de una poblacion Se extrae una muestra de la poblacion de interes y se calcula su proporcion p Esta se utiliza como el estimador puntual para la proporcion de la pobladon Un intervalo de confianza se obtiene mediante la siguiente formula general

estimador plusmn (coefidente de confiabilidad) X (error estandar)

EJERCICIOS

EJERCICIOS 177

En el capitulo anterior se vio que cuando np y n(1 - p) son mayores que 5 se puede considerar que la distribuci6n muestral de pse aproxima bastante a una distribuci6n normal Cuando se cumple con esta condici6n el coeficiente de confiabilidad es algUn valor de z de la distribuci6n normal estandar Esta visto que el error estandar es igual a (J p =fi(l-p) n Puesto que p que es el parametro que se trata de calcular se desconoce se debe utilizar pcomo una estimaci6n Asf se estima (J j por medio de ~p(l Pn y el intervalo de confianza de 100(1 - 0) por ciento para pesta dado por

pplusmn Z(I-1J2)~P(l- P) Fn (651)

Este intervalo se interpreta tanto desde el punto de vista practico como probabilistico

FJEMPLO 651

Mathers et al (A-12) encontraron queen una muestra de 591 pacientes internados en un hospital psiquiatrico 204 admitieron que consuniieron marihuana al meshynos una vez durante su vida Se pretende construir un intervalo de confianza de 95 por ciento para la proporcion de individuos que consumieron marihuana durante su vida en la poblaci6n muestreada de los internos del hospital psiquiatrico

Solucion La mejor estima~i6n puntual para la proporci6Il de la poblaci6nes p== 204591 3452 El tamafio de la muestra y hiestimacion de p tienen una magnitud suficiente parajustifKar el empleo de la distribucion norshymal estandar paraelaborar un intervalo de confianza EI coeficiente de corifiabilidad que corresponde alnivel de confianza de 95 es 196 la estimacion del errorestandar (Jp es ~p(l-pgtn = (3452)(6548)591

0 1956El intervalo de confianza para p de acuerdo con estos datos es

3452 plusmn 196(01956) 3452 plusmn 0383 3069 3835

Se puede decir que se tiene 95 por ciento de confianza de que la proporshycionpeste entre 3069 y 3835 ya que al repetir el muestreo casi 95 por ciento de los intervalos construidos en la forma de este intervalo inclushyyen a la proporcion p real Con base en estos resultados se espera con una confianza de 95 por ciento encontrar que entre 3069 y 3835 por ciento de los internados en el hospital psiquiatrico tiene antecedentes de consumo de marihuana bull

Para cada uno de los siguientes ejercicios establezca la interpretacion prictica yprobabilistica de los intervalos que se pide construir Identifique cada componente del intervalo la estimashycion puntual el coeficiente de confiabilidad yel error estandar Explique por que los coefishycientes de confiabilidad no son los misInos para todos los ejercicios

178 CAPITULO 6 ESTIIlACI6N

651 En una investigaci6nde ninos maltratados en pacientes psiquiatricos Brown y Anderson (A-IS) encontraron 166 pacientes en una muestra de 947 con antecedentes de abuso sexual y maltrato flsico Construya un intervalo de confianza de 90 por dento para la proporci6n de la poblaci6n

652 Catania et at (A-14) obtuvieron datos respecto al comportamiento sexual de una muestra de hombres y mujeres solteros con edades entre 20 y 44 residentes en areas geoijfaficas caracshyterizadas por tasas altas de enfermedades de transmision sexual e ingreso a programas de drogas De 1229 encuestados 50 por ciento respondieron que nunca utilizaron preservatishyvos Construya un intervalo de confianza de 95 por ciento para la proporcion de la poblaci6n que nunca utiliza preservativos

653 Rothberg y Lits (A-I 5 ) estudiaron el efecto del estres de la maternidad durante el embarazo en el peso del producto Los individuos eran 86 mujeres blancas con antecedentes de estres que no tenfan faetores de riesgo medico u obstetrico conoddo de peso bajo del producto Los investigadores eneontraron que 128 por dento de las madres estudiadas dieron a luz bebes que cubrfan el criterio de peso bajo Construya un intervalo de confianza de 99 por ciento para la proporci6n de la poblaci6n

654 En una muestra aleatoria simple de 125 varones desempleados quienes desertaron de la escuela preparatoria entre las edades de 16 y 21 anos inclusive 88 declararon que eran consumidores regulares de bebidas alcoh6litas Construya un intervalo de eonfianza de 95 por ciento para la proporcion de la poblacion

66 INTERVALO DE CONFIANZA PARA lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS POBlACIONES

A menudo se tiene interes en conocer la magnitud de la diferencia entre las proporcioshynes de dospoblaciones Es posible que se quiera comparar por ejemplo entre hombres y mujeres dos grupos de edades dos grupos socioecon6micos 0 dos grupos de diagshynostico con respecto a la proporcion que posee alguna caractenstica de interes Un estimador puntual insesgado de la diferencia entre dos proporciones de las poblacioshynes se obtieneal calcular la diferencia de las proporciones de las muestras PI P2 Tal como Se ha visto cuando n1 Yn2 son de gran tamano y las proporciones de la poblacion no estan muy cerca de 0 0 de 1 es posible aplicar el teorema del limite central y utilizar la teona de la distribucion normal para obtener los intervalos de conshyfianza EI error estandar de la estimacion se calcula mediante la siguiente formula

dado que como regIa se desconocen las proporciones de Ia poblacion Un intervashy10 de confianza de 100(1 - a) por ciento para PI P2 se obtiene as

(661)

Es posible interpretar este intervalo desde elpunto de vista probabiHstico y practico

EJERCICIOS 179

EJEMPLO 661

Borst et al (A-16) investigaron la relaci6n de desarrollo del ego edad sexo y diagshyn6stico de suicidio entre los internos adolescentes de la unidad de psiquiatria La muestra consistia en 96 varones y 123 niiias con edades entre 12 y 16 aiios seleccioshynados de entre los internados en la unidad de adolescentes y niiios de un hospital psiquiatrico privado Se reportaron 18 niiios y 60 niiias con intento de suicidio Cons ishyderese el comportamiento de las niiias como el de una muestra aleatoria simple a partir de una poblaci6n similar de niiias y que los j6venes igualmente pueden considerarse como una muestra aleatoria simple extraida de una poblaci6n similar de niiios Para estas dos poblaciones se pretende construir un intervalo de confianshyza de 99 por ciento para la diferencia entre las proporciones de los individuos con intento de suicidio

Soluci6n Las proporciones para las niiias y niiios respectivamente son Pc = 601 123 = A878y PB = 1896 1875 La diferencia entre las proporciones de lasmuestrases Pc PB = 4878 1875 = 3003 El error estandar estimado de la diferenda entre las proporciones de las muestras es

(4878)(5122) (1875)(8125) ---~~-~ +-------shy

123 96

El factor de confiabilidad a partir de la tabla D es 258 de modo que el intervalo de confianza con la f6rmula 661 es

3003 plusmn 258(0602) 14504556

Se dene la confianza de 99 por dento de que para las poblaciones muestteadas la ptopord6n de intentos de suiddio entre las niiias exceshyde a lapropord6n de intentosde suiddio entre los varones por 1450 y 4556

Puesto que el intervalo no incluye al cero se concluye que las dos proporciones de pobladones son diferentes bull

FJERCICIOS

Para cada uno de los siguientes ejercicios establezca las interpretaciones pnicticas y probabishylisticas de los intervalos que se pide construir Identifique cada componente del intervalo la estimaci6n puntual el coeficiente de confiabilidad y el error estandar Explique por que los coeficientes de confiabilidad no son el mismo para todos los ejercicios

661 Hargers et al (A-17) del departamento de Salud PUblica y Ambieptal en Amsterdam condushyjeron un estudio en el que los individuos eran consumidores de drogasinyectables (CDI) En una muestrade 194 consumidores de metadona regular de largo plazo (MLP) 145 eran varones En una muestra de 189 CDIque no consmiddotumian MLP 133 eran varones Establezca las consideraciones necesarias acerca de las muestras ypoblaciones representadas y construshy

180 CAPITULO 6 ESTlMACI6N

ya un intervalo de confianza de 95 por ciemo para la diferenda entre las proporciones de varones en las dos poblaciones

662 Una investigaci6n de Lane et ai (A-I8) valor6las diferencias en las pnicticas de deteccion de cancer de seno entre muestras de mujeres predominantemente de bajos ingresos con edashydes de 50 a 75 anos que lltilizan los servicios de c1inicas de sailld para todo el estado y mlljeres de la misma edad residentes en ciudades donde las c1inicas de salud son locales De las 404 encuestadas seleccionadas en toda la comunidad 592 por ciento estuvo de acuerdo con el siguiente comentario acerca del cancer de pecho las mujeres prolongan su vida si detectan el cancer desde el inicio De entre 795 usuarias de clinicas de salud en la mllestra 449 por ciento estuvo de acuerdo Establezca las suposiciones apropiadas para elaborar un intervalo de confianzade 99 por ciento para la diferencia entre las dos proporciones de las poblaciones de interes

663 Williams et at (A-19) encuestaron a una muestra de 67 medicos y 133 enfermeras con famishyliares farmacodependientes EI prop6sito del estudio era evaluar la influencia en los medishyEOS y enfermeras de estar estrechamente involucrados con una 0 mas personas farmaco dependientes Cincuenta y dos medicos y 89 enfermeras dijeron que vivian con personas farmacoldependientes que adversamente afectaban 8U trabajo E8tablezca todas las consideshyraciones que crea necesarias para construir un intervalo de confianza de 95 por ciento para la diferencia entre las proporciones en las dos poblaciones de trabajadores que se espera esten adversamente afectados por vivir con personas farmacodependientes

664 Aronow y Kronzon (A-20) identificaron los factores de riesgo coronado entre hombres y mujeres en una dinica de cuidados de la salud a largo plazo De los 215 individuos negros 58 tienen diabetes mellitus al igual que 217 individuos blancos de 1140 Elabore un intervalo de confianza de 90 por ciento de confianzapara la diferencia entre las proporciones de las dos poblaciones tCuaies son las poblaciones correspondientes ~Que consideraciones son necesarias para hacer valido el procedimiento de inferencia

67 DETEHMINAUON DEL TAMANO DE LA MUESTRA PARA LA ESTIMACIONDEIAS MEDIAS

La pregunta de que tan grande debe ser una muestra surge inmediatamente al inicio del planteamiento de cualquier encuesta 0 experimento Esta es una pregunshyta importante y no se debe tratara la ligera Tomar una muestra mas grande de 10 necesario para obtener los resultados deseados es un desperdicio de recursos mienshytras que por otro lado las muestras demasiado pequenas con frecuencia dan resulshytados que carecen de uso practico En esta secci6n se estudia c6mo determinar el tamano de la muestra de acuerdo con la situaci6n A continuaci6n se proporciona un metodo para determinar el tamano de la muestra que se requiere para estimar Ia media de la poblaci6n yen la siguiente secci6n se aplica este metodo para detershyminar el tamano de la milestra cuando se desea estimar la proporci6n de una poshyblaci6n Mediante extensiltmes directas de estos metodos es posible determinar el tamano necesario de las muestras para situaciones mas complicadas

Objetivos El objetivo de la estimaci6n porintervalos es el de obtener intervalos estrechos con alta confiabilidad Si se observan los componentes ~e un intervalo de confianzase veque 8U dimension esta determinada por la magnitud de la cantidad

(coeficiente de confiabilidad) x (error estandar)

131 67 DETERMINACION DEL TAMANO PARA LA l-IUESTRAmiddot

ya que lamagnitud total del intervalo de confIanza es eldoble de esta cantidad Se aprendi6 que a esta cantidad generalmente se Ie llama precisi6n de la estimaci6n o margen de error Para un error estandar dado incrementar la confIabilidad signishyfIca un coefIciente con mayor confIabilidad Y un coefIciente con mayor confIabilidad produce unintervalo mas amplio

Por otra parte si se ftia el coefIciente de confIabilidad la unica manera de redudr la amplitud del intervalo es la reducci6n del error estandar Dado que el error estandar es igual a (J IJ y como (J es una constante la unica forma de obtener un error estandar menor es tomar una muestra grande ~Que tan grande debeser la muestra Esto depende del tamafio de (J la desviad6n estandar de la poblaci6n asi como del grado de confIabilidad y dimensi6n del intervalo deseados

Suponga que se desea obtener un intervalo que se extienda d unidades hacia uno y otro lado del estimador Ellose enuncia

d (coefIciente de confIabilidad) X (error estandar) (671)

Si el muestreo es con reemplazos a partir de una poblaci6n infInita 0 de una que sea 10 sufIcientemente grande como para ignorar la correcci6n por poblaci6n fInita la ecuaci6n 671 se transforma en

(J

d z- (672)-r la cual cuando se despeja n nos da

(673)d2

Cuando el nmestreo se hacesin reemplazos a partir de una poblaci6n fInita y peshyquefia se requiere de la correcci6n por poblaci6n fInita y la ecuaci6n 671 se transforma en

(J~d (674)fN~

que al despejar n resulta en

n-----shy (675)d 2(N 1) + Z2(J2

Si puede omitirse la correcci6n por poblad6n fInita la ecuaci6n 675 se reshyduce a la ecuaci6n 673

Estillluci6n de (J 2 Las f6rmulas para el tamafio de la muestra requieren del conocimiento de (J2 pero como ya se ha sefialado la varian cia de la poblaci6n casi

132 CAPITULO 6 ESTlMACION

siempre sedesconoce Como resultado esnecesarioestimar (J2 Las fuentes de estishymaci6n de(J2 que se utilizan con mas frecuencia son las siguientes

1 Se extrae una muestrapilato 0 prel~l11inar de lapoblaci6n y se puede utilizar la variancia calculada a partir de esta muestra como unaestimaci6n de (J2 Las observaciones uti lizadas en la muestra piloto se toman como parte de la muesshytrafinal de modo que n (el tamaiio calculado de la muestra) n

1 (el tamaiio

de la muestra piloto) n2 (el numero de observaciones necesarias para satisfacer el requerimiento total del tamaiio de la muestra)

2 A partir de estudios anteriores osimilares es posible obtener estimaciones de (J2

3Si se cree que la poblaci6n de lacual se extrae la muestraposee una distribushyci6n aproximadamente nqrmal se puede aprovechar el hecho de que la amshyplitud es aproximadamente igual a 6 desviaciones estandar y calcular (J R6 Este metodo requiere aIglin conocimiento acerca de los valores minimo y maximo de la variable en la poblaci6n

EJEMPLO 671

Un nutri6logo del departamento de salud al efectuar una encuesta entre una poshyblacien de muchachas adolescentes con e1 fin de determinitr su ingesti6n diaria promedio de proteinas (medidas en gramos) busc6 el consejo de un bioestadistico con respecto al tamaiio de la muestra que deberfa tomar

~Que procedimiento debe seguir el bioestadistico para asesorar al nutri610go Antes de que el estadistico pueda ayudar el nutri6logo este debe proporcionar tres elementos de informaci6n h dimensi6n deseada del intervalo de confianza el nivel de confianza deseado y la magnitud de la variancia de la poblaci6n

Soludon Suponga que el nutri6logo requiere un intervalo con una dimensi6n de aprQximadamente 10 gramos es decir la estimaci6n se deberfa enconshytrar alrededor de 5 gramos de la media de la poblaci6n en ambas direcshyciones En otras palabras se desea un margen de error de 5 gramos Suponga que se decide por un coeficiente de confian7a de 95 y que con base en su experiencia previa el nutri6logo percibe que la desviaci6n estandar de la poblaci6n es probablemente de alrededor de 20 gramos EI estadfstico dispone ya de la informaci6n necesaria para calcular el tamaiio de la muestra z 196 (J = 20 y d 5 Suponga que el tamaiio de la poblaci6n es grande asf queel estadistico puede ignorar la correcshyci6n por poblaci6n finita y utilizar la ecuaci6n 673 Con las sustitucioshynes adecuadas el valor de n se calcula como

Se recomienda que el nutri610go tome una muestra de tamafio 62 AI calcular el tamaiio de una muestra a partir de las ecuaciones 673 0 675 el resultado se redondea al siguiente nurnero entero mayor si los calculosdan un numerocon decimales bull

183 68 DETERMINACION DEL TAl1ANO PARA LAS PROPORCIONES

EJERCICIOS

671 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su hospital Si se desea un intervalo de confianza de 99 por dento con una amplitud de 1 libra ~que tan grande debe ser la muestra de los registros de nacimiento Suponga que un estimashy

dor razonable para (J es 1 libra ~De que tamano debe ser la muestra si el coeficiente de confiabilidad se hace descender a 95

672 El director de la secdon de control dela rabia del departamento de salud publica desea extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso del ano anterior para estimar la edad media de las personas mordidas Requiere un intervalo de confianza de 95 por dento decide utilizar un valor de 25 para d y a partir de estudios anteriores estima que la desviacion estandar de la poblacion esta alrededor de los 15 anos ~Que tan grande debe ser el tamano de la muestra

673 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mglOO ml) de pacientes atendidos en una clinica para diabeticos durante el transcurso de los ultimos 10 anos Determine el numero de registros que el medico debe examinar para obtener un intershyvalo de confianza de 90 por ciento para 11 si la dimension requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varian cia de 60

674 Se deseaestimar la edad media en la que a los padentes de esclerosis multiple se les diagnosshytico el padecimiento por primera vez Se requiere un intervalo de confianza de 95 por dento con una dimension de 10 anos Si la variancia de la poblaci6n es de 90 ~que tan grande debera ser la muestra

68 DETERMINACION DELTAMANO DE lA MUESTRA PARA lA ESIDIACION DE lAS PROPORCIONES

EI metodo para estimar el tamafio de la muestra cuando se requiere estimar la proshyporcion de una poblacion es esencialmente el mismo que se describio para estimar la media de una poblacion Se aprovecha el hecho de que la mitad del intervalo deseashydo d se puede igualar al producto del coeficiente de confiabilidad y el error estandar

Si se supone que el muestreo ha sido hecho de manera aleatoria y que existen condiciones que garanticen que la distribuci6n de psea aproximadamente normal se obtiene la siguiente formula para n cuando el muestreo es con reemplazo cuanshydo se realizaa partir de una poblacion infinita 0 ruando la poblacion muestreada es 10 suficientemente grande como para hacer innecesario el uso de la correcci6n por poblacion finita

n (681)

dondeq = I-p Si la correccion por poblacion finita no puede descartarse la formula adecuashy

da paran es

(682)n d 2 (N -1)+z2pq

euan do N es grande en comparacion con n (es decir n IN 05) se puede pasar por alto la correccion por poblacion finita y la ecuacion 682 se reduce a la ecuacion 681

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

EJERCICIOS 165

EJERCICIOS

Sa aplica al leorema dellfmile central

FIGURA 633 Diagrama de flujo para deddir entre utililizar z y t cuando se hagan inferencias respecto a las medias de la poblaci6n (Para utilizar un procedimiento no parametrico vease el capitulo 13)

Analisis par computadara Si el proposito es construir un intervalo de conshyfianza con el programa MINITAB para la media de la poblacion cuando el estadfsshytico t es el factor de confiabilidad adecuado el comando se inicia con la palabra TINTERVAL Seleccione en Windows I-Sample t desde el menu de Basic Statistics

631 Utilice la distribud6n t para encontrar el factor de confiabilidad para el intervalo de confianshyza basado en los siguientes coeficientes de confianza y tamafiosde las muestras

a b c d

Coefidente de confianza 95 99 90 95 Tamafio de la muestra 15 24 8 30

632 En una investigacion acerca de la dependencia del flujo y volumen de todo el sistema respishyratorio en un grupo de pacientes con enfermedad obstructiva pulmonar cronica conectados a respiradores artificiales Tantucci et ai (A-2) registraron los siguientes valores de linea de

166 CAPITULO 6 ESTIMACION

base del flUjD continuo inspiratDriD (Us) 90 97 103110 104 100 CDnsidere que una muestra aleatDria simple esta cDnfDrmada pDr seis individuDs a partir de una pDblacion que sigue una distribuci6n nDrmal CDn individuDs CDn la misma enfermedad

a) ~Cuat es la estimaci6n puntual de la media de la pDblaci6n

b) ~Cuil es la desviacion estandar de la muestra

c) ~Cultll es la estimacion del error estandar para la media de la muestra

d) CDnstruya un intervalD de cDnfianza de 95 pDr ciento para el flUjD mediD cDntinuD inspishyratDriD de la pDblaci6n

e) ~Cual es la precision de la estimacion

f) Explique la interpretaci6n prDbabilistica para este intervalD de confianza

g) Explique la interpretacion practica para este intervalD de cDnfianza

633 LlDyd y MaillDux (A-3) informaron IDS siguientes datDs acerca del peso de la glandula pituitaria en una muestra de cuatrD ratas de Wistar Furth

media = 90 mg error estandar para la media = 3

FUEJTE Ricardo V Lloyd y Joe Mailloux Analysis ofSshy100 Protein Positive Folliculo Stellate Cells in Rat Pituitary Tissues AmericanJournal ofPathology 133 338-346

a) ~Cual es la desviadon estandar de la muestra

b) CDnstruya un intervalD de confianza de 95 pDr ciento para el peso medio de la glandula pituitaria para una pDblacion similar de ratas

c) ~Que supDsiciDnes se necesitan para que sea validD el intervalo de cDnfianza del inciso b

d) ~Que interpretacion puede ser la mas indicada cuandD se trata sDbre intervalos de conshyfianzacon alguien que no sabe de estadfstica Explique pDrque es la mas cDnveniente

e) 5i fuera necesario elabDrar un intervalD de cDnfianza de 90 pDr cientD para la media de la pDblaci6n ~el intervalD de cDnfianza serta mayDr 0 menor que el intervalD de 95 pDr dentD Explique su respuesta sin construir realmente el intervalD de cDnfianza

f) 5i [uera necesariD considerar un intervalo de CDnfianza de 99 pDr cientDpara lamedia de la poblacion ~el intervalo de cDnfianza serra mayDr 0 menDr que el intervalD de 95 pDr dentD Explique su respuesta sin cDnstruir realmentt el intervalD de cDnfianza

634 Kaminski y Rechberger (A-4) encontrarDn en un estudio sDbre la preeclampsia que la media de la presi6n sistolica sangufnea en 10 mujeres sanas y que no estan embarazadas es de 119 CDn una desviacion estandar de 21

a) 2Cual es el errDr estandar estimadD para la media

b) CDnstruya un intervalD de confianza de 99 pDr cientD para la media de la poblaci6n a partir de la cual puede considerarse que IDS 10 individuos conforman una muestra aleatoria

c) ~CUlil es la precisi6n estimada

d) ~Que consideraciones deben hacerse para comprobar la validez del intervalo de confiahza

635 Unamuestra de 16nifias de 10 afiDS pesan en promediD 715 con una desviacion estandar de 12libras CDnsidere el calculD de intervalDs de cDnfianza de 9095 y 99 pDr ciento para I-L

167 64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS

636 Una muestra aleatoria simple conformada por 16 individuos aparentemente sanos presenta los siguientes valores de arsenico eliminado en la orina (miligramos por dfa)

Individuo Valor Individuo Valor

1 007 9 012 2 030 10 006 3 025 11 010 4 008 12 032 5 030 13 006 6 038 14 009 7 007 15 014 8 005 16 011

Elabore un intervalo de confianza de 95 por ciento para la media de la poblaci6n

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES

En ocasiones se presentan casos en los que se desea estimar 1a diferencia entre 1a media de dos poblaciones A partir de cada poblacion se extrae una muestra aleatoria independiente y de los datos de cada una se calculan las medias muestrales XI y x2

respectivamente En el capitulo anterior se dijo que el estimador XI - x2 ofrece una estimacion insesgada de la diferencia entre las medias de las poblaciones III shy11 2 bull La variancia del estimador es (cr~ n l ) + (cr~ n 2 ) Tambien se menciono que seglin las condiciones la distribucion muestral de XI - x2 puede presentar una distribution al menos aproximadamente normal de modo que en muchos casos se utiliza la teorfa adecuada para las distribuciones normales en el calculo de un intershyvalo de confianza para III - 11 2 bull Cuando se conocen las variancias de la poblacion el intervalo de confianza del 100(1 - ex) por ciento para III - 112 esta dado por

(641)

El anal isis del intervalo de confianza para la diferencia entre las medias poblacionales ofrece informacion util para decidir si es 0 no probable que las medias de las dos poblaciones sean iguales Cuando el intervalo no incluye al cero se dice que el intervalo ofrece evidencia de que las dos poblaciones tienen medias diferentes Cuando el intervalo incluye al cero se dice que las poblaciones pueden tener meshydias iguales

Esto se ilustra a continuacion para el caso donde el muestreo se realiza a partir de una distribucion normal

168 CAPITULO 6 ESTlMACI6N

EJEMPLO 641

A un equipo de investigacion Ie interesa conocer la diferencia entre las concentracioshynes de acido urico en pacientes con y sin el sfndrome de Down En un gran hospital para el tratamiento de pacientes con retardo mental una muestra de 12 individuos con el sindrome presenta una media de XI = 45 mgll00 mL En un hospital general se encontro que una muestra de 15 individuos normales de la misma edad y sexo presenta un nivel medio de x2= 34 Si es razonable suponer que las dos poblaciones de valores muestran una distribucion normal y sus variancias son iguales a 1 y 15 calcule el intervalo de confianza de 95 por ciento para ~l - ~2

Soluci6n Para una estimacion puntual de III 112 se udliza Xl X2= 45 34 11 EI coeficiente de confiabilidad que corresponde a 95 localizado en la tabla D es 196 EI error estandar es

Por 10 tanto el intervalo de confianza de 95 por ciento es

11 plusmn 196(4282) 11plusmn84 26 194

Se dice que se dene una confianza de 95 por ciento de que la difeshyrencia real 111 - 112 este entre 26 y 194 porque en muestreos repetidos 95 por ciento de los intervalos construidos de esa manera incluiria la diferencia entre las medias reales

Puesto que el intervalo no incluye al cero se concluye que las dos poblaciones tienen diferentes medias bull

Muestreo a partir de poblaciones que no signen una distribuci6n ItOrmal La construccion de un intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando el muestreo se realiza a partir de poblaciones no normales se lleva a cabo en la forma descrita en el ejemplo 641 si las muestras n l y n

2 son grandes Una vez mas este es un resultado del teorema del limite central

Si se desconocen las variancias de la poblacion se utili zan las variancias de las muestras para estimarlas

IUEMPLO 642

Motivados por d conocimiento de la existencia de una gran cantidad de textos polemicos que sugieren que el estres la ansiedad y la depresion son dafiinos para el sistema inmunologico Gormanet ai (4-5) condujeron un estudio en el que se conshysider6 a individuos varoneshomosexuales algunos con VIH (virus de inmunodefishyciencia humana) positivo y otros con VIH negativo Los datos fueron registrados con una amplia vltJriedad de mediciones medicas inmunologicas psiquiatricas y neurol6gicas una de las cuales corresponde al numero de celulas CD4+ en la sanshy

64 INTERV ALO DE CONFIANZA PAHALA DIFERENCIA ENTRE DOS MEDIAS 169

gre El numero promedio de celulas CD4+ para middot112 individuos con infecci6n por VIR fue de 4018 con una desviaci6n estandar de 2264 Para los 75 individuos sin la infecci6n por VIR la media y la desviaci6n estandar fueron de 8282 y 2749 respectivamente Se pretende elaborar un intervalo de confianza de 99 por ciento para la diferencia de las medias de las poblaciones

Soluci6n No hay informaci6n con respecto a la forma de la distribuci6n de las celulas CD4+ Sin embargo como el tamafto de las muestras es grande el teorema del limite central asegura que la distribuci6n muestral de las diferencias entre las medias de la muestra siguen una distribuci6n aproxishymadamente normal independientemente de que la distribuci6n de la variable en las poblaciones no siga una distribuci6n normal Se puede utilizar este hecho para justificar el uso de la estadistica z como factor de confiabilidad en la construcci6n del intervalo de confianza Tampoco hay informaci6n acerca de las desviaciones estandar por 10 que puede emplearse las desviaciones estandar de las muestras para estimarlas La estimaci6n puntual para la diferencia entre las medias de las poblacioshynes es la diferencia entre las medias de las muestras 8282 - 4018 = 4264 En la tabla D se encuentra que el factor de confiabilidad es 258 La estimaci6n del error estandar es

s __ = 27492

+ 22642 =382786

Xl-X 75 112

Por la ecuaci6n 641 el intervalo de confianza de 99 por ciento para la diferencia entre las medias de la poblaci6n es

4264 plusmn 258(382786) 3276 5252

Se tiene la seguridad de 99 por ciento de que el promedio de celulas CD4+ en varones con VIR positivo difieren de la media para los varoshynes con VIR negativo por 3276 a 5252 bull

Distribuci6n t y la diferencia entre las medias Cuando no se conocen las variancias y se pretende estimar la diferencia entre las medias de dos poblacioshynes con un intervalo de confianza es posible utilizar la distribuci6n t para suminisshytrar el factor de confiabilidad si se conocen ciertas suposiciones se debe saber 0

suponer de buena fe que las dos poblaciones muestreadas siguen una distribuci6n normal Respecto a las variancias de las poblaciones se debe distinguir entre dos situaciones 1) la situaci6n en la que las variancias son iguales y 2) la situaci6n en la que no 10 son A continuaci6n se consideranambas sitpaciones por separado

Varianciaspoblacifmales iguales Si la suposici6n sobre igualdad de las variancias de las poblaciones esta justificada las dos variancias de las muestras calculadas a partir de las muestras independientes pueden considerarse como estishymaciones de 10 mismo es decir la variancia comun Parece 16gico entonces aproshyvechar este hecho en el anal isis en cuesti6n Esto es precisamente 10 que se hace para establecer una estimaci6n conjunta para la variancia comun Esta variancia se obtiene mediante el caIculo promedio ponderado de las dos variancias de las muesshy

170 CAPITULO 6 ESTlMACI6N

tras Cada variancia de la muestra es ponderada con base en sus grados de libertad Si los tamafios de las muestras son iguales este promedio ponderado es la media aritmetica de las variancias de las dos muestras Si el tamano de las dos muestras es distinto el promedio ponderado aprovecha la informacion adicional proporcionada por la muestra mayor La estimacion con junta se obtiene con la fOrmula

S2 = (nl _1)SI2 + (n2 l)s~ p (642)

+n2 -2nl

Asf la estimacion del error estandar esta dada por

(643)

y el intervalo de confianza de 100(1 a) por ciento para III 112 esta dada por

(644)

El nfunero de grados de libertad utilizado para determinar el valor de t que se usa para construir el intervalo es n

1 + n

2 2 que es el denominador de la ecuacion

642 Este intervalo se interpreta en la forma habitual Los metodos que pueden emplearse para tomar la decision acerca de la igualshy

dad de las variancias de las poblaciones se estudian en la seccion 610 y 78

EJEMPLO 643

Uno de los estudios de Stone et al (A-6) tuvo como objetivo determinar los efectos del ejercicio por un tiempo prolongado en los ejecutivos de una compania inscritos en un programa supervisado de acondicionamiento fisico Se registraron datos de 13 individuos (el grupo deportista) que voluntariamente se inscribieron el programa y que permanecieron activos por 13 anos en promedio y de 17 individuos (el segunshydo grupo el sedentario) que decidieron no inscribirse Entre los datos que se regisshytraron acerca de los individuos esta el mlmero maximo de sentadillas realizadas en 30 segundos El grupo deportista obtuvo una media y una desviacion estandar de 210 y 49 respectivamente La media y la desviacion estandar para el grupo sedenshytario fueron 121 y 56 respectivamente Se considera que las dos poblaciones de medici ones de acondicionamiento muscular siguen una distribuci6n aproxirnadashymente normal y que las variancias para ambas poblacionesson iguales Se pretenshyde elaborar un intervalo de confianza de 95 por ciento para Ja diferencia entre las medias de as poblaciones representadas por las dos muestras Soluci6n Primero se utiliza la ecuaci6n 642 para calcular la estimaci6n conjunta

de la variancia comtin de las poblaciones

(13-1)(49 2 )+(17 1)(562 ) =2821

13+17-2 Cuando se consulta la tabla E con 13 + 17 - 2= 28 grados de libertad y el nivel de confianza de 95 se encuentra que eLfactor de confiabilidad es 20484 Con la ecuacion 644 se calcula el intervalo de confianza de

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS 171

95 por ciento para la diferencia entre las medias de las poblaciones de la siguiente manera

2821 2821(210-121)plusmn20484 --+-shy

13 17 89 plusmn 40085

49129

Se tiene una confianza de 95 por ciento de que la diferencia entre las medias de las poblaciones estan entre 49 y 129 Se puede decir esto porque se sabe quesi se repite el amilisis muchfsimas veces y se calculan los intervalos de confianza de la misma manera cerca de 95 por ciento de los intervalos de confianza induiran la diferencia entre las medias de las poblaciones

Debido a que los intervalos no induyen al cerose conduye que las medias de las poblaciones son diferentes bull

Variancias poblacionales distintas Cuando no se puede conduir que las variancias de dos poblaciones de interes son iguales aun ruando pueda suponerse que las dos poblaciones presentan distribuciones normales no es adecuado utilizar la distribucion t como se acaba de describir para construir los intervalos de confianza

Una solucion al problema de variancias distintas fue propuesta por Behrens (3) y posteriormente fue verificada y generalizada por Fisher (4 5) Neyman (6) Scheffe (7 8) Y Welch (9 10) tambien proponen soluciones EI problema es analizashydo en detalle por Cochran (11)

EI problema gira en tomo al hecho de que la cantidad

no sigue una distribuci6n t con nj + n 2 grados de libertad ruando las variancias 2 shy

de las poblaciones son distintas Consecuentemente la distribucion t no se puede utilizar en la forma habitual pata obtener el factor de confiabilidad del intervalo de confianza para la diferencia entre las medias de dos poblaciones que tienen variancias diferentes La solucion propuesta por Cochran consiste en el calculo del factor de confiabilidad mediante la siguiente formula

wltj + w2tZ t l

f

-0f2 = (645) WI +w2

donde WI 512

np W 2 = s~ n2 tl = tl _ para nj - 1 grados de libertad y t2 = t l

_w2aI2

para n2

- 1 grados de libertad Un intervalo aproximado de confianza del 100(1 shya) por ciento para III - 112 esta dado por

(646)

172

EJERCICIOS

CAPITULO 6 ESTlMACION

FJEIUPLO 644

En la investigacion de Stone et al (A-6) descrita en el ejercicio 643 los investigashydores tambien informaron los siguientes datos de las medici ones referentes a todas las calificaciones del acondicionamiento muscular logradas por los individuos

Muestra n Media Desviaci6n estimdar

Grupo deportista 13 45 3

Grupo sedentario 17 37 10

Se considera que las dos poblaciones de todas las calificaciones de acondicionashymiento muscular siguen una distribuci6n aproximadamente normal Sin embargo no debe suponerse que las dos variancias poblacionales son iguales Se pretende construir un intervalo de confianza de 95 por ciento para la diferencia entre las medias de todas las calificaciones de acondicionamiento muscular para las dos poshyblaciones representadas por las muestras

Soluci6n Se utiliza t de la ecuaci6n 645 para calcular el factor de confiabilidad En la tabla E se muestra que con 12 grados de libertad y 1 - 052 = 975 t( 21788 Analogamente con 16 grados de libertad y 1- 052 = 975 t2 = 21199 Ahora Sf calcula

(3 2 13)(21788) + (102 17)(21199) 139784 t= =

(3 2 13)+(102 17) 065747

=21261

Con la ecuaci6n 646 ahora se construye el intervalo de confianza de 95 por ciento para la diferencia entre las medias de las dos poblaciones

2 2

(45 37)plusmn21261 3 + 10 13 17

8 plusmn 21261 (25641101) 25134

Puesto que el intervalo no incluye acero se concluye que las medias de las dos poblaciones son diferentes bull

Cuando se construyen intervalos de confianza para la diferencia entre las medias de dos poblaciones es posible utilizar la figura 641 para decidir rapidashymente si el factor de confiabilidad debe ser z t 0 tf

Para cada uno de los siguientes ejercicios construya intervalos de confianza de 90 95 y 99 par ciento para las diferencias entre las medias poblacionales Establezca consideraciones que hagan que el metodo sea valido Determine las interpretaciones practica y probabilistica

clJ clJ FIGURA 541 Diagrama de flujo para decidir si e1 factor de confiabilidad debe ser z tot cuando se realizan inferencia inferencias acerca de la diferencia entre las medias de dos pobladones (Para usar un procedimiento no parametrico ver el capitulo 11)

174 CAPiTULO 6 ESTlMACION

para cad a intervalo construido Suponga las variables bajo considerati6n en cad a ejercicio y establezca para que pueden servir a los investigadores esos resultados

641 EI objetivo de un experimento de Buckner et al (A-7) consisti6 en estudiar los efectos del relajamiento muscular inducido por el pancuronium en el volumen del plasma circulante Los individuos estudiados son recien nacidos con un peso mayor a 1700 gramos que necesishytaron de ayuda para respirar durante las primeras 24 horas despues de nacer y cumplieron con otros criterios cHnicos Cinco recien nacidos paraIizados con el pancuronium y siete recien nacidos no tratados presentaron las siguientes estadisticas en la segunda de las tres mediciones del volumen de plasma (ml) hecha durante la respiraci6n mecanica

Paralizados 480 81 No tratados 567 81

La segunda medici6n para el grupo tratado ocurri6 de 12 a 24 horas despues de la primera dosis de pancuronium Para el grupo no tratado las mediciones se hicieron de 12 a 24 horas despues de iniciar la respiracion mecanica

642 Zuckery Archer (A-8) afirman que la N-nitrosobis (2-oxopropyl)amina (BOP) y las nitrosaminas 3-oxidizadas producen una alta incidencia de tumores de conductos pancreaticos en el hamster dorado sirio Estudiaron los efectos en el peso sangufneo en la glucosa del plasma en la insulina yen los niveles de transamina glutamico-oxaloacetica del plasma (GOT) de los hamsters expuestos in vivo a la BOP Los investigadores reportaron los siguientes resultados en ocho animales tratados y 12 sin tratamiento

Variable Sin tratamiento Con tratamiento

Glucosa del plasma (mglgl) 101 plusmn 5 74plusmn 6

FUENTE Peter F Zucker y Michael C Archer Alterations Pancreatic Islet Function Produced by Carcinogenic Nitrosamines in the Syrian Hamster AmericanJournal oPathology 133 573-577

Los datos son la media de la muestra plusmn la estimaci6n del error estandar de la media de la muestra

643 Los objetivos de un estudio de Davis et al (A-g) son evaluar 1) la eficacia del programa auto ayuda momento para dejar de fumar cuando se utiliza con base de uno a uno en el hogar y 2) la viabilidad de ensefiar temicas para abandonar el habito de fumar a los estudiantes de enfermerfa en bachillerato A estudiantes graduados de enfermerfa inscritos en dos cursos de metodologia de la investigacion de la Universidad de Ottawa se les invit6 a participar en el proyecto Se aplic6 un cuestionario de opcion multiple para abandonar el habito de fumar a 120 estudiantes de enfermeria que participaron y a otros 42 estudiantes que no participashyron antes ni despues del estudio Se calcularon las diferencias entre las calificaciones antes y despues del estudio as como las siguientes estadisticas a partir de las diferencias

EJERCICIOS 175

Grupo Media Desviaci6n estandar

Participantes (A) 214444 15392 No participantes (B) 33333 14595

644 El doctor Ali Khraibi (A-IO) de la CHnica y Fundaci6n Mayo condujo una serie de experishymentos con el fin de evaluar las respuestas diureticas y natiureticas de ratas Okamoto esponshytaneamente hipertensivas (REB) y ratas Wistar-Kyoto (WRY) para dirigir incrementos en la presion hidrostatica renal intersticial (PBRI) Para aumentar la PBRI se utiIiz6 la expansi6n directa del volumen renal intersticial (DRIVE) a traves de una matriz implantada cronicamente en el rinOn Entre los datos registrados durante el estudio estan las siguientes mediciones de excreci6n de sodio a traves de la orina (UNa V) durante el periodo de DRIVE

Grupo

REB 632572796483527 2WKY 420469482 108210

FUENTE Publicada con autorizaci6n del Dr Ali A Khraibi

645 Osberg y Di Scala (A-II) realizaron un estudio centrado en la eficacia de los cinturones de seguridad para reducir 1esiones entre sobrevivientes de accidentes automoviHsticos internashydos en hospitales con edades de 4 a 14 afios El estudio compar610s resultados de 123 ninos que utilizaron el cintur6n contra 290 que no 10 utilizaron entre aquellos que se vieton enshyvueltos en tales accidentes y que fueron hospitalizados El informe con tenia la siguiente estadistica del numero de dfas en la unidad de cuidados intensivos

Grupo Media Error estandar estimado

Utiliz6 el cintur6n 83 16 No utiliz6 el cintur6n 139 18

646 La medicion del diametro transversal del coraz6n de hombres y mujeres adultos presenta los siguientes resultados

sx Grupo Tamafto de Ia muestra (cm) (cm)

Varones 12 1321 105 Mujeres 9 IIOO 101

Considere que las poblaciones siguen una distribucion normal con variancias iguales

176 CAPITULO 6 ESTIMACION

647 Veintiruatro animales de laboratorio con deficiencia de vitamina D fueron divididos en dos grupos iguales EI grupo 1 recibi6 un tratamiento consistente en una dieta que proporcionashyba vitamina D EI segundo grupo no fue tratado AI termino del periodo experimental se midieron las concentraciones de calcio ensuero obteniendose los siguientes resultados

Grupo tratado X 111 mg 100 mls = 15 Grupo sin tratamiento x= 78 mg 100 ml s = 20

Considere que las poblaciones siguen una distribuci6n normal con variancias iguales

648 Ados grupos de nifios se les hicieron pruebas de agudeza vi~ual El grupo 1 estuvo formado por 11 nifios que recibieron la atenci6n de medicos privados La calificaci6n media para este grupo fue de 26 con una desviaci6n estandar de 5 El segundogrupo que incluy6 14 nifios que recibieron atenci6n medica por parte del departamento de salud publica tuvo una calishyficaci6n promedio de 21 con una desviaci6n estandar de 6 Suponga que las poblaciones siguen una distribuci6n normal con variancias iguales

649 El tiempo promedio de estancia de una muestra de 20 pacientes dados de alta de un hospital general es de siete dras con una desviaci6n estaildar de dos dras Una muestra de 24 padenshytes dados de alta de un hospital de enfermedades cr6nicas tuvo un tiempo promedio de estancia de 36 dfas con una desviaci6n estindar de 10 dias Suponga que la poblaci6n sigue una distribuci6n normal con variancias desiguales

6410 En un estudio de factores que se consideran responsables de los efectos adversos del tabashyquismo sobre la reproducci6n humana se midieron los niveles de cadmio (nanogramos por gramo) en el tejido de la placenta de una muestra de 14 madres que fumaban y una muestra aleatoria independiente de 18 mujeres no fumadoras Los resultados fueron los siguientes

No fumadoras toO 84 128250 118 98 125 154 235

94251 1952559875 118122150

Fumadoras 300301150241305178168148

134285 175 144 125204

ms probable que el nivel medio de cadmio registrado sea mayor entre las fumadoras que entre las no fumadoras ~Por que se llegarfa a esta conclusi6n

65 INTERVALO DE CONFIANZA PARA IA PROPORCION DE UNA POBIACION

Muchas preguntas de interes para que el tecnico en salud tienen relacion con las proporciones de poblacion ~Que propordon de padentes que redben un tipo espeshycial de tratamiento se recuperan ~Que proporcion de alguna poblacion tiene cierta enfermedad ~Que propordon de una poblacion es inmune a derta enfermedad

Para estimar la proporcion de una poblacion se procede en la misma forma que cuando se estima la media de una poblacion Se extrae una muestra de la poblacion de interes y se calcula su proporcion p Esta se utiliza como el estimador puntual para la proporcion de la pobladon Un intervalo de confianza se obtiene mediante la siguiente formula general

estimador plusmn (coefidente de confiabilidad) X (error estandar)

EJERCICIOS

EJERCICIOS 177

En el capitulo anterior se vio que cuando np y n(1 - p) son mayores que 5 se puede considerar que la distribuci6n muestral de pse aproxima bastante a una distribuci6n normal Cuando se cumple con esta condici6n el coeficiente de confiabilidad es algUn valor de z de la distribuci6n normal estandar Esta visto que el error estandar es igual a (J p =fi(l-p) n Puesto que p que es el parametro que se trata de calcular se desconoce se debe utilizar pcomo una estimaci6n Asf se estima (J j por medio de ~p(l Pn y el intervalo de confianza de 100(1 - 0) por ciento para pesta dado por

pplusmn Z(I-1J2)~P(l- P) Fn (651)

Este intervalo se interpreta tanto desde el punto de vista practico como probabilistico

FJEMPLO 651

Mathers et al (A-12) encontraron queen una muestra de 591 pacientes internados en un hospital psiquiatrico 204 admitieron que consuniieron marihuana al meshynos una vez durante su vida Se pretende construir un intervalo de confianza de 95 por ciento para la proporcion de individuos que consumieron marihuana durante su vida en la poblaci6n muestreada de los internos del hospital psiquiatrico

Solucion La mejor estima~i6n puntual para la proporci6Il de la poblaci6nes p== 204591 3452 El tamafio de la muestra y hiestimacion de p tienen una magnitud suficiente parajustifKar el empleo de la distribucion norshymal estandar paraelaborar un intervalo de confianza EI coeficiente de corifiabilidad que corresponde alnivel de confianza de 95 es 196 la estimacion del errorestandar (Jp es ~p(l-pgtn = (3452)(6548)591

0 1956El intervalo de confianza para p de acuerdo con estos datos es

3452 plusmn 196(01956) 3452 plusmn 0383 3069 3835

Se puede decir que se tiene 95 por ciento de confianza de que la proporshycionpeste entre 3069 y 3835 ya que al repetir el muestreo casi 95 por ciento de los intervalos construidos en la forma de este intervalo inclushyyen a la proporcion p real Con base en estos resultados se espera con una confianza de 95 por ciento encontrar que entre 3069 y 3835 por ciento de los internados en el hospital psiquiatrico tiene antecedentes de consumo de marihuana bull

Para cada uno de los siguientes ejercicios establezca la interpretacion prictica yprobabilistica de los intervalos que se pide construir Identifique cada componente del intervalo la estimashycion puntual el coeficiente de confiabilidad yel error estandar Explique por que los coefishycientes de confiabilidad no son los misInos para todos los ejercicios

178 CAPITULO 6 ESTIIlACI6N

651 En una investigaci6nde ninos maltratados en pacientes psiquiatricos Brown y Anderson (A-IS) encontraron 166 pacientes en una muestra de 947 con antecedentes de abuso sexual y maltrato flsico Construya un intervalo de confianza de 90 por dento para la proporci6n de la poblaci6n

652 Catania et at (A-14) obtuvieron datos respecto al comportamiento sexual de una muestra de hombres y mujeres solteros con edades entre 20 y 44 residentes en areas geoijfaficas caracshyterizadas por tasas altas de enfermedades de transmision sexual e ingreso a programas de drogas De 1229 encuestados 50 por ciento respondieron que nunca utilizaron preservatishyvos Construya un intervalo de confianza de 95 por ciento para la proporcion de la poblaci6n que nunca utiliza preservativos

653 Rothberg y Lits (A-I 5 ) estudiaron el efecto del estres de la maternidad durante el embarazo en el peso del producto Los individuos eran 86 mujeres blancas con antecedentes de estres que no tenfan faetores de riesgo medico u obstetrico conoddo de peso bajo del producto Los investigadores eneontraron que 128 por dento de las madres estudiadas dieron a luz bebes que cubrfan el criterio de peso bajo Construya un intervalo de confianza de 99 por ciento para la proporci6n de la poblaci6n

654 En una muestra aleatoria simple de 125 varones desempleados quienes desertaron de la escuela preparatoria entre las edades de 16 y 21 anos inclusive 88 declararon que eran consumidores regulares de bebidas alcoh6litas Construya un intervalo de eonfianza de 95 por ciento para la proporcion de la poblacion

66 INTERVALO DE CONFIANZA PARA lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS POBlACIONES

A menudo se tiene interes en conocer la magnitud de la diferencia entre las proporcioshynes de dospoblaciones Es posible que se quiera comparar por ejemplo entre hombres y mujeres dos grupos de edades dos grupos socioecon6micos 0 dos grupos de diagshynostico con respecto a la proporcion que posee alguna caractenstica de interes Un estimador puntual insesgado de la diferencia entre dos proporciones de las poblacioshynes se obtieneal calcular la diferencia de las proporciones de las muestras PI P2 Tal como Se ha visto cuando n1 Yn2 son de gran tamano y las proporciones de la poblacion no estan muy cerca de 0 0 de 1 es posible aplicar el teorema del limite central y utilizar la teona de la distribucion normal para obtener los intervalos de conshyfianza EI error estandar de la estimacion se calcula mediante la siguiente formula

dado que como regIa se desconocen las proporciones de Ia poblacion Un intervashy10 de confianza de 100(1 - a) por ciento para PI P2 se obtiene as

(661)

Es posible interpretar este intervalo desde elpunto de vista probabiHstico y practico

EJERCICIOS 179

EJEMPLO 661

Borst et al (A-16) investigaron la relaci6n de desarrollo del ego edad sexo y diagshyn6stico de suicidio entre los internos adolescentes de la unidad de psiquiatria La muestra consistia en 96 varones y 123 niiias con edades entre 12 y 16 aiios seleccioshynados de entre los internados en la unidad de adolescentes y niiios de un hospital psiquiatrico privado Se reportaron 18 niiios y 60 niiias con intento de suicidio Cons ishyderese el comportamiento de las niiias como el de una muestra aleatoria simple a partir de una poblaci6n similar de niiias y que los j6venes igualmente pueden considerarse como una muestra aleatoria simple extraida de una poblaci6n similar de niiios Para estas dos poblaciones se pretende construir un intervalo de confianshyza de 99 por ciento para la diferencia entre las proporciones de los individuos con intento de suicidio

Soluci6n Las proporciones para las niiias y niiios respectivamente son Pc = 601 123 = A878y PB = 1896 1875 La diferencia entre las proporciones de lasmuestrases Pc PB = 4878 1875 = 3003 El error estandar estimado de la diferenda entre las proporciones de las muestras es

(4878)(5122) (1875)(8125) ---~~-~ +-------shy

123 96

El factor de confiabilidad a partir de la tabla D es 258 de modo que el intervalo de confianza con la f6rmula 661 es

3003 plusmn 258(0602) 14504556

Se dene la confianza de 99 por dento de que para las poblaciones muestteadas la ptopord6n de intentos de suiddio entre las niiias exceshyde a lapropord6n de intentosde suiddio entre los varones por 1450 y 4556

Puesto que el intervalo no incluye al cero se concluye que las dos proporciones de pobladones son diferentes bull

FJERCICIOS

Para cada uno de los siguientes ejercicios establezca las interpretaciones pnicticas y probabishylisticas de los intervalos que se pide construir Identifique cada componente del intervalo la estimaci6n puntual el coeficiente de confiabilidad y el error estandar Explique por que los coeficientes de confiabilidad no son el mismo para todos los ejercicios

661 Hargers et al (A-17) del departamento de Salud PUblica y Ambieptal en Amsterdam condushyjeron un estudio en el que los individuos eran consumidores de drogasinyectables (CDI) En una muestrade 194 consumidores de metadona regular de largo plazo (MLP) 145 eran varones En una muestra de 189 CDIque no consmiddotumian MLP 133 eran varones Establezca las consideraciones necesarias acerca de las muestras ypoblaciones representadas y construshy

180 CAPITULO 6 ESTlMACI6N

ya un intervalo de confianza de 95 por ciemo para la diferenda entre las proporciones de varones en las dos poblaciones

662 Una investigaci6n de Lane et ai (A-I8) valor6las diferencias en las pnicticas de deteccion de cancer de seno entre muestras de mujeres predominantemente de bajos ingresos con edashydes de 50 a 75 anos que lltilizan los servicios de c1inicas de sailld para todo el estado y mlljeres de la misma edad residentes en ciudades donde las c1inicas de salud son locales De las 404 encuestadas seleccionadas en toda la comunidad 592 por ciento estuvo de acuerdo con el siguiente comentario acerca del cancer de pecho las mujeres prolongan su vida si detectan el cancer desde el inicio De entre 795 usuarias de clinicas de salud en la mllestra 449 por ciento estuvo de acuerdo Establezca las suposiciones apropiadas para elaborar un intervalo de confianzade 99 por ciento para la diferencia entre las dos proporciones de las poblaciones de interes

663 Williams et at (A-19) encuestaron a una muestra de 67 medicos y 133 enfermeras con famishyliares farmacodependientes EI prop6sito del estudio era evaluar la influencia en los medishyEOS y enfermeras de estar estrechamente involucrados con una 0 mas personas farmaco dependientes Cincuenta y dos medicos y 89 enfermeras dijeron que vivian con personas farmacoldependientes que adversamente afectaban 8U trabajo E8tablezca todas las consideshyraciones que crea necesarias para construir un intervalo de confianza de 95 por ciento para la diferencia entre las proporciones en las dos poblaciones de trabajadores que se espera esten adversamente afectados por vivir con personas farmacodependientes

664 Aronow y Kronzon (A-20) identificaron los factores de riesgo coronado entre hombres y mujeres en una dinica de cuidados de la salud a largo plazo De los 215 individuos negros 58 tienen diabetes mellitus al igual que 217 individuos blancos de 1140 Elabore un intervalo de confianza de 90 por ciento de confianzapara la diferencia entre las proporciones de las dos poblaciones tCuaies son las poblaciones correspondientes ~Que consideraciones son necesarias para hacer valido el procedimiento de inferencia

67 DETEHMINAUON DEL TAMANO DE LA MUESTRA PARA LA ESTIMACIONDEIAS MEDIAS

La pregunta de que tan grande debe ser una muestra surge inmediatamente al inicio del planteamiento de cualquier encuesta 0 experimento Esta es una pregunshyta importante y no se debe tratara la ligera Tomar una muestra mas grande de 10 necesario para obtener los resultados deseados es un desperdicio de recursos mienshytras que por otro lado las muestras demasiado pequenas con frecuencia dan resulshytados que carecen de uso practico En esta secci6n se estudia c6mo determinar el tamano de la muestra de acuerdo con la situaci6n A continuaci6n se proporciona un metodo para determinar el tamano de la muestra que se requiere para estimar Ia media de la poblaci6n yen la siguiente secci6n se aplica este metodo para detershyminar el tamano de la milestra cuando se desea estimar la proporci6n de una poshyblaci6n Mediante extensiltmes directas de estos metodos es posible determinar el tamano necesario de las muestras para situaciones mas complicadas

Objetivos El objetivo de la estimaci6n porintervalos es el de obtener intervalos estrechos con alta confiabilidad Si se observan los componentes ~e un intervalo de confianzase veque 8U dimension esta determinada por la magnitud de la cantidad

(coeficiente de confiabilidad) x (error estandar)

131 67 DETERMINACION DEL TAMANO PARA LA l-IUESTRAmiddot

ya que lamagnitud total del intervalo de confIanza es eldoble de esta cantidad Se aprendi6 que a esta cantidad generalmente se Ie llama precisi6n de la estimaci6n o margen de error Para un error estandar dado incrementar la confIabilidad signishyfIca un coefIciente con mayor confIabilidad Y un coefIciente con mayor confIabilidad produce unintervalo mas amplio

Por otra parte si se ftia el coefIciente de confIabilidad la unica manera de redudr la amplitud del intervalo es la reducci6n del error estandar Dado que el error estandar es igual a (J IJ y como (J es una constante la unica forma de obtener un error estandar menor es tomar una muestra grande ~Que tan grande debeser la muestra Esto depende del tamafio de (J la desviad6n estandar de la poblaci6n asi como del grado de confIabilidad y dimensi6n del intervalo deseados

Suponga que se desea obtener un intervalo que se extienda d unidades hacia uno y otro lado del estimador Ellose enuncia

d (coefIciente de confIabilidad) X (error estandar) (671)

Si el muestreo es con reemplazos a partir de una poblaci6n infInita 0 de una que sea 10 sufIcientemente grande como para ignorar la correcci6n por poblaci6n fInita la ecuaci6n 671 se transforma en

(J

d z- (672)-r la cual cuando se despeja n nos da

(673)d2

Cuando el nmestreo se hacesin reemplazos a partir de una poblaci6n fInita y peshyquefia se requiere de la correcci6n por poblaci6n fInita y la ecuaci6n 671 se transforma en

(J~d (674)fN~

que al despejar n resulta en

n-----shy (675)d 2(N 1) + Z2(J2

Si puede omitirse la correcci6n por poblad6n fInita la ecuaci6n 675 se reshyduce a la ecuaci6n 673

Estillluci6n de (J 2 Las f6rmulas para el tamafio de la muestra requieren del conocimiento de (J2 pero como ya se ha sefialado la varian cia de la poblaci6n casi

132 CAPITULO 6 ESTlMACION

siempre sedesconoce Como resultado esnecesarioestimar (J2 Las fuentes de estishymaci6n de(J2 que se utilizan con mas frecuencia son las siguientes

1 Se extrae una muestrapilato 0 prel~l11inar de lapoblaci6n y se puede utilizar la variancia calculada a partir de esta muestra como unaestimaci6n de (J2 Las observaciones uti lizadas en la muestra piloto se toman como parte de la muesshytrafinal de modo que n (el tamaiio calculado de la muestra) n

1 (el tamaiio

de la muestra piloto) n2 (el numero de observaciones necesarias para satisfacer el requerimiento total del tamaiio de la muestra)

2 A partir de estudios anteriores osimilares es posible obtener estimaciones de (J2

3Si se cree que la poblaci6n de lacual se extrae la muestraposee una distribushyci6n aproximadamente nqrmal se puede aprovechar el hecho de que la amshyplitud es aproximadamente igual a 6 desviaciones estandar y calcular (J R6 Este metodo requiere aIglin conocimiento acerca de los valores minimo y maximo de la variable en la poblaci6n

EJEMPLO 671

Un nutri6logo del departamento de salud al efectuar una encuesta entre una poshyblacien de muchachas adolescentes con e1 fin de determinitr su ingesti6n diaria promedio de proteinas (medidas en gramos) busc6 el consejo de un bioestadistico con respecto al tamaiio de la muestra que deberfa tomar

~Que procedimiento debe seguir el bioestadistico para asesorar al nutri610go Antes de que el estadistico pueda ayudar el nutri6logo este debe proporcionar tres elementos de informaci6n h dimensi6n deseada del intervalo de confianza el nivel de confianza deseado y la magnitud de la variancia de la poblaci6n

Soludon Suponga que el nutri6logo requiere un intervalo con una dimensi6n de aprQximadamente 10 gramos es decir la estimaci6n se deberfa enconshytrar alrededor de 5 gramos de la media de la poblaci6n en ambas direcshyciones En otras palabras se desea un margen de error de 5 gramos Suponga que se decide por un coeficiente de confian7a de 95 y que con base en su experiencia previa el nutri6logo percibe que la desviaci6n estandar de la poblaci6n es probablemente de alrededor de 20 gramos EI estadfstico dispone ya de la informaci6n necesaria para calcular el tamaiio de la muestra z 196 (J = 20 y d 5 Suponga que el tamaiio de la poblaci6n es grande asf queel estadistico puede ignorar la correcshyci6n por poblaci6n finita y utilizar la ecuaci6n 673 Con las sustitucioshynes adecuadas el valor de n se calcula como

Se recomienda que el nutri610go tome una muestra de tamafio 62 AI calcular el tamaiio de una muestra a partir de las ecuaciones 673 0 675 el resultado se redondea al siguiente nurnero entero mayor si los calculosdan un numerocon decimales bull

183 68 DETERMINACION DEL TAl1ANO PARA LAS PROPORCIONES

EJERCICIOS

671 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su hospital Si se desea un intervalo de confianza de 99 por dento con una amplitud de 1 libra ~que tan grande debe ser la muestra de los registros de nacimiento Suponga que un estimashy

dor razonable para (J es 1 libra ~De que tamano debe ser la muestra si el coeficiente de confiabilidad se hace descender a 95

672 El director de la secdon de control dela rabia del departamento de salud publica desea extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso del ano anterior para estimar la edad media de las personas mordidas Requiere un intervalo de confianza de 95 por dento decide utilizar un valor de 25 para d y a partir de estudios anteriores estima que la desviacion estandar de la poblacion esta alrededor de los 15 anos ~Que tan grande debe ser el tamano de la muestra

673 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mglOO ml) de pacientes atendidos en una clinica para diabeticos durante el transcurso de los ultimos 10 anos Determine el numero de registros que el medico debe examinar para obtener un intershyvalo de confianza de 90 por ciento para 11 si la dimension requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varian cia de 60

674 Se deseaestimar la edad media en la que a los padentes de esclerosis multiple se les diagnosshytico el padecimiento por primera vez Se requiere un intervalo de confianza de 95 por dento con una dimension de 10 anos Si la variancia de la poblaci6n es de 90 ~que tan grande debera ser la muestra

68 DETERMINACION DELTAMANO DE lA MUESTRA PARA lA ESIDIACION DE lAS PROPORCIONES

EI metodo para estimar el tamafio de la muestra cuando se requiere estimar la proshyporcion de una poblacion es esencialmente el mismo que se describio para estimar la media de una poblacion Se aprovecha el hecho de que la mitad del intervalo deseashydo d se puede igualar al producto del coeficiente de confiabilidad y el error estandar

Si se supone que el muestreo ha sido hecho de manera aleatoria y que existen condiciones que garanticen que la distribuci6n de psea aproximadamente normal se obtiene la siguiente formula para n cuando el muestreo es con reemplazo cuanshydo se realizaa partir de una poblacion infinita 0 ruando la poblacion muestreada es 10 suficientemente grande como para hacer innecesario el uso de la correcci6n por poblacion finita

n (681)

dondeq = I-p Si la correccion por poblacion finita no puede descartarse la formula adecuashy

da paran es

(682)n d 2 (N -1)+z2pq

euan do N es grande en comparacion con n (es decir n IN 05) se puede pasar por alto la correccion por poblacion finita y la ecuacion 682 se reduce a la ecuacion 681

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

166 CAPITULO 6 ESTIMACION

base del flUjD continuo inspiratDriD (Us) 90 97 103110 104 100 CDnsidere que una muestra aleatDria simple esta cDnfDrmada pDr seis individuDs a partir de una pDblacion que sigue una distribuci6n nDrmal CDn individuDs CDn la misma enfermedad

a) ~Cuat es la estimaci6n puntual de la media de la pDblaci6n

b) ~Cuil es la desviacion estandar de la muestra

c) ~Cultll es la estimacion del error estandar para la media de la muestra

d) CDnstruya un intervalD de cDnfianza de 95 pDr ciento para el flUjD mediD cDntinuD inspishyratDriD de la pDblaci6n

e) ~Cual es la precision de la estimacion

f) Explique la interpretaci6n prDbabilistica para este intervalD de confianza

g) Explique la interpretacion practica para este intervalD de cDnfianza

633 LlDyd y MaillDux (A-3) informaron IDS siguientes datDs acerca del peso de la glandula pituitaria en una muestra de cuatrD ratas de Wistar Furth

media = 90 mg error estandar para la media = 3

FUEJTE Ricardo V Lloyd y Joe Mailloux Analysis ofSshy100 Protein Positive Folliculo Stellate Cells in Rat Pituitary Tissues AmericanJournal ofPathology 133 338-346

a) ~Cual es la desviadon estandar de la muestra

b) CDnstruya un intervalD de confianza de 95 pDr ciento para el peso medio de la glandula pituitaria para una pDblacion similar de ratas

c) ~Que supDsiciDnes se necesitan para que sea validD el intervalo de cDnfianza del inciso b

d) ~Que interpretacion puede ser la mas indicada cuandD se trata sDbre intervalos de conshyfianzacon alguien que no sabe de estadfstica Explique pDrque es la mas cDnveniente

e) 5i fuera necesario elabDrar un intervalD de cDnfianza de 90 pDr cientD para la media de la pDblaci6n ~el intervalD de cDnfianza serta mayDr 0 menor que el intervalD de 95 pDr dentD Explique su respuesta sin construir realmente el intervalD de cDnfianza

f) 5i [uera necesariD considerar un intervalo de CDnfianza de 99 pDr cientDpara lamedia de la poblacion ~el intervalo de cDnfianza serra mayDr 0 menDr que el intervalD de 95 pDr dentD Explique su respuesta sin cDnstruir realmentt el intervalD de cDnfianza

634 Kaminski y Rechberger (A-4) encontrarDn en un estudio sDbre la preeclampsia que la media de la presi6n sistolica sangufnea en 10 mujeres sanas y que no estan embarazadas es de 119 CDn una desviacion estandar de 21

a) 2Cual es el errDr estandar estimadD para la media

b) CDnstruya un intervalD de confianza de 99 pDr cientD para la media de la poblaci6n a partir de la cual puede considerarse que IDS 10 individuos conforman una muestra aleatoria

c) ~CUlil es la precisi6n estimada

d) ~Que consideraciones deben hacerse para comprobar la validez del intervalo de confiahza

635 Unamuestra de 16nifias de 10 afiDS pesan en promediD 715 con una desviacion estandar de 12libras CDnsidere el calculD de intervalDs de cDnfianza de 9095 y 99 pDr ciento para I-L

167 64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS

636 Una muestra aleatoria simple conformada por 16 individuos aparentemente sanos presenta los siguientes valores de arsenico eliminado en la orina (miligramos por dfa)

Individuo Valor Individuo Valor

1 007 9 012 2 030 10 006 3 025 11 010 4 008 12 032 5 030 13 006 6 038 14 009 7 007 15 014 8 005 16 011

Elabore un intervalo de confianza de 95 por ciento para la media de la poblaci6n

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES

En ocasiones se presentan casos en los que se desea estimar 1a diferencia entre 1a media de dos poblaciones A partir de cada poblacion se extrae una muestra aleatoria independiente y de los datos de cada una se calculan las medias muestrales XI y x2

respectivamente En el capitulo anterior se dijo que el estimador XI - x2 ofrece una estimacion insesgada de la diferencia entre las medias de las poblaciones III shy11 2 bull La variancia del estimador es (cr~ n l ) + (cr~ n 2 ) Tambien se menciono que seglin las condiciones la distribucion muestral de XI - x2 puede presentar una distribution al menos aproximadamente normal de modo que en muchos casos se utiliza la teorfa adecuada para las distribuciones normales en el calculo de un intershyvalo de confianza para III - 11 2 bull Cuando se conocen las variancias de la poblacion el intervalo de confianza del 100(1 - ex) por ciento para III - 112 esta dado por

(641)

El anal isis del intervalo de confianza para la diferencia entre las medias poblacionales ofrece informacion util para decidir si es 0 no probable que las medias de las dos poblaciones sean iguales Cuando el intervalo no incluye al cero se dice que el intervalo ofrece evidencia de que las dos poblaciones tienen medias diferentes Cuando el intervalo incluye al cero se dice que las poblaciones pueden tener meshydias iguales

Esto se ilustra a continuacion para el caso donde el muestreo se realiza a partir de una distribucion normal

168 CAPITULO 6 ESTlMACI6N

EJEMPLO 641

A un equipo de investigacion Ie interesa conocer la diferencia entre las concentracioshynes de acido urico en pacientes con y sin el sfndrome de Down En un gran hospital para el tratamiento de pacientes con retardo mental una muestra de 12 individuos con el sindrome presenta una media de XI = 45 mgll00 mL En un hospital general se encontro que una muestra de 15 individuos normales de la misma edad y sexo presenta un nivel medio de x2= 34 Si es razonable suponer que las dos poblaciones de valores muestran una distribucion normal y sus variancias son iguales a 1 y 15 calcule el intervalo de confianza de 95 por ciento para ~l - ~2

Soluci6n Para una estimacion puntual de III 112 se udliza Xl X2= 45 34 11 EI coeficiente de confiabilidad que corresponde a 95 localizado en la tabla D es 196 EI error estandar es

Por 10 tanto el intervalo de confianza de 95 por ciento es

11 plusmn 196(4282) 11plusmn84 26 194

Se dice que se dene una confianza de 95 por ciento de que la difeshyrencia real 111 - 112 este entre 26 y 194 porque en muestreos repetidos 95 por ciento de los intervalos construidos de esa manera incluiria la diferencia entre las medias reales

Puesto que el intervalo no incluye al cero se concluye que las dos poblaciones tienen diferentes medias bull

Muestreo a partir de poblaciones que no signen una distribuci6n ItOrmal La construccion de un intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando el muestreo se realiza a partir de poblaciones no normales se lleva a cabo en la forma descrita en el ejemplo 641 si las muestras n l y n

2 son grandes Una vez mas este es un resultado del teorema del limite central

Si se desconocen las variancias de la poblacion se utili zan las variancias de las muestras para estimarlas

IUEMPLO 642

Motivados por d conocimiento de la existencia de una gran cantidad de textos polemicos que sugieren que el estres la ansiedad y la depresion son dafiinos para el sistema inmunologico Gormanet ai (4-5) condujeron un estudio en el que se conshysider6 a individuos varoneshomosexuales algunos con VIH (virus de inmunodefishyciencia humana) positivo y otros con VIH negativo Los datos fueron registrados con una amplia vltJriedad de mediciones medicas inmunologicas psiquiatricas y neurol6gicas una de las cuales corresponde al numero de celulas CD4+ en la sanshy

64 INTERV ALO DE CONFIANZA PAHALA DIFERENCIA ENTRE DOS MEDIAS 169

gre El numero promedio de celulas CD4+ para middot112 individuos con infecci6n por VIR fue de 4018 con una desviaci6n estandar de 2264 Para los 75 individuos sin la infecci6n por VIR la media y la desviaci6n estandar fueron de 8282 y 2749 respectivamente Se pretende elaborar un intervalo de confianza de 99 por ciento para la diferencia de las medias de las poblaciones

Soluci6n No hay informaci6n con respecto a la forma de la distribuci6n de las celulas CD4+ Sin embargo como el tamafto de las muestras es grande el teorema del limite central asegura que la distribuci6n muestral de las diferencias entre las medias de la muestra siguen una distribuci6n aproxishymadamente normal independientemente de que la distribuci6n de la variable en las poblaciones no siga una distribuci6n normal Se puede utilizar este hecho para justificar el uso de la estadistica z como factor de confiabilidad en la construcci6n del intervalo de confianza Tampoco hay informaci6n acerca de las desviaciones estandar por 10 que puede emplearse las desviaciones estandar de las muestras para estimarlas La estimaci6n puntual para la diferencia entre las medias de las poblacioshynes es la diferencia entre las medias de las muestras 8282 - 4018 = 4264 En la tabla D se encuentra que el factor de confiabilidad es 258 La estimaci6n del error estandar es

s __ = 27492

+ 22642 =382786

Xl-X 75 112

Por la ecuaci6n 641 el intervalo de confianza de 99 por ciento para la diferencia entre las medias de la poblaci6n es

4264 plusmn 258(382786) 3276 5252

Se tiene la seguridad de 99 por ciento de que el promedio de celulas CD4+ en varones con VIR positivo difieren de la media para los varoshynes con VIR negativo por 3276 a 5252 bull

Distribuci6n t y la diferencia entre las medias Cuando no se conocen las variancias y se pretende estimar la diferencia entre las medias de dos poblacioshynes con un intervalo de confianza es posible utilizar la distribuci6n t para suminisshytrar el factor de confiabilidad si se conocen ciertas suposiciones se debe saber 0

suponer de buena fe que las dos poblaciones muestreadas siguen una distribuci6n normal Respecto a las variancias de las poblaciones se debe distinguir entre dos situaciones 1) la situaci6n en la que las variancias son iguales y 2) la situaci6n en la que no 10 son A continuaci6n se consideranambas sitpaciones por separado

Varianciaspoblacifmales iguales Si la suposici6n sobre igualdad de las variancias de las poblaciones esta justificada las dos variancias de las muestras calculadas a partir de las muestras independientes pueden considerarse como estishymaciones de 10 mismo es decir la variancia comun Parece 16gico entonces aproshyvechar este hecho en el anal isis en cuesti6n Esto es precisamente 10 que se hace para establecer una estimaci6n conjunta para la variancia comun Esta variancia se obtiene mediante el caIculo promedio ponderado de las dos variancias de las muesshy

170 CAPITULO 6 ESTlMACI6N

tras Cada variancia de la muestra es ponderada con base en sus grados de libertad Si los tamafios de las muestras son iguales este promedio ponderado es la media aritmetica de las variancias de las dos muestras Si el tamano de las dos muestras es distinto el promedio ponderado aprovecha la informacion adicional proporcionada por la muestra mayor La estimacion con junta se obtiene con la fOrmula

S2 = (nl _1)SI2 + (n2 l)s~ p (642)

+n2 -2nl

Asf la estimacion del error estandar esta dada por

(643)

y el intervalo de confianza de 100(1 a) por ciento para III 112 esta dada por

(644)

El nfunero de grados de libertad utilizado para determinar el valor de t que se usa para construir el intervalo es n

1 + n

2 2 que es el denominador de la ecuacion

642 Este intervalo se interpreta en la forma habitual Los metodos que pueden emplearse para tomar la decision acerca de la igualshy

dad de las variancias de las poblaciones se estudian en la seccion 610 y 78

EJEMPLO 643

Uno de los estudios de Stone et al (A-6) tuvo como objetivo determinar los efectos del ejercicio por un tiempo prolongado en los ejecutivos de una compania inscritos en un programa supervisado de acondicionamiento fisico Se registraron datos de 13 individuos (el grupo deportista) que voluntariamente se inscribieron el programa y que permanecieron activos por 13 anos en promedio y de 17 individuos (el segunshydo grupo el sedentario) que decidieron no inscribirse Entre los datos que se regisshytraron acerca de los individuos esta el mlmero maximo de sentadillas realizadas en 30 segundos El grupo deportista obtuvo una media y una desviacion estandar de 210 y 49 respectivamente La media y la desviacion estandar para el grupo sedenshytario fueron 121 y 56 respectivamente Se considera que las dos poblaciones de medici ones de acondicionamiento muscular siguen una distribuci6n aproxirnadashymente normal y que las variancias para ambas poblacionesson iguales Se pretenshyde elaborar un intervalo de confianza de 95 por ciento para Ja diferencia entre las medias de as poblaciones representadas por las dos muestras Soluci6n Primero se utiliza la ecuaci6n 642 para calcular la estimaci6n conjunta

de la variancia comtin de las poblaciones

(13-1)(49 2 )+(17 1)(562 ) =2821

13+17-2 Cuando se consulta la tabla E con 13 + 17 - 2= 28 grados de libertad y el nivel de confianza de 95 se encuentra que eLfactor de confiabilidad es 20484 Con la ecuacion 644 se calcula el intervalo de confianza de

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS 171

95 por ciento para la diferencia entre las medias de las poblaciones de la siguiente manera

2821 2821(210-121)plusmn20484 --+-shy

13 17 89 plusmn 40085

49129

Se tiene una confianza de 95 por ciento de que la diferencia entre las medias de las poblaciones estan entre 49 y 129 Se puede decir esto porque se sabe quesi se repite el amilisis muchfsimas veces y se calculan los intervalos de confianza de la misma manera cerca de 95 por ciento de los intervalos de confianza induiran la diferencia entre las medias de las poblaciones

Debido a que los intervalos no induyen al cerose conduye que las medias de las poblaciones son diferentes bull

Variancias poblacionales distintas Cuando no se puede conduir que las variancias de dos poblaciones de interes son iguales aun ruando pueda suponerse que las dos poblaciones presentan distribuciones normales no es adecuado utilizar la distribucion t como se acaba de describir para construir los intervalos de confianza

Una solucion al problema de variancias distintas fue propuesta por Behrens (3) y posteriormente fue verificada y generalizada por Fisher (4 5) Neyman (6) Scheffe (7 8) Y Welch (9 10) tambien proponen soluciones EI problema es analizashydo en detalle por Cochran (11)

EI problema gira en tomo al hecho de que la cantidad

no sigue una distribuci6n t con nj + n 2 grados de libertad ruando las variancias 2 shy

de las poblaciones son distintas Consecuentemente la distribucion t no se puede utilizar en la forma habitual pata obtener el factor de confiabilidad del intervalo de confianza para la diferencia entre las medias de dos poblaciones que tienen variancias diferentes La solucion propuesta por Cochran consiste en el calculo del factor de confiabilidad mediante la siguiente formula

wltj + w2tZ t l

f

-0f2 = (645) WI +w2

donde WI 512

np W 2 = s~ n2 tl = tl _ para nj - 1 grados de libertad y t2 = t l

_w2aI2

para n2

- 1 grados de libertad Un intervalo aproximado de confianza del 100(1 shya) por ciento para III - 112 esta dado por

(646)

172

EJERCICIOS

CAPITULO 6 ESTlMACION

FJEIUPLO 644

En la investigacion de Stone et al (A-6) descrita en el ejercicio 643 los investigashydores tambien informaron los siguientes datos de las medici ones referentes a todas las calificaciones del acondicionamiento muscular logradas por los individuos

Muestra n Media Desviaci6n estimdar

Grupo deportista 13 45 3

Grupo sedentario 17 37 10

Se considera que las dos poblaciones de todas las calificaciones de acondicionashymiento muscular siguen una distribuci6n aproximadamente normal Sin embargo no debe suponerse que las dos variancias poblacionales son iguales Se pretende construir un intervalo de confianza de 95 por ciento para la diferencia entre las medias de todas las calificaciones de acondicionamiento muscular para las dos poshyblaciones representadas por las muestras

Soluci6n Se utiliza t de la ecuaci6n 645 para calcular el factor de confiabilidad En la tabla E se muestra que con 12 grados de libertad y 1 - 052 = 975 t( 21788 Analogamente con 16 grados de libertad y 1- 052 = 975 t2 = 21199 Ahora Sf calcula

(3 2 13)(21788) + (102 17)(21199) 139784 t= =

(3 2 13)+(102 17) 065747

=21261

Con la ecuaci6n 646 ahora se construye el intervalo de confianza de 95 por ciento para la diferencia entre las medias de las dos poblaciones

2 2

(45 37)plusmn21261 3 + 10 13 17

8 plusmn 21261 (25641101) 25134

Puesto que el intervalo no incluye acero se concluye que las medias de las dos poblaciones son diferentes bull

Cuando se construyen intervalos de confianza para la diferencia entre las medias de dos poblaciones es posible utilizar la figura 641 para decidir rapidashymente si el factor de confiabilidad debe ser z t 0 tf

Para cada uno de los siguientes ejercicios construya intervalos de confianza de 90 95 y 99 par ciento para las diferencias entre las medias poblacionales Establezca consideraciones que hagan que el metodo sea valido Determine las interpretaciones practica y probabilistica

clJ clJ FIGURA 541 Diagrama de flujo para decidir si e1 factor de confiabilidad debe ser z tot cuando se realizan inferencia inferencias acerca de la diferencia entre las medias de dos pobladones (Para usar un procedimiento no parametrico ver el capitulo 11)

174 CAPiTULO 6 ESTlMACION

para cad a intervalo construido Suponga las variables bajo considerati6n en cad a ejercicio y establezca para que pueden servir a los investigadores esos resultados

641 EI objetivo de un experimento de Buckner et al (A-7) consisti6 en estudiar los efectos del relajamiento muscular inducido por el pancuronium en el volumen del plasma circulante Los individuos estudiados son recien nacidos con un peso mayor a 1700 gramos que necesishytaron de ayuda para respirar durante las primeras 24 horas despues de nacer y cumplieron con otros criterios cHnicos Cinco recien nacidos paraIizados con el pancuronium y siete recien nacidos no tratados presentaron las siguientes estadisticas en la segunda de las tres mediciones del volumen de plasma (ml) hecha durante la respiraci6n mecanica

Paralizados 480 81 No tratados 567 81

La segunda medici6n para el grupo tratado ocurri6 de 12 a 24 horas despues de la primera dosis de pancuronium Para el grupo no tratado las mediciones se hicieron de 12 a 24 horas despues de iniciar la respiracion mecanica

642 Zuckery Archer (A-8) afirman que la N-nitrosobis (2-oxopropyl)amina (BOP) y las nitrosaminas 3-oxidizadas producen una alta incidencia de tumores de conductos pancreaticos en el hamster dorado sirio Estudiaron los efectos en el peso sangufneo en la glucosa del plasma en la insulina yen los niveles de transamina glutamico-oxaloacetica del plasma (GOT) de los hamsters expuestos in vivo a la BOP Los investigadores reportaron los siguientes resultados en ocho animales tratados y 12 sin tratamiento

Variable Sin tratamiento Con tratamiento

Glucosa del plasma (mglgl) 101 plusmn 5 74plusmn 6

FUENTE Peter F Zucker y Michael C Archer Alterations Pancreatic Islet Function Produced by Carcinogenic Nitrosamines in the Syrian Hamster AmericanJournal oPathology 133 573-577

Los datos son la media de la muestra plusmn la estimaci6n del error estandar de la media de la muestra

643 Los objetivos de un estudio de Davis et al (A-g) son evaluar 1) la eficacia del programa auto ayuda momento para dejar de fumar cuando se utiliza con base de uno a uno en el hogar y 2) la viabilidad de ensefiar temicas para abandonar el habito de fumar a los estudiantes de enfermerfa en bachillerato A estudiantes graduados de enfermerfa inscritos en dos cursos de metodologia de la investigacion de la Universidad de Ottawa se les invit6 a participar en el proyecto Se aplic6 un cuestionario de opcion multiple para abandonar el habito de fumar a 120 estudiantes de enfermeria que participaron y a otros 42 estudiantes que no participashyron antes ni despues del estudio Se calcularon las diferencias entre las calificaciones antes y despues del estudio as como las siguientes estadisticas a partir de las diferencias

EJERCICIOS 175

Grupo Media Desviaci6n estandar

Participantes (A) 214444 15392 No participantes (B) 33333 14595

644 El doctor Ali Khraibi (A-IO) de la CHnica y Fundaci6n Mayo condujo una serie de experishymentos con el fin de evaluar las respuestas diureticas y natiureticas de ratas Okamoto esponshytaneamente hipertensivas (REB) y ratas Wistar-Kyoto (WRY) para dirigir incrementos en la presion hidrostatica renal intersticial (PBRI) Para aumentar la PBRI se utiIiz6 la expansi6n directa del volumen renal intersticial (DRIVE) a traves de una matriz implantada cronicamente en el rinOn Entre los datos registrados durante el estudio estan las siguientes mediciones de excreci6n de sodio a traves de la orina (UNa V) durante el periodo de DRIVE

Grupo

REB 632572796483527 2WKY 420469482 108210

FUENTE Publicada con autorizaci6n del Dr Ali A Khraibi

645 Osberg y Di Scala (A-II) realizaron un estudio centrado en la eficacia de los cinturones de seguridad para reducir 1esiones entre sobrevivientes de accidentes automoviHsticos internashydos en hospitales con edades de 4 a 14 afios El estudio compar610s resultados de 123 ninos que utilizaron el cintur6n contra 290 que no 10 utilizaron entre aquellos que se vieton enshyvueltos en tales accidentes y que fueron hospitalizados El informe con tenia la siguiente estadistica del numero de dfas en la unidad de cuidados intensivos

Grupo Media Error estandar estimado

Utiliz6 el cintur6n 83 16 No utiliz6 el cintur6n 139 18

646 La medicion del diametro transversal del coraz6n de hombres y mujeres adultos presenta los siguientes resultados

sx Grupo Tamafto de Ia muestra (cm) (cm)

Varones 12 1321 105 Mujeres 9 IIOO 101

Considere que las poblaciones siguen una distribucion normal con variancias iguales

176 CAPITULO 6 ESTIMACION

647 Veintiruatro animales de laboratorio con deficiencia de vitamina D fueron divididos en dos grupos iguales EI grupo 1 recibi6 un tratamiento consistente en una dieta que proporcionashyba vitamina D EI segundo grupo no fue tratado AI termino del periodo experimental se midieron las concentraciones de calcio ensuero obteniendose los siguientes resultados

Grupo tratado X 111 mg 100 mls = 15 Grupo sin tratamiento x= 78 mg 100 ml s = 20

Considere que las poblaciones siguen una distribuci6n normal con variancias iguales

648 Ados grupos de nifios se les hicieron pruebas de agudeza vi~ual El grupo 1 estuvo formado por 11 nifios que recibieron la atenci6n de medicos privados La calificaci6n media para este grupo fue de 26 con una desviaci6n estandar de 5 El segundogrupo que incluy6 14 nifios que recibieron atenci6n medica por parte del departamento de salud publica tuvo una calishyficaci6n promedio de 21 con una desviaci6n estandar de 6 Suponga que las poblaciones siguen una distribuci6n normal con variancias iguales

649 El tiempo promedio de estancia de una muestra de 20 pacientes dados de alta de un hospital general es de siete dras con una desviaci6n estaildar de dos dras Una muestra de 24 padenshytes dados de alta de un hospital de enfermedades cr6nicas tuvo un tiempo promedio de estancia de 36 dfas con una desviaci6n estindar de 10 dias Suponga que la poblaci6n sigue una distribuci6n normal con variancias desiguales

6410 En un estudio de factores que se consideran responsables de los efectos adversos del tabashyquismo sobre la reproducci6n humana se midieron los niveles de cadmio (nanogramos por gramo) en el tejido de la placenta de una muestra de 14 madres que fumaban y una muestra aleatoria independiente de 18 mujeres no fumadoras Los resultados fueron los siguientes

No fumadoras toO 84 128250 118 98 125 154 235

94251 1952559875 118122150

Fumadoras 300301150241305178168148

134285 175 144 125204

ms probable que el nivel medio de cadmio registrado sea mayor entre las fumadoras que entre las no fumadoras ~Por que se llegarfa a esta conclusi6n

65 INTERVALO DE CONFIANZA PARA IA PROPORCION DE UNA POBIACION

Muchas preguntas de interes para que el tecnico en salud tienen relacion con las proporciones de poblacion ~Que propordon de padentes que redben un tipo espeshycial de tratamiento se recuperan ~Que proporcion de alguna poblacion tiene cierta enfermedad ~Que propordon de una poblacion es inmune a derta enfermedad

Para estimar la proporcion de una poblacion se procede en la misma forma que cuando se estima la media de una poblacion Se extrae una muestra de la poblacion de interes y se calcula su proporcion p Esta se utiliza como el estimador puntual para la proporcion de la pobladon Un intervalo de confianza se obtiene mediante la siguiente formula general

estimador plusmn (coefidente de confiabilidad) X (error estandar)

EJERCICIOS

EJERCICIOS 177

En el capitulo anterior se vio que cuando np y n(1 - p) son mayores que 5 se puede considerar que la distribuci6n muestral de pse aproxima bastante a una distribuci6n normal Cuando se cumple con esta condici6n el coeficiente de confiabilidad es algUn valor de z de la distribuci6n normal estandar Esta visto que el error estandar es igual a (J p =fi(l-p) n Puesto que p que es el parametro que se trata de calcular se desconoce se debe utilizar pcomo una estimaci6n Asf se estima (J j por medio de ~p(l Pn y el intervalo de confianza de 100(1 - 0) por ciento para pesta dado por

pplusmn Z(I-1J2)~P(l- P) Fn (651)

Este intervalo se interpreta tanto desde el punto de vista practico como probabilistico

FJEMPLO 651

Mathers et al (A-12) encontraron queen una muestra de 591 pacientes internados en un hospital psiquiatrico 204 admitieron que consuniieron marihuana al meshynos una vez durante su vida Se pretende construir un intervalo de confianza de 95 por ciento para la proporcion de individuos que consumieron marihuana durante su vida en la poblaci6n muestreada de los internos del hospital psiquiatrico

Solucion La mejor estima~i6n puntual para la proporci6Il de la poblaci6nes p== 204591 3452 El tamafio de la muestra y hiestimacion de p tienen una magnitud suficiente parajustifKar el empleo de la distribucion norshymal estandar paraelaborar un intervalo de confianza EI coeficiente de corifiabilidad que corresponde alnivel de confianza de 95 es 196 la estimacion del errorestandar (Jp es ~p(l-pgtn = (3452)(6548)591

0 1956El intervalo de confianza para p de acuerdo con estos datos es

3452 plusmn 196(01956) 3452 plusmn 0383 3069 3835

Se puede decir que se tiene 95 por ciento de confianza de que la proporshycionpeste entre 3069 y 3835 ya que al repetir el muestreo casi 95 por ciento de los intervalos construidos en la forma de este intervalo inclushyyen a la proporcion p real Con base en estos resultados se espera con una confianza de 95 por ciento encontrar que entre 3069 y 3835 por ciento de los internados en el hospital psiquiatrico tiene antecedentes de consumo de marihuana bull

Para cada uno de los siguientes ejercicios establezca la interpretacion prictica yprobabilistica de los intervalos que se pide construir Identifique cada componente del intervalo la estimashycion puntual el coeficiente de confiabilidad yel error estandar Explique por que los coefishycientes de confiabilidad no son los misInos para todos los ejercicios

178 CAPITULO 6 ESTIIlACI6N

651 En una investigaci6nde ninos maltratados en pacientes psiquiatricos Brown y Anderson (A-IS) encontraron 166 pacientes en una muestra de 947 con antecedentes de abuso sexual y maltrato flsico Construya un intervalo de confianza de 90 por dento para la proporci6n de la poblaci6n

652 Catania et at (A-14) obtuvieron datos respecto al comportamiento sexual de una muestra de hombres y mujeres solteros con edades entre 20 y 44 residentes en areas geoijfaficas caracshyterizadas por tasas altas de enfermedades de transmision sexual e ingreso a programas de drogas De 1229 encuestados 50 por ciento respondieron que nunca utilizaron preservatishyvos Construya un intervalo de confianza de 95 por ciento para la proporcion de la poblaci6n que nunca utiliza preservativos

653 Rothberg y Lits (A-I 5 ) estudiaron el efecto del estres de la maternidad durante el embarazo en el peso del producto Los individuos eran 86 mujeres blancas con antecedentes de estres que no tenfan faetores de riesgo medico u obstetrico conoddo de peso bajo del producto Los investigadores eneontraron que 128 por dento de las madres estudiadas dieron a luz bebes que cubrfan el criterio de peso bajo Construya un intervalo de confianza de 99 por ciento para la proporci6n de la poblaci6n

654 En una muestra aleatoria simple de 125 varones desempleados quienes desertaron de la escuela preparatoria entre las edades de 16 y 21 anos inclusive 88 declararon que eran consumidores regulares de bebidas alcoh6litas Construya un intervalo de eonfianza de 95 por ciento para la proporcion de la poblacion

66 INTERVALO DE CONFIANZA PARA lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS POBlACIONES

A menudo se tiene interes en conocer la magnitud de la diferencia entre las proporcioshynes de dospoblaciones Es posible que se quiera comparar por ejemplo entre hombres y mujeres dos grupos de edades dos grupos socioecon6micos 0 dos grupos de diagshynostico con respecto a la proporcion que posee alguna caractenstica de interes Un estimador puntual insesgado de la diferencia entre dos proporciones de las poblacioshynes se obtieneal calcular la diferencia de las proporciones de las muestras PI P2 Tal como Se ha visto cuando n1 Yn2 son de gran tamano y las proporciones de la poblacion no estan muy cerca de 0 0 de 1 es posible aplicar el teorema del limite central y utilizar la teona de la distribucion normal para obtener los intervalos de conshyfianza EI error estandar de la estimacion se calcula mediante la siguiente formula

dado que como regIa se desconocen las proporciones de Ia poblacion Un intervashy10 de confianza de 100(1 - a) por ciento para PI P2 se obtiene as

(661)

Es posible interpretar este intervalo desde elpunto de vista probabiHstico y practico

EJERCICIOS 179

EJEMPLO 661

Borst et al (A-16) investigaron la relaci6n de desarrollo del ego edad sexo y diagshyn6stico de suicidio entre los internos adolescentes de la unidad de psiquiatria La muestra consistia en 96 varones y 123 niiias con edades entre 12 y 16 aiios seleccioshynados de entre los internados en la unidad de adolescentes y niiios de un hospital psiquiatrico privado Se reportaron 18 niiios y 60 niiias con intento de suicidio Cons ishyderese el comportamiento de las niiias como el de una muestra aleatoria simple a partir de una poblaci6n similar de niiias y que los j6venes igualmente pueden considerarse como una muestra aleatoria simple extraida de una poblaci6n similar de niiios Para estas dos poblaciones se pretende construir un intervalo de confianshyza de 99 por ciento para la diferencia entre las proporciones de los individuos con intento de suicidio

Soluci6n Las proporciones para las niiias y niiios respectivamente son Pc = 601 123 = A878y PB = 1896 1875 La diferencia entre las proporciones de lasmuestrases Pc PB = 4878 1875 = 3003 El error estandar estimado de la diferenda entre las proporciones de las muestras es

(4878)(5122) (1875)(8125) ---~~-~ +-------shy

123 96

El factor de confiabilidad a partir de la tabla D es 258 de modo que el intervalo de confianza con la f6rmula 661 es

3003 plusmn 258(0602) 14504556

Se dene la confianza de 99 por dento de que para las poblaciones muestteadas la ptopord6n de intentos de suiddio entre las niiias exceshyde a lapropord6n de intentosde suiddio entre los varones por 1450 y 4556

Puesto que el intervalo no incluye al cero se concluye que las dos proporciones de pobladones son diferentes bull

FJERCICIOS

Para cada uno de los siguientes ejercicios establezca las interpretaciones pnicticas y probabishylisticas de los intervalos que se pide construir Identifique cada componente del intervalo la estimaci6n puntual el coeficiente de confiabilidad y el error estandar Explique por que los coeficientes de confiabilidad no son el mismo para todos los ejercicios

661 Hargers et al (A-17) del departamento de Salud PUblica y Ambieptal en Amsterdam condushyjeron un estudio en el que los individuos eran consumidores de drogasinyectables (CDI) En una muestrade 194 consumidores de metadona regular de largo plazo (MLP) 145 eran varones En una muestra de 189 CDIque no consmiddotumian MLP 133 eran varones Establezca las consideraciones necesarias acerca de las muestras ypoblaciones representadas y construshy

180 CAPITULO 6 ESTlMACI6N

ya un intervalo de confianza de 95 por ciemo para la diferenda entre las proporciones de varones en las dos poblaciones

662 Una investigaci6n de Lane et ai (A-I8) valor6las diferencias en las pnicticas de deteccion de cancer de seno entre muestras de mujeres predominantemente de bajos ingresos con edashydes de 50 a 75 anos que lltilizan los servicios de c1inicas de sailld para todo el estado y mlljeres de la misma edad residentes en ciudades donde las c1inicas de salud son locales De las 404 encuestadas seleccionadas en toda la comunidad 592 por ciento estuvo de acuerdo con el siguiente comentario acerca del cancer de pecho las mujeres prolongan su vida si detectan el cancer desde el inicio De entre 795 usuarias de clinicas de salud en la mllestra 449 por ciento estuvo de acuerdo Establezca las suposiciones apropiadas para elaborar un intervalo de confianzade 99 por ciento para la diferencia entre las dos proporciones de las poblaciones de interes

663 Williams et at (A-19) encuestaron a una muestra de 67 medicos y 133 enfermeras con famishyliares farmacodependientes EI prop6sito del estudio era evaluar la influencia en los medishyEOS y enfermeras de estar estrechamente involucrados con una 0 mas personas farmaco dependientes Cincuenta y dos medicos y 89 enfermeras dijeron que vivian con personas farmacoldependientes que adversamente afectaban 8U trabajo E8tablezca todas las consideshyraciones que crea necesarias para construir un intervalo de confianza de 95 por ciento para la diferencia entre las proporciones en las dos poblaciones de trabajadores que se espera esten adversamente afectados por vivir con personas farmacodependientes

664 Aronow y Kronzon (A-20) identificaron los factores de riesgo coronado entre hombres y mujeres en una dinica de cuidados de la salud a largo plazo De los 215 individuos negros 58 tienen diabetes mellitus al igual que 217 individuos blancos de 1140 Elabore un intervalo de confianza de 90 por ciento de confianzapara la diferencia entre las proporciones de las dos poblaciones tCuaies son las poblaciones correspondientes ~Que consideraciones son necesarias para hacer valido el procedimiento de inferencia

67 DETEHMINAUON DEL TAMANO DE LA MUESTRA PARA LA ESTIMACIONDEIAS MEDIAS

La pregunta de que tan grande debe ser una muestra surge inmediatamente al inicio del planteamiento de cualquier encuesta 0 experimento Esta es una pregunshyta importante y no se debe tratara la ligera Tomar una muestra mas grande de 10 necesario para obtener los resultados deseados es un desperdicio de recursos mienshytras que por otro lado las muestras demasiado pequenas con frecuencia dan resulshytados que carecen de uso practico En esta secci6n se estudia c6mo determinar el tamano de la muestra de acuerdo con la situaci6n A continuaci6n se proporciona un metodo para determinar el tamano de la muestra que se requiere para estimar Ia media de la poblaci6n yen la siguiente secci6n se aplica este metodo para detershyminar el tamano de la milestra cuando se desea estimar la proporci6n de una poshyblaci6n Mediante extensiltmes directas de estos metodos es posible determinar el tamano necesario de las muestras para situaciones mas complicadas

Objetivos El objetivo de la estimaci6n porintervalos es el de obtener intervalos estrechos con alta confiabilidad Si se observan los componentes ~e un intervalo de confianzase veque 8U dimension esta determinada por la magnitud de la cantidad

(coeficiente de confiabilidad) x (error estandar)

131 67 DETERMINACION DEL TAMANO PARA LA l-IUESTRAmiddot

ya que lamagnitud total del intervalo de confIanza es eldoble de esta cantidad Se aprendi6 que a esta cantidad generalmente se Ie llama precisi6n de la estimaci6n o margen de error Para un error estandar dado incrementar la confIabilidad signishyfIca un coefIciente con mayor confIabilidad Y un coefIciente con mayor confIabilidad produce unintervalo mas amplio

Por otra parte si se ftia el coefIciente de confIabilidad la unica manera de redudr la amplitud del intervalo es la reducci6n del error estandar Dado que el error estandar es igual a (J IJ y como (J es una constante la unica forma de obtener un error estandar menor es tomar una muestra grande ~Que tan grande debeser la muestra Esto depende del tamafio de (J la desviad6n estandar de la poblaci6n asi como del grado de confIabilidad y dimensi6n del intervalo deseados

Suponga que se desea obtener un intervalo que se extienda d unidades hacia uno y otro lado del estimador Ellose enuncia

d (coefIciente de confIabilidad) X (error estandar) (671)

Si el muestreo es con reemplazos a partir de una poblaci6n infInita 0 de una que sea 10 sufIcientemente grande como para ignorar la correcci6n por poblaci6n fInita la ecuaci6n 671 se transforma en

(J

d z- (672)-r la cual cuando se despeja n nos da

(673)d2

Cuando el nmestreo se hacesin reemplazos a partir de una poblaci6n fInita y peshyquefia se requiere de la correcci6n por poblaci6n fInita y la ecuaci6n 671 se transforma en

(J~d (674)fN~

que al despejar n resulta en

n-----shy (675)d 2(N 1) + Z2(J2

Si puede omitirse la correcci6n por poblad6n fInita la ecuaci6n 675 se reshyduce a la ecuaci6n 673

Estillluci6n de (J 2 Las f6rmulas para el tamafio de la muestra requieren del conocimiento de (J2 pero como ya se ha sefialado la varian cia de la poblaci6n casi

132 CAPITULO 6 ESTlMACION

siempre sedesconoce Como resultado esnecesarioestimar (J2 Las fuentes de estishymaci6n de(J2 que se utilizan con mas frecuencia son las siguientes

1 Se extrae una muestrapilato 0 prel~l11inar de lapoblaci6n y se puede utilizar la variancia calculada a partir de esta muestra como unaestimaci6n de (J2 Las observaciones uti lizadas en la muestra piloto se toman como parte de la muesshytrafinal de modo que n (el tamaiio calculado de la muestra) n

1 (el tamaiio

de la muestra piloto) n2 (el numero de observaciones necesarias para satisfacer el requerimiento total del tamaiio de la muestra)

2 A partir de estudios anteriores osimilares es posible obtener estimaciones de (J2

3Si se cree que la poblaci6n de lacual se extrae la muestraposee una distribushyci6n aproximadamente nqrmal se puede aprovechar el hecho de que la amshyplitud es aproximadamente igual a 6 desviaciones estandar y calcular (J R6 Este metodo requiere aIglin conocimiento acerca de los valores minimo y maximo de la variable en la poblaci6n

EJEMPLO 671

Un nutri6logo del departamento de salud al efectuar una encuesta entre una poshyblacien de muchachas adolescentes con e1 fin de determinitr su ingesti6n diaria promedio de proteinas (medidas en gramos) busc6 el consejo de un bioestadistico con respecto al tamaiio de la muestra que deberfa tomar

~Que procedimiento debe seguir el bioestadistico para asesorar al nutri610go Antes de que el estadistico pueda ayudar el nutri6logo este debe proporcionar tres elementos de informaci6n h dimensi6n deseada del intervalo de confianza el nivel de confianza deseado y la magnitud de la variancia de la poblaci6n

Soludon Suponga que el nutri6logo requiere un intervalo con una dimensi6n de aprQximadamente 10 gramos es decir la estimaci6n se deberfa enconshytrar alrededor de 5 gramos de la media de la poblaci6n en ambas direcshyciones En otras palabras se desea un margen de error de 5 gramos Suponga que se decide por un coeficiente de confian7a de 95 y que con base en su experiencia previa el nutri6logo percibe que la desviaci6n estandar de la poblaci6n es probablemente de alrededor de 20 gramos EI estadfstico dispone ya de la informaci6n necesaria para calcular el tamaiio de la muestra z 196 (J = 20 y d 5 Suponga que el tamaiio de la poblaci6n es grande asf queel estadistico puede ignorar la correcshyci6n por poblaci6n finita y utilizar la ecuaci6n 673 Con las sustitucioshynes adecuadas el valor de n se calcula como

Se recomienda que el nutri610go tome una muestra de tamafio 62 AI calcular el tamaiio de una muestra a partir de las ecuaciones 673 0 675 el resultado se redondea al siguiente nurnero entero mayor si los calculosdan un numerocon decimales bull

183 68 DETERMINACION DEL TAl1ANO PARA LAS PROPORCIONES

EJERCICIOS

671 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su hospital Si se desea un intervalo de confianza de 99 por dento con una amplitud de 1 libra ~que tan grande debe ser la muestra de los registros de nacimiento Suponga que un estimashy

dor razonable para (J es 1 libra ~De que tamano debe ser la muestra si el coeficiente de confiabilidad se hace descender a 95

672 El director de la secdon de control dela rabia del departamento de salud publica desea extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso del ano anterior para estimar la edad media de las personas mordidas Requiere un intervalo de confianza de 95 por dento decide utilizar un valor de 25 para d y a partir de estudios anteriores estima que la desviacion estandar de la poblacion esta alrededor de los 15 anos ~Que tan grande debe ser el tamano de la muestra

673 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mglOO ml) de pacientes atendidos en una clinica para diabeticos durante el transcurso de los ultimos 10 anos Determine el numero de registros que el medico debe examinar para obtener un intershyvalo de confianza de 90 por ciento para 11 si la dimension requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varian cia de 60

674 Se deseaestimar la edad media en la que a los padentes de esclerosis multiple se les diagnosshytico el padecimiento por primera vez Se requiere un intervalo de confianza de 95 por dento con una dimension de 10 anos Si la variancia de la poblaci6n es de 90 ~que tan grande debera ser la muestra

68 DETERMINACION DELTAMANO DE lA MUESTRA PARA lA ESIDIACION DE lAS PROPORCIONES

EI metodo para estimar el tamafio de la muestra cuando se requiere estimar la proshyporcion de una poblacion es esencialmente el mismo que se describio para estimar la media de una poblacion Se aprovecha el hecho de que la mitad del intervalo deseashydo d se puede igualar al producto del coeficiente de confiabilidad y el error estandar

Si se supone que el muestreo ha sido hecho de manera aleatoria y que existen condiciones que garanticen que la distribuci6n de psea aproximadamente normal se obtiene la siguiente formula para n cuando el muestreo es con reemplazo cuanshydo se realizaa partir de una poblacion infinita 0 ruando la poblacion muestreada es 10 suficientemente grande como para hacer innecesario el uso de la correcci6n por poblacion finita

n (681)

dondeq = I-p Si la correccion por poblacion finita no puede descartarse la formula adecuashy

da paran es

(682)n d 2 (N -1)+z2pq

euan do N es grande en comparacion con n (es decir n IN 05) se puede pasar por alto la correccion por poblacion finita y la ecuacion 682 se reduce a la ecuacion 681

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

167 64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS

636 Una muestra aleatoria simple conformada por 16 individuos aparentemente sanos presenta los siguientes valores de arsenico eliminado en la orina (miligramos por dfa)

Individuo Valor Individuo Valor

1 007 9 012 2 030 10 006 3 025 11 010 4 008 12 032 5 030 13 006 6 038 14 009 7 007 15 014 8 005 16 011

Elabore un intervalo de confianza de 95 por ciento para la media de la poblaci6n

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES

En ocasiones se presentan casos en los que se desea estimar 1a diferencia entre 1a media de dos poblaciones A partir de cada poblacion se extrae una muestra aleatoria independiente y de los datos de cada una se calculan las medias muestrales XI y x2

respectivamente En el capitulo anterior se dijo que el estimador XI - x2 ofrece una estimacion insesgada de la diferencia entre las medias de las poblaciones III shy11 2 bull La variancia del estimador es (cr~ n l ) + (cr~ n 2 ) Tambien se menciono que seglin las condiciones la distribucion muestral de XI - x2 puede presentar una distribution al menos aproximadamente normal de modo que en muchos casos se utiliza la teorfa adecuada para las distribuciones normales en el calculo de un intershyvalo de confianza para III - 11 2 bull Cuando se conocen las variancias de la poblacion el intervalo de confianza del 100(1 - ex) por ciento para III - 112 esta dado por

(641)

El anal isis del intervalo de confianza para la diferencia entre las medias poblacionales ofrece informacion util para decidir si es 0 no probable que las medias de las dos poblaciones sean iguales Cuando el intervalo no incluye al cero se dice que el intervalo ofrece evidencia de que las dos poblaciones tienen medias diferentes Cuando el intervalo incluye al cero se dice que las poblaciones pueden tener meshydias iguales

Esto se ilustra a continuacion para el caso donde el muestreo se realiza a partir de una distribucion normal

168 CAPITULO 6 ESTlMACI6N

EJEMPLO 641

A un equipo de investigacion Ie interesa conocer la diferencia entre las concentracioshynes de acido urico en pacientes con y sin el sfndrome de Down En un gran hospital para el tratamiento de pacientes con retardo mental una muestra de 12 individuos con el sindrome presenta una media de XI = 45 mgll00 mL En un hospital general se encontro que una muestra de 15 individuos normales de la misma edad y sexo presenta un nivel medio de x2= 34 Si es razonable suponer que las dos poblaciones de valores muestran una distribucion normal y sus variancias son iguales a 1 y 15 calcule el intervalo de confianza de 95 por ciento para ~l - ~2

Soluci6n Para una estimacion puntual de III 112 se udliza Xl X2= 45 34 11 EI coeficiente de confiabilidad que corresponde a 95 localizado en la tabla D es 196 EI error estandar es

Por 10 tanto el intervalo de confianza de 95 por ciento es

11 plusmn 196(4282) 11plusmn84 26 194

Se dice que se dene una confianza de 95 por ciento de que la difeshyrencia real 111 - 112 este entre 26 y 194 porque en muestreos repetidos 95 por ciento de los intervalos construidos de esa manera incluiria la diferencia entre las medias reales

Puesto que el intervalo no incluye al cero se concluye que las dos poblaciones tienen diferentes medias bull

Muestreo a partir de poblaciones que no signen una distribuci6n ItOrmal La construccion de un intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando el muestreo se realiza a partir de poblaciones no normales se lleva a cabo en la forma descrita en el ejemplo 641 si las muestras n l y n

2 son grandes Una vez mas este es un resultado del teorema del limite central

Si se desconocen las variancias de la poblacion se utili zan las variancias de las muestras para estimarlas

IUEMPLO 642

Motivados por d conocimiento de la existencia de una gran cantidad de textos polemicos que sugieren que el estres la ansiedad y la depresion son dafiinos para el sistema inmunologico Gormanet ai (4-5) condujeron un estudio en el que se conshysider6 a individuos varoneshomosexuales algunos con VIH (virus de inmunodefishyciencia humana) positivo y otros con VIH negativo Los datos fueron registrados con una amplia vltJriedad de mediciones medicas inmunologicas psiquiatricas y neurol6gicas una de las cuales corresponde al numero de celulas CD4+ en la sanshy

64 INTERV ALO DE CONFIANZA PAHALA DIFERENCIA ENTRE DOS MEDIAS 169

gre El numero promedio de celulas CD4+ para middot112 individuos con infecci6n por VIR fue de 4018 con una desviaci6n estandar de 2264 Para los 75 individuos sin la infecci6n por VIR la media y la desviaci6n estandar fueron de 8282 y 2749 respectivamente Se pretende elaborar un intervalo de confianza de 99 por ciento para la diferencia de las medias de las poblaciones

Soluci6n No hay informaci6n con respecto a la forma de la distribuci6n de las celulas CD4+ Sin embargo como el tamafto de las muestras es grande el teorema del limite central asegura que la distribuci6n muestral de las diferencias entre las medias de la muestra siguen una distribuci6n aproxishymadamente normal independientemente de que la distribuci6n de la variable en las poblaciones no siga una distribuci6n normal Se puede utilizar este hecho para justificar el uso de la estadistica z como factor de confiabilidad en la construcci6n del intervalo de confianza Tampoco hay informaci6n acerca de las desviaciones estandar por 10 que puede emplearse las desviaciones estandar de las muestras para estimarlas La estimaci6n puntual para la diferencia entre las medias de las poblacioshynes es la diferencia entre las medias de las muestras 8282 - 4018 = 4264 En la tabla D se encuentra que el factor de confiabilidad es 258 La estimaci6n del error estandar es

s __ = 27492

+ 22642 =382786

Xl-X 75 112

Por la ecuaci6n 641 el intervalo de confianza de 99 por ciento para la diferencia entre las medias de la poblaci6n es

4264 plusmn 258(382786) 3276 5252

Se tiene la seguridad de 99 por ciento de que el promedio de celulas CD4+ en varones con VIR positivo difieren de la media para los varoshynes con VIR negativo por 3276 a 5252 bull

Distribuci6n t y la diferencia entre las medias Cuando no se conocen las variancias y se pretende estimar la diferencia entre las medias de dos poblacioshynes con un intervalo de confianza es posible utilizar la distribuci6n t para suminisshytrar el factor de confiabilidad si se conocen ciertas suposiciones se debe saber 0

suponer de buena fe que las dos poblaciones muestreadas siguen una distribuci6n normal Respecto a las variancias de las poblaciones se debe distinguir entre dos situaciones 1) la situaci6n en la que las variancias son iguales y 2) la situaci6n en la que no 10 son A continuaci6n se consideranambas sitpaciones por separado

Varianciaspoblacifmales iguales Si la suposici6n sobre igualdad de las variancias de las poblaciones esta justificada las dos variancias de las muestras calculadas a partir de las muestras independientes pueden considerarse como estishymaciones de 10 mismo es decir la variancia comun Parece 16gico entonces aproshyvechar este hecho en el anal isis en cuesti6n Esto es precisamente 10 que se hace para establecer una estimaci6n conjunta para la variancia comun Esta variancia se obtiene mediante el caIculo promedio ponderado de las dos variancias de las muesshy

170 CAPITULO 6 ESTlMACI6N

tras Cada variancia de la muestra es ponderada con base en sus grados de libertad Si los tamafios de las muestras son iguales este promedio ponderado es la media aritmetica de las variancias de las dos muestras Si el tamano de las dos muestras es distinto el promedio ponderado aprovecha la informacion adicional proporcionada por la muestra mayor La estimacion con junta se obtiene con la fOrmula

S2 = (nl _1)SI2 + (n2 l)s~ p (642)

+n2 -2nl

Asf la estimacion del error estandar esta dada por

(643)

y el intervalo de confianza de 100(1 a) por ciento para III 112 esta dada por

(644)

El nfunero de grados de libertad utilizado para determinar el valor de t que se usa para construir el intervalo es n

1 + n

2 2 que es el denominador de la ecuacion

642 Este intervalo se interpreta en la forma habitual Los metodos que pueden emplearse para tomar la decision acerca de la igualshy

dad de las variancias de las poblaciones se estudian en la seccion 610 y 78

EJEMPLO 643

Uno de los estudios de Stone et al (A-6) tuvo como objetivo determinar los efectos del ejercicio por un tiempo prolongado en los ejecutivos de una compania inscritos en un programa supervisado de acondicionamiento fisico Se registraron datos de 13 individuos (el grupo deportista) que voluntariamente se inscribieron el programa y que permanecieron activos por 13 anos en promedio y de 17 individuos (el segunshydo grupo el sedentario) que decidieron no inscribirse Entre los datos que se regisshytraron acerca de los individuos esta el mlmero maximo de sentadillas realizadas en 30 segundos El grupo deportista obtuvo una media y una desviacion estandar de 210 y 49 respectivamente La media y la desviacion estandar para el grupo sedenshytario fueron 121 y 56 respectivamente Se considera que las dos poblaciones de medici ones de acondicionamiento muscular siguen una distribuci6n aproxirnadashymente normal y que las variancias para ambas poblacionesson iguales Se pretenshyde elaborar un intervalo de confianza de 95 por ciento para Ja diferencia entre las medias de as poblaciones representadas por las dos muestras Soluci6n Primero se utiliza la ecuaci6n 642 para calcular la estimaci6n conjunta

de la variancia comtin de las poblaciones

(13-1)(49 2 )+(17 1)(562 ) =2821

13+17-2 Cuando se consulta la tabla E con 13 + 17 - 2= 28 grados de libertad y el nivel de confianza de 95 se encuentra que eLfactor de confiabilidad es 20484 Con la ecuacion 644 se calcula el intervalo de confianza de

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS 171

95 por ciento para la diferencia entre las medias de las poblaciones de la siguiente manera

2821 2821(210-121)plusmn20484 --+-shy

13 17 89 plusmn 40085

49129

Se tiene una confianza de 95 por ciento de que la diferencia entre las medias de las poblaciones estan entre 49 y 129 Se puede decir esto porque se sabe quesi se repite el amilisis muchfsimas veces y se calculan los intervalos de confianza de la misma manera cerca de 95 por ciento de los intervalos de confianza induiran la diferencia entre las medias de las poblaciones

Debido a que los intervalos no induyen al cerose conduye que las medias de las poblaciones son diferentes bull

Variancias poblacionales distintas Cuando no se puede conduir que las variancias de dos poblaciones de interes son iguales aun ruando pueda suponerse que las dos poblaciones presentan distribuciones normales no es adecuado utilizar la distribucion t como se acaba de describir para construir los intervalos de confianza

Una solucion al problema de variancias distintas fue propuesta por Behrens (3) y posteriormente fue verificada y generalizada por Fisher (4 5) Neyman (6) Scheffe (7 8) Y Welch (9 10) tambien proponen soluciones EI problema es analizashydo en detalle por Cochran (11)

EI problema gira en tomo al hecho de que la cantidad

no sigue una distribuci6n t con nj + n 2 grados de libertad ruando las variancias 2 shy

de las poblaciones son distintas Consecuentemente la distribucion t no se puede utilizar en la forma habitual pata obtener el factor de confiabilidad del intervalo de confianza para la diferencia entre las medias de dos poblaciones que tienen variancias diferentes La solucion propuesta por Cochran consiste en el calculo del factor de confiabilidad mediante la siguiente formula

wltj + w2tZ t l

f

-0f2 = (645) WI +w2

donde WI 512

np W 2 = s~ n2 tl = tl _ para nj - 1 grados de libertad y t2 = t l

_w2aI2

para n2

- 1 grados de libertad Un intervalo aproximado de confianza del 100(1 shya) por ciento para III - 112 esta dado por

(646)

172

EJERCICIOS

CAPITULO 6 ESTlMACION

FJEIUPLO 644

En la investigacion de Stone et al (A-6) descrita en el ejercicio 643 los investigashydores tambien informaron los siguientes datos de las medici ones referentes a todas las calificaciones del acondicionamiento muscular logradas por los individuos

Muestra n Media Desviaci6n estimdar

Grupo deportista 13 45 3

Grupo sedentario 17 37 10

Se considera que las dos poblaciones de todas las calificaciones de acondicionashymiento muscular siguen una distribuci6n aproximadamente normal Sin embargo no debe suponerse que las dos variancias poblacionales son iguales Se pretende construir un intervalo de confianza de 95 por ciento para la diferencia entre las medias de todas las calificaciones de acondicionamiento muscular para las dos poshyblaciones representadas por las muestras

Soluci6n Se utiliza t de la ecuaci6n 645 para calcular el factor de confiabilidad En la tabla E se muestra que con 12 grados de libertad y 1 - 052 = 975 t( 21788 Analogamente con 16 grados de libertad y 1- 052 = 975 t2 = 21199 Ahora Sf calcula

(3 2 13)(21788) + (102 17)(21199) 139784 t= =

(3 2 13)+(102 17) 065747

=21261

Con la ecuaci6n 646 ahora se construye el intervalo de confianza de 95 por ciento para la diferencia entre las medias de las dos poblaciones

2 2

(45 37)plusmn21261 3 + 10 13 17

8 plusmn 21261 (25641101) 25134

Puesto que el intervalo no incluye acero se concluye que las medias de las dos poblaciones son diferentes bull

Cuando se construyen intervalos de confianza para la diferencia entre las medias de dos poblaciones es posible utilizar la figura 641 para decidir rapidashymente si el factor de confiabilidad debe ser z t 0 tf

Para cada uno de los siguientes ejercicios construya intervalos de confianza de 90 95 y 99 par ciento para las diferencias entre las medias poblacionales Establezca consideraciones que hagan que el metodo sea valido Determine las interpretaciones practica y probabilistica

clJ clJ FIGURA 541 Diagrama de flujo para decidir si e1 factor de confiabilidad debe ser z tot cuando se realizan inferencia inferencias acerca de la diferencia entre las medias de dos pobladones (Para usar un procedimiento no parametrico ver el capitulo 11)

174 CAPiTULO 6 ESTlMACION

para cad a intervalo construido Suponga las variables bajo considerati6n en cad a ejercicio y establezca para que pueden servir a los investigadores esos resultados

641 EI objetivo de un experimento de Buckner et al (A-7) consisti6 en estudiar los efectos del relajamiento muscular inducido por el pancuronium en el volumen del plasma circulante Los individuos estudiados son recien nacidos con un peso mayor a 1700 gramos que necesishytaron de ayuda para respirar durante las primeras 24 horas despues de nacer y cumplieron con otros criterios cHnicos Cinco recien nacidos paraIizados con el pancuronium y siete recien nacidos no tratados presentaron las siguientes estadisticas en la segunda de las tres mediciones del volumen de plasma (ml) hecha durante la respiraci6n mecanica

Paralizados 480 81 No tratados 567 81

La segunda medici6n para el grupo tratado ocurri6 de 12 a 24 horas despues de la primera dosis de pancuronium Para el grupo no tratado las mediciones se hicieron de 12 a 24 horas despues de iniciar la respiracion mecanica

642 Zuckery Archer (A-8) afirman que la N-nitrosobis (2-oxopropyl)amina (BOP) y las nitrosaminas 3-oxidizadas producen una alta incidencia de tumores de conductos pancreaticos en el hamster dorado sirio Estudiaron los efectos en el peso sangufneo en la glucosa del plasma en la insulina yen los niveles de transamina glutamico-oxaloacetica del plasma (GOT) de los hamsters expuestos in vivo a la BOP Los investigadores reportaron los siguientes resultados en ocho animales tratados y 12 sin tratamiento

Variable Sin tratamiento Con tratamiento

Glucosa del plasma (mglgl) 101 plusmn 5 74plusmn 6

FUENTE Peter F Zucker y Michael C Archer Alterations Pancreatic Islet Function Produced by Carcinogenic Nitrosamines in the Syrian Hamster AmericanJournal oPathology 133 573-577

Los datos son la media de la muestra plusmn la estimaci6n del error estandar de la media de la muestra

643 Los objetivos de un estudio de Davis et al (A-g) son evaluar 1) la eficacia del programa auto ayuda momento para dejar de fumar cuando se utiliza con base de uno a uno en el hogar y 2) la viabilidad de ensefiar temicas para abandonar el habito de fumar a los estudiantes de enfermerfa en bachillerato A estudiantes graduados de enfermerfa inscritos en dos cursos de metodologia de la investigacion de la Universidad de Ottawa se les invit6 a participar en el proyecto Se aplic6 un cuestionario de opcion multiple para abandonar el habito de fumar a 120 estudiantes de enfermeria que participaron y a otros 42 estudiantes que no participashyron antes ni despues del estudio Se calcularon las diferencias entre las calificaciones antes y despues del estudio as como las siguientes estadisticas a partir de las diferencias

EJERCICIOS 175

Grupo Media Desviaci6n estandar

Participantes (A) 214444 15392 No participantes (B) 33333 14595

644 El doctor Ali Khraibi (A-IO) de la CHnica y Fundaci6n Mayo condujo una serie de experishymentos con el fin de evaluar las respuestas diureticas y natiureticas de ratas Okamoto esponshytaneamente hipertensivas (REB) y ratas Wistar-Kyoto (WRY) para dirigir incrementos en la presion hidrostatica renal intersticial (PBRI) Para aumentar la PBRI se utiIiz6 la expansi6n directa del volumen renal intersticial (DRIVE) a traves de una matriz implantada cronicamente en el rinOn Entre los datos registrados durante el estudio estan las siguientes mediciones de excreci6n de sodio a traves de la orina (UNa V) durante el periodo de DRIVE

Grupo

REB 632572796483527 2WKY 420469482 108210

FUENTE Publicada con autorizaci6n del Dr Ali A Khraibi

645 Osberg y Di Scala (A-II) realizaron un estudio centrado en la eficacia de los cinturones de seguridad para reducir 1esiones entre sobrevivientes de accidentes automoviHsticos internashydos en hospitales con edades de 4 a 14 afios El estudio compar610s resultados de 123 ninos que utilizaron el cintur6n contra 290 que no 10 utilizaron entre aquellos que se vieton enshyvueltos en tales accidentes y que fueron hospitalizados El informe con tenia la siguiente estadistica del numero de dfas en la unidad de cuidados intensivos

Grupo Media Error estandar estimado

Utiliz6 el cintur6n 83 16 No utiliz6 el cintur6n 139 18

646 La medicion del diametro transversal del coraz6n de hombres y mujeres adultos presenta los siguientes resultados

sx Grupo Tamafto de Ia muestra (cm) (cm)

Varones 12 1321 105 Mujeres 9 IIOO 101

Considere que las poblaciones siguen una distribucion normal con variancias iguales

176 CAPITULO 6 ESTIMACION

647 Veintiruatro animales de laboratorio con deficiencia de vitamina D fueron divididos en dos grupos iguales EI grupo 1 recibi6 un tratamiento consistente en una dieta que proporcionashyba vitamina D EI segundo grupo no fue tratado AI termino del periodo experimental se midieron las concentraciones de calcio ensuero obteniendose los siguientes resultados

Grupo tratado X 111 mg 100 mls = 15 Grupo sin tratamiento x= 78 mg 100 ml s = 20

Considere que las poblaciones siguen una distribuci6n normal con variancias iguales

648 Ados grupos de nifios se les hicieron pruebas de agudeza vi~ual El grupo 1 estuvo formado por 11 nifios que recibieron la atenci6n de medicos privados La calificaci6n media para este grupo fue de 26 con una desviaci6n estandar de 5 El segundogrupo que incluy6 14 nifios que recibieron atenci6n medica por parte del departamento de salud publica tuvo una calishyficaci6n promedio de 21 con una desviaci6n estandar de 6 Suponga que las poblaciones siguen una distribuci6n normal con variancias iguales

649 El tiempo promedio de estancia de una muestra de 20 pacientes dados de alta de un hospital general es de siete dras con una desviaci6n estaildar de dos dras Una muestra de 24 padenshytes dados de alta de un hospital de enfermedades cr6nicas tuvo un tiempo promedio de estancia de 36 dfas con una desviaci6n estindar de 10 dias Suponga que la poblaci6n sigue una distribuci6n normal con variancias desiguales

6410 En un estudio de factores que se consideran responsables de los efectos adversos del tabashyquismo sobre la reproducci6n humana se midieron los niveles de cadmio (nanogramos por gramo) en el tejido de la placenta de una muestra de 14 madres que fumaban y una muestra aleatoria independiente de 18 mujeres no fumadoras Los resultados fueron los siguientes

No fumadoras toO 84 128250 118 98 125 154 235

94251 1952559875 118122150

Fumadoras 300301150241305178168148

134285 175 144 125204

ms probable que el nivel medio de cadmio registrado sea mayor entre las fumadoras que entre las no fumadoras ~Por que se llegarfa a esta conclusi6n

65 INTERVALO DE CONFIANZA PARA IA PROPORCION DE UNA POBIACION

Muchas preguntas de interes para que el tecnico en salud tienen relacion con las proporciones de poblacion ~Que propordon de padentes que redben un tipo espeshycial de tratamiento se recuperan ~Que proporcion de alguna poblacion tiene cierta enfermedad ~Que propordon de una poblacion es inmune a derta enfermedad

Para estimar la proporcion de una poblacion se procede en la misma forma que cuando se estima la media de una poblacion Se extrae una muestra de la poblacion de interes y se calcula su proporcion p Esta se utiliza como el estimador puntual para la proporcion de la pobladon Un intervalo de confianza se obtiene mediante la siguiente formula general

estimador plusmn (coefidente de confiabilidad) X (error estandar)

EJERCICIOS

EJERCICIOS 177

En el capitulo anterior se vio que cuando np y n(1 - p) son mayores que 5 se puede considerar que la distribuci6n muestral de pse aproxima bastante a una distribuci6n normal Cuando se cumple con esta condici6n el coeficiente de confiabilidad es algUn valor de z de la distribuci6n normal estandar Esta visto que el error estandar es igual a (J p =fi(l-p) n Puesto que p que es el parametro que se trata de calcular se desconoce se debe utilizar pcomo una estimaci6n Asf se estima (J j por medio de ~p(l Pn y el intervalo de confianza de 100(1 - 0) por ciento para pesta dado por

pplusmn Z(I-1J2)~P(l- P) Fn (651)

Este intervalo se interpreta tanto desde el punto de vista practico como probabilistico

FJEMPLO 651

Mathers et al (A-12) encontraron queen una muestra de 591 pacientes internados en un hospital psiquiatrico 204 admitieron que consuniieron marihuana al meshynos una vez durante su vida Se pretende construir un intervalo de confianza de 95 por ciento para la proporcion de individuos que consumieron marihuana durante su vida en la poblaci6n muestreada de los internos del hospital psiquiatrico

Solucion La mejor estima~i6n puntual para la proporci6Il de la poblaci6nes p== 204591 3452 El tamafio de la muestra y hiestimacion de p tienen una magnitud suficiente parajustifKar el empleo de la distribucion norshymal estandar paraelaborar un intervalo de confianza EI coeficiente de corifiabilidad que corresponde alnivel de confianza de 95 es 196 la estimacion del errorestandar (Jp es ~p(l-pgtn = (3452)(6548)591

0 1956El intervalo de confianza para p de acuerdo con estos datos es

3452 plusmn 196(01956) 3452 plusmn 0383 3069 3835

Se puede decir que se tiene 95 por ciento de confianza de que la proporshycionpeste entre 3069 y 3835 ya que al repetir el muestreo casi 95 por ciento de los intervalos construidos en la forma de este intervalo inclushyyen a la proporcion p real Con base en estos resultados se espera con una confianza de 95 por ciento encontrar que entre 3069 y 3835 por ciento de los internados en el hospital psiquiatrico tiene antecedentes de consumo de marihuana bull

Para cada uno de los siguientes ejercicios establezca la interpretacion prictica yprobabilistica de los intervalos que se pide construir Identifique cada componente del intervalo la estimashycion puntual el coeficiente de confiabilidad yel error estandar Explique por que los coefishycientes de confiabilidad no son los misInos para todos los ejercicios

178 CAPITULO 6 ESTIIlACI6N

651 En una investigaci6nde ninos maltratados en pacientes psiquiatricos Brown y Anderson (A-IS) encontraron 166 pacientes en una muestra de 947 con antecedentes de abuso sexual y maltrato flsico Construya un intervalo de confianza de 90 por dento para la proporci6n de la poblaci6n

652 Catania et at (A-14) obtuvieron datos respecto al comportamiento sexual de una muestra de hombres y mujeres solteros con edades entre 20 y 44 residentes en areas geoijfaficas caracshyterizadas por tasas altas de enfermedades de transmision sexual e ingreso a programas de drogas De 1229 encuestados 50 por ciento respondieron que nunca utilizaron preservatishyvos Construya un intervalo de confianza de 95 por ciento para la proporcion de la poblaci6n que nunca utiliza preservativos

653 Rothberg y Lits (A-I 5 ) estudiaron el efecto del estres de la maternidad durante el embarazo en el peso del producto Los individuos eran 86 mujeres blancas con antecedentes de estres que no tenfan faetores de riesgo medico u obstetrico conoddo de peso bajo del producto Los investigadores eneontraron que 128 por dento de las madres estudiadas dieron a luz bebes que cubrfan el criterio de peso bajo Construya un intervalo de confianza de 99 por ciento para la proporci6n de la poblaci6n

654 En una muestra aleatoria simple de 125 varones desempleados quienes desertaron de la escuela preparatoria entre las edades de 16 y 21 anos inclusive 88 declararon que eran consumidores regulares de bebidas alcoh6litas Construya un intervalo de eonfianza de 95 por ciento para la proporcion de la poblacion

66 INTERVALO DE CONFIANZA PARA lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS POBlACIONES

A menudo se tiene interes en conocer la magnitud de la diferencia entre las proporcioshynes de dospoblaciones Es posible que se quiera comparar por ejemplo entre hombres y mujeres dos grupos de edades dos grupos socioecon6micos 0 dos grupos de diagshynostico con respecto a la proporcion que posee alguna caractenstica de interes Un estimador puntual insesgado de la diferencia entre dos proporciones de las poblacioshynes se obtieneal calcular la diferencia de las proporciones de las muestras PI P2 Tal como Se ha visto cuando n1 Yn2 son de gran tamano y las proporciones de la poblacion no estan muy cerca de 0 0 de 1 es posible aplicar el teorema del limite central y utilizar la teona de la distribucion normal para obtener los intervalos de conshyfianza EI error estandar de la estimacion se calcula mediante la siguiente formula

dado que como regIa se desconocen las proporciones de Ia poblacion Un intervashy10 de confianza de 100(1 - a) por ciento para PI P2 se obtiene as

(661)

Es posible interpretar este intervalo desde elpunto de vista probabiHstico y practico

EJERCICIOS 179

EJEMPLO 661

Borst et al (A-16) investigaron la relaci6n de desarrollo del ego edad sexo y diagshyn6stico de suicidio entre los internos adolescentes de la unidad de psiquiatria La muestra consistia en 96 varones y 123 niiias con edades entre 12 y 16 aiios seleccioshynados de entre los internados en la unidad de adolescentes y niiios de un hospital psiquiatrico privado Se reportaron 18 niiios y 60 niiias con intento de suicidio Cons ishyderese el comportamiento de las niiias como el de una muestra aleatoria simple a partir de una poblaci6n similar de niiias y que los j6venes igualmente pueden considerarse como una muestra aleatoria simple extraida de una poblaci6n similar de niiios Para estas dos poblaciones se pretende construir un intervalo de confianshyza de 99 por ciento para la diferencia entre las proporciones de los individuos con intento de suicidio

Soluci6n Las proporciones para las niiias y niiios respectivamente son Pc = 601 123 = A878y PB = 1896 1875 La diferencia entre las proporciones de lasmuestrases Pc PB = 4878 1875 = 3003 El error estandar estimado de la diferenda entre las proporciones de las muestras es

(4878)(5122) (1875)(8125) ---~~-~ +-------shy

123 96

El factor de confiabilidad a partir de la tabla D es 258 de modo que el intervalo de confianza con la f6rmula 661 es

3003 plusmn 258(0602) 14504556

Se dene la confianza de 99 por dento de que para las poblaciones muestteadas la ptopord6n de intentos de suiddio entre las niiias exceshyde a lapropord6n de intentosde suiddio entre los varones por 1450 y 4556

Puesto que el intervalo no incluye al cero se concluye que las dos proporciones de pobladones son diferentes bull

FJERCICIOS

Para cada uno de los siguientes ejercicios establezca las interpretaciones pnicticas y probabishylisticas de los intervalos que se pide construir Identifique cada componente del intervalo la estimaci6n puntual el coeficiente de confiabilidad y el error estandar Explique por que los coeficientes de confiabilidad no son el mismo para todos los ejercicios

661 Hargers et al (A-17) del departamento de Salud PUblica y Ambieptal en Amsterdam condushyjeron un estudio en el que los individuos eran consumidores de drogasinyectables (CDI) En una muestrade 194 consumidores de metadona regular de largo plazo (MLP) 145 eran varones En una muestra de 189 CDIque no consmiddotumian MLP 133 eran varones Establezca las consideraciones necesarias acerca de las muestras ypoblaciones representadas y construshy

180 CAPITULO 6 ESTlMACI6N

ya un intervalo de confianza de 95 por ciemo para la diferenda entre las proporciones de varones en las dos poblaciones

662 Una investigaci6n de Lane et ai (A-I8) valor6las diferencias en las pnicticas de deteccion de cancer de seno entre muestras de mujeres predominantemente de bajos ingresos con edashydes de 50 a 75 anos que lltilizan los servicios de c1inicas de sailld para todo el estado y mlljeres de la misma edad residentes en ciudades donde las c1inicas de salud son locales De las 404 encuestadas seleccionadas en toda la comunidad 592 por ciento estuvo de acuerdo con el siguiente comentario acerca del cancer de pecho las mujeres prolongan su vida si detectan el cancer desde el inicio De entre 795 usuarias de clinicas de salud en la mllestra 449 por ciento estuvo de acuerdo Establezca las suposiciones apropiadas para elaborar un intervalo de confianzade 99 por ciento para la diferencia entre las dos proporciones de las poblaciones de interes

663 Williams et at (A-19) encuestaron a una muestra de 67 medicos y 133 enfermeras con famishyliares farmacodependientes EI prop6sito del estudio era evaluar la influencia en los medishyEOS y enfermeras de estar estrechamente involucrados con una 0 mas personas farmaco dependientes Cincuenta y dos medicos y 89 enfermeras dijeron que vivian con personas farmacoldependientes que adversamente afectaban 8U trabajo E8tablezca todas las consideshyraciones que crea necesarias para construir un intervalo de confianza de 95 por ciento para la diferencia entre las proporciones en las dos poblaciones de trabajadores que se espera esten adversamente afectados por vivir con personas farmacodependientes

664 Aronow y Kronzon (A-20) identificaron los factores de riesgo coronado entre hombres y mujeres en una dinica de cuidados de la salud a largo plazo De los 215 individuos negros 58 tienen diabetes mellitus al igual que 217 individuos blancos de 1140 Elabore un intervalo de confianza de 90 por ciento de confianzapara la diferencia entre las proporciones de las dos poblaciones tCuaies son las poblaciones correspondientes ~Que consideraciones son necesarias para hacer valido el procedimiento de inferencia

67 DETEHMINAUON DEL TAMANO DE LA MUESTRA PARA LA ESTIMACIONDEIAS MEDIAS

La pregunta de que tan grande debe ser una muestra surge inmediatamente al inicio del planteamiento de cualquier encuesta 0 experimento Esta es una pregunshyta importante y no se debe tratara la ligera Tomar una muestra mas grande de 10 necesario para obtener los resultados deseados es un desperdicio de recursos mienshytras que por otro lado las muestras demasiado pequenas con frecuencia dan resulshytados que carecen de uso practico En esta secci6n se estudia c6mo determinar el tamano de la muestra de acuerdo con la situaci6n A continuaci6n se proporciona un metodo para determinar el tamano de la muestra que se requiere para estimar Ia media de la poblaci6n yen la siguiente secci6n se aplica este metodo para detershyminar el tamano de la milestra cuando se desea estimar la proporci6n de una poshyblaci6n Mediante extensiltmes directas de estos metodos es posible determinar el tamano necesario de las muestras para situaciones mas complicadas

Objetivos El objetivo de la estimaci6n porintervalos es el de obtener intervalos estrechos con alta confiabilidad Si se observan los componentes ~e un intervalo de confianzase veque 8U dimension esta determinada por la magnitud de la cantidad

(coeficiente de confiabilidad) x (error estandar)

131 67 DETERMINACION DEL TAMANO PARA LA l-IUESTRAmiddot

ya que lamagnitud total del intervalo de confIanza es eldoble de esta cantidad Se aprendi6 que a esta cantidad generalmente se Ie llama precisi6n de la estimaci6n o margen de error Para un error estandar dado incrementar la confIabilidad signishyfIca un coefIciente con mayor confIabilidad Y un coefIciente con mayor confIabilidad produce unintervalo mas amplio

Por otra parte si se ftia el coefIciente de confIabilidad la unica manera de redudr la amplitud del intervalo es la reducci6n del error estandar Dado que el error estandar es igual a (J IJ y como (J es una constante la unica forma de obtener un error estandar menor es tomar una muestra grande ~Que tan grande debeser la muestra Esto depende del tamafio de (J la desviad6n estandar de la poblaci6n asi como del grado de confIabilidad y dimensi6n del intervalo deseados

Suponga que se desea obtener un intervalo que se extienda d unidades hacia uno y otro lado del estimador Ellose enuncia

d (coefIciente de confIabilidad) X (error estandar) (671)

Si el muestreo es con reemplazos a partir de una poblaci6n infInita 0 de una que sea 10 sufIcientemente grande como para ignorar la correcci6n por poblaci6n fInita la ecuaci6n 671 se transforma en

(J

d z- (672)-r la cual cuando se despeja n nos da

(673)d2

Cuando el nmestreo se hacesin reemplazos a partir de una poblaci6n fInita y peshyquefia se requiere de la correcci6n por poblaci6n fInita y la ecuaci6n 671 se transforma en

(J~d (674)fN~

que al despejar n resulta en

n-----shy (675)d 2(N 1) + Z2(J2

Si puede omitirse la correcci6n por poblad6n fInita la ecuaci6n 675 se reshyduce a la ecuaci6n 673

Estillluci6n de (J 2 Las f6rmulas para el tamafio de la muestra requieren del conocimiento de (J2 pero como ya se ha sefialado la varian cia de la poblaci6n casi

132 CAPITULO 6 ESTlMACION

siempre sedesconoce Como resultado esnecesarioestimar (J2 Las fuentes de estishymaci6n de(J2 que se utilizan con mas frecuencia son las siguientes

1 Se extrae una muestrapilato 0 prel~l11inar de lapoblaci6n y se puede utilizar la variancia calculada a partir de esta muestra como unaestimaci6n de (J2 Las observaciones uti lizadas en la muestra piloto se toman como parte de la muesshytrafinal de modo que n (el tamaiio calculado de la muestra) n

1 (el tamaiio

de la muestra piloto) n2 (el numero de observaciones necesarias para satisfacer el requerimiento total del tamaiio de la muestra)

2 A partir de estudios anteriores osimilares es posible obtener estimaciones de (J2

3Si se cree que la poblaci6n de lacual se extrae la muestraposee una distribushyci6n aproximadamente nqrmal se puede aprovechar el hecho de que la amshyplitud es aproximadamente igual a 6 desviaciones estandar y calcular (J R6 Este metodo requiere aIglin conocimiento acerca de los valores minimo y maximo de la variable en la poblaci6n

EJEMPLO 671

Un nutri6logo del departamento de salud al efectuar una encuesta entre una poshyblacien de muchachas adolescentes con e1 fin de determinitr su ingesti6n diaria promedio de proteinas (medidas en gramos) busc6 el consejo de un bioestadistico con respecto al tamaiio de la muestra que deberfa tomar

~Que procedimiento debe seguir el bioestadistico para asesorar al nutri610go Antes de que el estadistico pueda ayudar el nutri6logo este debe proporcionar tres elementos de informaci6n h dimensi6n deseada del intervalo de confianza el nivel de confianza deseado y la magnitud de la variancia de la poblaci6n

Soludon Suponga que el nutri6logo requiere un intervalo con una dimensi6n de aprQximadamente 10 gramos es decir la estimaci6n se deberfa enconshytrar alrededor de 5 gramos de la media de la poblaci6n en ambas direcshyciones En otras palabras se desea un margen de error de 5 gramos Suponga que se decide por un coeficiente de confian7a de 95 y que con base en su experiencia previa el nutri6logo percibe que la desviaci6n estandar de la poblaci6n es probablemente de alrededor de 20 gramos EI estadfstico dispone ya de la informaci6n necesaria para calcular el tamaiio de la muestra z 196 (J = 20 y d 5 Suponga que el tamaiio de la poblaci6n es grande asf queel estadistico puede ignorar la correcshyci6n por poblaci6n finita y utilizar la ecuaci6n 673 Con las sustitucioshynes adecuadas el valor de n se calcula como

Se recomienda que el nutri610go tome una muestra de tamafio 62 AI calcular el tamaiio de una muestra a partir de las ecuaciones 673 0 675 el resultado se redondea al siguiente nurnero entero mayor si los calculosdan un numerocon decimales bull

183 68 DETERMINACION DEL TAl1ANO PARA LAS PROPORCIONES

EJERCICIOS

671 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su hospital Si se desea un intervalo de confianza de 99 por dento con una amplitud de 1 libra ~que tan grande debe ser la muestra de los registros de nacimiento Suponga que un estimashy

dor razonable para (J es 1 libra ~De que tamano debe ser la muestra si el coeficiente de confiabilidad se hace descender a 95

672 El director de la secdon de control dela rabia del departamento de salud publica desea extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso del ano anterior para estimar la edad media de las personas mordidas Requiere un intervalo de confianza de 95 por dento decide utilizar un valor de 25 para d y a partir de estudios anteriores estima que la desviacion estandar de la poblacion esta alrededor de los 15 anos ~Que tan grande debe ser el tamano de la muestra

673 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mglOO ml) de pacientes atendidos en una clinica para diabeticos durante el transcurso de los ultimos 10 anos Determine el numero de registros que el medico debe examinar para obtener un intershyvalo de confianza de 90 por ciento para 11 si la dimension requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varian cia de 60

674 Se deseaestimar la edad media en la que a los padentes de esclerosis multiple se les diagnosshytico el padecimiento por primera vez Se requiere un intervalo de confianza de 95 por dento con una dimension de 10 anos Si la variancia de la poblaci6n es de 90 ~que tan grande debera ser la muestra

68 DETERMINACION DELTAMANO DE lA MUESTRA PARA lA ESIDIACION DE lAS PROPORCIONES

EI metodo para estimar el tamafio de la muestra cuando se requiere estimar la proshyporcion de una poblacion es esencialmente el mismo que se describio para estimar la media de una poblacion Se aprovecha el hecho de que la mitad del intervalo deseashydo d se puede igualar al producto del coeficiente de confiabilidad y el error estandar

Si se supone que el muestreo ha sido hecho de manera aleatoria y que existen condiciones que garanticen que la distribuci6n de psea aproximadamente normal se obtiene la siguiente formula para n cuando el muestreo es con reemplazo cuanshydo se realizaa partir de una poblacion infinita 0 ruando la poblacion muestreada es 10 suficientemente grande como para hacer innecesario el uso de la correcci6n por poblacion finita

n (681)

dondeq = I-p Si la correccion por poblacion finita no puede descartarse la formula adecuashy

da paran es

(682)n d 2 (N -1)+z2pq

euan do N es grande en comparacion con n (es decir n IN 05) se puede pasar por alto la correccion por poblacion finita y la ecuacion 682 se reduce a la ecuacion 681

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

168 CAPITULO 6 ESTlMACI6N

EJEMPLO 641

A un equipo de investigacion Ie interesa conocer la diferencia entre las concentracioshynes de acido urico en pacientes con y sin el sfndrome de Down En un gran hospital para el tratamiento de pacientes con retardo mental una muestra de 12 individuos con el sindrome presenta una media de XI = 45 mgll00 mL En un hospital general se encontro que una muestra de 15 individuos normales de la misma edad y sexo presenta un nivel medio de x2= 34 Si es razonable suponer que las dos poblaciones de valores muestran una distribucion normal y sus variancias son iguales a 1 y 15 calcule el intervalo de confianza de 95 por ciento para ~l - ~2

Soluci6n Para una estimacion puntual de III 112 se udliza Xl X2= 45 34 11 EI coeficiente de confiabilidad que corresponde a 95 localizado en la tabla D es 196 EI error estandar es

Por 10 tanto el intervalo de confianza de 95 por ciento es

11 plusmn 196(4282) 11plusmn84 26 194

Se dice que se dene una confianza de 95 por ciento de que la difeshyrencia real 111 - 112 este entre 26 y 194 porque en muestreos repetidos 95 por ciento de los intervalos construidos de esa manera incluiria la diferencia entre las medias reales

Puesto que el intervalo no incluye al cero se concluye que las dos poblaciones tienen diferentes medias bull

Muestreo a partir de poblaciones que no signen una distribuci6n ItOrmal La construccion de un intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando el muestreo se realiza a partir de poblaciones no normales se lleva a cabo en la forma descrita en el ejemplo 641 si las muestras n l y n

2 son grandes Una vez mas este es un resultado del teorema del limite central

Si se desconocen las variancias de la poblacion se utili zan las variancias de las muestras para estimarlas

IUEMPLO 642

Motivados por d conocimiento de la existencia de una gran cantidad de textos polemicos que sugieren que el estres la ansiedad y la depresion son dafiinos para el sistema inmunologico Gormanet ai (4-5) condujeron un estudio en el que se conshysider6 a individuos varoneshomosexuales algunos con VIH (virus de inmunodefishyciencia humana) positivo y otros con VIH negativo Los datos fueron registrados con una amplia vltJriedad de mediciones medicas inmunologicas psiquiatricas y neurol6gicas una de las cuales corresponde al numero de celulas CD4+ en la sanshy

64 INTERV ALO DE CONFIANZA PAHALA DIFERENCIA ENTRE DOS MEDIAS 169

gre El numero promedio de celulas CD4+ para middot112 individuos con infecci6n por VIR fue de 4018 con una desviaci6n estandar de 2264 Para los 75 individuos sin la infecci6n por VIR la media y la desviaci6n estandar fueron de 8282 y 2749 respectivamente Se pretende elaborar un intervalo de confianza de 99 por ciento para la diferencia de las medias de las poblaciones

Soluci6n No hay informaci6n con respecto a la forma de la distribuci6n de las celulas CD4+ Sin embargo como el tamafto de las muestras es grande el teorema del limite central asegura que la distribuci6n muestral de las diferencias entre las medias de la muestra siguen una distribuci6n aproxishymadamente normal independientemente de que la distribuci6n de la variable en las poblaciones no siga una distribuci6n normal Se puede utilizar este hecho para justificar el uso de la estadistica z como factor de confiabilidad en la construcci6n del intervalo de confianza Tampoco hay informaci6n acerca de las desviaciones estandar por 10 que puede emplearse las desviaciones estandar de las muestras para estimarlas La estimaci6n puntual para la diferencia entre las medias de las poblacioshynes es la diferencia entre las medias de las muestras 8282 - 4018 = 4264 En la tabla D se encuentra que el factor de confiabilidad es 258 La estimaci6n del error estandar es

s __ = 27492

+ 22642 =382786

Xl-X 75 112

Por la ecuaci6n 641 el intervalo de confianza de 99 por ciento para la diferencia entre las medias de la poblaci6n es

4264 plusmn 258(382786) 3276 5252

Se tiene la seguridad de 99 por ciento de que el promedio de celulas CD4+ en varones con VIR positivo difieren de la media para los varoshynes con VIR negativo por 3276 a 5252 bull

Distribuci6n t y la diferencia entre las medias Cuando no se conocen las variancias y se pretende estimar la diferencia entre las medias de dos poblacioshynes con un intervalo de confianza es posible utilizar la distribuci6n t para suminisshytrar el factor de confiabilidad si se conocen ciertas suposiciones se debe saber 0

suponer de buena fe que las dos poblaciones muestreadas siguen una distribuci6n normal Respecto a las variancias de las poblaciones se debe distinguir entre dos situaciones 1) la situaci6n en la que las variancias son iguales y 2) la situaci6n en la que no 10 son A continuaci6n se consideranambas sitpaciones por separado

Varianciaspoblacifmales iguales Si la suposici6n sobre igualdad de las variancias de las poblaciones esta justificada las dos variancias de las muestras calculadas a partir de las muestras independientes pueden considerarse como estishymaciones de 10 mismo es decir la variancia comun Parece 16gico entonces aproshyvechar este hecho en el anal isis en cuesti6n Esto es precisamente 10 que se hace para establecer una estimaci6n conjunta para la variancia comun Esta variancia se obtiene mediante el caIculo promedio ponderado de las dos variancias de las muesshy

170 CAPITULO 6 ESTlMACI6N

tras Cada variancia de la muestra es ponderada con base en sus grados de libertad Si los tamafios de las muestras son iguales este promedio ponderado es la media aritmetica de las variancias de las dos muestras Si el tamano de las dos muestras es distinto el promedio ponderado aprovecha la informacion adicional proporcionada por la muestra mayor La estimacion con junta se obtiene con la fOrmula

S2 = (nl _1)SI2 + (n2 l)s~ p (642)

+n2 -2nl

Asf la estimacion del error estandar esta dada por

(643)

y el intervalo de confianza de 100(1 a) por ciento para III 112 esta dada por

(644)

El nfunero de grados de libertad utilizado para determinar el valor de t que se usa para construir el intervalo es n

1 + n

2 2 que es el denominador de la ecuacion

642 Este intervalo se interpreta en la forma habitual Los metodos que pueden emplearse para tomar la decision acerca de la igualshy

dad de las variancias de las poblaciones se estudian en la seccion 610 y 78

EJEMPLO 643

Uno de los estudios de Stone et al (A-6) tuvo como objetivo determinar los efectos del ejercicio por un tiempo prolongado en los ejecutivos de una compania inscritos en un programa supervisado de acondicionamiento fisico Se registraron datos de 13 individuos (el grupo deportista) que voluntariamente se inscribieron el programa y que permanecieron activos por 13 anos en promedio y de 17 individuos (el segunshydo grupo el sedentario) que decidieron no inscribirse Entre los datos que se regisshytraron acerca de los individuos esta el mlmero maximo de sentadillas realizadas en 30 segundos El grupo deportista obtuvo una media y una desviacion estandar de 210 y 49 respectivamente La media y la desviacion estandar para el grupo sedenshytario fueron 121 y 56 respectivamente Se considera que las dos poblaciones de medici ones de acondicionamiento muscular siguen una distribuci6n aproxirnadashymente normal y que las variancias para ambas poblacionesson iguales Se pretenshyde elaborar un intervalo de confianza de 95 por ciento para Ja diferencia entre las medias de as poblaciones representadas por las dos muestras Soluci6n Primero se utiliza la ecuaci6n 642 para calcular la estimaci6n conjunta

de la variancia comtin de las poblaciones

(13-1)(49 2 )+(17 1)(562 ) =2821

13+17-2 Cuando se consulta la tabla E con 13 + 17 - 2= 28 grados de libertad y el nivel de confianza de 95 se encuentra que eLfactor de confiabilidad es 20484 Con la ecuacion 644 se calcula el intervalo de confianza de

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS 171

95 por ciento para la diferencia entre las medias de las poblaciones de la siguiente manera

2821 2821(210-121)plusmn20484 --+-shy

13 17 89 plusmn 40085

49129

Se tiene una confianza de 95 por ciento de que la diferencia entre las medias de las poblaciones estan entre 49 y 129 Se puede decir esto porque se sabe quesi se repite el amilisis muchfsimas veces y se calculan los intervalos de confianza de la misma manera cerca de 95 por ciento de los intervalos de confianza induiran la diferencia entre las medias de las poblaciones

Debido a que los intervalos no induyen al cerose conduye que las medias de las poblaciones son diferentes bull

Variancias poblacionales distintas Cuando no se puede conduir que las variancias de dos poblaciones de interes son iguales aun ruando pueda suponerse que las dos poblaciones presentan distribuciones normales no es adecuado utilizar la distribucion t como se acaba de describir para construir los intervalos de confianza

Una solucion al problema de variancias distintas fue propuesta por Behrens (3) y posteriormente fue verificada y generalizada por Fisher (4 5) Neyman (6) Scheffe (7 8) Y Welch (9 10) tambien proponen soluciones EI problema es analizashydo en detalle por Cochran (11)

EI problema gira en tomo al hecho de que la cantidad

no sigue una distribuci6n t con nj + n 2 grados de libertad ruando las variancias 2 shy

de las poblaciones son distintas Consecuentemente la distribucion t no se puede utilizar en la forma habitual pata obtener el factor de confiabilidad del intervalo de confianza para la diferencia entre las medias de dos poblaciones que tienen variancias diferentes La solucion propuesta por Cochran consiste en el calculo del factor de confiabilidad mediante la siguiente formula

wltj + w2tZ t l

f

-0f2 = (645) WI +w2

donde WI 512

np W 2 = s~ n2 tl = tl _ para nj - 1 grados de libertad y t2 = t l

_w2aI2

para n2

- 1 grados de libertad Un intervalo aproximado de confianza del 100(1 shya) por ciento para III - 112 esta dado por

(646)

172

EJERCICIOS

CAPITULO 6 ESTlMACION

FJEIUPLO 644

En la investigacion de Stone et al (A-6) descrita en el ejercicio 643 los investigashydores tambien informaron los siguientes datos de las medici ones referentes a todas las calificaciones del acondicionamiento muscular logradas por los individuos

Muestra n Media Desviaci6n estimdar

Grupo deportista 13 45 3

Grupo sedentario 17 37 10

Se considera que las dos poblaciones de todas las calificaciones de acondicionashymiento muscular siguen una distribuci6n aproximadamente normal Sin embargo no debe suponerse que las dos variancias poblacionales son iguales Se pretende construir un intervalo de confianza de 95 por ciento para la diferencia entre las medias de todas las calificaciones de acondicionamiento muscular para las dos poshyblaciones representadas por las muestras

Soluci6n Se utiliza t de la ecuaci6n 645 para calcular el factor de confiabilidad En la tabla E se muestra que con 12 grados de libertad y 1 - 052 = 975 t( 21788 Analogamente con 16 grados de libertad y 1- 052 = 975 t2 = 21199 Ahora Sf calcula

(3 2 13)(21788) + (102 17)(21199) 139784 t= =

(3 2 13)+(102 17) 065747

=21261

Con la ecuaci6n 646 ahora se construye el intervalo de confianza de 95 por ciento para la diferencia entre las medias de las dos poblaciones

2 2

(45 37)plusmn21261 3 + 10 13 17

8 plusmn 21261 (25641101) 25134

Puesto que el intervalo no incluye acero se concluye que las medias de las dos poblaciones son diferentes bull

Cuando se construyen intervalos de confianza para la diferencia entre las medias de dos poblaciones es posible utilizar la figura 641 para decidir rapidashymente si el factor de confiabilidad debe ser z t 0 tf

Para cada uno de los siguientes ejercicios construya intervalos de confianza de 90 95 y 99 par ciento para las diferencias entre las medias poblacionales Establezca consideraciones que hagan que el metodo sea valido Determine las interpretaciones practica y probabilistica

clJ clJ FIGURA 541 Diagrama de flujo para decidir si e1 factor de confiabilidad debe ser z tot cuando se realizan inferencia inferencias acerca de la diferencia entre las medias de dos pobladones (Para usar un procedimiento no parametrico ver el capitulo 11)

174 CAPiTULO 6 ESTlMACION

para cad a intervalo construido Suponga las variables bajo considerati6n en cad a ejercicio y establezca para que pueden servir a los investigadores esos resultados

641 EI objetivo de un experimento de Buckner et al (A-7) consisti6 en estudiar los efectos del relajamiento muscular inducido por el pancuronium en el volumen del plasma circulante Los individuos estudiados son recien nacidos con un peso mayor a 1700 gramos que necesishytaron de ayuda para respirar durante las primeras 24 horas despues de nacer y cumplieron con otros criterios cHnicos Cinco recien nacidos paraIizados con el pancuronium y siete recien nacidos no tratados presentaron las siguientes estadisticas en la segunda de las tres mediciones del volumen de plasma (ml) hecha durante la respiraci6n mecanica

Paralizados 480 81 No tratados 567 81

La segunda medici6n para el grupo tratado ocurri6 de 12 a 24 horas despues de la primera dosis de pancuronium Para el grupo no tratado las mediciones se hicieron de 12 a 24 horas despues de iniciar la respiracion mecanica

642 Zuckery Archer (A-8) afirman que la N-nitrosobis (2-oxopropyl)amina (BOP) y las nitrosaminas 3-oxidizadas producen una alta incidencia de tumores de conductos pancreaticos en el hamster dorado sirio Estudiaron los efectos en el peso sangufneo en la glucosa del plasma en la insulina yen los niveles de transamina glutamico-oxaloacetica del plasma (GOT) de los hamsters expuestos in vivo a la BOP Los investigadores reportaron los siguientes resultados en ocho animales tratados y 12 sin tratamiento

Variable Sin tratamiento Con tratamiento

Glucosa del plasma (mglgl) 101 plusmn 5 74plusmn 6

FUENTE Peter F Zucker y Michael C Archer Alterations Pancreatic Islet Function Produced by Carcinogenic Nitrosamines in the Syrian Hamster AmericanJournal oPathology 133 573-577

Los datos son la media de la muestra plusmn la estimaci6n del error estandar de la media de la muestra

643 Los objetivos de un estudio de Davis et al (A-g) son evaluar 1) la eficacia del programa auto ayuda momento para dejar de fumar cuando se utiliza con base de uno a uno en el hogar y 2) la viabilidad de ensefiar temicas para abandonar el habito de fumar a los estudiantes de enfermerfa en bachillerato A estudiantes graduados de enfermerfa inscritos en dos cursos de metodologia de la investigacion de la Universidad de Ottawa se les invit6 a participar en el proyecto Se aplic6 un cuestionario de opcion multiple para abandonar el habito de fumar a 120 estudiantes de enfermeria que participaron y a otros 42 estudiantes que no participashyron antes ni despues del estudio Se calcularon las diferencias entre las calificaciones antes y despues del estudio as como las siguientes estadisticas a partir de las diferencias

EJERCICIOS 175

Grupo Media Desviaci6n estandar

Participantes (A) 214444 15392 No participantes (B) 33333 14595

644 El doctor Ali Khraibi (A-IO) de la CHnica y Fundaci6n Mayo condujo una serie de experishymentos con el fin de evaluar las respuestas diureticas y natiureticas de ratas Okamoto esponshytaneamente hipertensivas (REB) y ratas Wistar-Kyoto (WRY) para dirigir incrementos en la presion hidrostatica renal intersticial (PBRI) Para aumentar la PBRI se utiIiz6 la expansi6n directa del volumen renal intersticial (DRIVE) a traves de una matriz implantada cronicamente en el rinOn Entre los datos registrados durante el estudio estan las siguientes mediciones de excreci6n de sodio a traves de la orina (UNa V) durante el periodo de DRIVE

Grupo

REB 632572796483527 2WKY 420469482 108210

FUENTE Publicada con autorizaci6n del Dr Ali A Khraibi

645 Osberg y Di Scala (A-II) realizaron un estudio centrado en la eficacia de los cinturones de seguridad para reducir 1esiones entre sobrevivientes de accidentes automoviHsticos internashydos en hospitales con edades de 4 a 14 afios El estudio compar610s resultados de 123 ninos que utilizaron el cintur6n contra 290 que no 10 utilizaron entre aquellos que se vieton enshyvueltos en tales accidentes y que fueron hospitalizados El informe con tenia la siguiente estadistica del numero de dfas en la unidad de cuidados intensivos

Grupo Media Error estandar estimado

Utiliz6 el cintur6n 83 16 No utiliz6 el cintur6n 139 18

646 La medicion del diametro transversal del coraz6n de hombres y mujeres adultos presenta los siguientes resultados

sx Grupo Tamafto de Ia muestra (cm) (cm)

Varones 12 1321 105 Mujeres 9 IIOO 101

Considere que las poblaciones siguen una distribucion normal con variancias iguales

176 CAPITULO 6 ESTIMACION

647 Veintiruatro animales de laboratorio con deficiencia de vitamina D fueron divididos en dos grupos iguales EI grupo 1 recibi6 un tratamiento consistente en una dieta que proporcionashyba vitamina D EI segundo grupo no fue tratado AI termino del periodo experimental se midieron las concentraciones de calcio ensuero obteniendose los siguientes resultados

Grupo tratado X 111 mg 100 mls = 15 Grupo sin tratamiento x= 78 mg 100 ml s = 20

Considere que las poblaciones siguen una distribuci6n normal con variancias iguales

648 Ados grupos de nifios se les hicieron pruebas de agudeza vi~ual El grupo 1 estuvo formado por 11 nifios que recibieron la atenci6n de medicos privados La calificaci6n media para este grupo fue de 26 con una desviaci6n estandar de 5 El segundogrupo que incluy6 14 nifios que recibieron atenci6n medica por parte del departamento de salud publica tuvo una calishyficaci6n promedio de 21 con una desviaci6n estandar de 6 Suponga que las poblaciones siguen una distribuci6n normal con variancias iguales

649 El tiempo promedio de estancia de una muestra de 20 pacientes dados de alta de un hospital general es de siete dras con una desviaci6n estaildar de dos dras Una muestra de 24 padenshytes dados de alta de un hospital de enfermedades cr6nicas tuvo un tiempo promedio de estancia de 36 dfas con una desviaci6n estindar de 10 dias Suponga que la poblaci6n sigue una distribuci6n normal con variancias desiguales

6410 En un estudio de factores que se consideran responsables de los efectos adversos del tabashyquismo sobre la reproducci6n humana se midieron los niveles de cadmio (nanogramos por gramo) en el tejido de la placenta de una muestra de 14 madres que fumaban y una muestra aleatoria independiente de 18 mujeres no fumadoras Los resultados fueron los siguientes

No fumadoras toO 84 128250 118 98 125 154 235

94251 1952559875 118122150

Fumadoras 300301150241305178168148

134285 175 144 125204

ms probable que el nivel medio de cadmio registrado sea mayor entre las fumadoras que entre las no fumadoras ~Por que se llegarfa a esta conclusi6n

65 INTERVALO DE CONFIANZA PARA IA PROPORCION DE UNA POBIACION

Muchas preguntas de interes para que el tecnico en salud tienen relacion con las proporciones de poblacion ~Que propordon de padentes que redben un tipo espeshycial de tratamiento se recuperan ~Que proporcion de alguna poblacion tiene cierta enfermedad ~Que propordon de una poblacion es inmune a derta enfermedad

Para estimar la proporcion de una poblacion se procede en la misma forma que cuando se estima la media de una poblacion Se extrae una muestra de la poblacion de interes y se calcula su proporcion p Esta se utiliza como el estimador puntual para la proporcion de la pobladon Un intervalo de confianza se obtiene mediante la siguiente formula general

estimador plusmn (coefidente de confiabilidad) X (error estandar)

EJERCICIOS

EJERCICIOS 177

En el capitulo anterior se vio que cuando np y n(1 - p) son mayores que 5 se puede considerar que la distribuci6n muestral de pse aproxima bastante a una distribuci6n normal Cuando se cumple con esta condici6n el coeficiente de confiabilidad es algUn valor de z de la distribuci6n normal estandar Esta visto que el error estandar es igual a (J p =fi(l-p) n Puesto que p que es el parametro que se trata de calcular se desconoce se debe utilizar pcomo una estimaci6n Asf se estima (J j por medio de ~p(l Pn y el intervalo de confianza de 100(1 - 0) por ciento para pesta dado por

pplusmn Z(I-1J2)~P(l- P) Fn (651)

Este intervalo se interpreta tanto desde el punto de vista practico como probabilistico

FJEMPLO 651

Mathers et al (A-12) encontraron queen una muestra de 591 pacientes internados en un hospital psiquiatrico 204 admitieron que consuniieron marihuana al meshynos una vez durante su vida Se pretende construir un intervalo de confianza de 95 por ciento para la proporcion de individuos que consumieron marihuana durante su vida en la poblaci6n muestreada de los internos del hospital psiquiatrico

Solucion La mejor estima~i6n puntual para la proporci6Il de la poblaci6nes p== 204591 3452 El tamafio de la muestra y hiestimacion de p tienen una magnitud suficiente parajustifKar el empleo de la distribucion norshymal estandar paraelaborar un intervalo de confianza EI coeficiente de corifiabilidad que corresponde alnivel de confianza de 95 es 196 la estimacion del errorestandar (Jp es ~p(l-pgtn = (3452)(6548)591

0 1956El intervalo de confianza para p de acuerdo con estos datos es

3452 plusmn 196(01956) 3452 plusmn 0383 3069 3835

Se puede decir que se tiene 95 por ciento de confianza de que la proporshycionpeste entre 3069 y 3835 ya que al repetir el muestreo casi 95 por ciento de los intervalos construidos en la forma de este intervalo inclushyyen a la proporcion p real Con base en estos resultados se espera con una confianza de 95 por ciento encontrar que entre 3069 y 3835 por ciento de los internados en el hospital psiquiatrico tiene antecedentes de consumo de marihuana bull

Para cada uno de los siguientes ejercicios establezca la interpretacion prictica yprobabilistica de los intervalos que se pide construir Identifique cada componente del intervalo la estimashycion puntual el coeficiente de confiabilidad yel error estandar Explique por que los coefishycientes de confiabilidad no son los misInos para todos los ejercicios

178 CAPITULO 6 ESTIIlACI6N

651 En una investigaci6nde ninos maltratados en pacientes psiquiatricos Brown y Anderson (A-IS) encontraron 166 pacientes en una muestra de 947 con antecedentes de abuso sexual y maltrato flsico Construya un intervalo de confianza de 90 por dento para la proporci6n de la poblaci6n

652 Catania et at (A-14) obtuvieron datos respecto al comportamiento sexual de una muestra de hombres y mujeres solteros con edades entre 20 y 44 residentes en areas geoijfaficas caracshyterizadas por tasas altas de enfermedades de transmision sexual e ingreso a programas de drogas De 1229 encuestados 50 por ciento respondieron que nunca utilizaron preservatishyvos Construya un intervalo de confianza de 95 por ciento para la proporcion de la poblaci6n que nunca utiliza preservativos

653 Rothberg y Lits (A-I 5 ) estudiaron el efecto del estres de la maternidad durante el embarazo en el peso del producto Los individuos eran 86 mujeres blancas con antecedentes de estres que no tenfan faetores de riesgo medico u obstetrico conoddo de peso bajo del producto Los investigadores eneontraron que 128 por dento de las madres estudiadas dieron a luz bebes que cubrfan el criterio de peso bajo Construya un intervalo de confianza de 99 por ciento para la proporci6n de la poblaci6n

654 En una muestra aleatoria simple de 125 varones desempleados quienes desertaron de la escuela preparatoria entre las edades de 16 y 21 anos inclusive 88 declararon que eran consumidores regulares de bebidas alcoh6litas Construya un intervalo de eonfianza de 95 por ciento para la proporcion de la poblacion

66 INTERVALO DE CONFIANZA PARA lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS POBlACIONES

A menudo se tiene interes en conocer la magnitud de la diferencia entre las proporcioshynes de dospoblaciones Es posible que se quiera comparar por ejemplo entre hombres y mujeres dos grupos de edades dos grupos socioecon6micos 0 dos grupos de diagshynostico con respecto a la proporcion que posee alguna caractenstica de interes Un estimador puntual insesgado de la diferencia entre dos proporciones de las poblacioshynes se obtieneal calcular la diferencia de las proporciones de las muestras PI P2 Tal como Se ha visto cuando n1 Yn2 son de gran tamano y las proporciones de la poblacion no estan muy cerca de 0 0 de 1 es posible aplicar el teorema del limite central y utilizar la teona de la distribucion normal para obtener los intervalos de conshyfianza EI error estandar de la estimacion se calcula mediante la siguiente formula

dado que como regIa se desconocen las proporciones de Ia poblacion Un intervashy10 de confianza de 100(1 - a) por ciento para PI P2 se obtiene as

(661)

Es posible interpretar este intervalo desde elpunto de vista probabiHstico y practico

EJERCICIOS 179

EJEMPLO 661

Borst et al (A-16) investigaron la relaci6n de desarrollo del ego edad sexo y diagshyn6stico de suicidio entre los internos adolescentes de la unidad de psiquiatria La muestra consistia en 96 varones y 123 niiias con edades entre 12 y 16 aiios seleccioshynados de entre los internados en la unidad de adolescentes y niiios de un hospital psiquiatrico privado Se reportaron 18 niiios y 60 niiias con intento de suicidio Cons ishyderese el comportamiento de las niiias como el de una muestra aleatoria simple a partir de una poblaci6n similar de niiias y que los j6venes igualmente pueden considerarse como una muestra aleatoria simple extraida de una poblaci6n similar de niiios Para estas dos poblaciones se pretende construir un intervalo de confianshyza de 99 por ciento para la diferencia entre las proporciones de los individuos con intento de suicidio

Soluci6n Las proporciones para las niiias y niiios respectivamente son Pc = 601 123 = A878y PB = 1896 1875 La diferencia entre las proporciones de lasmuestrases Pc PB = 4878 1875 = 3003 El error estandar estimado de la diferenda entre las proporciones de las muestras es

(4878)(5122) (1875)(8125) ---~~-~ +-------shy

123 96

El factor de confiabilidad a partir de la tabla D es 258 de modo que el intervalo de confianza con la f6rmula 661 es

3003 plusmn 258(0602) 14504556

Se dene la confianza de 99 por dento de que para las poblaciones muestteadas la ptopord6n de intentos de suiddio entre las niiias exceshyde a lapropord6n de intentosde suiddio entre los varones por 1450 y 4556

Puesto que el intervalo no incluye al cero se concluye que las dos proporciones de pobladones son diferentes bull

FJERCICIOS

Para cada uno de los siguientes ejercicios establezca las interpretaciones pnicticas y probabishylisticas de los intervalos que se pide construir Identifique cada componente del intervalo la estimaci6n puntual el coeficiente de confiabilidad y el error estandar Explique por que los coeficientes de confiabilidad no son el mismo para todos los ejercicios

661 Hargers et al (A-17) del departamento de Salud PUblica y Ambieptal en Amsterdam condushyjeron un estudio en el que los individuos eran consumidores de drogasinyectables (CDI) En una muestrade 194 consumidores de metadona regular de largo plazo (MLP) 145 eran varones En una muestra de 189 CDIque no consmiddotumian MLP 133 eran varones Establezca las consideraciones necesarias acerca de las muestras ypoblaciones representadas y construshy

180 CAPITULO 6 ESTlMACI6N

ya un intervalo de confianza de 95 por ciemo para la diferenda entre las proporciones de varones en las dos poblaciones

662 Una investigaci6n de Lane et ai (A-I8) valor6las diferencias en las pnicticas de deteccion de cancer de seno entre muestras de mujeres predominantemente de bajos ingresos con edashydes de 50 a 75 anos que lltilizan los servicios de c1inicas de sailld para todo el estado y mlljeres de la misma edad residentes en ciudades donde las c1inicas de salud son locales De las 404 encuestadas seleccionadas en toda la comunidad 592 por ciento estuvo de acuerdo con el siguiente comentario acerca del cancer de pecho las mujeres prolongan su vida si detectan el cancer desde el inicio De entre 795 usuarias de clinicas de salud en la mllestra 449 por ciento estuvo de acuerdo Establezca las suposiciones apropiadas para elaborar un intervalo de confianzade 99 por ciento para la diferencia entre las dos proporciones de las poblaciones de interes

663 Williams et at (A-19) encuestaron a una muestra de 67 medicos y 133 enfermeras con famishyliares farmacodependientes EI prop6sito del estudio era evaluar la influencia en los medishyEOS y enfermeras de estar estrechamente involucrados con una 0 mas personas farmaco dependientes Cincuenta y dos medicos y 89 enfermeras dijeron que vivian con personas farmacoldependientes que adversamente afectaban 8U trabajo E8tablezca todas las consideshyraciones que crea necesarias para construir un intervalo de confianza de 95 por ciento para la diferencia entre las proporciones en las dos poblaciones de trabajadores que se espera esten adversamente afectados por vivir con personas farmacodependientes

664 Aronow y Kronzon (A-20) identificaron los factores de riesgo coronado entre hombres y mujeres en una dinica de cuidados de la salud a largo plazo De los 215 individuos negros 58 tienen diabetes mellitus al igual que 217 individuos blancos de 1140 Elabore un intervalo de confianza de 90 por ciento de confianzapara la diferencia entre las proporciones de las dos poblaciones tCuaies son las poblaciones correspondientes ~Que consideraciones son necesarias para hacer valido el procedimiento de inferencia

67 DETEHMINAUON DEL TAMANO DE LA MUESTRA PARA LA ESTIMACIONDEIAS MEDIAS

La pregunta de que tan grande debe ser una muestra surge inmediatamente al inicio del planteamiento de cualquier encuesta 0 experimento Esta es una pregunshyta importante y no se debe tratara la ligera Tomar una muestra mas grande de 10 necesario para obtener los resultados deseados es un desperdicio de recursos mienshytras que por otro lado las muestras demasiado pequenas con frecuencia dan resulshytados que carecen de uso practico En esta secci6n se estudia c6mo determinar el tamano de la muestra de acuerdo con la situaci6n A continuaci6n se proporciona un metodo para determinar el tamano de la muestra que se requiere para estimar Ia media de la poblaci6n yen la siguiente secci6n se aplica este metodo para detershyminar el tamano de la milestra cuando se desea estimar la proporci6n de una poshyblaci6n Mediante extensiltmes directas de estos metodos es posible determinar el tamano necesario de las muestras para situaciones mas complicadas

Objetivos El objetivo de la estimaci6n porintervalos es el de obtener intervalos estrechos con alta confiabilidad Si se observan los componentes ~e un intervalo de confianzase veque 8U dimension esta determinada por la magnitud de la cantidad

(coeficiente de confiabilidad) x (error estandar)

131 67 DETERMINACION DEL TAMANO PARA LA l-IUESTRAmiddot

ya que lamagnitud total del intervalo de confIanza es eldoble de esta cantidad Se aprendi6 que a esta cantidad generalmente se Ie llama precisi6n de la estimaci6n o margen de error Para un error estandar dado incrementar la confIabilidad signishyfIca un coefIciente con mayor confIabilidad Y un coefIciente con mayor confIabilidad produce unintervalo mas amplio

Por otra parte si se ftia el coefIciente de confIabilidad la unica manera de redudr la amplitud del intervalo es la reducci6n del error estandar Dado que el error estandar es igual a (J IJ y como (J es una constante la unica forma de obtener un error estandar menor es tomar una muestra grande ~Que tan grande debeser la muestra Esto depende del tamafio de (J la desviad6n estandar de la poblaci6n asi como del grado de confIabilidad y dimensi6n del intervalo deseados

Suponga que se desea obtener un intervalo que se extienda d unidades hacia uno y otro lado del estimador Ellose enuncia

d (coefIciente de confIabilidad) X (error estandar) (671)

Si el muestreo es con reemplazos a partir de una poblaci6n infInita 0 de una que sea 10 sufIcientemente grande como para ignorar la correcci6n por poblaci6n fInita la ecuaci6n 671 se transforma en

(J

d z- (672)-r la cual cuando se despeja n nos da

(673)d2

Cuando el nmestreo se hacesin reemplazos a partir de una poblaci6n fInita y peshyquefia se requiere de la correcci6n por poblaci6n fInita y la ecuaci6n 671 se transforma en

(J~d (674)fN~

que al despejar n resulta en

n-----shy (675)d 2(N 1) + Z2(J2

Si puede omitirse la correcci6n por poblad6n fInita la ecuaci6n 675 se reshyduce a la ecuaci6n 673

Estillluci6n de (J 2 Las f6rmulas para el tamafio de la muestra requieren del conocimiento de (J2 pero como ya se ha sefialado la varian cia de la poblaci6n casi

132 CAPITULO 6 ESTlMACION

siempre sedesconoce Como resultado esnecesarioestimar (J2 Las fuentes de estishymaci6n de(J2 que se utilizan con mas frecuencia son las siguientes

1 Se extrae una muestrapilato 0 prel~l11inar de lapoblaci6n y se puede utilizar la variancia calculada a partir de esta muestra como unaestimaci6n de (J2 Las observaciones uti lizadas en la muestra piloto se toman como parte de la muesshytrafinal de modo que n (el tamaiio calculado de la muestra) n

1 (el tamaiio

de la muestra piloto) n2 (el numero de observaciones necesarias para satisfacer el requerimiento total del tamaiio de la muestra)

2 A partir de estudios anteriores osimilares es posible obtener estimaciones de (J2

3Si se cree que la poblaci6n de lacual se extrae la muestraposee una distribushyci6n aproximadamente nqrmal se puede aprovechar el hecho de que la amshyplitud es aproximadamente igual a 6 desviaciones estandar y calcular (J R6 Este metodo requiere aIglin conocimiento acerca de los valores minimo y maximo de la variable en la poblaci6n

EJEMPLO 671

Un nutri6logo del departamento de salud al efectuar una encuesta entre una poshyblacien de muchachas adolescentes con e1 fin de determinitr su ingesti6n diaria promedio de proteinas (medidas en gramos) busc6 el consejo de un bioestadistico con respecto al tamaiio de la muestra que deberfa tomar

~Que procedimiento debe seguir el bioestadistico para asesorar al nutri610go Antes de que el estadistico pueda ayudar el nutri6logo este debe proporcionar tres elementos de informaci6n h dimensi6n deseada del intervalo de confianza el nivel de confianza deseado y la magnitud de la variancia de la poblaci6n

Soludon Suponga que el nutri6logo requiere un intervalo con una dimensi6n de aprQximadamente 10 gramos es decir la estimaci6n se deberfa enconshytrar alrededor de 5 gramos de la media de la poblaci6n en ambas direcshyciones En otras palabras se desea un margen de error de 5 gramos Suponga que se decide por un coeficiente de confian7a de 95 y que con base en su experiencia previa el nutri6logo percibe que la desviaci6n estandar de la poblaci6n es probablemente de alrededor de 20 gramos EI estadfstico dispone ya de la informaci6n necesaria para calcular el tamaiio de la muestra z 196 (J = 20 y d 5 Suponga que el tamaiio de la poblaci6n es grande asf queel estadistico puede ignorar la correcshyci6n por poblaci6n finita y utilizar la ecuaci6n 673 Con las sustitucioshynes adecuadas el valor de n se calcula como

Se recomienda que el nutri610go tome una muestra de tamafio 62 AI calcular el tamaiio de una muestra a partir de las ecuaciones 673 0 675 el resultado se redondea al siguiente nurnero entero mayor si los calculosdan un numerocon decimales bull

183 68 DETERMINACION DEL TAl1ANO PARA LAS PROPORCIONES

EJERCICIOS

671 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su hospital Si se desea un intervalo de confianza de 99 por dento con una amplitud de 1 libra ~que tan grande debe ser la muestra de los registros de nacimiento Suponga que un estimashy

dor razonable para (J es 1 libra ~De que tamano debe ser la muestra si el coeficiente de confiabilidad se hace descender a 95

672 El director de la secdon de control dela rabia del departamento de salud publica desea extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso del ano anterior para estimar la edad media de las personas mordidas Requiere un intervalo de confianza de 95 por dento decide utilizar un valor de 25 para d y a partir de estudios anteriores estima que la desviacion estandar de la poblacion esta alrededor de los 15 anos ~Que tan grande debe ser el tamano de la muestra

673 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mglOO ml) de pacientes atendidos en una clinica para diabeticos durante el transcurso de los ultimos 10 anos Determine el numero de registros que el medico debe examinar para obtener un intershyvalo de confianza de 90 por ciento para 11 si la dimension requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varian cia de 60

674 Se deseaestimar la edad media en la que a los padentes de esclerosis multiple se les diagnosshytico el padecimiento por primera vez Se requiere un intervalo de confianza de 95 por dento con una dimension de 10 anos Si la variancia de la poblaci6n es de 90 ~que tan grande debera ser la muestra

68 DETERMINACION DELTAMANO DE lA MUESTRA PARA lA ESIDIACION DE lAS PROPORCIONES

EI metodo para estimar el tamafio de la muestra cuando se requiere estimar la proshyporcion de una poblacion es esencialmente el mismo que se describio para estimar la media de una poblacion Se aprovecha el hecho de que la mitad del intervalo deseashydo d se puede igualar al producto del coeficiente de confiabilidad y el error estandar

Si se supone que el muestreo ha sido hecho de manera aleatoria y que existen condiciones que garanticen que la distribuci6n de psea aproximadamente normal se obtiene la siguiente formula para n cuando el muestreo es con reemplazo cuanshydo se realizaa partir de una poblacion infinita 0 ruando la poblacion muestreada es 10 suficientemente grande como para hacer innecesario el uso de la correcci6n por poblacion finita

n (681)

dondeq = I-p Si la correccion por poblacion finita no puede descartarse la formula adecuashy

da paran es

(682)n d 2 (N -1)+z2pq

euan do N es grande en comparacion con n (es decir n IN 05) se puede pasar por alto la correccion por poblacion finita y la ecuacion 682 se reduce a la ecuacion 681

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

64 INTERV ALO DE CONFIANZA PAHALA DIFERENCIA ENTRE DOS MEDIAS 169

gre El numero promedio de celulas CD4+ para middot112 individuos con infecci6n por VIR fue de 4018 con una desviaci6n estandar de 2264 Para los 75 individuos sin la infecci6n por VIR la media y la desviaci6n estandar fueron de 8282 y 2749 respectivamente Se pretende elaborar un intervalo de confianza de 99 por ciento para la diferencia de las medias de las poblaciones

Soluci6n No hay informaci6n con respecto a la forma de la distribuci6n de las celulas CD4+ Sin embargo como el tamafto de las muestras es grande el teorema del limite central asegura que la distribuci6n muestral de las diferencias entre las medias de la muestra siguen una distribuci6n aproxishymadamente normal independientemente de que la distribuci6n de la variable en las poblaciones no siga una distribuci6n normal Se puede utilizar este hecho para justificar el uso de la estadistica z como factor de confiabilidad en la construcci6n del intervalo de confianza Tampoco hay informaci6n acerca de las desviaciones estandar por 10 que puede emplearse las desviaciones estandar de las muestras para estimarlas La estimaci6n puntual para la diferencia entre las medias de las poblacioshynes es la diferencia entre las medias de las muestras 8282 - 4018 = 4264 En la tabla D se encuentra que el factor de confiabilidad es 258 La estimaci6n del error estandar es

s __ = 27492

+ 22642 =382786

Xl-X 75 112

Por la ecuaci6n 641 el intervalo de confianza de 99 por ciento para la diferencia entre las medias de la poblaci6n es

4264 plusmn 258(382786) 3276 5252

Se tiene la seguridad de 99 por ciento de que el promedio de celulas CD4+ en varones con VIR positivo difieren de la media para los varoshynes con VIR negativo por 3276 a 5252 bull

Distribuci6n t y la diferencia entre las medias Cuando no se conocen las variancias y se pretende estimar la diferencia entre las medias de dos poblacioshynes con un intervalo de confianza es posible utilizar la distribuci6n t para suminisshytrar el factor de confiabilidad si se conocen ciertas suposiciones se debe saber 0

suponer de buena fe que las dos poblaciones muestreadas siguen una distribuci6n normal Respecto a las variancias de las poblaciones se debe distinguir entre dos situaciones 1) la situaci6n en la que las variancias son iguales y 2) la situaci6n en la que no 10 son A continuaci6n se consideranambas sitpaciones por separado

Varianciaspoblacifmales iguales Si la suposici6n sobre igualdad de las variancias de las poblaciones esta justificada las dos variancias de las muestras calculadas a partir de las muestras independientes pueden considerarse como estishymaciones de 10 mismo es decir la variancia comun Parece 16gico entonces aproshyvechar este hecho en el anal isis en cuesti6n Esto es precisamente 10 que se hace para establecer una estimaci6n conjunta para la variancia comun Esta variancia se obtiene mediante el caIculo promedio ponderado de las dos variancias de las muesshy

170 CAPITULO 6 ESTlMACI6N

tras Cada variancia de la muestra es ponderada con base en sus grados de libertad Si los tamafios de las muestras son iguales este promedio ponderado es la media aritmetica de las variancias de las dos muestras Si el tamano de las dos muestras es distinto el promedio ponderado aprovecha la informacion adicional proporcionada por la muestra mayor La estimacion con junta se obtiene con la fOrmula

S2 = (nl _1)SI2 + (n2 l)s~ p (642)

+n2 -2nl

Asf la estimacion del error estandar esta dada por

(643)

y el intervalo de confianza de 100(1 a) por ciento para III 112 esta dada por

(644)

El nfunero de grados de libertad utilizado para determinar el valor de t que se usa para construir el intervalo es n

1 + n

2 2 que es el denominador de la ecuacion

642 Este intervalo se interpreta en la forma habitual Los metodos que pueden emplearse para tomar la decision acerca de la igualshy

dad de las variancias de las poblaciones se estudian en la seccion 610 y 78

EJEMPLO 643

Uno de los estudios de Stone et al (A-6) tuvo como objetivo determinar los efectos del ejercicio por un tiempo prolongado en los ejecutivos de una compania inscritos en un programa supervisado de acondicionamiento fisico Se registraron datos de 13 individuos (el grupo deportista) que voluntariamente se inscribieron el programa y que permanecieron activos por 13 anos en promedio y de 17 individuos (el segunshydo grupo el sedentario) que decidieron no inscribirse Entre los datos que se regisshytraron acerca de los individuos esta el mlmero maximo de sentadillas realizadas en 30 segundos El grupo deportista obtuvo una media y una desviacion estandar de 210 y 49 respectivamente La media y la desviacion estandar para el grupo sedenshytario fueron 121 y 56 respectivamente Se considera que las dos poblaciones de medici ones de acondicionamiento muscular siguen una distribuci6n aproxirnadashymente normal y que las variancias para ambas poblacionesson iguales Se pretenshyde elaborar un intervalo de confianza de 95 por ciento para Ja diferencia entre las medias de as poblaciones representadas por las dos muestras Soluci6n Primero se utiliza la ecuaci6n 642 para calcular la estimaci6n conjunta

de la variancia comtin de las poblaciones

(13-1)(49 2 )+(17 1)(562 ) =2821

13+17-2 Cuando se consulta la tabla E con 13 + 17 - 2= 28 grados de libertad y el nivel de confianza de 95 se encuentra que eLfactor de confiabilidad es 20484 Con la ecuacion 644 se calcula el intervalo de confianza de

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS 171

95 por ciento para la diferencia entre las medias de las poblaciones de la siguiente manera

2821 2821(210-121)plusmn20484 --+-shy

13 17 89 plusmn 40085

49129

Se tiene una confianza de 95 por ciento de que la diferencia entre las medias de las poblaciones estan entre 49 y 129 Se puede decir esto porque se sabe quesi se repite el amilisis muchfsimas veces y se calculan los intervalos de confianza de la misma manera cerca de 95 por ciento de los intervalos de confianza induiran la diferencia entre las medias de las poblaciones

Debido a que los intervalos no induyen al cerose conduye que las medias de las poblaciones son diferentes bull

Variancias poblacionales distintas Cuando no se puede conduir que las variancias de dos poblaciones de interes son iguales aun ruando pueda suponerse que las dos poblaciones presentan distribuciones normales no es adecuado utilizar la distribucion t como se acaba de describir para construir los intervalos de confianza

Una solucion al problema de variancias distintas fue propuesta por Behrens (3) y posteriormente fue verificada y generalizada por Fisher (4 5) Neyman (6) Scheffe (7 8) Y Welch (9 10) tambien proponen soluciones EI problema es analizashydo en detalle por Cochran (11)

EI problema gira en tomo al hecho de que la cantidad

no sigue una distribuci6n t con nj + n 2 grados de libertad ruando las variancias 2 shy

de las poblaciones son distintas Consecuentemente la distribucion t no se puede utilizar en la forma habitual pata obtener el factor de confiabilidad del intervalo de confianza para la diferencia entre las medias de dos poblaciones que tienen variancias diferentes La solucion propuesta por Cochran consiste en el calculo del factor de confiabilidad mediante la siguiente formula

wltj + w2tZ t l

f

-0f2 = (645) WI +w2

donde WI 512

np W 2 = s~ n2 tl = tl _ para nj - 1 grados de libertad y t2 = t l

_w2aI2

para n2

- 1 grados de libertad Un intervalo aproximado de confianza del 100(1 shya) por ciento para III - 112 esta dado por

(646)

172

EJERCICIOS

CAPITULO 6 ESTlMACION

FJEIUPLO 644

En la investigacion de Stone et al (A-6) descrita en el ejercicio 643 los investigashydores tambien informaron los siguientes datos de las medici ones referentes a todas las calificaciones del acondicionamiento muscular logradas por los individuos

Muestra n Media Desviaci6n estimdar

Grupo deportista 13 45 3

Grupo sedentario 17 37 10

Se considera que las dos poblaciones de todas las calificaciones de acondicionashymiento muscular siguen una distribuci6n aproximadamente normal Sin embargo no debe suponerse que las dos variancias poblacionales son iguales Se pretende construir un intervalo de confianza de 95 por ciento para la diferencia entre las medias de todas las calificaciones de acondicionamiento muscular para las dos poshyblaciones representadas por las muestras

Soluci6n Se utiliza t de la ecuaci6n 645 para calcular el factor de confiabilidad En la tabla E se muestra que con 12 grados de libertad y 1 - 052 = 975 t( 21788 Analogamente con 16 grados de libertad y 1- 052 = 975 t2 = 21199 Ahora Sf calcula

(3 2 13)(21788) + (102 17)(21199) 139784 t= =

(3 2 13)+(102 17) 065747

=21261

Con la ecuaci6n 646 ahora se construye el intervalo de confianza de 95 por ciento para la diferencia entre las medias de las dos poblaciones

2 2

(45 37)plusmn21261 3 + 10 13 17

8 plusmn 21261 (25641101) 25134

Puesto que el intervalo no incluye acero se concluye que las medias de las dos poblaciones son diferentes bull

Cuando se construyen intervalos de confianza para la diferencia entre las medias de dos poblaciones es posible utilizar la figura 641 para decidir rapidashymente si el factor de confiabilidad debe ser z t 0 tf

Para cada uno de los siguientes ejercicios construya intervalos de confianza de 90 95 y 99 par ciento para las diferencias entre las medias poblacionales Establezca consideraciones que hagan que el metodo sea valido Determine las interpretaciones practica y probabilistica

clJ clJ FIGURA 541 Diagrama de flujo para decidir si e1 factor de confiabilidad debe ser z tot cuando se realizan inferencia inferencias acerca de la diferencia entre las medias de dos pobladones (Para usar un procedimiento no parametrico ver el capitulo 11)

174 CAPiTULO 6 ESTlMACION

para cad a intervalo construido Suponga las variables bajo considerati6n en cad a ejercicio y establezca para que pueden servir a los investigadores esos resultados

641 EI objetivo de un experimento de Buckner et al (A-7) consisti6 en estudiar los efectos del relajamiento muscular inducido por el pancuronium en el volumen del plasma circulante Los individuos estudiados son recien nacidos con un peso mayor a 1700 gramos que necesishytaron de ayuda para respirar durante las primeras 24 horas despues de nacer y cumplieron con otros criterios cHnicos Cinco recien nacidos paraIizados con el pancuronium y siete recien nacidos no tratados presentaron las siguientes estadisticas en la segunda de las tres mediciones del volumen de plasma (ml) hecha durante la respiraci6n mecanica

Paralizados 480 81 No tratados 567 81

La segunda medici6n para el grupo tratado ocurri6 de 12 a 24 horas despues de la primera dosis de pancuronium Para el grupo no tratado las mediciones se hicieron de 12 a 24 horas despues de iniciar la respiracion mecanica

642 Zuckery Archer (A-8) afirman que la N-nitrosobis (2-oxopropyl)amina (BOP) y las nitrosaminas 3-oxidizadas producen una alta incidencia de tumores de conductos pancreaticos en el hamster dorado sirio Estudiaron los efectos en el peso sangufneo en la glucosa del plasma en la insulina yen los niveles de transamina glutamico-oxaloacetica del plasma (GOT) de los hamsters expuestos in vivo a la BOP Los investigadores reportaron los siguientes resultados en ocho animales tratados y 12 sin tratamiento

Variable Sin tratamiento Con tratamiento

Glucosa del plasma (mglgl) 101 plusmn 5 74plusmn 6

FUENTE Peter F Zucker y Michael C Archer Alterations Pancreatic Islet Function Produced by Carcinogenic Nitrosamines in the Syrian Hamster AmericanJournal oPathology 133 573-577

Los datos son la media de la muestra plusmn la estimaci6n del error estandar de la media de la muestra

643 Los objetivos de un estudio de Davis et al (A-g) son evaluar 1) la eficacia del programa auto ayuda momento para dejar de fumar cuando se utiliza con base de uno a uno en el hogar y 2) la viabilidad de ensefiar temicas para abandonar el habito de fumar a los estudiantes de enfermerfa en bachillerato A estudiantes graduados de enfermerfa inscritos en dos cursos de metodologia de la investigacion de la Universidad de Ottawa se les invit6 a participar en el proyecto Se aplic6 un cuestionario de opcion multiple para abandonar el habito de fumar a 120 estudiantes de enfermeria que participaron y a otros 42 estudiantes que no participashyron antes ni despues del estudio Se calcularon las diferencias entre las calificaciones antes y despues del estudio as como las siguientes estadisticas a partir de las diferencias

EJERCICIOS 175

Grupo Media Desviaci6n estandar

Participantes (A) 214444 15392 No participantes (B) 33333 14595

644 El doctor Ali Khraibi (A-IO) de la CHnica y Fundaci6n Mayo condujo una serie de experishymentos con el fin de evaluar las respuestas diureticas y natiureticas de ratas Okamoto esponshytaneamente hipertensivas (REB) y ratas Wistar-Kyoto (WRY) para dirigir incrementos en la presion hidrostatica renal intersticial (PBRI) Para aumentar la PBRI se utiIiz6 la expansi6n directa del volumen renal intersticial (DRIVE) a traves de una matriz implantada cronicamente en el rinOn Entre los datos registrados durante el estudio estan las siguientes mediciones de excreci6n de sodio a traves de la orina (UNa V) durante el periodo de DRIVE

Grupo

REB 632572796483527 2WKY 420469482 108210

FUENTE Publicada con autorizaci6n del Dr Ali A Khraibi

645 Osberg y Di Scala (A-II) realizaron un estudio centrado en la eficacia de los cinturones de seguridad para reducir 1esiones entre sobrevivientes de accidentes automoviHsticos internashydos en hospitales con edades de 4 a 14 afios El estudio compar610s resultados de 123 ninos que utilizaron el cintur6n contra 290 que no 10 utilizaron entre aquellos que se vieton enshyvueltos en tales accidentes y que fueron hospitalizados El informe con tenia la siguiente estadistica del numero de dfas en la unidad de cuidados intensivos

Grupo Media Error estandar estimado

Utiliz6 el cintur6n 83 16 No utiliz6 el cintur6n 139 18

646 La medicion del diametro transversal del coraz6n de hombres y mujeres adultos presenta los siguientes resultados

sx Grupo Tamafto de Ia muestra (cm) (cm)

Varones 12 1321 105 Mujeres 9 IIOO 101

Considere que las poblaciones siguen una distribucion normal con variancias iguales

176 CAPITULO 6 ESTIMACION

647 Veintiruatro animales de laboratorio con deficiencia de vitamina D fueron divididos en dos grupos iguales EI grupo 1 recibi6 un tratamiento consistente en una dieta que proporcionashyba vitamina D EI segundo grupo no fue tratado AI termino del periodo experimental se midieron las concentraciones de calcio ensuero obteniendose los siguientes resultados

Grupo tratado X 111 mg 100 mls = 15 Grupo sin tratamiento x= 78 mg 100 ml s = 20

Considere que las poblaciones siguen una distribuci6n normal con variancias iguales

648 Ados grupos de nifios se les hicieron pruebas de agudeza vi~ual El grupo 1 estuvo formado por 11 nifios que recibieron la atenci6n de medicos privados La calificaci6n media para este grupo fue de 26 con una desviaci6n estandar de 5 El segundogrupo que incluy6 14 nifios que recibieron atenci6n medica por parte del departamento de salud publica tuvo una calishyficaci6n promedio de 21 con una desviaci6n estandar de 6 Suponga que las poblaciones siguen una distribuci6n normal con variancias iguales

649 El tiempo promedio de estancia de una muestra de 20 pacientes dados de alta de un hospital general es de siete dras con una desviaci6n estaildar de dos dras Una muestra de 24 padenshytes dados de alta de un hospital de enfermedades cr6nicas tuvo un tiempo promedio de estancia de 36 dfas con una desviaci6n estindar de 10 dias Suponga que la poblaci6n sigue una distribuci6n normal con variancias desiguales

6410 En un estudio de factores que se consideran responsables de los efectos adversos del tabashyquismo sobre la reproducci6n humana se midieron los niveles de cadmio (nanogramos por gramo) en el tejido de la placenta de una muestra de 14 madres que fumaban y una muestra aleatoria independiente de 18 mujeres no fumadoras Los resultados fueron los siguientes

No fumadoras toO 84 128250 118 98 125 154 235

94251 1952559875 118122150

Fumadoras 300301150241305178168148

134285 175 144 125204

ms probable que el nivel medio de cadmio registrado sea mayor entre las fumadoras que entre las no fumadoras ~Por que se llegarfa a esta conclusi6n

65 INTERVALO DE CONFIANZA PARA IA PROPORCION DE UNA POBIACION

Muchas preguntas de interes para que el tecnico en salud tienen relacion con las proporciones de poblacion ~Que propordon de padentes que redben un tipo espeshycial de tratamiento se recuperan ~Que proporcion de alguna poblacion tiene cierta enfermedad ~Que propordon de una poblacion es inmune a derta enfermedad

Para estimar la proporcion de una poblacion se procede en la misma forma que cuando se estima la media de una poblacion Se extrae una muestra de la poblacion de interes y se calcula su proporcion p Esta se utiliza como el estimador puntual para la proporcion de la pobladon Un intervalo de confianza se obtiene mediante la siguiente formula general

estimador plusmn (coefidente de confiabilidad) X (error estandar)

EJERCICIOS

EJERCICIOS 177

En el capitulo anterior se vio que cuando np y n(1 - p) son mayores que 5 se puede considerar que la distribuci6n muestral de pse aproxima bastante a una distribuci6n normal Cuando se cumple con esta condici6n el coeficiente de confiabilidad es algUn valor de z de la distribuci6n normal estandar Esta visto que el error estandar es igual a (J p =fi(l-p) n Puesto que p que es el parametro que se trata de calcular se desconoce se debe utilizar pcomo una estimaci6n Asf se estima (J j por medio de ~p(l Pn y el intervalo de confianza de 100(1 - 0) por ciento para pesta dado por

pplusmn Z(I-1J2)~P(l- P) Fn (651)

Este intervalo se interpreta tanto desde el punto de vista practico como probabilistico

FJEMPLO 651

Mathers et al (A-12) encontraron queen una muestra de 591 pacientes internados en un hospital psiquiatrico 204 admitieron que consuniieron marihuana al meshynos una vez durante su vida Se pretende construir un intervalo de confianza de 95 por ciento para la proporcion de individuos que consumieron marihuana durante su vida en la poblaci6n muestreada de los internos del hospital psiquiatrico

Solucion La mejor estima~i6n puntual para la proporci6Il de la poblaci6nes p== 204591 3452 El tamafio de la muestra y hiestimacion de p tienen una magnitud suficiente parajustifKar el empleo de la distribucion norshymal estandar paraelaborar un intervalo de confianza EI coeficiente de corifiabilidad que corresponde alnivel de confianza de 95 es 196 la estimacion del errorestandar (Jp es ~p(l-pgtn = (3452)(6548)591

0 1956El intervalo de confianza para p de acuerdo con estos datos es

3452 plusmn 196(01956) 3452 plusmn 0383 3069 3835

Se puede decir que se tiene 95 por ciento de confianza de que la proporshycionpeste entre 3069 y 3835 ya que al repetir el muestreo casi 95 por ciento de los intervalos construidos en la forma de este intervalo inclushyyen a la proporcion p real Con base en estos resultados se espera con una confianza de 95 por ciento encontrar que entre 3069 y 3835 por ciento de los internados en el hospital psiquiatrico tiene antecedentes de consumo de marihuana bull

Para cada uno de los siguientes ejercicios establezca la interpretacion prictica yprobabilistica de los intervalos que se pide construir Identifique cada componente del intervalo la estimashycion puntual el coeficiente de confiabilidad yel error estandar Explique por que los coefishycientes de confiabilidad no son los misInos para todos los ejercicios

178 CAPITULO 6 ESTIIlACI6N

651 En una investigaci6nde ninos maltratados en pacientes psiquiatricos Brown y Anderson (A-IS) encontraron 166 pacientes en una muestra de 947 con antecedentes de abuso sexual y maltrato flsico Construya un intervalo de confianza de 90 por dento para la proporci6n de la poblaci6n

652 Catania et at (A-14) obtuvieron datos respecto al comportamiento sexual de una muestra de hombres y mujeres solteros con edades entre 20 y 44 residentes en areas geoijfaficas caracshyterizadas por tasas altas de enfermedades de transmision sexual e ingreso a programas de drogas De 1229 encuestados 50 por ciento respondieron que nunca utilizaron preservatishyvos Construya un intervalo de confianza de 95 por ciento para la proporcion de la poblaci6n que nunca utiliza preservativos

653 Rothberg y Lits (A-I 5 ) estudiaron el efecto del estres de la maternidad durante el embarazo en el peso del producto Los individuos eran 86 mujeres blancas con antecedentes de estres que no tenfan faetores de riesgo medico u obstetrico conoddo de peso bajo del producto Los investigadores eneontraron que 128 por dento de las madres estudiadas dieron a luz bebes que cubrfan el criterio de peso bajo Construya un intervalo de confianza de 99 por ciento para la proporci6n de la poblaci6n

654 En una muestra aleatoria simple de 125 varones desempleados quienes desertaron de la escuela preparatoria entre las edades de 16 y 21 anos inclusive 88 declararon que eran consumidores regulares de bebidas alcoh6litas Construya un intervalo de eonfianza de 95 por ciento para la proporcion de la poblacion

66 INTERVALO DE CONFIANZA PARA lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS POBlACIONES

A menudo se tiene interes en conocer la magnitud de la diferencia entre las proporcioshynes de dospoblaciones Es posible que se quiera comparar por ejemplo entre hombres y mujeres dos grupos de edades dos grupos socioecon6micos 0 dos grupos de diagshynostico con respecto a la proporcion que posee alguna caractenstica de interes Un estimador puntual insesgado de la diferencia entre dos proporciones de las poblacioshynes se obtieneal calcular la diferencia de las proporciones de las muestras PI P2 Tal como Se ha visto cuando n1 Yn2 son de gran tamano y las proporciones de la poblacion no estan muy cerca de 0 0 de 1 es posible aplicar el teorema del limite central y utilizar la teona de la distribucion normal para obtener los intervalos de conshyfianza EI error estandar de la estimacion se calcula mediante la siguiente formula

dado que como regIa se desconocen las proporciones de Ia poblacion Un intervashy10 de confianza de 100(1 - a) por ciento para PI P2 se obtiene as

(661)

Es posible interpretar este intervalo desde elpunto de vista probabiHstico y practico

EJERCICIOS 179

EJEMPLO 661

Borst et al (A-16) investigaron la relaci6n de desarrollo del ego edad sexo y diagshyn6stico de suicidio entre los internos adolescentes de la unidad de psiquiatria La muestra consistia en 96 varones y 123 niiias con edades entre 12 y 16 aiios seleccioshynados de entre los internados en la unidad de adolescentes y niiios de un hospital psiquiatrico privado Se reportaron 18 niiios y 60 niiias con intento de suicidio Cons ishyderese el comportamiento de las niiias como el de una muestra aleatoria simple a partir de una poblaci6n similar de niiias y que los j6venes igualmente pueden considerarse como una muestra aleatoria simple extraida de una poblaci6n similar de niiios Para estas dos poblaciones se pretende construir un intervalo de confianshyza de 99 por ciento para la diferencia entre las proporciones de los individuos con intento de suicidio

Soluci6n Las proporciones para las niiias y niiios respectivamente son Pc = 601 123 = A878y PB = 1896 1875 La diferencia entre las proporciones de lasmuestrases Pc PB = 4878 1875 = 3003 El error estandar estimado de la diferenda entre las proporciones de las muestras es

(4878)(5122) (1875)(8125) ---~~-~ +-------shy

123 96

El factor de confiabilidad a partir de la tabla D es 258 de modo que el intervalo de confianza con la f6rmula 661 es

3003 plusmn 258(0602) 14504556

Se dene la confianza de 99 por dento de que para las poblaciones muestteadas la ptopord6n de intentos de suiddio entre las niiias exceshyde a lapropord6n de intentosde suiddio entre los varones por 1450 y 4556

Puesto que el intervalo no incluye al cero se concluye que las dos proporciones de pobladones son diferentes bull

FJERCICIOS

Para cada uno de los siguientes ejercicios establezca las interpretaciones pnicticas y probabishylisticas de los intervalos que se pide construir Identifique cada componente del intervalo la estimaci6n puntual el coeficiente de confiabilidad y el error estandar Explique por que los coeficientes de confiabilidad no son el mismo para todos los ejercicios

661 Hargers et al (A-17) del departamento de Salud PUblica y Ambieptal en Amsterdam condushyjeron un estudio en el que los individuos eran consumidores de drogasinyectables (CDI) En una muestrade 194 consumidores de metadona regular de largo plazo (MLP) 145 eran varones En una muestra de 189 CDIque no consmiddotumian MLP 133 eran varones Establezca las consideraciones necesarias acerca de las muestras ypoblaciones representadas y construshy

180 CAPITULO 6 ESTlMACI6N

ya un intervalo de confianza de 95 por ciemo para la diferenda entre las proporciones de varones en las dos poblaciones

662 Una investigaci6n de Lane et ai (A-I8) valor6las diferencias en las pnicticas de deteccion de cancer de seno entre muestras de mujeres predominantemente de bajos ingresos con edashydes de 50 a 75 anos que lltilizan los servicios de c1inicas de sailld para todo el estado y mlljeres de la misma edad residentes en ciudades donde las c1inicas de salud son locales De las 404 encuestadas seleccionadas en toda la comunidad 592 por ciento estuvo de acuerdo con el siguiente comentario acerca del cancer de pecho las mujeres prolongan su vida si detectan el cancer desde el inicio De entre 795 usuarias de clinicas de salud en la mllestra 449 por ciento estuvo de acuerdo Establezca las suposiciones apropiadas para elaborar un intervalo de confianzade 99 por ciento para la diferencia entre las dos proporciones de las poblaciones de interes

663 Williams et at (A-19) encuestaron a una muestra de 67 medicos y 133 enfermeras con famishyliares farmacodependientes EI prop6sito del estudio era evaluar la influencia en los medishyEOS y enfermeras de estar estrechamente involucrados con una 0 mas personas farmaco dependientes Cincuenta y dos medicos y 89 enfermeras dijeron que vivian con personas farmacoldependientes que adversamente afectaban 8U trabajo E8tablezca todas las consideshyraciones que crea necesarias para construir un intervalo de confianza de 95 por ciento para la diferencia entre las proporciones en las dos poblaciones de trabajadores que se espera esten adversamente afectados por vivir con personas farmacodependientes

664 Aronow y Kronzon (A-20) identificaron los factores de riesgo coronado entre hombres y mujeres en una dinica de cuidados de la salud a largo plazo De los 215 individuos negros 58 tienen diabetes mellitus al igual que 217 individuos blancos de 1140 Elabore un intervalo de confianza de 90 por ciento de confianzapara la diferencia entre las proporciones de las dos poblaciones tCuaies son las poblaciones correspondientes ~Que consideraciones son necesarias para hacer valido el procedimiento de inferencia

67 DETEHMINAUON DEL TAMANO DE LA MUESTRA PARA LA ESTIMACIONDEIAS MEDIAS

La pregunta de que tan grande debe ser una muestra surge inmediatamente al inicio del planteamiento de cualquier encuesta 0 experimento Esta es una pregunshyta importante y no se debe tratara la ligera Tomar una muestra mas grande de 10 necesario para obtener los resultados deseados es un desperdicio de recursos mienshytras que por otro lado las muestras demasiado pequenas con frecuencia dan resulshytados que carecen de uso practico En esta secci6n se estudia c6mo determinar el tamano de la muestra de acuerdo con la situaci6n A continuaci6n se proporciona un metodo para determinar el tamano de la muestra que se requiere para estimar Ia media de la poblaci6n yen la siguiente secci6n se aplica este metodo para detershyminar el tamano de la milestra cuando se desea estimar la proporci6n de una poshyblaci6n Mediante extensiltmes directas de estos metodos es posible determinar el tamano necesario de las muestras para situaciones mas complicadas

Objetivos El objetivo de la estimaci6n porintervalos es el de obtener intervalos estrechos con alta confiabilidad Si se observan los componentes ~e un intervalo de confianzase veque 8U dimension esta determinada por la magnitud de la cantidad

(coeficiente de confiabilidad) x (error estandar)

131 67 DETERMINACION DEL TAMANO PARA LA l-IUESTRAmiddot

ya que lamagnitud total del intervalo de confIanza es eldoble de esta cantidad Se aprendi6 que a esta cantidad generalmente se Ie llama precisi6n de la estimaci6n o margen de error Para un error estandar dado incrementar la confIabilidad signishyfIca un coefIciente con mayor confIabilidad Y un coefIciente con mayor confIabilidad produce unintervalo mas amplio

Por otra parte si se ftia el coefIciente de confIabilidad la unica manera de redudr la amplitud del intervalo es la reducci6n del error estandar Dado que el error estandar es igual a (J IJ y como (J es una constante la unica forma de obtener un error estandar menor es tomar una muestra grande ~Que tan grande debeser la muestra Esto depende del tamafio de (J la desviad6n estandar de la poblaci6n asi como del grado de confIabilidad y dimensi6n del intervalo deseados

Suponga que se desea obtener un intervalo que se extienda d unidades hacia uno y otro lado del estimador Ellose enuncia

d (coefIciente de confIabilidad) X (error estandar) (671)

Si el muestreo es con reemplazos a partir de una poblaci6n infInita 0 de una que sea 10 sufIcientemente grande como para ignorar la correcci6n por poblaci6n fInita la ecuaci6n 671 se transforma en

(J

d z- (672)-r la cual cuando se despeja n nos da

(673)d2

Cuando el nmestreo se hacesin reemplazos a partir de una poblaci6n fInita y peshyquefia se requiere de la correcci6n por poblaci6n fInita y la ecuaci6n 671 se transforma en

(J~d (674)fN~

que al despejar n resulta en

n-----shy (675)d 2(N 1) + Z2(J2

Si puede omitirse la correcci6n por poblad6n fInita la ecuaci6n 675 se reshyduce a la ecuaci6n 673

Estillluci6n de (J 2 Las f6rmulas para el tamafio de la muestra requieren del conocimiento de (J2 pero como ya se ha sefialado la varian cia de la poblaci6n casi

132 CAPITULO 6 ESTlMACION

siempre sedesconoce Como resultado esnecesarioestimar (J2 Las fuentes de estishymaci6n de(J2 que se utilizan con mas frecuencia son las siguientes

1 Se extrae una muestrapilato 0 prel~l11inar de lapoblaci6n y se puede utilizar la variancia calculada a partir de esta muestra como unaestimaci6n de (J2 Las observaciones uti lizadas en la muestra piloto se toman como parte de la muesshytrafinal de modo que n (el tamaiio calculado de la muestra) n

1 (el tamaiio

de la muestra piloto) n2 (el numero de observaciones necesarias para satisfacer el requerimiento total del tamaiio de la muestra)

2 A partir de estudios anteriores osimilares es posible obtener estimaciones de (J2

3Si se cree que la poblaci6n de lacual se extrae la muestraposee una distribushyci6n aproximadamente nqrmal se puede aprovechar el hecho de que la amshyplitud es aproximadamente igual a 6 desviaciones estandar y calcular (J R6 Este metodo requiere aIglin conocimiento acerca de los valores minimo y maximo de la variable en la poblaci6n

EJEMPLO 671

Un nutri6logo del departamento de salud al efectuar una encuesta entre una poshyblacien de muchachas adolescentes con e1 fin de determinitr su ingesti6n diaria promedio de proteinas (medidas en gramos) busc6 el consejo de un bioestadistico con respecto al tamaiio de la muestra que deberfa tomar

~Que procedimiento debe seguir el bioestadistico para asesorar al nutri610go Antes de que el estadistico pueda ayudar el nutri6logo este debe proporcionar tres elementos de informaci6n h dimensi6n deseada del intervalo de confianza el nivel de confianza deseado y la magnitud de la variancia de la poblaci6n

Soludon Suponga que el nutri6logo requiere un intervalo con una dimensi6n de aprQximadamente 10 gramos es decir la estimaci6n se deberfa enconshytrar alrededor de 5 gramos de la media de la poblaci6n en ambas direcshyciones En otras palabras se desea un margen de error de 5 gramos Suponga que se decide por un coeficiente de confian7a de 95 y que con base en su experiencia previa el nutri6logo percibe que la desviaci6n estandar de la poblaci6n es probablemente de alrededor de 20 gramos EI estadfstico dispone ya de la informaci6n necesaria para calcular el tamaiio de la muestra z 196 (J = 20 y d 5 Suponga que el tamaiio de la poblaci6n es grande asf queel estadistico puede ignorar la correcshyci6n por poblaci6n finita y utilizar la ecuaci6n 673 Con las sustitucioshynes adecuadas el valor de n se calcula como

Se recomienda que el nutri610go tome una muestra de tamafio 62 AI calcular el tamaiio de una muestra a partir de las ecuaciones 673 0 675 el resultado se redondea al siguiente nurnero entero mayor si los calculosdan un numerocon decimales bull

183 68 DETERMINACION DEL TAl1ANO PARA LAS PROPORCIONES

EJERCICIOS

671 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su hospital Si se desea un intervalo de confianza de 99 por dento con una amplitud de 1 libra ~que tan grande debe ser la muestra de los registros de nacimiento Suponga que un estimashy

dor razonable para (J es 1 libra ~De que tamano debe ser la muestra si el coeficiente de confiabilidad se hace descender a 95

672 El director de la secdon de control dela rabia del departamento de salud publica desea extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso del ano anterior para estimar la edad media de las personas mordidas Requiere un intervalo de confianza de 95 por dento decide utilizar un valor de 25 para d y a partir de estudios anteriores estima que la desviacion estandar de la poblacion esta alrededor de los 15 anos ~Que tan grande debe ser el tamano de la muestra

673 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mglOO ml) de pacientes atendidos en una clinica para diabeticos durante el transcurso de los ultimos 10 anos Determine el numero de registros que el medico debe examinar para obtener un intershyvalo de confianza de 90 por ciento para 11 si la dimension requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varian cia de 60

674 Se deseaestimar la edad media en la que a los padentes de esclerosis multiple se les diagnosshytico el padecimiento por primera vez Se requiere un intervalo de confianza de 95 por dento con una dimension de 10 anos Si la variancia de la poblaci6n es de 90 ~que tan grande debera ser la muestra

68 DETERMINACION DELTAMANO DE lA MUESTRA PARA lA ESIDIACION DE lAS PROPORCIONES

EI metodo para estimar el tamafio de la muestra cuando se requiere estimar la proshyporcion de una poblacion es esencialmente el mismo que se describio para estimar la media de una poblacion Se aprovecha el hecho de que la mitad del intervalo deseashydo d se puede igualar al producto del coeficiente de confiabilidad y el error estandar

Si se supone que el muestreo ha sido hecho de manera aleatoria y que existen condiciones que garanticen que la distribuci6n de psea aproximadamente normal se obtiene la siguiente formula para n cuando el muestreo es con reemplazo cuanshydo se realizaa partir de una poblacion infinita 0 ruando la poblacion muestreada es 10 suficientemente grande como para hacer innecesario el uso de la correcci6n por poblacion finita

n (681)

dondeq = I-p Si la correccion por poblacion finita no puede descartarse la formula adecuashy

da paran es

(682)n d 2 (N -1)+z2pq

euan do N es grande en comparacion con n (es decir n IN 05) se puede pasar por alto la correccion por poblacion finita y la ecuacion 682 se reduce a la ecuacion 681

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

170 CAPITULO 6 ESTlMACI6N

tras Cada variancia de la muestra es ponderada con base en sus grados de libertad Si los tamafios de las muestras son iguales este promedio ponderado es la media aritmetica de las variancias de las dos muestras Si el tamano de las dos muestras es distinto el promedio ponderado aprovecha la informacion adicional proporcionada por la muestra mayor La estimacion con junta se obtiene con la fOrmula

S2 = (nl _1)SI2 + (n2 l)s~ p (642)

+n2 -2nl

Asf la estimacion del error estandar esta dada por

(643)

y el intervalo de confianza de 100(1 a) por ciento para III 112 esta dada por

(644)

El nfunero de grados de libertad utilizado para determinar el valor de t que se usa para construir el intervalo es n

1 + n

2 2 que es el denominador de la ecuacion

642 Este intervalo se interpreta en la forma habitual Los metodos que pueden emplearse para tomar la decision acerca de la igualshy

dad de las variancias de las poblaciones se estudian en la seccion 610 y 78

EJEMPLO 643

Uno de los estudios de Stone et al (A-6) tuvo como objetivo determinar los efectos del ejercicio por un tiempo prolongado en los ejecutivos de una compania inscritos en un programa supervisado de acondicionamiento fisico Se registraron datos de 13 individuos (el grupo deportista) que voluntariamente se inscribieron el programa y que permanecieron activos por 13 anos en promedio y de 17 individuos (el segunshydo grupo el sedentario) que decidieron no inscribirse Entre los datos que se regisshytraron acerca de los individuos esta el mlmero maximo de sentadillas realizadas en 30 segundos El grupo deportista obtuvo una media y una desviacion estandar de 210 y 49 respectivamente La media y la desviacion estandar para el grupo sedenshytario fueron 121 y 56 respectivamente Se considera que las dos poblaciones de medici ones de acondicionamiento muscular siguen una distribuci6n aproxirnadashymente normal y que las variancias para ambas poblacionesson iguales Se pretenshyde elaborar un intervalo de confianza de 95 por ciento para Ja diferencia entre las medias de as poblaciones representadas por las dos muestras Soluci6n Primero se utiliza la ecuaci6n 642 para calcular la estimaci6n conjunta

de la variancia comtin de las poblaciones

(13-1)(49 2 )+(17 1)(562 ) =2821

13+17-2 Cuando se consulta la tabla E con 13 + 17 - 2= 28 grados de libertad y el nivel de confianza de 95 se encuentra que eLfactor de confiabilidad es 20484 Con la ecuacion 644 se calcula el intervalo de confianza de

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS 171

95 por ciento para la diferencia entre las medias de las poblaciones de la siguiente manera

2821 2821(210-121)plusmn20484 --+-shy

13 17 89 plusmn 40085

49129

Se tiene una confianza de 95 por ciento de que la diferencia entre las medias de las poblaciones estan entre 49 y 129 Se puede decir esto porque se sabe quesi se repite el amilisis muchfsimas veces y se calculan los intervalos de confianza de la misma manera cerca de 95 por ciento de los intervalos de confianza induiran la diferencia entre las medias de las poblaciones

Debido a que los intervalos no induyen al cerose conduye que las medias de las poblaciones son diferentes bull

Variancias poblacionales distintas Cuando no se puede conduir que las variancias de dos poblaciones de interes son iguales aun ruando pueda suponerse que las dos poblaciones presentan distribuciones normales no es adecuado utilizar la distribucion t como se acaba de describir para construir los intervalos de confianza

Una solucion al problema de variancias distintas fue propuesta por Behrens (3) y posteriormente fue verificada y generalizada por Fisher (4 5) Neyman (6) Scheffe (7 8) Y Welch (9 10) tambien proponen soluciones EI problema es analizashydo en detalle por Cochran (11)

EI problema gira en tomo al hecho de que la cantidad

no sigue una distribuci6n t con nj + n 2 grados de libertad ruando las variancias 2 shy

de las poblaciones son distintas Consecuentemente la distribucion t no se puede utilizar en la forma habitual pata obtener el factor de confiabilidad del intervalo de confianza para la diferencia entre las medias de dos poblaciones que tienen variancias diferentes La solucion propuesta por Cochran consiste en el calculo del factor de confiabilidad mediante la siguiente formula

wltj + w2tZ t l

f

-0f2 = (645) WI +w2

donde WI 512

np W 2 = s~ n2 tl = tl _ para nj - 1 grados de libertad y t2 = t l

_w2aI2

para n2

- 1 grados de libertad Un intervalo aproximado de confianza del 100(1 shya) por ciento para III - 112 esta dado por

(646)

172

EJERCICIOS

CAPITULO 6 ESTlMACION

FJEIUPLO 644

En la investigacion de Stone et al (A-6) descrita en el ejercicio 643 los investigashydores tambien informaron los siguientes datos de las medici ones referentes a todas las calificaciones del acondicionamiento muscular logradas por los individuos

Muestra n Media Desviaci6n estimdar

Grupo deportista 13 45 3

Grupo sedentario 17 37 10

Se considera que las dos poblaciones de todas las calificaciones de acondicionashymiento muscular siguen una distribuci6n aproximadamente normal Sin embargo no debe suponerse que las dos variancias poblacionales son iguales Se pretende construir un intervalo de confianza de 95 por ciento para la diferencia entre las medias de todas las calificaciones de acondicionamiento muscular para las dos poshyblaciones representadas por las muestras

Soluci6n Se utiliza t de la ecuaci6n 645 para calcular el factor de confiabilidad En la tabla E se muestra que con 12 grados de libertad y 1 - 052 = 975 t( 21788 Analogamente con 16 grados de libertad y 1- 052 = 975 t2 = 21199 Ahora Sf calcula

(3 2 13)(21788) + (102 17)(21199) 139784 t= =

(3 2 13)+(102 17) 065747

=21261

Con la ecuaci6n 646 ahora se construye el intervalo de confianza de 95 por ciento para la diferencia entre las medias de las dos poblaciones

2 2

(45 37)plusmn21261 3 + 10 13 17

8 plusmn 21261 (25641101) 25134

Puesto que el intervalo no incluye acero se concluye que las medias de las dos poblaciones son diferentes bull

Cuando se construyen intervalos de confianza para la diferencia entre las medias de dos poblaciones es posible utilizar la figura 641 para decidir rapidashymente si el factor de confiabilidad debe ser z t 0 tf

Para cada uno de los siguientes ejercicios construya intervalos de confianza de 90 95 y 99 par ciento para las diferencias entre las medias poblacionales Establezca consideraciones que hagan que el metodo sea valido Determine las interpretaciones practica y probabilistica

clJ clJ FIGURA 541 Diagrama de flujo para decidir si e1 factor de confiabilidad debe ser z tot cuando se realizan inferencia inferencias acerca de la diferencia entre las medias de dos pobladones (Para usar un procedimiento no parametrico ver el capitulo 11)

174 CAPiTULO 6 ESTlMACION

para cad a intervalo construido Suponga las variables bajo considerati6n en cad a ejercicio y establezca para que pueden servir a los investigadores esos resultados

641 EI objetivo de un experimento de Buckner et al (A-7) consisti6 en estudiar los efectos del relajamiento muscular inducido por el pancuronium en el volumen del plasma circulante Los individuos estudiados son recien nacidos con un peso mayor a 1700 gramos que necesishytaron de ayuda para respirar durante las primeras 24 horas despues de nacer y cumplieron con otros criterios cHnicos Cinco recien nacidos paraIizados con el pancuronium y siete recien nacidos no tratados presentaron las siguientes estadisticas en la segunda de las tres mediciones del volumen de plasma (ml) hecha durante la respiraci6n mecanica

Paralizados 480 81 No tratados 567 81

La segunda medici6n para el grupo tratado ocurri6 de 12 a 24 horas despues de la primera dosis de pancuronium Para el grupo no tratado las mediciones se hicieron de 12 a 24 horas despues de iniciar la respiracion mecanica

642 Zuckery Archer (A-8) afirman que la N-nitrosobis (2-oxopropyl)amina (BOP) y las nitrosaminas 3-oxidizadas producen una alta incidencia de tumores de conductos pancreaticos en el hamster dorado sirio Estudiaron los efectos en el peso sangufneo en la glucosa del plasma en la insulina yen los niveles de transamina glutamico-oxaloacetica del plasma (GOT) de los hamsters expuestos in vivo a la BOP Los investigadores reportaron los siguientes resultados en ocho animales tratados y 12 sin tratamiento

Variable Sin tratamiento Con tratamiento

Glucosa del plasma (mglgl) 101 plusmn 5 74plusmn 6

FUENTE Peter F Zucker y Michael C Archer Alterations Pancreatic Islet Function Produced by Carcinogenic Nitrosamines in the Syrian Hamster AmericanJournal oPathology 133 573-577

Los datos son la media de la muestra plusmn la estimaci6n del error estandar de la media de la muestra

643 Los objetivos de un estudio de Davis et al (A-g) son evaluar 1) la eficacia del programa auto ayuda momento para dejar de fumar cuando se utiliza con base de uno a uno en el hogar y 2) la viabilidad de ensefiar temicas para abandonar el habito de fumar a los estudiantes de enfermerfa en bachillerato A estudiantes graduados de enfermerfa inscritos en dos cursos de metodologia de la investigacion de la Universidad de Ottawa se les invit6 a participar en el proyecto Se aplic6 un cuestionario de opcion multiple para abandonar el habito de fumar a 120 estudiantes de enfermeria que participaron y a otros 42 estudiantes que no participashyron antes ni despues del estudio Se calcularon las diferencias entre las calificaciones antes y despues del estudio as como las siguientes estadisticas a partir de las diferencias

EJERCICIOS 175

Grupo Media Desviaci6n estandar

Participantes (A) 214444 15392 No participantes (B) 33333 14595

644 El doctor Ali Khraibi (A-IO) de la CHnica y Fundaci6n Mayo condujo una serie de experishymentos con el fin de evaluar las respuestas diureticas y natiureticas de ratas Okamoto esponshytaneamente hipertensivas (REB) y ratas Wistar-Kyoto (WRY) para dirigir incrementos en la presion hidrostatica renal intersticial (PBRI) Para aumentar la PBRI se utiIiz6 la expansi6n directa del volumen renal intersticial (DRIVE) a traves de una matriz implantada cronicamente en el rinOn Entre los datos registrados durante el estudio estan las siguientes mediciones de excreci6n de sodio a traves de la orina (UNa V) durante el periodo de DRIVE

Grupo

REB 632572796483527 2WKY 420469482 108210

FUENTE Publicada con autorizaci6n del Dr Ali A Khraibi

645 Osberg y Di Scala (A-II) realizaron un estudio centrado en la eficacia de los cinturones de seguridad para reducir 1esiones entre sobrevivientes de accidentes automoviHsticos internashydos en hospitales con edades de 4 a 14 afios El estudio compar610s resultados de 123 ninos que utilizaron el cintur6n contra 290 que no 10 utilizaron entre aquellos que se vieton enshyvueltos en tales accidentes y que fueron hospitalizados El informe con tenia la siguiente estadistica del numero de dfas en la unidad de cuidados intensivos

Grupo Media Error estandar estimado

Utiliz6 el cintur6n 83 16 No utiliz6 el cintur6n 139 18

646 La medicion del diametro transversal del coraz6n de hombres y mujeres adultos presenta los siguientes resultados

sx Grupo Tamafto de Ia muestra (cm) (cm)

Varones 12 1321 105 Mujeres 9 IIOO 101

Considere que las poblaciones siguen una distribucion normal con variancias iguales

176 CAPITULO 6 ESTIMACION

647 Veintiruatro animales de laboratorio con deficiencia de vitamina D fueron divididos en dos grupos iguales EI grupo 1 recibi6 un tratamiento consistente en una dieta que proporcionashyba vitamina D EI segundo grupo no fue tratado AI termino del periodo experimental se midieron las concentraciones de calcio ensuero obteniendose los siguientes resultados

Grupo tratado X 111 mg 100 mls = 15 Grupo sin tratamiento x= 78 mg 100 ml s = 20

Considere que las poblaciones siguen una distribuci6n normal con variancias iguales

648 Ados grupos de nifios se les hicieron pruebas de agudeza vi~ual El grupo 1 estuvo formado por 11 nifios que recibieron la atenci6n de medicos privados La calificaci6n media para este grupo fue de 26 con una desviaci6n estandar de 5 El segundogrupo que incluy6 14 nifios que recibieron atenci6n medica por parte del departamento de salud publica tuvo una calishyficaci6n promedio de 21 con una desviaci6n estandar de 6 Suponga que las poblaciones siguen una distribuci6n normal con variancias iguales

649 El tiempo promedio de estancia de una muestra de 20 pacientes dados de alta de un hospital general es de siete dras con una desviaci6n estaildar de dos dras Una muestra de 24 padenshytes dados de alta de un hospital de enfermedades cr6nicas tuvo un tiempo promedio de estancia de 36 dfas con una desviaci6n estindar de 10 dias Suponga que la poblaci6n sigue una distribuci6n normal con variancias desiguales

6410 En un estudio de factores que se consideran responsables de los efectos adversos del tabashyquismo sobre la reproducci6n humana se midieron los niveles de cadmio (nanogramos por gramo) en el tejido de la placenta de una muestra de 14 madres que fumaban y una muestra aleatoria independiente de 18 mujeres no fumadoras Los resultados fueron los siguientes

No fumadoras toO 84 128250 118 98 125 154 235

94251 1952559875 118122150

Fumadoras 300301150241305178168148

134285 175 144 125204

ms probable que el nivel medio de cadmio registrado sea mayor entre las fumadoras que entre las no fumadoras ~Por que se llegarfa a esta conclusi6n

65 INTERVALO DE CONFIANZA PARA IA PROPORCION DE UNA POBIACION

Muchas preguntas de interes para que el tecnico en salud tienen relacion con las proporciones de poblacion ~Que propordon de padentes que redben un tipo espeshycial de tratamiento se recuperan ~Que proporcion de alguna poblacion tiene cierta enfermedad ~Que propordon de una poblacion es inmune a derta enfermedad

Para estimar la proporcion de una poblacion se procede en la misma forma que cuando se estima la media de una poblacion Se extrae una muestra de la poblacion de interes y se calcula su proporcion p Esta se utiliza como el estimador puntual para la proporcion de la pobladon Un intervalo de confianza se obtiene mediante la siguiente formula general

estimador plusmn (coefidente de confiabilidad) X (error estandar)

EJERCICIOS

EJERCICIOS 177

En el capitulo anterior se vio que cuando np y n(1 - p) son mayores que 5 se puede considerar que la distribuci6n muestral de pse aproxima bastante a una distribuci6n normal Cuando se cumple con esta condici6n el coeficiente de confiabilidad es algUn valor de z de la distribuci6n normal estandar Esta visto que el error estandar es igual a (J p =fi(l-p) n Puesto que p que es el parametro que se trata de calcular se desconoce se debe utilizar pcomo una estimaci6n Asf se estima (J j por medio de ~p(l Pn y el intervalo de confianza de 100(1 - 0) por ciento para pesta dado por

pplusmn Z(I-1J2)~P(l- P) Fn (651)

Este intervalo se interpreta tanto desde el punto de vista practico como probabilistico

FJEMPLO 651

Mathers et al (A-12) encontraron queen una muestra de 591 pacientes internados en un hospital psiquiatrico 204 admitieron que consuniieron marihuana al meshynos una vez durante su vida Se pretende construir un intervalo de confianza de 95 por ciento para la proporcion de individuos que consumieron marihuana durante su vida en la poblaci6n muestreada de los internos del hospital psiquiatrico

Solucion La mejor estima~i6n puntual para la proporci6Il de la poblaci6nes p== 204591 3452 El tamafio de la muestra y hiestimacion de p tienen una magnitud suficiente parajustifKar el empleo de la distribucion norshymal estandar paraelaborar un intervalo de confianza EI coeficiente de corifiabilidad que corresponde alnivel de confianza de 95 es 196 la estimacion del errorestandar (Jp es ~p(l-pgtn = (3452)(6548)591

0 1956El intervalo de confianza para p de acuerdo con estos datos es

3452 plusmn 196(01956) 3452 plusmn 0383 3069 3835

Se puede decir que se tiene 95 por ciento de confianza de que la proporshycionpeste entre 3069 y 3835 ya que al repetir el muestreo casi 95 por ciento de los intervalos construidos en la forma de este intervalo inclushyyen a la proporcion p real Con base en estos resultados se espera con una confianza de 95 por ciento encontrar que entre 3069 y 3835 por ciento de los internados en el hospital psiquiatrico tiene antecedentes de consumo de marihuana bull

Para cada uno de los siguientes ejercicios establezca la interpretacion prictica yprobabilistica de los intervalos que se pide construir Identifique cada componente del intervalo la estimashycion puntual el coeficiente de confiabilidad yel error estandar Explique por que los coefishycientes de confiabilidad no son los misInos para todos los ejercicios

178 CAPITULO 6 ESTIIlACI6N

651 En una investigaci6nde ninos maltratados en pacientes psiquiatricos Brown y Anderson (A-IS) encontraron 166 pacientes en una muestra de 947 con antecedentes de abuso sexual y maltrato flsico Construya un intervalo de confianza de 90 por dento para la proporci6n de la poblaci6n

652 Catania et at (A-14) obtuvieron datos respecto al comportamiento sexual de una muestra de hombres y mujeres solteros con edades entre 20 y 44 residentes en areas geoijfaficas caracshyterizadas por tasas altas de enfermedades de transmision sexual e ingreso a programas de drogas De 1229 encuestados 50 por ciento respondieron que nunca utilizaron preservatishyvos Construya un intervalo de confianza de 95 por ciento para la proporcion de la poblaci6n que nunca utiliza preservativos

653 Rothberg y Lits (A-I 5 ) estudiaron el efecto del estres de la maternidad durante el embarazo en el peso del producto Los individuos eran 86 mujeres blancas con antecedentes de estres que no tenfan faetores de riesgo medico u obstetrico conoddo de peso bajo del producto Los investigadores eneontraron que 128 por dento de las madres estudiadas dieron a luz bebes que cubrfan el criterio de peso bajo Construya un intervalo de confianza de 99 por ciento para la proporci6n de la poblaci6n

654 En una muestra aleatoria simple de 125 varones desempleados quienes desertaron de la escuela preparatoria entre las edades de 16 y 21 anos inclusive 88 declararon que eran consumidores regulares de bebidas alcoh6litas Construya un intervalo de eonfianza de 95 por ciento para la proporcion de la poblacion

66 INTERVALO DE CONFIANZA PARA lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS POBlACIONES

A menudo se tiene interes en conocer la magnitud de la diferencia entre las proporcioshynes de dospoblaciones Es posible que se quiera comparar por ejemplo entre hombres y mujeres dos grupos de edades dos grupos socioecon6micos 0 dos grupos de diagshynostico con respecto a la proporcion que posee alguna caractenstica de interes Un estimador puntual insesgado de la diferencia entre dos proporciones de las poblacioshynes se obtieneal calcular la diferencia de las proporciones de las muestras PI P2 Tal como Se ha visto cuando n1 Yn2 son de gran tamano y las proporciones de la poblacion no estan muy cerca de 0 0 de 1 es posible aplicar el teorema del limite central y utilizar la teona de la distribucion normal para obtener los intervalos de conshyfianza EI error estandar de la estimacion se calcula mediante la siguiente formula

dado que como regIa se desconocen las proporciones de Ia poblacion Un intervashy10 de confianza de 100(1 - a) por ciento para PI P2 se obtiene as

(661)

Es posible interpretar este intervalo desde elpunto de vista probabiHstico y practico

EJERCICIOS 179

EJEMPLO 661

Borst et al (A-16) investigaron la relaci6n de desarrollo del ego edad sexo y diagshyn6stico de suicidio entre los internos adolescentes de la unidad de psiquiatria La muestra consistia en 96 varones y 123 niiias con edades entre 12 y 16 aiios seleccioshynados de entre los internados en la unidad de adolescentes y niiios de un hospital psiquiatrico privado Se reportaron 18 niiios y 60 niiias con intento de suicidio Cons ishyderese el comportamiento de las niiias como el de una muestra aleatoria simple a partir de una poblaci6n similar de niiias y que los j6venes igualmente pueden considerarse como una muestra aleatoria simple extraida de una poblaci6n similar de niiios Para estas dos poblaciones se pretende construir un intervalo de confianshyza de 99 por ciento para la diferencia entre las proporciones de los individuos con intento de suicidio

Soluci6n Las proporciones para las niiias y niiios respectivamente son Pc = 601 123 = A878y PB = 1896 1875 La diferencia entre las proporciones de lasmuestrases Pc PB = 4878 1875 = 3003 El error estandar estimado de la diferenda entre las proporciones de las muestras es

(4878)(5122) (1875)(8125) ---~~-~ +-------shy

123 96

El factor de confiabilidad a partir de la tabla D es 258 de modo que el intervalo de confianza con la f6rmula 661 es

3003 plusmn 258(0602) 14504556

Se dene la confianza de 99 por dento de que para las poblaciones muestteadas la ptopord6n de intentos de suiddio entre las niiias exceshyde a lapropord6n de intentosde suiddio entre los varones por 1450 y 4556

Puesto que el intervalo no incluye al cero se concluye que las dos proporciones de pobladones son diferentes bull

FJERCICIOS

Para cada uno de los siguientes ejercicios establezca las interpretaciones pnicticas y probabishylisticas de los intervalos que se pide construir Identifique cada componente del intervalo la estimaci6n puntual el coeficiente de confiabilidad y el error estandar Explique por que los coeficientes de confiabilidad no son el mismo para todos los ejercicios

661 Hargers et al (A-17) del departamento de Salud PUblica y Ambieptal en Amsterdam condushyjeron un estudio en el que los individuos eran consumidores de drogasinyectables (CDI) En una muestrade 194 consumidores de metadona regular de largo plazo (MLP) 145 eran varones En una muestra de 189 CDIque no consmiddotumian MLP 133 eran varones Establezca las consideraciones necesarias acerca de las muestras ypoblaciones representadas y construshy

180 CAPITULO 6 ESTlMACI6N

ya un intervalo de confianza de 95 por ciemo para la diferenda entre las proporciones de varones en las dos poblaciones

662 Una investigaci6n de Lane et ai (A-I8) valor6las diferencias en las pnicticas de deteccion de cancer de seno entre muestras de mujeres predominantemente de bajos ingresos con edashydes de 50 a 75 anos que lltilizan los servicios de c1inicas de sailld para todo el estado y mlljeres de la misma edad residentes en ciudades donde las c1inicas de salud son locales De las 404 encuestadas seleccionadas en toda la comunidad 592 por ciento estuvo de acuerdo con el siguiente comentario acerca del cancer de pecho las mujeres prolongan su vida si detectan el cancer desde el inicio De entre 795 usuarias de clinicas de salud en la mllestra 449 por ciento estuvo de acuerdo Establezca las suposiciones apropiadas para elaborar un intervalo de confianzade 99 por ciento para la diferencia entre las dos proporciones de las poblaciones de interes

663 Williams et at (A-19) encuestaron a una muestra de 67 medicos y 133 enfermeras con famishyliares farmacodependientes EI prop6sito del estudio era evaluar la influencia en los medishyEOS y enfermeras de estar estrechamente involucrados con una 0 mas personas farmaco dependientes Cincuenta y dos medicos y 89 enfermeras dijeron que vivian con personas farmacoldependientes que adversamente afectaban 8U trabajo E8tablezca todas las consideshyraciones que crea necesarias para construir un intervalo de confianza de 95 por ciento para la diferencia entre las proporciones en las dos poblaciones de trabajadores que se espera esten adversamente afectados por vivir con personas farmacodependientes

664 Aronow y Kronzon (A-20) identificaron los factores de riesgo coronado entre hombres y mujeres en una dinica de cuidados de la salud a largo plazo De los 215 individuos negros 58 tienen diabetes mellitus al igual que 217 individuos blancos de 1140 Elabore un intervalo de confianza de 90 por ciento de confianzapara la diferencia entre las proporciones de las dos poblaciones tCuaies son las poblaciones correspondientes ~Que consideraciones son necesarias para hacer valido el procedimiento de inferencia

67 DETEHMINAUON DEL TAMANO DE LA MUESTRA PARA LA ESTIMACIONDEIAS MEDIAS

La pregunta de que tan grande debe ser una muestra surge inmediatamente al inicio del planteamiento de cualquier encuesta 0 experimento Esta es una pregunshyta importante y no se debe tratara la ligera Tomar una muestra mas grande de 10 necesario para obtener los resultados deseados es un desperdicio de recursos mienshytras que por otro lado las muestras demasiado pequenas con frecuencia dan resulshytados que carecen de uso practico En esta secci6n se estudia c6mo determinar el tamano de la muestra de acuerdo con la situaci6n A continuaci6n se proporciona un metodo para determinar el tamano de la muestra que se requiere para estimar Ia media de la poblaci6n yen la siguiente secci6n se aplica este metodo para detershyminar el tamano de la milestra cuando se desea estimar la proporci6n de una poshyblaci6n Mediante extensiltmes directas de estos metodos es posible determinar el tamano necesario de las muestras para situaciones mas complicadas

Objetivos El objetivo de la estimaci6n porintervalos es el de obtener intervalos estrechos con alta confiabilidad Si se observan los componentes ~e un intervalo de confianzase veque 8U dimension esta determinada por la magnitud de la cantidad

(coeficiente de confiabilidad) x (error estandar)

131 67 DETERMINACION DEL TAMANO PARA LA l-IUESTRAmiddot

ya que lamagnitud total del intervalo de confIanza es eldoble de esta cantidad Se aprendi6 que a esta cantidad generalmente se Ie llama precisi6n de la estimaci6n o margen de error Para un error estandar dado incrementar la confIabilidad signishyfIca un coefIciente con mayor confIabilidad Y un coefIciente con mayor confIabilidad produce unintervalo mas amplio

Por otra parte si se ftia el coefIciente de confIabilidad la unica manera de redudr la amplitud del intervalo es la reducci6n del error estandar Dado que el error estandar es igual a (J IJ y como (J es una constante la unica forma de obtener un error estandar menor es tomar una muestra grande ~Que tan grande debeser la muestra Esto depende del tamafio de (J la desviad6n estandar de la poblaci6n asi como del grado de confIabilidad y dimensi6n del intervalo deseados

Suponga que se desea obtener un intervalo que se extienda d unidades hacia uno y otro lado del estimador Ellose enuncia

d (coefIciente de confIabilidad) X (error estandar) (671)

Si el muestreo es con reemplazos a partir de una poblaci6n infInita 0 de una que sea 10 sufIcientemente grande como para ignorar la correcci6n por poblaci6n fInita la ecuaci6n 671 se transforma en

(J

d z- (672)-r la cual cuando se despeja n nos da

(673)d2

Cuando el nmestreo se hacesin reemplazos a partir de una poblaci6n fInita y peshyquefia se requiere de la correcci6n por poblaci6n fInita y la ecuaci6n 671 se transforma en

(J~d (674)fN~

que al despejar n resulta en

n-----shy (675)d 2(N 1) + Z2(J2

Si puede omitirse la correcci6n por poblad6n fInita la ecuaci6n 675 se reshyduce a la ecuaci6n 673

Estillluci6n de (J 2 Las f6rmulas para el tamafio de la muestra requieren del conocimiento de (J2 pero como ya se ha sefialado la varian cia de la poblaci6n casi

132 CAPITULO 6 ESTlMACION

siempre sedesconoce Como resultado esnecesarioestimar (J2 Las fuentes de estishymaci6n de(J2 que se utilizan con mas frecuencia son las siguientes

1 Se extrae una muestrapilato 0 prel~l11inar de lapoblaci6n y se puede utilizar la variancia calculada a partir de esta muestra como unaestimaci6n de (J2 Las observaciones uti lizadas en la muestra piloto se toman como parte de la muesshytrafinal de modo que n (el tamaiio calculado de la muestra) n

1 (el tamaiio

de la muestra piloto) n2 (el numero de observaciones necesarias para satisfacer el requerimiento total del tamaiio de la muestra)

2 A partir de estudios anteriores osimilares es posible obtener estimaciones de (J2

3Si se cree que la poblaci6n de lacual se extrae la muestraposee una distribushyci6n aproximadamente nqrmal se puede aprovechar el hecho de que la amshyplitud es aproximadamente igual a 6 desviaciones estandar y calcular (J R6 Este metodo requiere aIglin conocimiento acerca de los valores minimo y maximo de la variable en la poblaci6n

EJEMPLO 671

Un nutri6logo del departamento de salud al efectuar una encuesta entre una poshyblacien de muchachas adolescentes con e1 fin de determinitr su ingesti6n diaria promedio de proteinas (medidas en gramos) busc6 el consejo de un bioestadistico con respecto al tamaiio de la muestra que deberfa tomar

~Que procedimiento debe seguir el bioestadistico para asesorar al nutri610go Antes de que el estadistico pueda ayudar el nutri6logo este debe proporcionar tres elementos de informaci6n h dimensi6n deseada del intervalo de confianza el nivel de confianza deseado y la magnitud de la variancia de la poblaci6n

Soludon Suponga que el nutri6logo requiere un intervalo con una dimensi6n de aprQximadamente 10 gramos es decir la estimaci6n se deberfa enconshytrar alrededor de 5 gramos de la media de la poblaci6n en ambas direcshyciones En otras palabras se desea un margen de error de 5 gramos Suponga que se decide por un coeficiente de confian7a de 95 y que con base en su experiencia previa el nutri6logo percibe que la desviaci6n estandar de la poblaci6n es probablemente de alrededor de 20 gramos EI estadfstico dispone ya de la informaci6n necesaria para calcular el tamaiio de la muestra z 196 (J = 20 y d 5 Suponga que el tamaiio de la poblaci6n es grande asf queel estadistico puede ignorar la correcshyci6n por poblaci6n finita y utilizar la ecuaci6n 673 Con las sustitucioshynes adecuadas el valor de n se calcula como

Se recomienda que el nutri610go tome una muestra de tamafio 62 AI calcular el tamaiio de una muestra a partir de las ecuaciones 673 0 675 el resultado se redondea al siguiente nurnero entero mayor si los calculosdan un numerocon decimales bull

183 68 DETERMINACION DEL TAl1ANO PARA LAS PROPORCIONES

EJERCICIOS

671 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su hospital Si se desea un intervalo de confianza de 99 por dento con una amplitud de 1 libra ~que tan grande debe ser la muestra de los registros de nacimiento Suponga que un estimashy

dor razonable para (J es 1 libra ~De que tamano debe ser la muestra si el coeficiente de confiabilidad se hace descender a 95

672 El director de la secdon de control dela rabia del departamento de salud publica desea extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso del ano anterior para estimar la edad media de las personas mordidas Requiere un intervalo de confianza de 95 por dento decide utilizar un valor de 25 para d y a partir de estudios anteriores estima que la desviacion estandar de la poblacion esta alrededor de los 15 anos ~Que tan grande debe ser el tamano de la muestra

673 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mglOO ml) de pacientes atendidos en una clinica para diabeticos durante el transcurso de los ultimos 10 anos Determine el numero de registros que el medico debe examinar para obtener un intershyvalo de confianza de 90 por ciento para 11 si la dimension requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varian cia de 60

674 Se deseaestimar la edad media en la que a los padentes de esclerosis multiple se les diagnosshytico el padecimiento por primera vez Se requiere un intervalo de confianza de 95 por dento con una dimension de 10 anos Si la variancia de la poblaci6n es de 90 ~que tan grande debera ser la muestra

68 DETERMINACION DELTAMANO DE lA MUESTRA PARA lA ESIDIACION DE lAS PROPORCIONES

EI metodo para estimar el tamafio de la muestra cuando se requiere estimar la proshyporcion de una poblacion es esencialmente el mismo que se describio para estimar la media de una poblacion Se aprovecha el hecho de que la mitad del intervalo deseashydo d se puede igualar al producto del coeficiente de confiabilidad y el error estandar

Si se supone que el muestreo ha sido hecho de manera aleatoria y que existen condiciones que garanticen que la distribuci6n de psea aproximadamente normal se obtiene la siguiente formula para n cuando el muestreo es con reemplazo cuanshydo se realizaa partir de una poblacion infinita 0 ruando la poblacion muestreada es 10 suficientemente grande como para hacer innecesario el uso de la correcci6n por poblacion finita

n (681)

dondeq = I-p Si la correccion por poblacion finita no puede descartarse la formula adecuashy

da paran es

(682)n d 2 (N -1)+z2pq

euan do N es grande en comparacion con n (es decir n IN 05) se puede pasar por alto la correccion por poblacion finita y la ecuacion 682 se reduce a la ecuacion 681

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

64 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS 171

95 por ciento para la diferencia entre las medias de las poblaciones de la siguiente manera

2821 2821(210-121)plusmn20484 --+-shy

13 17 89 plusmn 40085

49129

Se tiene una confianza de 95 por ciento de que la diferencia entre las medias de las poblaciones estan entre 49 y 129 Se puede decir esto porque se sabe quesi se repite el amilisis muchfsimas veces y se calculan los intervalos de confianza de la misma manera cerca de 95 por ciento de los intervalos de confianza induiran la diferencia entre las medias de las poblaciones

Debido a que los intervalos no induyen al cerose conduye que las medias de las poblaciones son diferentes bull

Variancias poblacionales distintas Cuando no se puede conduir que las variancias de dos poblaciones de interes son iguales aun ruando pueda suponerse que las dos poblaciones presentan distribuciones normales no es adecuado utilizar la distribucion t como se acaba de describir para construir los intervalos de confianza

Una solucion al problema de variancias distintas fue propuesta por Behrens (3) y posteriormente fue verificada y generalizada por Fisher (4 5) Neyman (6) Scheffe (7 8) Y Welch (9 10) tambien proponen soluciones EI problema es analizashydo en detalle por Cochran (11)

EI problema gira en tomo al hecho de que la cantidad

no sigue una distribuci6n t con nj + n 2 grados de libertad ruando las variancias 2 shy

de las poblaciones son distintas Consecuentemente la distribucion t no se puede utilizar en la forma habitual pata obtener el factor de confiabilidad del intervalo de confianza para la diferencia entre las medias de dos poblaciones que tienen variancias diferentes La solucion propuesta por Cochran consiste en el calculo del factor de confiabilidad mediante la siguiente formula

wltj + w2tZ t l

f

-0f2 = (645) WI +w2

donde WI 512

np W 2 = s~ n2 tl = tl _ para nj - 1 grados de libertad y t2 = t l

_w2aI2

para n2

- 1 grados de libertad Un intervalo aproximado de confianza del 100(1 shya) por ciento para III - 112 esta dado por

(646)

172

EJERCICIOS

CAPITULO 6 ESTlMACION

FJEIUPLO 644

En la investigacion de Stone et al (A-6) descrita en el ejercicio 643 los investigashydores tambien informaron los siguientes datos de las medici ones referentes a todas las calificaciones del acondicionamiento muscular logradas por los individuos

Muestra n Media Desviaci6n estimdar

Grupo deportista 13 45 3

Grupo sedentario 17 37 10

Se considera que las dos poblaciones de todas las calificaciones de acondicionashymiento muscular siguen una distribuci6n aproximadamente normal Sin embargo no debe suponerse que las dos variancias poblacionales son iguales Se pretende construir un intervalo de confianza de 95 por ciento para la diferencia entre las medias de todas las calificaciones de acondicionamiento muscular para las dos poshyblaciones representadas por las muestras

Soluci6n Se utiliza t de la ecuaci6n 645 para calcular el factor de confiabilidad En la tabla E se muestra que con 12 grados de libertad y 1 - 052 = 975 t( 21788 Analogamente con 16 grados de libertad y 1- 052 = 975 t2 = 21199 Ahora Sf calcula

(3 2 13)(21788) + (102 17)(21199) 139784 t= =

(3 2 13)+(102 17) 065747

=21261

Con la ecuaci6n 646 ahora se construye el intervalo de confianza de 95 por ciento para la diferencia entre las medias de las dos poblaciones

2 2

(45 37)plusmn21261 3 + 10 13 17

8 plusmn 21261 (25641101) 25134

Puesto que el intervalo no incluye acero se concluye que las medias de las dos poblaciones son diferentes bull

Cuando se construyen intervalos de confianza para la diferencia entre las medias de dos poblaciones es posible utilizar la figura 641 para decidir rapidashymente si el factor de confiabilidad debe ser z t 0 tf

Para cada uno de los siguientes ejercicios construya intervalos de confianza de 90 95 y 99 par ciento para las diferencias entre las medias poblacionales Establezca consideraciones que hagan que el metodo sea valido Determine las interpretaciones practica y probabilistica

clJ clJ FIGURA 541 Diagrama de flujo para decidir si e1 factor de confiabilidad debe ser z tot cuando se realizan inferencia inferencias acerca de la diferencia entre las medias de dos pobladones (Para usar un procedimiento no parametrico ver el capitulo 11)

174 CAPiTULO 6 ESTlMACION

para cad a intervalo construido Suponga las variables bajo considerati6n en cad a ejercicio y establezca para que pueden servir a los investigadores esos resultados

641 EI objetivo de un experimento de Buckner et al (A-7) consisti6 en estudiar los efectos del relajamiento muscular inducido por el pancuronium en el volumen del plasma circulante Los individuos estudiados son recien nacidos con un peso mayor a 1700 gramos que necesishytaron de ayuda para respirar durante las primeras 24 horas despues de nacer y cumplieron con otros criterios cHnicos Cinco recien nacidos paraIizados con el pancuronium y siete recien nacidos no tratados presentaron las siguientes estadisticas en la segunda de las tres mediciones del volumen de plasma (ml) hecha durante la respiraci6n mecanica

Paralizados 480 81 No tratados 567 81

La segunda medici6n para el grupo tratado ocurri6 de 12 a 24 horas despues de la primera dosis de pancuronium Para el grupo no tratado las mediciones se hicieron de 12 a 24 horas despues de iniciar la respiracion mecanica

642 Zuckery Archer (A-8) afirman que la N-nitrosobis (2-oxopropyl)amina (BOP) y las nitrosaminas 3-oxidizadas producen una alta incidencia de tumores de conductos pancreaticos en el hamster dorado sirio Estudiaron los efectos en el peso sangufneo en la glucosa del plasma en la insulina yen los niveles de transamina glutamico-oxaloacetica del plasma (GOT) de los hamsters expuestos in vivo a la BOP Los investigadores reportaron los siguientes resultados en ocho animales tratados y 12 sin tratamiento

Variable Sin tratamiento Con tratamiento

Glucosa del plasma (mglgl) 101 plusmn 5 74plusmn 6

FUENTE Peter F Zucker y Michael C Archer Alterations Pancreatic Islet Function Produced by Carcinogenic Nitrosamines in the Syrian Hamster AmericanJournal oPathology 133 573-577

Los datos son la media de la muestra plusmn la estimaci6n del error estandar de la media de la muestra

643 Los objetivos de un estudio de Davis et al (A-g) son evaluar 1) la eficacia del programa auto ayuda momento para dejar de fumar cuando se utiliza con base de uno a uno en el hogar y 2) la viabilidad de ensefiar temicas para abandonar el habito de fumar a los estudiantes de enfermerfa en bachillerato A estudiantes graduados de enfermerfa inscritos en dos cursos de metodologia de la investigacion de la Universidad de Ottawa se les invit6 a participar en el proyecto Se aplic6 un cuestionario de opcion multiple para abandonar el habito de fumar a 120 estudiantes de enfermeria que participaron y a otros 42 estudiantes que no participashyron antes ni despues del estudio Se calcularon las diferencias entre las calificaciones antes y despues del estudio as como las siguientes estadisticas a partir de las diferencias

EJERCICIOS 175

Grupo Media Desviaci6n estandar

Participantes (A) 214444 15392 No participantes (B) 33333 14595

644 El doctor Ali Khraibi (A-IO) de la CHnica y Fundaci6n Mayo condujo una serie de experishymentos con el fin de evaluar las respuestas diureticas y natiureticas de ratas Okamoto esponshytaneamente hipertensivas (REB) y ratas Wistar-Kyoto (WRY) para dirigir incrementos en la presion hidrostatica renal intersticial (PBRI) Para aumentar la PBRI se utiIiz6 la expansi6n directa del volumen renal intersticial (DRIVE) a traves de una matriz implantada cronicamente en el rinOn Entre los datos registrados durante el estudio estan las siguientes mediciones de excreci6n de sodio a traves de la orina (UNa V) durante el periodo de DRIVE

Grupo

REB 632572796483527 2WKY 420469482 108210

FUENTE Publicada con autorizaci6n del Dr Ali A Khraibi

645 Osberg y Di Scala (A-II) realizaron un estudio centrado en la eficacia de los cinturones de seguridad para reducir 1esiones entre sobrevivientes de accidentes automoviHsticos internashydos en hospitales con edades de 4 a 14 afios El estudio compar610s resultados de 123 ninos que utilizaron el cintur6n contra 290 que no 10 utilizaron entre aquellos que se vieton enshyvueltos en tales accidentes y que fueron hospitalizados El informe con tenia la siguiente estadistica del numero de dfas en la unidad de cuidados intensivos

Grupo Media Error estandar estimado

Utiliz6 el cintur6n 83 16 No utiliz6 el cintur6n 139 18

646 La medicion del diametro transversal del coraz6n de hombres y mujeres adultos presenta los siguientes resultados

sx Grupo Tamafto de Ia muestra (cm) (cm)

Varones 12 1321 105 Mujeres 9 IIOO 101

Considere que las poblaciones siguen una distribucion normal con variancias iguales

176 CAPITULO 6 ESTIMACION

647 Veintiruatro animales de laboratorio con deficiencia de vitamina D fueron divididos en dos grupos iguales EI grupo 1 recibi6 un tratamiento consistente en una dieta que proporcionashyba vitamina D EI segundo grupo no fue tratado AI termino del periodo experimental se midieron las concentraciones de calcio ensuero obteniendose los siguientes resultados

Grupo tratado X 111 mg 100 mls = 15 Grupo sin tratamiento x= 78 mg 100 ml s = 20

Considere que las poblaciones siguen una distribuci6n normal con variancias iguales

648 Ados grupos de nifios se les hicieron pruebas de agudeza vi~ual El grupo 1 estuvo formado por 11 nifios que recibieron la atenci6n de medicos privados La calificaci6n media para este grupo fue de 26 con una desviaci6n estandar de 5 El segundogrupo que incluy6 14 nifios que recibieron atenci6n medica por parte del departamento de salud publica tuvo una calishyficaci6n promedio de 21 con una desviaci6n estandar de 6 Suponga que las poblaciones siguen una distribuci6n normal con variancias iguales

649 El tiempo promedio de estancia de una muestra de 20 pacientes dados de alta de un hospital general es de siete dras con una desviaci6n estaildar de dos dras Una muestra de 24 padenshytes dados de alta de un hospital de enfermedades cr6nicas tuvo un tiempo promedio de estancia de 36 dfas con una desviaci6n estindar de 10 dias Suponga que la poblaci6n sigue una distribuci6n normal con variancias desiguales

6410 En un estudio de factores que se consideran responsables de los efectos adversos del tabashyquismo sobre la reproducci6n humana se midieron los niveles de cadmio (nanogramos por gramo) en el tejido de la placenta de una muestra de 14 madres que fumaban y una muestra aleatoria independiente de 18 mujeres no fumadoras Los resultados fueron los siguientes

No fumadoras toO 84 128250 118 98 125 154 235

94251 1952559875 118122150

Fumadoras 300301150241305178168148

134285 175 144 125204

ms probable que el nivel medio de cadmio registrado sea mayor entre las fumadoras que entre las no fumadoras ~Por que se llegarfa a esta conclusi6n

65 INTERVALO DE CONFIANZA PARA IA PROPORCION DE UNA POBIACION

Muchas preguntas de interes para que el tecnico en salud tienen relacion con las proporciones de poblacion ~Que propordon de padentes que redben un tipo espeshycial de tratamiento se recuperan ~Que proporcion de alguna poblacion tiene cierta enfermedad ~Que propordon de una poblacion es inmune a derta enfermedad

Para estimar la proporcion de una poblacion se procede en la misma forma que cuando se estima la media de una poblacion Se extrae una muestra de la poblacion de interes y se calcula su proporcion p Esta se utiliza como el estimador puntual para la proporcion de la pobladon Un intervalo de confianza se obtiene mediante la siguiente formula general

estimador plusmn (coefidente de confiabilidad) X (error estandar)

EJERCICIOS

EJERCICIOS 177

En el capitulo anterior se vio que cuando np y n(1 - p) son mayores que 5 se puede considerar que la distribuci6n muestral de pse aproxima bastante a una distribuci6n normal Cuando se cumple con esta condici6n el coeficiente de confiabilidad es algUn valor de z de la distribuci6n normal estandar Esta visto que el error estandar es igual a (J p =fi(l-p) n Puesto que p que es el parametro que se trata de calcular se desconoce se debe utilizar pcomo una estimaci6n Asf se estima (J j por medio de ~p(l Pn y el intervalo de confianza de 100(1 - 0) por ciento para pesta dado por

pplusmn Z(I-1J2)~P(l- P) Fn (651)

Este intervalo se interpreta tanto desde el punto de vista practico como probabilistico

FJEMPLO 651

Mathers et al (A-12) encontraron queen una muestra de 591 pacientes internados en un hospital psiquiatrico 204 admitieron que consuniieron marihuana al meshynos una vez durante su vida Se pretende construir un intervalo de confianza de 95 por ciento para la proporcion de individuos que consumieron marihuana durante su vida en la poblaci6n muestreada de los internos del hospital psiquiatrico

Solucion La mejor estima~i6n puntual para la proporci6Il de la poblaci6nes p== 204591 3452 El tamafio de la muestra y hiestimacion de p tienen una magnitud suficiente parajustifKar el empleo de la distribucion norshymal estandar paraelaborar un intervalo de confianza EI coeficiente de corifiabilidad que corresponde alnivel de confianza de 95 es 196 la estimacion del errorestandar (Jp es ~p(l-pgtn = (3452)(6548)591

0 1956El intervalo de confianza para p de acuerdo con estos datos es

3452 plusmn 196(01956) 3452 plusmn 0383 3069 3835

Se puede decir que se tiene 95 por ciento de confianza de que la proporshycionpeste entre 3069 y 3835 ya que al repetir el muestreo casi 95 por ciento de los intervalos construidos en la forma de este intervalo inclushyyen a la proporcion p real Con base en estos resultados se espera con una confianza de 95 por ciento encontrar que entre 3069 y 3835 por ciento de los internados en el hospital psiquiatrico tiene antecedentes de consumo de marihuana bull

Para cada uno de los siguientes ejercicios establezca la interpretacion prictica yprobabilistica de los intervalos que se pide construir Identifique cada componente del intervalo la estimashycion puntual el coeficiente de confiabilidad yel error estandar Explique por que los coefishycientes de confiabilidad no son los misInos para todos los ejercicios

178 CAPITULO 6 ESTIIlACI6N

651 En una investigaci6nde ninos maltratados en pacientes psiquiatricos Brown y Anderson (A-IS) encontraron 166 pacientes en una muestra de 947 con antecedentes de abuso sexual y maltrato flsico Construya un intervalo de confianza de 90 por dento para la proporci6n de la poblaci6n

652 Catania et at (A-14) obtuvieron datos respecto al comportamiento sexual de una muestra de hombres y mujeres solteros con edades entre 20 y 44 residentes en areas geoijfaficas caracshyterizadas por tasas altas de enfermedades de transmision sexual e ingreso a programas de drogas De 1229 encuestados 50 por ciento respondieron que nunca utilizaron preservatishyvos Construya un intervalo de confianza de 95 por ciento para la proporcion de la poblaci6n que nunca utiliza preservativos

653 Rothberg y Lits (A-I 5 ) estudiaron el efecto del estres de la maternidad durante el embarazo en el peso del producto Los individuos eran 86 mujeres blancas con antecedentes de estres que no tenfan faetores de riesgo medico u obstetrico conoddo de peso bajo del producto Los investigadores eneontraron que 128 por dento de las madres estudiadas dieron a luz bebes que cubrfan el criterio de peso bajo Construya un intervalo de confianza de 99 por ciento para la proporci6n de la poblaci6n

654 En una muestra aleatoria simple de 125 varones desempleados quienes desertaron de la escuela preparatoria entre las edades de 16 y 21 anos inclusive 88 declararon que eran consumidores regulares de bebidas alcoh6litas Construya un intervalo de eonfianza de 95 por ciento para la proporcion de la poblacion

66 INTERVALO DE CONFIANZA PARA lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS POBlACIONES

A menudo se tiene interes en conocer la magnitud de la diferencia entre las proporcioshynes de dospoblaciones Es posible que se quiera comparar por ejemplo entre hombres y mujeres dos grupos de edades dos grupos socioecon6micos 0 dos grupos de diagshynostico con respecto a la proporcion que posee alguna caractenstica de interes Un estimador puntual insesgado de la diferencia entre dos proporciones de las poblacioshynes se obtieneal calcular la diferencia de las proporciones de las muestras PI P2 Tal como Se ha visto cuando n1 Yn2 son de gran tamano y las proporciones de la poblacion no estan muy cerca de 0 0 de 1 es posible aplicar el teorema del limite central y utilizar la teona de la distribucion normal para obtener los intervalos de conshyfianza EI error estandar de la estimacion se calcula mediante la siguiente formula

dado que como regIa se desconocen las proporciones de Ia poblacion Un intervashy10 de confianza de 100(1 - a) por ciento para PI P2 se obtiene as

(661)

Es posible interpretar este intervalo desde elpunto de vista probabiHstico y practico

EJERCICIOS 179

EJEMPLO 661

Borst et al (A-16) investigaron la relaci6n de desarrollo del ego edad sexo y diagshyn6stico de suicidio entre los internos adolescentes de la unidad de psiquiatria La muestra consistia en 96 varones y 123 niiias con edades entre 12 y 16 aiios seleccioshynados de entre los internados en la unidad de adolescentes y niiios de un hospital psiquiatrico privado Se reportaron 18 niiios y 60 niiias con intento de suicidio Cons ishyderese el comportamiento de las niiias como el de una muestra aleatoria simple a partir de una poblaci6n similar de niiias y que los j6venes igualmente pueden considerarse como una muestra aleatoria simple extraida de una poblaci6n similar de niiios Para estas dos poblaciones se pretende construir un intervalo de confianshyza de 99 por ciento para la diferencia entre las proporciones de los individuos con intento de suicidio

Soluci6n Las proporciones para las niiias y niiios respectivamente son Pc = 601 123 = A878y PB = 1896 1875 La diferencia entre las proporciones de lasmuestrases Pc PB = 4878 1875 = 3003 El error estandar estimado de la diferenda entre las proporciones de las muestras es

(4878)(5122) (1875)(8125) ---~~-~ +-------shy

123 96

El factor de confiabilidad a partir de la tabla D es 258 de modo que el intervalo de confianza con la f6rmula 661 es

3003 plusmn 258(0602) 14504556

Se dene la confianza de 99 por dento de que para las poblaciones muestteadas la ptopord6n de intentos de suiddio entre las niiias exceshyde a lapropord6n de intentosde suiddio entre los varones por 1450 y 4556

Puesto que el intervalo no incluye al cero se concluye que las dos proporciones de pobladones son diferentes bull

FJERCICIOS

Para cada uno de los siguientes ejercicios establezca las interpretaciones pnicticas y probabishylisticas de los intervalos que se pide construir Identifique cada componente del intervalo la estimaci6n puntual el coeficiente de confiabilidad y el error estandar Explique por que los coeficientes de confiabilidad no son el mismo para todos los ejercicios

661 Hargers et al (A-17) del departamento de Salud PUblica y Ambieptal en Amsterdam condushyjeron un estudio en el que los individuos eran consumidores de drogasinyectables (CDI) En una muestrade 194 consumidores de metadona regular de largo plazo (MLP) 145 eran varones En una muestra de 189 CDIque no consmiddotumian MLP 133 eran varones Establezca las consideraciones necesarias acerca de las muestras ypoblaciones representadas y construshy

180 CAPITULO 6 ESTlMACI6N

ya un intervalo de confianza de 95 por ciemo para la diferenda entre las proporciones de varones en las dos poblaciones

662 Una investigaci6n de Lane et ai (A-I8) valor6las diferencias en las pnicticas de deteccion de cancer de seno entre muestras de mujeres predominantemente de bajos ingresos con edashydes de 50 a 75 anos que lltilizan los servicios de c1inicas de sailld para todo el estado y mlljeres de la misma edad residentes en ciudades donde las c1inicas de salud son locales De las 404 encuestadas seleccionadas en toda la comunidad 592 por ciento estuvo de acuerdo con el siguiente comentario acerca del cancer de pecho las mujeres prolongan su vida si detectan el cancer desde el inicio De entre 795 usuarias de clinicas de salud en la mllestra 449 por ciento estuvo de acuerdo Establezca las suposiciones apropiadas para elaborar un intervalo de confianzade 99 por ciento para la diferencia entre las dos proporciones de las poblaciones de interes

663 Williams et at (A-19) encuestaron a una muestra de 67 medicos y 133 enfermeras con famishyliares farmacodependientes EI prop6sito del estudio era evaluar la influencia en los medishyEOS y enfermeras de estar estrechamente involucrados con una 0 mas personas farmaco dependientes Cincuenta y dos medicos y 89 enfermeras dijeron que vivian con personas farmacoldependientes que adversamente afectaban 8U trabajo E8tablezca todas las consideshyraciones que crea necesarias para construir un intervalo de confianza de 95 por ciento para la diferencia entre las proporciones en las dos poblaciones de trabajadores que se espera esten adversamente afectados por vivir con personas farmacodependientes

664 Aronow y Kronzon (A-20) identificaron los factores de riesgo coronado entre hombres y mujeres en una dinica de cuidados de la salud a largo plazo De los 215 individuos negros 58 tienen diabetes mellitus al igual que 217 individuos blancos de 1140 Elabore un intervalo de confianza de 90 por ciento de confianzapara la diferencia entre las proporciones de las dos poblaciones tCuaies son las poblaciones correspondientes ~Que consideraciones son necesarias para hacer valido el procedimiento de inferencia

67 DETEHMINAUON DEL TAMANO DE LA MUESTRA PARA LA ESTIMACIONDEIAS MEDIAS

La pregunta de que tan grande debe ser una muestra surge inmediatamente al inicio del planteamiento de cualquier encuesta 0 experimento Esta es una pregunshyta importante y no se debe tratara la ligera Tomar una muestra mas grande de 10 necesario para obtener los resultados deseados es un desperdicio de recursos mienshytras que por otro lado las muestras demasiado pequenas con frecuencia dan resulshytados que carecen de uso practico En esta secci6n se estudia c6mo determinar el tamano de la muestra de acuerdo con la situaci6n A continuaci6n se proporciona un metodo para determinar el tamano de la muestra que se requiere para estimar Ia media de la poblaci6n yen la siguiente secci6n se aplica este metodo para detershyminar el tamano de la milestra cuando se desea estimar la proporci6n de una poshyblaci6n Mediante extensiltmes directas de estos metodos es posible determinar el tamano necesario de las muestras para situaciones mas complicadas

Objetivos El objetivo de la estimaci6n porintervalos es el de obtener intervalos estrechos con alta confiabilidad Si se observan los componentes ~e un intervalo de confianzase veque 8U dimension esta determinada por la magnitud de la cantidad

(coeficiente de confiabilidad) x (error estandar)

131 67 DETERMINACION DEL TAMANO PARA LA l-IUESTRAmiddot

ya que lamagnitud total del intervalo de confIanza es eldoble de esta cantidad Se aprendi6 que a esta cantidad generalmente se Ie llama precisi6n de la estimaci6n o margen de error Para un error estandar dado incrementar la confIabilidad signishyfIca un coefIciente con mayor confIabilidad Y un coefIciente con mayor confIabilidad produce unintervalo mas amplio

Por otra parte si se ftia el coefIciente de confIabilidad la unica manera de redudr la amplitud del intervalo es la reducci6n del error estandar Dado que el error estandar es igual a (J IJ y como (J es una constante la unica forma de obtener un error estandar menor es tomar una muestra grande ~Que tan grande debeser la muestra Esto depende del tamafio de (J la desviad6n estandar de la poblaci6n asi como del grado de confIabilidad y dimensi6n del intervalo deseados

Suponga que se desea obtener un intervalo que se extienda d unidades hacia uno y otro lado del estimador Ellose enuncia

d (coefIciente de confIabilidad) X (error estandar) (671)

Si el muestreo es con reemplazos a partir de una poblaci6n infInita 0 de una que sea 10 sufIcientemente grande como para ignorar la correcci6n por poblaci6n fInita la ecuaci6n 671 se transforma en

(J

d z- (672)-r la cual cuando se despeja n nos da

(673)d2

Cuando el nmestreo se hacesin reemplazos a partir de una poblaci6n fInita y peshyquefia se requiere de la correcci6n por poblaci6n fInita y la ecuaci6n 671 se transforma en

(J~d (674)fN~

que al despejar n resulta en

n-----shy (675)d 2(N 1) + Z2(J2

Si puede omitirse la correcci6n por poblad6n fInita la ecuaci6n 675 se reshyduce a la ecuaci6n 673

Estillluci6n de (J 2 Las f6rmulas para el tamafio de la muestra requieren del conocimiento de (J2 pero como ya se ha sefialado la varian cia de la poblaci6n casi

132 CAPITULO 6 ESTlMACION

siempre sedesconoce Como resultado esnecesarioestimar (J2 Las fuentes de estishymaci6n de(J2 que se utilizan con mas frecuencia son las siguientes

1 Se extrae una muestrapilato 0 prel~l11inar de lapoblaci6n y se puede utilizar la variancia calculada a partir de esta muestra como unaestimaci6n de (J2 Las observaciones uti lizadas en la muestra piloto se toman como parte de la muesshytrafinal de modo que n (el tamaiio calculado de la muestra) n

1 (el tamaiio

de la muestra piloto) n2 (el numero de observaciones necesarias para satisfacer el requerimiento total del tamaiio de la muestra)

2 A partir de estudios anteriores osimilares es posible obtener estimaciones de (J2

3Si se cree que la poblaci6n de lacual se extrae la muestraposee una distribushyci6n aproximadamente nqrmal se puede aprovechar el hecho de que la amshyplitud es aproximadamente igual a 6 desviaciones estandar y calcular (J R6 Este metodo requiere aIglin conocimiento acerca de los valores minimo y maximo de la variable en la poblaci6n

EJEMPLO 671

Un nutri6logo del departamento de salud al efectuar una encuesta entre una poshyblacien de muchachas adolescentes con e1 fin de determinitr su ingesti6n diaria promedio de proteinas (medidas en gramos) busc6 el consejo de un bioestadistico con respecto al tamaiio de la muestra que deberfa tomar

~Que procedimiento debe seguir el bioestadistico para asesorar al nutri610go Antes de que el estadistico pueda ayudar el nutri6logo este debe proporcionar tres elementos de informaci6n h dimensi6n deseada del intervalo de confianza el nivel de confianza deseado y la magnitud de la variancia de la poblaci6n

Soludon Suponga que el nutri6logo requiere un intervalo con una dimensi6n de aprQximadamente 10 gramos es decir la estimaci6n se deberfa enconshytrar alrededor de 5 gramos de la media de la poblaci6n en ambas direcshyciones En otras palabras se desea un margen de error de 5 gramos Suponga que se decide por un coeficiente de confian7a de 95 y que con base en su experiencia previa el nutri6logo percibe que la desviaci6n estandar de la poblaci6n es probablemente de alrededor de 20 gramos EI estadfstico dispone ya de la informaci6n necesaria para calcular el tamaiio de la muestra z 196 (J = 20 y d 5 Suponga que el tamaiio de la poblaci6n es grande asf queel estadistico puede ignorar la correcshyci6n por poblaci6n finita y utilizar la ecuaci6n 673 Con las sustitucioshynes adecuadas el valor de n se calcula como

Se recomienda que el nutri610go tome una muestra de tamafio 62 AI calcular el tamaiio de una muestra a partir de las ecuaciones 673 0 675 el resultado se redondea al siguiente nurnero entero mayor si los calculosdan un numerocon decimales bull

183 68 DETERMINACION DEL TAl1ANO PARA LAS PROPORCIONES

EJERCICIOS

671 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su hospital Si se desea un intervalo de confianza de 99 por dento con una amplitud de 1 libra ~que tan grande debe ser la muestra de los registros de nacimiento Suponga que un estimashy

dor razonable para (J es 1 libra ~De que tamano debe ser la muestra si el coeficiente de confiabilidad se hace descender a 95

672 El director de la secdon de control dela rabia del departamento de salud publica desea extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso del ano anterior para estimar la edad media de las personas mordidas Requiere un intervalo de confianza de 95 por dento decide utilizar un valor de 25 para d y a partir de estudios anteriores estima que la desviacion estandar de la poblacion esta alrededor de los 15 anos ~Que tan grande debe ser el tamano de la muestra

673 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mglOO ml) de pacientes atendidos en una clinica para diabeticos durante el transcurso de los ultimos 10 anos Determine el numero de registros que el medico debe examinar para obtener un intershyvalo de confianza de 90 por ciento para 11 si la dimension requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varian cia de 60

674 Se deseaestimar la edad media en la que a los padentes de esclerosis multiple se les diagnosshytico el padecimiento por primera vez Se requiere un intervalo de confianza de 95 por dento con una dimension de 10 anos Si la variancia de la poblaci6n es de 90 ~que tan grande debera ser la muestra

68 DETERMINACION DELTAMANO DE lA MUESTRA PARA lA ESIDIACION DE lAS PROPORCIONES

EI metodo para estimar el tamafio de la muestra cuando se requiere estimar la proshyporcion de una poblacion es esencialmente el mismo que se describio para estimar la media de una poblacion Se aprovecha el hecho de que la mitad del intervalo deseashydo d se puede igualar al producto del coeficiente de confiabilidad y el error estandar

Si se supone que el muestreo ha sido hecho de manera aleatoria y que existen condiciones que garanticen que la distribuci6n de psea aproximadamente normal se obtiene la siguiente formula para n cuando el muestreo es con reemplazo cuanshydo se realizaa partir de una poblacion infinita 0 ruando la poblacion muestreada es 10 suficientemente grande como para hacer innecesario el uso de la correcci6n por poblacion finita

n (681)

dondeq = I-p Si la correccion por poblacion finita no puede descartarse la formula adecuashy

da paran es

(682)n d 2 (N -1)+z2pq

euan do N es grande en comparacion con n (es decir n IN 05) se puede pasar por alto la correccion por poblacion finita y la ecuacion 682 se reduce a la ecuacion 681

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

172

EJERCICIOS

CAPITULO 6 ESTlMACION

FJEIUPLO 644

En la investigacion de Stone et al (A-6) descrita en el ejercicio 643 los investigashydores tambien informaron los siguientes datos de las medici ones referentes a todas las calificaciones del acondicionamiento muscular logradas por los individuos

Muestra n Media Desviaci6n estimdar

Grupo deportista 13 45 3

Grupo sedentario 17 37 10

Se considera que las dos poblaciones de todas las calificaciones de acondicionashymiento muscular siguen una distribuci6n aproximadamente normal Sin embargo no debe suponerse que las dos variancias poblacionales son iguales Se pretende construir un intervalo de confianza de 95 por ciento para la diferencia entre las medias de todas las calificaciones de acondicionamiento muscular para las dos poshyblaciones representadas por las muestras

Soluci6n Se utiliza t de la ecuaci6n 645 para calcular el factor de confiabilidad En la tabla E se muestra que con 12 grados de libertad y 1 - 052 = 975 t( 21788 Analogamente con 16 grados de libertad y 1- 052 = 975 t2 = 21199 Ahora Sf calcula

(3 2 13)(21788) + (102 17)(21199) 139784 t= =

(3 2 13)+(102 17) 065747

=21261

Con la ecuaci6n 646 ahora se construye el intervalo de confianza de 95 por ciento para la diferencia entre las medias de las dos poblaciones

2 2

(45 37)plusmn21261 3 + 10 13 17

8 plusmn 21261 (25641101) 25134

Puesto que el intervalo no incluye acero se concluye que las medias de las dos poblaciones son diferentes bull

Cuando se construyen intervalos de confianza para la diferencia entre las medias de dos poblaciones es posible utilizar la figura 641 para decidir rapidashymente si el factor de confiabilidad debe ser z t 0 tf

Para cada uno de los siguientes ejercicios construya intervalos de confianza de 90 95 y 99 par ciento para las diferencias entre las medias poblacionales Establezca consideraciones que hagan que el metodo sea valido Determine las interpretaciones practica y probabilistica

clJ clJ FIGURA 541 Diagrama de flujo para decidir si e1 factor de confiabilidad debe ser z tot cuando se realizan inferencia inferencias acerca de la diferencia entre las medias de dos pobladones (Para usar un procedimiento no parametrico ver el capitulo 11)

174 CAPiTULO 6 ESTlMACION

para cad a intervalo construido Suponga las variables bajo considerati6n en cad a ejercicio y establezca para que pueden servir a los investigadores esos resultados

641 EI objetivo de un experimento de Buckner et al (A-7) consisti6 en estudiar los efectos del relajamiento muscular inducido por el pancuronium en el volumen del plasma circulante Los individuos estudiados son recien nacidos con un peso mayor a 1700 gramos que necesishytaron de ayuda para respirar durante las primeras 24 horas despues de nacer y cumplieron con otros criterios cHnicos Cinco recien nacidos paraIizados con el pancuronium y siete recien nacidos no tratados presentaron las siguientes estadisticas en la segunda de las tres mediciones del volumen de plasma (ml) hecha durante la respiraci6n mecanica

Paralizados 480 81 No tratados 567 81

La segunda medici6n para el grupo tratado ocurri6 de 12 a 24 horas despues de la primera dosis de pancuronium Para el grupo no tratado las mediciones se hicieron de 12 a 24 horas despues de iniciar la respiracion mecanica

642 Zuckery Archer (A-8) afirman que la N-nitrosobis (2-oxopropyl)amina (BOP) y las nitrosaminas 3-oxidizadas producen una alta incidencia de tumores de conductos pancreaticos en el hamster dorado sirio Estudiaron los efectos en el peso sangufneo en la glucosa del plasma en la insulina yen los niveles de transamina glutamico-oxaloacetica del plasma (GOT) de los hamsters expuestos in vivo a la BOP Los investigadores reportaron los siguientes resultados en ocho animales tratados y 12 sin tratamiento

Variable Sin tratamiento Con tratamiento

Glucosa del plasma (mglgl) 101 plusmn 5 74plusmn 6

FUENTE Peter F Zucker y Michael C Archer Alterations Pancreatic Islet Function Produced by Carcinogenic Nitrosamines in the Syrian Hamster AmericanJournal oPathology 133 573-577

Los datos son la media de la muestra plusmn la estimaci6n del error estandar de la media de la muestra

643 Los objetivos de un estudio de Davis et al (A-g) son evaluar 1) la eficacia del programa auto ayuda momento para dejar de fumar cuando se utiliza con base de uno a uno en el hogar y 2) la viabilidad de ensefiar temicas para abandonar el habito de fumar a los estudiantes de enfermerfa en bachillerato A estudiantes graduados de enfermerfa inscritos en dos cursos de metodologia de la investigacion de la Universidad de Ottawa se les invit6 a participar en el proyecto Se aplic6 un cuestionario de opcion multiple para abandonar el habito de fumar a 120 estudiantes de enfermeria que participaron y a otros 42 estudiantes que no participashyron antes ni despues del estudio Se calcularon las diferencias entre las calificaciones antes y despues del estudio as como las siguientes estadisticas a partir de las diferencias

EJERCICIOS 175

Grupo Media Desviaci6n estandar

Participantes (A) 214444 15392 No participantes (B) 33333 14595

644 El doctor Ali Khraibi (A-IO) de la CHnica y Fundaci6n Mayo condujo una serie de experishymentos con el fin de evaluar las respuestas diureticas y natiureticas de ratas Okamoto esponshytaneamente hipertensivas (REB) y ratas Wistar-Kyoto (WRY) para dirigir incrementos en la presion hidrostatica renal intersticial (PBRI) Para aumentar la PBRI se utiIiz6 la expansi6n directa del volumen renal intersticial (DRIVE) a traves de una matriz implantada cronicamente en el rinOn Entre los datos registrados durante el estudio estan las siguientes mediciones de excreci6n de sodio a traves de la orina (UNa V) durante el periodo de DRIVE

Grupo

REB 632572796483527 2WKY 420469482 108210

FUENTE Publicada con autorizaci6n del Dr Ali A Khraibi

645 Osberg y Di Scala (A-II) realizaron un estudio centrado en la eficacia de los cinturones de seguridad para reducir 1esiones entre sobrevivientes de accidentes automoviHsticos internashydos en hospitales con edades de 4 a 14 afios El estudio compar610s resultados de 123 ninos que utilizaron el cintur6n contra 290 que no 10 utilizaron entre aquellos que se vieton enshyvueltos en tales accidentes y que fueron hospitalizados El informe con tenia la siguiente estadistica del numero de dfas en la unidad de cuidados intensivos

Grupo Media Error estandar estimado

Utiliz6 el cintur6n 83 16 No utiliz6 el cintur6n 139 18

646 La medicion del diametro transversal del coraz6n de hombres y mujeres adultos presenta los siguientes resultados

sx Grupo Tamafto de Ia muestra (cm) (cm)

Varones 12 1321 105 Mujeres 9 IIOO 101

Considere que las poblaciones siguen una distribucion normal con variancias iguales

176 CAPITULO 6 ESTIMACION

647 Veintiruatro animales de laboratorio con deficiencia de vitamina D fueron divididos en dos grupos iguales EI grupo 1 recibi6 un tratamiento consistente en una dieta que proporcionashyba vitamina D EI segundo grupo no fue tratado AI termino del periodo experimental se midieron las concentraciones de calcio ensuero obteniendose los siguientes resultados

Grupo tratado X 111 mg 100 mls = 15 Grupo sin tratamiento x= 78 mg 100 ml s = 20

Considere que las poblaciones siguen una distribuci6n normal con variancias iguales

648 Ados grupos de nifios se les hicieron pruebas de agudeza vi~ual El grupo 1 estuvo formado por 11 nifios que recibieron la atenci6n de medicos privados La calificaci6n media para este grupo fue de 26 con una desviaci6n estandar de 5 El segundogrupo que incluy6 14 nifios que recibieron atenci6n medica por parte del departamento de salud publica tuvo una calishyficaci6n promedio de 21 con una desviaci6n estandar de 6 Suponga que las poblaciones siguen una distribuci6n normal con variancias iguales

649 El tiempo promedio de estancia de una muestra de 20 pacientes dados de alta de un hospital general es de siete dras con una desviaci6n estaildar de dos dras Una muestra de 24 padenshytes dados de alta de un hospital de enfermedades cr6nicas tuvo un tiempo promedio de estancia de 36 dfas con una desviaci6n estindar de 10 dias Suponga que la poblaci6n sigue una distribuci6n normal con variancias desiguales

6410 En un estudio de factores que se consideran responsables de los efectos adversos del tabashyquismo sobre la reproducci6n humana se midieron los niveles de cadmio (nanogramos por gramo) en el tejido de la placenta de una muestra de 14 madres que fumaban y una muestra aleatoria independiente de 18 mujeres no fumadoras Los resultados fueron los siguientes

No fumadoras toO 84 128250 118 98 125 154 235

94251 1952559875 118122150

Fumadoras 300301150241305178168148

134285 175 144 125204

ms probable que el nivel medio de cadmio registrado sea mayor entre las fumadoras que entre las no fumadoras ~Por que se llegarfa a esta conclusi6n

65 INTERVALO DE CONFIANZA PARA IA PROPORCION DE UNA POBIACION

Muchas preguntas de interes para que el tecnico en salud tienen relacion con las proporciones de poblacion ~Que propordon de padentes que redben un tipo espeshycial de tratamiento se recuperan ~Que proporcion de alguna poblacion tiene cierta enfermedad ~Que propordon de una poblacion es inmune a derta enfermedad

Para estimar la proporcion de una poblacion se procede en la misma forma que cuando se estima la media de una poblacion Se extrae una muestra de la poblacion de interes y se calcula su proporcion p Esta se utiliza como el estimador puntual para la proporcion de la pobladon Un intervalo de confianza se obtiene mediante la siguiente formula general

estimador plusmn (coefidente de confiabilidad) X (error estandar)

EJERCICIOS

EJERCICIOS 177

En el capitulo anterior se vio que cuando np y n(1 - p) son mayores que 5 se puede considerar que la distribuci6n muestral de pse aproxima bastante a una distribuci6n normal Cuando se cumple con esta condici6n el coeficiente de confiabilidad es algUn valor de z de la distribuci6n normal estandar Esta visto que el error estandar es igual a (J p =fi(l-p) n Puesto que p que es el parametro que se trata de calcular se desconoce se debe utilizar pcomo una estimaci6n Asf se estima (J j por medio de ~p(l Pn y el intervalo de confianza de 100(1 - 0) por ciento para pesta dado por

pplusmn Z(I-1J2)~P(l- P) Fn (651)

Este intervalo se interpreta tanto desde el punto de vista practico como probabilistico

FJEMPLO 651

Mathers et al (A-12) encontraron queen una muestra de 591 pacientes internados en un hospital psiquiatrico 204 admitieron que consuniieron marihuana al meshynos una vez durante su vida Se pretende construir un intervalo de confianza de 95 por ciento para la proporcion de individuos que consumieron marihuana durante su vida en la poblaci6n muestreada de los internos del hospital psiquiatrico

Solucion La mejor estima~i6n puntual para la proporci6Il de la poblaci6nes p== 204591 3452 El tamafio de la muestra y hiestimacion de p tienen una magnitud suficiente parajustifKar el empleo de la distribucion norshymal estandar paraelaborar un intervalo de confianza EI coeficiente de corifiabilidad que corresponde alnivel de confianza de 95 es 196 la estimacion del errorestandar (Jp es ~p(l-pgtn = (3452)(6548)591

0 1956El intervalo de confianza para p de acuerdo con estos datos es

3452 plusmn 196(01956) 3452 plusmn 0383 3069 3835

Se puede decir que se tiene 95 por ciento de confianza de que la proporshycionpeste entre 3069 y 3835 ya que al repetir el muestreo casi 95 por ciento de los intervalos construidos en la forma de este intervalo inclushyyen a la proporcion p real Con base en estos resultados se espera con una confianza de 95 por ciento encontrar que entre 3069 y 3835 por ciento de los internados en el hospital psiquiatrico tiene antecedentes de consumo de marihuana bull

Para cada uno de los siguientes ejercicios establezca la interpretacion prictica yprobabilistica de los intervalos que se pide construir Identifique cada componente del intervalo la estimashycion puntual el coeficiente de confiabilidad yel error estandar Explique por que los coefishycientes de confiabilidad no son los misInos para todos los ejercicios

178 CAPITULO 6 ESTIIlACI6N

651 En una investigaci6nde ninos maltratados en pacientes psiquiatricos Brown y Anderson (A-IS) encontraron 166 pacientes en una muestra de 947 con antecedentes de abuso sexual y maltrato flsico Construya un intervalo de confianza de 90 por dento para la proporci6n de la poblaci6n

652 Catania et at (A-14) obtuvieron datos respecto al comportamiento sexual de una muestra de hombres y mujeres solteros con edades entre 20 y 44 residentes en areas geoijfaficas caracshyterizadas por tasas altas de enfermedades de transmision sexual e ingreso a programas de drogas De 1229 encuestados 50 por ciento respondieron que nunca utilizaron preservatishyvos Construya un intervalo de confianza de 95 por ciento para la proporcion de la poblaci6n que nunca utiliza preservativos

653 Rothberg y Lits (A-I 5 ) estudiaron el efecto del estres de la maternidad durante el embarazo en el peso del producto Los individuos eran 86 mujeres blancas con antecedentes de estres que no tenfan faetores de riesgo medico u obstetrico conoddo de peso bajo del producto Los investigadores eneontraron que 128 por dento de las madres estudiadas dieron a luz bebes que cubrfan el criterio de peso bajo Construya un intervalo de confianza de 99 por ciento para la proporci6n de la poblaci6n

654 En una muestra aleatoria simple de 125 varones desempleados quienes desertaron de la escuela preparatoria entre las edades de 16 y 21 anos inclusive 88 declararon que eran consumidores regulares de bebidas alcoh6litas Construya un intervalo de eonfianza de 95 por ciento para la proporcion de la poblacion

66 INTERVALO DE CONFIANZA PARA lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS POBlACIONES

A menudo se tiene interes en conocer la magnitud de la diferencia entre las proporcioshynes de dospoblaciones Es posible que se quiera comparar por ejemplo entre hombres y mujeres dos grupos de edades dos grupos socioecon6micos 0 dos grupos de diagshynostico con respecto a la proporcion que posee alguna caractenstica de interes Un estimador puntual insesgado de la diferencia entre dos proporciones de las poblacioshynes se obtieneal calcular la diferencia de las proporciones de las muestras PI P2 Tal como Se ha visto cuando n1 Yn2 son de gran tamano y las proporciones de la poblacion no estan muy cerca de 0 0 de 1 es posible aplicar el teorema del limite central y utilizar la teona de la distribucion normal para obtener los intervalos de conshyfianza EI error estandar de la estimacion se calcula mediante la siguiente formula

dado que como regIa se desconocen las proporciones de Ia poblacion Un intervashy10 de confianza de 100(1 - a) por ciento para PI P2 se obtiene as

(661)

Es posible interpretar este intervalo desde elpunto de vista probabiHstico y practico

EJERCICIOS 179

EJEMPLO 661

Borst et al (A-16) investigaron la relaci6n de desarrollo del ego edad sexo y diagshyn6stico de suicidio entre los internos adolescentes de la unidad de psiquiatria La muestra consistia en 96 varones y 123 niiias con edades entre 12 y 16 aiios seleccioshynados de entre los internados en la unidad de adolescentes y niiios de un hospital psiquiatrico privado Se reportaron 18 niiios y 60 niiias con intento de suicidio Cons ishyderese el comportamiento de las niiias como el de una muestra aleatoria simple a partir de una poblaci6n similar de niiias y que los j6venes igualmente pueden considerarse como una muestra aleatoria simple extraida de una poblaci6n similar de niiios Para estas dos poblaciones se pretende construir un intervalo de confianshyza de 99 por ciento para la diferencia entre las proporciones de los individuos con intento de suicidio

Soluci6n Las proporciones para las niiias y niiios respectivamente son Pc = 601 123 = A878y PB = 1896 1875 La diferencia entre las proporciones de lasmuestrases Pc PB = 4878 1875 = 3003 El error estandar estimado de la diferenda entre las proporciones de las muestras es

(4878)(5122) (1875)(8125) ---~~-~ +-------shy

123 96

El factor de confiabilidad a partir de la tabla D es 258 de modo que el intervalo de confianza con la f6rmula 661 es

3003 plusmn 258(0602) 14504556

Se dene la confianza de 99 por dento de que para las poblaciones muestteadas la ptopord6n de intentos de suiddio entre las niiias exceshyde a lapropord6n de intentosde suiddio entre los varones por 1450 y 4556

Puesto que el intervalo no incluye al cero se concluye que las dos proporciones de pobladones son diferentes bull

FJERCICIOS

Para cada uno de los siguientes ejercicios establezca las interpretaciones pnicticas y probabishylisticas de los intervalos que se pide construir Identifique cada componente del intervalo la estimaci6n puntual el coeficiente de confiabilidad y el error estandar Explique por que los coeficientes de confiabilidad no son el mismo para todos los ejercicios

661 Hargers et al (A-17) del departamento de Salud PUblica y Ambieptal en Amsterdam condushyjeron un estudio en el que los individuos eran consumidores de drogasinyectables (CDI) En una muestrade 194 consumidores de metadona regular de largo plazo (MLP) 145 eran varones En una muestra de 189 CDIque no consmiddotumian MLP 133 eran varones Establezca las consideraciones necesarias acerca de las muestras ypoblaciones representadas y construshy

180 CAPITULO 6 ESTlMACI6N

ya un intervalo de confianza de 95 por ciemo para la diferenda entre las proporciones de varones en las dos poblaciones

662 Una investigaci6n de Lane et ai (A-I8) valor6las diferencias en las pnicticas de deteccion de cancer de seno entre muestras de mujeres predominantemente de bajos ingresos con edashydes de 50 a 75 anos que lltilizan los servicios de c1inicas de sailld para todo el estado y mlljeres de la misma edad residentes en ciudades donde las c1inicas de salud son locales De las 404 encuestadas seleccionadas en toda la comunidad 592 por ciento estuvo de acuerdo con el siguiente comentario acerca del cancer de pecho las mujeres prolongan su vida si detectan el cancer desde el inicio De entre 795 usuarias de clinicas de salud en la mllestra 449 por ciento estuvo de acuerdo Establezca las suposiciones apropiadas para elaborar un intervalo de confianzade 99 por ciento para la diferencia entre las dos proporciones de las poblaciones de interes

663 Williams et at (A-19) encuestaron a una muestra de 67 medicos y 133 enfermeras con famishyliares farmacodependientes EI prop6sito del estudio era evaluar la influencia en los medishyEOS y enfermeras de estar estrechamente involucrados con una 0 mas personas farmaco dependientes Cincuenta y dos medicos y 89 enfermeras dijeron que vivian con personas farmacoldependientes que adversamente afectaban 8U trabajo E8tablezca todas las consideshyraciones que crea necesarias para construir un intervalo de confianza de 95 por ciento para la diferencia entre las proporciones en las dos poblaciones de trabajadores que se espera esten adversamente afectados por vivir con personas farmacodependientes

664 Aronow y Kronzon (A-20) identificaron los factores de riesgo coronado entre hombres y mujeres en una dinica de cuidados de la salud a largo plazo De los 215 individuos negros 58 tienen diabetes mellitus al igual que 217 individuos blancos de 1140 Elabore un intervalo de confianza de 90 por ciento de confianzapara la diferencia entre las proporciones de las dos poblaciones tCuaies son las poblaciones correspondientes ~Que consideraciones son necesarias para hacer valido el procedimiento de inferencia

67 DETEHMINAUON DEL TAMANO DE LA MUESTRA PARA LA ESTIMACIONDEIAS MEDIAS

La pregunta de que tan grande debe ser una muestra surge inmediatamente al inicio del planteamiento de cualquier encuesta 0 experimento Esta es una pregunshyta importante y no se debe tratara la ligera Tomar una muestra mas grande de 10 necesario para obtener los resultados deseados es un desperdicio de recursos mienshytras que por otro lado las muestras demasiado pequenas con frecuencia dan resulshytados que carecen de uso practico En esta secci6n se estudia c6mo determinar el tamano de la muestra de acuerdo con la situaci6n A continuaci6n se proporciona un metodo para determinar el tamano de la muestra que se requiere para estimar Ia media de la poblaci6n yen la siguiente secci6n se aplica este metodo para detershyminar el tamano de la milestra cuando se desea estimar la proporci6n de una poshyblaci6n Mediante extensiltmes directas de estos metodos es posible determinar el tamano necesario de las muestras para situaciones mas complicadas

Objetivos El objetivo de la estimaci6n porintervalos es el de obtener intervalos estrechos con alta confiabilidad Si se observan los componentes ~e un intervalo de confianzase veque 8U dimension esta determinada por la magnitud de la cantidad

(coeficiente de confiabilidad) x (error estandar)

131 67 DETERMINACION DEL TAMANO PARA LA l-IUESTRAmiddot

ya que lamagnitud total del intervalo de confIanza es eldoble de esta cantidad Se aprendi6 que a esta cantidad generalmente se Ie llama precisi6n de la estimaci6n o margen de error Para un error estandar dado incrementar la confIabilidad signishyfIca un coefIciente con mayor confIabilidad Y un coefIciente con mayor confIabilidad produce unintervalo mas amplio

Por otra parte si se ftia el coefIciente de confIabilidad la unica manera de redudr la amplitud del intervalo es la reducci6n del error estandar Dado que el error estandar es igual a (J IJ y como (J es una constante la unica forma de obtener un error estandar menor es tomar una muestra grande ~Que tan grande debeser la muestra Esto depende del tamafio de (J la desviad6n estandar de la poblaci6n asi como del grado de confIabilidad y dimensi6n del intervalo deseados

Suponga que se desea obtener un intervalo que se extienda d unidades hacia uno y otro lado del estimador Ellose enuncia

d (coefIciente de confIabilidad) X (error estandar) (671)

Si el muestreo es con reemplazos a partir de una poblaci6n infInita 0 de una que sea 10 sufIcientemente grande como para ignorar la correcci6n por poblaci6n fInita la ecuaci6n 671 se transforma en

(J

d z- (672)-r la cual cuando se despeja n nos da

(673)d2

Cuando el nmestreo se hacesin reemplazos a partir de una poblaci6n fInita y peshyquefia se requiere de la correcci6n por poblaci6n fInita y la ecuaci6n 671 se transforma en

(J~d (674)fN~

que al despejar n resulta en

n-----shy (675)d 2(N 1) + Z2(J2

Si puede omitirse la correcci6n por poblad6n fInita la ecuaci6n 675 se reshyduce a la ecuaci6n 673

Estillluci6n de (J 2 Las f6rmulas para el tamafio de la muestra requieren del conocimiento de (J2 pero como ya se ha sefialado la varian cia de la poblaci6n casi

132 CAPITULO 6 ESTlMACION

siempre sedesconoce Como resultado esnecesarioestimar (J2 Las fuentes de estishymaci6n de(J2 que se utilizan con mas frecuencia son las siguientes

1 Se extrae una muestrapilato 0 prel~l11inar de lapoblaci6n y se puede utilizar la variancia calculada a partir de esta muestra como unaestimaci6n de (J2 Las observaciones uti lizadas en la muestra piloto se toman como parte de la muesshytrafinal de modo que n (el tamaiio calculado de la muestra) n

1 (el tamaiio

de la muestra piloto) n2 (el numero de observaciones necesarias para satisfacer el requerimiento total del tamaiio de la muestra)

2 A partir de estudios anteriores osimilares es posible obtener estimaciones de (J2

3Si se cree que la poblaci6n de lacual se extrae la muestraposee una distribushyci6n aproximadamente nqrmal se puede aprovechar el hecho de que la amshyplitud es aproximadamente igual a 6 desviaciones estandar y calcular (J R6 Este metodo requiere aIglin conocimiento acerca de los valores minimo y maximo de la variable en la poblaci6n

EJEMPLO 671

Un nutri6logo del departamento de salud al efectuar una encuesta entre una poshyblacien de muchachas adolescentes con e1 fin de determinitr su ingesti6n diaria promedio de proteinas (medidas en gramos) busc6 el consejo de un bioestadistico con respecto al tamaiio de la muestra que deberfa tomar

~Que procedimiento debe seguir el bioestadistico para asesorar al nutri610go Antes de que el estadistico pueda ayudar el nutri6logo este debe proporcionar tres elementos de informaci6n h dimensi6n deseada del intervalo de confianza el nivel de confianza deseado y la magnitud de la variancia de la poblaci6n

Soludon Suponga que el nutri6logo requiere un intervalo con una dimensi6n de aprQximadamente 10 gramos es decir la estimaci6n se deberfa enconshytrar alrededor de 5 gramos de la media de la poblaci6n en ambas direcshyciones En otras palabras se desea un margen de error de 5 gramos Suponga que se decide por un coeficiente de confian7a de 95 y que con base en su experiencia previa el nutri6logo percibe que la desviaci6n estandar de la poblaci6n es probablemente de alrededor de 20 gramos EI estadfstico dispone ya de la informaci6n necesaria para calcular el tamaiio de la muestra z 196 (J = 20 y d 5 Suponga que el tamaiio de la poblaci6n es grande asf queel estadistico puede ignorar la correcshyci6n por poblaci6n finita y utilizar la ecuaci6n 673 Con las sustitucioshynes adecuadas el valor de n se calcula como

Se recomienda que el nutri610go tome una muestra de tamafio 62 AI calcular el tamaiio de una muestra a partir de las ecuaciones 673 0 675 el resultado se redondea al siguiente nurnero entero mayor si los calculosdan un numerocon decimales bull

183 68 DETERMINACION DEL TAl1ANO PARA LAS PROPORCIONES

EJERCICIOS

671 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su hospital Si se desea un intervalo de confianza de 99 por dento con una amplitud de 1 libra ~que tan grande debe ser la muestra de los registros de nacimiento Suponga que un estimashy

dor razonable para (J es 1 libra ~De que tamano debe ser la muestra si el coeficiente de confiabilidad se hace descender a 95

672 El director de la secdon de control dela rabia del departamento de salud publica desea extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso del ano anterior para estimar la edad media de las personas mordidas Requiere un intervalo de confianza de 95 por dento decide utilizar un valor de 25 para d y a partir de estudios anteriores estima que la desviacion estandar de la poblacion esta alrededor de los 15 anos ~Que tan grande debe ser el tamano de la muestra

673 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mglOO ml) de pacientes atendidos en una clinica para diabeticos durante el transcurso de los ultimos 10 anos Determine el numero de registros que el medico debe examinar para obtener un intershyvalo de confianza de 90 por ciento para 11 si la dimension requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varian cia de 60

674 Se deseaestimar la edad media en la que a los padentes de esclerosis multiple se les diagnosshytico el padecimiento por primera vez Se requiere un intervalo de confianza de 95 por dento con una dimension de 10 anos Si la variancia de la poblaci6n es de 90 ~que tan grande debera ser la muestra

68 DETERMINACION DELTAMANO DE lA MUESTRA PARA lA ESIDIACION DE lAS PROPORCIONES

EI metodo para estimar el tamafio de la muestra cuando se requiere estimar la proshyporcion de una poblacion es esencialmente el mismo que se describio para estimar la media de una poblacion Se aprovecha el hecho de que la mitad del intervalo deseashydo d se puede igualar al producto del coeficiente de confiabilidad y el error estandar

Si se supone que el muestreo ha sido hecho de manera aleatoria y que existen condiciones que garanticen que la distribuci6n de psea aproximadamente normal se obtiene la siguiente formula para n cuando el muestreo es con reemplazo cuanshydo se realizaa partir de una poblacion infinita 0 ruando la poblacion muestreada es 10 suficientemente grande como para hacer innecesario el uso de la correcci6n por poblacion finita

n (681)

dondeq = I-p Si la correccion por poblacion finita no puede descartarse la formula adecuashy

da paran es

(682)n d 2 (N -1)+z2pq

euan do N es grande en comparacion con n (es decir n IN 05) se puede pasar por alto la correccion por poblacion finita y la ecuacion 682 se reduce a la ecuacion 681

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

clJ clJ FIGURA 541 Diagrama de flujo para decidir si e1 factor de confiabilidad debe ser z tot cuando se realizan inferencia inferencias acerca de la diferencia entre las medias de dos pobladones (Para usar un procedimiento no parametrico ver el capitulo 11)

174 CAPiTULO 6 ESTlMACION

para cad a intervalo construido Suponga las variables bajo considerati6n en cad a ejercicio y establezca para que pueden servir a los investigadores esos resultados

641 EI objetivo de un experimento de Buckner et al (A-7) consisti6 en estudiar los efectos del relajamiento muscular inducido por el pancuronium en el volumen del plasma circulante Los individuos estudiados son recien nacidos con un peso mayor a 1700 gramos que necesishytaron de ayuda para respirar durante las primeras 24 horas despues de nacer y cumplieron con otros criterios cHnicos Cinco recien nacidos paraIizados con el pancuronium y siete recien nacidos no tratados presentaron las siguientes estadisticas en la segunda de las tres mediciones del volumen de plasma (ml) hecha durante la respiraci6n mecanica

Paralizados 480 81 No tratados 567 81

La segunda medici6n para el grupo tratado ocurri6 de 12 a 24 horas despues de la primera dosis de pancuronium Para el grupo no tratado las mediciones se hicieron de 12 a 24 horas despues de iniciar la respiracion mecanica

642 Zuckery Archer (A-8) afirman que la N-nitrosobis (2-oxopropyl)amina (BOP) y las nitrosaminas 3-oxidizadas producen una alta incidencia de tumores de conductos pancreaticos en el hamster dorado sirio Estudiaron los efectos en el peso sangufneo en la glucosa del plasma en la insulina yen los niveles de transamina glutamico-oxaloacetica del plasma (GOT) de los hamsters expuestos in vivo a la BOP Los investigadores reportaron los siguientes resultados en ocho animales tratados y 12 sin tratamiento

Variable Sin tratamiento Con tratamiento

Glucosa del plasma (mglgl) 101 plusmn 5 74plusmn 6

FUENTE Peter F Zucker y Michael C Archer Alterations Pancreatic Islet Function Produced by Carcinogenic Nitrosamines in the Syrian Hamster AmericanJournal oPathology 133 573-577

Los datos son la media de la muestra plusmn la estimaci6n del error estandar de la media de la muestra

643 Los objetivos de un estudio de Davis et al (A-g) son evaluar 1) la eficacia del programa auto ayuda momento para dejar de fumar cuando se utiliza con base de uno a uno en el hogar y 2) la viabilidad de ensefiar temicas para abandonar el habito de fumar a los estudiantes de enfermerfa en bachillerato A estudiantes graduados de enfermerfa inscritos en dos cursos de metodologia de la investigacion de la Universidad de Ottawa se les invit6 a participar en el proyecto Se aplic6 un cuestionario de opcion multiple para abandonar el habito de fumar a 120 estudiantes de enfermeria que participaron y a otros 42 estudiantes que no participashyron antes ni despues del estudio Se calcularon las diferencias entre las calificaciones antes y despues del estudio as como las siguientes estadisticas a partir de las diferencias

EJERCICIOS 175

Grupo Media Desviaci6n estandar

Participantes (A) 214444 15392 No participantes (B) 33333 14595

644 El doctor Ali Khraibi (A-IO) de la CHnica y Fundaci6n Mayo condujo una serie de experishymentos con el fin de evaluar las respuestas diureticas y natiureticas de ratas Okamoto esponshytaneamente hipertensivas (REB) y ratas Wistar-Kyoto (WRY) para dirigir incrementos en la presion hidrostatica renal intersticial (PBRI) Para aumentar la PBRI se utiIiz6 la expansi6n directa del volumen renal intersticial (DRIVE) a traves de una matriz implantada cronicamente en el rinOn Entre los datos registrados durante el estudio estan las siguientes mediciones de excreci6n de sodio a traves de la orina (UNa V) durante el periodo de DRIVE

Grupo

REB 632572796483527 2WKY 420469482 108210

FUENTE Publicada con autorizaci6n del Dr Ali A Khraibi

645 Osberg y Di Scala (A-II) realizaron un estudio centrado en la eficacia de los cinturones de seguridad para reducir 1esiones entre sobrevivientes de accidentes automoviHsticos internashydos en hospitales con edades de 4 a 14 afios El estudio compar610s resultados de 123 ninos que utilizaron el cintur6n contra 290 que no 10 utilizaron entre aquellos que se vieton enshyvueltos en tales accidentes y que fueron hospitalizados El informe con tenia la siguiente estadistica del numero de dfas en la unidad de cuidados intensivos

Grupo Media Error estandar estimado

Utiliz6 el cintur6n 83 16 No utiliz6 el cintur6n 139 18

646 La medicion del diametro transversal del coraz6n de hombres y mujeres adultos presenta los siguientes resultados

sx Grupo Tamafto de Ia muestra (cm) (cm)

Varones 12 1321 105 Mujeres 9 IIOO 101

Considere que las poblaciones siguen una distribucion normal con variancias iguales

176 CAPITULO 6 ESTIMACION

647 Veintiruatro animales de laboratorio con deficiencia de vitamina D fueron divididos en dos grupos iguales EI grupo 1 recibi6 un tratamiento consistente en una dieta que proporcionashyba vitamina D EI segundo grupo no fue tratado AI termino del periodo experimental se midieron las concentraciones de calcio ensuero obteniendose los siguientes resultados

Grupo tratado X 111 mg 100 mls = 15 Grupo sin tratamiento x= 78 mg 100 ml s = 20

Considere que las poblaciones siguen una distribuci6n normal con variancias iguales

648 Ados grupos de nifios se les hicieron pruebas de agudeza vi~ual El grupo 1 estuvo formado por 11 nifios que recibieron la atenci6n de medicos privados La calificaci6n media para este grupo fue de 26 con una desviaci6n estandar de 5 El segundogrupo que incluy6 14 nifios que recibieron atenci6n medica por parte del departamento de salud publica tuvo una calishyficaci6n promedio de 21 con una desviaci6n estandar de 6 Suponga que las poblaciones siguen una distribuci6n normal con variancias iguales

649 El tiempo promedio de estancia de una muestra de 20 pacientes dados de alta de un hospital general es de siete dras con una desviaci6n estaildar de dos dras Una muestra de 24 padenshytes dados de alta de un hospital de enfermedades cr6nicas tuvo un tiempo promedio de estancia de 36 dfas con una desviaci6n estindar de 10 dias Suponga que la poblaci6n sigue una distribuci6n normal con variancias desiguales

6410 En un estudio de factores que se consideran responsables de los efectos adversos del tabashyquismo sobre la reproducci6n humana se midieron los niveles de cadmio (nanogramos por gramo) en el tejido de la placenta de una muestra de 14 madres que fumaban y una muestra aleatoria independiente de 18 mujeres no fumadoras Los resultados fueron los siguientes

No fumadoras toO 84 128250 118 98 125 154 235

94251 1952559875 118122150

Fumadoras 300301150241305178168148

134285 175 144 125204

ms probable que el nivel medio de cadmio registrado sea mayor entre las fumadoras que entre las no fumadoras ~Por que se llegarfa a esta conclusi6n

65 INTERVALO DE CONFIANZA PARA IA PROPORCION DE UNA POBIACION

Muchas preguntas de interes para que el tecnico en salud tienen relacion con las proporciones de poblacion ~Que propordon de padentes que redben un tipo espeshycial de tratamiento se recuperan ~Que proporcion de alguna poblacion tiene cierta enfermedad ~Que propordon de una poblacion es inmune a derta enfermedad

Para estimar la proporcion de una poblacion se procede en la misma forma que cuando se estima la media de una poblacion Se extrae una muestra de la poblacion de interes y se calcula su proporcion p Esta se utiliza como el estimador puntual para la proporcion de la pobladon Un intervalo de confianza se obtiene mediante la siguiente formula general

estimador plusmn (coefidente de confiabilidad) X (error estandar)

EJERCICIOS

EJERCICIOS 177

En el capitulo anterior se vio que cuando np y n(1 - p) son mayores que 5 se puede considerar que la distribuci6n muestral de pse aproxima bastante a una distribuci6n normal Cuando se cumple con esta condici6n el coeficiente de confiabilidad es algUn valor de z de la distribuci6n normal estandar Esta visto que el error estandar es igual a (J p =fi(l-p) n Puesto que p que es el parametro que se trata de calcular se desconoce se debe utilizar pcomo una estimaci6n Asf se estima (J j por medio de ~p(l Pn y el intervalo de confianza de 100(1 - 0) por ciento para pesta dado por

pplusmn Z(I-1J2)~P(l- P) Fn (651)

Este intervalo se interpreta tanto desde el punto de vista practico como probabilistico

FJEMPLO 651

Mathers et al (A-12) encontraron queen una muestra de 591 pacientes internados en un hospital psiquiatrico 204 admitieron que consuniieron marihuana al meshynos una vez durante su vida Se pretende construir un intervalo de confianza de 95 por ciento para la proporcion de individuos que consumieron marihuana durante su vida en la poblaci6n muestreada de los internos del hospital psiquiatrico

Solucion La mejor estima~i6n puntual para la proporci6Il de la poblaci6nes p== 204591 3452 El tamafio de la muestra y hiestimacion de p tienen una magnitud suficiente parajustifKar el empleo de la distribucion norshymal estandar paraelaborar un intervalo de confianza EI coeficiente de corifiabilidad que corresponde alnivel de confianza de 95 es 196 la estimacion del errorestandar (Jp es ~p(l-pgtn = (3452)(6548)591

0 1956El intervalo de confianza para p de acuerdo con estos datos es

3452 plusmn 196(01956) 3452 plusmn 0383 3069 3835

Se puede decir que se tiene 95 por ciento de confianza de que la proporshycionpeste entre 3069 y 3835 ya que al repetir el muestreo casi 95 por ciento de los intervalos construidos en la forma de este intervalo inclushyyen a la proporcion p real Con base en estos resultados se espera con una confianza de 95 por ciento encontrar que entre 3069 y 3835 por ciento de los internados en el hospital psiquiatrico tiene antecedentes de consumo de marihuana bull

Para cada uno de los siguientes ejercicios establezca la interpretacion prictica yprobabilistica de los intervalos que se pide construir Identifique cada componente del intervalo la estimashycion puntual el coeficiente de confiabilidad yel error estandar Explique por que los coefishycientes de confiabilidad no son los misInos para todos los ejercicios

178 CAPITULO 6 ESTIIlACI6N

651 En una investigaci6nde ninos maltratados en pacientes psiquiatricos Brown y Anderson (A-IS) encontraron 166 pacientes en una muestra de 947 con antecedentes de abuso sexual y maltrato flsico Construya un intervalo de confianza de 90 por dento para la proporci6n de la poblaci6n

652 Catania et at (A-14) obtuvieron datos respecto al comportamiento sexual de una muestra de hombres y mujeres solteros con edades entre 20 y 44 residentes en areas geoijfaficas caracshyterizadas por tasas altas de enfermedades de transmision sexual e ingreso a programas de drogas De 1229 encuestados 50 por ciento respondieron que nunca utilizaron preservatishyvos Construya un intervalo de confianza de 95 por ciento para la proporcion de la poblaci6n que nunca utiliza preservativos

653 Rothberg y Lits (A-I 5 ) estudiaron el efecto del estres de la maternidad durante el embarazo en el peso del producto Los individuos eran 86 mujeres blancas con antecedentes de estres que no tenfan faetores de riesgo medico u obstetrico conoddo de peso bajo del producto Los investigadores eneontraron que 128 por dento de las madres estudiadas dieron a luz bebes que cubrfan el criterio de peso bajo Construya un intervalo de confianza de 99 por ciento para la proporci6n de la poblaci6n

654 En una muestra aleatoria simple de 125 varones desempleados quienes desertaron de la escuela preparatoria entre las edades de 16 y 21 anos inclusive 88 declararon que eran consumidores regulares de bebidas alcoh6litas Construya un intervalo de eonfianza de 95 por ciento para la proporcion de la poblacion

66 INTERVALO DE CONFIANZA PARA lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS POBlACIONES

A menudo se tiene interes en conocer la magnitud de la diferencia entre las proporcioshynes de dospoblaciones Es posible que se quiera comparar por ejemplo entre hombres y mujeres dos grupos de edades dos grupos socioecon6micos 0 dos grupos de diagshynostico con respecto a la proporcion que posee alguna caractenstica de interes Un estimador puntual insesgado de la diferencia entre dos proporciones de las poblacioshynes se obtieneal calcular la diferencia de las proporciones de las muestras PI P2 Tal como Se ha visto cuando n1 Yn2 son de gran tamano y las proporciones de la poblacion no estan muy cerca de 0 0 de 1 es posible aplicar el teorema del limite central y utilizar la teona de la distribucion normal para obtener los intervalos de conshyfianza EI error estandar de la estimacion se calcula mediante la siguiente formula

dado que como regIa se desconocen las proporciones de Ia poblacion Un intervashy10 de confianza de 100(1 - a) por ciento para PI P2 se obtiene as

(661)

Es posible interpretar este intervalo desde elpunto de vista probabiHstico y practico

EJERCICIOS 179

EJEMPLO 661

Borst et al (A-16) investigaron la relaci6n de desarrollo del ego edad sexo y diagshyn6stico de suicidio entre los internos adolescentes de la unidad de psiquiatria La muestra consistia en 96 varones y 123 niiias con edades entre 12 y 16 aiios seleccioshynados de entre los internados en la unidad de adolescentes y niiios de un hospital psiquiatrico privado Se reportaron 18 niiios y 60 niiias con intento de suicidio Cons ishyderese el comportamiento de las niiias como el de una muestra aleatoria simple a partir de una poblaci6n similar de niiias y que los j6venes igualmente pueden considerarse como una muestra aleatoria simple extraida de una poblaci6n similar de niiios Para estas dos poblaciones se pretende construir un intervalo de confianshyza de 99 por ciento para la diferencia entre las proporciones de los individuos con intento de suicidio

Soluci6n Las proporciones para las niiias y niiios respectivamente son Pc = 601 123 = A878y PB = 1896 1875 La diferencia entre las proporciones de lasmuestrases Pc PB = 4878 1875 = 3003 El error estandar estimado de la diferenda entre las proporciones de las muestras es

(4878)(5122) (1875)(8125) ---~~-~ +-------shy

123 96

El factor de confiabilidad a partir de la tabla D es 258 de modo que el intervalo de confianza con la f6rmula 661 es

3003 plusmn 258(0602) 14504556

Se dene la confianza de 99 por dento de que para las poblaciones muestteadas la ptopord6n de intentos de suiddio entre las niiias exceshyde a lapropord6n de intentosde suiddio entre los varones por 1450 y 4556

Puesto que el intervalo no incluye al cero se concluye que las dos proporciones de pobladones son diferentes bull

FJERCICIOS

Para cada uno de los siguientes ejercicios establezca las interpretaciones pnicticas y probabishylisticas de los intervalos que se pide construir Identifique cada componente del intervalo la estimaci6n puntual el coeficiente de confiabilidad y el error estandar Explique por que los coeficientes de confiabilidad no son el mismo para todos los ejercicios

661 Hargers et al (A-17) del departamento de Salud PUblica y Ambieptal en Amsterdam condushyjeron un estudio en el que los individuos eran consumidores de drogasinyectables (CDI) En una muestrade 194 consumidores de metadona regular de largo plazo (MLP) 145 eran varones En una muestra de 189 CDIque no consmiddotumian MLP 133 eran varones Establezca las consideraciones necesarias acerca de las muestras ypoblaciones representadas y construshy

180 CAPITULO 6 ESTlMACI6N

ya un intervalo de confianza de 95 por ciemo para la diferenda entre las proporciones de varones en las dos poblaciones

662 Una investigaci6n de Lane et ai (A-I8) valor6las diferencias en las pnicticas de deteccion de cancer de seno entre muestras de mujeres predominantemente de bajos ingresos con edashydes de 50 a 75 anos que lltilizan los servicios de c1inicas de sailld para todo el estado y mlljeres de la misma edad residentes en ciudades donde las c1inicas de salud son locales De las 404 encuestadas seleccionadas en toda la comunidad 592 por ciento estuvo de acuerdo con el siguiente comentario acerca del cancer de pecho las mujeres prolongan su vida si detectan el cancer desde el inicio De entre 795 usuarias de clinicas de salud en la mllestra 449 por ciento estuvo de acuerdo Establezca las suposiciones apropiadas para elaborar un intervalo de confianzade 99 por ciento para la diferencia entre las dos proporciones de las poblaciones de interes

663 Williams et at (A-19) encuestaron a una muestra de 67 medicos y 133 enfermeras con famishyliares farmacodependientes EI prop6sito del estudio era evaluar la influencia en los medishyEOS y enfermeras de estar estrechamente involucrados con una 0 mas personas farmaco dependientes Cincuenta y dos medicos y 89 enfermeras dijeron que vivian con personas farmacoldependientes que adversamente afectaban 8U trabajo E8tablezca todas las consideshyraciones que crea necesarias para construir un intervalo de confianza de 95 por ciento para la diferencia entre las proporciones en las dos poblaciones de trabajadores que se espera esten adversamente afectados por vivir con personas farmacodependientes

664 Aronow y Kronzon (A-20) identificaron los factores de riesgo coronado entre hombres y mujeres en una dinica de cuidados de la salud a largo plazo De los 215 individuos negros 58 tienen diabetes mellitus al igual que 217 individuos blancos de 1140 Elabore un intervalo de confianza de 90 por ciento de confianzapara la diferencia entre las proporciones de las dos poblaciones tCuaies son las poblaciones correspondientes ~Que consideraciones son necesarias para hacer valido el procedimiento de inferencia

67 DETEHMINAUON DEL TAMANO DE LA MUESTRA PARA LA ESTIMACIONDEIAS MEDIAS

La pregunta de que tan grande debe ser una muestra surge inmediatamente al inicio del planteamiento de cualquier encuesta 0 experimento Esta es una pregunshyta importante y no se debe tratara la ligera Tomar una muestra mas grande de 10 necesario para obtener los resultados deseados es un desperdicio de recursos mienshytras que por otro lado las muestras demasiado pequenas con frecuencia dan resulshytados que carecen de uso practico En esta secci6n se estudia c6mo determinar el tamano de la muestra de acuerdo con la situaci6n A continuaci6n se proporciona un metodo para determinar el tamano de la muestra que se requiere para estimar Ia media de la poblaci6n yen la siguiente secci6n se aplica este metodo para detershyminar el tamano de la milestra cuando se desea estimar la proporci6n de una poshyblaci6n Mediante extensiltmes directas de estos metodos es posible determinar el tamano necesario de las muestras para situaciones mas complicadas

Objetivos El objetivo de la estimaci6n porintervalos es el de obtener intervalos estrechos con alta confiabilidad Si se observan los componentes ~e un intervalo de confianzase veque 8U dimension esta determinada por la magnitud de la cantidad

(coeficiente de confiabilidad) x (error estandar)

131 67 DETERMINACION DEL TAMANO PARA LA l-IUESTRAmiddot

ya que lamagnitud total del intervalo de confIanza es eldoble de esta cantidad Se aprendi6 que a esta cantidad generalmente se Ie llama precisi6n de la estimaci6n o margen de error Para un error estandar dado incrementar la confIabilidad signishyfIca un coefIciente con mayor confIabilidad Y un coefIciente con mayor confIabilidad produce unintervalo mas amplio

Por otra parte si se ftia el coefIciente de confIabilidad la unica manera de redudr la amplitud del intervalo es la reducci6n del error estandar Dado que el error estandar es igual a (J IJ y como (J es una constante la unica forma de obtener un error estandar menor es tomar una muestra grande ~Que tan grande debeser la muestra Esto depende del tamafio de (J la desviad6n estandar de la poblaci6n asi como del grado de confIabilidad y dimensi6n del intervalo deseados

Suponga que se desea obtener un intervalo que se extienda d unidades hacia uno y otro lado del estimador Ellose enuncia

d (coefIciente de confIabilidad) X (error estandar) (671)

Si el muestreo es con reemplazos a partir de una poblaci6n infInita 0 de una que sea 10 sufIcientemente grande como para ignorar la correcci6n por poblaci6n fInita la ecuaci6n 671 se transforma en

(J

d z- (672)-r la cual cuando se despeja n nos da

(673)d2

Cuando el nmestreo se hacesin reemplazos a partir de una poblaci6n fInita y peshyquefia se requiere de la correcci6n por poblaci6n fInita y la ecuaci6n 671 se transforma en

(J~d (674)fN~

que al despejar n resulta en

n-----shy (675)d 2(N 1) + Z2(J2

Si puede omitirse la correcci6n por poblad6n fInita la ecuaci6n 675 se reshyduce a la ecuaci6n 673

Estillluci6n de (J 2 Las f6rmulas para el tamafio de la muestra requieren del conocimiento de (J2 pero como ya se ha sefialado la varian cia de la poblaci6n casi

132 CAPITULO 6 ESTlMACION

siempre sedesconoce Como resultado esnecesarioestimar (J2 Las fuentes de estishymaci6n de(J2 que se utilizan con mas frecuencia son las siguientes

1 Se extrae una muestrapilato 0 prel~l11inar de lapoblaci6n y se puede utilizar la variancia calculada a partir de esta muestra como unaestimaci6n de (J2 Las observaciones uti lizadas en la muestra piloto se toman como parte de la muesshytrafinal de modo que n (el tamaiio calculado de la muestra) n

1 (el tamaiio

de la muestra piloto) n2 (el numero de observaciones necesarias para satisfacer el requerimiento total del tamaiio de la muestra)

2 A partir de estudios anteriores osimilares es posible obtener estimaciones de (J2

3Si se cree que la poblaci6n de lacual se extrae la muestraposee una distribushyci6n aproximadamente nqrmal se puede aprovechar el hecho de que la amshyplitud es aproximadamente igual a 6 desviaciones estandar y calcular (J R6 Este metodo requiere aIglin conocimiento acerca de los valores minimo y maximo de la variable en la poblaci6n

EJEMPLO 671

Un nutri6logo del departamento de salud al efectuar una encuesta entre una poshyblacien de muchachas adolescentes con e1 fin de determinitr su ingesti6n diaria promedio de proteinas (medidas en gramos) busc6 el consejo de un bioestadistico con respecto al tamaiio de la muestra que deberfa tomar

~Que procedimiento debe seguir el bioestadistico para asesorar al nutri610go Antes de que el estadistico pueda ayudar el nutri6logo este debe proporcionar tres elementos de informaci6n h dimensi6n deseada del intervalo de confianza el nivel de confianza deseado y la magnitud de la variancia de la poblaci6n

Soludon Suponga que el nutri6logo requiere un intervalo con una dimensi6n de aprQximadamente 10 gramos es decir la estimaci6n se deberfa enconshytrar alrededor de 5 gramos de la media de la poblaci6n en ambas direcshyciones En otras palabras se desea un margen de error de 5 gramos Suponga que se decide por un coeficiente de confian7a de 95 y que con base en su experiencia previa el nutri6logo percibe que la desviaci6n estandar de la poblaci6n es probablemente de alrededor de 20 gramos EI estadfstico dispone ya de la informaci6n necesaria para calcular el tamaiio de la muestra z 196 (J = 20 y d 5 Suponga que el tamaiio de la poblaci6n es grande asf queel estadistico puede ignorar la correcshyci6n por poblaci6n finita y utilizar la ecuaci6n 673 Con las sustitucioshynes adecuadas el valor de n se calcula como

Se recomienda que el nutri610go tome una muestra de tamafio 62 AI calcular el tamaiio de una muestra a partir de las ecuaciones 673 0 675 el resultado se redondea al siguiente nurnero entero mayor si los calculosdan un numerocon decimales bull

183 68 DETERMINACION DEL TAl1ANO PARA LAS PROPORCIONES

EJERCICIOS

671 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su hospital Si se desea un intervalo de confianza de 99 por dento con una amplitud de 1 libra ~que tan grande debe ser la muestra de los registros de nacimiento Suponga que un estimashy

dor razonable para (J es 1 libra ~De que tamano debe ser la muestra si el coeficiente de confiabilidad se hace descender a 95

672 El director de la secdon de control dela rabia del departamento de salud publica desea extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso del ano anterior para estimar la edad media de las personas mordidas Requiere un intervalo de confianza de 95 por dento decide utilizar un valor de 25 para d y a partir de estudios anteriores estima que la desviacion estandar de la poblacion esta alrededor de los 15 anos ~Que tan grande debe ser el tamano de la muestra

673 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mglOO ml) de pacientes atendidos en una clinica para diabeticos durante el transcurso de los ultimos 10 anos Determine el numero de registros que el medico debe examinar para obtener un intershyvalo de confianza de 90 por ciento para 11 si la dimension requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varian cia de 60

674 Se deseaestimar la edad media en la que a los padentes de esclerosis multiple se les diagnosshytico el padecimiento por primera vez Se requiere un intervalo de confianza de 95 por dento con una dimension de 10 anos Si la variancia de la poblaci6n es de 90 ~que tan grande debera ser la muestra

68 DETERMINACION DELTAMANO DE lA MUESTRA PARA lA ESIDIACION DE lAS PROPORCIONES

EI metodo para estimar el tamafio de la muestra cuando se requiere estimar la proshyporcion de una poblacion es esencialmente el mismo que se describio para estimar la media de una poblacion Se aprovecha el hecho de que la mitad del intervalo deseashydo d se puede igualar al producto del coeficiente de confiabilidad y el error estandar

Si se supone que el muestreo ha sido hecho de manera aleatoria y que existen condiciones que garanticen que la distribuci6n de psea aproximadamente normal se obtiene la siguiente formula para n cuando el muestreo es con reemplazo cuanshydo se realizaa partir de una poblacion infinita 0 ruando la poblacion muestreada es 10 suficientemente grande como para hacer innecesario el uso de la correcci6n por poblacion finita

n (681)

dondeq = I-p Si la correccion por poblacion finita no puede descartarse la formula adecuashy

da paran es

(682)n d 2 (N -1)+z2pq

euan do N es grande en comparacion con n (es decir n IN 05) se puede pasar por alto la correccion por poblacion finita y la ecuacion 682 se reduce a la ecuacion 681

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

174 CAPiTULO 6 ESTlMACION

para cad a intervalo construido Suponga las variables bajo considerati6n en cad a ejercicio y establezca para que pueden servir a los investigadores esos resultados

641 EI objetivo de un experimento de Buckner et al (A-7) consisti6 en estudiar los efectos del relajamiento muscular inducido por el pancuronium en el volumen del plasma circulante Los individuos estudiados son recien nacidos con un peso mayor a 1700 gramos que necesishytaron de ayuda para respirar durante las primeras 24 horas despues de nacer y cumplieron con otros criterios cHnicos Cinco recien nacidos paraIizados con el pancuronium y siete recien nacidos no tratados presentaron las siguientes estadisticas en la segunda de las tres mediciones del volumen de plasma (ml) hecha durante la respiraci6n mecanica

Paralizados 480 81 No tratados 567 81

La segunda medici6n para el grupo tratado ocurri6 de 12 a 24 horas despues de la primera dosis de pancuronium Para el grupo no tratado las mediciones se hicieron de 12 a 24 horas despues de iniciar la respiracion mecanica

642 Zuckery Archer (A-8) afirman que la N-nitrosobis (2-oxopropyl)amina (BOP) y las nitrosaminas 3-oxidizadas producen una alta incidencia de tumores de conductos pancreaticos en el hamster dorado sirio Estudiaron los efectos en el peso sangufneo en la glucosa del plasma en la insulina yen los niveles de transamina glutamico-oxaloacetica del plasma (GOT) de los hamsters expuestos in vivo a la BOP Los investigadores reportaron los siguientes resultados en ocho animales tratados y 12 sin tratamiento

Variable Sin tratamiento Con tratamiento

Glucosa del plasma (mglgl) 101 plusmn 5 74plusmn 6

FUENTE Peter F Zucker y Michael C Archer Alterations Pancreatic Islet Function Produced by Carcinogenic Nitrosamines in the Syrian Hamster AmericanJournal oPathology 133 573-577

Los datos son la media de la muestra plusmn la estimaci6n del error estandar de la media de la muestra

643 Los objetivos de un estudio de Davis et al (A-g) son evaluar 1) la eficacia del programa auto ayuda momento para dejar de fumar cuando se utiliza con base de uno a uno en el hogar y 2) la viabilidad de ensefiar temicas para abandonar el habito de fumar a los estudiantes de enfermerfa en bachillerato A estudiantes graduados de enfermerfa inscritos en dos cursos de metodologia de la investigacion de la Universidad de Ottawa se les invit6 a participar en el proyecto Se aplic6 un cuestionario de opcion multiple para abandonar el habito de fumar a 120 estudiantes de enfermeria que participaron y a otros 42 estudiantes que no participashyron antes ni despues del estudio Se calcularon las diferencias entre las calificaciones antes y despues del estudio as como las siguientes estadisticas a partir de las diferencias

EJERCICIOS 175

Grupo Media Desviaci6n estandar

Participantes (A) 214444 15392 No participantes (B) 33333 14595

644 El doctor Ali Khraibi (A-IO) de la CHnica y Fundaci6n Mayo condujo una serie de experishymentos con el fin de evaluar las respuestas diureticas y natiureticas de ratas Okamoto esponshytaneamente hipertensivas (REB) y ratas Wistar-Kyoto (WRY) para dirigir incrementos en la presion hidrostatica renal intersticial (PBRI) Para aumentar la PBRI se utiIiz6 la expansi6n directa del volumen renal intersticial (DRIVE) a traves de una matriz implantada cronicamente en el rinOn Entre los datos registrados durante el estudio estan las siguientes mediciones de excreci6n de sodio a traves de la orina (UNa V) durante el periodo de DRIVE

Grupo

REB 632572796483527 2WKY 420469482 108210

FUENTE Publicada con autorizaci6n del Dr Ali A Khraibi

645 Osberg y Di Scala (A-II) realizaron un estudio centrado en la eficacia de los cinturones de seguridad para reducir 1esiones entre sobrevivientes de accidentes automoviHsticos internashydos en hospitales con edades de 4 a 14 afios El estudio compar610s resultados de 123 ninos que utilizaron el cintur6n contra 290 que no 10 utilizaron entre aquellos que se vieton enshyvueltos en tales accidentes y que fueron hospitalizados El informe con tenia la siguiente estadistica del numero de dfas en la unidad de cuidados intensivos

Grupo Media Error estandar estimado

Utiliz6 el cintur6n 83 16 No utiliz6 el cintur6n 139 18

646 La medicion del diametro transversal del coraz6n de hombres y mujeres adultos presenta los siguientes resultados

sx Grupo Tamafto de Ia muestra (cm) (cm)

Varones 12 1321 105 Mujeres 9 IIOO 101

Considere que las poblaciones siguen una distribucion normal con variancias iguales

176 CAPITULO 6 ESTIMACION

647 Veintiruatro animales de laboratorio con deficiencia de vitamina D fueron divididos en dos grupos iguales EI grupo 1 recibi6 un tratamiento consistente en una dieta que proporcionashyba vitamina D EI segundo grupo no fue tratado AI termino del periodo experimental se midieron las concentraciones de calcio ensuero obteniendose los siguientes resultados

Grupo tratado X 111 mg 100 mls = 15 Grupo sin tratamiento x= 78 mg 100 ml s = 20

Considere que las poblaciones siguen una distribuci6n normal con variancias iguales

648 Ados grupos de nifios se les hicieron pruebas de agudeza vi~ual El grupo 1 estuvo formado por 11 nifios que recibieron la atenci6n de medicos privados La calificaci6n media para este grupo fue de 26 con una desviaci6n estandar de 5 El segundogrupo que incluy6 14 nifios que recibieron atenci6n medica por parte del departamento de salud publica tuvo una calishyficaci6n promedio de 21 con una desviaci6n estandar de 6 Suponga que las poblaciones siguen una distribuci6n normal con variancias iguales

649 El tiempo promedio de estancia de una muestra de 20 pacientes dados de alta de un hospital general es de siete dras con una desviaci6n estaildar de dos dras Una muestra de 24 padenshytes dados de alta de un hospital de enfermedades cr6nicas tuvo un tiempo promedio de estancia de 36 dfas con una desviaci6n estindar de 10 dias Suponga que la poblaci6n sigue una distribuci6n normal con variancias desiguales

6410 En un estudio de factores que se consideran responsables de los efectos adversos del tabashyquismo sobre la reproducci6n humana se midieron los niveles de cadmio (nanogramos por gramo) en el tejido de la placenta de una muestra de 14 madres que fumaban y una muestra aleatoria independiente de 18 mujeres no fumadoras Los resultados fueron los siguientes

No fumadoras toO 84 128250 118 98 125 154 235

94251 1952559875 118122150

Fumadoras 300301150241305178168148

134285 175 144 125204

ms probable que el nivel medio de cadmio registrado sea mayor entre las fumadoras que entre las no fumadoras ~Por que se llegarfa a esta conclusi6n

65 INTERVALO DE CONFIANZA PARA IA PROPORCION DE UNA POBIACION

Muchas preguntas de interes para que el tecnico en salud tienen relacion con las proporciones de poblacion ~Que propordon de padentes que redben un tipo espeshycial de tratamiento se recuperan ~Que proporcion de alguna poblacion tiene cierta enfermedad ~Que propordon de una poblacion es inmune a derta enfermedad

Para estimar la proporcion de una poblacion se procede en la misma forma que cuando se estima la media de una poblacion Se extrae una muestra de la poblacion de interes y se calcula su proporcion p Esta se utiliza como el estimador puntual para la proporcion de la pobladon Un intervalo de confianza se obtiene mediante la siguiente formula general

estimador plusmn (coefidente de confiabilidad) X (error estandar)

EJERCICIOS

EJERCICIOS 177

En el capitulo anterior se vio que cuando np y n(1 - p) son mayores que 5 se puede considerar que la distribuci6n muestral de pse aproxima bastante a una distribuci6n normal Cuando se cumple con esta condici6n el coeficiente de confiabilidad es algUn valor de z de la distribuci6n normal estandar Esta visto que el error estandar es igual a (J p =fi(l-p) n Puesto que p que es el parametro que se trata de calcular se desconoce se debe utilizar pcomo una estimaci6n Asf se estima (J j por medio de ~p(l Pn y el intervalo de confianza de 100(1 - 0) por ciento para pesta dado por

pplusmn Z(I-1J2)~P(l- P) Fn (651)

Este intervalo se interpreta tanto desde el punto de vista practico como probabilistico

FJEMPLO 651

Mathers et al (A-12) encontraron queen una muestra de 591 pacientes internados en un hospital psiquiatrico 204 admitieron que consuniieron marihuana al meshynos una vez durante su vida Se pretende construir un intervalo de confianza de 95 por ciento para la proporcion de individuos que consumieron marihuana durante su vida en la poblaci6n muestreada de los internos del hospital psiquiatrico

Solucion La mejor estima~i6n puntual para la proporci6Il de la poblaci6nes p== 204591 3452 El tamafio de la muestra y hiestimacion de p tienen una magnitud suficiente parajustifKar el empleo de la distribucion norshymal estandar paraelaborar un intervalo de confianza EI coeficiente de corifiabilidad que corresponde alnivel de confianza de 95 es 196 la estimacion del errorestandar (Jp es ~p(l-pgtn = (3452)(6548)591

0 1956El intervalo de confianza para p de acuerdo con estos datos es

3452 plusmn 196(01956) 3452 plusmn 0383 3069 3835

Se puede decir que se tiene 95 por ciento de confianza de que la proporshycionpeste entre 3069 y 3835 ya que al repetir el muestreo casi 95 por ciento de los intervalos construidos en la forma de este intervalo inclushyyen a la proporcion p real Con base en estos resultados se espera con una confianza de 95 por ciento encontrar que entre 3069 y 3835 por ciento de los internados en el hospital psiquiatrico tiene antecedentes de consumo de marihuana bull

Para cada uno de los siguientes ejercicios establezca la interpretacion prictica yprobabilistica de los intervalos que se pide construir Identifique cada componente del intervalo la estimashycion puntual el coeficiente de confiabilidad yel error estandar Explique por que los coefishycientes de confiabilidad no son los misInos para todos los ejercicios

178 CAPITULO 6 ESTIIlACI6N

651 En una investigaci6nde ninos maltratados en pacientes psiquiatricos Brown y Anderson (A-IS) encontraron 166 pacientes en una muestra de 947 con antecedentes de abuso sexual y maltrato flsico Construya un intervalo de confianza de 90 por dento para la proporci6n de la poblaci6n

652 Catania et at (A-14) obtuvieron datos respecto al comportamiento sexual de una muestra de hombres y mujeres solteros con edades entre 20 y 44 residentes en areas geoijfaficas caracshyterizadas por tasas altas de enfermedades de transmision sexual e ingreso a programas de drogas De 1229 encuestados 50 por ciento respondieron que nunca utilizaron preservatishyvos Construya un intervalo de confianza de 95 por ciento para la proporcion de la poblaci6n que nunca utiliza preservativos

653 Rothberg y Lits (A-I 5 ) estudiaron el efecto del estres de la maternidad durante el embarazo en el peso del producto Los individuos eran 86 mujeres blancas con antecedentes de estres que no tenfan faetores de riesgo medico u obstetrico conoddo de peso bajo del producto Los investigadores eneontraron que 128 por dento de las madres estudiadas dieron a luz bebes que cubrfan el criterio de peso bajo Construya un intervalo de confianza de 99 por ciento para la proporci6n de la poblaci6n

654 En una muestra aleatoria simple de 125 varones desempleados quienes desertaron de la escuela preparatoria entre las edades de 16 y 21 anos inclusive 88 declararon que eran consumidores regulares de bebidas alcoh6litas Construya un intervalo de eonfianza de 95 por ciento para la proporcion de la poblacion

66 INTERVALO DE CONFIANZA PARA lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS POBlACIONES

A menudo se tiene interes en conocer la magnitud de la diferencia entre las proporcioshynes de dospoblaciones Es posible que se quiera comparar por ejemplo entre hombres y mujeres dos grupos de edades dos grupos socioecon6micos 0 dos grupos de diagshynostico con respecto a la proporcion que posee alguna caractenstica de interes Un estimador puntual insesgado de la diferencia entre dos proporciones de las poblacioshynes se obtieneal calcular la diferencia de las proporciones de las muestras PI P2 Tal como Se ha visto cuando n1 Yn2 son de gran tamano y las proporciones de la poblacion no estan muy cerca de 0 0 de 1 es posible aplicar el teorema del limite central y utilizar la teona de la distribucion normal para obtener los intervalos de conshyfianza EI error estandar de la estimacion se calcula mediante la siguiente formula

dado que como regIa se desconocen las proporciones de Ia poblacion Un intervashy10 de confianza de 100(1 - a) por ciento para PI P2 se obtiene as

(661)

Es posible interpretar este intervalo desde elpunto de vista probabiHstico y practico

EJERCICIOS 179

EJEMPLO 661

Borst et al (A-16) investigaron la relaci6n de desarrollo del ego edad sexo y diagshyn6stico de suicidio entre los internos adolescentes de la unidad de psiquiatria La muestra consistia en 96 varones y 123 niiias con edades entre 12 y 16 aiios seleccioshynados de entre los internados en la unidad de adolescentes y niiios de un hospital psiquiatrico privado Se reportaron 18 niiios y 60 niiias con intento de suicidio Cons ishyderese el comportamiento de las niiias como el de una muestra aleatoria simple a partir de una poblaci6n similar de niiias y que los j6venes igualmente pueden considerarse como una muestra aleatoria simple extraida de una poblaci6n similar de niiios Para estas dos poblaciones se pretende construir un intervalo de confianshyza de 99 por ciento para la diferencia entre las proporciones de los individuos con intento de suicidio

Soluci6n Las proporciones para las niiias y niiios respectivamente son Pc = 601 123 = A878y PB = 1896 1875 La diferencia entre las proporciones de lasmuestrases Pc PB = 4878 1875 = 3003 El error estandar estimado de la diferenda entre las proporciones de las muestras es

(4878)(5122) (1875)(8125) ---~~-~ +-------shy

123 96

El factor de confiabilidad a partir de la tabla D es 258 de modo que el intervalo de confianza con la f6rmula 661 es

3003 plusmn 258(0602) 14504556

Se dene la confianza de 99 por dento de que para las poblaciones muestteadas la ptopord6n de intentos de suiddio entre las niiias exceshyde a lapropord6n de intentosde suiddio entre los varones por 1450 y 4556

Puesto que el intervalo no incluye al cero se concluye que las dos proporciones de pobladones son diferentes bull

FJERCICIOS

Para cada uno de los siguientes ejercicios establezca las interpretaciones pnicticas y probabishylisticas de los intervalos que se pide construir Identifique cada componente del intervalo la estimaci6n puntual el coeficiente de confiabilidad y el error estandar Explique por que los coeficientes de confiabilidad no son el mismo para todos los ejercicios

661 Hargers et al (A-17) del departamento de Salud PUblica y Ambieptal en Amsterdam condushyjeron un estudio en el que los individuos eran consumidores de drogasinyectables (CDI) En una muestrade 194 consumidores de metadona regular de largo plazo (MLP) 145 eran varones En una muestra de 189 CDIque no consmiddotumian MLP 133 eran varones Establezca las consideraciones necesarias acerca de las muestras ypoblaciones representadas y construshy

180 CAPITULO 6 ESTlMACI6N

ya un intervalo de confianza de 95 por ciemo para la diferenda entre las proporciones de varones en las dos poblaciones

662 Una investigaci6n de Lane et ai (A-I8) valor6las diferencias en las pnicticas de deteccion de cancer de seno entre muestras de mujeres predominantemente de bajos ingresos con edashydes de 50 a 75 anos que lltilizan los servicios de c1inicas de sailld para todo el estado y mlljeres de la misma edad residentes en ciudades donde las c1inicas de salud son locales De las 404 encuestadas seleccionadas en toda la comunidad 592 por ciento estuvo de acuerdo con el siguiente comentario acerca del cancer de pecho las mujeres prolongan su vida si detectan el cancer desde el inicio De entre 795 usuarias de clinicas de salud en la mllestra 449 por ciento estuvo de acuerdo Establezca las suposiciones apropiadas para elaborar un intervalo de confianzade 99 por ciento para la diferencia entre las dos proporciones de las poblaciones de interes

663 Williams et at (A-19) encuestaron a una muestra de 67 medicos y 133 enfermeras con famishyliares farmacodependientes EI prop6sito del estudio era evaluar la influencia en los medishyEOS y enfermeras de estar estrechamente involucrados con una 0 mas personas farmaco dependientes Cincuenta y dos medicos y 89 enfermeras dijeron que vivian con personas farmacoldependientes que adversamente afectaban 8U trabajo E8tablezca todas las consideshyraciones que crea necesarias para construir un intervalo de confianza de 95 por ciento para la diferencia entre las proporciones en las dos poblaciones de trabajadores que se espera esten adversamente afectados por vivir con personas farmacodependientes

664 Aronow y Kronzon (A-20) identificaron los factores de riesgo coronado entre hombres y mujeres en una dinica de cuidados de la salud a largo plazo De los 215 individuos negros 58 tienen diabetes mellitus al igual que 217 individuos blancos de 1140 Elabore un intervalo de confianza de 90 por ciento de confianzapara la diferencia entre las proporciones de las dos poblaciones tCuaies son las poblaciones correspondientes ~Que consideraciones son necesarias para hacer valido el procedimiento de inferencia

67 DETEHMINAUON DEL TAMANO DE LA MUESTRA PARA LA ESTIMACIONDEIAS MEDIAS

La pregunta de que tan grande debe ser una muestra surge inmediatamente al inicio del planteamiento de cualquier encuesta 0 experimento Esta es una pregunshyta importante y no se debe tratara la ligera Tomar una muestra mas grande de 10 necesario para obtener los resultados deseados es un desperdicio de recursos mienshytras que por otro lado las muestras demasiado pequenas con frecuencia dan resulshytados que carecen de uso practico En esta secci6n se estudia c6mo determinar el tamano de la muestra de acuerdo con la situaci6n A continuaci6n se proporciona un metodo para determinar el tamano de la muestra que se requiere para estimar Ia media de la poblaci6n yen la siguiente secci6n se aplica este metodo para detershyminar el tamano de la milestra cuando se desea estimar la proporci6n de una poshyblaci6n Mediante extensiltmes directas de estos metodos es posible determinar el tamano necesario de las muestras para situaciones mas complicadas

Objetivos El objetivo de la estimaci6n porintervalos es el de obtener intervalos estrechos con alta confiabilidad Si se observan los componentes ~e un intervalo de confianzase veque 8U dimension esta determinada por la magnitud de la cantidad

(coeficiente de confiabilidad) x (error estandar)

131 67 DETERMINACION DEL TAMANO PARA LA l-IUESTRAmiddot

ya que lamagnitud total del intervalo de confIanza es eldoble de esta cantidad Se aprendi6 que a esta cantidad generalmente se Ie llama precisi6n de la estimaci6n o margen de error Para un error estandar dado incrementar la confIabilidad signishyfIca un coefIciente con mayor confIabilidad Y un coefIciente con mayor confIabilidad produce unintervalo mas amplio

Por otra parte si se ftia el coefIciente de confIabilidad la unica manera de redudr la amplitud del intervalo es la reducci6n del error estandar Dado que el error estandar es igual a (J IJ y como (J es una constante la unica forma de obtener un error estandar menor es tomar una muestra grande ~Que tan grande debeser la muestra Esto depende del tamafio de (J la desviad6n estandar de la poblaci6n asi como del grado de confIabilidad y dimensi6n del intervalo deseados

Suponga que se desea obtener un intervalo que se extienda d unidades hacia uno y otro lado del estimador Ellose enuncia

d (coefIciente de confIabilidad) X (error estandar) (671)

Si el muestreo es con reemplazos a partir de una poblaci6n infInita 0 de una que sea 10 sufIcientemente grande como para ignorar la correcci6n por poblaci6n fInita la ecuaci6n 671 se transforma en

(J

d z- (672)-r la cual cuando se despeja n nos da

(673)d2

Cuando el nmestreo se hacesin reemplazos a partir de una poblaci6n fInita y peshyquefia se requiere de la correcci6n por poblaci6n fInita y la ecuaci6n 671 se transforma en

(J~d (674)fN~

que al despejar n resulta en

n-----shy (675)d 2(N 1) + Z2(J2

Si puede omitirse la correcci6n por poblad6n fInita la ecuaci6n 675 se reshyduce a la ecuaci6n 673

Estillluci6n de (J 2 Las f6rmulas para el tamafio de la muestra requieren del conocimiento de (J2 pero como ya se ha sefialado la varian cia de la poblaci6n casi

132 CAPITULO 6 ESTlMACION

siempre sedesconoce Como resultado esnecesarioestimar (J2 Las fuentes de estishymaci6n de(J2 que se utilizan con mas frecuencia son las siguientes

1 Se extrae una muestrapilato 0 prel~l11inar de lapoblaci6n y se puede utilizar la variancia calculada a partir de esta muestra como unaestimaci6n de (J2 Las observaciones uti lizadas en la muestra piloto se toman como parte de la muesshytrafinal de modo que n (el tamaiio calculado de la muestra) n

1 (el tamaiio

de la muestra piloto) n2 (el numero de observaciones necesarias para satisfacer el requerimiento total del tamaiio de la muestra)

2 A partir de estudios anteriores osimilares es posible obtener estimaciones de (J2

3Si se cree que la poblaci6n de lacual se extrae la muestraposee una distribushyci6n aproximadamente nqrmal se puede aprovechar el hecho de que la amshyplitud es aproximadamente igual a 6 desviaciones estandar y calcular (J R6 Este metodo requiere aIglin conocimiento acerca de los valores minimo y maximo de la variable en la poblaci6n

EJEMPLO 671

Un nutri6logo del departamento de salud al efectuar una encuesta entre una poshyblacien de muchachas adolescentes con e1 fin de determinitr su ingesti6n diaria promedio de proteinas (medidas en gramos) busc6 el consejo de un bioestadistico con respecto al tamaiio de la muestra que deberfa tomar

~Que procedimiento debe seguir el bioestadistico para asesorar al nutri610go Antes de que el estadistico pueda ayudar el nutri6logo este debe proporcionar tres elementos de informaci6n h dimensi6n deseada del intervalo de confianza el nivel de confianza deseado y la magnitud de la variancia de la poblaci6n

Soludon Suponga que el nutri6logo requiere un intervalo con una dimensi6n de aprQximadamente 10 gramos es decir la estimaci6n se deberfa enconshytrar alrededor de 5 gramos de la media de la poblaci6n en ambas direcshyciones En otras palabras se desea un margen de error de 5 gramos Suponga que se decide por un coeficiente de confian7a de 95 y que con base en su experiencia previa el nutri6logo percibe que la desviaci6n estandar de la poblaci6n es probablemente de alrededor de 20 gramos EI estadfstico dispone ya de la informaci6n necesaria para calcular el tamaiio de la muestra z 196 (J = 20 y d 5 Suponga que el tamaiio de la poblaci6n es grande asf queel estadistico puede ignorar la correcshyci6n por poblaci6n finita y utilizar la ecuaci6n 673 Con las sustitucioshynes adecuadas el valor de n se calcula como

Se recomienda que el nutri610go tome una muestra de tamafio 62 AI calcular el tamaiio de una muestra a partir de las ecuaciones 673 0 675 el resultado se redondea al siguiente nurnero entero mayor si los calculosdan un numerocon decimales bull

183 68 DETERMINACION DEL TAl1ANO PARA LAS PROPORCIONES

EJERCICIOS

671 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su hospital Si se desea un intervalo de confianza de 99 por dento con una amplitud de 1 libra ~que tan grande debe ser la muestra de los registros de nacimiento Suponga que un estimashy

dor razonable para (J es 1 libra ~De que tamano debe ser la muestra si el coeficiente de confiabilidad se hace descender a 95

672 El director de la secdon de control dela rabia del departamento de salud publica desea extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso del ano anterior para estimar la edad media de las personas mordidas Requiere un intervalo de confianza de 95 por dento decide utilizar un valor de 25 para d y a partir de estudios anteriores estima que la desviacion estandar de la poblacion esta alrededor de los 15 anos ~Que tan grande debe ser el tamano de la muestra

673 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mglOO ml) de pacientes atendidos en una clinica para diabeticos durante el transcurso de los ultimos 10 anos Determine el numero de registros que el medico debe examinar para obtener un intershyvalo de confianza de 90 por ciento para 11 si la dimension requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varian cia de 60

674 Se deseaestimar la edad media en la que a los padentes de esclerosis multiple se les diagnosshytico el padecimiento por primera vez Se requiere un intervalo de confianza de 95 por dento con una dimension de 10 anos Si la variancia de la poblaci6n es de 90 ~que tan grande debera ser la muestra

68 DETERMINACION DELTAMANO DE lA MUESTRA PARA lA ESIDIACION DE lAS PROPORCIONES

EI metodo para estimar el tamafio de la muestra cuando se requiere estimar la proshyporcion de una poblacion es esencialmente el mismo que se describio para estimar la media de una poblacion Se aprovecha el hecho de que la mitad del intervalo deseashydo d se puede igualar al producto del coeficiente de confiabilidad y el error estandar

Si se supone que el muestreo ha sido hecho de manera aleatoria y que existen condiciones que garanticen que la distribuci6n de psea aproximadamente normal se obtiene la siguiente formula para n cuando el muestreo es con reemplazo cuanshydo se realizaa partir de una poblacion infinita 0 ruando la poblacion muestreada es 10 suficientemente grande como para hacer innecesario el uso de la correcci6n por poblacion finita

n (681)

dondeq = I-p Si la correccion por poblacion finita no puede descartarse la formula adecuashy

da paran es

(682)n d 2 (N -1)+z2pq

euan do N es grande en comparacion con n (es decir n IN 05) se puede pasar por alto la correccion por poblacion finita y la ecuacion 682 se reduce a la ecuacion 681

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

EJERCICIOS 175

Grupo Media Desviaci6n estandar

Participantes (A) 214444 15392 No participantes (B) 33333 14595

644 El doctor Ali Khraibi (A-IO) de la CHnica y Fundaci6n Mayo condujo una serie de experishymentos con el fin de evaluar las respuestas diureticas y natiureticas de ratas Okamoto esponshytaneamente hipertensivas (REB) y ratas Wistar-Kyoto (WRY) para dirigir incrementos en la presion hidrostatica renal intersticial (PBRI) Para aumentar la PBRI se utiIiz6 la expansi6n directa del volumen renal intersticial (DRIVE) a traves de una matriz implantada cronicamente en el rinOn Entre los datos registrados durante el estudio estan las siguientes mediciones de excreci6n de sodio a traves de la orina (UNa V) durante el periodo de DRIVE

Grupo

REB 632572796483527 2WKY 420469482 108210

FUENTE Publicada con autorizaci6n del Dr Ali A Khraibi

645 Osberg y Di Scala (A-II) realizaron un estudio centrado en la eficacia de los cinturones de seguridad para reducir 1esiones entre sobrevivientes de accidentes automoviHsticos internashydos en hospitales con edades de 4 a 14 afios El estudio compar610s resultados de 123 ninos que utilizaron el cintur6n contra 290 que no 10 utilizaron entre aquellos que se vieton enshyvueltos en tales accidentes y que fueron hospitalizados El informe con tenia la siguiente estadistica del numero de dfas en la unidad de cuidados intensivos

Grupo Media Error estandar estimado

Utiliz6 el cintur6n 83 16 No utiliz6 el cintur6n 139 18

646 La medicion del diametro transversal del coraz6n de hombres y mujeres adultos presenta los siguientes resultados

sx Grupo Tamafto de Ia muestra (cm) (cm)

Varones 12 1321 105 Mujeres 9 IIOO 101

Considere que las poblaciones siguen una distribucion normal con variancias iguales

176 CAPITULO 6 ESTIMACION

647 Veintiruatro animales de laboratorio con deficiencia de vitamina D fueron divididos en dos grupos iguales EI grupo 1 recibi6 un tratamiento consistente en una dieta que proporcionashyba vitamina D EI segundo grupo no fue tratado AI termino del periodo experimental se midieron las concentraciones de calcio ensuero obteniendose los siguientes resultados

Grupo tratado X 111 mg 100 mls = 15 Grupo sin tratamiento x= 78 mg 100 ml s = 20

Considere que las poblaciones siguen una distribuci6n normal con variancias iguales

648 Ados grupos de nifios se les hicieron pruebas de agudeza vi~ual El grupo 1 estuvo formado por 11 nifios que recibieron la atenci6n de medicos privados La calificaci6n media para este grupo fue de 26 con una desviaci6n estandar de 5 El segundogrupo que incluy6 14 nifios que recibieron atenci6n medica por parte del departamento de salud publica tuvo una calishyficaci6n promedio de 21 con una desviaci6n estandar de 6 Suponga que las poblaciones siguen una distribuci6n normal con variancias iguales

649 El tiempo promedio de estancia de una muestra de 20 pacientes dados de alta de un hospital general es de siete dras con una desviaci6n estaildar de dos dras Una muestra de 24 padenshytes dados de alta de un hospital de enfermedades cr6nicas tuvo un tiempo promedio de estancia de 36 dfas con una desviaci6n estindar de 10 dias Suponga que la poblaci6n sigue una distribuci6n normal con variancias desiguales

6410 En un estudio de factores que se consideran responsables de los efectos adversos del tabashyquismo sobre la reproducci6n humana se midieron los niveles de cadmio (nanogramos por gramo) en el tejido de la placenta de una muestra de 14 madres que fumaban y una muestra aleatoria independiente de 18 mujeres no fumadoras Los resultados fueron los siguientes

No fumadoras toO 84 128250 118 98 125 154 235

94251 1952559875 118122150

Fumadoras 300301150241305178168148

134285 175 144 125204

ms probable que el nivel medio de cadmio registrado sea mayor entre las fumadoras que entre las no fumadoras ~Por que se llegarfa a esta conclusi6n

65 INTERVALO DE CONFIANZA PARA IA PROPORCION DE UNA POBIACION

Muchas preguntas de interes para que el tecnico en salud tienen relacion con las proporciones de poblacion ~Que propordon de padentes que redben un tipo espeshycial de tratamiento se recuperan ~Que proporcion de alguna poblacion tiene cierta enfermedad ~Que propordon de una poblacion es inmune a derta enfermedad

Para estimar la proporcion de una poblacion se procede en la misma forma que cuando se estima la media de una poblacion Se extrae una muestra de la poblacion de interes y se calcula su proporcion p Esta se utiliza como el estimador puntual para la proporcion de la pobladon Un intervalo de confianza se obtiene mediante la siguiente formula general

estimador plusmn (coefidente de confiabilidad) X (error estandar)

EJERCICIOS

EJERCICIOS 177

En el capitulo anterior se vio que cuando np y n(1 - p) son mayores que 5 se puede considerar que la distribuci6n muestral de pse aproxima bastante a una distribuci6n normal Cuando se cumple con esta condici6n el coeficiente de confiabilidad es algUn valor de z de la distribuci6n normal estandar Esta visto que el error estandar es igual a (J p =fi(l-p) n Puesto que p que es el parametro que se trata de calcular se desconoce se debe utilizar pcomo una estimaci6n Asf se estima (J j por medio de ~p(l Pn y el intervalo de confianza de 100(1 - 0) por ciento para pesta dado por

pplusmn Z(I-1J2)~P(l- P) Fn (651)

Este intervalo se interpreta tanto desde el punto de vista practico como probabilistico

FJEMPLO 651

Mathers et al (A-12) encontraron queen una muestra de 591 pacientes internados en un hospital psiquiatrico 204 admitieron que consuniieron marihuana al meshynos una vez durante su vida Se pretende construir un intervalo de confianza de 95 por ciento para la proporcion de individuos que consumieron marihuana durante su vida en la poblaci6n muestreada de los internos del hospital psiquiatrico

Solucion La mejor estima~i6n puntual para la proporci6Il de la poblaci6nes p== 204591 3452 El tamafio de la muestra y hiestimacion de p tienen una magnitud suficiente parajustifKar el empleo de la distribucion norshymal estandar paraelaborar un intervalo de confianza EI coeficiente de corifiabilidad que corresponde alnivel de confianza de 95 es 196 la estimacion del errorestandar (Jp es ~p(l-pgtn = (3452)(6548)591

0 1956El intervalo de confianza para p de acuerdo con estos datos es

3452 plusmn 196(01956) 3452 plusmn 0383 3069 3835

Se puede decir que se tiene 95 por ciento de confianza de que la proporshycionpeste entre 3069 y 3835 ya que al repetir el muestreo casi 95 por ciento de los intervalos construidos en la forma de este intervalo inclushyyen a la proporcion p real Con base en estos resultados se espera con una confianza de 95 por ciento encontrar que entre 3069 y 3835 por ciento de los internados en el hospital psiquiatrico tiene antecedentes de consumo de marihuana bull

Para cada uno de los siguientes ejercicios establezca la interpretacion prictica yprobabilistica de los intervalos que se pide construir Identifique cada componente del intervalo la estimashycion puntual el coeficiente de confiabilidad yel error estandar Explique por que los coefishycientes de confiabilidad no son los misInos para todos los ejercicios

178 CAPITULO 6 ESTIIlACI6N

651 En una investigaci6nde ninos maltratados en pacientes psiquiatricos Brown y Anderson (A-IS) encontraron 166 pacientes en una muestra de 947 con antecedentes de abuso sexual y maltrato flsico Construya un intervalo de confianza de 90 por dento para la proporci6n de la poblaci6n

652 Catania et at (A-14) obtuvieron datos respecto al comportamiento sexual de una muestra de hombres y mujeres solteros con edades entre 20 y 44 residentes en areas geoijfaficas caracshyterizadas por tasas altas de enfermedades de transmision sexual e ingreso a programas de drogas De 1229 encuestados 50 por ciento respondieron que nunca utilizaron preservatishyvos Construya un intervalo de confianza de 95 por ciento para la proporcion de la poblaci6n que nunca utiliza preservativos

653 Rothberg y Lits (A-I 5 ) estudiaron el efecto del estres de la maternidad durante el embarazo en el peso del producto Los individuos eran 86 mujeres blancas con antecedentes de estres que no tenfan faetores de riesgo medico u obstetrico conoddo de peso bajo del producto Los investigadores eneontraron que 128 por dento de las madres estudiadas dieron a luz bebes que cubrfan el criterio de peso bajo Construya un intervalo de confianza de 99 por ciento para la proporci6n de la poblaci6n

654 En una muestra aleatoria simple de 125 varones desempleados quienes desertaron de la escuela preparatoria entre las edades de 16 y 21 anos inclusive 88 declararon que eran consumidores regulares de bebidas alcoh6litas Construya un intervalo de eonfianza de 95 por ciento para la proporcion de la poblacion

66 INTERVALO DE CONFIANZA PARA lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS POBlACIONES

A menudo se tiene interes en conocer la magnitud de la diferencia entre las proporcioshynes de dospoblaciones Es posible que se quiera comparar por ejemplo entre hombres y mujeres dos grupos de edades dos grupos socioecon6micos 0 dos grupos de diagshynostico con respecto a la proporcion que posee alguna caractenstica de interes Un estimador puntual insesgado de la diferencia entre dos proporciones de las poblacioshynes se obtieneal calcular la diferencia de las proporciones de las muestras PI P2 Tal como Se ha visto cuando n1 Yn2 son de gran tamano y las proporciones de la poblacion no estan muy cerca de 0 0 de 1 es posible aplicar el teorema del limite central y utilizar la teona de la distribucion normal para obtener los intervalos de conshyfianza EI error estandar de la estimacion se calcula mediante la siguiente formula

dado que como regIa se desconocen las proporciones de Ia poblacion Un intervashy10 de confianza de 100(1 - a) por ciento para PI P2 se obtiene as

(661)

Es posible interpretar este intervalo desde elpunto de vista probabiHstico y practico

EJERCICIOS 179

EJEMPLO 661

Borst et al (A-16) investigaron la relaci6n de desarrollo del ego edad sexo y diagshyn6stico de suicidio entre los internos adolescentes de la unidad de psiquiatria La muestra consistia en 96 varones y 123 niiias con edades entre 12 y 16 aiios seleccioshynados de entre los internados en la unidad de adolescentes y niiios de un hospital psiquiatrico privado Se reportaron 18 niiios y 60 niiias con intento de suicidio Cons ishyderese el comportamiento de las niiias como el de una muestra aleatoria simple a partir de una poblaci6n similar de niiias y que los j6venes igualmente pueden considerarse como una muestra aleatoria simple extraida de una poblaci6n similar de niiios Para estas dos poblaciones se pretende construir un intervalo de confianshyza de 99 por ciento para la diferencia entre las proporciones de los individuos con intento de suicidio

Soluci6n Las proporciones para las niiias y niiios respectivamente son Pc = 601 123 = A878y PB = 1896 1875 La diferencia entre las proporciones de lasmuestrases Pc PB = 4878 1875 = 3003 El error estandar estimado de la diferenda entre las proporciones de las muestras es

(4878)(5122) (1875)(8125) ---~~-~ +-------shy

123 96

El factor de confiabilidad a partir de la tabla D es 258 de modo que el intervalo de confianza con la f6rmula 661 es

3003 plusmn 258(0602) 14504556

Se dene la confianza de 99 por dento de que para las poblaciones muestteadas la ptopord6n de intentos de suiddio entre las niiias exceshyde a lapropord6n de intentosde suiddio entre los varones por 1450 y 4556

Puesto que el intervalo no incluye al cero se concluye que las dos proporciones de pobladones son diferentes bull

FJERCICIOS

Para cada uno de los siguientes ejercicios establezca las interpretaciones pnicticas y probabishylisticas de los intervalos que se pide construir Identifique cada componente del intervalo la estimaci6n puntual el coeficiente de confiabilidad y el error estandar Explique por que los coeficientes de confiabilidad no son el mismo para todos los ejercicios

661 Hargers et al (A-17) del departamento de Salud PUblica y Ambieptal en Amsterdam condushyjeron un estudio en el que los individuos eran consumidores de drogasinyectables (CDI) En una muestrade 194 consumidores de metadona regular de largo plazo (MLP) 145 eran varones En una muestra de 189 CDIque no consmiddotumian MLP 133 eran varones Establezca las consideraciones necesarias acerca de las muestras ypoblaciones representadas y construshy

180 CAPITULO 6 ESTlMACI6N

ya un intervalo de confianza de 95 por ciemo para la diferenda entre las proporciones de varones en las dos poblaciones

662 Una investigaci6n de Lane et ai (A-I8) valor6las diferencias en las pnicticas de deteccion de cancer de seno entre muestras de mujeres predominantemente de bajos ingresos con edashydes de 50 a 75 anos que lltilizan los servicios de c1inicas de sailld para todo el estado y mlljeres de la misma edad residentes en ciudades donde las c1inicas de salud son locales De las 404 encuestadas seleccionadas en toda la comunidad 592 por ciento estuvo de acuerdo con el siguiente comentario acerca del cancer de pecho las mujeres prolongan su vida si detectan el cancer desde el inicio De entre 795 usuarias de clinicas de salud en la mllestra 449 por ciento estuvo de acuerdo Establezca las suposiciones apropiadas para elaborar un intervalo de confianzade 99 por ciento para la diferencia entre las dos proporciones de las poblaciones de interes

663 Williams et at (A-19) encuestaron a una muestra de 67 medicos y 133 enfermeras con famishyliares farmacodependientes EI prop6sito del estudio era evaluar la influencia en los medishyEOS y enfermeras de estar estrechamente involucrados con una 0 mas personas farmaco dependientes Cincuenta y dos medicos y 89 enfermeras dijeron que vivian con personas farmacoldependientes que adversamente afectaban 8U trabajo E8tablezca todas las consideshyraciones que crea necesarias para construir un intervalo de confianza de 95 por ciento para la diferencia entre las proporciones en las dos poblaciones de trabajadores que se espera esten adversamente afectados por vivir con personas farmacodependientes

664 Aronow y Kronzon (A-20) identificaron los factores de riesgo coronado entre hombres y mujeres en una dinica de cuidados de la salud a largo plazo De los 215 individuos negros 58 tienen diabetes mellitus al igual que 217 individuos blancos de 1140 Elabore un intervalo de confianza de 90 por ciento de confianzapara la diferencia entre las proporciones de las dos poblaciones tCuaies son las poblaciones correspondientes ~Que consideraciones son necesarias para hacer valido el procedimiento de inferencia

67 DETEHMINAUON DEL TAMANO DE LA MUESTRA PARA LA ESTIMACIONDEIAS MEDIAS

La pregunta de que tan grande debe ser una muestra surge inmediatamente al inicio del planteamiento de cualquier encuesta 0 experimento Esta es una pregunshyta importante y no se debe tratara la ligera Tomar una muestra mas grande de 10 necesario para obtener los resultados deseados es un desperdicio de recursos mienshytras que por otro lado las muestras demasiado pequenas con frecuencia dan resulshytados que carecen de uso practico En esta secci6n se estudia c6mo determinar el tamano de la muestra de acuerdo con la situaci6n A continuaci6n se proporciona un metodo para determinar el tamano de la muestra que se requiere para estimar Ia media de la poblaci6n yen la siguiente secci6n se aplica este metodo para detershyminar el tamano de la milestra cuando se desea estimar la proporci6n de una poshyblaci6n Mediante extensiltmes directas de estos metodos es posible determinar el tamano necesario de las muestras para situaciones mas complicadas

Objetivos El objetivo de la estimaci6n porintervalos es el de obtener intervalos estrechos con alta confiabilidad Si se observan los componentes ~e un intervalo de confianzase veque 8U dimension esta determinada por la magnitud de la cantidad

(coeficiente de confiabilidad) x (error estandar)

131 67 DETERMINACION DEL TAMANO PARA LA l-IUESTRAmiddot

ya que lamagnitud total del intervalo de confIanza es eldoble de esta cantidad Se aprendi6 que a esta cantidad generalmente se Ie llama precisi6n de la estimaci6n o margen de error Para un error estandar dado incrementar la confIabilidad signishyfIca un coefIciente con mayor confIabilidad Y un coefIciente con mayor confIabilidad produce unintervalo mas amplio

Por otra parte si se ftia el coefIciente de confIabilidad la unica manera de redudr la amplitud del intervalo es la reducci6n del error estandar Dado que el error estandar es igual a (J IJ y como (J es una constante la unica forma de obtener un error estandar menor es tomar una muestra grande ~Que tan grande debeser la muestra Esto depende del tamafio de (J la desviad6n estandar de la poblaci6n asi como del grado de confIabilidad y dimensi6n del intervalo deseados

Suponga que se desea obtener un intervalo que se extienda d unidades hacia uno y otro lado del estimador Ellose enuncia

d (coefIciente de confIabilidad) X (error estandar) (671)

Si el muestreo es con reemplazos a partir de una poblaci6n infInita 0 de una que sea 10 sufIcientemente grande como para ignorar la correcci6n por poblaci6n fInita la ecuaci6n 671 se transforma en

(J

d z- (672)-r la cual cuando se despeja n nos da

(673)d2

Cuando el nmestreo se hacesin reemplazos a partir de una poblaci6n fInita y peshyquefia se requiere de la correcci6n por poblaci6n fInita y la ecuaci6n 671 se transforma en

(J~d (674)fN~

que al despejar n resulta en

n-----shy (675)d 2(N 1) + Z2(J2

Si puede omitirse la correcci6n por poblad6n fInita la ecuaci6n 675 se reshyduce a la ecuaci6n 673

Estillluci6n de (J 2 Las f6rmulas para el tamafio de la muestra requieren del conocimiento de (J2 pero como ya se ha sefialado la varian cia de la poblaci6n casi

132 CAPITULO 6 ESTlMACION

siempre sedesconoce Como resultado esnecesarioestimar (J2 Las fuentes de estishymaci6n de(J2 que se utilizan con mas frecuencia son las siguientes

1 Se extrae una muestrapilato 0 prel~l11inar de lapoblaci6n y se puede utilizar la variancia calculada a partir de esta muestra como unaestimaci6n de (J2 Las observaciones uti lizadas en la muestra piloto se toman como parte de la muesshytrafinal de modo que n (el tamaiio calculado de la muestra) n

1 (el tamaiio

de la muestra piloto) n2 (el numero de observaciones necesarias para satisfacer el requerimiento total del tamaiio de la muestra)

2 A partir de estudios anteriores osimilares es posible obtener estimaciones de (J2

3Si se cree que la poblaci6n de lacual se extrae la muestraposee una distribushyci6n aproximadamente nqrmal se puede aprovechar el hecho de que la amshyplitud es aproximadamente igual a 6 desviaciones estandar y calcular (J R6 Este metodo requiere aIglin conocimiento acerca de los valores minimo y maximo de la variable en la poblaci6n

EJEMPLO 671

Un nutri6logo del departamento de salud al efectuar una encuesta entre una poshyblacien de muchachas adolescentes con e1 fin de determinitr su ingesti6n diaria promedio de proteinas (medidas en gramos) busc6 el consejo de un bioestadistico con respecto al tamaiio de la muestra que deberfa tomar

~Que procedimiento debe seguir el bioestadistico para asesorar al nutri610go Antes de que el estadistico pueda ayudar el nutri6logo este debe proporcionar tres elementos de informaci6n h dimensi6n deseada del intervalo de confianza el nivel de confianza deseado y la magnitud de la variancia de la poblaci6n

Soludon Suponga que el nutri6logo requiere un intervalo con una dimensi6n de aprQximadamente 10 gramos es decir la estimaci6n se deberfa enconshytrar alrededor de 5 gramos de la media de la poblaci6n en ambas direcshyciones En otras palabras se desea un margen de error de 5 gramos Suponga que se decide por un coeficiente de confian7a de 95 y que con base en su experiencia previa el nutri6logo percibe que la desviaci6n estandar de la poblaci6n es probablemente de alrededor de 20 gramos EI estadfstico dispone ya de la informaci6n necesaria para calcular el tamaiio de la muestra z 196 (J = 20 y d 5 Suponga que el tamaiio de la poblaci6n es grande asf queel estadistico puede ignorar la correcshyci6n por poblaci6n finita y utilizar la ecuaci6n 673 Con las sustitucioshynes adecuadas el valor de n se calcula como

Se recomienda que el nutri610go tome una muestra de tamafio 62 AI calcular el tamaiio de una muestra a partir de las ecuaciones 673 0 675 el resultado se redondea al siguiente nurnero entero mayor si los calculosdan un numerocon decimales bull

183 68 DETERMINACION DEL TAl1ANO PARA LAS PROPORCIONES

EJERCICIOS

671 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su hospital Si se desea un intervalo de confianza de 99 por dento con una amplitud de 1 libra ~que tan grande debe ser la muestra de los registros de nacimiento Suponga que un estimashy

dor razonable para (J es 1 libra ~De que tamano debe ser la muestra si el coeficiente de confiabilidad se hace descender a 95

672 El director de la secdon de control dela rabia del departamento de salud publica desea extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso del ano anterior para estimar la edad media de las personas mordidas Requiere un intervalo de confianza de 95 por dento decide utilizar un valor de 25 para d y a partir de estudios anteriores estima que la desviacion estandar de la poblacion esta alrededor de los 15 anos ~Que tan grande debe ser el tamano de la muestra

673 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mglOO ml) de pacientes atendidos en una clinica para diabeticos durante el transcurso de los ultimos 10 anos Determine el numero de registros que el medico debe examinar para obtener un intershyvalo de confianza de 90 por ciento para 11 si la dimension requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varian cia de 60

674 Se deseaestimar la edad media en la que a los padentes de esclerosis multiple se les diagnosshytico el padecimiento por primera vez Se requiere un intervalo de confianza de 95 por dento con una dimension de 10 anos Si la variancia de la poblaci6n es de 90 ~que tan grande debera ser la muestra

68 DETERMINACION DELTAMANO DE lA MUESTRA PARA lA ESIDIACION DE lAS PROPORCIONES

EI metodo para estimar el tamafio de la muestra cuando se requiere estimar la proshyporcion de una poblacion es esencialmente el mismo que se describio para estimar la media de una poblacion Se aprovecha el hecho de que la mitad del intervalo deseashydo d se puede igualar al producto del coeficiente de confiabilidad y el error estandar

Si se supone que el muestreo ha sido hecho de manera aleatoria y que existen condiciones que garanticen que la distribuci6n de psea aproximadamente normal se obtiene la siguiente formula para n cuando el muestreo es con reemplazo cuanshydo se realizaa partir de una poblacion infinita 0 ruando la poblacion muestreada es 10 suficientemente grande como para hacer innecesario el uso de la correcci6n por poblacion finita

n (681)

dondeq = I-p Si la correccion por poblacion finita no puede descartarse la formula adecuashy

da paran es

(682)n d 2 (N -1)+z2pq

euan do N es grande en comparacion con n (es decir n IN 05) se puede pasar por alto la correccion por poblacion finita y la ecuacion 682 se reduce a la ecuacion 681

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

176 CAPITULO 6 ESTIMACION

647 Veintiruatro animales de laboratorio con deficiencia de vitamina D fueron divididos en dos grupos iguales EI grupo 1 recibi6 un tratamiento consistente en una dieta que proporcionashyba vitamina D EI segundo grupo no fue tratado AI termino del periodo experimental se midieron las concentraciones de calcio ensuero obteniendose los siguientes resultados

Grupo tratado X 111 mg 100 mls = 15 Grupo sin tratamiento x= 78 mg 100 ml s = 20

Considere que las poblaciones siguen una distribuci6n normal con variancias iguales

648 Ados grupos de nifios se les hicieron pruebas de agudeza vi~ual El grupo 1 estuvo formado por 11 nifios que recibieron la atenci6n de medicos privados La calificaci6n media para este grupo fue de 26 con una desviaci6n estandar de 5 El segundogrupo que incluy6 14 nifios que recibieron atenci6n medica por parte del departamento de salud publica tuvo una calishyficaci6n promedio de 21 con una desviaci6n estandar de 6 Suponga que las poblaciones siguen una distribuci6n normal con variancias iguales

649 El tiempo promedio de estancia de una muestra de 20 pacientes dados de alta de un hospital general es de siete dras con una desviaci6n estaildar de dos dras Una muestra de 24 padenshytes dados de alta de un hospital de enfermedades cr6nicas tuvo un tiempo promedio de estancia de 36 dfas con una desviaci6n estindar de 10 dias Suponga que la poblaci6n sigue una distribuci6n normal con variancias desiguales

6410 En un estudio de factores que se consideran responsables de los efectos adversos del tabashyquismo sobre la reproducci6n humana se midieron los niveles de cadmio (nanogramos por gramo) en el tejido de la placenta de una muestra de 14 madres que fumaban y una muestra aleatoria independiente de 18 mujeres no fumadoras Los resultados fueron los siguientes

No fumadoras toO 84 128250 118 98 125 154 235

94251 1952559875 118122150

Fumadoras 300301150241305178168148

134285 175 144 125204

ms probable que el nivel medio de cadmio registrado sea mayor entre las fumadoras que entre las no fumadoras ~Por que se llegarfa a esta conclusi6n

65 INTERVALO DE CONFIANZA PARA IA PROPORCION DE UNA POBIACION

Muchas preguntas de interes para que el tecnico en salud tienen relacion con las proporciones de poblacion ~Que propordon de padentes que redben un tipo espeshycial de tratamiento se recuperan ~Que proporcion de alguna poblacion tiene cierta enfermedad ~Que propordon de una poblacion es inmune a derta enfermedad

Para estimar la proporcion de una poblacion se procede en la misma forma que cuando se estima la media de una poblacion Se extrae una muestra de la poblacion de interes y se calcula su proporcion p Esta se utiliza como el estimador puntual para la proporcion de la pobladon Un intervalo de confianza se obtiene mediante la siguiente formula general

estimador plusmn (coefidente de confiabilidad) X (error estandar)

EJERCICIOS

EJERCICIOS 177

En el capitulo anterior se vio que cuando np y n(1 - p) son mayores que 5 se puede considerar que la distribuci6n muestral de pse aproxima bastante a una distribuci6n normal Cuando se cumple con esta condici6n el coeficiente de confiabilidad es algUn valor de z de la distribuci6n normal estandar Esta visto que el error estandar es igual a (J p =fi(l-p) n Puesto que p que es el parametro que se trata de calcular se desconoce se debe utilizar pcomo una estimaci6n Asf se estima (J j por medio de ~p(l Pn y el intervalo de confianza de 100(1 - 0) por ciento para pesta dado por

pplusmn Z(I-1J2)~P(l- P) Fn (651)

Este intervalo se interpreta tanto desde el punto de vista practico como probabilistico

FJEMPLO 651

Mathers et al (A-12) encontraron queen una muestra de 591 pacientes internados en un hospital psiquiatrico 204 admitieron que consuniieron marihuana al meshynos una vez durante su vida Se pretende construir un intervalo de confianza de 95 por ciento para la proporcion de individuos que consumieron marihuana durante su vida en la poblaci6n muestreada de los internos del hospital psiquiatrico

Solucion La mejor estima~i6n puntual para la proporci6Il de la poblaci6nes p== 204591 3452 El tamafio de la muestra y hiestimacion de p tienen una magnitud suficiente parajustifKar el empleo de la distribucion norshymal estandar paraelaborar un intervalo de confianza EI coeficiente de corifiabilidad que corresponde alnivel de confianza de 95 es 196 la estimacion del errorestandar (Jp es ~p(l-pgtn = (3452)(6548)591

0 1956El intervalo de confianza para p de acuerdo con estos datos es

3452 plusmn 196(01956) 3452 plusmn 0383 3069 3835

Se puede decir que se tiene 95 por ciento de confianza de que la proporshycionpeste entre 3069 y 3835 ya que al repetir el muestreo casi 95 por ciento de los intervalos construidos en la forma de este intervalo inclushyyen a la proporcion p real Con base en estos resultados se espera con una confianza de 95 por ciento encontrar que entre 3069 y 3835 por ciento de los internados en el hospital psiquiatrico tiene antecedentes de consumo de marihuana bull

Para cada uno de los siguientes ejercicios establezca la interpretacion prictica yprobabilistica de los intervalos que se pide construir Identifique cada componente del intervalo la estimashycion puntual el coeficiente de confiabilidad yel error estandar Explique por que los coefishycientes de confiabilidad no son los misInos para todos los ejercicios

178 CAPITULO 6 ESTIIlACI6N

651 En una investigaci6nde ninos maltratados en pacientes psiquiatricos Brown y Anderson (A-IS) encontraron 166 pacientes en una muestra de 947 con antecedentes de abuso sexual y maltrato flsico Construya un intervalo de confianza de 90 por dento para la proporci6n de la poblaci6n

652 Catania et at (A-14) obtuvieron datos respecto al comportamiento sexual de una muestra de hombres y mujeres solteros con edades entre 20 y 44 residentes en areas geoijfaficas caracshyterizadas por tasas altas de enfermedades de transmision sexual e ingreso a programas de drogas De 1229 encuestados 50 por ciento respondieron que nunca utilizaron preservatishyvos Construya un intervalo de confianza de 95 por ciento para la proporcion de la poblaci6n que nunca utiliza preservativos

653 Rothberg y Lits (A-I 5 ) estudiaron el efecto del estres de la maternidad durante el embarazo en el peso del producto Los individuos eran 86 mujeres blancas con antecedentes de estres que no tenfan faetores de riesgo medico u obstetrico conoddo de peso bajo del producto Los investigadores eneontraron que 128 por dento de las madres estudiadas dieron a luz bebes que cubrfan el criterio de peso bajo Construya un intervalo de confianza de 99 por ciento para la proporci6n de la poblaci6n

654 En una muestra aleatoria simple de 125 varones desempleados quienes desertaron de la escuela preparatoria entre las edades de 16 y 21 anos inclusive 88 declararon que eran consumidores regulares de bebidas alcoh6litas Construya un intervalo de eonfianza de 95 por ciento para la proporcion de la poblacion

66 INTERVALO DE CONFIANZA PARA lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS POBlACIONES

A menudo se tiene interes en conocer la magnitud de la diferencia entre las proporcioshynes de dospoblaciones Es posible que se quiera comparar por ejemplo entre hombres y mujeres dos grupos de edades dos grupos socioecon6micos 0 dos grupos de diagshynostico con respecto a la proporcion que posee alguna caractenstica de interes Un estimador puntual insesgado de la diferencia entre dos proporciones de las poblacioshynes se obtieneal calcular la diferencia de las proporciones de las muestras PI P2 Tal como Se ha visto cuando n1 Yn2 son de gran tamano y las proporciones de la poblacion no estan muy cerca de 0 0 de 1 es posible aplicar el teorema del limite central y utilizar la teona de la distribucion normal para obtener los intervalos de conshyfianza EI error estandar de la estimacion se calcula mediante la siguiente formula

dado que como regIa se desconocen las proporciones de Ia poblacion Un intervashy10 de confianza de 100(1 - a) por ciento para PI P2 se obtiene as

(661)

Es posible interpretar este intervalo desde elpunto de vista probabiHstico y practico

EJERCICIOS 179

EJEMPLO 661

Borst et al (A-16) investigaron la relaci6n de desarrollo del ego edad sexo y diagshyn6stico de suicidio entre los internos adolescentes de la unidad de psiquiatria La muestra consistia en 96 varones y 123 niiias con edades entre 12 y 16 aiios seleccioshynados de entre los internados en la unidad de adolescentes y niiios de un hospital psiquiatrico privado Se reportaron 18 niiios y 60 niiias con intento de suicidio Cons ishyderese el comportamiento de las niiias como el de una muestra aleatoria simple a partir de una poblaci6n similar de niiias y que los j6venes igualmente pueden considerarse como una muestra aleatoria simple extraida de una poblaci6n similar de niiios Para estas dos poblaciones se pretende construir un intervalo de confianshyza de 99 por ciento para la diferencia entre las proporciones de los individuos con intento de suicidio

Soluci6n Las proporciones para las niiias y niiios respectivamente son Pc = 601 123 = A878y PB = 1896 1875 La diferencia entre las proporciones de lasmuestrases Pc PB = 4878 1875 = 3003 El error estandar estimado de la diferenda entre las proporciones de las muestras es

(4878)(5122) (1875)(8125) ---~~-~ +-------shy

123 96

El factor de confiabilidad a partir de la tabla D es 258 de modo que el intervalo de confianza con la f6rmula 661 es

3003 plusmn 258(0602) 14504556

Se dene la confianza de 99 por dento de que para las poblaciones muestteadas la ptopord6n de intentos de suiddio entre las niiias exceshyde a lapropord6n de intentosde suiddio entre los varones por 1450 y 4556

Puesto que el intervalo no incluye al cero se concluye que las dos proporciones de pobladones son diferentes bull

FJERCICIOS

Para cada uno de los siguientes ejercicios establezca las interpretaciones pnicticas y probabishylisticas de los intervalos que se pide construir Identifique cada componente del intervalo la estimaci6n puntual el coeficiente de confiabilidad y el error estandar Explique por que los coeficientes de confiabilidad no son el mismo para todos los ejercicios

661 Hargers et al (A-17) del departamento de Salud PUblica y Ambieptal en Amsterdam condushyjeron un estudio en el que los individuos eran consumidores de drogasinyectables (CDI) En una muestrade 194 consumidores de metadona regular de largo plazo (MLP) 145 eran varones En una muestra de 189 CDIque no consmiddotumian MLP 133 eran varones Establezca las consideraciones necesarias acerca de las muestras ypoblaciones representadas y construshy

180 CAPITULO 6 ESTlMACI6N

ya un intervalo de confianza de 95 por ciemo para la diferenda entre las proporciones de varones en las dos poblaciones

662 Una investigaci6n de Lane et ai (A-I8) valor6las diferencias en las pnicticas de deteccion de cancer de seno entre muestras de mujeres predominantemente de bajos ingresos con edashydes de 50 a 75 anos que lltilizan los servicios de c1inicas de sailld para todo el estado y mlljeres de la misma edad residentes en ciudades donde las c1inicas de salud son locales De las 404 encuestadas seleccionadas en toda la comunidad 592 por ciento estuvo de acuerdo con el siguiente comentario acerca del cancer de pecho las mujeres prolongan su vida si detectan el cancer desde el inicio De entre 795 usuarias de clinicas de salud en la mllestra 449 por ciento estuvo de acuerdo Establezca las suposiciones apropiadas para elaborar un intervalo de confianzade 99 por ciento para la diferencia entre las dos proporciones de las poblaciones de interes

663 Williams et at (A-19) encuestaron a una muestra de 67 medicos y 133 enfermeras con famishyliares farmacodependientes EI prop6sito del estudio era evaluar la influencia en los medishyEOS y enfermeras de estar estrechamente involucrados con una 0 mas personas farmaco dependientes Cincuenta y dos medicos y 89 enfermeras dijeron que vivian con personas farmacoldependientes que adversamente afectaban 8U trabajo E8tablezca todas las consideshyraciones que crea necesarias para construir un intervalo de confianza de 95 por ciento para la diferencia entre las proporciones en las dos poblaciones de trabajadores que se espera esten adversamente afectados por vivir con personas farmacodependientes

664 Aronow y Kronzon (A-20) identificaron los factores de riesgo coronado entre hombres y mujeres en una dinica de cuidados de la salud a largo plazo De los 215 individuos negros 58 tienen diabetes mellitus al igual que 217 individuos blancos de 1140 Elabore un intervalo de confianza de 90 por ciento de confianzapara la diferencia entre las proporciones de las dos poblaciones tCuaies son las poblaciones correspondientes ~Que consideraciones son necesarias para hacer valido el procedimiento de inferencia

67 DETEHMINAUON DEL TAMANO DE LA MUESTRA PARA LA ESTIMACIONDEIAS MEDIAS

La pregunta de que tan grande debe ser una muestra surge inmediatamente al inicio del planteamiento de cualquier encuesta 0 experimento Esta es una pregunshyta importante y no se debe tratara la ligera Tomar una muestra mas grande de 10 necesario para obtener los resultados deseados es un desperdicio de recursos mienshytras que por otro lado las muestras demasiado pequenas con frecuencia dan resulshytados que carecen de uso practico En esta secci6n se estudia c6mo determinar el tamano de la muestra de acuerdo con la situaci6n A continuaci6n se proporciona un metodo para determinar el tamano de la muestra que se requiere para estimar Ia media de la poblaci6n yen la siguiente secci6n se aplica este metodo para detershyminar el tamano de la milestra cuando se desea estimar la proporci6n de una poshyblaci6n Mediante extensiltmes directas de estos metodos es posible determinar el tamano necesario de las muestras para situaciones mas complicadas

Objetivos El objetivo de la estimaci6n porintervalos es el de obtener intervalos estrechos con alta confiabilidad Si se observan los componentes ~e un intervalo de confianzase veque 8U dimension esta determinada por la magnitud de la cantidad

(coeficiente de confiabilidad) x (error estandar)

131 67 DETERMINACION DEL TAMANO PARA LA l-IUESTRAmiddot

ya que lamagnitud total del intervalo de confIanza es eldoble de esta cantidad Se aprendi6 que a esta cantidad generalmente se Ie llama precisi6n de la estimaci6n o margen de error Para un error estandar dado incrementar la confIabilidad signishyfIca un coefIciente con mayor confIabilidad Y un coefIciente con mayor confIabilidad produce unintervalo mas amplio

Por otra parte si se ftia el coefIciente de confIabilidad la unica manera de redudr la amplitud del intervalo es la reducci6n del error estandar Dado que el error estandar es igual a (J IJ y como (J es una constante la unica forma de obtener un error estandar menor es tomar una muestra grande ~Que tan grande debeser la muestra Esto depende del tamafio de (J la desviad6n estandar de la poblaci6n asi como del grado de confIabilidad y dimensi6n del intervalo deseados

Suponga que se desea obtener un intervalo que se extienda d unidades hacia uno y otro lado del estimador Ellose enuncia

d (coefIciente de confIabilidad) X (error estandar) (671)

Si el muestreo es con reemplazos a partir de una poblaci6n infInita 0 de una que sea 10 sufIcientemente grande como para ignorar la correcci6n por poblaci6n fInita la ecuaci6n 671 se transforma en

(J

d z- (672)-r la cual cuando se despeja n nos da

(673)d2

Cuando el nmestreo se hacesin reemplazos a partir de una poblaci6n fInita y peshyquefia se requiere de la correcci6n por poblaci6n fInita y la ecuaci6n 671 se transforma en

(J~d (674)fN~

que al despejar n resulta en

n-----shy (675)d 2(N 1) + Z2(J2

Si puede omitirse la correcci6n por poblad6n fInita la ecuaci6n 675 se reshyduce a la ecuaci6n 673

Estillluci6n de (J 2 Las f6rmulas para el tamafio de la muestra requieren del conocimiento de (J2 pero como ya se ha sefialado la varian cia de la poblaci6n casi

132 CAPITULO 6 ESTlMACION

siempre sedesconoce Como resultado esnecesarioestimar (J2 Las fuentes de estishymaci6n de(J2 que se utilizan con mas frecuencia son las siguientes

1 Se extrae una muestrapilato 0 prel~l11inar de lapoblaci6n y se puede utilizar la variancia calculada a partir de esta muestra como unaestimaci6n de (J2 Las observaciones uti lizadas en la muestra piloto se toman como parte de la muesshytrafinal de modo que n (el tamaiio calculado de la muestra) n

1 (el tamaiio

de la muestra piloto) n2 (el numero de observaciones necesarias para satisfacer el requerimiento total del tamaiio de la muestra)

2 A partir de estudios anteriores osimilares es posible obtener estimaciones de (J2

3Si se cree que la poblaci6n de lacual se extrae la muestraposee una distribushyci6n aproximadamente nqrmal se puede aprovechar el hecho de que la amshyplitud es aproximadamente igual a 6 desviaciones estandar y calcular (J R6 Este metodo requiere aIglin conocimiento acerca de los valores minimo y maximo de la variable en la poblaci6n

EJEMPLO 671

Un nutri6logo del departamento de salud al efectuar una encuesta entre una poshyblacien de muchachas adolescentes con e1 fin de determinitr su ingesti6n diaria promedio de proteinas (medidas en gramos) busc6 el consejo de un bioestadistico con respecto al tamaiio de la muestra que deberfa tomar

~Que procedimiento debe seguir el bioestadistico para asesorar al nutri610go Antes de que el estadistico pueda ayudar el nutri6logo este debe proporcionar tres elementos de informaci6n h dimensi6n deseada del intervalo de confianza el nivel de confianza deseado y la magnitud de la variancia de la poblaci6n

Soludon Suponga que el nutri6logo requiere un intervalo con una dimensi6n de aprQximadamente 10 gramos es decir la estimaci6n se deberfa enconshytrar alrededor de 5 gramos de la media de la poblaci6n en ambas direcshyciones En otras palabras se desea un margen de error de 5 gramos Suponga que se decide por un coeficiente de confian7a de 95 y que con base en su experiencia previa el nutri6logo percibe que la desviaci6n estandar de la poblaci6n es probablemente de alrededor de 20 gramos EI estadfstico dispone ya de la informaci6n necesaria para calcular el tamaiio de la muestra z 196 (J = 20 y d 5 Suponga que el tamaiio de la poblaci6n es grande asf queel estadistico puede ignorar la correcshyci6n por poblaci6n finita y utilizar la ecuaci6n 673 Con las sustitucioshynes adecuadas el valor de n se calcula como

Se recomienda que el nutri610go tome una muestra de tamafio 62 AI calcular el tamaiio de una muestra a partir de las ecuaciones 673 0 675 el resultado se redondea al siguiente nurnero entero mayor si los calculosdan un numerocon decimales bull

183 68 DETERMINACION DEL TAl1ANO PARA LAS PROPORCIONES

EJERCICIOS

671 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su hospital Si se desea un intervalo de confianza de 99 por dento con una amplitud de 1 libra ~que tan grande debe ser la muestra de los registros de nacimiento Suponga que un estimashy

dor razonable para (J es 1 libra ~De que tamano debe ser la muestra si el coeficiente de confiabilidad se hace descender a 95

672 El director de la secdon de control dela rabia del departamento de salud publica desea extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso del ano anterior para estimar la edad media de las personas mordidas Requiere un intervalo de confianza de 95 por dento decide utilizar un valor de 25 para d y a partir de estudios anteriores estima que la desviacion estandar de la poblacion esta alrededor de los 15 anos ~Que tan grande debe ser el tamano de la muestra

673 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mglOO ml) de pacientes atendidos en una clinica para diabeticos durante el transcurso de los ultimos 10 anos Determine el numero de registros que el medico debe examinar para obtener un intershyvalo de confianza de 90 por ciento para 11 si la dimension requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varian cia de 60

674 Se deseaestimar la edad media en la que a los padentes de esclerosis multiple se les diagnosshytico el padecimiento por primera vez Se requiere un intervalo de confianza de 95 por dento con una dimension de 10 anos Si la variancia de la poblaci6n es de 90 ~que tan grande debera ser la muestra

68 DETERMINACION DELTAMANO DE lA MUESTRA PARA lA ESIDIACION DE lAS PROPORCIONES

EI metodo para estimar el tamafio de la muestra cuando se requiere estimar la proshyporcion de una poblacion es esencialmente el mismo que se describio para estimar la media de una poblacion Se aprovecha el hecho de que la mitad del intervalo deseashydo d se puede igualar al producto del coeficiente de confiabilidad y el error estandar

Si se supone que el muestreo ha sido hecho de manera aleatoria y que existen condiciones que garanticen que la distribuci6n de psea aproximadamente normal se obtiene la siguiente formula para n cuando el muestreo es con reemplazo cuanshydo se realizaa partir de una poblacion infinita 0 ruando la poblacion muestreada es 10 suficientemente grande como para hacer innecesario el uso de la correcci6n por poblacion finita

n (681)

dondeq = I-p Si la correccion por poblacion finita no puede descartarse la formula adecuashy

da paran es

(682)n d 2 (N -1)+z2pq

euan do N es grande en comparacion con n (es decir n IN 05) se puede pasar por alto la correccion por poblacion finita y la ecuacion 682 se reduce a la ecuacion 681

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

EJERCICIOS

EJERCICIOS 177

En el capitulo anterior se vio que cuando np y n(1 - p) son mayores que 5 se puede considerar que la distribuci6n muestral de pse aproxima bastante a una distribuci6n normal Cuando se cumple con esta condici6n el coeficiente de confiabilidad es algUn valor de z de la distribuci6n normal estandar Esta visto que el error estandar es igual a (J p =fi(l-p) n Puesto que p que es el parametro que se trata de calcular se desconoce se debe utilizar pcomo una estimaci6n Asf se estima (J j por medio de ~p(l Pn y el intervalo de confianza de 100(1 - 0) por ciento para pesta dado por

pplusmn Z(I-1J2)~P(l- P) Fn (651)

Este intervalo se interpreta tanto desde el punto de vista practico como probabilistico

FJEMPLO 651

Mathers et al (A-12) encontraron queen una muestra de 591 pacientes internados en un hospital psiquiatrico 204 admitieron que consuniieron marihuana al meshynos una vez durante su vida Se pretende construir un intervalo de confianza de 95 por ciento para la proporcion de individuos que consumieron marihuana durante su vida en la poblaci6n muestreada de los internos del hospital psiquiatrico

Solucion La mejor estima~i6n puntual para la proporci6Il de la poblaci6nes p== 204591 3452 El tamafio de la muestra y hiestimacion de p tienen una magnitud suficiente parajustifKar el empleo de la distribucion norshymal estandar paraelaborar un intervalo de confianza EI coeficiente de corifiabilidad que corresponde alnivel de confianza de 95 es 196 la estimacion del errorestandar (Jp es ~p(l-pgtn = (3452)(6548)591

0 1956El intervalo de confianza para p de acuerdo con estos datos es

3452 plusmn 196(01956) 3452 plusmn 0383 3069 3835

Se puede decir que se tiene 95 por ciento de confianza de que la proporshycionpeste entre 3069 y 3835 ya que al repetir el muestreo casi 95 por ciento de los intervalos construidos en la forma de este intervalo inclushyyen a la proporcion p real Con base en estos resultados se espera con una confianza de 95 por ciento encontrar que entre 3069 y 3835 por ciento de los internados en el hospital psiquiatrico tiene antecedentes de consumo de marihuana bull

Para cada uno de los siguientes ejercicios establezca la interpretacion prictica yprobabilistica de los intervalos que se pide construir Identifique cada componente del intervalo la estimashycion puntual el coeficiente de confiabilidad yel error estandar Explique por que los coefishycientes de confiabilidad no son los misInos para todos los ejercicios

178 CAPITULO 6 ESTIIlACI6N

651 En una investigaci6nde ninos maltratados en pacientes psiquiatricos Brown y Anderson (A-IS) encontraron 166 pacientes en una muestra de 947 con antecedentes de abuso sexual y maltrato flsico Construya un intervalo de confianza de 90 por dento para la proporci6n de la poblaci6n

652 Catania et at (A-14) obtuvieron datos respecto al comportamiento sexual de una muestra de hombres y mujeres solteros con edades entre 20 y 44 residentes en areas geoijfaficas caracshyterizadas por tasas altas de enfermedades de transmision sexual e ingreso a programas de drogas De 1229 encuestados 50 por ciento respondieron que nunca utilizaron preservatishyvos Construya un intervalo de confianza de 95 por ciento para la proporcion de la poblaci6n que nunca utiliza preservativos

653 Rothberg y Lits (A-I 5 ) estudiaron el efecto del estres de la maternidad durante el embarazo en el peso del producto Los individuos eran 86 mujeres blancas con antecedentes de estres que no tenfan faetores de riesgo medico u obstetrico conoddo de peso bajo del producto Los investigadores eneontraron que 128 por dento de las madres estudiadas dieron a luz bebes que cubrfan el criterio de peso bajo Construya un intervalo de confianza de 99 por ciento para la proporci6n de la poblaci6n

654 En una muestra aleatoria simple de 125 varones desempleados quienes desertaron de la escuela preparatoria entre las edades de 16 y 21 anos inclusive 88 declararon que eran consumidores regulares de bebidas alcoh6litas Construya un intervalo de eonfianza de 95 por ciento para la proporcion de la poblacion

66 INTERVALO DE CONFIANZA PARA lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS POBlACIONES

A menudo se tiene interes en conocer la magnitud de la diferencia entre las proporcioshynes de dospoblaciones Es posible que se quiera comparar por ejemplo entre hombres y mujeres dos grupos de edades dos grupos socioecon6micos 0 dos grupos de diagshynostico con respecto a la proporcion que posee alguna caractenstica de interes Un estimador puntual insesgado de la diferencia entre dos proporciones de las poblacioshynes se obtieneal calcular la diferencia de las proporciones de las muestras PI P2 Tal como Se ha visto cuando n1 Yn2 son de gran tamano y las proporciones de la poblacion no estan muy cerca de 0 0 de 1 es posible aplicar el teorema del limite central y utilizar la teona de la distribucion normal para obtener los intervalos de conshyfianza EI error estandar de la estimacion se calcula mediante la siguiente formula

dado que como regIa se desconocen las proporciones de Ia poblacion Un intervashy10 de confianza de 100(1 - a) por ciento para PI P2 se obtiene as

(661)

Es posible interpretar este intervalo desde elpunto de vista probabiHstico y practico

EJERCICIOS 179

EJEMPLO 661

Borst et al (A-16) investigaron la relaci6n de desarrollo del ego edad sexo y diagshyn6stico de suicidio entre los internos adolescentes de la unidad de psiquiatria La muestra consistia en 96 varones y 123 niiias con edades entre 12 y 16 aiios seleccioshynados de entre los internados en la unidad de adolescentes y niiios de un hospital psiquiatrico privado Se reportaron 18 niiios y 60 niiias con intento de suicidio Cons ishyderese el comportamiento de las niiias como el de una muestra aleatoria simple a partir de una poblaci6n similar de niiias y que los j6venes igualmente pueden considerarse como una muestra aleatoria simple extraida de una poblaci6n similar de niiios Para estas dos poblaciones se pretende construir un intervalo de confianshyza de 99 por ciento para la diferencia entre las proporciones de los individuos con intento de suicidio

Soluci6n Las proporciones para las niiias y niiios respectivamente son Pc = 601 123 = A878y PB = 1896 1875 La diferencia entre las proporciones de lasmuestrases Pc PB = 4878 1875 = 3003 El error estandar estimado de la diferenda entre las proporciones de las muestras es

(4878)(5122) (1875)(8125) ---~~-~ +-------shy

123 96

El factor de confiabilidad a partir de la tabla D es 258 de modo que el intervalo de confianza con la f6rmula 661 es

3003 plusmn 258(0602) 14504556

Se dene la confianza de 99 por dento de que para las poblaciones muestteadas la ptopord6n de intentos de suiddio entre las niiias exceshyde a lapropord6n de intentosde suiddio entre los varones por 1450 y 4556

Puesto que el intervalo no incluye al cero se concluye que las dos proporciones de pobladones son diferentes bull

FJERCICIOS

Para cada uno de los siguientes ejercicios establezca las interpretaciones pnicticas y probabishylisticas de los intervalos que se pide construir Identifique cada componente del intervalo la estimaci6n puntual el coeficiente de confiabilidad y el error estandar Explique por que los coeficientes de confiabilidad no son el mismo para todos los ejercicios

661 Hargers et al (A-17) del departamento de Salud PUblica y Ambieptal en Amsterdam condushyjeron un estudio en el que los individuos eran consumidores de drogasinyectables (CDI) En una muestrade 194 consumidores de metadona regular de largo plazo (MLP) 145 eran varones En una muestra de 189 CDIque no consmiddotumian MLP 133 eran varones Establezca las consideraciones necesarias acerca de las muestras ypoblaciones representadas y construshy

180 CAPITULO 6 ESTlMACI6N

ya un intervalo de confianza de 95 por ciemo para la diferenda entre las proporciones de varones en las dos poblaciones

662 Una investigaci6n de Lane et ai (A-I8) valor6las diferencias en las pnicticas de deteccion de cancer de seno entre muestras de mujeres predominantemente de bajos ingresos con edashydes de 50 a 75 anos que lltilizan los servicios de c1inicas de sailld para todo el estado y mlljeres de la misma edad residentes en ciudades donde las c1inicas de salud son locales De las 404 encuestadas seleccionadas en toda la comunidad 592 por ciento estuvo de acuerdo con el siguiente comentario acerca del cancer de pecho las mujeres prolongan su vida si detectan el cancer desde el inicio De entre 795 usuarias de clinicas de salud en la mllestra 449 por ciento estuvo de acuerdo Establezca las suposiciones apropiadas para elaborar un intervalo de confianzade 99 por ciento para la diferencia entre las dos proporciones de las poblaciones de interes

663 Williams et at (A-19) encuestaron a una muestra de 67 medicos y 133 enfermeras con famishyliares farmacodependientes EI prop6sito del estudio era evaluar la influencia en los medishyEOS y enfermeras de estar estrechamente involucrados con una 0 mas personas farmaco dependientes Cincuenta y dos medicos y 89 enfermeras dijeron que vivian con personas farmacoldependientes que adversamente afectaban 8U trabajo E8tablezca todas las consideshyraciones que crea necesarias para construir un intervalo de confianza de 95 por ciento para la diferencia entre las proporciones en las dos poblaciones de trabajadores que se espera esten adversamente afectados por vivir con personas farmacodependientes

664 Aronow y Kronzon (A-20) identificaron los factores de riesgo coronado entre hombres y mujeres en una dinica de cuidados de la salud a largo plazo De los 215 individuos negros 58 tienen diabetes mellitus al igual que 217 individuos blancos de 1140 Elabore un intervalo de confianza de 90 por ciento de confianzapara la diferencia entre las proporciones de las dos poblaciones tCuaies son las poblaciones correspondientes ~Que consideraciones son necesarias para hacer valido el procedimiento de inferencia

67 DETEHMINAUON DEL TAMANO DE LA MUESTRA PARA LA ESTIMACIONDEIAS MEDIAS

La pregunta de que tan grande debe ser una muestra surge inmediatamente al inicio del planteamiento de cualquier encuesta 0 experimento Esta es una pregunshyta importante y no se debe tratara la ligera Tomar una muestra mas grande de 10 necesario para obtener los resultados deseados es un desperdicio de recursos mienshytras que por otro lado las muestras demasiado pequenas con frecuencia dan resulshytados que carecen de uso practico En esta secci6n se estudia c6mo determinar el tamano de la muestra de acuerdo con la situaci6n A continuaci6n se proporciona un metodo para determinar el tamano de la muestra que se requiere para estimar Ia media de la poblaci6n yen la siguiente secci6n se aplica este metodo para detershyminar el tamano de la milestra cuando se desea estimar la proporci6n de una poshyblaci6n Mediante extensiltmes directas de estos metodos es posible determinar el tamano necesario de las muestras para situaciones mas complicadas

Objetivos El objetivo de la estimaci6n porintervalos es el de obtener intervalos estrechos con alta confiabilidad Si se observan los componentes ~e un intervalo de confianzase veque 8U dimension esta determinada por la magnitud de la cantidad

(coeficiente de confiabilidad) x (error estandar)

131 67 DETERMINACION DEL TAMANO PARA LA l-IUESTRAmiddot

ya que lamagnitud total del intervalo de confIanza es eldoble de esta cantidad Se aprendi6 que a esta cantidad generalmente se Ie llama precisi6n de la estimaci6n o margen de error Para un error estandar dado incrementar la confIabilidad signishyfIca un coefIciente con mayor confIabilidad Y un coefIciente con mayor confIabilidad produce unintervalo mas amplio

Por otra parte si se ftia el coefIciente de confIabilidad la unica manera de redudr la amplitud del intervalo es la reducci6n del error estandar Dado que el error estandar es igual a (J IJ y como (J es una constante la unica forma de obtener un error estandar menor es tomar una muestra grande ~Que tan grande debeser la muestra Esto depende del tamafio de (J la desviad6n estandar de la poblaci6n asi como del grado de confIabilidad y dimensi6n del intervalo deseados

Suponga que se desea obtener un intervalo que se extienda d unidades hacia uno y otro lado del estimador Ellose enuncia

d (coefIciente de confIabilidad) X (error estandar) (671)

Si el muestreo es con reemplazos a partir de una poblaci6n infInita 0 de una que sea 10 sufIcientemente grande como para ignorar la correcci6n por poblaci6n fInita la ecuaci6n 671 se transforma en

(J

d z- (672)-r la cual cuando se despeja n nos da

(673)d2

Cuando el nmestreo se hacesin reemplazos a partir de una poblaci6n fInita y peshyquefia se requiere de la correcci6n por poblaci6n fInita y la ecuaci6n 671 se transforma en

(J~d (674)fN~

que al despejar n resulta en

n-----shy (675)d 2(N 1) + Z2(J2

Si puede omitirse la correcci6n por poblad6n fInita la ecuaci6n 675 se reshyduce a la ecuaci6n 673

Estillluci6n de (J 2 Las f6rmulas para el tamafio de la muestra requieren del conocimiento de (J2 pero como ya se ha sefialado la varian cia de la poblaci6n casi

132 CAPITULO 6 ESTlMACION

siempre sedesconoce Como resultado esnecesarioestimar (J2 Las fuentes de estishymaci6n de(J2 que se utilizan con mas frecuencia son las siguientes

1 Se extrae una muestrapilato 0 prel~l11inar de lapoblaci6n y se puede utilizar la variancia calculada a partir de esta muestra como unaestimaci6n de (J2 Las observaciones uti lizadas en la muestra piloto se toman como parte de la muesshytrafinal de modo que n (el tamaiio calculado de la muestra) n

1 (el tamaiio

de la muestra piloto) n2 (el numero de observaciones necesarias para satisfacer el requerimiento total del tamaiio de la muestra)

2 A partir de estudios anteriores osimilares es posible obtener estimaciones de (J2

3Si se cree que la poblaci6n de lacual se extrae la muestraposee una distribushyci6n aproximadamente nqrmal se puede aprovechar el hecho de que la amshyplitud es aproximadamente igual a 6 desviaciones estandar y calcular (J R6 Este metodo requiere aIglin conocimiento acerca de los valores minimo y maximo de la variable en la poblaci6n

EJEMPLO 671

Un nutri6logo del departamento de salud al efectuar una encuesta entre una poshyblacien de muchachas adolescentes con e1 fin de determinitr su ingesti6n diaria promedio de proteinas (medidas en gramos) busc6 el consejo de un bioestadistico con respecto al tamaiio de la muestra que deberfa tomar

~Que procedimiento debe seguir el bioestadistico para asesorar al nutri610go Antes de que el estadistico pueda ayudar el nutri6logo este debe proporcionar tres elementos de informaci6n h dimensi6n deseada del intervalo de confianza el nivel de confianza deseado y la magnitud de la variancia de la poblaci6n

Soludon Suponga que el nutri6logo requiere un intervalo con una dimensi6n de aprQximadamente 10 gramos es decir la estimaci6n se deberfa enconshytrar alrededor de 5 gramos de la media de la poblaci6n en ambas direcshyciones En otras palabras se desea un margen de error de 5 gramos Suponga que se decide por un coeficiente de confian7a de 95 y que con base en su experiencia previa el nutri6logo percibe que la desviaci6n estandar de la poblaci6n es probablemente de alrededor de 20 gramos EI estadfstico dispone ya de la informaci6n necesaria para calcular el tamaiio de la muestra z 196 (J = 20 y d 5 Suponga que el tamaiio de la poblaci6n es grande asf queel estadistico puede ignorar la correcshyci6n por poblaci6n finita y utilizar la ecuaci6n 673 Con las sustitucioshynes adecuadas el valor de n se calcula como

Se recomienda que el nutri610go tome una muestra de tamafio 62 AI calcular el tamaiio de una muestra a partir de las ecuaciones 673 0 675 el resultado se redondea al siguiente nurnero entero mayor si los calculosdan un numerocon decimales bull

183 68 DETERMINACION DEL TAl1ANO PARA LAS PROPORCIONES

EJERCICIOS

671 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su hospital Si se desea un intervalo de confianza de 99 por dento con una amplitud de 1 libra ~que tan grande debe ser la muestra de los registros de nacimiento Suponga que un estimashy

dor razonable para (J es 1 libra ~De que tamano debe ser la muestra si el coeficiente de confiabilidad se hace descender a 95

672 El director de la secdon de control dela rabia del departamento de salud publica desea extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso del ano anterior para estimar la edad media de las personas mordidas Requiere un intervalo de confianza de 95 por dento decide utilizar un valor de 25 para d y a partir de estudios anteriores estima que la desviacion estandar de la poblacion esta alrededor de los 15 anos ~Que tan grande debe ser el tamano de la muestra

673 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mglOO ml) de pacientes atendidos en una clinica para diabeticos durante el transcurso de los ultimos 10 anos Determine el numero de registros que el medico debe examinar para obtener un intershyvalo de confianza de 90 por ciento para 11 si la dimension requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varian cia de 60

674 Se deseaestimar la edad media en la que a los padentes de esclerosis multiple se les diagnosshytico el padecimiento por primera vez Se requiere un intervalo de confianza de 95 por dento con una dimension de 10 anos Si la variancia de la poblaci6n es de 90 ~que tan grande debera ser la muestra

68 DETERMINACION DELTAMANO DE lA MUESTRA PARA lA ESIDIACION DE lAS PROPORCIONES

EI metodo para estimar el tamafio de la muestra cuando se requiere estimar la proshyporcion de una poblacion es esencialmente el mismo que se describio para estimar la media de una poblacion Se aprovecha el hecho de que la mitad del intervalo deseashydo d se puede igualar al producto del coeficiente de confiabilidad y el error estandar

Si se supone que el muestreo ha sido hecho de manera aleatoria y que existen condiciones que garanticen que la distribuci6n de psea aproximadamente normal se obtiene la siguiente formula para n cuando el muestreo es con reemplazo cuanshydo se realizaa partir de una poblacion infinita 0 ruando la poblacion muestreada es 10 suficientemente grande como para hacer innecesario el uso de la correcci6n por poblacion finita

n (681)

dondeq = I-p Si la correccion por poblacion finita no puede descartarse la formula adecuashy

da paran es

(682)n d 2 (N -1)+z2pq

euan do N es grande en comparacion con n (es decir n IN 05) se puede pasar por alto la correccion por poblacion finita y la ecuacion 682 se reduce a la ecuacion 681

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

178 CAPITULO 6 ESTIIlACI6N

651 En una investigaci6nde ninos maltratados en pacientes psiquiatricos Brown y Anderson (A-IS) encontraron 166 pacientes en una muestra de 947 con antecedentes de abuso sexual y maltrato flsico Construya un intervalo de confianza de 90 por dento para la proporci6n de la poblaci6n

652 Catania et at (A-14) obtuvieron datos respecto al comportamiento sexual de una muestra de hombres y mujeres solteros con edades entre 20 y 44 residentes en areas geoijfaficas caracshyterizadas por tasas altas de enfermedades de transmision sexual e ingreso a programas de drogas De 1229 encuestados 50 por ciento respondieron que nunca utilizaron preservatishyvos Construya un intervalo de confianza de 95 por ciento para la proporcion de la poblaci6n que nunca utiliza preservativos

653 Rothberg y Lits (A-I 5 ) estudiaron el efecto del estres de la maternidad durante el embarazo en el peso del producto Los individuos eran 86 mujeres blancas con antecedentes de estres que no tenfan faetores de riesgo medico u obstetrico conoddo de peso bajo del producto Los investigadores eneontraron que 128 por dento de las madres estudiadas dieron a luz bebes que cubrfan el criterio de peso bajo Construya un intervalo de confianza de 99 por ciento para la proporci6n de la poblaci6n

654 En una muestra aleatoria simple de 125 varones desempleados quienes desertaron de la escuela preparatoria entre las edades de 16 y 21 anos inclusive 88 declararon que eran consumidores regulares de bebidas alcoh6litas Construya un intervalo de eonfianza de 95 por ciento para la proporcion de la poblacion

66 INTERVALO DE CONFIANZA PARA lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS POBlACIONES

A menudo se tiene interes en conocer la magnitud de la diferencia entre las proporcioshynes de dospoblaciones Es posible que se quiera comparar por ejemplo entre hombres y mujeres dos grupos de edades dos grupos socioecon6micos 0 dos grupos de diagshynostico con respecto a la proporcion que posee alguna caractenstica de interes Un estimador puntual insesgado de la diferencia entre dos proporciones de las poblacioshynes se obtieneal calcular la diferencia de las proporciones de las muestras PI P2 Tal como Se ha visto cuando n1 Yn2 son de gran tamano y las proporciones de la poblacion no estan muy cerca de 0 0 de 1 es posible aplicar el teorema del limite central y utilizar la teona de la distribucion normal para obtener los intervalos de conshyfianza EI error estandar de la estimacion se calcula mediante la siguiente formula

dado que como regIa se desconocen las proporciones de Ia poblacion Un intervashy10 de confianza de 100(1 - a) por ciento para PI P2 se obtiene as

(661)

Es posible interpretar este intervalo desde elpunto de vista probabiHstico y practico

EJERCICIOS 179

EJEMPLO 661

Borst et al (A-16) investigaron la relaci6n de desarrollo del ego edad sexo y diagshyn6stico de suicidio entre los internos adolescentes de la unidad de psiquiatria La muestra consistia en 96 varones y 123 niiias con edades entre 12 y 16 aiios seleccioshynados de entre los internados en la unidad de adolescentes y niiios de un hospital psiquiatrico privado Se reportaron 18 niiios y 60 niiias con intento de suicidio Cons ishyderese el comportamiento de las niiias como el de una muestra aleatoria simple a partir de una poblaci6n similar de niiias y que los j6venes igualmente pueden considerarse como una muestra aleatoria simple extraida de una poblaci6n similar de niiios Para estas dos poblaciones se pretende construir un intervalo de confianshyza de 99 por ciento para la diferencia entre las proporciones de los individuos con intento de suicidio

Soluci6n Las proporciones para las niiias y niiios respectivamente son Pc = 601 123 = A878y PB = 1896 1875 La diferencia entre las proporciones de lasmuestrases Pc PB = 4878 1875 = 3003 El error estandar estimado de la diferenda entre las proporciones de las muestras es

(4878)(5122) (1875)(8125) ---~~-~ +-------shy

123 96

El factor de confiabilidad a partir de la tabla D es 258 de modo que el intervalo de confianza con la f6rmula 661 es

3003 plusmn 258(0602) 14504556

Se dene la confianza de 99 por dento de que para las poblaciones muestteadas la ptopord6n de intentos de suiddio entre las niiias exceshyde a lapropord6n de intentosde suiddio entre los varones por 1450 y 4556

Puesto que el intervalo no incluye al cero se concluye que las dos proporciones de pobladones son diferentes bull

FJERCICIOS

Para cada uno de los siguientes ejercicios establezca las interpretaciones pnicticas y probabishylisticas de los intervalos que se pide construir Identifique cada componente del intervalo la estimaci6n puntual el coeficiente de confiabilidad y el error estandar Explique por que los coeficientes de confiabilidad no son el mismo para todos los ejercicios

661 Hargers et al (A-17) del departamento de Salud PUblica y Ambieptal en Amsterdam condushyjeron un estudio en el que los individuos eran consumidores de drogasinyectables (CDI) En una muestrade 194 consumidores de metadona regular de largo plazo (MLP) 145 eran varones En una muestra de 189 CDIque no consmiddotumian MLP 133 eran varones Establezca las consideraciones necesarias acerca de las muestras ypoblaciones representadas y construshy

180 CAPITULO 6 ESTlMACI6N

ya un intervalo de confianza de 95 por ciemo para la diferenda entre las proporciones de varones en las dos poblaciones

662 Una investigaci6n de Lane et ai (A-I8) valor6las diferencias en las pnicticas de deteccion de cancer de seno entre muestras de mujeres predominantemente de bajos ingresos con edashydes de 50 a 75 anos que lltilizan los servicios de c1inicas de sailld para todo el estado y mlljeres de la misma edad residentes en ciudades donde las c1inicas de salud son locales De las 404 encuestadas seleccionadas en toda la comunidad 592 por ciento estuvo de acuerdo con el siguiente comentario acerca del cancer de pecho las mujeres prolongan su vida si detectan el cancer desde el inicio De entre 795 usuarias de clinicas de salud en la mllestra 449 por ciento estuvo de acuerdo Establezca las suposiciones apropiadas para elaborar un intervalo de confianzade 99 por ciento para la diferencia entre las dos proporciones de las poblaciones de interes

663 Williams et at (A-19) encuestaron a una muestra de 67 medicos y 133 enfermeras con famishyliares farmacodependientes EI prop6sito del estudio era evaluar la influencia en los medishyEOS y enfermeras de estar estrechamente involucrados con una 0 mas personas farmaco dependientes Cincuenta y dos medicos y 89 enfermeras dijeron que vivian con personas farmacoldependientes que adversamente afectaban 8U trabajo E8tablezca todas las consideshyraciones que crea necesarias para construir un intervalo de confianza de 95 por ciento para la diferencia entre las proporciones en las dos poblaciones de trabajadores que se espera esten adversamente afectados por vivir con personas farmacodependientes

664 Aronow y Kronzon (A-20) identificaron los factores de riesgo coronado entre hombres y mujeres en una dinica de cuidados de la salud a largo plazo De los 215 individuos negros 58 tienen diabetes mellitus al igual que 217 individuos blancos de 1140 Elabore un intervalo de confianza de 90 por ciento de confianzapara la diferencia entre las proporciones de las dos poblaciones tCuaies son las poblaciones correspondientes ~Que consideraciones son necesarias para hacer valido el procedimiento de inferencia

67 DETEHMINAUON DEL TAMANO DE LA MUESTRA PARA LA ESTIMACIONDEIAS MEDIAS

La pregunta de que tan grande debe ser una muestra surge inmediatamente al inicio del planteamiento de cualquier encuesta 0 experimento Esta es una pregunshyta importante y no se debe tratara la ligera Tomar una muestra mas grande de 10 necesario para obtener los resultados deseados es un desperdicio de recursos mienshytras que por otro lado las muestras demasiado pequenas con frecuencia dan resulshytados que carecen de uso practico En esta secci6n se estudia c6mo determinar el tamano de la muestra de acuerdo con la situaci6n A continuaci6n se proporciona un metodo para determinar el tamano de la muestra que se requiere para estimar Ia media de la poblaci6n yen la siguiente secci6n se aplica este metodo para detershyminar el tamano de la milestra cuando se desea estimar la proporci6n de una poshyblaci6n Mediante extensiltmes directas de estos metodos es posible determinar el tamano necesario de las muestras para situaciones mas complicadas

Objetivos El objetivo de la estimaci6n porintervalos es el de obtener intervalos estrechos con alta confiabilidad Si se observan los componentes ~e un intervalo de confianzase veque 8U dimension esta determinada por la magnitud de la cantidad

(coeficiente de confiabilidad) x (error estandar)

131 67 DETERMINACION DEL TAMANO PARA LA l-IUESTRAmiddot

ya que lamagnitud total del intervalo de confIanza es eldoble de esta cantidad Se aprendi6 que a esta cantidad generalmente se Ie llama precisi6n de la estimaci6n o margen de error Para un error estandar dado incrementar la confIabilidad signishyfIca un coefIciente con mayor confIabilidad Y un coefIciente con mayor confIabilidad produce unintervalo mas amplio

Por otra parte si se ftia el coefIciente de confIabilidad la unica manera de redudr la amplitud del intervalo es la reducci6n del error estandar Dado que el error estandar es igual a (J IJ y como (J es una constante la unica forma de obtener un error estandar menor es tomar una muestra grande ~Que tan grande debeser la muestra Esto depende del tamafio de (J la desviad6n estandar de la poblaci6n asi como del grado de confIabilidad y dimensi6n del intervalo deseados

Suponga que se desea obtener un intervalo que se extienda d unidades hacia uno y otro lado del estimador Ellose enuncia

d (coefIciente de confIabilidad) X (error estandar) (671)

Si el muestreo es con reemplazos a partir de una poblaci6n infInita 0 de una que sea 10 sufIcientemente grande como para ignorar la correcci6n por poblaci6n fInita la ecuaci6n 671 se transforma en

(J

d z- (672)-r la cual cuando se despeja n nos da

(673)d2

Cuando el nmestreo se hacesin reemplazos a partir de una poblaci6n fInita y peshyquefia se requiere de la correcci6n por poblaci6n fInita y la ecuaci6n 671 se transforma en

(J~d (674)fN~

que al despejar n resulta en

n-----shy (675)d 2(N 1) + Z2(J2

Si puede omitirse la correcci6n por poblad6n fInita la ecuaci6n 675 se reshyduce a la ecuaci6n 673

Estillluci6n de (J 2 Las f6rmulas para el tamafio de la muestra requieren del conocimiento de (J2 pero como ya se ha sefialado la varian cia de la poblaci6n casi

132 CAPITULO 6 ESTlMACION

siempre sedesconoce Como resultado esnecesarioestimar (J2 Las fuentes de estishymaci6n de(J2 que se utilizan con mas frecuencia son las siguientes

1 Se extrae una muestrapilato 0 prel~l11inar de lapoblaci6n y se puede utilizar la variancia calculada a partir de esta muestra como unaestimaci6n de (J2 Las observaciones uti lizadas en la muestra piloto se toman como parte de la muesshytrafinal de modo que n (el tamaiio calculado de la muestra) n

1 (el tamaiio

de la muestra piloto) n2 (el numero de observaciones necesarias para satisfacer el requerimiento total del tamaiio de la muestra)

2 A partir de estudios anteriores osimilares es posible obtener estimaciones de (J2

3Si se cree que la poblaci6n de lacual se extrae la muestraposee una distribushyci6n aproximadamente nqrmal se puede aprovechar el hecho de que la amshyplitud es aproximadamente igual a 6 desviaciones estandar y calcular (J R6 Este metodo requiere aIglin conocimiento acerca de los valores minimo y maximo de la variable en la poblaci6n

EJEMPLO 671

Un nutri6logo del departamento de salud al efectuar una encuesta entre una poshyblacien de muchachas adolescentes con e1 fin de determinitr su ingesti6n diaria promedio de proteinas (medidas en gramos) busc6 el consejo de un bioestadistico con respecto al tamaiio de la muestra que deberfa tomar

~Que procedimiento debe seguir el bioestadistico para asesorar al nutri610go Antes de que el estadistico pueda ayudar el nutri6logo este debe proporcionar tres elementos de informaci6n h dimensi6n deseada del intervalo de confianza el nivel de confianza deseado y la magnitud de la variancia de la poblaci6n

Soludon Suponga que el nutri6logo requiere un intervalo con una dimensi6n de aprQximadamente 10 gramos es decir la estimaci6n se deberfa enconshytrar alrededor de 5 gramos de la media de la poblaci6n en ambas direcshyciones En otras palabras se desea un margen de error de 5 gramos Suponga que se decide por un coeficiente de confian7a de 95 y que con base en su experiencia previa el nutri6logo percibe que la desviaci6n estandar de la poblaci6n es probablemente de alrededor de 20 gramos EI estadfstico dispone ya de la informaci6n necesaria para calcular el tamaiio de la muestra z 196 (J = 20 y d 5 Suponga que el tamaiio de la poblaci6n es grande asf queel estadistico puede ignorar la correcshyci6n por poblaci6n finita y utilizar la ecuaci6n 673 Con las sustitucioshynes adecuadas el valor de n se calcula como

Se recomienda que el nutri610go tome una muestra de tamafio 62 AI calcular el tamaiio de una muestra a partir de las ecuaciones 673 0 675 el resultado se redondea al siguiente nurnero entero mayor si los calculosdan un numerocon decimales bull

183 68 DETERMINACION DEL TAl1ANO PARA LAS PROPORCIONES

EJERCICIOS

671 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su hospital Si se desea un intervalo de confianza de 99 por dento con una amplitud de 1 libra ~que tan grande debe ser la muestra de los registros de nacimiento Suponga que un estimashy

dor razonable para (J es 1 libra ~De que tamano debe ser la muestra si el coeficiente de confiabilidad se hace descender a 95

672 El director de la secdon de control dela rabia del departamento de salud publica desea extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso del ano anterior para estimar la edad media de las personas mordidas Requiere un intervalo de confianza de 95 por dento decide utilizar un valor de 25 para d y a partir de estudios anteriores estima que la desviacion estandar de la poblacion esta alrededor de los 15 anos ~Que tan grande debe ser el tamano de la muestra

673 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mglOO ml) de pacientes atendidos en una clinica para diabeticos durante el transcurso de los ultimos 10 anos Determine el numero de registros que el medico debe examinar para obtener un intershyvalo de confianza de 90 por ciento para 11 si la dimension requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varian cia de 60

674 Se deseaestimar la edad media en la que a los padentes de esclerosis multiple se les diagnosshytico el padecimiento por primera vez Se requiere un intervalo de confianza de 95 por dento con una dimension de 10 anos Si la variancia de la poblaci6n es de 90 ~que tan grande debera ser la muestra

68 DETERMINACION DELTAMANO DE lA MUESTRA PARA lA ESIDIACION DE lAS PROPORCIONES

EI metodo para estimar el tamafio de la muestra cuando se requiere estimar la proshyporcion de una poblacion es esencialmente el mismo que se describio para estimar la media de una poblacion Se aprovecha el hecho de que la mitad del intervalo deseashydo d se puede igualar al producto del coeficiente de confiabilidad y el error estandar

Si se supone que el muestreo ha sido hecho de manera aleatoria y que existen condiciones que garanticen que la distribuci6n de psea aproximadamente normal se obtiene la siguiente formula para n cuando el muestreo es con reemplazo cuanshydo se realizaa partir de una poblacion infinita 0 ruando la poblacion muestreada es 10 suficientemente grande como para hacer innecesario el uso de la correcci6n por poblacion finita

n (681)

dondeq = I-p Si la correccion por poblacion finita no puede descartarse la formula adecuashy

da paran es

(682)n d 2 (N -1)+z2pq

euan do N es grande en comparacion con n (es decir n IN 05) se puede pasar por alto la correccion por poblacion finita y la ecuacion 682 se reduce a la ecuacion 681

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

EJERCICIOS 179

EJEMPLO 661

Borst et al (A-16) investigaron la relaci6n de desarrollo del ego edad sexo y diagshyn6stico de suicidio entre los internos adolescentes de la unidad de psiquiatria La muestra consistia en 96 varones y 123 niiias con edades entre 12 y 16 aiios seleccioshynados de entre los internados en la unidad de adolescentes y niiios de un hospital psiquiatrico privado Se reportaron 18 niiios y 60 niiias con intento de suicidio Cons ishyderese el comportamiento de las niiias como el de una muestra aleatoria simple a partir de una poblaci6n similar de niiias y que los j6venes igualmente pueden considerarse como una muestra aleatoria simple extraida de una poblaci6n similar de niiios Para estas dos poblaciones se pretende construir un intervalo de confianshyza de 99 por ciento para la diferencia entre las proporciones de los individuos con intento de suicidio

Soluci6n Las proporciones para las niiias y niiios respectivamente son Pc = 601 123 = A878y PB = 1896 1875 La diferencia entre las proporciones de lasmuestrases Pc PB = 4878 1875 = 3003 El error estandar estimado de la diferenda entre las proporciones de las muestras es

(4878)(5122) (1875)(8125) ---~~-~ +-------shy

123 96

El factor de confiabilidad a partir de la tabla D es 258 de modo que el intervalo de confianza con la f6rmula 661 es

3003 plusmn 258(0602) 14504556

Se dene la confianza de 99 por dento de que para las poblaciones muestteadas la ptopord6n de intentos de suiddio entre las niiias exceshyde a lapropord6n de intentosde suiddio entre los varones por 1450 y 4556

Puesto que el intervalo no incluye al cero se concluye que las dos proporciones de pobladones son diferentes bull

FJERCICIOS

Para cada uno de los siguientes ejercicios establezca las interpretaciones pnicticas y probabishylisticas de los intervalos que se pide construir Identifique cada componente del intervalo la estimaci6n puntual el coeficiente de confiabilidad y el error estandar Explique por que los coeficientes de confiabilidad no son el mismo para todos los ejercicios

661 Hargers et al (A-17) del departamento de Salud PUblica y Ambieptal en Amsterdam condushyjeron un estudio en el que los individuos eran consumidores de drogasinyectables (CDI) En una muestrade 194 consumidores de metadona regular de largo plazo (MLP) 145 eran varones En una muestra de 189 CDIque no consmiddotumian MLP 133 eran varones Establezca las consideraciones necesarias acerca de las muestras ypoblaciones representadas y construshy

180 CAPITULO 6 ESTlMACI6N

ya un intervalo de confianza de 95 por ciemo para la diferenda entre las proporciones de varones en las dos poblaciones

662 Una investigaci6n de Lane et ai (A-I8) valor6las diferencias en las pnicticas de deteccion de cancer de seno entre muestras de mujeres predominantemente de bajos ingresos con edashydes de 50 a 75 anos que lltilizan los servicios de c1inicas de sailld para todo el estado y mlljeres de la misma edad residentes en ciudades donde las c1inicas de salud son locales De las 404 encuestadas seleccionadas en toda la comunidad 592 por ciento estuvo de acuerdo con el siguiente comentario acerca del cancer de pecho las mujeres prolongan su vida si detectan el cancer desde el inicio De entre 795 usuarias de clinicas de salud en la mllestra 449 por ciento estuvo de acuerdo Establezca las suposiciones apropiadas para elaborar un intervalo de confianzade 99 por ciento para la diferencia entre las dos proporciones de las poblaciones de interes

663 Williams et at (A-19) encuestaron a una muestra de 67 medicos y 133 enfermeras con famishyliares farmacodependientes EI prop6sito del estudio era evaluar la influencia en los medishyEOS y enfermeras de estar estrechamente involucrados con una 0 mas personas farmaco dependientes Cincuenta y dos medicos y 89 enfermeras dijeron que vivian con personas farmacoldependientes que adversamente afectaban 8U trabajo E8tablezca todas las consideshyraciones que crea necesarias para construir un intervalo de confianza de 95 por ciento para la diferencia entre las proporciones en las dos poblaciones de trabajadores que se espera esten adversamente afectados por vivir con personas farmacodependientes

664 Aronow y Kronzon (A-20) identificaron los factores de riesgo coronado entre hombres y mujeres en una dinica de cuidados de la salud a largo plazo De los 215 individuos negros 58 tienen diabetes mellitus al igual que 217 individuos blancos de 1140 Elabore un intervalo de confianza de 90 por ciento de confianzapara la diferencia entre las proporciones de las dos poblaciones tCuaies son las poblaciones correspondientes ~Que consideraciones son necesarias para hacer valido el procedimiento de inferencia

67 DETEHMINAUON DEL TAMANO DE LA MUESTRA PARA LA ESTIMACIONDEIAS MEDIAS

La pregunta de que tan grande debe ser una muestra surge inmediatamente al inicio del planteamiento de cualquier encuesta 0 experimento Esta es una pregunshyta importante y no se debe tratara la ligera Tomar una muestra mas grande de 10 necesario para obtener los resultados deseados es un desperdicio de recursos mienshytras que por otro lado las muestras demasiado pequenas con frecuencia dan resulshytados que carecen de uso practico En esta secci6n se estudia c6mo determinar el tamano de la muestra de acuerdo con la situaci6n A continuaci6n se proporciona un metodo para determinar el tamano de la muestra que se requiere para estimar Ia media de la poblaci6n yen la siguiente secci6n se aplica este metodo para detershyminar el tamano de la milestra cuando se desea estimar la proporci6n de una poshyblaci6n Mediante extensiltmes directas de estos metodos es posible determinar el tamano necesario de las muestras para situaciones mas complicadas

Objetivos El objetivo de la estimaci6n porintervalos es el de obtener intervalos estrechos con alta confiabilidad Si se observan los componentes ~e un intervalo de confianzase veque 8U dimension esta determinada por la magnitud de la cantidad

(coeficiente de confiabilidad) x (error estandar)

131 67 DETERMINACION DEL TAMANO PARA LA l-IUESTRAmiddot

ya que lamagnitud total del intervalo de confIanza es eldoble de esta cantidad Se aprendi6 que a esta cantidad generalmente se Ie llama precisi6n de la estimaci6n o margen de error Para un error estandar dado incrementar la confIabilidad signishyfIca un coefIciente con mayor confIabilidad Y un coefIciente con mayor confIabilidad produce unintervalo mas amplio

Por otra parte si se ftia el coefIciente de confIabilidad la unica manera de redudr la amplitud del intervalo es la reducci6n del error estandar Dado que el error estandar es igual a (J IJ y como (J es una constante la unica forma de obtener un error estandar menor es tomar una muestra grande ~Que tan grande debeser la muestra Esto depende del tamafio de (J la desviad6n estandar de la poblaci6n asi como del grado de confIabilidad y dimensi6n del intervalo deseados

Suponga que se desea obtener un intervalo que se extienda d unidades hacia uno y otro lado del estimador Ellose enuncia

d (coefIciente de confIabilidad) X (error estandar) (671)

Si el muestreo es con reemplazos a partir de una poblaci6n infInita 0 de una que sea 10 sufIcientemente grande como para ignorar la correcci6n por poblaci6n fInita la ecuaci6n 671 se transforma en

(J

d z- (672)-r la cual cuando se despeja n nos da

(673)d2

Cuando el nmestreo se hacesin reemplazos a partir de una poblaci6n fInita y peshyquefia se requiere de la correcci6n por poblaci6n fInita y la ecuaci6n 671 se transforma en

(J~d (674)fN~

que al despejar n resulta en

n-----shy (675)d 2(N 1) + Z2(J2

Si puede omitirse la correcci6n por poblad6n fInita la ecuaci6n 675 se reshyduce a la ecuaci6n 673

Estillluci6n de (J 2 Las f6rmulas para el tamafio de la muestra requieren del conocimiento de (J2 pero como ya se ha sefialado la varian cia de la poblaci6n casi

132 CAPITULO 6 ESTlMACION

siempre sedesconoce Como resultado esnecesarioestimar (J2 Las fuentes de estishymaci6n de(J2 que se utilizan con mas frecuencia son las siguientes

1 Se extrae una muestrapilato 0 prel~l11inar de lapoblaci6n y se puede utilizar la variancia calculada a partir de esta muestra como unaestimaci6n de (J2 Las observaciones uti lizadas en la muestra piloto se toman como parte de la muesshytrafinal de modo que n (el tamaiio calculado de la muestra) n

1 (el tamaiio

de la muestra piloto) n2 (el numero de observaciones necesarias para satisfacer el requerimiento total del tamaiio de la muestra)

2 A partir de estudios anteriores osimilares es posible obtener estimaciones de (J2

3Si se cree que la poblaci6n de lacual se extrae la muestraposee una distribushyci6n aproximadamente nqrmal se puede aprovechar el hecho de que la amshyplitud es aproximadamente igual a 6 desviaciones estandar y calcular (J R6 Este metodo requiere aIglin conocimiento acerca de los valores minimo y maximo de la variable en la poblaci6n

EJEMPLO 671

Un nutri6logo del departamento de salud al efectuar una encuesta entre una poshyblacien de muchachas adolescentes con e1 fin de determinitr su ingesti6n diaria promedio de proteinas (medidas en gramos) busc6 el consejo de un bioestadistico con respecto al tamaiio de la muestra que deberfa tomar

~Que procedimiento debe seguir el bioestadistico para asesorar al nutri610go Antes de que el estadistico pueda ayudar el nutri6logo este debe proporcionar tres elementos de informaci6n h dimensi6n deseada del intervalo de confianza el nivel de confianza deseado y la magnitud de la variancia de la poblaci6n

Soludon Suponga que el nutri6logo requiere un intervalo con una dimensi6n de aprQximadamente 10 gramos es decir la estimaci6n se deberfa enconshytrar alrededor de 5 gramos de la media de la poblaci6n en ambas direcshyciones En otras palabras se desea un margen de error de 5 gramos Suponga que se decide por un coeficiente de confian7a de 95 y que con base en su experiencia previa el nutri6logo percibe que la desviaci6n estandar de la poblaci6n es probablemente de alrededor de 20 gramos EI estadfstico dispone ya de la informaci6n necesaria para calcular el tamaiio de la muestra z 196 (J = 20 y d 5 Suponga que el tamaiio de la poblaci6n es grande asf queel estadistico puede ignorar la correcshyci6n por poblaci6n finita y utilizar la ecuaci6n 673 Con las sustitucioshynes adecuadas el valor de n se calcula como

Se recomienda que el nutri610go tome una muestra de tamafio 62 AI calcular el tamaiio de una muestra a partir de las ecuaciones 673 0 675 el resultado se redondea al siguiente nurnero entero mayor si los calculosdan un numerocon decimales bull

183 68 DETERMINACION DEL TAl1ANO PARA LAS PROPORCIONES

EJERCICIOS

671 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su hospital Si se desea un intervalo de confianza de 99 por dento con una amplitud de 1 libra ~que tan grande debe ser la muestra de los registros de nacimiento Suponga que un estimashy

dor razonable para (J es 1 libra ~De que tamano debe ser la muestra si el coeficiente de confiabilidad se hace descender a 95

672 El director de la secdon de control dela rabia del departamento de salud publica desea extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso del ano anterior para estimar la edad media de las personas mordidas Requiere un intervalo de confianza de 95 por dento decide utilizar un valor de 25 para d y a partir de estudios anteriores estima que la desviacion estandar de la poblacion esta alrededor de los 15 anos ~Que tan grande debe ser el tamano de la muestra

673 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mglOO ml) de pacientes atendidos en una clinica para diabeticos durante el transcurso de los ultimos 10 anos Determine el numero de registros que el medico debe examinar para obtener un intershyvalo de confianza de 90 por ciento para 11 si la dimension requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varian cia de 60

674 Se deseaestimar la edad media en la que a los padentes de esclerosis multiple se les diagnosshytico el padecimiento por primera vez Se requiere un intervalo de confianza de 95 por dento con una dimension de 10 anos Si la variancia de la poblaci6n es de 90 ~que tan grande debera ser la muestra

68 DETERMINACION DELTAMANO DE lA MUESTRA PARA lA ESIDIACION DE lAS PROPORCIONES

EI metodo para estimar el tamafio de la muestra cuando se requiere estimar la proshyporcion de una poblacion es esencialmente el mismo que se describio para estimar la media de una poblacion Se aprovecha el hecho de que la mitad del intervalo deseashydo d se puede igualar al producto del coeficiente de confiabilidad y el error estandar

Si se supone que el muestreo ha sido hecho de manera aleatoria y que existen condiciones que garanticen que la distribuci6n de psea aproximadamente normal se obtiene la siguiente formula para n cuando el muestreo es con reemplazo cuanshydo se realizaa partir de una poblacion infinita 0 ruando la poblacion muestreada es 10 suficientemente grande como para hacer innecesario el uso de la correcci6n por poblacion finita

n (681)

dondeq = I-p Si la correccion por poblacion finita no puede descartarse la formula adecuashy

da paran es

(682)n d 2 (N -1)+z2pq

euan do N es grande en comparacion con n (es decir n IN 05) se puede pasar por alto la correccion por poblacion finita y la ecuacion 682 se reduce a la ecuacion 681

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

180 CAPITULO 6 ESTlMACI6N

ya un intervalo de confianza de 95 por ciemo para la diferenda entre las proporciones de varones en las dos poblaciones

662 Una investigaci6n de Lane et ai (A-I8) valor6las diferencias en las pnicticas de deteccion de cancer de seno entre muestras de mujeres predominantemente de bajos ingresos con edashydes de 50 a 75 anos que lltilizan los servicios de c1inicas de sailld para todo el estado y mlljeres de la misma edad residentes en ciudades donde las c1inicas de salud son locales De las 404 encuestadas seleccionadas en toda la comunidad 592 por ciento estuvo de acuerdo con el siguiente comentario acerca del cancer de pecho las mujeres prolongan su vida si detectan el cancer desde el inicio De entre 795 usuarias de clinicas de salud en la mllestra 449 por ciento estuvo de acuerdo Establezca las suposiciones apropiadas para elaborar un intervalo de confianzade 99 por ciento para la diferencia entre las dos proporciones de las poblaciones de interes

663 Williams et at (A-19) encuestaron a una muestra de 67 medicos y 133 enfermeras con famishyliares farmacodependientes EI prop6sito del estudio era evaluar la influencia en los medishyEOS y enfermeras de estar estrechamente involucrados con una 0 mas personas farmaco dependientes Cincuenta y dos medicos y 89 enfermeras dijeron que vivian con personas farmacoldependientes que adversamente afectaban 8U trabajo E8tablezca todas las consideshyraciones que crea necesarias para construir un intervalo de confianza de 95 por ciento para la diferencia entre las proporciones en las dos poblaciones de trabajadores que se espera esten adversamente afectados por vivir con personas farmacodependientes

664 Aronow y Kronzon (A-20) identificaron los factores de riesgo coronado entre hombres y mujeres en una dinica de cuidados de la salud a largo plazo De los 215 individuos negros 58 tienen diabetes mellitus al igual que 217 individuos blancos de 1140 Elabore un intervalo de confianza de 90 por ciento de confianzapara la diferencia entre las proporciones de las dos poblaciones tCuaies son las poblaciones correspondientes ~Que consideraciones son necesarias para hacer valido el procedimiento de inferencia

67 DETEHMINAUON DEL TAMANO DE LA MUESTRA PARA LA ESTIMACIONDEIAS MEDIAS

La pregunta de que tan grande debe ser una muestra surge inmediatamente al inicio del planteamiento de cualquier encuesta 0 experimento Esta es una pregunshyta importante y no se debe tratara la ligera Tomar una muestra mas grande de 10 necesario para obtener los resultados deseados es un desperdicio de recursos mienshytras que por otro lado las muestras demasiado pequenas con frecuencia dan resulshytados que carecen de uso practico En esta secci6n se estudia c6mo determinar el tamano de la muestra de acuerdo con la situaci6n A continuaci6n se proporciona un metodo para determinar el tamano de la muestra que se requiere para estimar Ia media de la poblaci6n yen la siguiente secci6n se aplica este metodo para detershyminar el tamano de la milestra cuando se desea estimar la proporci6n de una poshyblaci6n Mediante extensiltmes directas de estos metodos es posible determinar el tamano necesario de las muestras para situaciones mas complicadas

Objetivos El objetivo de la estimaci6n porintervalos es el de obtener intervalos estrechos con alta confiabilidad Si se observan los componentes ~e un intervalo de confianzase veque 8U dimension esta determinada por la magnitud de la cantidad

(coeficiente de confiabilidad) x (error estandar)

131 67 DETERMINACION DEL TAMANO PARA LA l-IUESTRAmiddot

ya que lamagnitud total del intervalo de confIanza es eldoble de esta cantidad Se aprendi6 que a esta cantidad generalmente se Ie llama precisi6n de la estimaci6n o margen de error Para un error estandar dado incrementar la confIabilidad signishyfIca un coefIciente con mayor confIabilidad Y un coefIciente con mayor confIabilidad produce unintervalo mas amplio

Por otra parte si se ftia el coefIciente de confIabilidad la unica manera de redudr la amplitud del intervalo es la reducci6n del error estandar Dado que el error estandar es igual a (J IJ y como (J es una constante la unica forma de obtener un error estandar menor es tomar una muestra grande ~Que tan grande debeser la muestra Esto depende del tamafio de (J la desviad6n estandar de la poblaci6n asi como del grado de confIabilidad y dimensi6n del intervalo deseados

Suponga que se desea obtener un intervalo que se extienda d unidades hacia uno y otro lado del estimador Ellose enuncia

d (coefIciente de confIabilidad) X (error estandar) (671)

Si el muestreo es con reemplazos a partir de una poblaci6n infInita 0 de una que sea 10 sufIcientemente grande como para ignorar la correcci6n por poblaci6n fInita la ecuaci6n 671 se transforma en

(J

d z- (672)-r la cual cuando se despeja n nos da

(673)d2

Cuando el nmestreo se hacesin reemplazos a partir de una poblaci6n fInita y peshyquefia se requiere de la correcci6n por poblaci6n fInita y la ecuaci6n 671 se transforma en

(J~d (674)fN~

que al despejar n resulta en

n-----shy (675)d 2(N 1) + Z2(J2

Si puede omitirse la correcci6n por poblad6n fInita la ecuaci6n 675 se reshyduce a la ecuaci6n 673

Estillluci6n de (J 2 Las f6rmulas para el tamafio de la muestra requieren del conocimiento de (J2 pero como ya se ha sefialado la varian cia de la poblaci6n casi

132 CAPITULO 6 ESTlMACION

siempre sedesconoce Como resultado esnecesarioestimar (J2 Las fuentes de estishymaci6n de(J2 que se utilizan con mas frecuencia son las siguientes

1 Se extrae una muestrapilato 0 prel~l11inar de lapoblaci6n y se puede utilizar la variancia calculada a partir de esta muestra como unaestimaci6n de (J2 Las observaciones uti lizadas en la muestra piloto se toman como parte de la muesshytrafinal de modo que n (el tamaiio calculado de la muestra) n

1 (el tamaiio

de la muestra piloto) n2 (el numero de observaciones necesarias para satisfacer el requerimiento total del tamaiio de la muestra)

2 A partir de estudios anteriores osimilares es posible obtener estimaciones de (J2

3Si se cree que la poblaci6n de lacual se extrae la muestraposee una distribushyci6n aproximadamente nqrmal se puede aprovechar el hecho de que la amshyplitud es aproximadamente igual a 6 desviaciones estandar y calcular (J R6 Este metodo requiere aIglin conocimiento acerca de los valores minimo y maximo de la variable en la poblaci6n

EJEMPLO 671

Un nutri6logo del departamento de salud al efectuar una encuesta entre una poshyblacien de muchachas adolescentes con e1 fin de determinitr su ingesti6n diaria promedio de proteinas (medidas en gramos) busc6 el consejo de un bioestadistico con respecto al tamaiio de la muestra que deberfa tomar

~Que procedimiento debe seguir el bioestadistico para asesorar al nutri610go Antes de que el estadistico pueda ayudar el nutri6logo este debe proporcionar tres elementos de informaci6n h dimensi6n deseada del intervalo de confianza el nivel de confianza deseado y la magnitud de la variancia de la poblaci6n

Soludon Suponga que el nutri6logo requiere un intervalo con una dimensi6n de aprQximadamente 10 gramos es decir la estimaci6n se deberfa enconshytrar alrededor de 5 gramos de la media de la poblaci6n en ambas direcshyciones En otras palabras se desea un margen de error de 5 gramos Suponga que se decide por un coeficiente de confian7a de 95 y que con base en su experiencia previa el nutri6logo percibe que la desviaci6n estandar de la poblaci6n es probablemente de alrededor de 20 gramos EI estadfstico dispone ya de la informaci6n necesaria para calcular el tamaiio de la muestra z 196 (J = 20 y d 5 Suponga que el tamaiio de la poblaci6n es grande asf queel estadistico puede ignorar la correcshyci6n por poblaci6n finita y utilizar la ecuaci6n 673 Con las sustitucioshynes adecuadas el valor de n se calcula como

Se recomienda que el nutri610go tome una muestra de tamafio 62 AI calcular el tamaiio de una muestra a partir de las ecuaciones 673 0 675 el resultado se redondea al siguiente nurnero entero mayor si los calculosdan un numerocon decimales bull

183 68 DETERMINACION DEL TAl1ANO PARA LAS PROPORCIONES

EJERCICIOS

671 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su hospital Si se desea un intervalo de confianza de 99 por dento con una amplitud de 1 libra ~que tan grande debe ser la muestra de los registros de nacimiento Suponga que un estimashy

dor razonable para (J es 1 libra ~De que tamano debe ser la muestra si el coeficiente de confiabilidad se hace descender a 95

672 El director de la secdon de control dela rabia del departamento de salud publica desea extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso del ano anterior para estimar la edad media de las personas mordidas Requiere un intervalo de confianza de 95 por dento decide utilizar un valor de 25 para d y a partir de estudios anteriores estima que la desviacion estandar de la poblacion esta alrededor de los 15 anos ~Que tan grande debe ser el tamano de la muestra

673 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mglOO ml) de pacientes atendidos en una clinica para diabeticos durante el transcurso de los ultimos 10 anos Determine el numero de registros que el medico debe examinar para obtener un intershyvalo de confianza de 90 por ciento para 11 si la dimension requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varian cia de 60

674 Se deseaestimar la edad media en la que a los padentes de esclerosis multiple se les diagnosshytico el padecimiento por primera vez Se requiere un intervalo de confianza de 95 por dento con una dimension de 10 anos Si la variancia de la poblaci6n es de 90 ~que tan grande debera ser la muestra

68 DETERMINACION DELTAMANO DE lA MUESTRA PARA lA ESIDIACION DE lAS PROPORCIONES

EI metodo para estimar el tamafio de la muestra cuando se requiere estimar la proshyporcion de una poblacion es esencialmente el mismo que se describio para estimar la media de una poblacion Se aprovecha el hecho de que la mitad del intervalo deseashydo d se puede igualar al producto del coeficiente de confiabilidad y el error estandar

Si se supone que el muestreo ha sido hecho de manera aleatoria y que existen condiciones que garanticen que la distribuci6n de psea aproximadamente normal se obtiene la siguiente formula para n cuando el muestreo es con reemplazo cuanshydo se realizaa partir de una poblacion infinita 0 ruando la poblacion muestreada es 10 suficientemente grande como para hacer innecesario el uso de la correcci6n por poblacion finita

n (681)

dondeq = I-p Si la correccion por poblacion finita no puede descartarse la formula adecuashy

da paran es

(682)n d 2 (N -1)+z2pq

euan do N es grande en comparacion con n (es decir n IN 05) se puede pasar por alto la correccion por poblacion finita y la ecuacion 682 se reduce a la ecuacion 681

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

131 67 DETERMINACION DEL TAMANO PARA LA l-IUESTRAmiddot

ya que lamagnitud total del intervalo de confIanza es eldoble de esta cantidad Se aprendi6 que a esta cantidad generalmente se Ie llama precisi6n de la estimaci6n o margen de error Para un error estandar dado incrementar la confIabilidad signishyfIca un coefIciente con mayor confIabilidad Y un coefIciente con mayor confIabilidad produce unintervalo mas amplio

Por otra parte si se ftia el coefIciente de confIabilidad la unica manera de redudr la amplitud del intervalo es la reducci6n del error estandar Dado que el error estandar es igual a (J IJ y como (J es una constante la unica forma de obtener un error estandar menor es tomar una muestra grande ~Que tan grande debeser la muestra Esto depende del tamafio de (J la desviad6n estandar de la poblaci6n asi como del grado de confIabilidad y dimensi6n del intervalo deseados

Suponga que se desea obtener un intervalo que se extienda d unidades hacia uno y otro lado del estimador Ellose enuncia

d (coefIciente de confIabilidad) X (error estandar) (671)

Si el muestreo es con reemplazos a partir de una poblaci6n infInita 0 de una que sea 10 sufIcientemente grande como para ignorar la correcci6n por poblaci6n fInita la ecuaci6n 671 se transforma en

(J

d z- (672)-r la cual cuando se despeja n nos da

(673)d2

Cuando el nmestreo se hacesin reemplazos a partir de una poblaci6n fInita y peshyquefia se requiere de la correcci6n por poblaci6n fInita y la ecuaci6n 671 se transforma en

(J~d (674)fN~

que al despejar n resulta en

n-----shy (675)d 2(N 1) + Z2(J2

Si puede omitirse la correcci6n por poblad6n fInita la ecuaci6n 675 se reshyduce a la ecuaci6n 673

Estillluci6n de (J 2 Las f6rmulas para el tamafio de la muestra requieren del conocimiento de (J2 pero como ya se ha sefialado la varian cia de la poblaci6n casi

132 CAPITULO 6 ESTlMACION

siempre sedesconoce Como resultado esnecesarioestimar (J2 Las fuentes de estishymaci6n de(J2 que se utilizan con mas frecuencia son las siguientes

1 Se extrae una muestrapilato 0 prel~l11inar de lapoblaci6n y se puede utilizar la variancia calculada a partir de esta muestra como unaestimaci6n de (J2 Las observaciones uti lizadas en la muestra piloto se toman como parte de la muesshytrafinal de modo que n (el tamaiio calculado de la muestra) n

1 (el tamaiio

de la muestra piloto) n2 (el numero de observaciones necesarias para satisfacer el requerimiento total del tamaiio de la muestra)

2 A partir de estudios anteriores osimilares es posible obtener estimaciones de (J2

3Si se cree que la poblaci6n de lacual se extrae la muestraposee una distribushyci6n aproximadamente nqrmal se puede aprovechar el hecho de que la amshyplitud es aproximadamente igual a 6 desviaciones estandar y calcular (J R6 Este metodo requiere aIglin conocimiento acerca de los valores minimo y maximo de la variable en la poblaci6n

EJEMPLO 671

Un nutri6logo del departamento de salud al efectuar una encuesta entre una poshyblacien de muchachas adolescentes con e1 fin de determinitr su ingesti6n diaria promedio de proteinas (medidas en gramos) busc6 el consejo de un bioestadistico con respecto al tamaiio de la muestra que deberfa tomar

~Que procedimiento debe seguir el bioestadistico para asesorar al nutri610go Antes de que el estadistico pueda ayudar el nutri6logo este debe proporcionar tres elementos de informaci6n h dimensi6n deseada del intervalo de confianza el nivel de confianza deseado y la magnitud de la variancia de la poblaci6n

Soludon Suponga que el nutri6logo requiere un intervalo con una dimensi6n de aprQximadamente 10 gramos es decir la estimaci6n se deberfa enconshytrar alrededor de 5 gramos de la media de la poblaci6n en ambas direcshyciones En otras palabras se desea un margen de error de 5 gramos Suponga que se decide por un coeficiente de confian7a de 95 y que con base en su experiencia previa el nutri6logo percibe que la desviaci6n estandar de la poblaci6n es probablemente de alrededor de 20 gramos EI estadfstico dispone ya de la informaci6n necesaria para calcular el tamaiio de la muestra z 196 (J = 20 y d 5 Suponga que el tamaiio de la poblaci6n es grande asf queel estadistico puede ignorar la correcshyci6n por poblaci6n finita y utilizar la ecuaci6n 673 Con las sustitucioshynes adecuadas el valor de n se calcula como

Se recomienda que el nutri610go tome una muestra de tamafio 62 AI calcular el tamaiio de una muestra a partir de las ecuaciones 673 0 675 el resultado se redondea al siguiente nurnero entero mayor si los calculosdan un numerocon decimales bull

183 68 DETERMINACION DEL TAl1ANO PARA LAS PROPORCIONES

EJERCICIOS

671 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su hospital Si se desea un intervalo de confianza de 99 por dento con una amplitud de 1 libra ~que tan grande debe ser la muestra de los registros de nacimiento Suponga que un estimashy

dor razonable para (J es 1 libra ~De que tamano debe ser la muestra si el coeficiente de confiabilidad se hace descender a 95

672 El director de la secdon de control dela rabia del departamento de salud publica desea extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso del ano anterior para estimar la edad media de las personas mordidas Requiere un intervalo de confianza de 95 por dento decide utilizar un valor de 25 para d y a partir de estudios anteriores estima que la desviacion estandar de la poblacion esta alrededor de los 15 anos ~Que tan grande debe ser el tamano de la muestra

673 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mglOO ml) de pacientes atendidos en una clinica para diabeticos durante el transcurso de los ultimos 10 anos Determine el numero de registros que el medico debe examinar para obtener un intershyvalo de confianza de 90 por ciento para 11 si la dimension requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varian cia de 60

674 Se deseaestimar la edad media en la que a los padentes de esclerosis multiple se les diagnosshytico el padecimiento por primera vez Se requiere un intervalo de confianza de 95 por dento con una dimension de 10 anos Si la variancia de la poblaci6n es de 90 ~que tan grande debera ser la muestra

68 DETERMINACION DELTAMANO DE lA MUESTRA PARA lA ESIDIACION DE lAS PROPORCIONES

EI metodo para estimar el tamafio de la muestra cuando se requiere estimar la proshyporcion de una poblacion es esencialmente el mismo que se describio para estimar la media de una poblacion Se aprovecha el hecho de que la mitad del intervalo deseashydo d se puede igualar al producto del coeficiente de confiabilidad y el error estandar

Si se supone que el muestreo ha sido hecho de manera aleatoria y que existen condiciones que garanticen que la distribuci6n de psea aproximadamente normal se obtiene la siguiente formula para n cuando el muestreo es con reemplazo cuanshydo se realizaa partir de una poblacion infinita 0 ruando la poblacion muestreada es 10 suficientemente grande como para hacer innecesario el uso de la correcci6n por poblacion finita

n (681)

dondeq = I-p Si la correccion por poblacion finita no puede descartarse la formula adecuashy

da paran es

(682)n d 2 (N -1)+z2pq

euan do N es grande en comparacion con n (es decir n IN 05) se puede pasar por alto la correccion por poblacion finita y la ecuacion 682 se reduce a la ecuacion 681

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

132 CAPITULO 6 ESTlMACION

siempre sedesconoce Como resultado esnecesarioestimar (J2 Las fuentes de estishymaci6n de(J2 que se utilizan con mas frecuencia son las siguientes

1 Se extrae una muestrapilato 0 prel~l11inar de lapoblaci6n y se puede utilizar la variancia calculada a partir de esta muestra como unaestimaci6n de (J2 Las observaciones uti lizadas en la muestra piloto se toman como parte de la muesshytrafinal de modo que n (el tamaiio calculado de la muestra) n

1 (el tamaiio

de la muestra piloto) n2 (el numero de observaciones necesarias para satisfacer el requerimiento total del tamaiio de la muestra)

2 A partir de estudios anteriores osimilares es posible obtener estimaciones de (J2

3Si se cree que la poblaci6n de lacual se extrae la muestraposee una distribushyci6n aproximadamente nqrmal se puede aprovechar el hecho de que la amshyplitud es aproximadamente igual a 6 desviaciones estandar y calcular (J R6 Este metodo requiere aIglin conocimiento acerca de los valores minimo y maximo de la variable en la poblaci6n

EJEMPLO 671

Un nutri6logo del departamento de salud al efectuar una encuesta entre una poshyblacien de muchachas adolescentes con e1 fin de determinitr su ingesti6n diaria promedio de proteinas (medidas en gramos) busc6 el consejo de un bioestadistico con respecto al tamaiio de la muestra que deberfa tomar

~Que procedimiento debe seguir el bioestadistico para asesorar al nutri610go Antes de que el estadistico pueda ayudar el nutri6logo este debe proporcionar tres elementos de informaci6n h dimensi6n deseada del intervalo de confianza el nivel de confianza deseado y la magnitud de la variancia de la poblaci6n

Soludon Suponga que el nutri6logo requiere un intervalo con una dimensi6n de aprQximadamente 10 gramos es decir la estimaci6n se deberfa enconshytrar alrededor de 5 gramos de la media de la poblaci6n en ambas direcshyciones En otras palabras se desea un margen de error de 5 gramos Suponga que se decide por un coeficiente de confian7a de 95 y que con base en su experiencia previa el nutri6logo percibe que la desviaci6n estandar de la poblaci6n es probablemente de alrededor de 20 gramos EI estadfstico dispone ya de la informaci6n necesaria para calcular el tamaiio de la muestra z 196 (J = 20 y d 5 Suponga que el tamaiio de la poblaci6n es grande asf queel estadistico puede ignorar la correcshyci6n por poblaci6n finita y utilizar la ecuaci6n 673 Con las sustitucioshynes adecuadas el valor de n se calcula como

Se recomienda que el nutri610go tome una muestra de tamafio 62 AI calcular el tamaiio de una muestra a partir de las ecuaciones 673 0 675 el resultado se redondea al siguiente nurnero entero mayor si los calculosdan un numerocon decimales bull

183 68 DETERMINACION DEL TAl1ANO PARA LAS PROPORCIONES

EJERCICIOS

671 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su hospital Si se desea un intervalo de confianza de 99 por dento con una amplitud de 1 libra ~que tan grande debe ser la muestra de los registros de nacimiento Suponga que un estimashy

dor razonable para (J es 1 libra ~De que tamano debe ser la muestra si el coeficiente de confiabilidad se hace descender a 95

672 El director de la secdon de control dela rabia del departamento de salud publica desea extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso del ano anterior para estimar la edad media de las personas mordidas Requiere un intervalo de confianza de 95 por dento decide utilizar un valor de 25 para d y a partir de estudios anteriores estima que la desviacion estandar de la poblacion esta alrededor de los 15 anos ~Que tan grande debe ser el tamano de la muestra

673 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mglOO ml) de pacientes atendidos en una clinica para diabeticos durante el transcurso de los ultimos 10 anos Determine el numero de registros que el medico debe examinar para obtener un intershyvalo de confianza de 90 por ciento para 11 si la dimension requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varian cia de 60

674 Se deseaestimar la edad media en la que a los padentes de esclerosis multiple se les diagnosshytico el padecimiento por primera vez Se requiere un intervalo de confianza de 95 por dento con una dimension de 10 anos Si la variancia de la poblaci6n es de 90 ~que tan grande debera ser la muestra

68 DETERMINACION DELTAMANO DE lA MUESTRA PARA lA ESIDIACION DE lAS PROPORCIONES

EI metodo para estimar el tamafio de la muestra cuando se requiere estimar la proshyporcion de una poblacion es esencialmente el mismo que se describio para estimar la media de una poblacion Se aprovecha el hecho de que la mitad del intervalo deseashydo d se puede igualar al producto del coeficiente de confiabilidad y el error estandar

Si se supone que el muestreo ha sido hecho de manera aleatoria y que existen condiciones que garanticen que la distribuci6n de psea aproximadamente normal se obtiene la siguiente formula para n cuando el muestreo es con reemplazo cuanshydo se realizaa partir de una poblacion infinita 0 ruando la poblacion muestreada es 10 suficientemente grande como para hacer innecesario el uso de la correcci6n por poblacion finita

n (681)

dondeq = I-p Si la correccion por poblacion finita no puede descartarse la formula adecuashy

da paran es

(682)n d 2 (N -1)+z2pq

euan do N es grande en comparacion con n (es decir n IN 05) se puede pasar por alto la correccion por poblacion finita y la ecuacion 682 se reduce a la ecuacion 681

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

183 68 DETERMINACION DEL TAl1ANO PARA LAS PROPORCIONES

EJERCICIOS

671 La administradora de un hospital desea estimar el peso medio de los bebes nacidos en su hospital Si se desea un intervalo de confianza de 99 por dento con una amplitud de 1 libra ~que tan grande debe ser la muestra de los registros de nacimiento Suponga que un estimashy

dor razonable para (J es 1 libra ~De que tamano debe ser la muestra si el coeficiente de confiabilidad se hace descender a 95

672 El director de la secdon de control dela rabia del departamento de salud publica desea extraer una muestra de los registros de mordidas de perro reportadas durante el transcurso del ano anterior para estimar la edad media de las personas mordidas Requiere un intervalo de confianza de 95 por dento decide utilizar un valor de 25 para d y a partir de estudios anteriores estima que la desviacion estandar de la poblacion esta alrededor de los 15 anos ~Que tan grande debe ser el tamano de la muestra

673 Un medico desea conocer el valor medio de glucosa en la sangre en ayunas (mglOO ml) de pacientes atendidos en una clinica para diabeticos durante el transcurso de los ultimos 10 anos Determine el numero de registros que el medico debe examinar para obtener un intershyvalo de confianza de 90 por ciento para 11 si la dimension requerida para el intervalo es de 6 unidades y una muestra piloto presenta una varian cia de 60

674 Se deseaestimar la edad media en la que a los padentes de esclerosis multiple se les diagnosshytico el padecimiento por primera vez Se requiere un intervalo de confianza de 95 por dento con una dimension de 10 anos Si la variancia de la poblaci6n es de 90 ~que tan grande debera ser la muestra

68 DETERMINACION DELTAMANO DE lA MUESTRA PARA lA ESIDIACION DE lAS PROPORCIONES

EI metodo para estimar el tamafio de la muestra cuando se requiere estimar la proshyporcion de una poblacion es esencialmente el mismo que se describio para estimar la media de una poblacion Se aprovecha el hecho de que la mitad del intervalo deseashydo d se puede igualar al producto del coeficiente de confiabilidad y el error estandar

Si se supone que el muestreo ha sido hecho de manera aleatoria y que existen condiciones que garanticen que la distribuci6n de psea aproximadamente normal se obtiene la siguiente formula para n cuando el muestreo es con reemplazo cuanshydo se realizaa partir de una poblacion infinita 0 ruando la poblacion muestreada es 10 suficientemente grande como para hacer innecesario el uso de la correcci6n por poblacion finita

n (681)

dondeq = I-p Si la correccion por poblacion finita no puede descartarse la formula adecuashy

da paran es

(682)n d 2 (N -1)+z2pq

euan do N es grande en comparacion con n (es decir n IN 05) se puede pasar por alto la correccion por poblacion finita y la ecuacion 682 se reduce a la ecuacion 681

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

184 CAPITULO 6 ESTIMACION

Estimacion de p Como puede observarse ambas formulas requieren que se conozcaP que es la prop orcion de poblacion que posee la caracteristica de interes Obviamente dado que este es el panimetro que se desea estimar sera desconocido Una solucion para este problema consiste en tomar una muestra piloto y calcular una estimacion para utilizarla en lugar de p dentro de la formula para n Algunas veces el investigador tendra nocion de algUn limite superior para pque podra uti shylizar en la formula Par ejemplo si se desea estimar la proporcion de alguna poblashycion que presenta cierta discapacidad es posible que se crea que la proporcion real no puede ser mayor que digamos 30 Se sustituye entonces ppor 30 en la formushyla para n Si es imposible obtener una mejor estimacion se puede igualar p a 5 y resolver para n Dado que p 5 en la formula proporcionael maximo valor de n este procedimiento dara una muestra 10 suficientemente grande para alcanzar la confiabiIidad y la dimensi6n del intervalo deseadas Sin embargo puede ser mas grande de 10 necesario y resultar mas costosa que si se dispusiera de una mejor estimacion de p Este procedimiento se debe utilizar solamente si no se puede lleshygar a una mejor estimacion de p

FJEMPLO 681

Se planea realizar una encuesta para determinar que proporcion de fami1ias en cierta area carece de servicios medicos Se cree que la proporcion no puede ser mayor que 35 Se desea un intervalo de tonfianza de 95 por ciento con d = 05 ~De que tamano se debe seleccionar 1a muestra de familias

Solucion Si se omite la correcci6n por poblacion finita se tiene

n (196)2(35)(65) =3496 (05)2

Por 10 tanto e1 tamano de la muestra es de 350 bull FJERCICIOS

681 Un epidemiQlogo desea saber que proporci6n de adultos que viven en una gran area metroposhylilmla tienen el subtipo ay del virus B de la hepatitis Detennine el tamano de la muestra que pudiera ser necesario para estimar una proporci6n real cercana a 03 con una confianza de 95 por demo Se sabe que en un area metropolitana similar la proporci6n de adultos con esa earacterfstica es de 20 Si los datos para otra area metropolitana no estuvieran disponibles y no se pudiera obtener una muestra piloto (eual sena el tamano requerido de la muestra

682 Se planea realizar una encuesta para determinar que proporci6n de los estudiantes de seshycundaria de un sistema escolar metropolitano han fumado regularmente marihuana Si no se euenta con una estimaei6n de p de estudios anteriores no se puede extraer una muestra piloto se desea un eoefieiente de eonfianza de 95 y se decide utilizar el valor de d 04 Determine el tamano adecuado de la muestra ~De que tamano debera ser la muestra para obtener un intervalo de eonflanza de 99 por demo

683 EI administrador de un hospital desea saber que proporei6n de paeientes dados de alta estan inconformes con la atend6n redbida durante su hospitalizaci6n Si d = 05 el coeficiente de

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

69 INTERVALO DE CONFIANZA PARA LA VARIANCIA DE POBLACIONES 185

confianza es de 95 y no se dispone de ninguna otra informacion ~que tan grande debe ser la muestra ~Que tamafio debe tener si el valor de pes de aproximadamente 25

684 Una agencia de planificacion de la salud desea saber en una region geognifica determinada que proporcion de pacientes admitidos en hospitales para tratamiento de traumatismos abanshydonaron el hospital por defundon Se requiere de un intervalo de confianza de 95 por dento con una amplitud de 06 y a partir de otra evidencia se estima que la proporcion de la poblaci6nes de 20 ~Que tan grande debe ser la muestra

69 INTERVALO DE CONFIANZA PABA lA VARIANCIA DE POBlACIONES CON DISTRIBUCION NORMAL

Estimaci6n puntual de la variancia de la poblaciOn En las secciones anteriores se sugiri6 que cuando se desconoce Ia variancia de la poblaci6n es posishyble utilizar la variancia de la muestra como un estimador Es posible que ellector se pregunte respecto a la caUdad de este estimador Se ha estudiado s610 un criterio de bondad el de ser insesgado asi que es necesario revisar si la variancia de la muesshytra es un esthnador insesgado de la variancia de la poblaci6n Para ser insesgado el valor promedio de la variancia de la muestra sobre todas las muestras posibles debe ser iguala la variancia de la poblaci6n Esto es debe cumplirse la expresi6n E(S2) (j2 Para ver si esta condici6n se cumple en una situaci6n particular se considera el ejemplo de la secci6n 53 para obtener una qistribuci6n muestral En la tabla 531 se presentan todas las muestras posibles de tamano 2 a partir de la poblaci6n forshymada con valores 68 10 12 Y 14 Recuerde que dos medidas de dispersi6n para esta poblaci6n se calcularon como

L(X 11)2 L(X 11)2 (j2 = i - r- = 8 Y S2 = I r- =10

N N-l

Si se calcula la variancia de la muestra S2 = L(X x)2j(n 1) para cada una de las muestras posibles que aparecen en la tabla 531 se obtienen las variancias muestrales de la tabla 691

TABlA 691 Variancias calenladas a partir de las mnestras de la tabla 531

Segundaextraccion

6 8 10 12 14

Primera extraccion

6 8

10 12 14

0 2 8

18 32

2 8 18 0 2 8 2 0 2 8 2 0

18 8 2

32 18 8 2 0

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

186 CAPjTUL06 ESTIMACION

Muestreo con reemplazos Si el muestreo es con reemplazos el valor esperashydo de 52 se obtiene tomando la media de todas las variancias posibles de las muesshytras en la tabla 691 Cuando se hace esto se obtiene

L s2 0 + 2 + + 2 + 0 200 E(S2)=__ = =-=8

N 25 25

y se aprecia por ejemplo que cuando el muestreo es con reemplazos E(S2) = cr2

donde S2 =L(xi -W (n -1) y cr2 L(Xi 11)2 N

Maestreo sin reemplazos Si se considera el caso donde el muestreo es sin reemplazos el valor esperado de S2 se obtiene al tomar la media de todas las variancias por encima (0 por abajo) de la diagonal principal Esto es

2+8+middotmiddotmiddot+2 100 10

lO lO

que tal como se observa no es igual a cr2 sino igual a S2 L(X 11)2 (N -1) Estos resultados son ejemplos de principios generales ya que es posible mosshy

trar en terminos generales que

E(S2) = cr2 cuando el muestreo se realiza con reemplazo E(52) = S2 cuando el muestreo se realiza sin reemplazo

Cuando N es grande N 1 Y N son aproximadamente iguales y en conseshycuencia cr2 y S2 serfm aproximadamente iguales

Estos resultados justifican el uso de S2 = L(xi middot )2 (n -1) cuando se calcula la variancia de la muestra Asimismo debe notarse que a pesar de que 52 es un estimador insesgado de cr2 s no es un estimador insesgado de cr Sin embargo el sesgo disminuye rapidamente a medida que aumentan

Estimacion por ildervalos de la variancia de anapoblacion Con una estimaci6n puntual disponible resulta 16gico preguntarse acerca de la consshytrucci6n de un intervalo de confianza para la variancia de una poblaci6n El exito al construir un intervalo de confianza para cr2 depende de la capacidad para enconshytrar una distribuci6n muestral adecuada

La distribuciOn deji-cuadrada En general los intervalos de confianza para cr2 se basan en la distribud6n muestral de (n - l)s2cr2

bull Si se extraen muestras de tamano n de una poblaci6n con distribuci6n normal esta cantidad tiene una distrishybuci6n conocida como distribuci6n ji-cuadrada (x2) con n 1 grados de libertad En el capitulo siguiente se habIanl mas acerca de esta distribud6n aqui s610 se did que esta es la distribuci6n que sigue la cantidad (n - 1)s2cr2 y que resulta util para calcushylar los intervalos de confianza para cr2 cuando se cumple el supuesto de que la pobIaci6n sigue una distribuci6n normal

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

69 INTERV ALO DE CONFIANZA PARA LA V ARIANCIA DE POBLACIONFS 187

FIGURA 691 Distribuciones deji-cuadrada para algunosgrados de libertad k (Fuente utilizada con autorizaci6n de Paul G Hoel y Raymond] ] essen Basic Statistics for Business and Economics Wiley)

En la figura 691 se muestran algunas distribuciones ji-cuadrada para difeshyrentes grados de libertad En la tabla F se encuentran los percentiles de la distribuci6n ji-cuadrada Los encabezados de las columnas dan los valores de X2 ala izquierda de los cuales esta una proporci6n del area total bajo la curva igual a los subIndices de X2 Las denominaciones de los renglones son los grados de libertad

Para obtener un intervalo de confianza de 100(1 a) porciento para al se obtiene primero el intervalo de confianza de 1OO( 1 - a) por ciento para (n 1)s202 Para efectuar este procedimiento se seleccionan los valores X2 de la tabla F de tal modo que a2 quede a la izquierda del valor menor y a2 quede a la derecha del valor mayor En otras palabras los dos valores de X2 se seleccionan de modo que a se divide en partes iguales entre las dos colas de la distribuci6n Estos dos valoshyres de X2 se designan como X~12 y X-(aI2) respectivamente Por 10 tanto el intervalo de confianza de 100(1- a) porcientopara (n - 1)s202 esta dado por

2 (n -1)s2 2middot

Xa2 lt 2 lt XI-(aI2)a Ahora se utiliza esta ecuaci6n para obtener una f6rmula con 0 2 como unico

termino centraL Primero se divide cada termino por (n 1)s2 para obtener

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

188 CAPITULO 6 ESTlMACION

Si se aplica el elemento redproco en esta ecuaci6n se obtiene

(n -1)s2 2 (n -1)s2 ---------gt()gt-------shy

X~2 Xi-(a2)

N6tese que la direcci6n de las desigualdades cambian cuando se aplica el elemento redproco Pero si se invierte el orden de los terminos se tiene

(-I)s2 2 (n-l)s2 --- lt () lt ------shy (691)X~-(a2) ~2

que es un intervalo de confianza de 100(1- a) por ciento para ()2 Si se toma la rafz cuadrada de cada termino de la ecuaci6n 691 se tiene el siguiente intervalo de confianza de 100(1 - a) para la desviaci6n estandar de la poblaci6n

(n l)s210ltn_--1)S_2 lt () lt (692) ~ X~a2)

EJEMPLO 691

Enmiddot una investigacion de los efectos de dietas con densidad baja en colesterol lipoproteico Rassias et al (A-21) estudiaron a 12 individuos hombres y mujeres medianamente hipercolesterolemicos Los niveles de colesterol (mmoVl) para estos individuos fueron 60 64 70 58 60 58 59 67 61 65 63 58 Se supone que los 12 individuos forman una muestra aleatoria simple extrafda de una poblashycion de individuos similares que sigue una distribucion normal Se pretende estishymar a partir de los datos de la muestra la variancia de los nivelesdel colesterol del plasma en la poblacion con un intervalo de confianza de 95 por ciento

Soluci6n La muestra produce un valor para S2 391868 Los grados de libertad son n - 1 = 11 Los valores convenientes para X2 a partir de la tabla F son Xf-(a2)= 21920 Y X2 31816 EI intervalo de confianza de 95 por ciento para ()2 es

11(391868) lt ()2 lt 11(391868)

2192031816 196649087 lt ()2 lt 135483656

EI intervalo de confianza para () es

4434 lt () lt 11640

Se tiene un 95 por ciento de confiariza de que los panimetros estishymados estan dentro de los lfmites especificados porque se sabe que a la larga al muestrear varias veces 95 por ciento de los intervalos construishydos como se llustro incluirfan los parametros respectivos bull

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

FJERCICIOS

EJERCICIOS 189

Algunas precauciones Aunque este metodo para obtener los intervalos de confianza para cr2 se utiliza ampliamente no carece de inconvenientes Primeshyro la suposicion de normalidad para la poblacion de la cual se extrae la muesshytra es muy importante y los resultados pueden ser enganosos si se ignora esta suposicion

Otra dificultad con estos intervalos resulta del hecho de que el estimador no esta en el centro del intervalo de confianza como en el caso delintervalo de conshyfianza para ~ Esto se debe a que la distribudon de ji-cuadrada a diferencia de la normal no es simetrica La consecuencia pnictica de ello es que el metodo descrito para la obtencion de los intervalos de confianza para cr2 no produce los intervalos de confianza mas cortos posibles Tate y Klett (12) proporcionan tab las que pueden servir para veneer esta dificultad

691 Los objetivos del estudio de Kennedy yBhambhani (A-22) son utilizar las medidones psicoshy16gicas para determinar la confiabilidad de la prueba de reerisayo del emulador de trabajo del equipo terapeutico de Baltimore durante tres tareas simUladas aplicadasen laintensidad de trabajo leve medio y pesado y examinar la validez de los criterios de las tareas al compashyrarlas contra las tareas rea1es hechas en un laboratorio de ambiente contro1ado Los 30 indishyviduos son hombres sanos con eclades entre 18 y 35 anos Los investigadores informaron una desviaci6n estandar de 57 para 1a variable consumo pico de oxigeno (Umin) durante uno de 10sprocedimientos Describa 1a poblaci6n dela que fueron tornados los datos para 1a muesshytra para hacer inferencias Construya un intervalo de confianzade 95 por dento para la variancia poblacional de la variable consumo de oxigeno

692 Kubic et al (A-23) evaluaron los parametros hematol6gicos de 11 pacientes con la infeccion docurnentada de Bordetella pertussis Los individuos estudiados son 11 ninos infectados con edades entre un mes y 45 aDos La cuenta de gl6bulos blancos (WBC)(x109l) en los sujetos de estudio son 202 15484298409 197495 121320729 135 (Fuente Virginia L Kubic Paill T Kubic y Richard D Brunning The Morphologic and Immunophenotypic Assessment of the Lymphocytosis Accompanying Bordetella pertussis Infection AmericanJoumal oClinical Pathology 95 809-815) Describa la poblad6n de la que podran tomarse los datos para hacer inferencias Construya un intervalo de confianza de 90 por dento para la varian cia de la cuenta de gl6bulos blancos para esta poblaci6n

693 Se calcul6la capacidad vital forzada de 20 varones adu1tos sanos La variancia de la muestra fue de 1000000 Construya intervalos deconfianza de 90 por ciento para cr2 y cr

694 En un estudio de los tiempos de circulaci6n sangufnea en el miocardio se obtuvieron los tiempos de circulaci6n aparente en una muestra de 30 pacientes con enfermedad arterial coronaria Se encontr6 que la variancia de la muestra es de 103Construya interval os de confianza de 99 dento para cr2 y cr

695 Una muestra de 25 hombres fisica y mentalmente sanos particip6 en Un experimento acerca del sueiio en el cual se registr6 el porcentaje del tiempo total transcurrido durante cierta etapa del sueiio en cada uno de los participantes La variancia calculada a partir de los datos de la muestra es 225 Construya intervalos de confianza de 95 por ciento para cr y ()2

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

190 CAPITULO 6 ESTIMACION

696 Se midieron las concentraciones de hemoglobina en 16 ani males expuestos a un compuesto quimico nocivo Se registraron los siguientes valores 156 148 144 166 138 140 173 174 186 162147157 164 139 148 175 Construya intervalos de confianza de 95 por ciento para cr2 y cr

697 Veinte muestras de la calidad del aire tomadas en una misma regi6n durante un periodo de 6 meses presentaron las siguientes cantidades de partfculas suspendidas de materia (microshygramos por metro cubico deaire)

68 22 36 32 42 24 28 38 30 44 28 27 28 43 45 50 79 74 57 21

Considere que estas mediciones constituyen una muestra aleatoria a partir de una poblaci6n que sigue una distribuci6n normal para construir los intervalos de confianza de 95 por ciento para la variancia poblacional

610 INTERVALO DE COr1f1ANZAPARAlARAZON DE lAS VARIANCIAS DE DOS POBlACIONES CON DISTRIBUCION NORMAL

Con frecuencia se tiene iriteres en comparar dos variancias y una manera de hacershy10 es obtener su razon lt5~ 1lt5~ Si lasdos variancias son iguales gU razon sera igual a 1 PorIo general las variancias de las poblaciones sondesc~nocidas y en conseshycuencia todacomparacion que haga debera basarse en las variancias de las muesshytras Para ser espedficos es posible que se pretenda estimar la razon de las variancias de dos poblaciones En la seccion 64 se indica que el uso valido de la distribucion t para elaborar los intervalosde confianza para la diferencia entre las medias de dos poblaciones requiere que las variancias sean iguales Si el intervalo de confianza para la razon de las variancias de dos poblaciones incluye a 1 se concluye que las variancias de las dos poblaciones puede ser de hecho iguales Una vez mas dado que esta es una forma de iriferenciase debe confiar en alguna distribucion muestral en este caso la distribucion de (S12 1lt5f) I(si 1lt5~) se utiliza siempre que se satisfagan ciertos supuestos Dichos supuestos son que S12 y si sean calculados a partir de muestras independientes de tamafto n

1 y n

2 respectivamente y que dichas muesshy

tras sean extraidas de poblaciones con distribucion normal Se utilizaa S12 para

designar a la mayor de las dos variancias

La distribucion F Si los supuestos son satisfechos (S12 1lt5n I(s Ilt5~)sigue una distribuci6n conocida Como distribuci6n F En un capitulo posterior se estudia el tema con mayor detalle pero hay que notar que esta distribuci6n depende de dos valores para los grados de libertad uno que corresponde al valor n] - J utilizado paracalcular Sj2 Y el otro valor correspondiente a n

2 - 1 usado para calcular si

Comunmente se les conoce como grados de libertad del numerador y grados de libertad del denominador La figura 6101 muestra algunas distribuciones F para diferentes

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

610 INTERVALO DE CONFIANZA PARA LA RAZON DE LAS VARIANCIAS 191

(1000)10

08

06 w lt

04

05 10 15 20 25 30 35 40

F

FIGU8A6101 Distribuci6nFpara varios grados de libertad (De Documenta Geigy Scientific Tables septima edici6n Gortesfa de Ciba-Geigy Limited Basel Switzerland)

combinaciones de los grados de libertad del numerador y del denominador La tabla G contiene para combinadones espedficas de grados de libertad y valores de a los valotes de F ala derecha de las males se tiene al2 del area bajo la curva de F

Intervalo de confianza para ai10 Para encontrar el intervalo de confianshyza de 100(1 - a) por dento para af a~ se comienza con la expresion

donde FuJ2 YFHuJ2 ) son los valores a partir de la tabla para la distribuci6n F a la derecha y ala izquierda de los males respectivamente esta a2 del area bajo la curva

EI termino intermedio de la expresi6n puede reescribirse para obtener la siguiente ecuacion

Si se divide entre S12 s se tiene

Fa2 a~ F-(a2)--lt-lt--shyS[ s~ a~ S1

2 I s~

Con la aplicaci6n del redproco de los tres terminos se obtiene

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

192 CAPITULO 6 ESTlMACION

Ysi se invierte el orden se tiene el siguiente intervalo de confianza de 1OO( 1 - 0) por ciento para Of 10

(6101)

FJEMPLO 6101

Goldberg et al (A-24) realizaron un estudio para determinar si una dosis de dextroanfetamina podia tener efectos positivos sobre las emociones y la percepci6n de pacientes esquizofrenicos mantenidos a regimen de haloperidol Entre las variashybles medidas estaba el cambio en el estado de tensi6n-ansiedad del paciente Hubo n

2 = 4 pacientes que respondieron a la anfetamina con una desviaci6n estandar

para esta medici6n de 34 Para los n l

= 11 pacientes que no respondieron se present6 una desviaci6n estandar de 58 Se considera que estos pacientes conforshyman las muestras aleatorias simples e independientes extraidas de poblaciones con pacientes que presentan las mismas condiciones mentales Se considera que la puntuaci6n del cambio de estado de tensi6n-ansiedad sigue una distribuci6n norshymal en ambas poblaciones Se pretende elaborar un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

Soluci6n Se tiene la siguiente informacion

n l = 11 n

2 = 4

st (58)2 =3364 si = (34)2 1156 dJ grados de libertad del numerador 10 dJ = grados de libertad del denominador 3

0= 05 20704 F95 = 1442F 025

Ahora todo esta listo para obtener el intervalo de confianza de 95 por ciento para Of I O~ sustituyendo adecuadamente los valores en la expresi6n 6101

336411156 Of 33641156-----lt - lt----shy1442 O~ 20704

02 2018lt-1 lt140554

O~

Las interpretaciones practica yprobabilistica para este intervalo pueden darse

Puesto que el intervalo 2018 a 140554 induye ai es posibleconshycluir que las variancias para las dos poblaciones son iguales bull

Calculo de FI-fIfl) Y 1112 En este punto se debe hacer la engorrosa pero inevitashyble explicaci6n de c6mo se obtienen los valores de F975 = 1442 Y F 025 20704 El valor de F975 en la intersecci6n de la columna encabezada por dJ lOy el rengl6n identificado con dJ = 3 es 1442 Si se tiene una tabla mas extensa para la distribushyci6n F localizar a F 025 no representa problema alguno simplemente se localizarfa

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

FJERCICIOS

EJERCICIOS 193

de la misma manera en que se localiz6 Fg75 se tomada el valor de la intersecci6n de la columna encabezada por lOy el rengl6n encabezado por 3 Para incluir cada percentil posible de la distribuci6n F se haria una tabla extremadamente grande Sin embargo por suerte existe una relaci6n que permite calcular valores inferiores para el percentil a partir de esta limitada tabla La relaci6n es la siguiente

1 F-od[ d[ (6102)

Procedimiento Se intercambian los grados de libertad del numerador y denominador para

localizar adecuadamente los valores de F Para el problema mencionado se localiza 483 el cual se encuentra en la intersecci6n de la columna 3 y el reng16n 10 Ahora se aplica el redproco de este valor 1483 20704 En resumen ellimite inferior de confianza (LCL por sus siglas en ingles) y ellimite superior de confianza (UCL) para (]~ I (]~ son los siguientes

S2 1 LCL=~--shy

S2 F2 012d[ d[

S2UCL = __---I__

s~ll F-(012)d[d

Otros procedimientos para hacer inferencias acerca de la igualdad de dos variancias cuando las poblaciones muestreadas no tienen una distribuci6n normal se pueden encontrar en ellibro de Daniel (13)

6101 El objetivo de un estudio realizado por Hahn et al (A-25) era determinar si la prueba del aliento alcoh6lico era un metodo confiable para vigilar la absord6n de irrigante durante la prostatectomfa en pacientes vfctimas de la enfermedad pulmonar obstructiva cr6nica (COPD por las siglas en ingles) Se consideraron a n[ = 7 pacientes vfctimas graves de COPD y a n

2

= 7 pacientes esencialmente libres de cualquier enfermedad pulmonar como poblaci6n de controL Una de las variables medidas es el peso (en kilogramos) Los pesos correspondientes a los individuos de control son 74 82 94 90 98 97 Y 84 Los pesos correspondientes a los individuos con COPD son 81 58 93 58 51 96 Y 67 Se considera que estas muestras conforman muestras aleatorias simples e independientes extrafdas de dos poblaciones de pacientes con caractensticas similares vfctimas graves de COPD y pacientes con funciones pulmonares esencialmente sanas Se sup one que los pesos de los individuos en estas poblashydones siguen una distribuci6n normal Elabore un intervalo de confianza de 95 por ciento para la raz6n de las variancias de las dos poblaciones

6102 Una de las investigaciones de Southwick et al (A-26) tiene como prop6sito describir con mas precisi6n el componente emocional causante de trastornos de estres postraumatico (PTSD sishyglas en ingles) Los individuos estudiados son varones internos en la unidad psiquiatrica del centro medico para la atend6n de excombatientes militares Veintiocho individuos satisfudan el criterio de PTSD pues eran soldados excombatientes de la guerra de Vietnam Otros 17 indivishy

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

194 CAPITULO 6 ESTIMACION

duos eran victimas de muchos otros des6rdenes emocionales depresivos Para valorar las medishydas registradas de los sintomas mas severos en 45 individuos se utiliz6la escala de 21 puntos de clasificad6n de Hamilton para medir la depresi6n La desviaci6n estandar de las calificacioshynes para los padentes con PTSD fue de 990 y para los pacientes con trastomos depresivo grave la desviaci6n fue de 630 Formule las suposiciones necesarias respecto a las muestras y pobladones de las que podrian tomarse los datos para hacer inferencias Construya un imershyvalo de confianza de 99 por ciento para la raz6n de las variancias de las dos poblaciones de ca1ificaciones obtenidas con la escala de dasificacion de Hamilton para medir la depresi6n

6103 Se analizaron estadisticamente los indices de ataques de apoplejfa de dos muestras de pashycientes que padedan infarto del miocardio Las variancias de las muestras fueron de 12 y 10

---~~-----Hubo 21 pacientes en cada muestra Construya un intervalo de confianza de 95 por ciento para la razon de las variancias de las dos poblaciones

6104 Treinta y dos adultos aHisicos sometidos a terapia del habla fueron divididos en dos grupos iguales EI grupo 1 recibio el tratamiento 1 y el grupo 2 recibi6 el tratamiento 2 EI anal isis estadistico de los resultados de la eficacia de los tratamientos dio las siguientes variancias 5j

2 = 8 s~ =15Construya el intervalo de confianza de 90 por dento para (j~ (j~

6105 Se calcularon las variancias de las muestras para los volumenes de flujo (ml) de dos grupos de pacientes que sufren de una alteraci6n en el tabique interauricular Los resultados y tamashyflos de las muestras son los siguientes

nj = 31 512 = 35000

n2 41 s~ 20000

Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6106 Se registraron las respuestas de las concentraciones de glucosa frente a la administracion de glucosa oral en II pacientes con la enfermedad de Huntington (grupo 1) y en 13 individuos de control (grupo 2) EI analisis estadistico de los resultados proporciono las siguientes variancias de las muestras Sj2 = 105 y si = 148 Construya el intervalo de confianza de 95 por dento para la raz6n de las dos variancias

6107 Las mediciones de la secreci6n gistrica de icido clorhidrico (miliequivalentes por hora) en 16 individuos normales y en 10 individuos con ulcera duodenal proporcionaron los siguienshytes resultados

Individuos normales 63202305 19 3241406261 35 1317456362

Individuos con Ulcera 13720615928429418421130 262130

Construya un intervalo de confIanza de 95 porciento para la raz6n de las variancias de las dos poblaciones ~Que suposiciones se deben tomar en cuenta para que este procedimiento sea vilido

611 RESUNlliN

En este capitulo se estudia una de las principales areas de la inferencia estadistica la estimaci6n Se estudian tanto las estimaciones puntuales como las de interval os Se ilustran los conceptos y metodos relacionados con la construcci6n de los intervashylos de confianza de los siguientes parametros medias diferencia de dos medias proporciones diferencia entre dos proporciones variancias y raz6n de dos variancias

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

195 PREGUNTAS Y EJERCICIOS DE REPASO

Tambien se describe como determinar el tamafio de la muestra necesario para estimar la media y la proporcion de la poblacion con niveles espedficos de precishysion

Ademas en este capitulo se indica que la estimacion de intervalos para los parametros de la poblacion son preferibles mas que las estimaciones puntuales porshyque las afirmaciones de confianza pueden apegarse a la estimacion de intervalos

PREGUNTAS YFJERCICIOS DE REPASO

1 ~Que es la inferencia estadlstica

2 ~Por que es la estimaci6n un tipo importante de inferencia

3 tQue es la estimaci6n puntual

4 Explique el significado del termino insesgado

5 Defma los siguientes conceptos

a) Coeficiente de confiabilidad b) Coeficiente de confianza c) Precision

d) Error estandar e) Estimador f) Margen de error

6 Escriba la formula general para un intervalo de confianza

7 Enuncie las interpretaciones probabiHsticas y pnkticas de un intervalo de confianza

8 ~Que uso tiene el teorema de1limite central en la estimaci6n

9 Describa la distribuci6n t

10 ltCullies son las suposiciones que fundamentan el uso de Ia distribuci6n t para estimar la media de una sola poblaci6n

11 ltQue es la correcci6n por poblaci6n fin ita cCuando se puede pasar por alto

12 (Cullies son las suposiciones que fundamentan e1 uso de la distribuci6n t para estimar la diferencia entre las medias de dos poblaciones

13 El analisis de los gases de la sangre arterial practicado a 15 hombres adultos fisicamente activos proporcion6 los siguientes valores de Pa02 en reposo

758080748478897283767587787988

Calcule e1 intervalo de confianza de 95 por ciento para la media de la poblaci6n

14 cQue proporci6n de pacientes asmaticos son alergicos al polvo En una muestra de 140 individuos 35 por ciento tuvo reacciones positivas en la pieL Construya un intervaIo de confianza de 95 por ciento para la proporci6n de la poblaci6n

15 Se llev6 a cabo una encuesta de higiene industrial en una area metropolitana de gran tamashyno De 70 plantas manufactureras visitadas 21 recibieron la calificaci6n de deficiente en 10 que se refiere a la ausencia de medidas de seguridad Construya un intervalo de confianza de 95 por ciento para la proporci6n de la poblaci6n con una calificaci6n de deficiente

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

196 cAPiTULO 6 ESTIMACION

16 Con base en el problema anterior ~que tan grande debe ser la muestra para estimar la proporci6n de poblaci6n dentro de 05 con un intervalo de confianza de 95 por ciento (30 es la mejor estimaci6n disponible para p)

a) si fuera posible pasar por alto la correcci6n por poblaci6n finita b) 8i no fuera posible pasar por alto la correcci6n por poblacion finita y N 1500

17 En una encuesta dentalllevada a cabo por un grupo de salud se solicito a 500 adultos que dijeran el porque de su ultima visita al dentista De los 220 que tenlan una educaci6n inferior ala preparatoria 44 senalaron que 10 hablan hecho por razones preventivas De los restantes 280 quienes tenlan educadon preparatoria 0 un nivel superior 150 sefialaron que 10 habian hecho por la misma raz6n Construya un intervalo de confianza de 95 por ciento para Jt diferenda entre las dos proporciones de las poblaciones

18 Un grupo de investigadores de cancer de mama reuni610s siguientes datos en cuanto al tamano de los tumores

Tipo de tumor n s

A 21 385 cm 195cm B 16 280cm 170 cm

Construya un intervalo de confianza de 95 por ciento para la diferenda entre las medias de las poblaciones

19 Se encontr6 que derto medicamento es eficaz para el tratamiento de las enfermedades pulmonares en 180 de los 200 casos tratados Construya un intervalo de confianza de 90 por dento para la proporcion de la poblaci6n

20 Setenta pacientes con ulceras con estancamiento en la pierna fueron divididos en dos grupos iguales Cada grupo recibi6 un tratamiento distinto para el edema AI finalizar el experishymento la eficacia del tratamiento fue evaluada en terminos de reducci6n del volumen de la pierna determinado por eI desplazamiento de agua Las medias y desviaciones estandar de ambos grupos aparecen en la siguiente tabla

Grupo (tratamiento) s

A 95 cc 25 B 125 cc 30

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones

21 2Cual es el nive promedio de bilirrubina en e suero de los pacientes internados en un hospital para el tratamiento de la hepatitis Una muestra de 10 padentes arroj610s siguienshytes resultados

205148213 127 152266234229157192

Construya un intervalo de confianza de 95 por dento para la media de la poblaci6n

22 Se midieron las concentraciones de pH de la saliva en dos muestras aleatorias independientes de ninos de escuela primaria Los ninos de la muestra A no tenian caries mientras que los ninos de la muestra B tenlan una alta incidencia de caries Los resultados fueron los siguientes

A 714711761798721716789 B 736 704 719 741 710 715 736 724786747782737766762765 757764700725719

Construya un intervalo de confianza de 90 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de las poblaciones son iguales

23 Una muestra aleatoria de 12 pacientes que padedan insomnio tomaron el medicamento A Otra muestra aleatoria independiente de 16 pacientes con el mismo problema recibio el

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

197 PREGUNTAS Y EJERCICIOS DE REPASO

medicamento B El numero de horas de sueno experimentadas durante la segunda noche despues de iniciado el tratamiento son las siguientes

A 35573469 17838306468366957 B 45 117 1084563 38 62 66 71 64 45

5132474530

Construya un intervalo de confianza de 95 por ciento para la diferencia entre las medias de las poblaciones Suponga que las variancias de ambas poblaciones son iguales

24 Milliez et at (A-27) realizaron un estudio de embarazos de alto riesgo Se trabajo con una muestra de 23 mujeres primerizas que tuvieron bebes con un peso de 2958 gramos y desviashycion estindar de 620 En una segunda muestra de 26 mujeres multiparas la media y la desviaci6n estltindar de los pesos de los bebes que nacieron fueron de 3085 y 704 gramos respectivamente Establezca las consideraciones necesarias acerca de las muestras y de las poblaciones de las que pueden utilizarse los datos para hacer inferencias Elabore un intervalo de confianza de 95 por ciento para la diferencia entre la media de los pesos de los recien nacidos para las dos poblaciones

25 EI objetivo de estudio de Martin et al (A-28) era comparar la funci6n de los neutrofilos presenshytes en la sangre de la arteria pulmonar y en el fluido dellavado pulmonar de pacientes en la etapa temprana del sindrome de insuficiencia respiratoria del adulto Existen tres funciones antibacteriales importantes liberaci6n de especies que reaccionan ante el oxigeno actividad bactericida contra organismos externos como el estafilococo dorado y la quimiotaxis Para 18 de los individuos estudiados la media del pH del fluido de lavado broncoalveolar es de 739 con una desviacion estandar de 39 Elabore un intervalo de confianza de 90 por ciento para la media del pH en la pob1acion Establezca las suposiciones necesarias para que el procedishymiento sea valido

26 Harrison et al(A-29) condujeron un estudio acerca de personas de la tercera edad en un municipio de Londres Ademas de otras caracterfsticas reunieron datos acerca del grado de depresion entre los residentes del municipio En una muestra de 158 individuos previamenshyte diagnosticados como personas depresivas 48 fueron clasificadas durante la encuesta como con depresi6n En la muestra de 745 individuos sin un diagnostico previa de depresion 311 fueron clasificados con depresion en la misma encuesta Elabore un intervalo de conshyfianza de 99 por ciento para la diferencia entre las proporciones de las poblaciones Estashyblezca las suposiciones necesarias para que el procedimiento sea valido

27 Un estudio de Thurnau et at (A-30) tiene como proposito evaluar la exactitud del in dice de desproporcion cefalopelvica y la via de nacimiento en mujeres embarazadas que intentan el parto via vaginal cuando ya tuvieron con anterioridad nacimientos por via cesarea Entre los datos reportados estan los siguientes pesos (en gramos) de los recien nacidos

Via de nacimiento b Media Desviaci6n esUindar

Vaginal 47 3325 514

Elabore un intervalo de confianza de 95 para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido

28 En un estudio de la funci6n de las grasas en la etiologia de enfermedades isquemicas del coraz6n se seleccionaron las siguientes poblaciones 60 individuos varones entre 40 y 60 alios de edad quienes habian tenido un infarto del miocardio y 50 individuos varones apashyrentemente sanos de la misma edad y condicion social Una de las variables de interes era la proporcion del acido linoleico (A L) en los acidos grasos trigliceridos del plasma de los individuos Los datos para esta variable son los siguientes

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

198 CAPiTULO 6 ESTIMACION

Individuos con infarto del miocardio

Individuo AL Individuo AL Individuo AL Individuo AL

1 180 2 176 3 96 4 55 5 168 6 129 7 140 8 80 9 89 10 150 11 93 12 58

13 83 14 48 15 69 16 183 17 240 18 168 19 121 20 129 21 169 22 151 23 61 24 166 25 87 26 156 27 123 28 149

-~-----~

29 169 30 57 31 143 32 141 33 141 34 151 35 106 36 136 37 164 38 107 39 181 40 143 41 69 42 65 43 177 44 134 45 156 46 109 47 130 48 106 49 79 50 28 51 152 52 223 53 97 54 152 55 101 56 115 57 154 58 178 59 126 60 72

Individuos saludables

Individuo AL Individuo AL Individuo AL Individuo AL

1 171 2 229 3 104 4 309 5 327 6 91 7 201 8 192 9 189 10 203 11 356 12 172

13 58 14 152 15 222 16 212 17 193 18 256 19 424 20 59 21 296 22 182 23 217 24 297 25 124 26 154 27 217 28 193 29 164 30 231 31 190 32 129 33 185 34 276 35 250 36 200 37 517 38 205 39 259 40 246 41 224 42 271 43 111 44 327 45 132 46 221 47 135 48 53 49 290 50 202

Elabore un intervalo de confianza de 95 por ciento para la direrencia entre las medias cQue es 10

que sugieren estos datos respecto a los niveles de acido linoleico en las dos poblaciones muestreadas

29 Osberg et al (A-31) condujeron un estudio para identificar los factores que predicen si los nifios con lesiones similares tratados en clinicas de traumatologia son 0 no dados de alta y transferidos al area de rehabilitaci6n intrahospitalaria De entre los hallazgos de los investishygadores estan los siguientes en una muestra de U5 individuos dados de alta de la clfnica de traumatologia y transferidos para rehabilitaci6n 983 por ciento tuvieron lesiones cefilicas 685 por ciento de 200 individuos dados de alta para regresar a sus hogares tuvieron heridas en la cabeza Elabore un intervalo de confianza de 95 por dento para la diferencia entre las

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

199 PREGUNTAS Y EJERCICIOS DE REPASO

proporciones de la poblaci6n Establezca las suposiciones necesarias para que el procedishymiento sea valido

30 Una investigaci6n de Steinhardt et al (A-32) tiene dos prop6sitos Primero determinar si el nivel de actividad nsica y la salud cardiovascular estan relacionados con el ausentismo y solicishytud de atenci6n medica entre los policfas durante un periodo de un ano Segundo determinar si los niveles moderados de actividad flsica y la salud estan inversamente asociados con la reduccion de ausentismo y solicitud de atencion medica Los sujetos de estudio fueron los polidas de la ciudad de Austin del estado de Texas Estados Unidos Entre otros hallazgos los investigadores reportaron que 65 individuos cuyo nivel de actividad flsica se dasifico como sedentario tuvieron un ausentismo promedio de 1004 dias por ano y una desviaci6n estandar de 965 Para 275 individuos con actividad flsica de tres veces por semana se obtuvo una media y una desviaci6n estandar de 604 y 659 respectivamente Elabore un intervalo de confianza de 95 por ciento para la diferencia entre las medias Establezca las suposiciones necesarias para que el procedimiento sea valido (Que condusiones pueden obtenerse del resultado

31 En general se prefieren los intervalos de confianza estrechos mas que los intervalos amplios Se pueden elaborar intervalos de confianza estrechos por medio del uso de coeficientes de confianza pequenos Para un conjunto dado de otras condiciones (que pasa con el nivel de confianza cuando el coeficiente de confianza es pequeno ~Que pasaria con la amplitud del intervalo y el nivel de confianza si se utilizara un coeficiente de confianza igual a cero

32 En general un coeficiente de confianza alto se prefiere en lugar de un coeficiente menor Para otro con junto dado de condiciones suponga que el coeficiente de confianza es de 100 por ciento ~Cual seria el efecto de esta situacion en la amplitud del intervalo

33 EI investigador el Fiky et al (A-33) midieron la fracci6n de la derivacion mediante un cateter en la arteria pulmonar de 22 pacientes sometidos a cirugia selectiva en la arteria coronaria A partir de los resultados los investigadores calcularon una media de 196 y elaboraron el intervalo de confianza de 90 por ciento para la media de la poblaci6n con puntos extremos de 188 y 204 (Cual puede ser el factor de confiabilidad adecuado para el intervalo z 0 t Justifique su elecci6n ~Cual es la precision de la estimacion y el margen de error

34 Dunkan et at (A-34) informaron acerca del estudio disenado para valorar la relaci6n de lactancia materna exdusiva independiente de los factores de riesgo identificados y la otitis media aguda y recurrente durante los primeros 12 meses de vida Los individuos estudiados fueron 1220 infantes que utilizaron un metodo de cuidados de salud ~Cua fue la poblacion objetivo CuM fue la poblaci6n muestreada

35 Un estudio de Kay et at (A-35) tiene como prop6sito determinar la seguridad y eficacia de la ablaci6n por radiofrecuencia como terapia definitiva de taquicardias auriculares primarias Se estudiaron a 15 pacientes con arritmias auriculares primarias en una etapa en que el tratamiento medico ya no controlaba la enfermedad Los autores conduyeron que la ablashyci6n con un cateter de radiofrecuencia pareda ser una tecnica segura y eficaz para el tratashymiento de arritmias auriculares primarias que no son tratables con medicamentos cCua es la poblaci6n objetivo cCuaI es la poblacion muestreada

36 Bellomo et al (A-36) condujeron un estudio para cuantificar la perdida de insulina y absorshyci6n de glucosa durante hemofiltraciones continuas agudas con dialisis y evaluar la imporshytancia medica de estos cambios Los individuos estudiados eran 16 pacientes de la unidad de cuidados intensivos con insuficiencia renal aguda en una dinica medica universitaria Los autores conduyeron que una absorci6n significativa de la glucosa ocurre durante hemoshyfiltraciones agudas continuas con dialisis y esta vinculada con perdidas menores de insulina a traves del filtro cCuaI es lapoblaci6n objetivo cCuaIes la poblaci6n muestreada Como parte del analisis los autores construyeron un intervalo de confianza para varias medias Con base en la informacion presentada ~cual es el valor numerico adecuado para el factor de confiabilidad de los intervalos

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

---------

200 CAPITULO 6 ESTlMACION

37 Con base en e1 ejercicio 2311 elabore un intervalo de confianza de 95 porciento para la raz6n SIR de las medias poblacionales ~Se utilizaria t 0 z como coeficiente de confiabilidad ltPor que Describa las poblaciones de las que es posible hacer inferendas con base en este estudio

38 Consulte el ejercido 2312 y e1abore un intervalo de confianza de 90 por ciento para la media de la talla de la poblaci6n ~Se utilizaria t 0 z como coeficiente de confiabilidad ~Por que Describa las pobladones de las que es posible hacer inferencias con base en este anal isis

39 En el capitulo 2 revise el ejercicio 35 para elaborar un intervalo de confianza de 99 por dento para la media del estado de nutrici6n de la poblaci6n ~Utilizaria t 0 z como coefieiente de confiabilidad ~Por que Describa las poblaeiones de las que es posible hacer inferencias con base en este amilisis

Ejercicios para utilizar con grandes volumenes de datos almacenados en el disco para computadora suministrado por el editor

1 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muesshytra aleatoria simple de tamano 15 de esta poblaci6n y elabore un intervalo de confianza de 95 por eiento para la media de la poblaci6n Compare los resultados contra los de oOOS companeshyros ~Que suposiciones son necesarias para que el procedimiento de estimacion sea valido

2 En referencia a los niveles de colesterol para 1000 individuos (CHOLEST) seleccione una muestra aleatoria simple de tamano 50 a partir de esta poblaci6n y elabore un intervalo de confianza de 95 por ciento de la proporci6n de individuos en la poblaci6n que tienen lectushyras mayores a 225 Compare los resultados contra los de otros companeros

3 De la poblaci6n de los pesos de 1200 bebes recien naeidos (BABYWGTS) en una clinica de beneficencia extraiga una muestra aleatoria simple de tamano 20 y construya un intervashy10 de confianza de 95 por ciento para la media de la poblacion Compare los resultados contra los de otros compafieros ~Que suposiciones son necesarias para que el procedimienshyto de estimacion sea valido

4 De la poblaci6n de los pesos de 1200 bebes recien nacidos (BABYWGTS) en una cHnica de beneficencia seleceione una muestra aleatoria simple de tamano 35 y construya un intervashy10 de confianza de 95 por dento para la media de la poblaei6n Compare este intervalo con el construido en el ejercieio anterior

5 De la poblaei6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) selecshyeione una muestra aleatoria simple de tamano 15 y construya un inttrvalo de conflanza de 99 por ciento para la media de la poblacion ~Que suposiciones son necesarias para que el procedimiento sea valido

6 A partir de la poblaci6n de las estaturas de 1000 muchachos de 12 anos de edad (BOYHGTS) seleccione una muestra aleatoria simple de tamano 35 y construya un intervalo de confianza de 99 por dento para la media de la poblaci6n Compare este intervalo contra el construido en el ejercicio 5 anterior

BmUOGRAFfA

Bibliografia de metodologia

I John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA

2 W S Gosset (Student) The Probable Error of a Mean Biometrika 6 1-25

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

BIBLIOGRAFlA 201

3 W V Behrens Ein Beitrag zu Fehlerberechnung bei wenige Bcobachtungen Landshywirtsschaftlichejahrbucher 68 807-837

4 R A Fisher The Comparison of Samples with Possibly Unequal Variances Annals ofEugenics 9174-180

5 R A Fisher The Asymptotic Approach to Behrens Integral with Further Tables for the d Test of Significance Annals ofEugenics 11 141-172

6 J Neyman Fiducial Argument and the Theory of Confidence Intervals Biometrika 32 128-150

7 H Scheffe On Solutions of the Behrens-Fisher Problem Based on the t-Distribution The Annals ofMathematical Statistics 14 35-44

8 H Scheffe A Note on the Behrens-Fisher Problem The Annals ofMathematical Statistics 15 430-432

9 B L Welch The Significance of the Difference Between Two Means When the Population Variances Are Unequal Biometrika 29 350-361

10 B L Welch The Generalization of Students Problem When Several Different Population Variances Are Involved Biometrika 3428-35

11 William G Cochran Approximate Significance Levels of the Behrens-Fisher Test Biometrics 20191-195

12 R F Tate y G W Klett Optimal Confidence Intervals for the Variance of a Normal Distribution journal ofthe American Statistical Association 54 674-682

13 Wayne W Daniel Applied Nonparametric Statistics segunda edici6n PWS-KENT Boston

Bibliografia de apIicaciones

A-I Maureen McCauley The Effect ofBody Mechanics Instruction on Work Performance Among Young Workers The Americanjournal ofOccupational Therapy 44 402- 407 Copyright 1990 American Occupational Therapy Association Inc Reimpreso con licencia

A-2 C Tantucci C Corbeil M Chasse J Braidy N Matar y J Milic-Emili Flow Resistance in Patients with Chronic Obstructive Pulmonary Disease in Acute Respiratory Failure American Review ofRespiratory Disease 144 384-389

A-S Ricardo V Uoyd yJoe Mailloux Analysis of S-1 00 Protein Positive Folliculo-Stellate Cells in Rat Pituitary Tissues American journal ofPathology 133 338-346

A-4 Krzysztof Kaminski y Tomasz Rechberger Concentration of Digoxin-like Immunoreactive Substance in Patients with Preeclampsia and Its Relation to Severity of Pregnancy-Induced Hypertension Americanjournal ofObstetrics and Gynecology 165 733-736

A-5 Jack M Gorman Robert Kertzner Thomas Cooper Raymond R Goetz Isabel Lagomasino Hana Novacenko Janet B W Williams Yaakov Stern Richard Mayeux y Anke A Ehrhardt Glucocorticoid Level and Neuropsychiatric Symptoms in Homosexual Men with HN Positive Infection Americanjournal ofPsychiatry 148 41-45

A-6 William] Stone Debra E Rothstein y Cynthia L Shoenhair Coronary Health Disease Risk Factors and Health Related Fitness in Long-Term Excercising versus Sedentary Corporate Executives Americanjournal ofHealth Promotion 5 169-173

A-7 Phillip S Buckner David A Todd Kei Lui y Elizabeth]ohn Effect of Short-Term Muscle Relaxation on Neonatal Plasma Volume Critical Care Medicine 19 1357-1361 Williams amp Wilkins

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516

202 CAPITULO 6 ESTIMACION

AmiddotS Peter E Zucker y Michael C Archer Alterations in Pancreatic Islet function Produced by Carcinogenic Nitrosamines in the Syrian Hamster American journal ofPathology 133 573shy577

A-9 Barbara L Davies Louise Matte-Lewis Annette M OConnor Corinne S Dulbergy Elizabeth R Drake Evaluation of the Time to Quit Self-Help Smoking Cessation Program Canadian journal ofPublic Health 83 19-23

AmiddotIO Ali A Khraibi Direct Renal Interstitial Volume Expansion Causes Exaggerated Natriuresis in SHR Americanjournal ofPhysiology 30 F567-F570

A-ll J Scott Osberg y Carla Di Scala Morbidity Among Pediatric Motor Vehicle Crash Victims The Effectiveness of Seat Belts Americanjournal ofPublic Health 82 422-425

A-12 D C Mathers A H Ghodse A W Caan y S A Scott Cannabis Use in a Large Sample of Acute Psychiatric Admissions Britishjournal ofAddiction 86779-784 Society for the Study of Addiction to Alcohol and Other Drugs

A-13 George R Brown y Bradley Anderson Psychiatric Morbidity in Adult Inpatients with Childhood Histories ofSexual and Physical Abuse Americanjournal ofPsychiatry 148 55-61

A-I4 Joseph A Catania Thomas] Coates Susan Kegeles Mindy Thompson Fullilove John Peterson Barbara Marin David Siegel y Stephen Hully Condom Use in Multi-ethnic Neighborhoods of San francisco The Population-Based AMEN (AIDS in Multi-Ethnic Neighborhoods) Study American journal ofPublic Health 82 284-287

A-15 Alan D Rothbergy Berenice Lits Psychosocial Support for Maternal Stress During Pregnancy Effect on Birth Weight Americanjournal ofObstetrics and Gynecology 165 403-407

A-I6 Sophie R Borst Gil G Noam y John A Bartok Adolescent Suicidality A ClinicalshyDevelopment Approach journal ofthe American Academy ofChild and Adolescent Psychiatry 30 796-803 de Am Acad of Child amp Adol Psychiatry

A-I7 Christina Hartgers Anneke U A R)van den Hock Pieta Krijnen y RoelA Coutinho Hrv Prevalence and Risk Behavior Among Injecting Drugs Users Who Participate in LowshyThreshold Methadone Programs in Amsterdam Americanjournal ofPublic Health 82 547shy551

AmiddotIS Dorothy S Lane Anthony P Polednak y Mary Ann Burg Breast Cancer Screening Practices Among Users of County-Funded Health Centers vs Women in the Entire Community Amencanjournal ofPublic Health 82 199-203

Amiddot19 Etta Williams Leclair Bissell y Eleanor Sullivan The Effects ofCo-dependence on Physicians and Nurses Britishjournal ofAddiction 8637-42 Society for the Study of Addiction to Alcohol and Other Drugs

Amiddot20 Wilbert Aronow e Itzhak Kronzon Prevalence of Coronary Risk Factors in Elderly Blacks andWhitesjournal ofthe American Geriatrics Society 39567-570 American Geriatrics Society

A2IGeorgina Rassias Mark Kestin y PauIJ Nestel Linoleic Acid Lowers LDL Cholesterol Without a Proportionate Displacement ofSaturated Fatty Acid Europeanjournal ofClinical Nutrition 45315-320 i

I

Amiddot22 Lorian E Kennedy y Yagesh N Bhambhani The Baltimore Therapeutic Equipment Work Simulator Reliability and Validity at Three Work Intensities Archives Of Physical Medicine and Rehabilitation 72511-516