5.2 intervalos de confianza (segunda parte)

María del Consuelo Valle Espinosa

Estimación por intervalo de confianza

(segunda parte parte)

Instituto Tecnológico Superior de Zacapoaxtla

Departamento de Desarrollo Académico

Ahora consideraremos un problemas más realista:

Construir un intervalo de confianza para la media poblacional cuando la varianza (o desviación estándar) es desconocida.

En este caso es necesario abordar dos aspectos del problema:

1. El valor de la varianza (desviación estándar) no es conocida y debe ser estimada.

2. La distribución muestral de la variable obtenida al reemplazar la varianza de la población por la varianza obtenida a partir de los datos de la muestra, no es la distribución normal.

Varianza muestral y desviación estándar muestral:

Seleccionemos de la población una muestra aleatoria de tamaño n .

Entonces el estimador S2 representado en la figura se le llama varianza muestral.

A S se le conoce como desviación estándar muestral.

Cabe aclarar que al haber dividido el estimador entre (n – 1) nos permite hace de él un estimador no sesgado.

Pues bien, al reemplazar σ2 por S2 se crea una nueva distribución muestral conocida como “t de Student” o simplemente una distribución «t» con (n – 1) grados de libertad.

La variable aleatoria en base a la cual se construyen la distribución muestral “T” es:

Observaciones:

1) Hay un número infinito de distribuciones “t”, cada una identificada por un parámetro γ , llamado “grados de libertad” .

2) El parámetro γ es siempre positivo y está relacionado con el tamaño de la muestra.

3) Cada distribución “T” tiene; una gráfica continua, simétrica, en forma de campana centrada en cero.

Gamma es un parámetro de forma en el sentido de que cuando γ crece, la varianza de la distribución de muestreo “Tγ” decrece. De este modo, cuando más grande el número de grados de libertad, más compacta se vuelve la curva.

También cuando el número de grados de libertad crece, la curva «t» se aproxima a la curva Normal Tipificada.

Con todos estos antecedentes estudiados, es tiempo de presentar el siguiente teorema, que permite construir un intervalo de confianza de la media de la población con (1 - α)% de confianza, cuando no se conoce la varianza de la población.

Sea una muestra aleatoria de tamaño n de una población que se distribuye en forma normal.

Entonces un intervalo de confianza de la media poblacional cuando no se conoce la varianza

poblacional y con (1 - α) % de confianza viene dado por:

Ejemplo :De una muestra de tamaño 16 de una población normal se han obtenido los siguientes estimadores:

Costruir un intervalo de confianza para la media poblacional con 95% de confianza

26.

66.0

57.1

2

_

S

S

X

Calculemos los rangos de valores de la función t para 15 grados de libertad con un 95% de confianza:

Los límites del intervalo de confianza son:

El numero de grados de libertad implicados en la búsqueda de un intervalo de confianza de µ, cuando no se conoce la varianza poblacional es n -1.

Si hay razón para sospechar que la variable bajo estudio tiene una distribución que este lejos de la normal no se utilizaran procedimientos estadísticos basados en la distribución T. Mas bien se emplearían algunas técnicas de distribución libre (Estadística no paramétrica).

¿Qué factores afectan a la longitud de un intervalo de confianza?

La confianza deseada, que controla el valor de t

La variabilidad de la muestra, que se mide por s

El tamaño de la muestra

En la dirección de Internet

http://onlinestatbook.com/stat_sim/conf_interval/index.html

se puede encontrar la simulación que nos permite observar la variación de la media de la muestra, a partir de la selección aleatoria de 100 muestras, ayuda a ilustrar cómo el ancho del intervalo de confianza depende del tamaño de la muestra y el nivel de confianza.

Mientras que la simulación trabaja con 100 muestras, un investigador tiene una sola muestra.



En la figura se observa el muestreo de una población con una media de 50 y una desviación estándar de 10. Los 100 dibujos de intervalos de confianza fueron generados con muestras de tamaño 15.

Para cada muestra, los intervalos de confianza del 95% y 99% sobre la media se calculan en base a la media de la muestra y la desviación estándar de la muestra.

Los intervalos para las distintas muestras se muestran por líneas horizontales.

Los intervalos de confianza del 95% están dibujados en color naranja y el intervalo de confianza del 99% en color azul.

Los intervalos de confianza al 95% que no contienen la media de la población, y se muestra en rojo.

Los intervalos de confianza al 99% que no contienen la media de la población, y se muestra en blanco.

Tamaño de la muestrapara el intervalo de

confianza

Ejemplo : Supongamos que debe realizarse un estudio para estimar el

peso medio en el momento del nacimiento de niños cuyas madres son adictas a la cocaína. ¿Cuan grande debe ser una muestra para estimar esta medida con un margen de ½ libra y con una confianza del 95 %?

Consideremos la ecuación:

despejando n y sustituyendo q = 1 tenemos:

¿Qué valor de t debe utilizarse?Para resolver este problema, hay que recordar que para muestras grandes, los valores de t pueden aproximarse mediante los valores de la función de distribución Normal, por lo que su valor que se puede tomar de t es 1.96

Por lo que:

¿Cuánto vale s2?

Hay varias formas de responder a esta pregunta: Utilizar el estimador de un estudio anterior. Efectuar un pequeño estudio preliminar o piloto y utilizar el valor de s2 hallado para ayudar a planificar el experimento mayor.

Ahora bien, si se recuerda que la ley de probabilidad normal garantiza que la variable aleatoria estará el 95 % de las veces dentro de 2 desviaciones estándar de su media, el rango de la variable aleatoria es aproximadamente 4 desviaciones estándar.

Podemos utilizar el rango dividido por 4 para aproximar s.

Para este ejemplo se puede suponer que el peso en el momento del nacimiento de estos niños probablemente estará entre 2 y 12 libras. Por lo tanto, el rango es 10, y s es aproximadamente 10/4 = 2.5.

El tamaño de muestra requerido

Intervalo de confianza de la varianza de la población

En algunas ocasiones el interés de la inferencia se centra, no sobre la media de la población, sino sobre su varianza.

Por consiguiente, es necesario que seamos capaces, no solamente de encontrar una estimación puntual de la varianza poblacional, sino también de construir un intervalo de confianza relativo a este parámetro.

Para construir un intervalo de confianza de la varianza de la población se toma como base para el cálculo de probabilidades la distribución Chi-cuadrado.

Los límites para un intervalo de confianza de la varianza poblacional del (1 - α) % pueden encontrarse considerando la partición de la curva de la distribución

Ejemplo : Se extrajo una muestra aleatoria de 16 plantas para estimar la varianza en la concentración de cobre. Las plantas fueron quemadas, y se analizaron las cenizas. Se obtuvieron las siguientes observaciones con respecto a x (concentración de cobre (en partes por millón) (supóngase que x está normalmente distribuida). Para estos datos se tiene que:

S2 = 377.30.

La partición de la curva Chi-cuadrada que se necesita para construir un intervalo de confianza de un 90 % está representada en la figura, en donde los dos valores en el dominio de la función fueron calculados con el programa NCSS

De este modo:

Despejando σ2 en el centro de la desigualdad obtenemos:

Sustituyendo el valor de la varianza muestral tenemos:

El intervalo de confianza será:

Referencia:

ESTADISTICA PARA BIOLOGIA Y CIENCIAS DE LA SALUD

J.SUSAN MILTON

MCGRAW-HILL / INTERAMERICANA DE ESPAÑA, S.A., 2007

ISBN 9788448159962

5.2 intervalos de confianza (segunda parte)

Education