5.2 intervalos de confianza (segunda parte)

31
María del Consuelo Valle Espinosa Estimación por intervalo de confianza (segunda parte parte) Instituto Tecnológico Superior de Zacapoaxtla Departamento de Desarrollo Académico

Upload: consuelo-valle

Post on 24-Jul-2015

479 views

Category:

Education


2 download

TRANSCRIPT

Page 1: 5.2 Intervalos de Confianza (segunda parte)

María del Consuelo Valle Espinosa

Estimación por intervalo de confianza

(segunda parte parte)

Instituto Tecnológico Superior de Zacapoaxtla

Departamento de Desarrollo Académico

Page 2: 5.2 Intervalos de Confianza (segunda parte)

Ahora consideraremos un problemas más realista:

Construir un intervalo de confianza para la media poblacional cuando la varianza (o desviación estándar) es desconocida.

En este caso es necesario abordar dos aspectos del problema:

1. El valor de la varianza (desviación estándar) no es conocida y debe ser estimada.

2. La distribución muestral de la variable obtenida al reemplazar la varianza de la población por la varianza obtenida a partir de los datos de la muestra, no es la distribución normal.

Page 3: 5.2 Intervalos de Confianza (segunda parte)

Varianza muestral y desviación estándar muestral:

Seleccionemos de la población una muestra aleatoria de tamaño n .

Entonces el estimador S2 representado en la figura se le llama varianza muestral.

A S se le conoce como desviación estándar muestral.

Page 4: 5.2 Intervalos de Confianza (segunda parte)

Cabe aclarar que al haber dividido el estimador entre (n – 1) nos permite hace de él un estimador no sesgado.

Pues bien, al reemplazar σ2 por S2 se crea una nueva distribución muestral conocida como “t de Student” o simplemente una distribución «t» con (n – 1) grados de libertad.

Page 5: 5.2 Intervalos de Confianza (segunda parte)

La variable aleatoria en base a la cual se construyen la distribución muestral “T” es:

Page 6: 5.2 Intervalos de Confianza (segunda parte)

Observaciones:

1) Hay un número infinito de distribuciones “t”, cada una identificada por un parámetro γ , llamado “grados de libertad” .

2) El parámetro γ es siempre positivo y está relacionado con el tamaño de la muestra.

3) Cada distribución “T” tiene; una gráfica continua, simétrica, en forma de campana centrada en cero.

Page 7: 5.2 Intervalos de Confianza (segunda parte)

Gamma es un parámetro de forma en el sentido de que cuando γ crece, la varianza de la distribución de muestreo “Tγ” decrece. De este modo, cuando más grande el número de grados de libertad, más compacta se vuelve la curva.

Page 8: 5.2 Intervalos de Confianza (segunda parte)

También cuando el número de grados de libertad crece, la curva «t» se aproxima a la curva Normal Tipificada.

Page 9: 5.2 Intervalos de Confianza (segunda parte)

Con todos estos antecedentes estudiados, es tiempo de presentar el siguiente teorema, que permite construir un intervalo de confianza de la media de la población con (1 - α)% de confianza, cuando no se conoce la varianza de la población.

Sea una muestra aleatoria de tamaño n de una población que se distribuye en forma normal.

Entonces un intervalo de confianza de la media poblacional cuando no se conoce la varianza

poblacional y con (1 - α) % de confianza viene dado por:

Page 10: 5.2 Intervalos de Confianza (segunda parte)

Ejemplo :De una muestra de tamaño 16 de una población normal se han obtenido los siguientes estimadores:

Costruir un intervalo de confianza para la media poblacional con 95% de confianza

26.

66.0

57.1

2

_

S

S

X

Page 11: 5.2 Intervalos de Confianza (segunda parte)

Calculemos los rangos de valores de la función t para 15 grados de libertad con un 95% de confianza:

Page 12: 5.2 Intervalos de Confianza (segunda parte)
Page 13: 5.2 Intervalos de Confianza (segunda parte)

Los límites del intervalo de confianza son:

El numero de grados de libertad implicados en la búsqueda de un intervalo de confianza de µ, cuando no se conoce la varianza poblacional es n -1.

Si hay razón para sospechar que la variable bajo estudio tiene una distribución que este lejos de la normal no se utilizaran procedimientos estadísticos basados en la distribución T. Mas bien se emplearían algunas técnicas de distribución libre (Estadística no paramétrica).

Page 14: 5.2 Intervalos de Confianza (segunda parte)

¿Qué factores afectan a la longitud de un intervalo de confianza?

La confianza deseada, que controla el valor de t

La variabilidad de la muestra, que se mide por s

El tamaño de la muestra

Page 15: 5.2 Intervalos de Confianza (segunda parte)

En la dirección de Internet

http://onlinestatbook.com/stat_sim/conf_interval/index.html

se puede encontrar la simulación que nos permite observar la variación de la media de la muestra, a partir de la selección aleatoria de 100 muestras, ayuda a ilustrar cómo el ancho del intervalo de confianza depende del tamaño de la muestra y el nivel de confianza.

Mientras que la simulación trabaja con 100 muestras, un investigador tiene una sola muestra.

Page 16: 5.2 Intervalos de Confianza (segunda parte)
Page 17: 5.2 Intervalos de Confianza (segunda parte)

En la figura se observa el muestreo de una población con una media de 50 y una desviación estándar de 10. Los 100 dibujos de intervalos de confianza fueron generados con muestras de tamaño 15.

Para cada muestra, los intervalos de confianza del 95% y 99% sobre la media se calculan en base a la media de la muestra y la desviación estándar de la muestra.

Los intervalos para las distintas muestras se muestran por líneas horizontales.

Los intervalos de confianza del 95% están dibujados en color naranja y el intervalo de confianza del 99% en color azul.

Los intervalos de confianza al 95% que no contienen la media de la población, y se muestra en rojo.

Los intervalos de confianza al 99% que no contienen la media de la población, y se muestra en blanco.

Page 18: 5.2 Intervalos de Confianza (segunda parte)

Tamaño de la muestrapara el intervalo de

confianza

Page 19: 5.2 Intervalos de Confianza (segunda parte)

Ejemplo : Supongamos que debe realizarse un estudio para estimar el

peso medio en el momento del nacimiento de niños cuyas madres son adictas a la cocaína. ¿Cuan grande debe ser una muestra para estimar esta medida con un margen de ½ libra y con una confianza del 95 %?

Page 20: 5.2 Intervalos de Confianza (segunda parte)

Consideremos la ecuación:

despejando n y sustituyendo q = 1 tenemos:

Page 21: 5.2 Intervalos de Confianza (segunda parte)

¿Qué valor de t debe utilizarse?Para resolver este problema, hay que recordar que para muestras grandes, los valores de t pueden aproximarse mediante los valores de la función de distribución Normal, por lo que su valor que se puede tomar de t es 1.96

Page 22: 5.2 Intervalos de Confianza (segunda parte)

Por lo que:

¿Cuánto vale s2?

Hay varias formas de responder a esta pregunta: Utilizar el estimador de un estudio anterior. Efectuar un pequeño estudio preliminar o piloto y utilizar el valor de s2 hallado para ayudar a planificar el experimento mayor.

Page 23: 5.2 Intervalos de Confianza (segunda parte)

Ahora bien, si se recuerda que la ley de probabilidad normal garantiza que la variable aleatoria estará el 95 % de las veces dentro de 2 desviaciones estándar de su media, el rango de la variable aleatoria es aproximadamente 4 desviaciones estándar.

Podemos utilizar el rango dividido por 4 para aproximar s.

Para este ejemplo se puede suponer que el peso en el momento del nacimiento de estos niños probablemente estará entre 2 y 12 libras. Por lo tanto, el rango es 10, y s es aproximadamente 10/4 = 2.5.

El tamaño de muestra requerido

Page 24: 5.2 Intervalos de Confianza (segunda parte)

Intervalo de confianza de la varianza de la población

Page 25: 5.2 Intervalos de Confianza (segunda parte)

En algunas ocasiones el interés de la inferencia se centra, no sobre la media de la población, sino sobre su varianza.

Por consiguiente, es necesario que seamos capaces, no solamente de encontrar una estimación puntual de la varianza poblacional, sino también de construir un intervalo de confianza relativo a este parámetro.

Para construir un intervalo de confianza de la varianza de la población se toma como base para el cálculo de probabilidades la distribución Chi-cuadrado.

Los límites para un intervalo de confianza de la varianza poblacional del (1 - α) % pueden encontrarse considerando la partición de la curva de la distribución

Page 26: 5.2 Intervalos de Confianza (segunda parte)
Page 27: 5.2 Intervalos de Confianza (segunda parte)

Ejemplo : Se extrajo una muestra aleatoria de 16 plantas para estimar la varianza en la concentración de cobre. Las plantas fueron quemadas, y se analizaron las cenizas. Se obtuvieron las siguientes observaciones con respecto a x (concentración de cobre (en partes por millón) (supóngase que x está normalmente distribuida). Para estos datos se tiene que:

S2 = 377.30.

Page 28: 5.2 Intervalos de Confianza (segunda parte)

La partición de la curva Chi-cuadrada que se necesita para construir un intervalo de confianza de un 90 % está representada en la figura, en donde los dos valores en el dominio de la función fueron calculados con el programa NCSS

Page 29: 5.2 Intervalos de Confianza (segunda parte)

De este modo:

Page 30: 5.2 Intervalos de Confianza (segunda parte)

Despejando σ2 en el centro de la desigualdad obtenemos:

Sustituyendo el valor de la varianza muestral tenemos:

El intervalo de confianza será:

Page 31: 5.2 Intervalos de Confianza (segunda parte)

Referencia:

ESTADISTICA PARA BIOLOGIA Y CIENCIAS DE LA SALUD 

J.SUSAN MILTON

MCGRAW-HILL / INTERAMERICANA DE ESPAÑA, S.A., 2007

ISBN 9788448159962