inferencia: estimación puntual y por intervalos
DESCRIPTION
Inferencia: Estimación Puntual y por Intervalos. Tema 2. “I keep saying the sexy job in the next ten years will be statisticians . People think I'm joking , but who would've guessed that computer engineers would've been the sexy job of the 1990s?“ Hal Varian - PowerPoint PPT PresentationTRANSCRIPT
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Inferencia: Estimación Inferencia: Estimación Puntual y por IntervalosPuntual y por Intervalos
Tema 2Tema 2
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
““I keep saying the sexy job in the next ten I keep saying the sexy job in the next ten years will be statisticians. People think years will be statisticians. People think I'm joking, but who would've guessed I'm joking, but who would've guessed that computer engineers would've been that computer engineers would've been the sexy job of the 1990s?“the sexy job of the 1990s?“
Hal VarianEconomista en Jefe de Google
Enero 2009
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Contenido programáticoContenido programático Muestreo y Estimación puntualMuestreo y Estimación puntual La media muestralLa media muestral
Ley de los Grandes NúmerosLey de los Grandes Números Teorema central del LímiteTeorema central del Límite
Estimación por Intervalos de Estimación por Intervalos de confianzaconfianza
Distribuciones asociadas a la Normal Distribuciones asociadas a la Normal en el muestreoen el muestreo
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
¿Qué es Inferencia?¿Qué es Inferencia? Objetivo: usar datos muestrales Objetivo: usar datos muestrales
para extraer información de la para extraer información de la
población:población: Estimar parámetrosEstimar parámetros Construir intervalos de confianzaConstruir intervalos de confianza Realizar pruebas acerca de los valores de Realizar pruebas acerca de los valores de
los parámetroslos parámetros Determinar el tipo de distribución que Determinar el tipo de distribución que
caracteriza a la poblacióncaracteriza a la población
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s MUESTREO ALEATORIO MUESTREO ALEATORIO SIMPLESIMPLE
Representativa de la población
Seleccionar observaciones más convenientes
Muestra aleatoriaExperimento aleatorio
Variable aleatoria
Sesgo
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
MUESTREO ALEATORIO MUESTREO ALEATORIO SIMPLESIMPLE
Dada una Variable aleatoria X, un Dada una Variable aleatoria X, un conjunto {Xconjunto {X11, X, X22, ...,X, ...,Xnn} de variables es } de variables es una una Muestra Aleatoria SimpleMuestra Aleatoria Simple (MAS) (MAS) de X si:de X si:
1.1. Cada XCada Xii tiene la misma distribución que X. tiene la misma distribución que X.
2.2. Las variables XLas variables X11, X, X22, ...,X, ...,Xnn son son estadísticamente independientes entre sí.estadísticamente independientes entre sí.
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
MUESTREO ALEATORIO MUESTREO ALEATORIO SIMPLESIMPLE
No confundir el concepto de muestra No confundir el concepto de muestra como:como:
Resultado de observar el valor que Resultado de observar el valor que toman las n variables {toman las n variables {XX11, X, X22, ...,X, ...,Xnn} } en un proceso de muestreo.en un proceso de muestreo.
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
MuestraMuestra
Las propiedades estadísticas que aquí se estudian Las propiedades estadísticas que aquí se estudian se refieren a la MAS como variable aleatoria se refieren a la MAS como variable aleatoria multivariada y no como al conjunto de números multivariada y no como al conjunto de números resultantes de la observación de la misma.resultantes de la observación de la misma.
Proceso Proceso de de MuestreoMuestreo
XXnn……..XX22XX11
6,86,8……7,37,38,58,5
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Las variables X1…Xn constituyen una muestra
aleatoria de tamaño n de una distribución
cuya media es µ y cuya varianza es σ2. En
otras palabras, cada Xi tiene media µ y
varianza σ2.
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
EstadísticosEstadísticos Un Un estadísticoestadístico es una función de la muestra { es una función de la muestra {XX11, X, X22, ...,X, ...,Xnn}. }. Constituye una Constituye una nueva variable aleatorianueva variable aleatoria construida a construida a
partir de la muestra aleatoria simple. partir de la muestra aleatoria simple. Es más sencillo operar con él que con la muestra como Es más sencillo operar con él que con la muestra como
tal.tal. Ejemplos:Ejemplos:
Media muestralMedia muestral MáxMáx = máximo {= máximo {XX11, X, X22, ...,X, ...,Xnn}}
MínMín = mínimo {= mínimo {XX11, X, X22, ...,X, ...,Xnn}} RangoRango = máx - mín. = máx - mín.
Varianza muestralVarianza muestral
n
kk mX
ns
1
22 )()1(
1
n
XXXm n
21
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Muestreo EstadísticoMuestreo Estadístico Propósito:Propósito:
Hacer inferencias acerca de la población. Hacer inferencias acerca de la población. Específicamente: Específicamente:
estimar los parámetros (estimar los parámetros (θθ11, , θθ2, 2, ...) ...) desconocidos de la variable aleatoria X que desconocidos de la variable aleatoria X que
representa a la población.representa a la población.
Ej.: Si la vida de un Venezolano se caracteriza Ej.: Si la vida de un Venezolano se caracteriza con una distribución exponencial X(con una distribución exponencial X(θθ), ), Hallar Hallar θθ que es su esperanza de vida. que es su esperanza de vida.
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
¿Cómo se estima?¿Cómo se estima? Mediante estadísticos adecuados, útiles, Mediante estadísticos adecuados, útiles,
cuyas distribuciones se conocen, como la cuyas distribuciones se conocen, como la
media muestral, la varianza muestral, el media muestral, la varianza muestral, el
máximo de la muestra, etc..máximo de la muestra, etc.. Supuestos:Supuestos:
El tipo de distribución es conocidaEl tipo de distribución es conocida Los parámetros son desconocidosLos parámetros son desconocidos
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
EstimadoresEstimadores
T es un T es un estimadorestimador de θ de θ si es un estadístico que si es un estadístico que
permite estimar un parámetro θpermite estimar un parámetro θ
Estimación puntual de θ:Estimación puntual de θ: resultado de T calculado resultado de T calculado
sobre los valores específicos de la muestrasobre los valores específicos de la muestra
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Proceso de MuestreoProceso de Muestreo
EstimadoresEstimadores
EstimaciónEstimación
5577MuestrMuestraa 667788
6,65
67578
m
EstimadorEstimador
XX33XX22 XX55XX44XX11MuestrMuestraa
551 XX
m
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Propiedades de los Propiedades de los estimadores puntualesestimadores puntuales
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
La estimación puntual es La estimación puntual es similar al proceso de similar al proceso de disparar con una pistola a disparar con una pistola a un blanco o lanzar un un blanco o lanzar un dardo a una dianadardo a una diana
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
•El estimador es semejante a la pistolaEl estimador es semejante a la pistola
•una estimación en particular, a la bala una estimación en particular, a la bala
•y el parámetro de interés al centro del blanco.y el parámetro de interés al centro del blanco.
• Sacar una muestra de la población y estimar el Sacar una muestra de la población y estimar el valor del parámetro es equivalente a disparar un valor del parámetro es equivalente a disparar un solo tiro al blanco. solo tiro al blanco.
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
•Suponga que una persona dispara un solo tiro al Suponga que una persona dispara un solo tiro al blanco y que el tiro da en el centro. blanco y que el tiro da en el centro.
•¿Concluimos que es un excelente tirador? ¿Concluimos que es un excelente tirador?
•¿Querría usted sostener el blanco mientras se dispara ¿Querría usted sostener el blanco mientras se dispara el segundo tiro? el segundo tiro?
Evidentemente, no decidiríamos que el hombre es un Evidentemente, no decidiríamos que el hombre es un tirador experto basados en tan escasa evidencia. tirador experto basados en tan escasa evidencia.
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Sin embargo, si un millón de tiros Sin embargo, si un millón de tiros sucesivos dan en el centro del blanco, sucesivos dan en el centro del blanco, podríamos tener suficiente confianza en el podríamos tener suficiente confianza en el tirador para sostener el blanco en el tirador para sostener el blanco en el siguiente tiro. siguiente tiro.
El hecho que se desea enfatizar es: El hecho que se desea enfatizar es:
No podemos evaluar la bondad de un No podemos evaluar la bondad de un procedimiento de estimación puntual procedimiento de estimación puntual basándonos en una sola estimación, más basándonos en una sola estimación, más bien debemos observar los resultados y bien debemos observar los resultados y utilizar el procedimiento de estimación utilizar el procedimiento de estimación muchas, muchas veces. muchas, muchas veces.
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Precisión y ExactitudPrecisión y Exactitud PrecisiónPrecisión: que las estimaciones no se dispersen : que las estimaciones no se dispersen
demasiadodemasiado ExactitudExactitud: que si se realizan numerosos experimentos : que si se realizan numerosos experimentos
el promedio del estadístico sea el parámetro a el promedio del estadístico sea el parámetro a estimar.estimar.
θ ImprecisoEbrio
θ InexactoTuerto
Características deseables de un buen Características deseables de un buen estimadorestimador
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Precisión y ExactitudPrecisión y Exactitud
PrecisiónPrecisión
ExactitudExactitud
VarianzaVarianza
Valor esperadoValor esperado
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
T es un T es un estimador insesgadoestimador insesgado de θ de θ si E(T) = θ. si E(T) = θ.
Supongamos que se tiene un número indefinido de Supongamos que se tiene un número indefinido de
muestras de una población, todas ellas del mismo muestras de una población, todas ellas del mismo
tamaño tamaño nn. .
Sobre cada muestra el estimador nos ofrece una Sobre cada muestra el estimador nos ofrece una
estimación concreta del parámetro que buscamos. estimación concreta del parámetro que buscamos.
Pues bien, el estimador es insesgado, si sobre dicha Pues bien, el estimador es insesgado, si sobre dicha
cantidad indefinida de estimaciones, el valor medio cantidad indefinida de estimaciones, el valor medio
obtenido en las estimaciones es obtenido en las estimaciones es θ.θ.
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Error Cuadrático MedioError Cuadrático Medio(Mean Square Error)(Mean Square Error)
Si T es un estimador de Si T es un estimador de θθ, el MSE es , el MSE es una medida de dispersión de T una medida de dispersión de T respecto de respecto de θθ..
MSE = E(T -MSE = E(T - θ θ))22
Propiedad Propiedad
MSE = VAR(T) + (E( T) -MSE = VAR(T) + (E( T) - θ θ))22
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
.
.
.
.
.
.
.
.
. ..
θ)ˆ(E
.
.
. .BB
.
22 B)ˆV()ˆE(MSE
entonces
)ˆE(B
aSesgollamaráSe
Error Cuadrático MedioError Cuadrático Medio(Mean Square Error)(Mean Square Error)
.
.
. .
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Error Cuadrático MedioError Cuadrático Medio(Mean Square Error)(Mean Square Error)
InsesgadoInsesgado T es un T es un estimador insesgadoestimador insesgado de θ de θ si E(T) = si E(T) =
θθ Se entiende por Se entiende por sesgosesgo del estimador a la del estimador a la
diferencia: E(T) – θdiferencia: E(T) – θ
MSE = Var(T) + (sesgo)MSE = Var(T) + (sesgo)22
Objetivo: minimizar ambos términos varianza y Objetivo: minimizar ambos términos varianza y sesgosesgo
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Insesgados de Varianza Insesgados de Varianza MínimaMínima
TT es unes un estimador insesgado de varianza estimador insesgado de varianza mínima mínima de θde θ si es el de menor varianza entre si es el de menor varianza entre todos los estimador insesgados.todos los estimador insesgados.
Insesgado E (T1) = E ( T2) = θθ
V (T1) > V ( T2)
θθ
T1
T2
Deseadoθθ
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s Ejemplo:
2
2ˆ
7
...ˆ
4612
7211
XXX
XXX
Sea X1, X2,…, X7 una muestra aleatoria de una población que tiene media μ y varianza σ2. Considere los siguientes estimadores de μ :
a) ¿Alguno de estos estimadores es insesgado?
b) ¿Cuál estimador es el “mejor”?
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
La lectura de un voltímetro conectado a un circuito de prueba tiene una distribución uniforme en el intervalo (θ, θ+1θ, θ+1) en donde θθ es el verdadero pero desconocido voltaje del circuito. Suponga que Y1, Y2,…, Yn es una muestra aleatoria de tales lecturas.
Demuestre que es un estimador sesgado de θθ y calcule su sesgo.
Y
Ejemplo:
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s Teorema de ChebychevTeorema de Chebychev(Tchebisheff, Tchebichev)(Tchebisheff, Tchebichev)
La desigualdad de Chebychev provee una cota que no depende de la distribución, sino de la varianza de X
Sea X una variable aleatoria. Entonces, para cualquier k>0:
2
2
2
Var(X)y E(X)
1
11
donde
kkXP
ok
kXP
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
kk Regla de Regla de ChebychevChebychev
Distribución Distribución normalnormal
1.51.5 Menor que 44.4%Menor que 44.4% 13.4%13.4%
22 Menor que 25.0%Menor que 25.0% 4.6%4.6%
33 Menor que 11%Menor que 11% 0.27%0.27%
44 Menor que 6.3%Menor que 6.3% 0.01%0.01%
PORCENTAJE DE LA DISTRIBUCIÓN MAYOR QUE K DESVIACIONES ESTÁNDAR A PARTIR DE LA MEDIA
La cota que ofrece la desigualdad de Chebychev puede ser grosera en algunos casos, pero debemos recordar que la desigualdad sirve para todas las distribuciones.
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s Teorema de ChebychevTeorema de Chebychev(Tchebisheff, Tchebichev)(Tchebisheff, Tchebichev)
También puede escribirse:
2
2
XP
µ-ε µ µ+ε
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
SiSi E(X)=5 y V(X)=100/12. ( E(X)=5 y V(X)=100/12. (εε=4)=4)
P(|X – 5| > 4) <= P(|X – 5| > 4) <= ??
Si ahora suponemos Si ahora suponemos XX~U(0,10), ~U(0,10), ¿cuánto es la probabilidad¿cuánto es la probabilidad??
Ejemplo:
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
ConsistenciaConsistencia
Concentración del estimador en torno a θ a Concentración del estimador en torno a θ a medida que la muestra crece (cuando la medida que la muestra crece (cuando la información aumenta).información aumenta).
Es esta propiedad de consistencia de un Es esta propiedad de consistencia de un estimador lo que permite conformarse con el estimador lo que permite conformarse con el valor observado de un estimador y asumirlo como valor observado de un estimador y asumirlo como representativo del verdadero valor del parámetro representativo del verdadero valor del parámetro θ. θ.
T5
θθ
T100
θθ
N= 100 N= 5
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
ConsistenciaConsistencia TTnn es un es un estimador consistenteestimador consistente de θ si: de θ si:
Para todos los valores de θ y donde ε es un Para todos los valores de θ y donde ε es un
número positivo arbitrario.número positivo arbitrario.
1)|(|Problim
n n
T
O, en forma equivalente,
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
0)(lim
si de econsistentestimador
un es insesgado estimador
n n
n
TV
paraTUn
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Media MuestralMedia MuestralSea X de valor esperado μ y desviación estándar σSea X de valor esperado μ y desviación estándar σy {Xy {X11, X, X22, ...,X, ...,Xnn} muestra aleatoria simple de X.} muestra aleatoria simple de X.
Por las propiedades ya establecidas sobre la Por las propiedades ya establecidas sobre la suma de variables aleatorias independientes:suma de variables aleatorias independientes:
E(m)= μ E(m)= μ
V(m)=σV(m)=σ22/n /n
Luego, m es un estimador insesgado de μ.Luego, m es un estimador insesgado de μ.
n
XXXm n
21
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
De aquí, la media de la media muestral (m) De aquí, la media de la media muestral (m) es igual a la media de la distribución de la es igual a la media de la distribución de la cual se seleccionó la muestra aleatoria, pero cual se seleccionó la muestra aleatoria, pero la varianza de m es solo 1/n veces la la varianza de m es solo 1/n veces la varianza de esa distribución.varianza de esa distribución.
La distribución de probabilidad de la media muestral estará más concentrada alrededor del valor medio µ que la distribución original.
Media MuestralMedia Muestral
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Concentración de la Media Concentración de la Media MuestralMuestral
La media muestral tiene el mismo valor La media muestral tiene el mismo valor esperado pero está más concentrada en torno esperado pero está más concentrada en torno a μ, ya que la desviación estándar disminuye a μ, ya que la desviación estándar disminuye con la raíz cuadrada de n.con la raíz cuadrada de n.
0 5 10 15 20 25 30 35 400
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0 5 10 15 20 25 30 35 400
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
n
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Varianza MuestralVarianza Muestral
1
)(1
2
2
n
XXS
n
ii
La varianza muestral:
Es un estimador insesgado de σ2
En cambio,
Es un estimador sesgado de σ2
n
XXS
n
ii
1
2
2
)(
E(S2) = σ2
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Varianza MuestralVarianza Muestral
Es un estimador insesgado de la varianza de la Es un estimador insesgado de la varianza de la
población, E(Spoblación, E(S22) = V(X) ) = V(X)
Es consistenteEs consistente
No existe un teorema de convergencia como el No existe un teorema de convergencia como el
teorema central del límiteteorema central del límite
N
kk mx
Ns
1
22 )()1(
1Observe el denominador
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Importancia de la Media Importancia de la Media Muestral Muestral
Su relevancia en la estadística se resume en dos grandes Su relevancia en la estadística se resume en dos grandes propiedades:propiedades:
Ley de los Grandes NúmerosLey de los Grandes Números
Teorema Central del LímiteTeorema Central del Límite
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Ley de los Grandes Ley de los Grandes Números Números
La media muestral es un La media muestral es un estimador consistente de μestimador consistente de μ
La consistencia es el fundamento La consistencia es el fundamento teórico para la estimación de la media teórico para la estimación de la media poblacional por la media muestral.poblacional por la media muestral.
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Ley de los Grandes Ley de los Grandes Números Números
La Ley de los Grandes Números indica La Ley de los Grandes Números indica que que mm se concentra entorno a μ, pero se concentra entorno a μ, pero no indica cómo es la distribución de la no indica cómo es la distribución de la media muestral. El siguiente teorema media muestral. El siguiente teorema tiene ese propósito:tiene ese propósito:
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Teorema Central del LímiteTeorema Central del Límite
Cuando n Cuando n + +∞∞ la distribución de la media muestral la distribución de la media muestral
(m) se aproxima a la distribución de una Normal; más (m) se aproxima a la distribución de una Normal; más
precisamente el estadístico de la media estandarizada:precisamente el estadístico de la media estandarizada:
n
- m = Z
Normal Estándar
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Teorema Central del LímiteTeorema Central del Límite Cuando el tamaño de la muestra crece la distribución de Cuando el tamaño de la muestra crece la distribución de
la muestra se asemeja a la normal. la muestra se asemeja a la normal.
X
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Uso del Teorema Central del Uso del Teorema Central del LímiteLímite
Cualquiera sea la variable aleatoria X, su media Cualquiera sea la variable aleatoria X, su media muestral puede considerarse Normal si el tamaño muestral puede considerarse Normal si el tamaño muestral (N) es suficientemente “grande”. muestral (N) es suficientemente “grande”.
¿Cuán grande debe ser la muestra?¿Cuán grande debe ser la muestra? X parecida a una Normal X parecida a una Normal N N ≥≥ 12 12 X asimétrica X asimétrica N N ≥≥ 30 30 X muy asimétrica o multimodal X muy asimétrica o multimodal N N ≥≥ 50 50
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Teorema Central del LímiteTeorema Central del Límite
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
No todos los estadísticos son asintóticamente normales, por más grande que sea el N
Cuan grande es el N para que se observe la tendencia de la media muestral a la distribución normal, depende de la distribución de la población.
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s Distribución Uniforme
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Distribución Uniforme
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s DistribuciónExponencialN=15
N=30
N=50
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Suponga que en una población grande de seres humanos, el diámetro craneal sigue una distribución aproximadamente normal, con una media de 185.6 mm y una desviación estándar de 12 mm. ¿Cuál es la probabilidad de que una muestra aleatoria de tamaño 16 de esta población tenga una media mayor que 190?
Teorema Central del LímiteTeorema Central del Límite
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Los resultados de las pruebas de aptitud académica de todos los alumnos de los liceos de Maracaibo tiene una media de 60 y una varianza de 64. El valor de la media de una generación específica de cierto liceo de Mérida con n=100 alumnos fue 58 ¿Puede afirmarse que este liceo tiene peores resultados que los de Maracaibo?
Teorema Central del LímiteTeorema Central del Límite
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Alumnos de Liceos de Maracaibo Alumnos de Liceos de Mérida
Teorema Central del LímiteTeorema Central del Límite
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
El Centro de apoyo de Ingeniería y Vivienda del Ejército El Centro de apoyo de Ingeniería y Vivienda del Ejército de Estados Unidos patrocinó en fechas recientes un de Estados Unidos patrocinó en fechas recientes un estudio de las características de confiabilidad, estudio de las características de confiabilidad, disponibilidad y mantenimiento de sistemas pequeños disponibilidad y mantenimiento de sistemas pequeños que trabajan con diesel y gas en instalaciones militares y que trabajan con diesel y gas en instalaciones militares y comerciales. El estudio reveló que el tiempo, comerciales. El estudio reveló que el tiempo, xx, antes de , antes de que sea necesario dar mantenimiento correctivo a que sea necesario dar mantenimiento correctivo a sistemas diesel auxiliares continuos tiene una sistemas diesel auxiliares continuos tiene una distribución exponencial aproximada con una media distribución exponencial aproximada con una media estimada de 1700 horas. estimada de 1700 horas. Suponiendo Suponiendo µµ=1700 calcule la probabilidad de que el =1700 calcule la probabilidad de que el tiempo medio antes de dar mantenimiento correctivo a tiempo medio antes de dar mantenimiento correctivo a una muestra de 70 sistemas diesel auxiliares continuos una muestra de 70 sistemas diesel auxiliares continuos exceda las 2500 horas.exceda las 2500 horas.
Teorema Central del LímiteTeorema Central del Límite
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Si se extrae una muestra aleatoria de n observaciones, ySi se extrae una muestra aleatoria de n observaciones, y11, , yy22, …, y, …, ynn, de una población con una media finita , de una población con una media finita μμ y una y una varianza varianza σσ22, entonces, si n es lo bastante grande, la , entonces, si n es lo bastante grande, la distribución de muestreo de la sumadistribución de muestreo de la suma
Se puede aproximar con una función de densidad normal Se puede aproximar con una función de densidad normal con parámetros: con parámetros:
n
iiy
1
Distribución de muestreo de una suma Distribución de muestreo de una suma de variables aleatoriasde variables aleatorias
El estadístico sería
·
·
n
nZ
μΣ=nμ y σ2Σ=
nσ2
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
El gerente de Mercadeo de pinturas Montana afirma que con un galón de pintura se pinta una media de 20 metros, con una varianza de 2. Supongamos que se desea pintar un área que tiene 630 metros. ¿Serán suficientes 32 galones? ¿Qué probabilidad tengo de que no me alcance?
Distribución de muestreo de una suma Distribución de muestreo de una suma de variables aleatoriasde variables aleatorias
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
El sueldo mensual promedio de los habitantes de Venezuela se distribuye uniformemente entre BsF. 500 y BsF. 3.500. Calcule la probabilidad de que al seleccionar al azar a 100 personas, la suma de sus sueldos supere los 220 mil bolívares.
Distribución de muestreo de una suma Distribución de muestreo de una suma de variables aleatoriasde variables aleatorias
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Estimación por IntervalosEstimación por Intervalos Un estimador proporciona un valor aproximado de un Un estimador proporciona un valor aproximado de un
parámetro θ . ¿parámetro θ . ¿Es suficienteEs suficiente??
¿Cuán próxima es la estimación al parámetro? ¿Cuán próxima es la estimación al parámetro?
La estimación por intervalos de confianza La estimación por intervalos de confianza es la respuestaes la respuesta..
med=170 cm La estatura media de los estudiantes de ingeniería es aproximadamente 170 cm.
La estatura media de los estudiantes de ingeniería se encuentra entre 169 y 172 cm
169 <= μ<=172 cm
Estimación
puntual
Estimación por
intervalos
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
DefiniciónDefinición Si {X1, X2, ...,Xn} es una MAS de una Si {X1, X2, ...,Xn} es una MAS de una
Variable X, y se desea estimar θ, un Variable X, y se desea estimar θ, un intervalo de confianza intervalo de confianza (1-(1-αα)) es un es un intervalo intervalo [inf, sup][inf, sup], que tiene una , que tiene una probabilidad (1-probabilidad (1-αα) de cubrir al parámetro ) de cubrir al parámetro θθ..
Inf y sup son dos estadísticos de la muestra Inf y sup son dos estadísticos de la muestra que cumplen:que cumplen:
Prob (inf ≤ θ ≤ sup) = 1 - Prob (inf ≤ θ ≤ sup) = 1 - αα
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Interpretación frecuentistaInterpretación frecuentista
Si se toman 100 muestras aleatorias de la Si se toman 100 muestras aleatorias de la
población, y se construye un intervalo de población, y se construye un intervalo de
confianza [inf, sup] del 95% para cada una confianza [inf, sup] del 95% para cada una
de ellas, se espera que en 95 de ellas el de ellas, se espera que en 95 de ellas el
intervalo contenga al parámetro.intervalo contenga al parámetro.
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Interpretación frecuentistaInterpretación frecuentista
5 rojos
2
blancos
6 rojos
1 blanco
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Consideraciones AdicionalesConsideraciones Adicionales Lo aleatorio es el intervalo [inf, sup] Lo aleatorio es el intervalo [inf, sup]
θ es desconocido pero fijoθ es desconocido pero fijo
El El método de construcciónmétodo de construcción es el que es el que posee el nivel de confianzaposee el nivel de confianza
Observada la muestra y construido el Observada la muestra y construido el intervalo concreto éste contendrá o no al intervalo concreto éste contendrá o no al parámetro.parámetro.
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Consideraciones AdicionalesConsideraciones Adicionales No se sabe si el intervalo obtenido con No se sabe si el intervalo obtenido con
una muestra en particular contiene o no una muestra en particular contiene o no el verdadero valor del parámetro, el verdadero valor del parámetro,
pero el método utilizado para obtener el pero el método utilizado para obtener el intervalo hace que éste contenga el intervalo hace que éste contenga el valor verdadero el (1 - valor verdadero el (1 - αα)% de las veces. )% de las veces.
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Intervalos de Confianza de Intervalos de Confianza de Poblaciones NormalesPoblaciones Normales
De la media con σ conocidaDe la media con σ conocida
De la media con σ desconocidaDe la media con σ desconocida
De la varianzaDe la varianza
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
α/2 α/2
-zα/2 zα/2
¿Cómo se construye un Intervalo de Confianza?¿Cómo se construye un Intervalo de Confianza?
Si X es N(μ, σSi X es N(μ, σ22) y tenemos una muestra de tamaño N, su ) y tenemos una muestra de tamaño N, su media muestral m se distribuye también Normal pero N(μ, media muestral m se distribuye también Normal pero N(μ, σσ22/N). /N).
Distribución de la estadística
N
- x Z
P(Z > zα) = α
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
12/2/n
zx n
zx P
12/2/ z
n
x z P
Despejando la media teórica, nos queda:
Esta expresión hace referencia a que, con una probabilidad de 1-α, el intervalo aleatorio contendrá el valor de μ.
P(Z > zα) = α
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Se sabe que la duración, en horas, de un bombillo de 75 watts tiene una distribución aproximadamente normal, con una desviación estándar de 20 horas. Se toma una muestra aleatoria de 25 bombillos, la cual resulta tener una duración promedio de 1014 horas. Construya un intervalo de confianza bilateral del 95% para la duración promedio de los bombillos.
Intervalo de confianza para la media, varianza conocida
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
¿Qué observa al construir un intervalo de confianza bilateral del 99% para la duración promedio de los bombillos.
Intervalo de confianza para la media, varianza conocida
Un equipo de investigadores está interesado en la puntualidad de los pacientes en las citas concertadas. En un estudio de flujo de pacientes en los consultorios de médicos generales se encontró que una muestra de 35 pacientes llegaba 17,2 minutos tarde a las citas, en promedio. Una investigación previa había demostrado que la desviación era de 8 minutos aproximadamente. Se tuvo la sensación de que la distribución de la población era normal. ¿Cuál es el intervalode confianza de 90% para µ, que es el promedio real de impuntualidad en las citas?
Intervalo de confianza para la media, varianza conocida
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Un fabricante produce anillos para los pistones de un motor de automóvil. Se sabe que el diámetro del anillo está distribuido aproximadamente de manera normal, y que tiene una desviación estándar σ = 0,001 mm. Una muestra aleatoria de 15 anillos tiene un diámetro promedio de m = 74,036 mm.
•Construya el intervalo de confianza bilateral del 99% para el diámetro promedio del anillo.
Intervalo de confianza para la media, varianza conocida
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Intervalo de Confianza de la Intervalo de Confianza de la Media μ con σ desconocidaMedia μ con σ desconocida
Si se desconoce σ, se debe recurrir a la Si se desconoce σ, se debe recurrir a la distribución t de Student distribución t de Student
Sea X d N(μ, σSea X d N(μ, σ22), {X), {X11,.....,X,.....,Xnn} una M.A.S., m y s, } una M.A.S., m y s, media y desviación estándar muestral; entonces media y desviación estándar muestral; entonces el estadístico:el estadístico:
) n
s (
- m = t
es una es una tt con con n-1 n-1
grados de libertadgrados de libertad
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s Dada la distribución del estadístico y el nivel de confianza, se tiene la Dada la distribución del estadístico y el nivel de confianza, se tiene la siguiente igualdad:siguiente igualdad:
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Su aplicación inmediata es que:Su aplicación inmediata es que:
n
stx
n
stx nn 1,2/1,2/
Es un intervalo de confianza de probabilidad (1-Es un intervalo de confianza de probabilidad (1-αα) ) del valor esperado, μ. del valor esperado, μ.
12/2/ t
n
sx
t P
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
La dirección médica de una clínica desea estimar el número promedio de días necesarios para el tratamiento de pacientes con edades entre 25 y 34 años. Una muestra aleatoria de 500 pacientes de la clínica con esas edades proporcionó una media de 5.4 días y una desviación estándar de 3.1 días. Obtenga un intervalo de confianza de 95% para el promedio del tiempo de estancia de la población de pacientes de la cual se obtuvo la muestra.
Intervalo de confianza para la media, varianza desconocida
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Un ingeniero de control de calidad midió el espesor de la pared de 25 botellas de vidrio de dos litros. La media muestral es m=4.05 mm, mientras que la desviación estándar muestral es s=0.08 mm. Encuentre un intervalo de confianza del 90% para la media del espesor de la pared de las botellas.
Intervalo de confianza para la media, varianza desconocida
¿La población tiene una
distribución normal?
¿La muestra es grande? ¿La muestra
es grande?
¿Se conoce la varianza
de la población?
¿Se conoce la varianza
de la población?
¿Se conoce la varianza
de la población?
z t ó z
z t
z t ó z
NP
Sí
Sí
Sí
Sí
Sí
Sí
NoNo
No
NoNo
Se aplica el teorema central del límite
No
NP: Método no paramétrico
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s Intervalo de confianza para diferencia de medias, para observaciones no apareadas
Se toman dos muestras aleatorias independientes de dos poblaciones de interés. Es decir, la selección de elementos para una muestra no afecta, ni es afectada por, la selección de elementos para la otra muestra.
Ej: Estudiar la presión sanguínea en mujeres que toman o no cierta hormona. Tomamos un grupo de mujeres que la toman y un grupo de mujeres que no la toman.
Diferencia entre dos poblaciones
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Intervalo de confianza para la diferencia de dos medias, varianzas conocidas
Desviación de la diferencia muestral:
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Se prueban dos fórmulas diferentes de un combustible oxigenado para motor en cuanto al octanaje. La varianza del octanaje para la fórmula
1 es σ21=1.5 mientras que para la fórmula 2 es
σ22=1.2. Se prueban dos muestras aleatorias de
tamaño n1=15 y n2=20. Los octanajes promedios
observados son m1=89.6 y m2=92.5. Construya un
intervalo de confianza bilateral del 95% para la diferencia en el octanaje promedio.
Intervalo de confianza para la diferencia de dos medias, varianzas conocidas
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Se administra dos somníferos A y B a dos grupos de pacientes en un hospital. El A especifica que su desviación estándar es 1 hora, mientras el B especifica 1.5 horas. Si los tamaños muestrales
son n1=15 y n2 = 20 para los grupos A y B y las
medias de sueño en esa noche fueron 10 y 9 horas respectivamente, construya un intervalo de confianza bilateral del 95% para la diferencia de horas de sueño entre los somníferos
Intervalo de confianza para la diferencia de dos medias, varianzas conocidas
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
¿Cuál somnífero concluye usted que es mejor?
Intervalo de confianza para la diferencia de dos medias, varianzas conocidas
83.117.0 21
De acuerdo al intervalo de confianza, podemos concluir que el somnífero A produce más sueño que el B.
Es más, se tiene una confianza del 95% que el somnífero A produce entre 0.17 y 1.83 horas más de sueño que el somnífero B.
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
¿Cuál somnífero hubiese concluido usted que ¿Cuál somnífero hubiese concluido usted que
produce mejores resultados si el intervalo de produce mejores resultados si el intervalo de
confianza le hubiese quedado, por ejemplo?confianza le hubiese quedado, por ejemplo?
Intervalo de confianza para la diferencia de dos medias, varianzas conocidas
3.15.1 21
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s Intervalo de confianza para diferencia de medias, para observaciones no apareadas
Se toman dos muestras aleatorias independientes de dos poblaciones de interés. Es decir, la selección de elementos para una muestra no afecta, ni es afectada por, la selección de elementos para la otra muestra.
Ej: Estudiar la presión sanguínea en dos grupos de mujeres que toman cierta hormona. Tomamos un grupo de mujeres que la toman y un grupo de mujeres que no la toman.
Diferencia entre dos poblaciones
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s Intervalo de confianza para diferencia de medias, para observaciones apareadas
Existen solo n unidades experimentales diferentes y los datos están recopilados por pares => cada unidad experimental está formada por dos observaciones
Ej: Estudiar la presión sanguínea en un grupo de mujeres antes y después de tomar cierta hormona. (En este ejemplo los datos son los conjuntos de medidas en las mismas personas).
Muestras apareadas
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s Intervalo de confianza para diferencia de medias, para observaciones apareadas
Programador
Sitio 1 2 3 4 5 6 7 8 9 10 11 12
Lenguaje 1 17 16 21 14 18 24 16 14 21 23 13 18
Lenguaje 2 18 14 19 11 23 21 10 13 19 24 15 20
Un científico de la computación está investigando la utilidad de dos lenguajes de diseño para mejorar las tareas de programación. Se pide a doce programadores expertos, familiarizados con los dos lenguajes, que codifiquen una función estándar en ambos lenguajes, anotando el tiempo, en minutos, que requieren para hacer esta tarea. Los datos obtenidos son los siguientes:
Encuentre un intervalo de confianza del 95% para la diferencia en los tiempos de codificación promedio. ¿Existe algo que indique una preferencia por alguno de los lenguajes?
DiferenciaDiferencia -1-1 22 22 33 -5-5 33 66 11 22 -1-1 -2-2 -2-2
d = 2/3
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Intervalo de Confianza de la Intervalo de Confianza de la Media μ cuando se conoce σMedia μ cuando se conoce σ
PrecisiónPrecisión
La estatura media está entre 171 y 173 cm con una confianza del 95%
La estatura media está entre 165 y 175 cm con una confianza del 99%
Precisión
+
-
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Intervalo de Confianza de la Intervalo de Confianza de la Media μ cuando se conoce σMedia μ cuando se conoce σ
Se puede dar un intervalo con una Se puede dar un intervalo con una confianza del 100%confianza del 100%
Z0,0 = ∞
(-∞ , ∞)
““El peso promedio de los estudiantes de ingeniería se encuentra El peso promedio de los estudiantes de ingeniería se encuentra entre -∞ y ∞”. Esto es cierto, pero inútilentre -∞ y ∞”. Esto es cierto, pero inútil
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s ¿De qué tamaño debo ¿De qué tamaño debo tomar la muestra?tomar la muestra?
Cuando se realiza un muestreo ingenuamente Cuando se realiza un muestreo ingenuamente
se quiere que la estimación sea:se quiere que la estimación sea:
Exacta o al menos muy precisaExacta o al menos muy precisa
Verdadera o al menos muy confiableVerdadera o al menos muy confiable
BarataBarata
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
¿Confiable preciso y barato?¿Confiable preciso y barato? Cuando se estima μ y σ es conocido, el intervalo Cuando se estima μ y σ es conocido, el intervalo
de confianza tiene una longitud de:de confianza tiene una longitud de:
estableciéndose una relación simple entre:estableciéndose una relación simple entre: La confianza (1-La confianza (1-αα ) ) La precisión LLa precisión L El tamaño muestral NEl tamaño muestral N
n
zL
2/2
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Intervalo de Confianza de la Intervalo de Confianza de la Media μ cuando se conoce σMedia μ cuando se conoce σ
n
zL
2/2
LongitudLongitud
• Mayor es la seguridad de que el intervalo contenga el verdadero valor del parámetro
• Menor información se tiene acerca del valor verdadero
• Menor es la precisión
Mientras más grande es la longitud del intervalo
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Tamaño MuestralTamaño Muestral ¡Obsérvese que no se puede fijar ¡Obsérvese que no se puede fijar
arbitrariamente los 3 números!arbitrariamente los 3 números!
1-α L
N
Confianza Precisión
Tamaño Muestral
¡Sólo se puedenfijar 2!
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Tamaño MuestralTamaño Muestral Si se fija precisión (L) y confianza (1-Si se fija precisión (L) y confianza (1-αα) )
resulta:resulta:
Para disminuir el intervalo a la mitad es Para disminuir el intervalo a la mitad es necesario cuadriplicar la muestra. necesario cuadriplicar la muestra.
2
2/.2
L
zN
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Si xbarra se utiliza como estimación de μ, entonces puede tenerse una confianza del 100(1-α)% de que el error no será mayor que una cantidad específica E cuando el tamaño de la muestra sea:
2
2/
E
zn
Definición
Determinación del tamaño de la muestra para la estimación de las medias
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
x μn
zx
2/ nzx
2/
n
z
2/2Longitud del intervalo =
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
x μ
)max( xerrorE
nzx
2/ n
zx
2/
Longitud del intervalo (L) = 2E
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Intervalo de Confianza de la Intervalo de Confianza de la Media μ cuando se conoce σMedia μ cuando se conoce σ
2
2/
E
zn
TamañoTamaño de la muestra de la muestra
donde )max( xE
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
2
2/
E
zn
TamañoTamaño de la muestra de la muestra
Considerando el resto de los parámetros fijos:
Conforme disminuye la longitud del intervalo 2E, el tamaño requerido de la muestra aumenta.
A medida que aumenta σ, el tamaño requerido de la muestra aumenta.
Conforme aumenta el nivel de confianza, el tamaño de la muestra aumenta.
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s Tamaño Muestral en función Tamaño Muestral en función de L/sigmade L/sigma
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Un nutricionista, va a efectuar una encuesta entre una población de muchachas adolescentes con el fin de determinar su ingestión diaria promedio de proteínas, por lo que desea saber qué tamaño de la muestra debería tomar. Suponga que el nutricionista quiere un intervalo con una dimensión de aproximadamente 10 grs., un intervalo de confianza de .95 y que, con base en su experiencia previa, sabe que la desviación estándar de la población es de alrededor de 20 grs.
Determinación del tamaño de la muestra para la estimación de las medias
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Tamaño MuestralTamaño Muestral ¿Qué hacer si σ es desconocido?¿Qué hacer si σ es desconocido? No es posible sustituirla por No es posible sustituirla por s s ya que ya que
depende de m y Ndepende de m y N
¿Existe una estimación previa?¿Existe una estimación previa? ¿Opinión de expertos confiable? ¿Opinión de expertos confiable?
¿Existe una estimación anterior de σ ¿Existe una estimación anterior de σ con su intervalo de confianza con su intervalo de confianza adecuado?adecuado?
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Muestreo PreliminarMuestreo Preliminar Si no se dispone de una estimación anterior Si no se dispone de una estimación anterior
de σ, es necesario hacer un muestreo de σ, es necesario hacer un muestreo preliminar:preliminar: Conservador:Conservador: Calcule un intervalo de confianza Calcule un intervalo de confianza
de σ, (con confianza=0,7; por ejemplo)de σ, (con confianza=0,7; por ejemplo)
use su extremo superior como σ si desea ser use su extremo superior como σ si desea ser cauteloso aunque el N obtenido sea grande.cauteloso aunque el N obtenido sea grande.
Pragmático: Pragmático: Úsese directamente el Úsese directamente el ss muestral muestral estimado si confía en la estimación preliminar, estimado si confía en la estimación preliminar, corriendo el riesgo de que el N sea subestimadocorriendo el riesgo de que el N sea subestimado
S
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s Intervalo de confianza para la proporción de una población
nppzp /)ˆ1(ˆˆ 2/
elementosdetotalNúmero
condicioncumplenelemNump
___
___ˆ
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s Intervalo de confianza para la proporción de una población
Un grupo de investigadores encontró que en una muestra de 591 pacientes en un hospital psiquiátrico, 204 pacientes admitieron que consumieron marihuana al menos una vez durante su vida. Se pretende construir un intervalo de confianza de 95% para la proporción de individuos que consumieron marihuana durante su vida en la población de internos del hospital.
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s Determinación del tamaño de la muestra para la estimación de proporciones
2
22/ )1(
E
ppzn
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Se planea realizar una encuesta para determinar qué proporción de familias en cierta área carece de servicio médicos. Se cree que la proporción no puede ser mayor que 0.35. Se desea un intervalo de confianza del 95% con E = 0.05. ¿Cuántas familias deben encuestarse?
Determinación del tamaño de la muestra para la estimación de proporciones
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s Intervalo de Confianza de la Intervalo de Confianza de la VarianzaVarianza
Cuando se desea estimar la varianza teórica (σCuando se desea estimar la varianza teórica (σ22) )
a partir de una muestra de tamaño n, se debe a partir de una muestra de tamaño n, se debe
recurrir a la distribución recurrir a la distribución (Ji-cuadrado) (Ji-cuadrado)
con n-1 grados de libertad con n-1 grados de libertad La distribución considera la varianza muestral La distribución considera la varianza muestral
SS22::
2
2 S ) 1 - n ( Es una Es una con n-1 con n-1
grados de libertad.grados de libertad.
21n
21n
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Intervalo de Confianza de la Intervalo de Confianza de la VarianzaVarianza
De la ecuación anterior se deduce que :De la ecuación anterior se deduce que :
21
22
)1( nn
s
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s Intervalo de confianza para la varianza de una población
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Si sSi s22 es la varianza muestral de una muestra aleatoria de tamaño es la varianza muestral de una muestra aleatoria de tamaño n, tomada de una distribución normal con varianza desconocida n, tomada de una distribución normal con varianza desconocida σσ22, , entonces, un intervalo de confianza del 100(1-entonces, un intervalo de confianza del 100(1-αα))% para % para σσ22 es: es:
donde X2α/2,n-1 y X2
1-α/2,n-1 son los puntos críticos superior e inferior respectivamente que corresponden a la probabilidad α/2 de la distribución ji-cuadrada con n-1 grados de libertad
21,2/1
22
21,2/
2 )1()1(
nn
snsn
Intervalo de confianza para la varianza de una distribución normal
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
La técnica de estimación se aplica a n tanto grandes como pequeñas, siempre que se suponga que la población de la cual se seleccionó la muestra tiene aproximadamente, una distribución normal.
Intervalo de confianza para la varianza de una población
Supuesto:Supuesto:
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s Intervalo de confianza para la varianza de una población
Un supervisor de control de calidad en una enlatadora Un supervisor de control de calidad en una enlatadora sabe que la cantidad exacta contenida en cada lata varía, sabe que la cantidad exacta contenida en cada lata varía, pues hay ciertos factores imposibles de controlar que pues hay ciertos factores imposibles de controlar que afectan la cantidad de llenado. El llenado medio por lata afectan la cantidad de llenado. El llenado medio por lata es importante, pero igualmente importante es la es importante, pero igualmente importante es la variación variación σσ22 de la cantidad de llenado. Si es grande de la cantidad de llenado. Si es grande algunas latas contendrán muy poco y otras demasiado. A algunas latas contendrán muy poco y otras demasiado. A fin de estimar la variación fin de estimar la variación σσ22 del llenado de la enlatadora, del llenado de la enlatadora, el supervisor escoge al azar 10 latas y pesa el contenido el supervisor escoge al azar 10 latas y pesa el contenido de cada una, obteniendo los siguientes pesos (en onzas):de cada una, obteniendo los siguientes pesos (en onzas):
7.96 7.90 7.98 8.01 7.97 7.96 8.03 8.02 8.04 8.027.96 7.90 7.98 8.01 7.97 7.96 8.03 8.02 8.04 8.02
Establezca un intervalo del 90% para la variación del Establezca un intervalo del 90% para la variación del llenado de las latasllenado de las latas
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s Intervalo de confianza para la varianza de una distribución normal
Se utiliza el término jitter o perturbación oscilatoria (www.canare.com.hk/ Tech%20Notes/Jitter.htm) para describir las variaciones en el tiempo de conducción de un sistema de energía modular de agua pulsada. Es indispensable que el jitter de transferencia sea bajo para que una tecnología de línea de agua tenga éxito. Una investigación del jitter de transferencia en el interruptor de abertura de plasma de un sistema prototipo produjo para el tiempo de conducción en n=18 pruebas, una media = 334.8 nanosegundos y s=6.3 nanosegundos .
•Establezca un intervalo de confianza de 95% para la verdadera desviación estándar de los tiempos de conducción del sistema prototipo.
•Se considera que un sistema tiene jitter de transferencia bajo si la verdadera desviación estándar del tiempo de conducción es menor que 7 nanosegundos ¿El sistema prototipo satisface este requisito?
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Un fabricante de detergente líquido está interesado en la uniformidad de la máquina utilizada para llenar las botellas. De manera específica, es deseable que la desviación estándar σ del proceso de llenado sea menor que 0.15 onzas de líquido; de otro modo, existe un porcentaje mayor del deseable de botellas con un contenido menor de detergente. Supóngase que la distribución del volumen de llenado es aproximadamente normal. Al tomar una muestra aleatoria de 20 botellas, se obtiene una varianza muestral s2 = 0.0153 (onzas de líquido)2. Con estos valores ¿podría usted afirmar que la desviación estándar del proceso es la deseable? Considere un intervalo superior de confianza del 95%.
Intervalo de confianza para la varianza de una distribución normal
22
1,
2)1(
nX
sn2
1,1
22 )1(
nX
sn
Cota de confianza inferior del (1-α)% Cota de confianza superior del (1-α)%
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s Intervalo de confianza para el cociente de varianzas de dos distribuciones normales
Comparar varianzas
Se hace inferencia acerca del cociente o razón σ12/σ2
2
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Grados de libertad del numerador
Grados de libertad del denominador
Distribución F
Nx
Ny
FNx
Ny
1
12
1
21
Cociente de dos variables Chi-cuadrada divididas entre sus grados de libertad
Distribución F con Ny-1 y Nx-1 grados de libertad
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s Intervalo de confianza para el cociente de varianzas de dos distribuciones normales
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Densidad de la Distribución F con r y s grados de libertad
Intervalo de confianza para el cociente de varianzas de dos distribuciones normales
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Si s12 y s2
2 son las varianzas muestrales de dos muestras aleatorias de tamaños n1 y n2, respectivamente, tomadas de dos poblaciones normales e independientes con varianzas σ1
2 y σ22 desconocidas,
entonces, un intervalo de confianza del 100(1-α)% para el cociente σ1
2/σ22 es:
donde fα/2,n2-1,n1-1 y f1-α/2,n2-1,n1-1 son los puntos críticos superior e inferior que corresponden al porcentaje α/2 de la distribución F con n2-1 y n1-1 grados de libertad en el numerador y denominador, respectivamente.
11,12,2/2
2
2
12
2
2
111,12,2/12
2
2
1 nnnn ff
ss
ss
Intervalo de confianza para el cociente de varianzas de dos distribuciones normales
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s Intervalo de confianza para el cociente de varianzas de dos distribuciones normales
12,11,2/11,12,2/1
1
nnnn f
f
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Una empresa ha estado experimentando con dos disposiciones Una empresa ha estado experimentando con dos disposiciones físicas distintas de su línea de ensamble. A fin de obtener una físicas distintas de su línea de ensamble. A fin de obtener una disposición que permita un mayor control del proceso, usted disposición que permita un mayor control del proceso, usted sugiere que se adopte de manera permanente la disposición que sugiere que se adopte de manera permanente la disposición que exhiba la varianza más pequeña en el número de unidades exhiba la varianza más pequeña en el número de unidades terminadas producidas al día. Dos muestras aleatorias terminadas producidas al día. Dos muestras aleatorias independientes producen los siguientes resultados:independientes producen los siguientes resultados:
nn11 = 21 días = 21 días nn22=25 días =25 días ss1122 = 1.432 = 1.432 ss22
22=3.761=3.761
Establezca un intervalo de confianza del 95% para Establezca un intervalo de confianza del 95% para σσ1122//σσ22
22 , la razón , la razón
de las varianzas del número de unidades terminadas para las dos de las varianzas del número de unidades terminadas para las dos disposiciones de línea de ensamble. Con base en el resultado, disposiciones de línea de ensamble. Con base en el resultado, ¿cuál de las dos disposiciones recomendaría usted?¿cuál de las dos disposiciones recomendaría usted?
Intervalo de confianza para el cociente de varianzas de dos distribuciones normales
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s Intervalo de confianza para el cociente de varianzas de dos distribuciones normales
Si el intervalo hubiese sido:
¿Cuál hubiese sido su conclusión?
55.1163.0 2
2
2
1
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Distribuciones en el muestreo Distribuciones en el muestreo asociadas a la Normalasociadas a la Normal
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Distribución T de Student Distribución T de Student Características Características
Nexo entre las medias muestral y teórica Nexo entre las medias muestral y teórica en una población normal.en una población normal.
Simétrica, como una normal aplastadaSimétrica, como una normal aplastada Cuando los grados de libertad (gl) crecen, Cuando los grados de libertad (gl) crecen,
la distribución t tiende a una Normal la distribución t tiende a una Normal Estándar.Estándar.
Si gl > 30 no se distingue de una normal Si gl > 30 no se distingue de una normal estándar estándar
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Distribución T de Student Distribución T de Student
Parámetros Parámetros gl (Grados de libertad)gl (Grados de libertad)
Variable aleatoriaVariable aleatoriaTT
Valor esperadoValor esperadoE(X)= 0 E(X)= 0
Varianza Varianza V(X) = gl/(gl-2) V(X) = gl/(gl-2) para gl > para gl >
2 2
Función de Función de distribución distribución acumulada en el SAS acumulada en el SAS PROBT(t,gl)PROBT(t,gl)
InversaInversaTINV(p, gl).TINV(p, gl).
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Gráfica Distribución T de Gráfica Distribución T de Student Student
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Distribución Ji-Cuadrado Distribución Ji-Cuadrado
Características Características Nexo entre las varianzas de la población Nexo entre las varianzas de la población
y la muestral.y la muestral. Suma de n Normales estándares Suma de n Normales estándares
elevadas al cuadradoelevadas al cuadrado Toma valores positivosToma valores positivos AsimétricaAsimétrica Se desplaza a la derecha en función de Se desplaza a la derecha en función de
los grados de libertad los grados de libertad
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Distribución Ji-Cuadrado Distribución Ji-Cuadrado
Parámetros Parámetros gl (Grados de libertad)gl (Grados de libertad) Distribución gamma Distribución gamma
con parámetro de con parámetro de forma forma αα = gl/2 y = gl/2 y de escala de escala θθ = 2. = 2.
Valor esperadoValor esperadoE(X)= gl E(X)= gl
VarianzaVarianzaV(X)= 2gl V(X)= 2gl
Función de Función de distribución distribución acumulada en el SAS acumulada en el SAS PROBCHI(x, gl)PROBCHI(x, gl)
Inversa Inversa CINV(p, gl)CINV(p, gl)
Que es la más útil en el Que es la más útil en el muestreo; donde gl muestreo; donde gl significa grados de significa grados de libertad.libertad.
Tem
a 2.
Inf
eren
cia:
Est
imac
ión
Pun
tual
y P
or I
nter
valo
s
Distribución Ji-Cuadrado Distribución Ji-Cuadrado