Capítulo 7 Capítulo 7 Estimación de Estimación de ParámetrosParámetros
Estadística Computacional
Algunas consideracionesprevias
Conceptos básicos Distribuciones usadas en InferenciaTeoremas relevantesEstimación puntualEstimación por intervalos
Distribuciones usadas en InferenciaDistribuciones usadas en Inferencia
1.- Ji-Cuadrado con “n” grados de libertad.Sea X1, X2,...,Xn n v.a. continuas independientes tal que Xi ~ N (0,1) i = 1,n (i.i.d.)
~ donde)(n
n
iiXY 2
1
2
)()( yIn
eyyf
Rn
yn
Y
22 2
21
2
donde
OBS:
1.
2.
3.
0
1 dyey y
nYE nYVar 2
2
22 ;)(
nn
2)21()(n
Y tt
nYE
nYVar 2
y
)( yfY
TABLA
Distribuciones usadas en InferenciaDistribuciones usadas en Inferencia
2.- t-Student Sea X v.a.c. tal que X ~ N (0,1)
Y v.a.c. tal que Y ~ 2(n)
Sea ~
)(nStudentt
nY
Xt
)()( tIn
n
ntn
tf R
n
T
2
12
1 2
12
OBS:
1.
2.
3.
0tE 2
n
ntVar
tTPtFT )(
existenotT )(
TABLA
t
)( yfT
Distribuciones usadas en InferenciaDistribuciones usadas en Inferencia3.- F-de FisherSea X v.a.c. tal que X ~ 2(n)
Y v.a.c. tal que Y ~ 2(m) independientes
Sea ~ ),( mnF
mYnX
Z
)()( zI
zmn
zKzf
Rmn
n
Z
2
12
1
siendo
OBS:
1.
2.
2
22
2n
mn
mn
mn
K
2
m
nZE
)()()(42
222
2
mmnmnm
ZV
TABLA zZPzFZ )(
2
m
nZE z
)(zfZ
Teoremas LímitesTeoremas Límites•Convergencia en Distribución:
x pto. continuidad
•Convergencia en Probabilidad:
>0•Nota:
)()( xFxFlimssiXX XXnD
n n
0 XXPlimssiXX nnP
n
XXXX Dn
Pn
Desigualdad de Chebyshev:
Sea X v.a. /
Entonces
XE XV ;
2
XVXEXP
Ley débil de los grandes números:
suc. de v.a.i.i.d. /
entonces:
RXE
2XV
NnnX
0 nn XPlim
Teorema Central de Límite:
Sea {X} suc. de v.a.i.i.d /
finitas. Entonces:
XE 2XV;
)1,0(N
n
XY Dn
n
El objetivo de la estimación de parámetros es proveer de métodos que permitan determinar con cierta precisión, el valor de los parámetros desconocidos de un modelo estadístico a partir de una muestra extraída al azar de una Población.
1. Método de estimación Puntual2. Método de estimación por Intervalos
Estimación de ParámetrosEstimación de Parámetros
Definición de EstimadorDefinición de EstimadorUn estimador es una regla que nos indica cómo obtener un parámetro de un modelo, basándose en la información contenida en una muestra ( M={ f ( x , ) : modelo )
T :
x T (x) = T (X1, X2,...., Xn)
T (x) : Estimador de , variable aleatoria, función de la muestra, que no depende del parámetro .
(Estadística basada en la Información )
={x : x es una muestra aleatoria} Espacio de Información
En lo que sigue = T (X1, X2,...., Xn) estimador de .
Propiedades de los estimadores puntualesPropiedades de los estimadores puntuales
Un estimador es una v.a. y todo juicio sobre él, se basará en su ley de Probabilidad, y más específicamente sobre su Esperanza y Varianza.
1. se dice que es insesgado
2. se llama sesgo de
3. se llama error cuadrático medio del estimador
4. se dice que es consistente
nXXTEE ,...,ˆ1
ˆEB
ˆˆˆ 2BVarECM
1ˆlim Pn Wˆ
Propiedades de los estimadores puntualesPropiedades de los estimadores puntuales
5. Si , decimos que es un estimador insesgado de varianza mínima para . Si todo otro estimador insesgado de , digamos , se verifica que:
6. Sea X1, X2,..., Xn m.a. f ( x , ). Si es:
Nota: Si es eficiente
ˆE
~ˆ VarVar ~
1
2
),(lnˆˆ xf
nEVarE
ˆ),(lnˆ
12
xfnEVar
7. Sean dos estimadores de . Se llama
eficiencia relativa de a:
8. es un estimador suficiente si usa toda la información contenida en la muestra.
21 ~ˆ y
1
212
ˆ
~ˆ,~
ECMECM
ef
12 ˆ/~ rc
Propiedades de los estimadores puntualesPropiedades de los estimadores puntuales
Métodos de estimación puntual
Método de Momentos Método de Máxima Verosimilitud Método de Mínimos Cuadrados
Momentos (K. Pearson)Momentos (K. Pearson)
rir
r xn
mXE1
La idea es simple. Consiste en igualar los momentos de la población y de la muestra
Máxima VerosimilitudMáxima VerosimilitudConsideremos X = (X1, X2,..., Xn ) m.a. f ( x , ). Se llama función de verosimilitud a:
Además se define:
función soporte:
función score:
El valor (vector) de que maximiza se llama estimador máximo verosimil, i.e.
(caso univariado)
n
iixfxf
1
0 ,,
lnL
L
L
00 2
2
LL
Propiedades de los Estimadores Máximo Verosímiles
Propiedades de los Estimadores Máximo Verosímiles
Los estimadores máximo verosímiles son:
Asintóticamente insesgadosAsintóticamente normalesAsintóticamente eficientesInvariantes bajo transformaciones biunívocasSi estimador suficiente, es suficienteMV
Sea X1, X2,..., Xn m.a. N ( , 2 ).
Encontrar el EMV de
2
222
21
2
iX X
nL ln,
2
22
1222
iXn
X e,
4
22
20
0
Sn
Sn
SXH ,
2 ,
222 0 nnX SXL
,
En general:
6
2
4
42
22
2
2
2
2
2
2
12
iXn
Xnn
L
LL
H ,
:= Matriz de Información de Fisheresperada.
:= Matriz de Información observadaen la muestra.
2 ,HE
2SXH ,
IE
IO
OBS: Caso escalar
Se dice que es un estimador eficiente de
..RCL
E
1
2
2
..~ RCV ~
Estimación por IntervalosEstimación por Intervalos
En la práctica, interesa no sólo dar una estimación de un parámetro, sino que además, un intervalo que permita precisar la incertidumbre existente en la estimación.Definición: Sea x m.a. f ( x , ). Sean 1=T1(x),
2=T2(x) dos estadísticas de : T1 T2 x ;
P 1 2 = 1 - =
Entonces el I = 1 ; 2 se llama intervalo aleatorio
de confianza del 100 % para ( 0 < < 1 ).
Fijado , el problema de determinar 1 y 2 puede resolverse encontrando una variable aleatoria Q(x,) cuya distribución esté totalmente definida, que sea independiente de .
La variable Q(x,) se denomina “Cantidad Pivotal”
Estimación por IntervalosEstimación por Intervalos
Ejemplo: X1, X2,..., Xn1 N ( 1 ,21)
Q(x,)= Q(x,)=)1,0(~11
11N
n
X
)1(
11
11 ~
ntnS
X
1. Encontrar una cantidad Q.2. P q1 Q q2 = 1 - =
3. Invertir P 1 2 = , obteniendo así un intervalo I=1 ; 2 de confianza para de nivel
100 %.
Observación: Para muestras grandes la v.a. Q siempre existe, ya que si , entonces
tiene distribución asintóticamente normal estándar.
MV MV
MV
ˆ
ˆ
Método de la Cantidad PivotalMétodo de la Cantidad Pivotal
Intervalo de Confianza para diferencia de medias
Intervalo de Confianza para diferencia de medias
P1: X1, X2,..., Xn1 N ( 1 ,21)
P2: Y1, Y2,..., Yn2 N ( 2 ,22)
Supuesto: Poblaciones Normales
)1,0(11
11N
n
X
),( 1022
22N
n
Y
)( 1
22
1
211
1
1
n
Sn
)( 1
22
2
222
2
1
n
Sn
~
~
~
~
)( 2
22
2
222
21
211
21
11
nn
SnSn
)( 2
22
221
21
2
nn
PSnn
~
~
Asumiendo independencia de las muestras :
22
21 Si
2
21
2121
2111
nn
P
t
nnS
XXQ
~
21
222121
1121 nn
StXXI Pnn,)(
Finalmente:
Es un Intervalo de confianza de nivel para 1 - 2
2
22
1
21
22121 n
SnS
tXXIg,
)(
Supongamos que
Siendo g = n1 + n2 - 2 - grados de libertad
22
21
2
212
12
22112
11
11''
''
SnSn
SnSn
21,' i
nS
Si
ii
Intervalo de Confianza para 12/2
2Intervalo de Confianza para 12/2
2
.., lgFS
SF nn 112
22
2
21
21
21
~
Recordemos que:
)( 1
22
1
211
1
1
n
Sn
)( 1
22
2
222
2
1
n
Sn
~ ~
2
1
22
21
22
21
22
21
22
S
SF
S
SFI ba
donde 1ba FFFP
2FFa 2FFb Si Se obtiene el intervalo de iguales colas;
Resumen: Intervalos de Confianza
Poblaciones NormalesPoblaciones no Normales
Parámetro Estadística Distribución Intervalo
, conocido
, desconocido
1 - 2 1 = 2
1 - 2 1 2
muestra grande
N (0,1)
N (0,1)
221 nnt
1nt
221 nnt
12n2
21
2121
11nn
S
XX
P
2
22
1
21
2121
nS
nS
XX
MV
MV
ˆˆ
2
21
Sn
S
Xn
Xnn
zX 2
nStX 2
2
2
2
212
2 11
SnSn
;
21
22111nn
StXX P
2
22
1
21
221nS
nS
tXX
MVMV z ˆˆ
2