estimación de parámetros · 2017. 6. 8. · intervalos de confianza para los principales...

25
INFERENCIA ESTADISTICA Proferora: Lic. Gladis Mazza

Upload: others

Post on 20-Aug-2021

9 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Estimación de Parámetros · 2017. 6. 8. · Intervalos de confianza para los principales parámetros El caso de la media (1) En este caso, en lugar de indicar simplemente un único

INFERENCIA ESTADISTICA

Proferora: Lic. Gladis Mazza

Page 2: Estimación de Parámetros · 2017. 6. 8. · Intervalos de confianza para los principales parámetros El caso de la media (1) En este caso, en lugar de indicar simplemente un único

INFERENCIA ESTADISTICA

Por este proceso es posible utilizar estadísticos calculados a partir de muestras para estimar los valores de los parámetros

de la población. Por ejemplo:Media muestral Media poblacional Proporcion muestral Prop. Poblac.Varianza muestral Variacia Poblac.

Page 3: Estimación de Parámetros · 2017. 6. 8. · Intervalos de confianza para los principales parámetros El caso de la media (1) En este caso, en lugar de indicar simplemente un único

DISTRIBUCIONES MUESTRALES

Los estadísticos son variables aleatorias que tienen una distribución asociada y tienen media y varianza.Para el estadístico media muestral la esperanza de la distribución de las medias muestrales es igual a la esperanza de la variable original. E(x)= µLa varianza de la distribución de las medias es igual a la varianza de la distribución de la variable estudiada, dividida por el tamaño de la muestra: s2/n

Page 4: Estimación de Parámetros · 2017. 6. 8. · Intervalos de confianza para los principales parámetros El caso de la media (1) En este caso, en lugar de indicar simplemente un único

DISTRIBUCIONES MUESTRALES

La distribución muestral es la distribución de los resultados calculados sobre todas las muestras posibles.Distribución muestral de la Media: El estadístico media muestral es un estimador de la media poblacional que cumple con la propiedad de Imparcialidad: La media de todas las medias muestrales posibles es igual a la media poblacional.

Page 5: Estimación de Parámetros · 2017. 6. 8. · Intervalos de confianza para los principales parámetros El caso de la media (1) En este caso, en lugar de indicar simplemente un único

DISTRIBUCIÓN MEDIA MUESTRAL

Ejemplo: Un auditor toma una muestra de 36 de una población de 1000 deudores morosos. El valor promedio de saldos por cobrar de la población es de $ 2600 con una desviación estándar poblacional de $450 ¿Cuál es la probabilidad de que la media muestral sea inferior a $ 2500? Y ¿Cuál es la probabilidad de que la media muestral se encuentre $150 de la media la población en mas y menos?

Page 6: Estimación de Parámetros · 2017. 6. 8. · Intervalos de confianza para los principales parámetros El caso de la media (1) En este caso, en lugar de indicar simplemente un único

TEORIA DE LA ESTIMACIÓN

ESTIMACIÓN PUNTUAL Y POR INTERVALOS:La estimación puntual: es un proceso mediante el cual se estima un parámetro en un punto, dado un valor específico como estimación.Estimación por intervalos: Es un procedimiento mediante el cual se puede afirmar, con una determinada probabilidad, que el intervalor (a,b) contiene al verdadero valor del parámetro.P(a≤ q ≤ b) = 1 - α

Page 7: Estimación de Parámetros · 2017. 6. 8. · Intervalos de confianza para los principales parámetros El caso de la media (1) En este caso, en lugar de indicar simplemente un único

Propiedades deseables de los estimadores

Veremos CUATRO propiedades:

1.Ausencia de sesgo

2.Consistencia

3.Eficiencia

4.Suficiencia

Page 8: Estimación de Parámetros · 2017. 6. 8. · Intervalos de confianza para los principales parámetros El caso de la media (1) En este caso, en lugar de indicar simplemente un único

Propiedades deseables en los

estimadores (1)

1. Ser insesgado. Diremos que es un estimador insesgado de si la

esperanza de es . Es decir, qq

q

q

( )E q q

La media muestral es un estimador insesgado de la

media poblacional.

Pero la varianza muestral NO es un estimador

insesgado de la varianza poblacional, pero sí lo es en

cambio la cuasivarianza.

Page 9: Estimación de Parámetros · 2017. 6. 8. · Intervalos de confianza para los principales parámetros El caso de la media (1) En este caso, en lugar de indicar simplemente un único

Propiedades deseables en los

estimadores (2)

2. Consistencia. Se dice que un estimador es consistente si se cumple que

lim 0n

P q q

Esta expresión indica que a medida que se incrementa el tamaño muestral, la

diferencia entre el estimador y el parámetro será menos que cualquier número

().

A diferencia de la “ausencia de sesgo” que se define para valores finitos de n, la

“consistencia” es una propiedad asintótica.

Tanto la media muestral como la cuasivarianza son estimadores consistentes.

Nota: la varianza muestral ES un estimador consistente de la varianza

poblacional, dado que a medida que el tamaño muestral se incrementa, el sesgo

disminuye y disminuye.

Page 10: Estimación de Parámetros · 2017. 6. 8. · Intervalos de confianza para los principales parámetros El caso de la media (1) En este caso, en lugar de indicar simplemente un único

Propiedades deseables en los

estimadores (3)

3. Eficiencia. Se emplea para COMPARAR estimadores.

Si tenemos dos estimadores y de un mismo parámetro q, diremos que

es más eficiente que si tenemos que var( )<var( )

Se puede comprobar que la varianza muestral es más eficiente que la

cuasivarianza muestral a la hora de estimar la varianza poblacional. (Aún

así, se prefiere la cuasivarianza muestral como estimador de la varianza

poblacional por ser un estimador insesgado.)

1q1q

2q

2q

2q 1q 2q

Page 11: Estimación de Parámetros · 2017. 6. 8. · Intervalos de confianza para los principales parámetros El caso de la media (1) En este caso, en lugar de indicar simplemente un único

Propiedades deseables en los

estimadores (4)

4. Suficiencia. Diremos que es un estimador suficiente del parámetro

si dicho estimador basta por sí solo para estimar

q

qq

Page 12: Estimación de Parámetros · 2017. 6. 8. · Intervalos de confianza para los principales parámetros El caso de la media (1) En este caso, en lugar de indicar simplemente un único

Intervalos de confianza para los

principales parámetros

El caso de la media (1)

En este caso, en lugar de indicar simplemente un único valor como estimación del

parámetro, lo que haremos es ofrecer un intervalo de valores que sea asumible con

cierta probabilidad por el parámetro que queremos estimar.

-Intervalo de confianza: Es el intervalo de las estimaciones (probables) sobre el

parámetro.

-Límites de los intervalos de confianza: Son los dos valores extremos del intervalo

de confianza

Page 13: Estimación de Parámetros · 2017. 6. 8. · Intervalos de confianza para los principales parámetros El caso de la media (1) En este caso, en lugar de indicar simplemente un único

Intervalos de confianza para los principales

parámetros: El caso de la media (2)

Ahora bien, ¿cuán grande habrá de ser el intervalo de confianza?

Evidentemente, si decimos que el intervalo de confianza va de menos infinito a

más infinito, seguro que acertamos...pero eso no es muy útil. Por su parte, el

extremo es la estimación puntual, en la que lo usual es que no demos con el valor

del parámetro...

La idea es crear unos intervalos de confianza de manera que sepamos en qué

porcentaje de casos el parámetro estará dentro del intervalo crítico.

¿Y cómo fijamos tal porcentaje de casos? Usualmente se asume un porcentaje

del 95%. Al calcular un intervalo de confianza sobre la media al 95% ello quiere

decir que el 95% de las veces que repitamos el proceso de muestreo (y

calculemos la media muestral), la media poblacional estará dentro de tal intervalo.

Page 14: Estimación de Parámetros · 2017. 6. 8. · Intervalos de confianza para los principales parámetros El caso de la media (1) En este caso, en lugar de indicar simplemente un único

Intervalos de confianza para los principales

parámetros: El caso de la media (3)

Pero, ¿cómo calculamos estos dos límites?

Sabemos que la distribución subyacente es normal, lo cual nos ayuda enormemente.

En una distribución normal tipificada, es muy fácil saber qué puntuación típica (z) deja a la

izquierda el 2.5% de los datos (yendo a las tablas es -1.96) y cuál deja a la izquierda el

97.5% de los datos (o a la derecha el 2.5% de los datos: 1.96).

Ahora habrá que pasar esos datos a puntuaciones directas....

Page 15: Estimación de Parámetros · 2017. 6. 8. · Intervalos de confianza para los principales parámetros El caso de la media (1) En este caso, en lugar de indicar simplemente un único

Intervalos de confianza para los principales

parámetros: El caso de la media (3)

Pero, ¿cómo calculamos estos dos límites?

Vamos a ver DOS casos.

Primero, veremos el caso de que sepamos la varianza poblacional.

Segundo, veremos el caso de que NO sepamos la varianza poblacional

Page 16: Estimación de Parámetros · 2017. 6. 8. · Intervalos de confianza para los principales parámetros El caso de la media (1) En este caso, en lugar de indicar simplemente un único

Intervalos de confianza para los principales

parámetros: El caso de la media (4)

Nuestra distribución es normal, pero con cierta media y cierta desviación típica, las

cuales sabemos por el tema anterior:

1) La media de la distribución muestral de medias es la media poblacional m

2) La varianza de la distribución muestral de medias es s2/n

O lo que es lo mismo, la desviación típica de la dist.muestral de medias es

2Conocemoss

ns

Page 17: Estimación de Parámetros · 2017. 6. 8. · Intervalos de confianza para los principales parámetros El caso de la media (1) En este caso, en lugar de indicar simplemente un único

Intervalos de confianza para los principales

parámetros: El caso de la media (5)

Estimador de esmX Recordad que

O lo que es análogo

Y para pasar directas-típicas:

2Conocemoss

i iX z Xn

s

/

ii

X Xz

ns

Page 18: Estimación de Parámetros · 2017. 6. 8. · Intervalos de confianza para los principales parámetros El caso de la media (1) En este caso, en lugar de indicar simplemente un único

z 0’975z 0’025

En definitiva

Intervalos de confianza para los principales

parámetros: El caso de la media (6)

Aplicando la lógica

de pasar de

puntuaciones típicas

a directas

En Punt.típicas

En Punt.directas

2Conocemoss

0.025 0.975 0.95P X z X zn n

s sm

0.025X zn

s

0.975X zn

s

Page 19: Estimación de Parámetros · 2017. 6. 8. · Intervalos de confianza para los principales parámetros El caso de la media (1) En este caso, en lugar de indicar simplemente un único

Intervalos de confianza para la media: CASO DE

DESCONOCER LA VARIANZA POBLACIONAL

Para la media (cuando conocemos la varianza poblacional), tenemos la

expresión

Pero si no conocemos la varianza poblacional, no podemos emplear

En su lugar hemos de emplear

Ahora la distribución ya no es exactamente una distribución normal...

Por el tema anterior sabemos que la distribución muestral de

2s

n

2

n

s

/

X

s n

mno es una distribución normal, sino una distribución t de

Student con n-1 grados de libertad.

0.025 0.975 0.95P X z X zn n

s sm

Recordad, en el caso de

varianza conocida teníamos: /

ii

Xz

n

m

s

Page 20: Estimación de Parámetros · 2017. 6. 8. · Intervalos de confianza para los principales parámetros El caso de la media (1) En este caso, en lugar de indicar simplemente un único

Intervalos de confianza para la media: CASO DE

DESCONOCER LA VARIANZA POBLACIONAL

En definitiva, para la media (cuando conocemos la varianza poblacional),

tenemos la expresión

Pero si no conocemos la varianza poblacional (el caso realista), tenemos la

expresión:

En todo caso, recordad que si "n" es grande, la distribución t de Student será

virtualmente una distribución normal N(0,1). En otras palabras, si "n" es grande, ambas

fórmulas dan unos intervalos virtualmente idéntico, y emplear la distribución normal es

correcto.

0.025 0.975 0.95P X z X zn n

s sm

0.025 1 0.975 1 0.95n n

s sP X t X t

n nm

Page 21: Estimación de Parámetros · 2017. 6. 8. · Intervalos de confianza para los principales parámetros El caso de la media (1) En este caso, en lugar de indicar simplemente un único

Intervalos de confianza para los principales

parámetros: El caso de la media (7)

¿Qué quiere decir la expresión siguiente?

Quiere decir que cada vez que extraigamos una muestra y hallemos la

media, el parámetro desconocido m estará entre los límites de dicho

intervalo el 95% de las veces. (O el 99% si hubiéramos elegido un

intervalo al 99%, etc.)

0.025 0.975 0.95P X z X zn n

s sm

Page 22: Estimación de Parámetros · 2017. 6. 8. · Intervalos de confianza para los principales parámetros El caso de la media (1) En este caso, en lugar de indicar simplemente un único

Intervalos de confianza para los principales

parámetros: Tamaño muestral y la amplitud del

intervalo de confianza

Es claro que a medida que el tamaño muestral aumente, la amplitud del intervalo

disminuye. (Evidentemente, esto es general, no sólo para la media.) Veamos, en

todo caso un ejemplo:

Caso A1. Media muestral=10, varianza pobl=4, tamaño muestral=12

Caso A2. Media muestral=10, varianza pobl=4, tamaño muestral=20

Para el caso de la media hemos visto que

0.025 0.975 0.95P X z X zn n

s sm

2 2

10 ( 1.96) 10 1.96 9.12 10.88 0.9520 20

P Pm m

2 2

10 ( 1.96) 10 1.96 8.87 11.13 0.9512 12

P Pm m

Page 23: Estimación de Parámetros · 2017. 6. 8. · Intervalos de confianza para los principales parámetros El caso de la media (1) En este caso, en lugar de indicar simplemente un único

Intervalos de confianza para los principales

parámetros: Amplitud del intervalo de confianza

y el valor del índice de confianza

Pero evidentemente es posible emplear intervalos a, digamos, el 99%. En tal caso,

tendremos más seguridad de que el parámetro de interés se halle en los límites del

intervalo. El problema es que incrementar tal índice aumenta así mismo la amplitud del

intervalo.

Caso A1. Media muestral=10, varianza pobl.=4, tamaño muestral=12. Intervalo al 95%

Caso A2. Media muestral=10, varianza pobl=4, tamaño muestral=12. Intervalo al 99%

El caso "usual" (por defecto) es emplear intervalos al 95%.

0.025 0.975 0.95P X z X zn n

s sm

2 2

10 ( 2.57) 10 2.57 8.52 11.48 0.9912 12

P Pm m

2 2

10 ( 1.96) 10 1.96 8.87 11.13 0.9512 12

P Pm m

Page 24: Estimación de Parámetros · 2017. 6. 8. · Intervalos de confianza para los principales parámetros El caso de la media (1) En este caso, en lugar de indicar simplemente un único

Intervalos de confianza para OTROS parámetros

Intervalos de confianza para las proporciones

Caso de muestras grandes

.025 .975

(1 ) (1 )0.95

P P P PP P z P z

n n

Caso de muestras pequeñas

Page 25: Estimación de Parámetros · 2017. 6. 8. · Intervalos de confianza para los principales parámetros El caso de la media (1) En este caso, en lugar de indicar simplemente un único

Intervalos de confianza para OTROS parámetros

Intervalos de confianza para la varianza

2 22

2 2

.975 1 .025 1

0.95n n

n S n SP s