estadística i tema 5: introducción a la inferencia estadística · tema 5. introducci on a la...

41
Estad´ ıstica I Tema 5: Introducci´on a la inferencia estad´ ıstica

Upload: ngothu

Post on 27-Jan-2019

222 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Estadıstica ITema 5: Introduccion a la inferencia estadıstica

Page 2: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Tema 5. Introduccion a la inferencia estadıstica

Contenidos

I Objetivos.

I Estimacion puntual.

I Bondad de ajuste a una distribucion.

I Distribucion de la media muestral.

I Intervalo de confianza para la media.

Page 3: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Inferencia estadıstica

I Objetivo: Estudiar las caracterısticas de interes de una poblacion atraves de la informacion contenida en una muestra.

I Identificamos el concepto de poblacion estadıstica con el conceptode poblacion sobre la que se define la variable aleatoria X , que esobjeto de estudio.

I La ley o distribucion de la poblacion es la distribucion de los valoresde la variable aleatoria de interes, X . Por ejemplo, X puede teneruna distribucion normal de parametros µ y σ, X ∼ N (µ, σ).

I El objetivo fundamental de la inferencia estadıstica es inferir losvalores de los parametros poblacionales o de determinadascaracterısticas de una variable aleatoria, como la media poblacional,que sean desconocidos, basandonos en la informacion proporcionadapor una muestra.

Page 4: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Muestreo

I Una muestra es un subconjunto finito de una poblacion. El numerode individuos que forman la muestra se denomina tamano muestral.

I En la practica no suele ser habitual estudiar todos los elementos deuna poblacion ya que:

I los elementos pueden existir conceptualmente, pero no en la realidad(poblacion de piezas defectuosas que producira una maquina en suvida util).

I puede ser inviable economicamente estudiar a toda la poblacion.

I el estudio llevarıa tanto tiempo que serıa impracticable e incluso laspropiedades de la poblacion podrıan variar con el tiempo (encuestaselectorales).

I el estudio puede implicar la destruccion del elemento (estudio de lavida media de una partida de bombillas, estudio de la tension derotura de unos cables,. . . ).

Page 5: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Muestreo aleatorio simple

I Un muestreo aleatorio simple consiste en seleccionar aleatoriamentemiembros de una poblacion de tal manera que:

I cada elemento de la poblacion tenga la misma probabilidad de serescogido, asegurando, de esta manera, la representatividad de lamuestra de cara a la poblacion; y

I las selecciones se realizan con reposicion, de tal manera que lapoblacion es identica en todas las extracciones. Notar que si eltamano de la poblacion (N) es grande con respecto al tamanomuestral (n) es indiferente hacer el muestreo con o sin reposicion.

Page 6: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Muestra aleatoria simple

I Sea X la variable aleatoria estudiada con distribucion F . Unamuestra aleatoria simple de tamano n es un conjunto de n v.a.X1, . . . ,Xn tal que:

I X1, . . . ,Xn tienen todas la distribucion F (Xi ∼ F , ∀i).

I X1, . . . ,Xn son independientes entre si.

I Cada valor concreto x1, . . . , xn de dicha m.a.s. se denomina muestraparticular.

I Un estadıstico es una funcion real de la m.a.s. X1, . . . ,Xn. Por tanto,un estadıstico es una variable aleatoria (a diferencia de un parametroque es un numero fijo, inherente a la poblacion).

Page 7: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Uso de la muestra aleatoria simple

I Supongamos una v.a. para la que desconocemos el valor de E [X ].Para estimar el valor de E [X ], es habitual utilizar una m.a.s. paraobtener el estadıstico media muestral:

X =1

n

n∑i=1

Xi

Notar que X es una variable aleatoria.

I Ahora, para una muestra particular x1, . . . , xn, obtenemos el valornumerico particular x = 1

n

∑ni=1 xi .

I OBS: X 6= x .

I Veremos mas adelante porque X es un buen estimador de E [X ],pero antes veamos un ejemplo.

Page 8: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Ejemplo de muestreo e inferencia

I Tenemos una poblacion compuesta de N = 24 individuos (poblacionfinita) donde la variable de interes es X = “Tiempo para completaruna consulta medica”.

I Los valores poblacionales (en minutos) son:

5,1 1 0,9 3,8 10,2 2,1 9,5 4,51 2,2 1,5 4,8 1,6 8,8 4,3 19 5,1 0,2 2,3 0,8 7,8 7,7 1,5

I Por lo tanto, la media poblacional es E [X ] = 4.

Parámetros población, !

Parámetros muestra, l

!

!

Muestreo

Inferencia

0

3,75

7,50

11,25

15,00

DATOS POBLACIÓN

0

2,5

5,0

7,5

10,0

1,50,8

0,2

1,6

4,5

9,5

3,8

DATOS MUESTRA

Page 9: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Ejemplo de muestreo e inferenciaI Seleccionamos una m.a.s. de tamano 7 dada por:

3,8 9,5 4,8 1,6 0,2 0,8 1,5

I La media muestral de estos valores es x = 3,171. Por lo tanto, elerror (sesgo) relativo es (4− 3,171) /4 = 0,207.

I Si a la m.a.s. anterior le anadimos nuevos elementos, la mediamuestral cambia. De hecho, vemos que el aumento reiterado deelementos hace que la media muestral converja a la mediapoblacional.

0

1,5

3,0

4,5

6,0

7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

4,04,24,0

4,34,34,44,44,14,24,4

4,64,6

4,14,0

3,63,9

3,33,1

CAMBIO EN EL PROMEDIO CON EL TAMAÑO MUESTRAL

Tamaño muestral

Page 10: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Ejemplo de muestreo e inferenciaI Por otro lado, si seleccionamos otra m.a.s. de tamano 7 obtenemos:

5,1 1 0,9 3,8 10,2 2,1 9,5

que tiene media muestal x = 4,65. Un histograma con todos losposibles valores de la media muestral para muestras de tamano 7 esel siguiente:

0

5000

10000

15000

20000

25000

1 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4 4 4 5 5 5 5 5 5 5 6 6 6 6 6 6 6 7 7 7 7 7 7 7 8 8

DISTRIBUCION DE MEDIAS MUESTRALES TAMAÑO 7

Page 11: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Ejemplo de muestreo e inferencia

I A continuacion, comparamos los histogramas con todos los posiblesvalores de la media muestral para muestras de tamano 7 y 17:

0

5000

10000

15000

20000

25000

1 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4 4 4 5 5 5 5 5 5 5 6 6 6 6 6 6 6 7 7 7 7 7 7 7 8 8

DISTRIBUCION DE MEDIAS MUESTRALES TAMAÑO 7

0

15000

30000

45000

60000

1 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4 4 4 5 5 5 5 5 5 5 6 6 6 6 6 6 6 7 7 7 7 7 7 7 8 8

DISTRIBUCION DE MEDIAS MUESTRALES TAMAÑO 17

Page 12: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Muestreo aleatorio simple

Conclusiones

I Una muestra aleatoria simple de tamano n de una v.a. X es unconjunto de v.a. independientes, todas con la misma distribucionque X :

{Xi}ni=1 i .i .d .

I La media muestral, X , es una variable aleatoria. En general, losestadısticos son variables aleatorias que dependen de la seleccionaleatoria de los individuos de la muestra.

Page 13: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Media muestral

I Calculemos la esperanza y la varianza de la v.a. X para mostrar lasrazones que hacen a X ser un buen estimador de E [X ].

I Para ello, utilizamos dos propiedades de la esperanza y la varianzade sumas de variables alteatorias.

I Sea X1, . . . ,Xn una m.a.s. de una v.a. X con esperanza E [X ] yvarianza V [X ]. Entonces:

E [a1X1 + · · ·+ anXn] = a1E [X1] + · · ·+ anE [Xn]

yV [a1X1 + · · ·+ anXn] = a21V [X1] + · · ·+ a2nV [Xn] ,

para cualesquiera numeros reales a1, . . . , an.

Page 14: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Media muestral

I Aplicando las propiedades anteriores, obtenemos:

E[X]

= E

[1

n

n∑i=1

Xi

]=

1

n

n∑i=1

E [Xi ] =1

n

n∑i=1

E [X ] = E [X ]

y

V[X]

= V

[1

n

n∑i=1

Xi

]=

1

n2

n∑i=1

V [Xi ] =1

n2

n∑i=1

V [X ] =V [X ]

n

I Por lo tanto, el valor esperado de X es E [X ]. Decimos que X esinsesgado para estimar E [X ].

I Ademas, como V[X]

= V [X ] /n, cuanto mayor sea n, mas cerca se

espera que este X de E [X ].

I Estas propiedades justifican el uso de X como estimador de E [X ].

Page 15: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Distribucion de Bernoulli

I Los resultados anteriores permiten obtener estadısticos que podemosutilizar para estimar los parametros de las distribucionesconsideradas en el Tema 4 conocidos los valores de una m.a.s.

I En primer lugar, sea X una variable aleatoria con una distribucionBernoulli de parametro p, X ∼ Ber (p). Por lo tanto,

X =

{1 con probabilidad p0 con probabilidad 1− p

I p es la probabilidad de exito, tambien llamada proporcion de exitos.

I Notar que E [X ] = p y que V [X ] = p (1− p).

Page 16: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Distribucion de Bernoulli

I Supongamos que tenemos una m.a.s. de tamano n de la v.a. X . Elobjetivo es estimar el valor del parametro p basado en la m.a.s.X1, . . . ,Xn. Puesto que p, la probabilidad de exito, es el valoresperado de X , podemos estimar p como sigue:

p = X

I Ademas, por los resultados anteriores, tenemos que:

E [p] = p y V [p] =p (1− p)

n

por lo que si el tamano muestral es muy grande p debe estar muycerca de p.

Page 17: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Ejemplo

I En un pueblo, Pablo se quiere presentar a alcalde. Como quiereconocer las posibilidades que tiene, Pablo decide hacer una pequenaencuesta para estimar la proporcion de personas que le votarıan.

I Suponemos la v.a. X =“Votar a Pablo” que toma dos valores, 1, sila persona seleccionada pretende votar a Pablo, y 0, si no.

I Tomamos una muestra de tamano 10 obteniendo los valores:

1 0 0 1 1 0 1 0 1 0

I Por lo tanto, la proporcion estimada de presuntos votantes de Pabloes p = 0,5.

Page 18: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Distribucion Binomial

I A continuacion, sea Y una variable aleatoria con una distribucionBinomial de parametros m y p, Y ∼ B (m, p). Por lo tanto,

P (Y = y) =

(m

y

)py (1− p)m−y

para y = 0, 1, . . . ,m.

I Recordamos que la binomial Y ∼ B (m, p) es la suma de m v.a.Bernoulli independientes de parametro p, es decir, una m.a.s.X1, . . . ,Xm, por lo que Y = X1 + · · ·+ Xm.

I Por lo tanto, E [Y ] = mp y que V [Y ] = mp (1− p).

I Veamos como estimar la proporcion p en dos situaciones que nospodemos encontrar.

Page 19: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Distribucion Binomial

I En primer lugar, si unicamente tenemos una muestra de Y , digamosY1, entonces podemos estimar p como sigue:

p =Y1

m=

X1 + · · ·+ Xm

m

que coincide con la media muestral de la m.a.s. X1, . . . ,Xm de lavariable Bernoulli X .

I Por ello, la estimacion verifica las mismas propiedades que en el casode la Bernoulli, es decir:

E [p] = p y V [p] =p (1− p)

m

por lo que si el numero de repeticiones del experimento Bernoulli, m,es muy grande, p debe estar muy cerca de p.

Page 20: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Ejemplo

I En el ejemplo anterior, si definimos la variable Y =“Numero devotantes de Pablo en una muestra de tamano 10”, para la muestraobtenida obtendremos Y1 = 5.

I En este caso, claro esta, la proporcion estimada es la misma que enel ejemplo anterior, p = 0,5.

Page 21: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Distribucion Binomial

I En segundo lugar, si tenemos una m.a.s. de tamano n de la v.a. Y ,digamos Y1, . . . ,Yn (Notar que n es el tamano de la muestra y m esel numero de repeticiones del experimento Bernoulli), entoncespodemos estimar p como sigue:

p =Y

m=

Y1 + · · ·+ Yn

n ×m

I Ademas, por las propiedades de la media muestral, tenemos que:

E [p] = E

[Y

m

]=

mp

m= p

y

V [p] = V

[Y

m

]=

1

m2V[Y]

=p (1− p)

n ×m

por lo que si el numero de repeticiones del experimento, m, y/o elnumero de muestral binomiales, n, es muy grande, p debe estar muycerca de p.

Page 22: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Ejemplo

I Supongamos a continuacion que Pablo realiza un segundo muestreoobteniendo los siguientes valores de la variable X =“Votar a Pablo”:

0 0 0 0 1 0 0 1 0 0

I En este caso, la proporcion de votantes estimada es 0.2.

I El valor obtenido de la variable Y =“Numero de votantes en unamuestra de tamano 10” es, entonces, Y2 = 2.

I Si buscamos un estimador de la proporcion que tenga en cuenta losvalores, Y1 = 5 e Y2 = 2, obtenemos:

p =5 + 2

10× 2=

7

20= 0,35

Page 23: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Distribucion normal

I Por ultimo, sea X una variable aleatoria con una distribucion normalo Gaussiana de parametros µ y σ, X ∼ N (µ, σ). Por lo tanto,

f (x) =1√2πσ

exp

{− 1

2σ2(x − µ)2

}, para −∞ < x <∞

Recordamos que E [X ] = µ y que V [X ] = σ2.

I Ahora, si tenemos una m.a.s. de tamano n de la v.a. X , digamosX1, . . . ,Xn, entonces podemos estimar p como sigue:

µ = X y σ =

√√√√1

n

n∑i=1

(Xi − X

)2

Page 24: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Distribucion normalI Por las propiedades de la media muestral, se verifica que:

E [µ] = E[X]

= µ y V [µ] = V[X]

=σ2

n

por lo que si n, es muy grande, µ debe estar muy cerca de µ.

I El analisis de la desviacion tıpica es mas complejo, pero se puededemostrar que:

E[σ2]

=n − 1

nσ2

es decir, E[σ2]

no es σ2, si bien E[σ2]

tiende a σ2 si n tiende a ∞.

I Por esta razon, a veces se suele utilizar el estimador llamadoquasi-desviacion tıpica dado por:

s =

√√√√ 1

n − 1

n∑i=1

(Xi − X

)2Para este estimador, tenemos que E

[s2]

= σ2.

Page 25: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Ejemplo

I Se supone que el rendimiento mensual de un cierto activo financierosigue una distribucion normal. Se desea conocer los parametros dedicha distribucion.

I Se disponen de n = 46 valores de los rendimientos mensuales dedicho activo (en porcentajes).

I La media muestral, x = 1,03, es un estimador de la mediapoblacional µ.

I Por otro lado, la desviacion tıpica muestral, σ = 4,16, es unestimador de la desviacion tıpica poblacional, σ. Un estimadoralternativo es la quasi-desviacion tıpica, s = 4,25.

Page 26: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Bondad de ajuste

I Como hemos visto en los ejemplos anteriores, a veces es necesariosuponer que los datos proceden de una cierta distribucion. Estasuposicion debe ser debidamente justificada.

I Existen diferentes metodos utiles para realizar dicha justificacion quereciben el nombre de metodos para la bondad del ajuste.

I Aquı unicamente vamos a considerar dos procedimientos graficosmuy habituales para la bondad de ajuste.

Page 27: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Histograma con funcion de densidadI El primero consiste en comparar un histograma de los datos con la

funcion de densidad obtenida con los parametros estimados. Si lahipotesis de partida es cierta, entonces la funcion de densidad debeser parecida al histograma.

I Por ejemplo, el siguiente grafico muestra los datos correspondientesa 200 rendimientos de un activo financiero. El grafico compara elhistograma con la funcion de densidad normal obtenida con losparametros estimados (µ = 0,83 y σ = 4,12).

Page 28: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

QQ-plot

I El segundo de los metodos es un grafico llamado QQ-plot. ElQQ-plot muestra los cuantiles estimados de los datos frente a loscuantiles equivalentes de la distribucion con los parametrosestimados de la muestra.

I Si los datos han sido realmente generados por la distribucionconsiderada, entonces los puntos del grafico deben disponersealrededor de una lınea recta.

I Si la funcion de distribucion correspondiente es continua y creciente,el cuantil p-esimo (0 < p < 1), denotado por qp se obtieneinvirtiendo la funcion de distribucion. Es decir, si buscamos el valorde qp tal que F (qp) = p, entonces, qp = F−1(p). Si la distribuciones discreta o constante a trozos, qp = min {x : F (x) ≥ p}.

I El cuantil muestral p-esimo, Qp, se obtienen mediante el siguienteproceso: (1) ordenamos los datos de menor a mayor, obteniendo lasecuencia x(1), . . . , x(n); (2) entonces, Qp viene dado por Qp = x([np]).

Page 29: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

QQ-plot

I Por ejemplo, el siguiente grafico muestra el QQ-plot de los 200rendimientos de un cierto activo financiero, donde se muestran loscuantiles estimados de los datos frente a los cuantiles equivalentesde la distribucion normal de parametros µ = 0,83 y σ = 4,12.

I Como se puede comprobar el ajuste parece bastante bueno.

Page 30: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

La distribucion de la media muestral

I En previas transparencias hemos visto como realizar estimacion delos parametros de algunas distribuciones basandonos en laspropiedades de la media muestral.

I A continuacion, buscamos conocer cual es la distribucion de lamedia muestral. Esta distribucion nos sera de gran utilidad paradefinir intervalos de confianza.

Page 31: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

La distribucion de la media muestral

I Si X tiene una distribucion normal N (µ, σ) y X1, . . . ,Xn es unam.a.s. de X , se verifica que:

X ∼ N(µ,

σ√n

)=⇒ X − µ

σ√n

∼ N (0, 1)

I Si X tiene esperanza E [X ] y varianza V [X ] y no tiene unadistribucion normal, entonces el Teorema Central del Lımite (TCL)afirma que, si X1, . . . ,Xn es una m.a.s. de X , donde n essuficientemente grande (n ≥ 30, aproximadamente), se verifica que:

X ∼ N

(E [X ] ,

√V [X ]

n

)=⇒ X − E [X ]√

V [X ]n

−→ N (0, 1)

Page 32: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Ejemplo

I Si X1, . . . ,Xn es una m.a.s. de X que tiene una distribucion Ber (p),para n grande tenemos que:

X −→ N

(p,

√p (1− p)

n

)=⇒ X − p√

p(1−p)n

−→ N (0, 1)

Page 33: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Ejemplo

I Sea X la v.a. discreta con funcion de probabilidad:

P (X = x) =

{1/4 si x = 1, 2, 3, 4

0 si no

I Se toma una m.a.s. de tamano n = 125 de X . ¿Cual es laprobabilidad de que la media muestral se encuentre entre 2,4 y 2,6?

I Tenemos que:

E [X ] =1

4× 1 +

1

4× 2 +

1

4× 3 +

1

4× 4 = 2,5

V [X ] = E[X 2]− E [X ]2 =

=1

4× 12 +

1

4× 22 +

1

4× 32 +

1

4× 42 − 2,52 = 1,25

Page 34: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Ejemplo

I Por lo tanto,

X −→ N

(2,5,

√1,25

125

)= N (2,5, 0,1)

I De esta distribucion obtenemos que, aproximadamente:

P(2,4 < X < 2,6

)= P

(2,4− 2,5

0,1<

X − 2,5

0,1<

2,6− 2,5

0,1

)=

= P (−1 < Z < 1) = P (Z < 1)− P (Z < −1) =

= P (Z < 1)− (1− P (Z < 1)) =

= 2× P (Z < 1)− 1 = 2× 0,8413− 1 = 0,6826.

Page 35: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Intervalos de confianza

I En lugar de un estimador puntual, parece ser mas informativoproducir un intervalo de valores posibles para el verdadero valor delparametro desconocido.

I Por ejemplo, dada una muestra nos gustarıa conocer un intervalo devalores que con toda seguridad incluya al verdadero valor de lamedia poblacional, µ. Por desgracia, esto no es posible.

I En su lugar, consideramos un procedimiento de construccion deintervalos de tal manera que el (1− α) % de los intervalos que sepueden construir con diferentes m.a.s. contega el verdadero valor dela media poblacional, µ. Aquı, α es el nivel de confianza y elintervalo obtenido se llamara intervalo de confianza.

Page 36: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Intervalos de confianza

I Supongamos X1, . . . ,Xn una m.a.s. de una v.a. X con distribucionN (µ, σ), siendo σ conocida.

I Sabemos que X ∼ N(µ, σ√

n

), o lo que es lo mismo, que

X−µσ√n

∼ N (0, 1). Entonces:

P

(−zα/2 <

X − µσ√n

< zα/2

)= 1− α

de donde:

P

(X − zα/2

σ√n< µ < X + zα/2

σ√n

)= 1− α

I Por lo tanto, para una muestra particular x1, . . . , xn, un intervalo deconfianza para µ al nivel 1− α esta dado por:(

x − zα/2σ√n, x + zα/2

σ√n

)

Page 37: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Intervalos de confianza

I Se han generado 100 muestras de tamano 50 de una distribucionN (−2, 1). Se han construido los intervalos de confianza al 90 % paraµ. Aproximadamente, el 90 % de los intervalos ası construidosincluye el valor real µ = 2.Interpretacion frecuentista del intervalo de confianza

Page 38: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Ejemplo

I Supongamos que los rendimientos de las acciones de la empresaSEGURA S.L. siguen una distribucion normal de media µ euros yvarianza σ2 = 1. Se toma una m.a.s. de n = 20 rendimientos,obteniendo los valores:

5,29 3,66 5,71 6,62 4,30 5,85 6,25 3,40 3,55 5,574,60 5,69 5,81 5,71 6,29 5,66 6,19 3,79 4,98 4,84

I La media muestral para estos 20 datos es x = 5,188. Por lo tanto, elintervalo de confianza al 90 % para el rendimiento medio de estaempresa es:(

5,188− 1,6451√20, 5,188 + 1,645

1√20

)= (4,6678, 5,7082)

Page 39: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Intervalo de confianza

I ¿Que ocurre si la desviacion tıpica no es conocida o la poblacion noes normal?

I Cuando el tamano muestral, n, es grande, el TCL nos dice que ladistribucion de X es aproximadamente normal independientementede la distribucion de los datos.

I Por lo tanto, si los datos no son normales, para muestras grandes,podemos utilizar el intervalo de confianza siguiente para la mediapoblacional: (

x − zα/2σ√n, x + zα/2

σ√n

)siendo σ la desviacion tıpica estimada de los datos.

Page 40: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Intervalo de confianza

I Sea X1, . . . ,Xn una m.a.s. de una v.a. X que sigue una distribucionBer(p). Entonces, X es una v.a. que estima la proporcion de exitosen n experimentos Bernoulli, p.

I Por el TCL sabemos que:

X ∼ N

(p,

√p (1− p)

n

)I El intervalo de confianza para la proporcion p queda entonces como

sigue: (p − zα/2

√p (1− p)

n, p + zα/2

√p (1− p)

n

)donde p = x .

Page 41: Estadística I Tema 5: Introducción a la inferencia estadística · Tema 5. Introducci on a la inferencia estad stica Contenidos I Objetivos. I Estimaci on puntual. I Bondad de ajuste

Ejemplo

I En el ejemplo de la estimacion del parametro p de la Bernoulli,Pablo finalmente realiza n = 100 entrevistas y obtiene la estimacionp = 0,4.

I El intervalo de confianza al 95 % de la proporcion p es:(0,4− 1,96

√0,4 (1− 0,4)

100, 0,4 + 1,96

√0,4 (1− 0,4)

100

)=

= (0,3039, 0,4960)