estadistica y probabilidad

15
Parte 1 – Suma de variables aleatorias y Teorema central del límite Prof. María B. Pintarelli 103 6- SUMA DE VARIABLES ALEATORIAS Y TEOREMA CENTRAL DEL LÍMITE 6.1 – Suma de variables aleatorias independientes Cuando se estudiaron las variables aleatorias bidimensionales se habló de una función de variable aleatoria bidimensional. En particular se nombró la suma de n variables aleatorias, pero no se dijo nada sobre la distribución de esa v.a. suma. Es a menudo importante saber cuál es la distribución de una suma de variables aleatorias indepen- dientes. Consideramos algunos ejemplos en el caso discreto 1- Suma de variables aleatorias independientes con distribución Poisson ) ( ~ ntes independie Y y ; ) ( ~ ; ) ( ~ 2 1 2 1 λ λ λ λ + + P Y X X P Y P X Dem.) Consideramos el evento { } n Y X = + como unión de eventos excluyentes { } n k k n Y k X = = 0 , , entonces ( ) = = = = = = = = = + = = = ! ! ) ( ) ( ) , ( ) ( 2 0 1 0 0 2 1 k n e k e k n Y P k X P k n Y k X P n Y X P k n n k k n k n k λ λ λ λ X e Y independientes ( ) ( ) ( ) n k n n k k n k k n k n e k n k n n e k n k e 2 1 ) ( 2 0 1 ) ( 0 2 1 ) ( ! ! ! ! ! ! ! 2 1 2 1 2 1 λ λ λ λ λ λ λ λ λ λ λ λ + = = = + = + = + Binomio de Newton O sea X+Y tiene distribución Poisson con parámetro 2 1 λ λ + 2- Suma de variables aleatorias binomiales independientes ) , ( ~ ntes independie Y y ; ) , ( ~ ; ) , ( ~ 2 1 2 1 p n n B Y X X p n B Y p n B X + + Dem.) Nuevamente consideramos el evento { } k Y X = + como unión de eventos excluyentes { } 1 0 , n i i k Y i X = = , entonces = = = = = = = = = + + = = = i k n i k i n i n k n i n i p p i k n p p i n i k Y P i X P i k Y i X P k Y X P 2 1 1 1 1 ) 1 ( ) 1 ( ) ( ) ( ) , ( ) ( 2 0 1 0 0 X e Y independientes = = + i k n i n p p n i k n n k 2 0 1 1 2 1 ) 1 ( En la expresión anterior si r j > entonces 0 = j r

Upload: robert-taylor

Post on 14-Feb-2016

10 views

Category:

Documents


8 download

DESCRIPTION

teorema del limite central

TRANSCRIPT

Page 1: Estadistica y Probabilidad

Parte 1 – Suma de variables aleatorias y

Teorema central del límite Prof. María B. Pintarelli

103

6- SUMA DE VARIABLES ALEATORIAS Y TEOREMA

CENTRAL DEL LÍMITE

6.1 – Suma de variables aleatorias independientes

Cuando se estudiaron las variables aleatorias bidimensionales se habló de una función de variable

aleatoria bidimensional. En particular se nombró la suma de n variables aleatorias, pero no se dijo

nada sobre la distribución de esa v.a. suma.

Es a menudo importante saber cuál es la distribución de una suma de variables aleatorias indepen-

dientes.

Consideramos algunos ejemplos en el caso discreto

1- Suma de variables aleatorias independientes con distribución Poisson

)(~ ntesindependie Yy ; )(~ ; )(~ 2121 λλλλ ++⇒ PYXXPYPX

Dem.)

Consideramos el evento { }nYX =+ como unión de eventos excluyentes

{ } nkknYkX ≤≤−== 0 , , entonces

( )=

−=−===−====+

−−

=

==∑∑∑

!!)()(),()( 2

0

1

00

21

kne

keknYPkXPknYkXPnYXP

knn

k

kn

k

n

k

λλ λλ

X e Y independientes

( ) ( )( )nkn

n

k

kn

k

knk

n

e

knk

n

n

e

knke 21

)(

2

0

1

)(

0

21)(

!!!

!

!!!

2121

21 λλλλλλ λλλλ

λλ +=−

=−

=+−

=

+−

=

−+− ∑∑

Binomio de Newton

O sea X+Y tiene distribución Poisson con parámetro 21 λλ +

2- Suma de variables aleatorias binomiales independientes

),(~ ntesindependie Yy ; ),(~ ; ),(~ 2121 pnnBYXXpnBYpnBX ++⇒

Dem.)

Nuevamente consideramos el evento { }kYX =+ como unión de eventos excluyentes

{ } 10 , niikYiX ≤≤−== , entonces

=−

−−

=−===−====+ +−−−

===∑∑∑ iknikinin

k

n

i

n

i

ppik

npp

i

nikYPiXPikYiXPkYXP 21

111

)1()1()()(),()(2

0

1

00

X e Y independientes

−= ∑

=

−+

ik

n

i

npp

n

i

knnk 2

0

11

21)1(

En la expresión anterior si rj > entonces 0=

j

r

Page 2: Estadistica y Probabilidad

Parte 1 – Suma de variables aleatorias y

Teorema central del límite Prof. María B. Pintarelli

104

Por último usamos la siguiente identidad combinatoria ∑=

+=

1

0

2121n

i k

nn

ik

n

i

n

Y entonces

knnkpp

k

nnkYXP

−+−

+==+ 21)1()(

21

O sea X+Y tiene distribución binomial con parámetros 21 nn + y p

Observación: en los dos casos anteriores se puede generalizar el resultado a n variables aleatorias

independientes, usando el principio de inducción completa, es decir

1- Si nXXX ,...,, 21 son n variables aleatorias independientes donde )(~ ii PX λ para todo

ni ,...,2,1= entonces )(~00

∑∑==

n

i

i

n

i

i PX λ

2- Si nXXX ,...,, 21 son n variables aleatorias independientes donde ),(~ pnBX ii para todo

ni ,...,2,1= entonces ),(~00

pnBXn

i

i

n

i

i ∑∑==

Suma de variables aleatorias normales independientes

Si X e Y son dos variables aleatorias continuas independientes con densidades g(x) y h(y) respecti-

vamente se puede probar (no lo demostraremos aquí) que la v.a. YXZ += tiene densidad dada

por ∫∞

∞−

+ −= dyyhyzgzf YX )()()(

Usando esto se puede demostrar el siguiente importante resultado:

Por inducción completa se puede generalizar este resultado a n variables:

De lo anterior y del hecho que ( ) ),~ ,~ 222 σµσµ abN(abaXNX ++⇒ tenemos:

Si nXXX ,...,, 21 son n variables aleatorias independientes donde ),(~ 2

iii NX σµ para todo

ni ,...,2,1= entonces ),(~1

2

00

∑∑∑===

n

i

i

n

i

i

n

i

i NX σµ

Si nXXX ,...,, 21 son n variables aleatorias independientes donde ),(~ 2

iii NX σµ para todo

ni ,...,2,1= entonces ),(~1

22

00

∑∑∑===

n

i

ii

n

i

ii

n

i

ii aaNXa σµ donde naaa ,...,, 21 son números reales

Si X e Y son variables aleatorias independientes donde ( ) ,~2

11 σµNX y ( ) ,~2

22 σµNY enton-

ces ( ) ,~2

2

2

121 σσµµ +++ NYX

Page 3: Estadistica y Probabilidad

Parte 1 – Suma de variables aleatorias y

Teorema central del límite Prof. María B. Pintarelli

105

Se dice que ∑=

n

i

iiXa0

es una combinación lineal de variables aleatorias.

Ejemplos:

1- La envoltura de plástico para un disco magnético está formada por dos hojas. El espesor de cada

una tiene una distribución normal con media 1.5 milímetros y desviación estándar de 0.1 milí-

metros. Las hojas son independientes.

a) Determine la media y la desviación estándar del espesor total de las dos hojas.

b) ¿Cuál es la probabilidad de que el espesor total sea mayor que 3.3 milímetros?

Solución: Sean las variables aleatorias

X: “espesor de la hoja 1” e Y: “espesor de la hoja 2”

Entonces )1.0,5.1~ 2N(X ; )1.0,5.1~ 2N(Y y X e Y independientes

a) Si definimos la v.a. Z: “espesor total de las dos hojas” , entonces YXZ +=

Por lo tanto )1.01.0 ,5.15.1~ 22 ++N(Z es decir )02.0 ,3~ N(Z

En consecuencia 3)( =ZE , 02.0)( == ZVZσ

b) Se pide calcular )3.3( >ZP

( ) 017.0983.0112132.2102.0

33.31

02.0

33.3

02.0

3)3.3( =−=Φ−=

−Φ−=

−>

−=>

ZPZP

2-Tengo tres mensajes que atender en el edificio administrativo. Sea Xi : “ el tiempo que toma el i-

ésimo mensaje” (i = 1, 2 ,3), y sea X4 : “ el tiempo total que utilizo para caminar hacia y desde el

edificio y entre cada mensaje”. Suponga que las Xi son independientes, normalmente distribui-

das, con las siguientes medias y desviaciones estándar:

3 ,12 ,2 ,8 ,1 ,5 ,4 min,15 44332211 ======== σµσµσµσµ

Pienso salir de mi oficina precisamente a las 10.00 a.m. y deseo pegar una nota en mi puerta que

dice “regreso a las t a.m.” ¿A qué hora t debo escribir si deseo que la probabilidad de mi llegada

después de t sea 0.01?

Solución: Definimos la v.a. Z: “tiempo transcurrido desde que salgo de mi oficina hasta que re-

greso”, entonces 4321 XXXXT +++=

Por lo tanto

∑∑==

4

1

24

1

,~i

i

i

iNT σµ , y se pide hallar t tal que 01.0)( => tTP

501285154

1

=+++=∑=i

iµ y 303214222

4

1

22 =+++=∑=i

Entonces 01.030

501)( =

−Φ−=>

ttTP , es decir 99.0

30

50=

−Φ

t

Buscando en la tabla de la normal 7619.62503033.2 33.230

50=+×=⇒=

−t

t

3- El ancho del marco de una puerta tiene una distribución normal con media 24 pulgadas y des-

viación estándar de 1/8 de pulgada. El ancho de la puerta tiene una distribución normal con me-

dia 23.875 de pulgadas y desviación estándar de 1/16 de pulgadas. Suponer independencia.

a) Determine la distribución, la media y la desviación estándar de la diferencia entre el ancho

del marco y de la puerta.

Page 4: Estadistica y Probabilidad

Parte 1 – Suma de variables aleatorias y

Teorema central del límite Prof. María B. Pintarelli

106

b) ¿Cuál es la probabilidad de que la diferencia entre el ancho del marco y de la puerta sea ma-

yor que ¼ de pulgada?.

c) ¿Cuál es la probabilidad de que la puerta no quepa en el marco?.

Solución: Sean las variables aleatorias

X: “ancho del marco de la puerta en pulgadas”

Y: “ancho de la puerta en pulgadas”

Entonces )1/8)( ,24~ 2N(X , )1/16)( ,875.23~ 2N(Y , X e Y independientes

a) Se pide la distribución de X-Y , )( YXE − , )( YXVYX −=−σ

125.0875.2324)()()( =−=−=− YEXEYXE

16

5

256

5

16

1

8

1)()()(

22

=∴=

+

=+=− −YXYVXVYXV σ

Por lo tanto

2

16

5 ,125.0~ NYX

b) Se pide la probabilidad )4/1( >−YXP

1867.08133.01)8944.0(15

521

16

5

125.025.01)4/1( =−=Φ−=

Φ−=

Φ−=>−YXP

c) Si la puerta no entra en el marco entonces se da el evento { }YX < o equivalentemente

{ }0<−YX , por lo tanto

1867.05

521

5

52

16

5

125.00)0( =

Φ−=

−Φ=

Φ=<−YXP

4- Supongamos que las variables aleatorias X e Y denotan la longitud y el ancho en cm, respecti-

vamente, de una pieza.

Supongamos además que X e Y son independientes y que X ~ N(2 , 0.12 ) , Y ~ N(5 , 0.2

2 ).

Entonces Z = 2X + 2Y es una v.a. que representa el perímetro de la pieza.

Calcular la probabilidad de que el perímetro sea mayor que 14.5 cm.

Solución: tenemos que ( )2222 2.021.02 ,5222 ~ ×+××+×NZ , o sea ( )0.2 ,14 ~ NZ

La probabilidad pedida es )5.14( >ZP , entonces

( ) 119.08810.011180.112

51

2.0

145.141)5.14( =−=Φ−=

Φ−=

−Φ−=>ZP

5- Si se aplican dos cargas aleatorias 21 y XX a una viga voladiza como se muestra en la figura si-

guiente, el momento de flexión en 0 debido a las cargas es 2211 XaXa + .

a) Suponga que 21 y XX son v.a. independientes con medias 2

y 4 KLbs respectivamente, y desviaciones estándar 0.5 y

1.0 KLbs, respectivamente.

Page 5: Estadistica y Probabilidad

Parte 1 – Suma de variables aleatorias y

Teorema central del límite Prof. María B. Pintarelli

107

Si 51 =a pies y 102 =a pies, ¿cuál es el momento de flexión esperado y cuál es la desviación

estándar del momento de flexión?

b) Si 21 y XX están normalmente distribuidas, ¿cuál es la probabilidad de que el momento de

flexión supere 75 KLbs?

Solución: Sea la v.a. Z: “momento de flexión en 0”, entonces 21 105 XXZ +=

Por lo tanto

a) 5041025)(10)(5)( 21 =×+×=+= XEXEZE

4

65

4

6511025.0251105.05)( 2222 =∴=×+×=×+×= ZZV σ

b) Si 21 y XX están normalmente distribuidas, entonces

4

65 ,50 ~ NZ

Por lo tanto

( ) 01120.6113

65101

4

65

50751)75( =−≈Φ−=

Φ−=

Φ−=>ZP

Promedio de variables aleatorias normales independientes

Dem.) Notar que n

X

X

n

i

i∑== 1 es un caso particular de combinación lineal de variables aleatorias

donde n

ai1

= para todo ni ,...,2,1=

Además en este caso µµ =i y 22 σσ =i para todo ni ,...,2,1=

Por lo tanto, X tiene distribución normal con esperanza µµµµ ===∑∑==

n

i

n

i

i nnnn 11

111 y varian-

za

nn

nnn

n

i

i

n

i

22

2

2

2

1

2

2

1

111 σσσσ =

=

=

∑∑==

Es decir,

nNX

2

,~σ

µ

Observación: a X se lo llama promedio muestral o media muestral

Si nXXX ,...,, 21 son n variables aleatorias independientes donde ),(~ 2σµNX i para todo

ni ,...,2,1= entonces la v.a. n

X

X

n

i

i∑== 1 tiene distribución normal con

media µ y varianza n

Page 6: Estadistica y Probabilidad

Parte 1 – Suma de variables aleatorias y

Teorema central del límite Prof. María B. Pintarelli

108

Ejemplos:

1) El diámetro interno de un anillo de pistón seleccionado al azar es una v.a. con distribución nor-

mal con media 12 cm y desviación estándar de 0.04 cm.

a) Si X es el diámetro promedio en una muestra de 16=n anillos, calcule )01.1299.11( ≤≤ XP

b) ¿Qué tan probable es que el diámetro promedio exceda de 12.01 cuando 25=n ?

Solución:

a) Sean las variables aleatorias :iX “diámetro del anillo i” 16,...,2,1=i

Entonces ( )04.0 ,12~ 2NX i para cada i.

Por lo tanto

16

04.0,12~2

NX . Entonces

( ) ( )

6826.018413.02

1)1(211

16

04.0 2

1299.11

16

04.0 2

1201.12

)

16

04.0 2

1201.12

16

04.0 2

12

16

04.0 2

1299.11()01.1299.11(

=−×=

=−=−−=

−−

−=

=−≤−≤−=≤≤

φφφφφ

XPXP

b) En este caso

25

04.0,12~2

NX , entonces

1056.08944.01)25.1(1

25

04.0

1201.121)01.12(

2=−=−=

−−=> φφXP

2) Una máquina embotelladora puede regularse de tal manera que llene un promedio de µ onzas

por botella. Se ha observado que la cantidad de contenido que suministra la máquina presenta una

distribución normal con 1=σ onza. De la producción de la máquina un cierto día, se obtiene una

muestra de 9 botellas llenas (todas fueron llenadas con las mismas posiciones del control operati-

vo) y se miden las onzas del contenido de cada una.

a) Determinar la probabilidad de que la media muestral se encuentre a lo más a 0.3 onzas de la

media real µ para tales posiciones de control

b) ¿Cuántas observaciones deben incluirse en la muestra si se desea que la media muestral esté a

lo más a 0.3 onzas de µ con una probabilidad de 0.95?

Page 7: Estadistica y Probabilidad

Parte 1 – Suma de variables aleatorias y

Teorema central del límite Prof. María B. Pintarelli

109

Solución:

a) Sean las variables aleatorias :iX “contenido en onzas de la botella i” 9,...,2,1=i

Entonces ( )1,~ µNX i para cada i.

Por lo tanto

9

1,~ µNX . Se desea calcular

6318.01)9.0(2

)9.0()9.0(9.09.03.03.0

3.03.0)3.03.0()3.0(

=−Φ=

=−Φ−Φ=

−≤−=

−≤−=

=

≤−

≤−=≤−≤−=≤−

n

XP

nn

X

n

P

nn

X

n

PXPXP

σµ

σσµ

σ

σσµ

σµµ

b) Ahora se pretende que

95.0)3.03.0()3.0( =≤−≤−=≤− µµ XPXP

Entonces

95.03.01

3.03.03.0

)3.0( =

−≤−=

−≤

−=≤− n

n

XnP

nn

X

n

PXPµ

σσµ

σµ

Mediante la tabla de la acumulada de la normal estándar se tiene que

( ) ( ) ( ) 96.13.0 0.9753.0 95.013.023.01

3.0 =⇒=Φ⇒=−Φ=

−≤− nnnn

n

XnP

µ

O sea 68.423.0

96.12

=

≈n

Si tomamos 43=n , entonces )3.0( ≤− µXP será un poco mayor que 0.95

6.2 - Teorema central del límite

Acabamos de ver que la suma de un número finito n de variables aleatorias independientes que

están normalmente distribuidas es una variable aleatoria también normalmente distribuida. Esta

propiedad reproductiva no es exclusiva de la distribución normal. En efecto, por ejemplo, ya vimos

que existen variables aleatorias discretas que la cumplen, es el caso de la Poisson y la Binomial.

En realidad, la propiedad que le da a la distribución normal el lugar privilegiado que ocupa entre

todas las distribuciones es el hecho de que la suma de un número muy grande, rigurosamente un

número infinito numerable, de variables aleatorias independientes con distribuciones arbitrarias

(no necesariamente normales) es una variable aleatoria que tiene, aproximadamente, una distribu-

ción normal. Este es, esencialmente, el contenido del

Page 8: Estadistica y Probabilidad

Parte 1 – Suma de variables aleatorias y

Teorema central del límite Prof. María B. Pintarelli

110

Dem.) sin demostración

Observaciones:

1- Notar que ( ) ( ) µnXEXESEn

i

i

n

i

in ==

= ∑∑

== 11

y ( ) ( ) 2

11

σnXVXVSVn

i

i

n

i

in ==

= ∑∑

==

Por lo tanto 2σ

µ

n

nSZ n

n

−= es la v.a. nS estandarizada

2- Notar que

=

=

n

XPz

n

n

n

nS

Pzn

nSP

n

n

σµ

σ

µ

σ

µ22

, por lo tanto también se puede

enunciar el Teorema central del límite de la siguiente forma

Donde

n

XZ n σ

µ−= es el promedio muestral estandarizado

3- Aunque en muchos casos el T.C.L. funciona bien para valores de n pequeños , en particular

donde la población es continua y simétrica, en otras situaciones se requieren valores de n mas

grandes, dependiendo de la forma de la distribución de las iX . En muchos casos de interés prácti-

co, si 30≥n , la aproximación normal será satisfactoria sin importar cómo sea la forma de la dis-

tribución de las iX . Si 30<n , el T.C.L. funciona si la distribución de las iX no está muy alejada

de una distribución normal

4- Para interpretar el significado del T.C.L., se generan (por computadora) n valores de una v.a.

exponencial con parámetro 5.0=λ , y se calcula el promedio de esos n valores. Esto se repite 1000

veces, por lo tanto tenemos 1000 valores de la v.a. X .

Teorema central del límite (T.C.L.):

Sean nX,...,X,X 21 variables aleatorias independientes con ( ) µ=iXE y ( ) 2σ=iXV para todo

n,...,,i 21= , es decir independientes idénticamente distribuidas

Sea la v.a. ∑=

=n

i

in XS1

y sea 2σ

µ

n

nSZ n

n

−= .

Entonces ( ) ( )zzZPlim nn

Φ=≤∞→

, esto es ∫∞−

∞→=

− zx

n

ndxez

n

nSP 2

2

2

2

1lim

πσ

µ

Sean nX,...,X,X 21 variables aleatorias independientes con ( ) µ=iXE y ( ) 2σ=iXV para todo

n,...,,i 21= , es decir independientes idénticamente distribuidas

Sea la v.a. promedio muestral ∑=

=n

i

iXn

X1

1 y sea

n

XZ n σ

µ−= .

Entonces ( ) ( )zzZPlim nn

Φ=≤∞→

, esto es ∫∞−

∞→=

− zx

ndxez

n

XP 2

2

2

1lim

πσ

µ

Page 9: Estadistica y Probabilidad

Parte 1 – Suma de variables aleatorias y

Teorema central del límite Prof. María B. Pintarelli

111

Hacemos un histograma de frecuencias de X , esto es, tomamos un intervalo ),( ba donde

“caen” todos los valores de X , y lo subdividimos en intervalos mas chicos de igual longitud. La

frecuencia de cada subintervalo es la cantidad de valores de X que caen en dicho subintervalo.

Se grafican estas frecuencias obteniéndose los gráficos siguientes que se pueden considerar una

aproximación a la verdadera distribución de X .

Se observa que a medida que aumenta el valor de n los gráficos se van haciendo más simétricos,

pareciéndose a la gráfica de una distribución normal.

Ejemplos:

1- Supóngase que 30 instrumentos electrónicos D1, D2, ......,D30, se usan de la manera siguiente: tan

pronto como D1 falla empieza a actuar D2. Cuando D2 falla empieza a actuar D3, etc. Supóngase

que el tiempo de falla de Di es una v.a. distribuida exponencialmente con parámetro λ = 0.1 por hora. Sea T el tiempo total de operación de los 30 instrumentos. ¿Cuál es la probabilidad de que T

exceda 350 horas?

Solución:

Si iX : “tiempo de falla del instrumento iD ” 30,...,2,1=i

Entonces )1.0(~ ExpX i para 30,...,2,1=i

El tiempo total de operación de los 30 instrumentos es ∑=

=30

1i

iXT , donde

3001.0

130)(30)(

30

1

=×=×=

= ∑

=i

i

i XEXETE

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

50

100

150

12 34 567 891011121314151617181920212223242526272829303132

20

40

60

80

1 2 3 4 5 6 7 8 91011121314151617181920212223242526272829

10

20

30

40

50

1 2 3 4 5 6 7 8 9 10111213141516171819202122

10

20

30

40

n=2 n = 5

n = 15 n = 30

Page 10: Estadistica y Probabilidad

Parte 1 – Suma de variables aleatorias y

Teorema central del límite Prof. María B. Pintarelli

112

30001.0

130)(30)(

2

30

1

=×=×=

= ∑

=i

i

i XVXVTV

Entonces por T.C.L. N(0,1)~3000

300−T aproximadamente pues 30=n

La probabilidad pedida es

( ) 18141.081859.019128.013000

3003501

3000

300350

3000

300)350( =−=Φ−=

−Φ−≈

−>

−=>

TPTP

T.C.L.

2- Suponga que el consumo de calorías por día de una determinada persona es una v.a. con media

3000 calorías y desviación estándar de 230 calorías. ¿Cuál es la probabilidad de que el promedio

de consumo de calorías diario de dicha persona en el siguiente año (365 días) sea entre 2959 y

3050?

Solución:

Definimos las variables aleatorias

iX : “cantidad de calorías que una persona consume en el día i” 365,...,2,1=i

Se sabe que 3000)( =iXE y 2230)( =iXV

Si ∑=

=365

1365

1

i

iXX entonces 3000)( =XE y 365

230)(

22

==n

XVσ

La probabilidad pedida es

( )

( ) ( ) 10140.315.4

365230

30002959

365230

30003050

365230

30003050

365230

3000

365230

3000295930502959

=−≈−Φ−Φ=

Φ−

Φ≈

≤−

≤−

=≤≤X

PXP

T.C.L.

Aplicaciones del Teorema central del límite

Aproximación normal a la distribución binomial El Teorema central del límite se puede utilizar para aproximar las probabilidades de algunas varia-

bles aleatorias discretas cuando es difícil calcular las probabilidades exactas para valores grandes

de los parámetros.

Supongamos que X tiene una distribución binomial con parámetros n y p. Para calcular )( kXP ≤

debemos hacer la suma ∑=

==≤k

i

iXPkXP0

)()( o recurrir a las tablas de la F.d.a. , pero para valo-

res de n grandes no existen tablas, por lo tanto habría que hacer el cálculo en forma directa y mu-

chas veces es laborioso.

Como una opción podemos considerar a X como suma de variables aleatorias más simples, especí-

ficamente, si definimos

Page 11: Estadistica y Probabilidad

Parte 1 – Suma de variables aleatorias y

Teorema central del límite Prof. María B. Pintarelli

113

=contrariocaso

éxitoocurrederepeticiónésimaílaensi

X i 0

1 ε ni ,...,2,1=

entonces cada iX se la puede considerar ),1( pB , y además

nXXX ,...,, 21 son independientes

Podemos escribir ∑=

=+++=n

i

in XXXXX1

21 ... y si n es grande entonces X tendrá aproxima-

damente una distribución normal con parámetros np y )1( pnp − , es decir

( )( )1,0

1.

.

2N

ppn

pnX

n

nXZ n ≈

−=

−=

σ

µ si n es lo suficientemente grande

Observaciones:

1- La aproximación normal a la distribución binomial funciona bien aun cuando n no sea muy

grande si p no está demasiado cerca de cero o de uno. En particular la aproximación normal a la

binomial es buena si n es grande , 5>np y 5)1( >− pn , pero es más efectivo aplicar esta aproxi-

mación cuando 10>np y 10)1( >− pn

2- Corrección por continuidad.

Acabamos de ver que si X∼B(n,p) entonces, para n suficientemente grande, podemos considerar

que aproximadamente es X∼ ( )[ ]pp.n,p.nN −1 . El problema que surge de inmediato si deseo cal-

cular, por ejemplo, la probabilidad de que kX = (con k alguno de los valores posibles 0,1,2,…,n)

es que la binomial es una distribución discreta y tiene sentido calcular probabilidades como

( )kXP = mientras que la normal es una distribución continua y, en consecuencia, ( ) 0== kXP

puesto que para una variable aleatoria continua la probabilidad de que ésta tome un valor aislado

es cero. Esto se resuelve si se considera ( )

+≤≤−≈=2

1

2

1kXkPkXP

También se puede usar esta corrección para mejorar la aproximación en otros casos, específica-

mente en lugar de )( kXP ≤ calculamos

+≤≈≤2

1)( kXPkXP

Y en lugar de

−≥≈≥2

1)( kXPkXP

En los gráficos siguientes se muestra para diferentes valores de n y p cómo aproxima la distribu-

ción ))1( ,( pnpnpN − a la distribución ) ,( pnB

5 10 15 20 25

0.025

0.05

0.075

0.1

0.125

0.15

0.175

2 4 6 8 10 12 14

0.05

0.1

0.15

0.2

n = 25

p = 0.7 n = 15

p = 0.5

Page 12: Estadistica y Probabilidad

Parte 1 – Suma de variables aleatorias y

Teorema central del límite Prof. María B. Pintarelli

114

5 10 15 20

0.05

0.1

0.15

0.2

0.25

0.3

0.35

50 60 70 80 90 100

0.02

0.04

0.06

0.08

20 40 60 80 100 120 140

0.02

0.04

0.06

0.08

0.1

2 4 6 8 10

0.1

0.2

0.3

0.4

Ejemplos:

1- Sea X∼ B(25,0.4). Hallar las probabilidades exactas de que 8≤X y 8=X y comparar estos

resultados con los valores correspondientes encontrados por la aproximación normal.

Solución:

De la tabla de la F.d.a. de la binomial encontramos 274.0)8( =≤XP

Y 120.0154.0274.0)7()8()8( =−=≤−≤== XPXPXP

Ahora usamos la aproximación normal

( ) 2709.061.06.04.025

105.8

)1()5.8()8( =−Φ≈

××

−≤

−=≤≈≤

pnp

npXPXPXP

corrección por continuidad

Observar que el valor aproximado está muy cercano al valor exacto para 274.0)8( =≤XP

( )

1170.01593.02709.0

61.06

1002.1

6

105.8

6

10

6

105.75.85.7)8(

=−=

=

−≤

−≤−=

−≤

−≤

−=≤≤≈=

XP

XPXPXP

Nuevamente este valor aproximado está muy cerca del valor real de 120.0)8( ==XP

n =15

p = 0.9

n = 100

p = 0.7

n = 150

p = 0.1

n = 10

p = 0.1

Page 13: Estadistica y Probabilidad

Parte 1 – Suma de variables aleatorias y

Teorema central del límite Prof. María B. Pintarelli

115

2- Suponga que el 10% de todos los ejes de acero producidos por cierto proceso están fuera de

especificaciones, pero se pueden volver a trabajar (en lugar de tener que enviarlos a la chatarra).

Considere una muestra aleatoria de 200 ejes y denote por X el número entre ellos que estén fuera

de especificaciones y se puedan volver a trabajar. ¿Cuál es la probabilidad (aproximada) de que X

sea

a) a lo sumo 30?

b) menos de 30?

c) entre 15 y 25 (inclusive)?

Solución:

Sea la v.a. X: “número de ejes fuera de especificaciones”

Entonces )1.0,200(~ BX , además 5201.0200 >=×=np y 5180)1.01(200)1( >=−×=− pn

Por lo tanto podemos aplicar la aproximación normal a la binomial

a) la probabilidad pedida es )30( ≤XP

( ) 993244.0474.218

205.30

18

205.30

)1()5.30()30( =Φ=

−Φ≈

−≤

−=≤≈≤

pnp

npXPXPXP

b) La probabilidad pedida es )30( <XP

Al ser X una v.a. discreta con distribución binomial )29()30( ≤=< XPXP

( ) 98745.02391.218

205.29)5.29()29( =Φ=

−Φ≈≤≈≤ XPXP

c)

( ) ( )

( ) ( ) ( ) 80294.0190147.0212963.122963.12963.1

18

205.14

18

205.255.255.142515

=−×=−Φ=−Φ−Φ=

=

−Φ−

−Φ≈≤≤≈≤≤ XPXP

3- El gerente de un supermercado desea recabar información sobre la proporción de clientes a los

que no les agrada una nueva política respecto de la aceptación de cheques. ¿Cuántos clientes ten-

dría que incluir en una muestra si desea que la fracción de la muestra se desvíe a lo mas en 0.15 de

la verdadera fracción, con probabilidad de 0.98?.

Solución:

Sea X: “número de clientes a los que no les agrada la nueva política de aceptación de cheques”

Entonces ),(~ pnBX donde p es desconocido y es la verdadera proporción de clientes a los que

no les agrada la nueva política de aceptación de cheques. El gerente tomará una muestra de n clien-

tes para “estimar” p con n

XX = ya que

n

XX = es la proporción de clientes a los que no les

agrada la nueva política de aceptación de cheques en la muestra de n clientes. Si no se toman a

todos los clientes, entonces n

XX = no será igual a p.

La pregunta es cuál debe ser n para que n

XX = se aleje del verdadero p en menos de 0.15 con

probabilidad 0.98 por lo menos, o sea para que ( ) 98.015.0 ≥≤− pXP

Entonces planteamos

( ) ( ) ≈

−≤

−≤

−=≤−≤−=≤−

)1(

15.0

)1()1(

15.015.015.015.0

pnp

n

pnp

npX

pnp

nPpXPpXP

Page 14: Estadistica y Probabilidad

Parte 1 – Suma de variables aleatorias y

Teorema central del límite Prof. María B. Pintarelli

116

T.C.L.

98.01)1(

15.02

)1(

15.0

)1(

15.0≥−

−Φ=

−Φ−

−Φ≈

pnp

n

pnp

n

pnp

n

Por lo tanto 99.02

198.0

)1(

15.0=

+≥

−Φ

pnp

n

Además nn

pp

n

pnp

n3.0

)5.01(5.0

15.0

)1(

15.0

)1(

15.0=

−≥

−=

Entonces debe cumplirse que 33.23.0 ≥n o sea 3211.603.0

33.22

=

≥n

O sea se debe tomar una muestra de al menos 61 clientes

Aproximación normal a la distribución Poisson

Se puede probar aplicando Teorema central del límite que

Es decir para λ suficientemente grande )1,0(NX

≈−

λ

λ

En la práctica si 30≥λ la aproximación es buena.

Observación: la demostración es sencilla si λ es igual a un número natural n pues, si considera-

mos las variables aleatorias )1(~ PX i con ni ,...,2,1= independientes, entonces ya sabemos que

∑∑==

n

i

n

i

i PX11

1~ , es decir )(~1

nPXn

i

i∑=

Pero además por T.C.L. si n es grande ∑=

n

i

iX1

tiene aproximadamente distribución normal con pa-

rámetros nnn =×= 1µ y nnn =×= 12σ

O sea la distribución de ∑=

n

i

iX1

que es exactamente Poisson con parámetro n, se puede aproximar

con una ),( nnN , por lo tanto )1,0(Nn

nX≈

− aproximadamente para valores de n suficientemente

grandes

En los gráficos siguientes se muestra para diferentes valores de λ cómo aproxima la distribución

) ,( λλN a la distribución )(λP

Si )(~ λPX entonces para λ suficientemente grande λ

λ−X tiene aproximadamente distribu-

ción )1,0(N

Page 15: Estadistica y Probabilidad

Parte 1 – Suma de variables aleatorias y

Teorema central del límite Prof. María B. Pintarelli

117

20 40 60 80 100

0.01

0.02

0.03

0.04

0.05

5 10 15 20 25 30

0.05

0.1

0.15

0.2

Ejemplo:

El número de infracciones por estacionamiento en cierta ciudad en cualquier día hábil tiene una

distribución de Poisson con parámetro λ = 50. ¿Cuál es la probabilidad aproximada de que:

a) entre 35 y 70 infracciones se expidan en un día en particular?

b) el número total de infracciones expedidas durante una semana de 5 días sea entre 225 y 275?

Solución:

Sea X: “número de infracciones por estacionamiento en cierta ciudad en cualquier día hábil”

Entonces )(~ λPX donde 50=λ

Como 50=λ entonces )1,0(50

50N

X≈

− (aproximadamente)

a) la probabilidad pedida es

( ) ( ) ( )

9805.0017.0997599.0

12132.28284.250

5035

50

50707035

=−=

=−Φ−Φ=

−Φ−

−Φ≈≤≤ XP

b) Sea Y: “número total de infracciones expedidas durante una semana de 5 días”

Entonces )(~ λPY donde 250550 =×=λ

La probabilidad pedida es

( ) ( ) ( )

( ) 8859.0194295.0215811.12

5811.15811.1250

250225

250

250275275225

=−×=−Φ=

=−Φ−Φ=

−Φ−

−Φ≈≤≤ YP

50=λ 3=λ