estadistica y probabilidad
DESCRIPTION
teorema del limite centralTRANSCRIPT
Parte 1 – Suma de variables aleatorias y
Teorema central del límite Prof. María B. Pintarelli
103
6- SUMA DE VARIABLES ALEATORIAS Y TEOREMA
CENTRAL DEL LÍMITE
6.1 – Suma de variables aleatorias independientes
Cuando se estudiaron las variables aleatorias bidimensionales se habló de una función de variable
aleatoria bidimensional. En particular se nombró la suma de n variables aleatorias, pero no se dijo
nada sobre la distribución de esa v.a. suma.
Es a menudo importante saber cuál es la distribución de una suma de variables aleatorias indepen-
dientes.
Consideramos algunos ejemplos en el caso discreto
1- Suma de variables aleatorias independientes con distribución Poisson
)(~ ntesindependie Yy ; )(~ ; )(~ 2121 λλλλ ++⇒ PYXXPYPX
Dem.)
Consideramos el evento { }nYX =+ como unión de eventos excluyentes
{ } nkknYkX ≤≤−== 0 , , entonces
( )=
−=−===−====+
−−
=
−
==∑∑∑
!!)()(),()( 2
0
1
00
21
kne
keknYPkXPknYkXPnYXP
knn
k
kn
k
n
k
λλ λλ
X e Y independientes
( ) ( )( )nkn
n
k
kn
k
knk
n
e
knk
n
n
e
knke 21
)(
2
0
1
)(
0
21)(
!!!
!
!!!
2121
21 λλλλλλ λλλλ
λλ +=−
=−
=+−
−
=
+−
=
−+− ∑∑
Binomio de Newton
O sea X+Y tiene distribución Poisson con parámetro 21 λλ +
2- Suma de variables aleatorias binomiales independientes
),(~ ntesindependie Yy ; ),(~ ; ),(~ 2121 pnnBYXXpnBYpnBX ++⇒
Dem.)
Nuevamente consideramos el evento { }kYX =+ como unión de eventos excluyentes
{ } 10 , niikYiX ≤≤−== , entonces
=−
−−
=−===−====+ +−−−
===∑∑∑ iknikinin
k
n
i
n
i
ppik
npp
i
nikYPiXPikYiXPkYXP 21
111
)1()1()()(),()(2
0
1
00
X e Y independientes
−
−= ∑
=
−+
ik
n
i
npp
n
i
knnk 2
0
11
21)1(
En la expresión anterior si rj > entonces 0=
j
r
Parte 1 – Suma de variables aleatorias y
Teorema central del límite Prof. María B. Pintarelli
104
Por último usamos la siguiente identidad combinatoria ∑=
+=
−
1
0
2121n
i k
nn
ik
n
i
n
Y entonces
knnkpp
k
nnkYXP
−+−
+==+ 21)1()(
21
O sea X+Y tiene distribución binomial con parámetros 21 nn + y p
Observación: en los dos casos anteriores se puede generalizar el resultado a n variables aleatorias
independientes, usando el principio de inducción completa, es decir
1- Si nXXX ,...,, 21 son n variables aleatorias independientes donde )(~ ii PX λ para todo
ni ,...,2,1= entonces )(~00
∑∑==
n
i
i
n
i
i PX λ
2- Si nXXX ,...,, 21 son n variables aleatorias independientes donde ),(~ pnBX ii para todo
ni ,...,2,1= entonces ),(~00
pnBXn
i
i
n
i
i ∑∑==
Suma de variables aleatorias normales independientes
Si X e Y son dos variables aleatorias continuas independientes con densidades g(x) y h(y) respecti-
vamente se puede probar (no lo demostraremos aquí) que la v.a. YXZ += tiene densidad dada
por ∫∞
∞−
+ −= dyyhyzgzf YX )()()(
Usando esto se puede demostrar el siguiente importante resultado:
Por inducción completa se puede generalizar este resultado a n variables:
De lo anterior y del hecho que ( ) ),~ ,~ 222 σµσµ abN(abaXNX ++⇒ tenemos:
Si nXXX ,...,, 21 son n variables aleatorias independientes donde ),(~ 2
iii NX σµ para todo
ni ,...,2,1= entonces ),(~1
2
00
∑∑∑===
n
i
i
n
i
i
n
i
i NX σµ
Si nXXX ,...,, 21 son n variables aleatorias independientes donde ),(~ 2
iii NX σµ para todo
ni ,...,2,1= entonces ),(~1
22
00
∑∑∑===
n
i
ii
n
i
ii
n
i
ii aaNXa σµ donde naaa ,...,, 21 son números reales
Si X e Y son variables aleatorias independientes donde ( ) ,~2
11 σµNX y ( ) ,~2
22 σµNY enton-
ces ( ) ,~2
2
2
121 σσµµ +++ NYX
Parte 1 – Suma de variables aleatorias y
Teorema central del límite Prof. María B. Pintarelli
105
Se dice que ∑=
n
i
iiXa0
es una combinación lineal de variables aleatorias.
Ejemplos:
1- La envoltura de plástico para un disco magnético está formada por dos hojas. El espesor de cada
una tiene una distribución normal con media 1.5 milímetros y desviación estándar de 0.1 milí-
metros. Las hojas son independientes.
a) Determine la media y la desviación estándar del espesor total de las dos hojas.
b) ¿Cuál es la probabilidad de que el espesor total sea mayor que 3.3 milímetros?
Solución: Sean las variables aleatorias
X: “espesor de la hoja 1” e Y: “espesor de la hoja 2”
Entonces )1.0,5.1~ 2N(X ; )1.0,5.1~ 2N(Y y X e Y independientes
a) Si definimos la v.a. Z: “espesor total de las dos hojas” , entonces YXZ +=
Por lo tanto )1.01.0 ,5.15.1~ 22 ++N(Z es decir )02.0 ,3~ N(Z
En consecuencia 3)( =ZE , 02.0)( == ZVZσ
b) Se pide calcular )3.3( >ZP
( ) 017.0983.0112132.2102.0
33.31
02.0
33.3
02.0
3)3.3( =−=Φ−=
−Φ−=
−>
−=>
ZPZP
2-Tengo tres mensajes que atender en el edificio administrativo. Sea Xi : “ el tiempo que toma el i-
ésimo mensaje” (i = 1, 2 ,3), y sea X4 : “ el tiempo total que utilizo para caminar hacia y desde el
edificio y entre cada mensaje”. Suponga que las Xi son independientes, normalmente distribui-
das, con las siguientes medias y desviaciones estándar:
3 ,12 ,2 ,8 ,1 ,5 ,4 min,15 44332211 ======== σµσµσµσµ
Pienso salir de mi oficina precisamente a las 10.00 a.m. y deseo pegar una nota en mi puerta que
dice “regreso a las t a.m.” ¿A qué hora t debo escribir si deseo que la probabilidad de mi llegada
después de t sea 0.01?
Solución: Definimos la v.a. Z: “tiempo transcurrido desde que salgo de mi oficina hasta que re-
greso”, entonces 4321 XXXXT +++=
Por lo tanto
∑∑==
4
1
24
1
,~i
i
i
iNT σµ , y se pide hallar t tal que 01.0)( => tTP
501285154
1
=+++=∑=i
iµ y 303214222
4
1
22 =+++=∑=i
iσ
Entonces 01.030
501)( =
−Φ−=>
ttTP , es decir 99.0
30
50=
−Φ
t
Buscando en la tabla de la normal 7619.62503033.2 33.230
50=+×=⇒=
−t
t
3- El ancho del marco de una puerta tiene una distribución normal con media 24 pulgadas y des-
viación estándar de 1/8 de pulgada. El ancho de la puerta tiene una distribución normal con me-
dia 23.875 de pulgadas y desviación estándar de 1/16 de pulgadas. Suponer independencia.
a) Determine la distribución, la media y la desviación estándar de la diferencia entre el ancho
del marco y de la puerta.
Parte 1 – Suma de variables aleatorias y
Teorema central del límite Prof. María B. Pintarelli
106
b) ¿Cuál es la probabilidad de que la diferencia entre el ancho del marco y de la puerta sea ma-
yor que ¼ de pulgada?.
c) ¿Cuál es la probabilidad de que la puerta no quepa en el marco?.
Solución: Sean las variables aleatorias
X: “ancho del marco de la puerta en pulgadas”
Y: “ancho de la puerta en pulgadas”
Entonces )1/8)( ,24~ 2N(X , )1/16)( ,875.23~ 2N(Y , X e Y independientes
a) Se pide la distribución de X-Y , )( YXE − , )( YXVYX −=−σ
125.0875.2324)()()( =−=−=− YEXEYXE
16
5
256
5
16
1
8
1)()()(
22
=∴=
+
=+=− −YXYVXVYXV σ
Por lo tanto
−
2
16
5 ,125.0~ NYX
b) Se pide la probabilidad )4/1( >−YXP
1867.08133.01)8944.0(15
521
16
5
125.025.01)4/1( =−=Φ−=
Φ−=
−
Φ−=>−YXP
c) Si la puerta no entra en el marco entonces se da el evento { }YX < o equivalentemente
{ }0<−YX , por lo tanto
1867.05
521
5
52
16
5
125.00)0( =
Φ−=
−Φ=
−
Φ=<−YXP
4- Supongamos que las variables aleatorias X e Y denotan la longitud y el ancho en cm, respecti-
vamente, de una pieza.
Supongamos además que X e Y son independientes y que X ~ N(2 , 0.12 ) , Y ~ N(5 , 0.2
2 ).
Entonces Z = 2X + 2Y es una v.a. que representa el perímetro de la pieza.
Calcular la probabilidad de que el perímetro sea mayor que 14.5 cm.
Solución: tenemos que ( )2222 2.021.02 ,5222 ~ ×+××+×NZ , o sea ( )0.2 ,14 ~ NZ
La probabilidad pedida es )5.14( >ZP , entonces
( ) 119.08810.011180.112
51
2.0
145.141)5.14( =−=Φ−=
Φ−=
−Φ−=>ZP
5- Si se aplican dos cargas aleatorias 21 y XX a una viga voladiza como se muestra en la figura si-
guiente, el momento de flexión en 0 debido a las cargas es 2211 XaXa + .
a) Suponga que 21 y XX son v.a. independientes con medias 2
y 4 KLbs respectivamente, y desviaciones estándar 0.5 y
1.0 KLbs, respectivamente.
Parte 1 – Suma de variables aleatorias y
Teorema central del límite Prof. María B. Pintarelli
107
Si 51 =a pies y 102 =a pies, ¿cuál es el momento de flexión esperado y cuál es la desviación
estándar del momento de flexión?
b) Si 21 y XX están normalmente distribuidas, ¿cuál es la probabilidad de que el momento de
flexión supere 75 KLbs?
Solución: Sea la v.a. Z: “momento de flexión en 0”, entonces 21 105 XXZ +=
Por lo tanto
a) 5041025)(10)(5)( 21 =×+×=+= XEXEZE
4
65
4
6511025.0251105.05)( 2222 =∴=×+×=×+×= ZZV σ
b) Si 21 y XX están normalmente distribuidas, entonces
4
65 ,50 ~ NZ
Por lo tanto
( ) 01120.6113
65101
4
65
50751)75( =−≈Φ−=
Φ−=
−
Φ−=>ZP
Promedio de variables aleatorias normales independientes
Dem.) Notar que n
X
X
n
i
i∑== 1 es un caso particular de combinación lineal de variables aleatorias
donde n
ai1
= para todo ni ,...,2,1=
Además en este caso µµ =i y 22 σσ =i para todo ni ,...,2,1=
Por lo tanto, X tiene distribución normal con esperanza µµµµ ===∑∑==
n
i
n
i
i nnnn 11
111 y varian-
za
nn
nnn
n
i
i
n
i
22
2
2
2
1
2
2
1
111 σσσσ =
=
=
∑∑==
Es decir,
nNX
2
,~σ
µ
Observación: a X se lo llama promedio muestral o media muestral
Si nXXX ,...,, 21 son n variables aleatorias independientes donde ),(~ 2σµNX i para todo
ni ,...,2,1= entonces la v.a. n
X
X
n
i
i∑== 1 tiene distribución normal con
media µ y varianza n
2σ
Parte 1 – Suma de variables aleatorias y
Teorema central del límite Prof. María B. Pintarelli
108
Ejemplos:
1) El diámetro interno de un anillo de pistón seleccionado al azar es una v.a. con distribución nor-
mal con media 12 cm y desviación estándar de 0.04 cm.
a) Si X es el diámetro promedio en una muestra de 16=n anillos, calcule )01.1299.11( ≤≤ XP
b) ¿Qué tan probable es que el diámetro promedio exceda de 12.01 cuando 25=n ?
Solución:
a) Sean las variables aleatorias :iX “diámetro del anillo i” 16,...,2,1=i
Entonces ( )04.0 ,12~ 2NX i para cada i.
Por lo tanto
16
04.0,12~2
NX . Entonces
( ) ( )
6826.018413.02
1)1(211
16
04.0 2
1299.11
16
04.0 2
1201.12
)
16
04.0 2
1201.12
16
04.0 2
12
16
04.0 2
1299.11()01.1299.11(
=−×=
=−=−−=
−−
−=
=−≤−≤−=≤≤
φφφφφ
XPXP
b) En este caso
25
04.0,12~2
NX , entonces
1056.08944.01)25.1(1
25
04.0
1201.121)01.12(
2=−=−=
−−=> φφXP
2) Una máquina embotelladora puede regularse de tal manera que llene un promedio de µ onzas
por botella. Se ha observado que la cantidad de contenido que suministra la máquina presenta una
distribución normal con 1=σ onza. De la producción de la máquina un cierto día, se obtiene una
muestra de 9 botellas llenas (todas fueron llenadas con las mismas posiciones del control operati-
vo) y se miden las onzas del contenido de cada una.
a) Determinar la probabilidad de que la media muestral se encuentre a lo más a 0.3 onzas de la
media real µ para tales posiciones de control
b) ¿Cuántas observaciones deben incluirse en la muestra si se desea que la media muestral esté a
lo más a 0.3 onzas de µ con una probabilidad de 0.95?
Parte 1 – Suma de variables aleatorias y
Teorema central del límite Prof. María B. Pintarelli
109
Solución:
a) Sean las variables aleatorias :iX “contenido en onzas de la botella i” 9,...,2,1=i
Entonces ( )1,~ µNX i para cada i.
Por lo tanto
9
1,~ µNX . Se desea calcular
6318.01)9.0(2
)9.0()9.0(9.09.03.03.0
3.03.0)3.03.0()3.0(
=−Φ=
=−Φ−Φ=
≤
−≤−=
≤
−≤−=
=
≤−
≤−=≤−≤−=≤−
n
XP
nn
X
n
P
nn
X
n
PXPXP
σµ
σσµ
σ
σσµ
σµµ
b) Ahora se pretende que
95.0)3.03.0()3.0( =≤−≤−=≤− µµ XPXP
Entonces
95.03.01
3.03.03.0
)3.0( =
≤
−≤−=
≤
−≤
−=≤− n
n
XnP
nn
X
n
PXPµ
σσµ
σµ
Mediante la tabla de la acumulada de la normal estándar se tiene que
( ) ( ) ( ) 96.13.0 0.9753.0 95.013.023.01
3.0 =⇒=Φ⇒=−Φ=
≤
−≤− nnnn
n
XnP
µ
O sea 68.423.0
96.12
=
≈n
Si tomamos 43=n , entonces )3.0( ≤− µXP será un poco mayor que 0.95
6.2 - Teorema central del límite
Acabamos de ver que la suma de un número finito n de variables aleatorias independientes que
están normalmente distribuidas es una variable aleatoria también normalmente distribuida. Esta
propiedad reproductiva no es exclusiva de la distribución normal. En efecto, por ejemplo, ya vimos
que existen variables aleatorias discretas que la cumplen, es el caso de la Poisson y la Binomial.
En realidad, la propiedad que le da a la distribución normal el lugar privilegiado que ocupa entre
todas las distribuciones es el hecho de que la suma de un número muy grande, rigurosamente un
número infinito numerable, de variables aleatorias independientes con distribuciones arbitrarias
(no necesariamente normales) es una variable aleatoria que tiene, aproximadamente, una distribu-
ción normal. Este es, esencialmente, el contenido del
Parte 1 – Suma de variables aleatorias y
Teorema central del límite Prof. María B. Pintarelli
110
Dem.) sin demostración
Observaciones:
1- Notar que ( ) ( ) µnXEXESEn
i
i
n
i
in ==
= ∑∑
== 11
y ( ) ( ) 2
11
σnXVXVSVn
i
i
n
i
in ==
= ∑∑
==
Por lo tanto 2σ
µ
n
nSZ n
n
−= es la v.a. nS estandarizada
2- Notar que
−
=
≤
−
=
≤
−
n
XPz
n
n
n
nS
Pzn
nSP
n
n
σµ
σ
µ
σ
µ22
, por lo tanto también se puede
enunciar el Teorema central del límite de la siguiente forma
Donde
n
XZ n σ
µ−= es el promedio muestral estandarizado
3- Aunque en muchos casos el T.C.L. funciona bien para valores de n pequeños , en particular
donde la población es continua y simétrica, en otras situaciones se requieren valores de n mas
grandes, dependiendo de la forma de la distribución de las iX . En muchos casos de interés prácti-
co, si 30≥n , la aproximación normal será satisfactoria sin importar cómo sea la forma de la dis-
tribución de las iX . Si 30<n , el T.C.L. funciona si la distribución de las iX no está muy alejada
de una distribución normal
4- Para interpretar el significado del T.C.L., se generan (por computadora) n valores de una v.a.
exponencial con parámetro 5.0=λ , y se calcula el promedio de esos n valores. Esto se repite 1000
veces, por lo tanto tenemos 1000 valores de la v.a. X .
Teorema central del límite (T.C.L.):
Sean nX,...,X,X 21 variables aleatorias independientes con ( ) µ=iXE y ( ) 2σ=iXV para todo
n,...,,i 21= , es decir independientes idénticamente distribuidas
Sea la v.a. ∑=
=n
i
in XS1
y sea 2σ
µ
n
nSZ n
n
−= .
Entonces ( ) ( )zzZPlim nn
Φ=≤∞→
, esto es ∫∞−
−
∞→=
≤
− zx
n
ndxez
n
nSP 2
2
2
2
1lim
πσ
µ
Sean nX,...,X,X 21 variables aleatorias independientes con ( ) µ=iXE y ( ) 2σ=iXV para todo
n,...,,i 21= , es decir independientes idénticamente distribuidas
Sea la v.a. promedio muestral ∑=
=n
i
iXn
X1
1 y sea
n
XZ n σ
µ−= .
Entonces ( ) ( )zzZPlim nn
Φ=≤∞→
, esto es ∫∞−
−
∞→=
≤
− zx
ndxez
n
XP 2
2
2
1lim
πσ
µ
Parte 1 – Suma de variables aleatorias y
Teorema central del límite Prof. María B. Pintarelli
111
Hacemos un histograma de frecuencias de X , esto es, tomamos un intervalo ),( ba donde
“caen” todos los valores de X , y lo subdividimos en intervalos mas chicos de igual longitud. La
frecuencia de cada subintervalo es la cantidad de valores de X que caen en dicho subintervalo.
Se grafican estas frecuencias obteniéndose los gráficos siguientes que se pueden considerar una
aproximación a la verdadera distribución de X .
Se observa que a medida que aumenta el valor de n los gráficos se van haciendo más simétricos,
pareciéndose a la gráfica de una distribución normal.
Ejemplos:
1- Supóngase que 30 instrumentos electrónicos D1, D2, ......,D30, se usan de la manera siguiente: tan
pronto como D1 falla empieza a actuar D2. Cuando D2 falla empieza a actuar D3, etc. Supóngase
que el tiempo de falla de Di es una v.a. distribuida exponencialmente con parámetro λ = 0.1 por hora. Sea T el tiempo total de operación de los 30 instrumentos. ¿Cuál es la probabilidad de que T
exceda 350 horas?
Solución:
Si iX : “tiempo de falla del instrumento iD ” 30,...,2,1=i
Entonces )1.0(~ ExpX i para 30,...,2,1=i
El tiempo total de operación de los 30 instrumentos es ∑=
=30
1i
iXT , donde
3001.0
130)(30)(
30
1
=×=×=
= ∑
=i
i
i XEXETE
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
50
100
150
12 34 567 891011121314151617181920212223242526272829303132
20
40
60
80
1 2 3 4 5 6 7 8 91011121314151617181920212223242526272829
10
20
30
40
50
1 2 3 4 5 6 7 8 9 10111213141516171819202122
10
20
30
40
n=2 n = 5
n = 15 n = 30
Parte 1 – Suma de variables aleatorias y
Teorema central del límite Prof. María B. Pintarelli
112
30001.0
130)(30)(
2
30
1
=×=×=
= ∑
=i
i
i XVXVTV
Entonces por T.C.L. N(0,1)~3000
300−T aproximadamente pues 30=n
La probabilidad pedida es
( ) 18141.081859.019128.013000
3003501
3000
300350
3000
300)350( =−=Φ−=
−Φ−≈
−>
−=>
TPTP
T.C.L.
2- Suponga que el consumo de calorías por día de una determinada persona es una v.a. con media
3000 calorías y desviación estándar de 230 calorías. ¿Cuál es la probabilidad de que el promedio
de consumo de calorías diario de dicha persona en el siguiente año (365 días) sea entre 2959 y
3050?
Solución:
Definimos las variables aleatorias
iX : “cantidad de calorías que una persona consume en el día i” 365,...,2,1=i
Se sabe que 3000)( =iXE y 2230)( =iXV
Si ∑=
=365
1365
1
i
iXX entonces 3000)( =XE y 365
230)(
22
==n
XVσ
La probabilidad pedida es
( )
( ) ( ) 10140.315.4
365230
30002959
365230
30003050
365230
30003050
365230
3000
365230
3000295930502959
=−≈−Φ−Φ=
−
Φ−
−
Φ≈
≈
−
≤−
≤−
=≤≤X
PXP
T.C.L.
Aplicaciones del Teorema central del límite
Aproximación normal a la distribución binomial El Teorema central del límite se puede utilizar para aproximar las probabilidades de algunas varia-
bles aleatorias discretas cuando es difícil calcular las probabilidades exactas para valores grandes
de los parámetros.
Supongamos que X tiene una distribución binomial con parámetros n y p. Para calcular )( kXP ≤
debemos hacer la suma ∑=
==≤k
i
iXPkXP0
)()( o recurrir a las tablas de la F.d.a. , pero para valo-
res de n grandes no existen tablas, por lo tanto habría que hacer el cálculo en forma directa y mu-
chas veces es laborioso.
Como una opción podemos considerar a X como suma de variables aleatorias más simples, especí-
ficamente, si definimos
Parte 1 – Suma de variables aleatorias y
Teorema central del límite Prof. María B. Pintarelli
113
−
=contrariocaso
éxitoocurrederepeticiónésimaílaensi
X i 0
1 ε ni ,...,2,1=
entonces cada iX se la puede considerar ),1( pB , y además
nXXX ,...,, 21 son independientes
Podemos escribir ∑=
=+++=n
i
in XXXXX1
21 ... y si n es grande entonces X tendrá aproxima-
damente una distribución normal con parámetros np y )1( pnp − , es decir
( )( )1,0
1.
.
2N
ppn
pnX
n
nXZ n ≈
−
−=
−=
σ
µ si n es lo suficientemente grande
Observaciones:
1- La aproximación normal a la distribución binomial funciona bien aun cuando n no sea muy
grande si p no está demasiado cerca de cero o de uno. En particular la aproximación normal a la
binomial es buena si n es grande , 5>np y 5)1( >− pn , pero es más efectivo aplicar esta aproxi-
mación cuando 10>np y 10)1( >− pn
2- Corrección por continuidad.
Acabamos de ver que si X∼B(n,p) entonces, para n suficientemente grande, podemos considerar
que aproximadamente es X∼ ( )[ ]pp.n,p.nN −1 . El problema que surge de inmediato si deseo cal-
cular, por ejemplo, la probabilidad de que kX = (con k alguno de los valores posibles 0,1,2,…,n)
es que la binomial es una distribución discreta y tiene sentido calcular probabilidades como
( )kXP = mientras que la normal es una distribución continua y, en consecuencia, ( ) 0== kXP
puesto que para una variable aleatoria continua la probabilidad de que ésta tome un valor aislado
es cero. Esto se resuelve si se considera ( )
+≤≤−≈=2
1
2
1kXkPkXP
También se puede usar esta corrección para mejorar la aproximación en otros casos, específica-
mente en lugar de )( kXP ≤ calculamos
+≤≈≤2
1)( kXPkXP
Y en lugar de
−≥≈≥2
1)( kXPkXP
En los gráficos siguientes se muestra para diferentes valores de n y p cómo aproxima la distribu-
ción ))1( ,( pnpnpN − a la distribución ) ,( pnB
5 10 15 20 25
0.025
0.05
0.075
0.1
0.125
0.15
0.175
2 4 6 8 10 12 14
0.05
0.1
0.15
0.2
n = 25
p = 0.7 n = 15
p = 0.5
Parte 1 – Suma de variables aleatorias y
Teorema central del límite Prof. María B. Pintarelli
114
5 10 15 20
0.05
0.1
0.15
0.2
0.25
0.3
0.35
50 60 70 80 90 100
0.02
0.04
0.06
0.08
20 40 60 80 100 120 140
0.02
0.04
0.06
0.08
0.1
2 4 6 8 10
0.1
0.2
0.3
0.4
Ejemplos:
1- Sea X∼ B(25,0.4). Hallar las probabilidades exactas de que 8≤X y 8=X y comparar estos
resultados con los valores correspondientes encontrados por la aproximación normal.
Solución:
De la tabla de la F.d.a. de la binomial encontramos 274.0)8( =≤XP
Y 120.0154.0274.0)7()8()8( =−=≤−≤== XPXPXP
Ahora usamos la aproximación normal
( ) 2709.061.06.04.025
105.8
)1()5.8()8( =−Φ≈
××
−≤
−
−=≤≈≤
pnp
npXPXPXP
corrección por continuidad
Observar que el valor aproximado está muy cercano al valor exacto para 274.0)8( =≤XP
( )
1170.01593.02709.0
61.06
1002.1
6
105.8
6
10
6
105.75.85.7)8(
=−=
=
−≤
−≤−=
−≤
−≤
−=≤≤≈=
XP
XPXPXP
Nuevamente este valor aproximado está muy cerca del valor real de 120.0)8( ==XP
n =15
p = 0.9
n = 100
p = 0.7
n = 150
p = 0.1
n = 10
p = 0.1
Parte 1 – Suma de variables aleatorias y
Teorema central del límite Prof. María B. Pintarelli
115
2- Suponga que el 10% de todos los ejes de acero producidos por cierto proceso están fuera de
especificaciones, pero se pueden volver a trabajar (en lugar de tener que enviarlos a la chatarra).
Considere una muestra aleatoria de 200 ejes y denote por X el número entre ellos que estén fuera
de especificaciones y se puedan volver a trabajar. ¿Cuál es la probabilidad (aproximada) de que X
sea
a) a lo sumo 30?
b) menos de 30?
c) entre 15 y 25 (inclusive)?
Solución:
Sea la v.a. X: “número de ejes fuera de especificaciones”
Entonces )1.0,200(~ BX , además 5201.0200 >=×=np y 5180)1.01(200)1( >=−×=− pn
Por lo tanto podemos aplicar la aproximación normal a la binomial
a) la probabilidad pedida es )30( ≤XP
( ) 993244.0474.218
205.30
18
205.30
)1()5.30()30( =Φ=
−Φ≈
−≤
−
−=≤≈≤
pnp
npXPXPXP
b) La probabilidad pedida es )30( <XP
Al ser X una v.a. discreta con distribución binomial )29()30( ≤=< XPXP
( ) 98745.02391.218
205.29)5.29()29( =Φ=
−Φ≈≤≈≤ XPXP
c)
( ) ( )
( ) ( ) ( ) 80294.0190147.0212963.122963.12963.1
18
205.14
18
205.255.255.142515
=−×=−Φ=−Φ−Φ=
=
−Φ−
−Φ≈≤≤≈≤≤ XPXP
3- El gerente de un supermercado desea recabar información sobre la proporción de clientes a los
que no les agrada una nueva política respecto de la aceptación de cheques. ¿Cuántos clientes ten-
dría que incluir en una muestra si desea que la fracción de la muestra se desvíe a lo mas en 0.15 de
la verdadera fracción, con probabilidad de 0.98?.
Solución:
Sea X: “número de clientes a los que no les agrada la nueva política de aceptación de cheques”
Entonces ),(~ pnBX donde p es desconocido y es la verdadera proporción de clientes a los que
no les agrada la nueva política de aceptación de cheques. El gerente tomará una muestra de n clien-
tes para “estimar” p con n
XX = ya que
n
XX = es la proporción de clientes a los que no les
agrada la nueva política de aceptación de cheques en la muestra de n clientes. Si no se toman a
todos los clientes, entonces n
XX = no será igual a p.
La pregunta es cuál debe ser n para que n
XX = se aleje del verdadero p en menos de 0.15 con
probabilidad 0.98 por lo menos, o sea para que ( ) 98.015.0 ≥≤− pXP
Entonces planteamos
( ) ( ) ≈
−≤
−
−≤
−
−=≤−≤−=≤−
)1(
15.0
)1()1(
15.015.015.015.0
pnp
n
pnp
npX
pnp
nPpXPpXP
Parte 1 – Suma de variables aleatorias y
Teorema central del límite Prof. María B. Pintarelli
116
T.C.L.
98.01)1(
15.02
)1(
15.0
)1(
15.0≥−
−Φ=
−
−Φ−
−Φ≈
pnp
n
pnp
n
pnp
n
Por lo tanto 99.02
198.0
)1(
15.0=
+≥
−Φ
pnp
n
Además nn
pp
n
pnp
n3.0
)5.01(5.0
15.0
)1(
15.0
)1(
15.0=
−≥
−=
−
Entonces debe cumplirse que 33.23.0 ≥n o sea 3211.603.0
33.22
=
≥n
O sea se debe tomar una muestra de al menos 61 clientes
Aproximación normal a la distribución Poisson
Se puede probar aplicando Teorema central del límite que
Es decir para λ suficientemente grande )1,0(NX
≈−
λ
λ
En la práctica si 30≥λ la aproximación es buena.
Observación: la demostración es sencilla si λ es igual a un número natural n pues, si considera-
mos las variables aleatorias )1(~ PX i con ni ,...,2,1= independientes, entonces ya sabemos que
∑∑==
n
i
n
i
i PX11
1~ , es decir )(~1
nPXn
i
i∑=
Pero además por T.C.L. si n es grande ∑=
n
i
iX1
tiene aproximadamente distribución normal con pa-
rámetros nnn =×= 1µ y nnn =×= 12σ
O sea la distribución de ∑=
n
i
iX1
que es exactamente Poisson con parámetro n, se puede aproximar
con una ),( nnN , por lo tanto )1,0(Nn
nX≈
− aproximadamente para valores de n suficientemente
grandes
En los gráficos siguientes se muestra para diferentes valores de λ cómo aproxima la distribución
) ,( λλN a la distribución )(λP
Si )(~ λPX entonces para λ suficientemente grande λ
λ−X tiene aproximadamente distribu-
ción )1,0(N
Parte 1 – Suma de variables aleatorias y
Teorema central del límite Prof. María B. Pintarelli
117
20 40 60 80 100
0.01
0.02
0.03
0.04
0.05
5 10 15 20 25 30
0.05
0.1
0.15
0.2
Ejemplo:
El número de infracciones por estacionamiento en cierta ciudad en cualquier día hábil tiene una
distribución de Poisson con parámetro λ = 50. ¿Cuál es la probabilidad aproximada de que:
a) entre 35 y 70 infracciones se expidan en un día en particular?
b) el número total de infracciones expedidas durante una semana de 5 días sea entre 225 y 275?
Solución:
Sea X: “número de infracciones por estacionamiento en cierta ciudad en cualquier día hábil”
Entonces )(~ λPX donde 50=λ
Como 50=λ entonces )1,0(50
50N
X≈
− (aproximadamente)
a) la probabilidad pedida es
( ) ( ) ( )
9805.0017.0997599.0
12132.28284.250
5035
50
50707035
=−=
=−Φ−Φ=
−Φ−
−Φ≈≤≤ XP
b) Sea Y: “número total de infracciones expedidas durante una semana de 5 días”
Entonces )(~ λPY donde 250550 =×=λ
La probabilidad pedida es
( ) ( ) ( )
( ) 8859.0194295.0215811.12
5811.15811.1250
250225
250
250275275225
=−×=−Φ=
=−Φ−Φ=
−Φ−
−Φ≈≤≤ YP
50=λ 3=λ