ley de los grandes nÚmeros - fi.mdp.edu.ar · aleatoria y su media , ... probabilidad, de la media...

23
LEY DE LOS GRANDES NÚMEROS

Upload: phungkien

Post on 03-May-2018

222 views

Category:

Documents


5 download

TRANSCRIPT

LEY DE LOS GRANDES

NÚMEROS

¿Hasta qué grado la media y la varianza caracterizan la distribución de una variable aleatoria ?

Desigualdad de Tchebyshev

Esta desigualdad brinda un medio para entender cómo la

varianza mide la variabilidad alrededor de la esperanza

matemática de la variable. Dicha desigualdad afirma que:

“Si la Esperanza y la varianza de la variable X son finitas, para cualquier

número positivo k, la probabilidad de que la variable aleatoria X esté en el

intervalo

2

1; es mayor o igual que 1- es decirk k

k

Es decir :

2

2

1; 1-

11-

P k k ók

P x kk

La probabilidad de que X asuma un valor que está

dentro de las k dispersiones de su esperanza, es por

lo menos

2

11 0k

k

Consideraciones

Son sucesos

complementarios, 2

1la P x k

k

1)Ya que yx k x k

2 2

1 12) Si k<1 1- 0 1y

k k

Entonces la desigualdad de Tchebyshev es trivial para

valores de k < 1, ya que 0< p < 1

3) El significado de esta desigualdad reside en su completa

universalidad, ya que puede ser aplicada a cualquier variable

aleatoria .

En particular es útil , pues proporciona una sencilla demostración

de la ley de los grandes números

Otra utilidad

Si conocemos la distribución de probabilidades de una variable aleatoria discreta o continua, podemos

calcular su

E(x) y V(x), si existen, pero

el recíproco no es cierto, es decir, conociendo E(x) y V(x), no podemos reconstruir la distribución de

probabilidades, por lo tanto no podemos calcular la probabilidad de que la diferencia entre la variable

aleatoria y su media , en valor absoluto , se mantengan menor que un valor c, pero con esta desigualdad podemos dar una cota superior o

inferior.

Ejemplo

¿Cuál es la probabilidad que se

asocia con valores de x hasta 2

xi

0 1 2 3 4

P(xi)

0,05 0,2 0,4 0,25 0,1

?

Es decir,¿ Cuál es la 2 ?P x

Solución

2

( ) 2,15

( ) 5,65 2,15 1,0275 ( ) 1,0136

E x

V x x

Como conocemos la distribución de X, podemos calcular lo

pedido exactamente.

2 2,15 2.1,0136P x P x

2,15 2,0272 0,1228 4,1772P x P x

( 1) ( 2) ( 3) ( 4)P x P x P x P x

0,2 + 0,4 + 0,25 + 0,1 = 0,95

Supongamos no conocer la distribución de X,

pero conocemos su esperanza y varianza, y

aplicamos la desigualdad de Tchebyshev

Sólo podemos obtener una cota de la probabilidad

2

12 1P x

k

2

1 32,15 2.1,0136 1 0,75

2 4P x

Y efectivamente 0,95 > 0,75

Vimos que

Cuando el número de repeticiones de un

experimento aleatorio aumenta

considerablemente, la frecuencia

relativa del suceso A converge en

sentido probabilístico a la probabilidad

teórica.

( ) para Af P A n

Teoremas conocidos con el nombre de:

“leyes de los grandes números”

1)Teorema de Bernoulli

En una sucesión de pruebas de Bernoulli, dado un

número positivo arbitrario, la probabilidad de que

la frecuencia relativa del éxito en n pruebas, difiera

de la probabilidad p en una cantidad mayor que ,

tiende a cero cuando n tiende a infinito.

1 0lim An

P f pO

también

0 0lím An

P f p

Demostración en el pizarrón

Otra forma de enunciar el Teorema de Bernoulli

En toda sucesión de pruebas de Bernoulli, la frecuencia

relativa converge en sentido probabilístico a p.

0 0lim An

P f p

1 0lím An

P f p

Teorema de Bernoulli generalizado

• Dada una sucesión

de variables aleatorias, dos a dos

independientes, con una misma

distribución de probabilidades y con

esperanza y varianza se

verifica que para todo épsilon >0

nxxxx ....,,.........,, 321

2

01 xPlímóxPlímnn

• En otras palabras :el límite , en

probabilidad, de la media muestral

para n tendiendo a infinito , es igual

a la esperanza matemática.

• Demostración

Teorema del límite central ó

Teorema central del límite

• Enunciado:

• “Si S es la suma de un gran número de variables aleatorias idénticamente distribuidas e independientes , cada una de ellas con

esperanza y varianza ,entonces la fdp de la variable

Es la distribución normal estándar cuando n tiende a infinito

2

n

nS

• Este teorema también es válido (bajo ciertas condiciones) cuando las variables aleatorias no están idénticamente distribuidas. Esta generalización es válida cuando las variables aleatorias individuales solo hacen una contribución relativamente pequeña a la suma total.

• En estos casos se reemplaza por

• Y por

n n

i

i

1nn

i

i

1

2

• Luego la fda de S es función de

N(0,1) del siguiente modo

n

i

i

n

i

i

n

s

sSPón

ssSP

1

2

0

0

0

0

1

Observación

• Cuando la variable aleatoria es discreta hay que aplicar la

corrección de continuidad que consiste en ampliar el

intervalo en una unidad , es decir , si

• Entonces el intervalo se amplia de la siguiente manera:

bXa

2

1

2

1bXa

Aplicaciones del Teorema Ejemplo 1:Supóngase que una fábrica produce cafeteras eléctricas de las

cuales, alrededor del 5% son defectuosas. Si se inspeccionan 100 cafeteras

¿Cuál es la probabilidad de que haya entre 2 y 6 defectuosas?

0,4977

2 6 3 ( 4) ( 5)P x P x P x P x

3 97 4 96 5 95100 100 1000,05 .0,95 0,05 .0,95 0,05 .0,95

3 4 5

Comparemos el resultado del cálculo directo con el cálculo aproximado,

es decir, aplicando el TCL:

Aplicamos el TCL

Calculamos

E(x)=np=100.0,05=5 V(x)= np(1-p)=100.0,05.0,95= 4,75

6 5 2 52 6 0,46 1,38

4,75 4,75

0,6772 0,0838 0,5934

P x

Comparamos con el resultado exacto 0,4977. No es una buena aproximación. Por

ser x una variable discreta, calculemos

5 5 3 5(3 5)

4,75 4,75

0 0,92 0,5 0,1788 0,3212

P x Tampoco es buena

aproximación

Aplicamos la corrección por continuidad

a -0.5 a

b + 0.5 b

p(x)

1 1

2 2Si a x b a x b

Corrección por continuidad

Para variables discretas, consiste en ampliar el intervalo en una unidad, es decir:

0,4659

1 1

2 2Si a x b a x b

5,5 5 2,5 52,5 5,5

4,75 4,75

0,23 1,15 0,591 0,1251

P x

Es una buena aproximación

Ejemplo 2 Una fábrica de productos alimenticios produce carne enlatada, con un peso

medio de 250 grs y una varianza de 900 grs cuadrados por lata. Si los

pesos de las latas son estadísticamente independientes. Las cajas

contienen 60 latas. Se elige una al azar, hallar la probabilidad de que:

a) El peso de la caja sea a lo sumo 14,5 kg.

b) El peso de la caja sea al menos 15,3 kg.

: es el peso de cada lata C: es el peso de la caja ix

2( ) 250 . ( ) 30i iE x grs V x grs60 60 60

1 1 1

( ) 60.250 15.000 15 .i i i

i i i

C x E C E x E x grs kg

60 602

1 1

( ) 60.900 54.000

( ) 60.900 60.30 232,38 0,23238

i i

i i

V C V x V x grs

C grs kg

Observaciones

• El n que se requiere para aplicar el TCL en gran parte

depende de la forma de la distribución de la var. aleatoria

individuales que se suman

• Si los sumandos están distribuidos normalmente entonces

al aplicar el TCL da probabilidades exactas (no importa el n)

• Si no se sabe nada de cómo están distribuidos los

sumandos entonces el n e mayor o igual que 25 para

obtener buenas aproximaciones.

• Si las variables aleatorias se distribuyen binomialmente

n > 10 si p es aproximadamente 0,5

Si p es aproximadamente 0 o p aproximadamente 1 n debe ser

bastante mayor