¿Hasta qué grado la media y la varianza caracterizan la distribución de una variable aleatoria ?
Desigualdad de Tchebyshev
Esta desigualdad brinda un medio para entender cómo la
varianza mide la variabilidad alrededor de la esperanza
matemática de la variable. Dicha desigualdad afirma que:
“Si la Esperanza y la varianza de la variable X son finitas, para cualquier
número positivo k, la probabilidad de que la variable aleatoria X esté en el
intervalo
2
1; es mayor o igual que 1- es decirk k
k
Es decir :
2
2
1; 1-
11-
P k k ók
P x kk
La probabilidad de que X asuma un valor que está
dentro de las k dispersiones de su esperanza, es por
lo menos
2
11 0k
k
Consideraciones
Son sucesos
complementarios, 2
1la P x k
k
1)Ya que yx k x k
2 2
1 12) Si k<1 1- 0 1y
k k
Entonces la desigualdad de Tchebyshev es trivial para
valores de k < 1, ya que 0< p < 1
3) El significado de esta desigualdad reside en su completa
universalidad, ya que puede ser aplicada a cualquier variable
aleatoria .
En particular es útil , pues proporciona una sencilla demostración
de la ley de los grandes números
Otra utilidad
Si conocemos la distribución de probabilidades de una variable aleatoria discreta o continua, podemos
calcular su
E(x) y V(x), si existen, pero
el recíproco no es cierto, es decir, conociendo E(x) y V(x), no podemos reconstruir la distribución de
probabilidades, por lo tanto no podemos calcular la probabilidad de que la diferencia entre la variable
aleatoria y su media , en valor absoluto , se mantengan menor que un valor c, pero con esta desigualdad podemos dar una cota superior o
inferior.
Ejemplo
¿Cuál es la probabilidad que se
asocia con valores de x hasta 2
xi
0 1 2 3 4
P(xi)
0,05 0,2 0,4 0,25 0,1
?
Es decir,¿ Cuál es la 2 ?P x
Solución
2
( ) 2,15
( ) 5,65 2,15 1,0275 ( ) 1,0136
E x
V x x
Como conocemos la distribución de X, podemos calcular lo
pedido exactamente.
2 2,15 2.1,0136P x P x
2,15 2,0272 0,1228 4,1772P x P x
( 1) ( 2) ( 3) ( 4)P x P x P x P x
0,2 + 0,4 + 0,25 + 0,1 = 0,95
Supongamos no conocer la distribución de X,
pero conocemos su esperanza y varianza, y
aplicamos la desigualdad de Tchebyshev
Sólo podemos obtener una cota de la probabilidad
2
12 1P x
k
2
1 32,15 2.1,0136 1 0,75
2 4P x
Y efectivamente 0,95 > 0,75
Vimos que
Cuando el número de repeticiones de un
experimento aleatorio aumenta
considerablemente, la frecuencia
relativa del suceso A converge en
sentido probabilístico a la probabilidad
teórica.
( ) para Af P A n
Teoremas conocidos con el nombre de:
“leyes de los grandes números”
1)Teorema de Bernoulli
En una sucesión de pruebas de Bernoulli, dado un
número positivo arbitrario, la probabilidad de que
la frecuencia relativa del éxito en n pruebas, difiera
de la probabilidad p en una cantidad mayor que ,
tiende a cero cuando n tiende a infinito.
1 0lim An
P f pO
también
0 0lím An
P f p
Demostración en el pizarrón
Otra forma de enunciar el Teorema de Bernoulli
En toda sucesión de pruebas de Bernoulli, la frecuencia
relativa converge en sentido probabilístico a p.
0 0lim An
P f p
1 0lím An
P f p
Teorema de Bernoulli generalizado
• Dada una sucesión
de variables aleatorias, dos a dos
independientes, con una misma
distribución de probabilidades y con
esperanza y varianza se
verifica que para todo épsilon >0
nxxxx ....,,.........,, 321
2
01 xPlímóxPlímnn
• En otras palabras :el límite , en
probabilidad, de la media muestral
para n tendiendo a infinito , es igual
a la esperanza matemática.
• Demostración
Teorema del límite central ó
Teorema central del límite
• Enunciado:
• “Si S es la suma de un gran número de variables aleatorias idénticamente distribuidas e independientes , cada una de ellas con
esperanza y varianza ,entonces la fdp de la variable
Es la distribución normal estándar cuando n tiende a infinito
2
n
nS
• Este teorema también es válido (bajo ciertas condiciones) cuando las variables aleatorias no están idénticamente distribuidas. Esta generalización es válida cuando las variables aleatorias individuales solo hacen una contribución relativamente pequeña a la suma total.
• En estos casos se reemplaza por
• Y por
n n
i
i
1nn
i
i
1
2
• Luego la fda de S es función de
N(0,1) del siguiente modo
n
i
i
n
i
i
n
s
sSPón
ssSP
1
2
0
0
0
0
1
Observación
• Cuando la variable aleatoria es discreta hay que aplicar la
corrección de continuidad que consiste en ampliar el
intervalo en una unidad , es decir , si
• Entonces el intervalo se amplia de la siguiente manera:
bXa
2
1
2
1bXa
Aplicaciones del Teorema Ejemplo 1:Supóngase que una fábrica produce cafeteras eléctricas de las
cuales, alrededor del 5% son defectuosas. Si se inspeccionan 100 cafeteras
¿Cuál es la probabilidad de que haya entre 2 y 6 defectuosas?
0,4977
2 6 3 ( 4) ( 5)P x P x P x P x
3 97 4 96 5 95100 100 1000,05 .0,95 0,05 .0,95 0,05 .0,95
3 4 5
Comparemos el resultado del cálculo directo con el cálculo aproximado,
es decir, aplicando el TCL:
Aplicamos el TCL
Calculamos
E(x)=np=100.0,05=5 V(x)= np(1-p)=100.0,05.0,95= 4,75
6 5 2 52 6 0,46 1,38
4,75 4,75
0,6772 0,0838 0,5934
P x
Comparamos con el resultado exacto 0,4977. No es una buena aproximación. Por
ser x una variable discreta, calculemos
5 5 3 5(3 5)
4,75 4,75
0 0,92 0,5 0,1788 0,3212
P x Tampoco es buena
aproximación
Corrección por continuidad
Para variables discretas, consiste en ampliar el intervalo en una unidad, es decir:
0,4659
1 1
2 2Si a x b a x b
5,5 5 2,5 52,5 5,5
4,75 4,75
0,23 1,15 0,591 0,1251
P x
Es una buena aproximación
Ejemplo 2 Una fábrica de productos alimenticios produce carne enlatada, con un peso
medio de 250 grs y una varianza de 900 grs cuadrados por lata. Si los
pesos de las latas son estadísticamente independientes. Las cajas
contienen 60 latas. Se elige una al azar, hallar la probabilidad de que:
a) El peso de la caja sea a lo sumo 14,5 kg.
b) El peso de la caja sea al menos 15,3 kg.
: es el peso de cada lata C: es el peso de la caja ix
2( ) 250 . ( ) 30i iE x grs V x grs60 60 60
1 1 1
( ) 60.250 15.000 15 .i i i
i i i
C x E C E x E x grs kg
60 602
1 1
( ) 60.900 54.000
( ) 60.900 60.30 232,38 0,23238
i i
i i
V C V x V x grs
C grs kg
Observaciones
• El n que se requiere para aplicar el TCL en gran parte
depende de la forma de la distribución de la var. aleatoria
individuales que se suman
• Si los sumandos están distribuidos normalmente entonces
al aplicar el TCL da probabilidades exactas (no importa el n)
• Si no se sabe nada de cómo están distribuidos los
sumandos entonces el n e mayor o igual que 25 para
obtener buenas aproximaciones.
• Si las variables aleatorias se distribuyen binomialmente
n > 10 si p es aproximadamente 0,5
Si p es aproximadamente 0 o p aproximadamente 1 n debe ser
bastante mayor