distribuciones mas comunes

11
II.- Distribuciones probabilísticas más comunes a) La Distribución Normal Una variable aleatoria continua es la que puede asumir un número infinito de posibles valores dentro de un rango específico. Estos valores usualmente resultan de medir algo (medidas de longitud, de peso, de tiempo, de temperatura etc.) El título de Normal viene de que al principio se consideraba que todos los fenómenos en su estado normal deben seguir esa distribución; sin embargo, hoy día, esa concepción ha sido superada y la distribución normal se considera tan corriente como otro tipo de distribución. Características de la distribución de probabilidad normal: La distribución de probabilidad normal y su curva tiene las siguientes características: 1. La curva normal tiene forma de campana (campana de Gauss). La media, la moda y la mediana de la distribución son iguales y se localizan en el centro de la distribución. 2. La distribución de probabilidad normal es simétrica alrededor de su media. Por lo tanto, la mitad del área bajo la curva está antes del punto central y la otra mitad después. El área total bajo la curva es igual a 1. 3. La curva normal se aproxima de manera asintótica al eje horizontal conforme se aleja de la media en cualquier dirección. Esto significa que la curva se acerca al eje horizontal conforme se aleja de la media, pero nunca lo llega a tocar. 4. La función de la curva normal es la siguiente: La familia de la distribución de probabilidad normal:

Upload: daisuke-nunez

Post on 02-Dec-2015

38 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Distribuciones Mas Comunes

II.- Distribuciones probabilísticas más comunes

a) La Distribución Normal

Una variable aleatoria continua es la que puede asumir un número infinito de posibles valores dentro de un rango específico. Estos valores usualmente resultan de medir algo (medidas de longitud, de peso, de tiempo, de temperatura etc.)

El título de Normal viene de que al principio se consideraba que todos los fenómenos en su estado normal deben seguir esa distribución; sin embargo, hoy día, esa concepción ha sido superada y la distribución normal se considera tan corriente como otro tipo de distribución.

Características de la distribución de probabilidad normal:

La distribución de probabilidad normal y su curva tiene las siguientes características:

1. La curva normal tiene forma de campana (campana de Gauss). La media, la moda y la mediana de la distribución son iguales y se localizan en el centro de la distribución.

2. La distribución de probabilidad normal es simétrica alrededor de su media. Por lo tanto, la mitad del área bajo la curva está antes del punto central y la otra mitad después. El área total bajo la curva es igual a 1.

3. La curva normal se aproxima de manera asintótica al eje horizontal conforme se aleja de la media en cualquier dirección. Esto significa que la curva se acerca al eje horizontal conforme se aleja de la media, pero nunca lo llega a tocar.

4. La función de la curva normal es la siguiente:

La familia de la distribución de probabilidad normal:

Cuando se habla de la distribución normal, realmente se está hablando de una familia de curvas. Como se puede apreciar en la función de la curva normal, la curva depende de dos variables además de la variable independiente x, tales como la media (μ), y la desviación estándar (σ).

Por lo tanto se tendrán curvas diferentes para funciones con desviación estándar diferente aún cuando sus medias fuesen iguales, como se muestra enseguida.

Curvas normales con media igual y desviación estándar diferente.Si por el contrario, las curvas tienen desviación estándar igual y la media es diferente, las curvas serán idénticas pero centradas en diferente posición en el eje horizontal.

Page 2: Distribuciones Mas Comunes

Curvas normales con desviación estándar igual y media diferenteSi las curvas tienen la media diferente y también la desviación estándar diferente, aparte de estar centradas en diferentes lugares del eje x, tendrá formas diferentes.

Curvas normales con media diferente y desviación estándar diferente

La distribución normal estándar El área bajo la curva normal y sobre el eje x es igual a la probabilidad de que la variable aleatoria x tome un valor dentro de cierto intervalo. Para medir esta área es necesario calcular la integral de la función de la curva normal para un intervalo de valores. Para evitar la dificultad de resolver integrales es necesario tabular las áreas que corresponden a cada valor de x. Como el número de distribuciones normales es ilimitado sería una tarea sin fin intentar establecer tablas para cada combinación de μ y σ. Afortunadamente, un miembro de la familia de las distribuciones normales puede ser usado en todos los problemas donde la distribución normal es aplicable, esta es la distribución normal con media cero y desviación estándar 1, la cual es llamada distribución normal estándar.

Cada distribución normal deberá estandarizarse, es decir, transformarse a una distribución normal estándar, utilizando un valor z, o variable aleatoria estándar.

Valor z. Distancia entre un valor seleccionado, denominado X, y la media de la distribución, en unidades de una desviación estándar. En términos de fórmula:

z = x – μσ

Gracias a esta fórmula podemos transformar cualquier distribución normal a la distribución normal estándar.

Ejemplo:

La vida media de un alimento deshidratado, según el fabricante, es de 68 meses, con una desviación típica de 5. Se supone que se distribuye según una distribución normal. En un lote de 10.000 frascos. a) ¿Cuántos frascos superarán previsiblemente los 75 meses? b) ¿Cuántos frascos se estropearán antes de 60 meses?

a) t = (75 -68)/5 = 1,4

P (X > 75) = (t > 1,4) = 1 - P (t ≤ 1,4) = 1 - 0,9192 = 0,0808

Luego, el 8,08% de los frascos (808 lámparas) superarán los 75 meses.

Page 3: Distribuciones Mas Comunes

b) La Distribución Binomial

La distribución binomial es típica de las variables que proceden de un experimento que cumple las siguientes condiciones:

1) El experimento está compuesto de n pruebas iguales, siendo n un número natural fijo.

2) Cada prueba resulta en un suceso que cumple las propiedades de la variable binómica o de Bernouilli, es decir, sólo existen dos posibles resultados, mutuamente excluyentes, que se denominan generalmente como éxito y fracaso.

3) La probabilidad del ‚éxito (o del fracaso) es constante en todas las pruebas. P(éxito) = p ; P(fracaso) = 1 - p = q

4) Las pruebas son estadísticamente independientes,

En estas condiciones, la variable aleatoria X que cuenta el número de ‚éxitos en las pruebas se llama variable binomial. Evidentemente, el espacio muestral estar compuesto por los números enteros del 0 al n. Se suele decir que una variable binómica cuenta objetos de un tipo determinado en un muestreo de n elementos con reemplazamiento.

La función de probabilidad de la variable binomial se representa como b(x,n,p) siendo n el número de pruebas y p la probabilidad del ‚éxito. n y p son los parámetros de la distribución.

La manera más fácil de calcular de valor de números combinatorios, como los incluidos en la expresión anterior, es utilizando el triángulo de Tartaglia

Page 4: Distribuciones Mas Comunes

La media y la varianza de la variable binomial se calculan como:

Media = μ = n p

Varianza = σ2 = n p q

Gráficamente el aspecto de la distribución depende de que sea o no simétrica Por ejemplo, el caso en que n = 4:

Ejemplo:

En un lote de frascos de vidrio de mermelada de fresa, la probabilidad de encontrar un frasco con una fresa entera es de 20%. Si se selecciona una muestra aleatoria de n=10. Calcular la probabilidad de que esta muestra contenga un frasco con una fresa entera.

K=1, n=10, p= 0.2.

La probabilidad de encontrarla, sería de 26,84%.

Page 5: Distribuciones Mas Comunes

c) Distribución hipergeométrica

Una variable tiene distribución hipergeométrica si procede de un experimento que cumple las siguientes condiciones:

1) Se toma una muestra de tamaño n, sin reemplazamiento, de un conjunto finito de N objetos.

2) K de los N objetos se pueden clasificar como ‚éxitos y N - K como fracasos.

X cuenta el número de ‚éxitos obtenidos en la muestra. El espacio muestral es el conjunto de los números enteros de 0 a n, ó de 0 a K si K < n.

En este caso, la probabilidad del ‚éxito en pruebas sucesivas no es constante pues depende del resultado de las pruebas anteriores. Por tanto, las pruebas no son independientes entre sí.

La función de probabilidad de la variable hipergeométrica es:

Los parámetros de la distribución son n, N y K.

Los valores de la media y la varianza se calculan según las ecuaciones:

Si n es pequeño, con relación a N (n << N), la probabilidad de un ‚éxito variar muy poco de una prueba a otra, así pues, la variable, en este caso, es esencialmente binomial; en esta situación, N suele ser muy grande y los números combinatorios se vuelven prácticamente inmanejables, así pues, la probabilidades se calculan más cómodamente aproximando por las ecuaciones de una binomial con p = K / N.

La media de la variable aproximada (μ = n p = n (K / N)) es la misma que la de la variable antes de la aproximación; sin embargo, la varianza de la variable binomial es ligeramente superior a la de la hipergeométrica.

Page 6: Distribuciones Mas Comunes

el factor por el que difieren ser siempre menor que 1 y tan próximo a 1 como cierto sea que n << N.

El aspecto de la distribución es bastante similar al de la binomial. Como ejemplo, mostramos los casos análogos a los de las binomiales del apartado anterior (p inicial = 0,25 y n = 4)

Ejemplo: En una industria de conservas, se tienen dos autoclaves, uno de capacidad 40 cajas por minuto, y otro de 10 cajas por minuto. Un lote de producto tiene 50 cajas.

Se sabe que el autoclave de menor capacidad tuvo una falla considerable durante un minuto, por lo que el lote 10, se ha parado. El lote 10 está conformado por 40 cajas del autoclave de más capacidad, y las diez unidades fallidas. Se van a elegir 5 cajas de ese lote. ¿Cuál es la probabilidad de que 4 de los 5 elegidos sean adecuados para el consumo?

La probabilidad es de 0.431.

Page 7: Distribuciones Mas Comunes

d) Distribución de Poisson

Una variable de tipo Poisson cuenta ‚éxitos (es decir, objetos de un tipo determinado) que ocurren en una región del espacio o del tiempo.

El experimento que la genera debe cumplir las siguientes condiciones:

1. El número de éxitos que ocurren en cada región del tiempo o del espacio es independiente de lo que ocurra en cualquier otro tiempo o espacio disjunto del anterior.

2. La probabilidad de un ‚éxito en un tiempo o espacio pequeño es proporcional al tamaño de este y no depende de lo que ocurra fuera de él.

3. La probabilidad de encontrar uno o más ‚éxitos en una región del tiempo o del espacio tiende a cero a medida que se reducen las dimensiones de la región en estudio.

Como consecuencia de estas condiciones, las variables Poisson típicas son variables en las que se cuentan sucesos raros.

La función de probabilidad de una variable Poisson es:

El parámetro de la distribución es λ que es igual a la media y a la varianza de la variable.

Esta característica puede servirnos para identificar a una variable Poisson en casos en que se presenten serias dificultades para verificar los postulados de definición.

La distribución de Poisson se puede considerar como el límite al que tiende la distribución binomial cuando n tiende a y p tiende a 0, siendo np constante (y menor que 7); en esta situación sería difícil calcular probabilidades en una variable binomial y, por tanto, se utiliza una aproximación a través de una variable Poisson con media l = n p.

La varianza de la variable aproximada es ligeramente superior a la de la variable binomial.

Las variables Poisson cumplen la propiedad de que la suma de variables Poisson independientes es otra Poisson con media igual a la suma las medias.

Page 8: Distribuciones Mas Comunes

El aspecto de la distribución depende muchísimo de la magnitud de la media. Como ejemplo, mostramos tres casos con λ = 0,5 (arriba a la izquierda), λ = 1,5 (arriba a la derecha) y λ = 5 (abajo) Obsérvese que la asimetría de la distribución disminuye al crecer λ y que, en paralelo, la gráfica empieza a tener un aspecto acampanado.

Ejemplo:

En la inspección del sello de latas de conserva producida por un proceso electrolítico continuo, se

identifican 0.2 imperfecciones en promedio por minuto. Determine las probabilidades de

identificar a) una imperfección en 3 minutos, b) al menos dos imperfecciones en 5 minutos, c)

cuando más una imperfección en 15 minutos.

Solución:

a) x = variable que nos define el número de imperfecciones en las latas por cada 3 minutos = 0,

1, 2, 3, ...., etc., etc.

= 0.2 x 3 =0.6 imperfecciones en promedio por cada 3 minutos en la hojalata

b) x = variable que nos define el número de imperfecciones en la hojalata por cada 5 minutos =

0, 1, 2, 3, ...., etc., etc.

= 0.2 x 5 =1 imperfección en promedio por cada 5 minutos en la hojalata

Page 9: Distribuciones Mas Comunes

=1-(0.367918+0.367918) = 0.26416

c) x = variable que nos define el número de imperfecciones en la hojalata por cada 15 minutos =

0, 1, 2, 3, ....., etc., etc.

= 0.2 x 15 = 3 imperfecciones en promedio por cada 15 minutos en la hojalata

= 0.0498026 + 0.149408 = 0.1992106