1.5 dist. normal

19
1.5 Distribución Normal 1.5.1 Modelo de Probabilidades Una característica de una variable aleatoria es que sólo toma valores separados, distintos o contables, cuando una variable aleatoria x es discreta, se puede asignar una probabilidad a cada valor que puede tomar x y obtener la distribución de probabilidad para x. la suma de todas las probabilidades asociadas con los valores diferentes de x es 1. Sin embargo no todos los experimentos producen variables aleatorias que son discretas. Por ejemplo, medir el tiempo de llegada a la escuela. Los valores pueden ser 30 o 31 minutos, o cualquier número entre 30 y 31 minutos, tal como 30.26 minutos. Además, en este intervalo hay un número infinito de valores. De modo que los resultados no son contables y se conocen como una variable aleatoria continua. Una Variable Aleatoria Continua (VAC) puede tomar cualquier valor de un número infinito de valores en la recta real, sus valores posibles forman un intervalo continuo y las probabilidades de las variables aleatorias continuas se asocian sólo con intervalos de observaciones, no con valores individuales, como ocurre en el caso de la variable aleatoria discreta. La distribución de probabilidad se crea al distribuir una unidad de probabilidad a lo largo de la recta, así como se podría distribuir un puño de arena.

Upload: mike-rivera-yahoo-07-y-2010

Post on 21-Jul-2016

125 views

Category:

Documents


3 download

DESCRIPTION

Autor: Emma Bautista, CCH Oriente, Unam, 2014

TRANSCRIPT

1.5 Distribución Normal

1.5.1 Modelo de Probabilidades

Una característica de una variable aleatoria es que sólo toma valores

separados, distintos o contables, cuando una variable aleatoria x es

discreta, se puede asignar una probabilidad a cada valor que puede tomar

x y obtener la distribución de probabilidad para x. la suma de todas las

probabilidades asociadas con los valores diferentes de x es 1. Sin embargo

no todos los experimentos producen variables aleatorias que son discretas.

Por ejemplo, medir el tiempo de llegada a la escuela. Los valores pueden

ser 30 o 31 minutos, o cualquier número entre 30 y 31 minutos, tal como

30.26 minutos. Además, en este intervalo hay un número infinito de

valores. De modo que los resultados no son contables y se conocen como

una variable aleatoria continua.

Una Variable Aleatoria Continua (VAC) puede tomar cualquier valor

de un número infinito de valores en la recta real, sus valores posibles

forman un intervalo continuo y las probabilidades de las variables

aleatorias continuas se asocian sólo con intervalos de observaciones, no

con valores individuales, como ocurre en el caso de la variable aleatoria

discreta.

La distribución de probabilidad se crea al distribuir una unidad de

probabilidad a lo largo de la recta, así como se podría distribuir un puño

de arena.

La probabilidad “granos de arena o

mediciones, se acumulará en ciertos lugares,”

y el resultado es la distribución de

probabilidad que se muestra en la figura 3. La

profundidad o densidad de la probabilidad,

que varía con x, se puede describir mediante

la expresión matemática )(xf , llamada

distribución de probabilidad o función de

densidad de probabilidad para la variable

aleatoria x.

Figura 3. La profundidad o densidad

Una de las propiedades de la distribución de probabilidad continua es que

la suma de frecuencias relativas es igual a uno y la probabilidad de que x

se encuentre en un cierto intervalo se puede encontrar al sumar las

probabilidades en ese intervalo, considerando que la probabilidad de que

x, sea igual a algún valor particular; por ejemplo, puesto que no hay área

sobre un solo punto: x = a, en la distribución de probabilidad para una

variable aleatoria continua, implica que la probabilidad es cero.

1.5.2 Distribución Normal Estándar y sus propiedades.

Características de la distribución de probabilidad continúa.

Sea X una variable aleatoria continúa, entonces la función de probabilidad

)(xf x , asociada a X satisface las condiciones:

a) 0)( xf x (no negativa) para todo número real.

b) El área bajo la curva en la distribución de probabilidad continua es igual a 1.

c) La probabilidad de que x se encuentre en un intervalo particular; por ejemplo, de

a a b , es igual al área bajo la curva entre los dos puntos a y b. ésta es el área

sombreada Fig.3

d) P(x = a) = 0 Para variables aleatorias continuas.

La distribución normal es aquélla en la que xf x crece y decrece suave y

simétricamente a derecha e izquierda de la media. Su representación se

aproxima o es semejante a una campana como la de la figura 4, su función

de densidad xf x está representada geométricamente en la figura 4 y por

la expresión algebraica 1:

Expresión

2

2

1

2

1)(

x

exf

con y

X

Los símbolos e y son constantes matemáticas

cuyos valores aproximados son 2.7183 y 3.1416,

respectivamente; y 0 son los

parámetros que representan la media y la

desviación estándar de la población.

xf x

x

Fig.4 Distribución Normal Estándar

Propiedades de la distribución normal:

1. La curva se asemeja a una campana, de ahí que se denomine “Campana

de Gauss” o “curva Gaussiana”

2. Es simétrica con respecto a la media de la distribución

Distribución de probabilidad normal.

La variable aleatoria continua X está distribuida normalmente con

parámetros y 2 si y sólo si su función de probabilidades es:

Fig.4 Distribución Normal

Estándar

x xf x

3. La media, la mediana y la moda son iguales.

4. Se extiende de a +

5. La curva es asintótica con el eje X (La curva es simétrica respecto a la

recta perpendicular al eje X que corta a la curva en su punto máximo,

punto desde el cual cae simétricamente la curva en las dos direcciones y se

extiende sin llegar a tocar el eje X)

6. El área total bajo la curva normal y por encima del eje horizontal es

igual a 1

7. La distribución normal queda completamente determinada por los

parámetros y ; existe una distribución normal diferente para cada

combinación de media y desviación estándar.

8. El área bajo la curva entre dos puntos es la probabilidad de que una

variable distribuida normalmente asuma un valor entre ellos.

Diferentes densidades para la distribución de probabilidad normal.

Caso 1.

Diferentes valores de la medias , manteniendo constante el valor de ,

representa un desplazamiento horizontal de la distribución normal.

( 321 )

Figura 5. Distribuciones de probabilidad normales con valores de

diferentes.

Caso 2.

Diferentes valores de ()( 321

,

manteniendo constante .

Cuanto mayor sea el valor de la

desviación estándar, existe mayor

dispersión de los datos, los valores

grandes de reducen la altura de la curva

y aumentan su amplitud, los valores

pequeños aumentan la altura de la curva

y reducen su amplitud.

Figura 6. Distribuciones de probabilidad

normales con valores de diferentes.

Según la regla empírica, casi todos los valores de una variable aleatoria

continua se encuentran en el intervalo 3 . Mientras estos valores

sean positivos, la distribución normal proporciona un buen modelo para

describir los datos.

4.0

9.0

4.1

4.0

9.0

4.1

8

X

4 6

5.0 5.0 5.0

1.5.3 Área bajo la curva normal y manejo de tablas.

Como se menciono antes la probabilidad de que una variable continua

tome un valor determinado es cero, es decir P(X=x)= 0 cualquiera que sea

el valor de x. Por eso, las probabilidades en los modelos continuos se

calculan en intervalos, es decir P(a <X < b).Sólo que en el caso de la

distribución normal ello presenta grandes dificultades debido a que no se

conoce la función original con la cual pueda calcularse la integral que nos

da la función de distribución de normal F(x), la cual se expresa en la

forma:

xt

dtexXPxF

2

2

1

2

1

Expresión 2.

El único medio para conocer F(x) es el de usar laboriosos métodos

numéricos con el auxilio de la computadora. Los resultados están vaciados

en tablas para uso general.

El gran inconveniente de esto es que se tendrían que hacer o tener a la

mano una tabla distinta para cada valor de y para cada valor de 0 ,

puesto que hay una distribución diferente para cada uno de esos valores y

existe un número infinito de cada uno de los parámetros ( , ).

La solución fue construir una sola tabla, la del modelo estándar al cual

pueden ser trasladados todos los casos particulares de distribuciones

normales, modelo cuyos parámetros son 0 y 1 (que son el origen y

la unidad o escala de medida estándar). Este modelo es el La distribución

Normal Estándar, Para el cual el símbolo X de la variable se cambia por

el símbolo Z.

Z ~ N(0, 1) La distribución normal estándar es el método general para

calcular las probabilidades de eventos relativos a cualquier distribución

normal X ~ N( , ) o a la inversa , para encontrar eventos relativos a X ~

N( , ) que satisfacen probabilidades conocidas de antemano.

La estandarización de una distribución normal significa que cualquier

evento de una X ~ N ( , ) se traslada a un evento de la normal estándar Z

~ N (0, 1) que mantenga la misma probabilidad (las probabilidades de

ambos eventos deben corresponder a áreas iguales).

Una variable aleatoria normal x se estandariza al expresar su valor como

el número de desviaciones estándar ( ) a la izquierda o derecha de su

media ( ).

La variable aleatoria normal estandarizada, z , se define como:

La distribución de probabilidad para z que se muestra en la figura 10, se

llama distribución normal estandarizada porque su media es 0 y su

desviación estándar es 1.

El área bajo la curva normal

estándar entre la media 0Z y

un valor positivo de z .

Por ejemplo, 0z, es la probabilidad

).0( 0zZP

Esta área se toma de la tabla 3,

apéndice I, en la figura 9 se

muestra el área de la región la

cual es de 0.3413.

Figura 10. Distribución normal estandarizada.

La tabla 3 ha sido construida registrando el área de regiones como ésta;

para calcular dicha área hay que localizar el valor de 1Z ,

conjugándolo con la columna correspondiente a .00 ahí puede verse que el

xz

valor es precisamente el .3413, por lo tanto: .3413.0)10( ZP En

general, la tabla 3 proporciona la probabilidad de intervalos de la forma (0,

Z) para valores positivos de Z con dos cifras decimales.

Versión abreviada de Tabla 3, apéncice I

Z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09

0.0 0.00000 0.00399 0.00798 0.01197 0.01595 0.01994 0.02392 0.02790 0.03188 0.03586

0.1 0.03983 0.04380 0.04776 0.05172 0.05567 0.05962 0.06356 0.06749 0.07142 0.07535

0.2 0.07926 0.08317 0.08706 0.09095 0.09483 0.09871 0.10257 0.10642 0.11026 0.11409

0.3 0.11791 0.12172 0.12552 0.12930 0.13307 0.13683 0.14058 0.14431 0.14803 0.15173

0.4 0.15542 0.15910 0.16276 0.16640 0.17003 0.17364 0.17724 0.18082 0.18439 0.18793

0.5 0.19146 0.19497 0.19847 0.20194 0.20540 0.20884 0.21226 0.21566 0.21904 0.22240

0.6 0.22575 0.22907 0.23237 0.23565 0.23891 0.24215 0.24537 0.24857 0.25175 0.25490

0.7 0.25804 0.26115 0.26424 0.26730 0.27035 0.27337 0.27637 0.27935 0.28230 0.28524

0.8 0.28814 0.29103 0.29389 0.29673 0.29955 0.30234 0.30511 0.30785 0.31057 0.31327

0.9 0.31594 0.31859 0.32121 0.32381 0.32639 0.32894 0.33147 0.33398 0.33646 0.33891

1.0 0.34134 0.34375 0.34614 0.34849 0.35083 0.35314 0.35543 0.35769 0.35993 0.36214

1.1 0.36433 0.36650 0.36864 0.37076 0.37286 0.37493 0.37698 0.37900 0.38100 0.38298

1.2 0.38493 0.38686 0.38877 0.39065 0.39251 0.39435 0.39617 0.39796 0.39973 0.40147

Para calcular una probabilidad de cualquier variable aleatoria de la forma

X ~ N ( , 2 ), solamente es necesario “estandarizar” o “normalizar” la

variable aleatoria correspondiente por medio de

xZ y

posteriormente consultar las tablas de distribución normal estándar Z ~ N

(0, 21 ).

Ejemplo 1.6

Encontrar P ( ).28.10 Z Esta probabilidad corresponde al área entre la

media ( 0z ) y un punto 28.1z desviación estándar a la derecha de la

media (Figura 11).

Solución.

El área es la parte sombreada en la

figura 11. Puesto que en la tabla 3,

del apéndice I, se encuentran las

áreas bajo la curva normal a la

derecha de la media, sólo necesita

encontrar el valor tabulado que

corresponde a 2.1z y luego cruzar

la parte superior de la tabla hasta la

columna marcada por .08 la

intersección de esta fila y columna

da el área 0.39973 por

consiguiente:

39973.0)28.10( ZP

Figura 11. Área bajo la curva normal estándar para

el ejemplo 25.

1.5.4 Problemas de aplicación.

Ejemplo 1.7

El tiempo que tarda el servicio medico de emergencia en llegar a un centro

deportivo ubicado afuera de la ciudad, tiene una distribución normal con

17 minutos y 3 minutos. Determinar la probabilidad de que el

tiempo de arribo es:

a) Entre 13 y 22 minutos.

b) Sea más de 22 minutos

0.39973

c) Esté entre 15.5 y 18.5 minutos.

Solución.

Sea la variable aleatoria X= El tiempo que tarda el servicio medico de

emergencia en llegar a un centro deportivo ubicado afuera de la ciudad.

Puesto que X ~ N (17, 23 ), Por lo tanto:

a) Para el primer caso se requiere que se calcule la probabilidad

2213 XP , es decir, los valores de la variable estandarizada y el

área representa la probabilidad que se pide encontrar, esto es calcular

los valores de Z para 13 y 22, o sea: 131 X y 222 X

66.13

1722

33.13

1713

22

11

XZ

XZ

33.11 z O

40824.01 A

66.12 z O

45254.02 A

86078.0

45254.040824.021

AAA

El signo menos únicamente índica que la

puntuación Z se encuentra a la izquierda de la

media.

Figura 15. Área bajo la curva normal estándar,

ejemplo 29, a).

8607.067.133.13

1722

3

1713)2213(

ZPZPXP

1A

2A

0.86078

La probabilidad de que el tiempo de arribo del servicio de emergencia en

llegar a un centro deportivo ubicado afuera de la ciudad, entre 13 y 22

minutos es de 0.8607, lo que equivale al 86.07%

b) La probabilidad )22( XP ,

Primero se calcula Z para 22, o sea: 221 X , 66.1

3

1722

Z

Para determinar esta área,

primero se calcula el área entre

0 y 1.66, es decir se busca el

valor de z = 1.66 en la tabla

1, anexo I.

encontrando: 45154.01 A

El área completa del lado

derecho es 0.5, por lo que a esta

área se le resta 1A

04846.045154.05.0 A

Figura 16. Área bajo la curva normal estándar, ejemplo

29, b).

)22( XP = 04846.066.13

1722

ZPZP

La probabilidad de que el tiempo de arribo del servicio de emergencia en

llegar a un centro deportivo ubicado afuera de la ciudad, sea más de 22

minutos es de 0.04846, lo que equivale al 4.84%.

c) La probabilidad )5.185.15( XP

Primero se calcula Z para 15.5 y 18.5, o sea: 5.151 X y 5.182 X

1A

0.04846

05.3

175.151

Z 5.0

3

175.182

Z

Donde el signo menos únicamente índica que la puntuación Z se encuentra

a la izquierda de la media.

El área 5.01 z se busca en la tabla 1, siendo: 19146.01 A

El área 5.02 z se busca en la tabla 1, siendo: 19146.02 A

Por lo que: 38292.019146.019146.021 AAA

38292.0)5.05.0(3

175.18

3

175.15)5.185.15(

ZPZPXP

La probabilidad de que el

tiempo de arribo del servicio

de emergencia en llegar a un

centro deportivo ubicado

afuera de la ciudad, entre

15.5 y 18.5 minutos es de

0.38292, lo que equivale al

38.29%.

Figura 17. Área bajo la curva normal estándar, ejemplo 29,

c).

Percentiles en una distribución normal

Para encontrar el p-enésimo percentil px en una distribución normal con

media y desviación estándar , primero se busca el percentil de una

1A

2A

0.38292

normal estándar pz y luego se relaciona con pp zx de modo que

se encuentra el percentil para px . Esta expresión convierte el percentil de

la normal estándar al percentil de una distribución normal con parámetros

y .

Ejemplo 1.8

Aun grupo de niños se les aplica una prueba de inteligencia, supóngase

que las puntuaciones se distribuyen en forma normal, la puntuación

promedio es 100 y la desviación estándar 15 . Si el 20% de los

niños están bajo este puntaje. ¿Cuál es este?

Solución.

Sea la variable aleatoria X= Las puntuaciones de la prueba de inteligencia

que se aplica a los niños. Puesto que X ~ N (100, 215 ), Por lo tanto:

Primero se localiza el percentil 0.20 aproximado a una normal con media

100 y desviación estándar 15 . Se averigua el valor de z que

corresponde a ese percentil, esto es: 20.0)15

100( 0

xZP esto es de la

tabla 1 se obtiene que 84.020 z

Si el 20% de los niños están bajo este puntaje, se ubica este porcentaje del

lado izquierdo de la curva, como lo muestra la figura 17. De ahí que en las

tabla 1, del anexo I, se busca el valor más cercano a 0.30, de adentro hacia

fuera. El cual se conforma por 84.020 z

Como se observa el área bajo la curva normal está entre 0 y 0.84, por lo

que X está a una distancia 84.0 de la media por lo que:

15

10084.0 0

x

, despejando 0x , se tiene: 4.8715)84.0(1000 x

Z .00 .01 .02 .03 .04 .05

0.

0

0.0000

0

0.0039

9

0.0079

8

0.0119

7

0.0159

5

0.0199

4

0.

1

0.0398

3

0.0438

0

0.0477

6

0.0517

2

0.0556

7

0.0596

2

0.

2

0.0792

6

0.0831

7

0.0870

6

0.0909

5

0.0948

3

0.0987

1

0.

3

0.1179

1

0.1217

2

0.1255

2

0.1293

0

0.1330

7

0.1368

3

0.

4

0.1554

2

0.1591

0

0.1627

6

0.1664

0

0.1700

3

0.1736

4

0.

5

0.1914

6

0.1949

7

0.1984

7

0.2019

4

0.2054

0

0.2088

4

0.

6

0.2257

5

0.2290

7

0.2323

7

0.2356

5

0.2389

1

0.2421

5

0.

7

0.2580

4

0.2611

5

0.2642

4

0.2673

0

0.2703

5

0.2733

7

0.

8

0.2881

4

0.2910

3

0.2938

9

0.2967

3

0.2995

5

0.3023

4

0.

9

0.3159

4

0.3185

9

0.3212

1

0.3238

1

0.3263

9

0.3289

4

Fig. 18. Área bajo la curva normal, ejemplo

30.

Sea 0x la puntuación buscada, ,20.0)( 0 xXP si estandarizamos

obtenemos:

20.015

1000

xZP , entonces 84.0

15

1000 x

y 874.870 x

Alrededor del 20% de los niños tienen un puntaje menor de 87.

Ejemplo 1.9

En una industria de dulces se envasan chocolates rellenos en frascos cuyos

pesos netos tienen distribución normal con desviación estándar de 6.50

gramos, Si el 5% de los frascos tiene un peso mayor que 160 gramos,

¿Cuál es el peso medio de ellos?

30%

50%

20%

Solución.

Dado que aproximadamente el 45% (se busca en la tablas 1, de adentro

hacia a fuera, el valor mas cercano a .45, es decir .44950, siendo

conformado por 64.10 Z ) de los frascos que pesan entre y 160 gramos,

como lo muestra la figura 18. El punto 160 se encuentra a una distancia de

1.64 de . Es decir: 50.6

16064.1

Por lo que hay que despejar a la .

34.149

66.10160

66.10160

66.10160

16066.10

16050.664.1

El peso promedio de los

frascos es de 149.34 gramos.

Fig. 19. Área bajo la curva normal, ejemplo 31.

Ejemplo 1.10

El tiempo que tardan los estudiantes del CCH Oriente, al hablar por

teléfono celular se distribuye normalmente.

a) Si al realizar una llamada, el 15% de los estudiantes excede de

30minutos hablando por celular y 6% de los estudiantes dura menos

de 5minunutos comunicándose por este medio. ¿Cuál es el valor

promedio y la desviación estándar, del tiempo que tardan hablando

por celular?

1.64

5%

160

64.1

45%

b) Si el tiempo promedio que tardan los estudiantes al hablar por

celular es de 18 minutos, considerando que estos se comunican

entre 14 y 22minutos, con una probabilidad del 95%, ¿Cuál es el

valor máximo de la desviación estándar?

Solución.

a) Dado que aproximadamente el 44% y el 35% de los estudiantes tardan

hablando por celular. Como lo muestra la figura 20.

(Se busca en la tablas 1, de adentro hacia a fuera, el valor mas cercano a

0.44 y 0.35, es decir 0.43943 y 0.34849 respectivamente, siendo

conformados por 55.11 Z , el signo menos índica que la puntuación Z se

encuentra a la izquierda de la media, 03.12 Z )

Por lo que:

3003.1

555.1

Fig. 20. Área bajo la curva normal, ejemplo 32

Tenemos un sistema de ecuaciones con las incógnitas y , el cual se

puede resolver por el método de sustitución, igualación, suma-resta o

determinantes. En este caso utilizaremos igualación.

6%

44%

30 03.1

5 55.1

1

2

35%

15%

55.1

5

555.1

03.1

30

3003.1

03.1

30

55.1

5

El valor promedio y la desviación estándar, del tiempo que tardan

hablando los estudiantes por celular es:

Minutos69.9

69.903.1

0193.2030

69.96898.955.1

0193.205

El valor promedio y la

desviación estándar, del

tiempo que tardan

hablando los estudiantes

por celular es

01.20 Minutos y

69.9 Minutos.

0193.20

58.2

65.51

58.265.51

55.103.15.4615.5

55.15.4603.115.5

)30(55.1)5(03.1

01.20 minutos y 69.9 minutos.

c) Como 95.0 z del área está dentro de 0z desviaciones estándar de

la

d) media. La mitad del área 4750.0

2

95.

quedara a la izquierda de la

media y la otra mitad hacia la derecha por que la distribución

normal es simétrica. Así, necesita el valor 0z a lo largo de las

abscisas que corresponde a un área igual a 0.4750 que corresponde a

96.10 z . Como lo muestra la figura 20.

Es decir:

181496.1

O bien:

182296.1

Fig. 21. Área bajo la curva normal, ejemplo 10.

En cual quiera de estos casos, hay que despejar la por lo que:

minutos

0408.2

96.1

1822

182296.1

minutos

Del tiempo que tardan hablando los estudiantes por celular, el valor de la

desviación estándar es 04.2 minutos.

95%

.4750

.4750

14

96.1

22

96.1

0408.2

96.1

1814

181496.1