catítulo v distribuciones continuas: · pdf filecuando estudiamos una variable continua...

27
Lidia Diblasi 131 CATÍTULO V DISTRIBUCIONES CONTINUAS: Distribución NORMAL En nuestra vida utilizamos muchas veces la palabra normal para decir por ejemplo que es “normal que los jóvenes ingresen a la universidad cuando tienen entre 18 y 19 años” o que es “normal que en Mendoza tengamos en verano temperaturas de alrededor de 30º” o que es “normal que una persona que mide 1,65 m tenga un peso de entre 55 y 60 kg”, etc por supuesto que no todo es tan simétrico y tenemos alumnos en la universidad que ingresan con edades mucho mayores a los 18 años, o que en verano la temperatura pueda llegar a 42 grados, o que una persona de 1,65 m pese 48 kg, etc Pero si es cierto que hay ciertas “medidas” que son normales por ser siempre las más comunes respecto al grupo de estudio. En Estadística podemos demostrar que la probabilidad de los casos extremos son bajas. Lo más común es encontrar la mayor cantidad de casos concentrada alrededor de los valores medios o las medidas de tendencia central. En estos casos estamos en presencia de una distribución que llamamos Normal. Es una curva teórica, suave, perfectamente simétrica que concentra la mayoría de los datos en el centro y que es unimodal. En el ejemplo siguiente podemos apreciar un modelo de distribución Normal que representa la edad de los niños que asisten a un comedor comunitario. Edad de niños aist entes a un comedor comunitario 12. 0 - 13. 0 11.0 - 12 .0 10. 0 - 11.0 9.0 - 10. 0 8.0 - 9. 0 7.0 - 8.0 6. 0 - 7. 0 5.0 - 6. 0 4.0 - 5. 0 3. 0 - 4.0 2.0 - 3. 0 1.0 - 2.0 7 6 5 4 3 2 1 0 Desv. típ. = 2.45 Media = 6.0 N = 36.00

Upload: tranliem

Post on 03-Feb-2018

217 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: CATÍTULO V DISTRIBUCIONES CONTINUAS: · PDF fileCuando estudiamos una variable continua deseamos saber la probabilidad de que “X” asuma valores dentro de un intervalo X a y X

Lidia Diblasi

131

CATÍTULO V

DISTRIBUCIONES CONTINUAS: Distribución NORMAL

En nuestra vida utilizamos muchas veces la palabra normal para decir por

ejemplo que es “normal que los jóvenes ingresen a la universidad cuando tienen

entre 18 y 19 años” o que es “normal que en Mendoza tengamos en verano

temperaturas de alrededor de 30º” o que es “normal que una persona que mide

1,65 m tenga un peso de entre 55 y 60 kg”, etc por supuesto que no todo es tan

simétrico y tenemos alumnos en la universidad que ingresan con edades mucho

mayores a los 18 años, o que en verano la temperatura pueda llegar a 42 grados,

o que una persona de 1,65 m pese 48 kg, etc

Pero si es cierto que hay ciertas “medidas” que son normales por ser

siempre las más comunes respecto al grupo de estudio. En Estadística podemos

demostrar que la probabilidad de los casos extremos son bajas. Lo más común es

encontrar la mayor cantidad de casos concentrada alrededor de los valores

medios o las medidas de tendencia central.

En estos casos estamos en presencia de una distribución que llamamos

Normal. Es una curva teórica, suave, perfectamente simétrica que concentra la

mayoría de los datos en el centro y que es unimodal.

En el ejemplo siguiente podemos apreciar un modelo de distribución Normal

que representa la edad de los niños que asisten a un comedor comunitario.

Edad de niños aist entes a un comedor comunitario

12.0 - 13.0

11.0 - 12.0

10.0 - 11.0

9.0 - 10.0

8.0 - 9.0

7.0 - 8.0

6.0 - 7.0

5.0 - 6.0

4.0 - 5.0

3.0 - 4.0

2.0 - 3.0

1.0 - 2.0

7

6

5

4

3

2

1

0

Desv. típ. = 2.45

Media = 6.0

N = 36.00

Page 2: CATÍTULO V DISTRIBUCIONES CONTINUAS: · PDF fileCuando estudiamos una variable continua deseamos saber la probabilidad de que “X” asuma valores dentro de un intervalo X a y X

Lidia Diblasi

132

Veamos cómo trabaja

Cuando estudiamos las variables discretas aprendimos a determinar la

probabilidad de que la variable aleatoria discreta “X” asuma un valor particular.

Cuando estudiamos una variable continua deseamos saber la probabilidad de que

“X” asuma valores dentro de un intervalo Xa y Xb, o la probabilidad de que “X” sea

mayor que Xb o menor que Xa.

Si recordamos el ejemplo de la edad de las mujeres al casarse, que vimos

en el capítulo III, podríamos averiguar la probabilidad del intervalo entre 25 y 29

años de edad, donde Xa = 25 y Xb = 29.

Hemos visto que las distribuciones de frecuencia y las distribuciones de

frecuencias relativas de variables continuas se construyen definiendo unos

intervalos de clase y determinando la frecuencia o frecuencia relativa con que las

observaciones quedan incluidas dentro de los intervalos de clase. Esto se puede

representar gráficamente por medio de histogramas o polígonos de frecuencia. El

área que queda comprendida bajo el histograma o el polígono de frecuencia entre

dos valores cualquiera por ejemplo: Xa y Xb de una variable aleatoria “X” es igual

a la frecuencia relativa de la ocurrencia de los valores de “X” entre Xa y Xb, en

nuestro ejemplo entre 25 y 29 años.

Sabemos que si los datos que disponemos son una muestra extraída de

una población, podemos interpretar estas frecuencias relativas como estimaciones

de las probabilidades verdaderas correspondientes. Podemos interpretar la

frecuencia relativa de que ocurran valores muestrales de “X” entre Xa y Xb

(inclusive), como una estimación de la P(Xa ≤ X ≤ Xb), es decir, de la probabilidad

de que “X” tome valores entre Xa (25) y Xb (29) (inclusive).

Intervalo xi fi fr 15 - 19 17 8 0.16 20 - 24 22 9 0.18 25 - 29 27 11 0.22 30 - 34 32 8 0.16 35 - 39 37 6 0.12 40 - 44 42 4 0.08 45 - 49 47 2 0.04

50 - 54 52 2 0.04

Page 3: CATÍTULO V DISTRIBUCIONES CONTINUAS: · PDF fileCuando estudiamos una variable continua deseamos saber la probabilidad de que “X” asuma valores dentro de un intervalo X a y X

Lidia Diblasi

133

Siguiendo el ejemplo podríamos decir, siguiendo las frecuencias relativas

que la probabilidad del intervalo entre 25 y 29 años es del 0,22 o del 22%.

Supongamos que tenemos una muestra de una variable aleatoria continua

“X”, hacemos el histograma correspondiente con frecuencias relativas. El área

sombreada se puede interpretar como la estimación de la probabilidad de que “X”

asuma valores entre Xa y Xb.

Si tenemos una muestra grande de valores de X y hacemos los intervalos

muy pequeños podemos obtener otro tipo de representación.

Page 4: CATÍTULO V DISTRIBUCIONES CONTINUAS: · PDF fileCuando estudiamos una variable continua deseamos saber la probabilidad de que “X” asuma valores dentro de un intervalo X a y X

Lidia Diblasi

134

A medida que crece el número de observaciones y disminuyen las

amplitudes de los intervalos de clase, el histograma se asemeja cada vez más a

una curva suave. El área comprendida bajo la curva y por encima del eje

horizontal y entre las perpendiculares que se levantan sobre los dos puntos a y b,

es igual a la probabilidad de que la variable aleatoria asuma los valores

comprendidos entre los dos puntos.

Lo que se está haciendo es determinar la probabilidad comprendida en un

intervalo. La razón es que para una variable continua p(X = x) = 0. O sea que la

probabilidad de que “X” asuma un valor específico es igual a cero. Lo que quiero

decir es que no podemos calcular el valor de un punto, sino el de un área o

intervalo, por pequeño que sea. Podemos ver en una curva que represente una

distribución de probabilidades continuas que el área que queda encima de un

punto es igual a cero.

Para calcular el área entre dos puntos ej. a y b, en una distribución de

probabilidades continuas necesitamos usar el cálculo integral. En el proceso de

integración, el cálculo integral utiliza una técnica matemática que es el límite de

una sumación. Así cuando uno emplea el cálculo integral para hallar el área bajo

una curva suave, en realidad está agregando áreas de rectángulos

infinitesimalmente pequeños (celdas).

Nosotros no vamos a usar el cálculo integral en ninguna distribución de

probabilidad continua, ya que las áreas bajo las curvas que tienen interés ya han

sido determinadas y tabuladas.

Distribución Normal:

Es una de las más importantes que se conocen. Su fórmula fue publicada

por primera vez por Abrahan Demoivre en 1733. Otros que figuran en su historia

son Pierre Simón, el Marqués de La Place (1749 – 1827) y Carl Gauss (1777 –

Page 5: CATÍTULO V DISTRIBUCIONES CONTINUAS: · PDF fileCuando estudiamos una variable continua deseamos saber la probabilidad de que “X” asuma valores dentro de un intervalo X a y X

Lidia Diblasi

135

1855), en cuyo honor se denomina a veces distribución de Gauss o campana de

Gauss.

La fórmula es:

-1/2 ( x - µ ) 2

1 σ

f(x) = e

σ 2 π

Donde: µ . media de la distribución

σ: la desviación típica de la distribución

π: la constante 3,14159...

e: la constante 2,71828...

Algunas características de la distribución normal:

1- es una distribución con forma de campana, perfectamente simétrica basada

en un número infinito de casos, por lo que sólo puede ser tratada de forma

aproximada, cuando trabajamos con datos reales.

2- al ser una distribución simétrica respecto de su media, el 50% del área está

a la derecha de la media y el 50 % a la izquierda.

3- la media (µ ó x ), la mediana (Me) y la moda (Mo) son iguales.

4- la distancia horizontal que hay desde el punto de inflexión de la curva (el

punto donde la curva deja de ser cóncava hacia abajo y empieza a ser

cóncava hacia arriba) hasta una perpendicular levantada sobre la media es

igual a la desviación típica.

Page 6: CATÍTULO V DISTRIBUCIONES CONTINUAS: · PDF fileCuando estudiamos una variable continua deseamos saber la probabilidad de que “X” asuma valores dentro de un intervalo X a y X

Lidia Diblasi

136

5- el área comprendida bajo la curva y por encima del eje horizontal es igual a

1, como suma de frecuencias relativas o como distribución de probabilidad.

6- la distribución normal es realmente una “familia” de distribuciones puesto

que existe una distribución diferente para cada valor de µµµµ y σσσσ. El valor de

µ sitúa a la distribución en el eje horizontal. Y el valor de σ nos dice que

cuanto más grande sea la desviación típica, más plana y extendida es la

gráfica de la distribución.

Ejemplo: tres distribuciones normales con distinta µµµµ e igual σσσσ.

Pensemos por ejemplo que tenemos el promedio de edad de tres grupos de

estudiantes de distinto niveles educativos: el primer grupo representan las edades

de alumnos de 7º año de la escuela primaria y su media es de 11,96 años; el

segundo grupo representa a alumnos de 5º año del nivel medio, su media es de

18,5 años y por último el tercer grupo representa a alumnos universitarios que

Page 7: CATÍTULO V DISTRIBUCIONES CONTINUAS: · PDF fileCuando estudiamos una variable continua deseamos saber la probabilidad de que “X” asuma valores dentro de un intervalo X a y X

Lidia Diblasi

137

llevan cinco años desde que comenzaron la carrera universitaria, su promedio de

edad es de 24,8 años. Todos los grupos son muy homogéneos en su

conformación y tienen una desviación típica aproximada de 1,5 años

Ejemplo: tres distribuciones normales con igual µµµµ y distinta σσσσ.

También podemos pensar en grupos que coinciden en la edad promedio

pero que son muy heterogéneos en su conformación y tienen desviaciones típicas

muy distintas que hacen que su representación adquiera diversa forma por su

variabilidad.

7- la curva de la distribución normal se extiende desde - ∞∞∞∞ a + ∞∞∞∞ sin cortar

nunca el eje de las x o el eje horizontal.

8- si levantamos perpendiculares a una distancia de una desviación típica de la

media en cada uno de los dos lados, el área comprendida entre estas dos

perpendiculares, la curva y el eje horizontal es igual aproximadamente a 0,6826 o

Page 8: CATÍTULO V DISTRIBUCIONES CONTINUAS: · PDF fileCuando estudiamos una variable continua deseamos saber la probabilidad de que “X” asuma valores dentro de un intervalo X a y X

Lidia Diblasi

138

sea el 68,26 % del área total. De la misma forma podemos encerrar el 95 %,

levantando perpendiculares a dos desvíos de la media y para ambos lados.

Podemos encerrar aproximadamente el 99,7 % del área total, levantando

perpendiculares a una distancia de tres desviaciones estándar desde la media en

cada uno de los dos lados. Dicho de otro modo, si nos apartamos uno, dos o tres

desvío de la media hacia ambos lados vamos a obtener el 68, el 95 y el 99 % de

los casos de la distribución, aún en distribuciones levemente asimétricas.

La distribución normal estandarizada:

Page 9: CATÍTULO V DISTRIBUCIONES CONTINUAS: · PDF fileCuando estudiamos una variable continua deseamos saber la probabilidad de que “X” asuma valores dentro de un intervalo X a y X

Lidia Diblasi

139

Dijimos que hay una distribución normal diferente para cada valor diferente

de media y desvío poblacional: µµµµ y σσσσ. De ahí que es muy importante una

distribución normal que se llama distribución normal estandarizada que tiene

media µµµµ = 0 y σσσσ = 1 (varianza), y todas sus áreas se encuentran tabuladas.

En esta tabla podemos encontrar cualquier valor entre 0 y zi, o sea

cualquier valor entre la media y un valor determinado de la variable aleatoria Z que

está normalmente distribuida con media 0 y varianza 1.(Ver tabla Distribución

Normal en Anexos Tablas)

Aplicaciones de la distribución normal:

Como ya dijimos, es muy poco probable que en la realidad encontremos

variables aleatorias que se distribuyen normalmente con exactitud, porque la

distribución normal es un ideal matemático. Pero sí muchas variables aleatorias

continuas pueden caracterizarse mediante una distribución normal.

Cuando en una investigación la variable de interés está normalmente

distribuida por lo menos de manera aproximada, utilizamos en su análisis el

conocimiento que tenemos de la distribución normal. Con la distribución normal

estandarizada, podemos responder preguntas de probabilidad en relación a una

variable aleatoria “X” que está normalmente distribuida por lo menos de manera

aproximada. Por ejemplo podríamos desear saber la probabilidad de que alguna

variable aleatoria “X” distribuida normalmente en forma aproximada, con media µ

y desviación típica σ asuma valores comprendidos entre Xa y Xb. Para obtener

dichas probabilidades transformamos la variable “X” con media µ y varianza σ en

la variable normal estándar “Z” con media 0 y varianza 1, por medio de la fórmula:

Xi - µµµµ

Z = σσσσ

Page 10: CATÍTULO V DISTRIBUCIONES CONTINUAS: · PDF fileCuando estudiamos una variable continua deseamos saber la probabilidad de que “X” asuma valores dentro de un intervalo X a y X

Lidia Diblasi

140

Mediante esta fórmula cualquier valor xi de la variable aleatoria “X” se

transforma en un valor z de la variable normal estandarizada “Z”. Una vez que

hallamos hecho estas transformaciones podemos utilizar la tabla para hallar las

probabilidades de interés.

Los valores de la variable Z representan unidades de desvíos respecto a la

media.

Veamos un ejemplo:

Supongamos que queremos encontrar el área bajo la curva de la normal o

la probabilidad entre dos valores de una variable X: definida como “cantidad de

horas de estudios mensuales” xa y xb, donde:

Xa = 105 horas de estudio

Xb = 115 horas de estudio

La media de esta variable aleatoria “X” es µ = 100 y σ = 10, entonces, si pasamos

estos valores de X a Z mediante la fórmula tenemos:

Page 11: CATÍTULO V DISTRIBUCIONES CONTINUAS: · PDF fileCuando estudiamos una variable continua deseamos saber la probabilidad de que “X” asuma valores dentro de un intervalo X a y X

Lidia Diblasi

141

Xa Za = 5,010

100105=

Xb Zb = 5,110

100115=

P (105 ≤ x ≤ 115) = P

−≤≤

−10

100115

10

100105Z

P ( 5,15,0 ≤≤ Z )

Page 12: CATÍTULO V DISTRIBUCIONES CONTINUAS: · PDF fileCuando estudiamos una variable continua deseamos saber la probabilidad de que “X” asuma valores dentro de un intervalo X a y X

Lidia Diblasi

142

Si buscamos en la tabla de la distribución Normal los valores de

probabilidad acumulada correspondiente al valor de Z = 0,5 y el de Z = 1,5,

obtenemos los siguientes resultados:

Z = 0,5 0,1915 F(x1) área entre 0 y 0,5

Z = 1,5 0,4332 F(x2) área entre 0 y 1,5

= F(x2) – F(x1)

= 0,4332 – 0,1915

P (105 ≤≤≤≤ x ≤≤≤≤ 115) = 0,2417

Podemos decir entonces que la probabilidad de encontrar alumnos universitarios

que estudien entre 105 y 115 es de 0,2417 o del 24 %. O más simple que el 24 %

de los estudiantes consultados estudian 105 y 115 horas mensuales, lo que

representa entre 3,5 y 3,8 horas diarias.

Cómo usamos la tabla de Probabilidades Normales.

Veamos algunos ejemplos

Vamos a trabajar con los resultados de una encuesta realizada a los

alumnos ingresantes a primer año de la facultad de Ciencias Políticas y Sociales

de la UNCuyo para determinar el perfil del ingresante. A la pregunta “cuántas

horas de estudio semanal considerás que deberías dedicarle al estudio en la

universidad independiente de las horas de clase” la respuesta generó una

distribución aproximadamente normal con media 22 horas y un desvío de 6,5 hs.

Caso 1

Queremos calcular la probabilidad de encontrar alumnos que estudien entre 15,5

hs y 28,5 hs.

P (15,5 ≤ x ≤ 28,5) = P

−≤≤

−5.6

225.28

5.6

225,15Z

Page 13: CATÍTULO V DISTRIBUCIONES CONTINUAS: · PDF fileCuando estudiamos una variable continua deseamos saber la probabilidad de que “X” asuma valores dentro de un intervalo X a y X

Lidia Diblasi

143

P ( 11 ≤≤− Z )

El área de la variable X:”horas de estudio” entre 15,5 y 28,5 se corresponde con el

área de la variable Z entre -1 y 1. Lo que nos está indicando que el área que

estamos buscando se encuentra a un desvío en más y en menos de la media.

Vamos a buscar en la tabla de las probabilidades de la distribución Normal a qué

probabilidad corresponde el área entre -1 y 1.

En la tabla aparecen en la primera columna el entero y el primer decimal

de los valores de Z y en la primera fila el segundo decimal. Los valores que nos

proporciona la tabla son probabilidades acumuladas, desde el valor 0 hasta el

0,50, o la mitad de la distribución para valores positivos de Z.

Si observamos en tabla el valor 1,00 corresponde al valor 0,3413 y como la

distribución normal es perfectamente simétrica, el área entre 0 y 1 es igual al área

entre 0 y -1, por lo tanto esta área también vale 0,3413.

15,5 22 28,5 X

-1 0 1 Z

0,34,13 + 0,3413

Por lo tanto todo el área entre -1 y 1 es igual a la suma de ambas:

Page 14: CATÍTULO V DISTRIBUCIONES CONTINUAS: · PDF fileCuando estudiamos una variable continua deseamos saber la probabilidad de que “X” asuma valores dentro de un intervalo X a y X

Lidia Diblasi

144

(-1 ≤ Z ≤ 1) = 0,3413 + 0,3413

= 0,6826

Por lo que podemos concluir que la probabilidad de encontrar alumnos de este

grupo que estudien entre 15,5 y 28,5 horas semanales es de 0,6826 o del 68,26%

O bien podríamos decir que el 68% estudian entre 2 y 4 horas diarias

aproximadamente.

Caso II

Siguiendo el mismo ejemplo queremos calcular la probabilidad de aquellos

alumnos que estudian más de 30 hs semanales.

P (X ≥ 30) = P

−≥

5,6

2230Z

El área que encontramos en la tabla corresponde al valor de z de o a 1,23 =

0,3907 pero la probabilidad que nosotros buscamos es el de los valores mayores

o iguales a 1,23, por lo tanto como sabemos que la mitad de la distribución, de 0 a

infinito, es igual a 0,50 a éste valor debemos restarle 0,3907, para obtener la

probabilidad buscada:

22 30 X

0 1,23 Z

0,3907

0,50

Page 15: CATÍTULO V DISTRIBUCIONES CONTINUAS: · PDF fileCuando estudiamos una variable continua deseamos saber la probabilidad de que “X” asuma valores dentro de un intervalo X a y X

Lidia Diblasi

145

P (Z ≥ 1,23) = 0,50 – 0,3907

= 0,1093

Por lo que podemos concluir que la probabilidad de encontrar alumnos que

estudien 30 o más horas semanales es de 0,1093 o del 10,93% o del 11%

aproximadamente.

Caso III

Siguiendo el mismo ejemplo supongamos que queremos calcular la probabilidad

de aquellos alumnos que estudian menos de 30 hs semanales.

P (X ≤ 30) = P

−≤

5,6

2230Z

a- Como sabemos por el caso II que los alumnos que estudian 30 o más horas es

de 0,1093 y también sabemos por las propiedades de la distribución normal que

toda el área debajo de la curva vale 1, podemos calcular el área propuesta

haciendo:

1- F(x ≥ 30) = 1 – 0,1093

= 0,8907

Por lo que podemos concluir que la probabilidad de encontrar alumnos que

estudien hasta 30 horas semanales es del 89 %.

b- en el caso que no hubiéramos calculado la probabilidad de los que estudian

más de treinta horas, podemos calcular la probabilidad de la siguiente forma:

P (X ≤ 30) = P

−≤

5,6

2230Z

Z = 1,23 → 0,3907

Page 16: CATÍTULO V DISTRIBUCIONES CONTINUAS: · PDF fileCuando estudiamos una variable continua deseamos saber la probabilidad de que “X” asuma valores dentro de un intervalo X a y X

Lidia Diblasi

146

22 30 X

0 1,23 Z

Sabemos que el área entre 0 y 1,23 es igual a 0,3907. A ésta área debemos

agregarle o sumarle todos aquellos que estudian menos de Z = 0, el área de

- ∞ a 0 que sabemos que vale 0,50, ya que es la mitad de la distribución, por lo

que el área total que buscamos es igual a:

0,50 + 0,3907 = 0,8907

Por lo que llegamos a la misma conclusión: los alumnos que estudian menos de

30 hs semanales representan el 89% de la distribución.

Si la muestra de alumnos consultados fuera de n = 200, podríamos calcular

cuántos son los que estudian menos de 30 horas semanales:

200 * 0,89 = 178

De un total de 200 alumnos los que estudian hasta 30 horas semanales son 178.

Caso IV

Supongamos que ahora queremos averiguar cual es la probabilidad de seleccionar

alumnos que estudien entre 25 y 30 horas semanales:

Page 17: CATÍTULO V DISTRIBUCIONES CONTINUAS: · PDF fileCuando estudiamos una variable continua deseamos saber la probabilidad de que “X” asuma valores dentro de un intervalo X a y X

Lidia Diblasi

147

P (25 ≤ x ≤ 30) = P

−≤≤

−5.6

2230

5.6

2225Z

P ( 23,146,0 ≤≤ Z )

↓ ↓

0,1772 0,3907

El área entre 0 y 0,46 = 0,1772

Y el área entre 0 y 1,23 = 0,3907

22 25 30 X

0 0,46 1,23 Z

0,1772

0,3907

Si sólo queremos saber la probabilidad o el área entre 0,46 y 1,23 y como la tabla

nos da las probabilidades acumuladas a partir de la media en Z = 0, el área entre

0 y 0,46 está contenida en el área entre 0 y 1,23, por lo que debemos hacer la

siguiente operación:

0,3907 – 0,1772 = 0,2135

Podemos concluir entonces que los alumnos que estudian entre 25 y 30 hs

semanales representan el 21,35 %

Page 18: CATÍTULO V DISTRIBUCIONES CONTINUAS: · PDF fileCuando estudiamos una variable continua deseamos saber la probabilidad de que “X” asuma valores dentro de un intervalo X a y X

Lidia Diblasi

148

Caso V

Siguiendo el mismo ejemplo supongamos que queremos calcular la probabilidad

de aquellos alumnos que estudian más de 20 hs. semanales.

P (X ≥ 20) = P

−≥

5,6

2220Z

Z ≥ -0,31 → 0,1217 la probabilidad del área entre 0 y -0,31 es de 0, 1217 a la cual

debemos sumarle la probabilidad de los que estudian entre la media e infinito:

0 a ∞ que igual a 0,50, por lo que el resultado sería:

20 22 X

-0,31 0 Z

0,1217

0,50

0,1217 + 0,50 = 0,6215

Podemos decir que los alumnos que estudian 20 o más horas semanales tienen

una probabilidad de ser seleccionados de 0,6215 o de algo más del 62%.

Page 19: CATÍTULO V DISTRIBUCIONES CONTINUAS: · PDF fileCuando estudiamos una variable continua deseamos saber la probabilidad de que “X” asuma valores dentro de un intervalo X a y X

Lidia Diblasi

149

Caso VI

a- Supongamos que queremos saber ahora a cuántos desvíos de la media está el

80% de la distribución, o dicho de otra forma cuánto valen Z1 y Z2. Si distribuimos

el 80% a ambos lados de la media nos quedan dos áreas de 40% de los casos,

una de los menores que la media y otra de los mayores.

Ahora vamos a cambiar la forma de buscar en la tabla de la distribución normal.

En vez de buscar los valores de probabilidad, conocido un valor de Z, en la

primera columna y en la primera fila, como hemos hecho en los casos anteriores;

dado que lo que conocemos es el valor de la probabilidad y que lo que queremos

conocer es el valor de Z, buscamos en el interior de la tabla el valor que más se

aproxime a 0,40, una vez localizado, recorremos el camino inverso; observamos

en la primera columna y en la primera fila a qué valor de Z corresponde:

El área del 40% menor y mayor que la media corresponde al valor de Z = ± 1,28

-1,28 0 1,28 Z

0,40 0,40

Podríamos decir entonces que el área del 80% se encuentra a ± 1,28 desvíos de

la media

Page 20: CATÍTULO V DISTRIBUCIONES CONTINUAS: · PDF fileCuando estudiamos una variable continua deseamos saber la probabilidad de que “X” asuma valores dentro de un intervalo X a y X

Lidia Diblasi

150

b- supongamos que queremos averiguar a cuántos desvíos de la media se

encuentra el área del 95%. Realizamos el mismo procedimiento, repartimos

equitativamente 0,95 en dos lo cual nos da 0,475; buscamos este valor en el

interior de la tabla:

-1,96 0 1,96 Z

0,475 0,475

El área del 95% se encuentra entre los valores de Z = ± 1,96, o bien a 1,96

desvíos de la media.

Caso VII

Otra forma de usar la tabla de la distribución normal es para resolver problemas

como el siguiente:

a- Cuántas horas por semana estudia el 5% de los que menos estudian?

Usando la misma fórmula que hemos utilizado para estandarizar la variable x a Z

podemos resolver este ejercicio. La incógnita ahora es un valor de la variable y no

una probabilidad:

σxxi

Z−

=

Page 21: CATÍTULO V DISTRIBUCIONES CONTINUAS: · PDF fileCuando estudiamos una variable continua deseamos saber la probabilidad de que “X” asuma valores dentro de un intervalo X a y X

Lidia Diblasi

151

Conocemos el valor de la media x = 22, el valor del desvío σ = 6,5 y podemos,

con lo que hemos visto en los casos anteriores, conocer el valor de Z para el área

0,05 o del 5%, entonces despejamos Xi que es nuestra incógnita y nos queda:

xi = Z * σ + x

xi = -1,65 * 6,5 + 22

xi = -10,725 + 22

xi = 11,275 hs

Podemos concluir que el 5% que menos estudia, estudia 11 horas semanales o

menos.

b- si nos hubieran preguntado por el 5% que más estudia, cuántas horas lo hace,

hacemos exactamente el mismo procedimiento, lo único que va a cambiar es el

signo correspondiente al valor de Z.

xi = Z * σ + x

xi = 1,65 * 6,5 + 22

xi = 10,725 + 22

xi = 32,725 hs.

Podemos decir que el 5% que más estudia, estudia 33 hs o más

Aproximación normal de la binomial

La distribución normal proporciona una buena aproximación de la

distribución binomial cuando “n” es grande y “p” no está demasiado cerca de 0 ó 1.

Para utilizar la aproximación normal hacemos µ = n.p ; σ = √ n.p.q y

convertimos los valores de la variable original en valores z, para hallar las

probabilidades que nos interesan. Cuando el tamaño de la muestra que se va a

analizar no es uno de los valores de “n” que figuran en las tablas binomiales

disponibles, la aproximación normal a la binomial proporciona una alternativa

conveniente, mientras más cerca esté P (probabilidad de éxito), de 0,5..

Como la distribución normal es una distribución de probabilidades para

variables continuas y la binomial es una distribución de probabilidades para

Page 22: CATÍTULO V DISTRIBUCIONES CONTINUAS: · PDF fileCuando estudiamos una variable continua deseamos saber la probabilidad de que “X” asuma valores dentro de un intervalo X a y X

Lidia Diblasi

152

variables discretas, podemos obtener mejores resultados si hacemos un ajuste en

que se tenga en cuenta este hecho cuando utilicemos la aproximación. Este

ajuste, denominado corrección de continuidad, se puede comprender mejor

observando un histograma construido con datos binomiales y con una curva suave

superpuesta.

Ejemplo:

Vamos a calcular:

para n= 20 y p = 0,3

a- P(x = 8) usando probabilidades binomiales

b- P (7,5 ≤ X ≤ 8,5) usando aproximación normal

(b) P (7,5 ≤ X ≤ 8,5) usando probabilidades normales

Page 23: CATÍTULO V DISTRIBUCIONES CONTINUAS: · PDF fileCuando estudiamos una variable continua deseamos saber la probabilidad de que “X” asuma valores dentro de un intervalo X a y X

Lidia Diblasi

153

Cuando utilizamos la aproximación normal de la binomial debemos tener en

cuenta el hecho de que para la binomial P(X=x) es el área del rectángulo centrada

en X. Cuando convertimos valores de “x” en valores de “Z” la corrección de

continuidad consiste en sumar 0,5 a y/o restar 0,5 de x según sea conveniente.

Ejemplo:

P(Xa ≤ X ≤ Xb) P ( 7,5 ≤ X ≤ 8,5)

Recordemos que en la binomial, la E(X) = x = n.p y la D(X) = σ = qpn .. ,

entonces:

Z = qpn

pnX

..

.−

Za = 7.0.3.0.20

3.0.205.7 − =

05.2

5.1 = 0,73

Zb = 7.0.3.0.20

3.0.205.8 − =

05.2

5.2 = 1,22

Buscamos entonces en la tabla de la distribución normal las áreas de Z = 0,73 y Z

= 1,22 y obtenemos la probabilidad de esa área, haciendo F(x2) – F(x1) entonces

tenemos: 0,8888 – 0,7673 = 0,1215.

Podemos concluir que como variable discreta, utilizando la distribución

binomial, la probabilidad de X=8 es 0,1144 o el 11,44%. Si utilizamos la

distribución normal, con la corrección por continuidad, para el cálculo del área

entre 7,5 a 8,5, la probabilidad es de 0,1215 o del 12,15%.

Page 24: CATÍTULO V DISTRIBUCIONES CONTINUAS: · PDF fileCuando estudiamos una variable continua deseamos saber la probabilidad de que “X” asuma valores dentro de un intervalo X a y X

Lidia Diblasi

154

Ejercicios propuestos:

I- Distribución Normal

En todos los casos grafique e interprete los resultados

1-Suponiendo que el tiempo que tardan los asistentes a un Centro de Salud en ser

atendidos sigue una distribución normal, con media de 15 minutos y desvío típico de 5

min. ¿cuál es la probabilidad de:

a- que una persona sea atendida habiendo esperado entre 20 y 25 minutos

b- que sea atendida habiendo esperado más de 10 minutos.

c - cuánto tiempo esperó el 10 % de los que menos esperaron

2- Un trabajador social ha realizado un seguimiento sobre la edad de las personas

internadas en hospitales públicos, encontrando que es una variable normalmente

distribuida con una media de 48 años y una desviación de 4 años. Si se toma una persona

al azar de esta población. ¿Cuál es la probabilidad de que tenga:

a) Más de 45 años P ( X > 45 )

b) Entre 49 y 51 años P (49 < X < 51 )

c) 40 años o menos P ( X < 40)

3- El consumo mensual de alimentos perecederos por familia de cuatro miembros, es de

30 kg semanales, con un desvío típico de 5 kg. Se supone que éste consumo sigue una

distribución normal. ¿Cuál es la probabilidad de que al seleccionar una familia al azar

consuma:

a) entre 25 y 35 kg mensuales?

b) menos de 25 kg y más de 35 kg?

c) más de 23 kg?

4-El peso de las personas por grupos de edad sigue una distribución Normal. Se toma

una muestra de mujeres mayores de 55 años y se obtiene un peso promedio de 60 kg,

con un desvío tipo de 6 kg. Si se selecciona al azar una mujer de éste grupo, cuál es la

probabilidad de:

Page 25: CATÍTULO V DISTRIBUCIONES CONTINUAS: · PDF fileCuando estudiamos una variable continua deseamos saber la probabilidad de que “X” asuma valores dentro de un intervalo X a y X

Lidia Diblasi

155

a) que pese entre 50 y 60 kg,

b) que pese más de 56 kg,

c) Calcule cuánto pesa el 5% que más pesa..

5- Explique qué es la distribución Normal, dibújela y diga cuáles son sus principales

propiedades y diga qué significan.

6- El puntaje promedio de los parciales de los estudiantes de 3º año de una cátedra de

Estadística Aplicada es de 7,8 puntos con un desvío de 1.5 puntos. Si los puntajes de

distribuyen normalmente, calcule la probabilidad de escoger al azar:

a) alumnos que tengan un promedio superior a 8 puntos

b) entre 6 y 7 puntos.

c) menos de 5,5 puntos

d) diga qué puntaje obtuvo el 3 % de los que menos puntos sacó.

e) ¿a cuántos desvíos de la media se encuentra el 85% de la distribución de los puntos ?

.

7- La estatura de las personas, al igual que el peso, por grupos de edad sigue una

distribución Normal. Se tomó una muestra de 120 jóvenes universitarios de ambos sexos

y se obtuvo una estatura promedio de 170 cm con un desvío típico de 15cm, calcular:

a) cuál es la probabilidad de encontrar jóvenes que tengan una estatura entre 175 y 180

cm?

b) y entre 160 y 165 cm?

c) cuántos jóvenes hay en cada uno de los segmentos anteriores?

d) cuántos jóvenes se encuentran a dos desvíos de la media?

8- Dada una distribución Normal estandarizada, diga:

a) a cuántas unidades de desvíos se encuentra el 60 % central de la distribución?

b) a cuántas el 90 %?

c) a cuántas el 95%?

d) a cuántas el 99%?

Page 26: CATÍTULO V DISTRIBUCIONES CONTINUAS: · PDF fileCuando estudiamos una variable continua deseamos saber la probabilidad de que “X” asuma valores dentro de un intervalo X a y X

Lidia Diblasi

156

II- Resolver por Binomial y Normal

Interprete y grafique los resultados

1-Se sabe que el 40% de las familias de una población no tiene cobertura médica. Se

toma una muestra de 30 familias al azar en una comunidad muy heterogénea, cuál es la

probabilidad de que entre 10 y 12 no tengan cobertura médica. Resuelva:

a) Binomial

b) Normal

2- Según un estudio realizado por una consultora la probabildad de encontrar gente que

no tiene claro qué debe votar en las próximas elecciones es del 0,70. Calcular la

probabilidad de que al seleccionar una muestra de 30 personas que estén en condiciones

de votar, encontremos a 20 o más en estas condiciones. Resuelva, utilizando las tablas

correspondientes, de ser posible, por:

a) Binomial

b) Normal

3- Se toma una muestra de mujeres jefas de hogar para analizar si trabajan fuera del

hogar, en relación de dependencia. En la muestra el 58 % se encontraba en esas

condiciones. Cuál es la probabilidad que al seleccionar al azar una muestra de 20 mujeres

al menos 15 trabajen fuera del hogar en relación de dependencia. Resuelva, usando las

tablas, de ser posible, por:

a) Binomial

b) Normal

4- Suponiendo que en un Centro de Salud son atendidos diariamente 15 niños de cada

veinte personas atendidas ¿cuál es la probabilidad de que de una muestra de 30

personas sean atendidos exactamente 20 niños. Resuelva, de ser posible, por:

a) Binomial

b) Normal.

Page 27: CATÍTULO V DISTRIBUCIONES CONTINUAS: · PDF fileCuando estudiamos una variable continua deseamos saber la probabilidad de que “X” asuma valores dentro de un intervalo X a y X

Lidia Diblasi

157

Bibliografía consultada:

Blanch, Nidia y Joekes, Silvia: “Estadística Aplicada a la Investigación” Nódulo 7

Curso de posgrado; Fac. de Ciencias económicas, Universidad Nacional de

Córdoba, 1994

Canavos, George, C. “Probabilidad y Estadística. Aplicaciones y Métodos”

McGraw Hill, México, 1990

Chao, Linconln, “Estadística para las Ciencias Administrativas”, Ed. Mc Graw Hill,

1978.

DANIEL, Wayne, “Estadística con aplicaciones a las Ciencias Sociales y a la

Educación”, Ed. Nc Graw Hill, 1981.

GARCÏA FERRANDO, Manuel, “Introducción a la Estadística en Sociología”,

Alianza Editorial, 1992.

Hopkins, kenneth; Hopkins, B.R.; Glass, Gene: “Estadística básica para las

Ciencias Sociales y del Comportamiento” Prentice-Hall Hispanoamérica, S.A.,

México, 1997

LEVIN, Jack, “Fundamentos de Estadística en la Investigación Social”, Ed. Harla,

1977.

KREYSZIG, Erwin, “Introducción a la Estadística matemática”. Ed Limusa – Wiley,

S:A:, México, 1973.

SPIEGEL, Murray, “Teoría y Problemas de Estadística”, Serie de compendios

Shawn, Ed. Mc Graw Hill.

Spiegel, Murray, " Estadística", Serie de Compendios Shawn, Mc Graw Hill

Interamericana de México S.A.,1994