estadistica y probabilidades cap vii

52
VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

Upload: richard-huaman-durand

Post on 14-Jul-2015

1.412 views

Category:

Education


0 download

TRANSCRIPT

Page 1: Estadistica y probabilidades cap VII

VARIABLES ALEATORIAS Y DISTRIBUCIONES DE

PROBABILIDAD

Page 2: Estadistica y probabilidades cap VII

VARIABLE ALEATORIA

Una variable aleatoria se define asignando un valor numérico a cada suceso simple de un experimento que conduzca a resultados aleatorios.

VARIABLES ALEATORIAS DISCRETAS

VARIABLES ALEATORIAS CONTINUAS

Una variable aleatoria discreta es una variable que puede tomar solo valores de un conjunto predeterminado

Una variable aleatoria continua se mide en una escala numérica. Cada observación de la variable aleatoria puede tomar cualquier

valor dentro de un rango específico

Page 3: Estadistica y probabilidades cap VII

Las distribuciones de probabilidad son idealizaciones de los polígonos de frecuencias.

Las DP de variable continua se definen mediante una función y=f(x) llamada función de probabilidad o función de densidad. La probabilidad viene dada por el área bajo la curva, por lo que: •El área encerrada bajo la totalidad de la curva es 1. •Para obtener la probabilidad P(a≤X≤b) obtenemos la proporción de área que hay bajo la curva desde a hasta b. •La probabilidad de sucesos puntuales es 0, P(X=a)=0

Distribución de Probabilidad

Page 4: Estadistica y probabilidades cap VII

Empleados ausentespor día, x

Numero de días,

ni

Probabilidad, P(x)

12345678

1825394627252210

0.0850.1180.1840.2170.1270.1180.1040.047

212 1.000

Ejemplo

1 2 3 4 5 6 7 8

Número de días, x

P(x)

Page 5: Estadistica y probabilidades cap VII

Parámetros en una distribución de probabilidadPor analogía con las variables estadísticas podemos definir también aquí la media µ y la desviación típica σ de la variable aleatoria.

•La media µ , también llamada esperanza matemática, es un valor representativo de todos los valores que toma la variable aleatoria X, lo podemos imaginar como el punto sobre el eje de abscisas donde al poner una cuña la figura plana definida por la función de densidad quedará en equilibrio. Para calcularla hemos de hacer:

•La desviación típica σ es una medida de la dispersión de los valores que toma la variable aleatoria de la media. Como ocurría con las variables estadísticas la desviación típica será más pequeña o más grande según la gráfica de la función de densidad sea más estrecha o más ancha en torno a la media. En este caso se calcula:

Page 6: Estadistica y probabilidades cap VII

Ejemplo: Al lanzar dos dados la suma de ambos puede asumir 11 valores diferentes en 36 puntos muestrales

En este caso vemos que la distribución de p(x) obtenida es simétrica.

Para el caso de 1 solo dado, donde todos los valores tienen la misma probabilidad de salir (1/6), obtendríamos una

distribución uniforme

Page 7: Estadistica y probabilidades cap VII

Supongamos que un experimento aleatorio tiene las siguientes

características:

•En cada prueba del experimento sólo son posibles dos

resultados: el suceso A (éxito) y su contrario A’ (fracaso).

•El resultado obtenido en cada prueba es independiente de los

resultados obtenidos anteriormente.

•La probabilidad del suceso A es constante, la representamos

por p, y no varía de una prueba a otra. La probabilidad de A’

es 1- p y la representamos por q .

El experimento consta de un número n de pruebas.

Distribución Binomial

Todo experimento que tenga estas características diremos que sigue el modelo de la distribución Binomial. A la variable X que expresa el número de éxitos obtenidos en cada prueba del experimento, la llamaremos variable aleatoria binomial.

Page 8: Estadistica y probabilidades cap VII

Función de probabilidad de la distribución Binomialo también denominada función de la distribución de Bernoulli (para n=1).

Verificándose: 0 ≤ p ≤ 1

Distribución BinomialLa variable binomial es una variable aleatoria discreta, sólo puede tomar los valores 0, 1, 2, 3, 4, ..., n suponiendo que se han realizado n pruebas.Como hay que considerar todas las maneras posibles de obtener k-éxitos y (n-k) fracasos debemos calcular éstas por combinaciones (número combinatorio n sobre k).

Se suele representar por B(n,p) siendo n y p los parámetros de dicha distribución.

Probabilidad de obtener K éxitos

qpknk

k

nkXp

−••

== )(

Page 9: Estadistica y probabilidades cap VII

Parámetros de la Distribución Binomial

Distribución Binomial

Función de Distribución de la variable aleatoria Binomial

Esta función de distribución proporciona, para cada número real xi, la probabilidad

de que la variable X tome valores menores o iguales que xi.

Siendo K el mayor número entero menor o igual a xi

qpqpqpknknn

k

nnnxXpxF

−−••

++••

+••

=≤= ....

10)()(

110

11

Page 10: Estadistica y probabilidades cap VII

Resumen Distribución Binomial

Distribución Binomial

Sea X una variable aleatoria discreta correspondiente a una distribución binomial.

xnx

xnx

qpxxn

npnxP

ppxxn

npnxP

−=

−−

=

!)!(

!),;(

)1(!)!(

!),;(

Page 11: Estadistica y probabilidades cap VII
Page 12: Estadistica y probabilidades cap VII

Distribución BinomialEjemplo La probabilidad de éxito de una determinada vacuna es 0.72. Calcula la probabilidad de a que una vez administrada a 15 pacientes:a) Ninguno sufra la enfermedadb) Todos sufran la enfermedadc) Dos de ellos contraigan la enfermedadSolución :Se trata de una distribución binomial de parámetros B(15, 0.72)

Page 13: Estadistica y probabilidades cap VII

Distribución de PoissonEsta distribución aparece en algunos procesos que tienen una dimensión temporal o espacial, y en fenomenos que tienen un alto número de experimentos (alto n) y una baja probabilidad de que ocurran (baja p).Ejemplos:• número de llamadas telefónicas que recibe un servicio de atención a urgencias durante un intervalo de tiempo determinado•número de cultivos infectados por una plaga en una cierta región geográfica

La función de probabilidad de una variable aleatoria de Poisson con media λ > 0, que simplificamos con la notación P(λ), es

siendo su función de distribución el sumatorio de cada uno de los valores menores.La media y varianza de X son ambas iguales a λ ,

E[X] = V[X] = λ .

Page 14: Estadistica y probabilidades cap VII

Distribución de Poisson

EjemploEl número de enfermos que solicitan atención de urgencia en un hospital durante un periodo de 24 horas tiene una media de m = 43.2 pacientes. Unas obras en las instalaciones mermarán las capacidades de atención del servicio, el cual se sabe que colapsará si el número de enfermos excede de 50. ¿Cual es la probabilidad de que colapse el servicio de urgencias del hospital?

Bajo las condiciones del modelo de Poisson, se trata de una distribución P(43.2). La probabilidad solicitada es

P(X > 50) = 1 – P(X <= 50) = 1 - F(50) = 0.13.

El responsable del servicio deberá valorar si esta probabilidad es lo suficientemente alta como para reforzar la atención de urgencias con más efectivos, materiales, espacios, etc.

Page 15: Estadistica y probabilidades cap VII

Distribución de PoissonEjemploCierta enfermedad tiene una probabilidad muy baja de ocurrir, p=1/100.000. Calcular la probabilidad de que en una ciudad con 500.000 habitantes haya más de 3 personas con dicha enfermedad.Calcular el número esperado de habitantes que la padecen.

Consideramos la v.a. X que contabiliza el número de personas que padecen la enfermedad, es claro que sigue un modelo binomial, pero que puede ser muy bien aproximado por un modelo de Poisson, de modo que

Así el número esperado de personas que padecen la enfermedad es

Existe una gran dispersión, y no sería extraño encontrar que en realidad hay muchas más personas o menos que están enfermas. La probabilidad de que haya más de tres personas enfermas es:

Page 16: Estadistica y probabilidades cap VII

DISTRIBUCIÓN HIPERGEOMÉTRICA

• Está estrechamente relacionada con la distribución de probabilidad binomial. La diferencia entre ambas está en la independencia de los intentos y en que la probabilidad de éxito cambia de uno a otro

• Se usa para calcular la probabilidad de que una muestra aleatoria de n artículos seleccionados sin reemplazo, obtengamos x elementos identificados como éxitos, y n-x como fracasos. Para que suceda esto debemos obtener x éxitos de los r de la población, y n-x fracasos de los N-r de la población

Page 17: Estadistica y probabilidades cap VII

CARACTERISTICAS:1. En cada prueba solo hay dos resultados éxitos y fracasos.2. Las probabilidades asociadas a cada uno de los resultados no son constantes.3. Cada ensayo o repetición del experimento no es independiente de los demás.4. El número de repeticiones del experimento (n) es constante.5. La población es finita

N

rnxE =)(

)1

)(1(2

−−−=

N

nN

N

r

N

rnσ

1.

.2.

Page 18: Estadistica y probabilidades cap VII

0 x r≤ ≤( )( )

( )Nn

rx

rNxnxP

−−=)(

Donde N= tamaño de la población n = tamaño de la muestra r = numero de éxitos en un población x = numero de éxitos en una muestra para los cuales se desea la probabilidad

Page 19: Estadistica y probabilidades cap VII

1. Un círculo de calidad esta formado por 5 miembros, 3 mujeres y 2 varones; se debe elegir 2 miembros del círculo para ser capacitados. ¿Cuál es la probabilidad de elegir 2 mujeres al azar?

• Solución

N=5, n=2, r=3 mujeres en la población

x=2 mujeres en la muestra

Ejemplos.

( )( )( )

( )( )( ) 10

3)( 5

2

32

20 ===

−−

Nn

rx

rNxnxP

Page 20: Estadistica y probabilidades cap VII

2. En cierta clínica hay 20 pacientes de los cuales se sabe que el 25% tienen cáncer. Se extrae aleatoriamente sin reemplazo 4 pacientes para el despistaje de cáncera) ¿Cuál es la probabilidad de que al menos uno tenga cáncer?b) ¿Cuál es el número esperado de pacientes con cáncer?

3. Un jurado de 7 jueces va a decidir entre dos finalistas quién es la ganadora del concurso de belleza, para lo cual bastará una mayoría simple de los jueces. Suponga que 4 jueces votan por María y que los otros 3 votan por Susana. Se eligen al azar 3 jueces y se les pregunta por quién van a votar. ¿Cuál es la probabilidad de que la mayoría de los jueces de la muestra estén a favor de María?

Page 21: Estadistica y probabilidades cap VII

La distribución Normal o de Gauss es el modeloprobabilístico más importante. Se utiliza paramodelar gran número de fenómenos aleatorios,entre ellos el ruido y los errores en la medida.Aparece además como distribución límite en elTeorema Central del Límite. Sus parámetros sonla media μ y la desviación típica σ ,X ~ N(μ,σ)

DISTRIBUCIÓN NORMAL

Page 22: Estadistica y probabilidades cap VII
Page 23: Estadistica y probabilidades cap VII

• Está caracterizada por dos parámetros: la media, μ y la desviación típica, σ.

• Su función de densidad es:

0) (σ π2σ

1)(σ)μ,(

2

2

σ2

μ)(

>==−− x

exPN

La curva normal adopta un número infinito de formas, determinadas por sus parámetros μ y σ.

Page 24: Estadistica y probabilidades cap VII

− ∞ + ∞

Características de la distribución Normal

µ , Mo, Mn

σ σµ - σ µ + σ

• Tiene forma de campana, es asintótica al eje de las abscisas

(para x = ±∞ )

• Los puntos de inflexión tienen como abscisas los valores µ ± σ

• Simétrica con respecto a la media (µ) donde coinciden la mediana (Me) y la moda (Mo )

Puntos de

inflexión

Page 25: Estadistica y probabilidades cap VII

Distribución normal con µ=0 para varios valores σ

0

0.4

0.8

1.2

1.6

-2.50 -1.50 -0.50 0.50 1.50 2.50

x

σ=0.25σ=0.5σ=1

p(x)

Page 26: Estadistica y probabilidades cap VII

20 30 40 50 60 70 80 90 100 110 120

σ = 5 σ = 5

10=σ

Curvas normales con distintas medias y desviaciones estándar.

0) (σ π2σ

1)(σ)μ,(

2

2

σ2

μ)(

>==−− x

exPN

Page 27: Estadistica y probabilidades cap VII

N(μ, σ): Interpretación probabilista• Entre la media y una

desviación típica tenemos siempre la misma probabilidad: aproximadamente el 68%.

•Si tomamos intervalos centrados en μ, y cuyos extremos están…–a distancia σ, tenemos probabilidad 68%

–a distancia 2 σ, tenemos probabilidad 95%

–a distancia 2’5 σ tenemos probabilidad 99%

• Entre la media y dos desviaciones típicas aprox. 95%

Page 28: Estadistica y probabilidades cap VII

Podemos obtener la función de distribución F(x) integrando la función de densidad de probabilidad:

π2σ

1)(

2

2

σ2

μ)(

dvexFx v

∫∞−

−−=

De modo que la probabilidad de una variable aleatoria normal X en un intervalo a ≤ x ≤ b es:

π2σ

1)()()(

2

2

σ2

μ)(

dveaFbFbXaPb

a

v

∫−−

=−=≤≤

¡No podemos calcular analíticamente el valor de la integral!Tabularemos sus valores numéricos...

2

2

σ2

μ)(

π2σ

1)(σ)μ,(

−−==

x

exPN

1 π2σ

1 2

2

σ2

μ)(

=∫∞

∞−

−−dve

v

En particular:

Page 29: Estadistica y probabilidades cap VII

¿Cómo calcular probabilidades asociadas ¿Cómo calcular probabilidades asociadas a una curva normal específica?a una curva normal específica?

Dado que tanto µ como σ pueden asumir infinitos valores lo que hace impracticable tabular las probabilidades para todas las posibles distribuciones normales, se utiliza la distribución normal reducida o tipificada.

Se define una variable z = xx - - µµ

σσ

Es una traslación , y un cambio de escala de la variable original.

Page 30: Estadistica y probabilidades cap VII

La nueva variable z se distribuye como una

NORMAL con media µ = 0 y desviación típica σ = 1

-3 -2 -1 0 1 2 3-3 -2 -1 0 1 2 3

zz

68%95%99%

Recordemos de nuevo que en cualquier distribución normal las probabilidades delimitadas entre : ± σ = 68 %

± 2σ = 95 %± 3σ = 99 %

68%

99%

95%

Page 31: Estadistica y probabilidades cap VII

Tipificación• Dada una variable de media μ y desviación típica

σ, se denomina valor tipificado z, de una observación x, a la distancia (con signo) con respecto a la media, medido en desviaciones típicas, es decir:

σµ−= x

z

• En el caso de variable X normal, la interpretación es clara: asigna a todo valor de N(μ, σ), un valor de N(0,1) que deja exáctamente la misma probabilidad por debajo.

• Nos permite así comparar entre dos valores de dos distribuciones normales diferentes, para saber cuál de los dos es más extremo.

Page 32: Estadistica y probabilidades cap VII

Se quiere dar una beca a uno de dos estudiantes de sistemas educativos diferentes y se asignará al que tenga mejor expediente académico:– El estudiante A tiene una calificación de 8 en un sistema

donde la calificación de los alumnos se comporta como N(6,1).

– El estudiante B tiene una calificación de 80 en un sistema donde la calificación de los alumnos se comporta como N(70,10).

110

7080

21

68

=−=−=

=−=−=

B

xz

xz

BBB

A

AAA

σµ

σµ

–No podemos comparar directamente 8 puntos de A frente a los 80 de B, pero como ambas poblaciones se comportan de modo normal, podemos tipificar y observar las puntuaciones sobre una distribución de referencia N(0,1).

–Como zA > zB, podemos decir que el porcentaje de compañeros del mismo sistema de estudios que ha superado en calificación al estudiante A es mayor que el que ha superado B. En principio A es mejor candidato para la beca.

Page 33: Estadistica y probabilidades cap VII

duezZpzF

zezp

∫∞−

=≤=

∞<<∞−=

z

2

u

2

z

2

2

π2

1)()(

;π2

1)(

Característica de la distribución normal tipificada (reducida o estándar):

No depende de ningún parámetro.

Su media es 0, su varianza es 1 y su desviación típica es 1.

La curva f(x) es simétrica respecto al eje de ordenadas y tiene un máximo en este eje.

Tiene dos puntos de inflexión en z =1 y z = -1.

Page 34: Estadistica y probabilidades cap VII

Hay varios tipos de tablas de la distribución normal

La que se explica aquí representa las áreas para los diferentes valores de z desde 0 hasta +∞.

00+∞

Los valores Los valores negativos de z negativos de z NONO están tabulados, ya están tabulados, ya que la distribución que la distribución es simétricaes simétrica

Page 35: Estadistica y probabilidades cap VII

0.00.00.10.10.20.20.30.30.40.4

0.50.5

0.00.00.10.10.20.20.30.30.40.4

0.50.5

0 1 2 3 4 5 6 7 8 90 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 90 1 2 3 4 5 6 7 8 9

.0000 .0040 .0080 .0120 .0160 .0199 .0239 .0279 .0319 .0359

.0398 .0438 .0478 .0517 .0557 .0596 .0363 .0675 .0675 .0754

.0793 .0832 .0871 .0910 .0948 .0987 .1026 .... ...... ......

.1179 ..... ...... ...... ......

.1554 .... ..... ....

.1915 ....

La tabla consta de:La tabla consta de: *Margen izquierdo : Los enteros de z y su primer decimal.* * Margen superior: segundo decimal* * Cuerpo de la tabla: áreas correspondientes,

acumuladas, desde 0 hasta 3.99

Page 36: Estadistica y probabilidades cap VII

EJEMPLOS:EJEMPLOS:

1.-¿Cuál es la probabilidad de que un

valor de z esté entre 0 y -2.03?

2.-¿Cuál es la probabilidad de que un

valor de z esté entre -2.03 y +2.03?

3. Hallar P( z >1.25 ) 4. Hallar P ( -0.34 < z <∞ )

5. Hallar P ( 0.34 < z < 2.30 )

Page 37: Estadistica y probabilidades cap VII

?

Ejemplo 1

¿Cuál es la probabilidad de que un valor de z esté entre 0 y -2.03?¿Cuál es la probabilidad de que un valor de z esté entre 0 y -2.03?

zz

Cómo la curva es simétrica

P (-2.03 < z < 0) = P (0 < z < 2.03)

-3 -2 -1 0 1 2 3-3 -2 -1 0 1 2 3

Page 38: Estadistica y probabilidades cap VII

0 1 2 3 4

1.8

1.9

2.0

2.1

47. 88%

Ejemplo 1

¿Cuál es la probabilidad de que un valor de z esté entre 0 y -2.03?¿Cuál es la probabilidad de que un valor de z esté entre 0 y -2.03?

-3 -2 -1 0 1 2 3-3 -2 -1 0 1 2 3

zz

Se busca en la tabla el área correspondiente a z = 2.03

0.47882

Page 39: Estadistica y probabilidades cap VII

?47.88% 47.88%

Ejemplo 2

¿Cuál es la probabilidad de que un valor de z esté entre -2.03 y 2.03 ?¿Cuál es la probabilidad de que un valor de z esté entre -2.03 y 2.03 ?

-3 -2 -1 0 1 2 3-3 -2 -1 0 1 2 3

zz

En el ejemplo 1, vimos que la probabilidad de que z estuviera entre 0 y 2.03= 0.47882

La misma área hay entre 0 y -2.03 , por lo tanto

P ( -2.03< z< 2.03) = 0.95764

95.76%

Page 40: Estadistica y probabilidades cap VII

Ejemplo 3

¿Cuál es la probabilidad de que un valor de z sea mayor a 1.25 ?¿Cuál es la probabilidad de que un valor de z sea mayor a 1.25 ?

zz -3 -2 -1 0 1 2 3-3 -2 -1 0 1 2 3

??

1.- La probabilidad de 0 < z < +∞ = 0.5002.- La probabilidad de 0 < z < 1.25 = 0.39435

39.44%

3.- La probabilidad de z > 1.25 =

0.500 - 0.39435= 0.10565

10.56%

50%50%

Page 41: Estadistica y probabilidades cap VII

Hallar P( -0.34 < z < Hallar P( -0.34 < z < ∞∞ ) )

zz

P(0 < z <0.34) = 0.13307 = P(-0.34 < z < 0)

13.31% 50%

63.31%

P( -0.34 < z < ∞) =0.13307 + 0.50000 = 0.63307

-3 -2 -1 0 1 2 -3 -2 -1 0 1 2 33

Ejemplo 4

P (0 < z < ∞ ) = 0.50000

Page 42: Estadistica y probabilidades cap VII

Ejemplo 5

Hallar P( 0.34 < z < 2.30)Hallar P( 0.34 < z < 2.30)

zz

-3 -2 -1 0 1 2 3-3 -2 -1 0 1 2 3

P(0< z <0.34) = 0.13307P( 0 < z < 2.30) = 0.4893

P (0.34 < z < 2.30) = 0.48930 - 0.13307 = 0.35623

35.62%

Page 43: Estadistica y probabilidades cap VII

EJEMPLOEJEMPLO

Sea una variable distribuida normalmente con media µ = 4 y desviación típica σ = 1.5.

¿Cuál es la probabilidad de encontrar un valor x ≥ 6 (P(x ≥ 6 ))?

Page 44: Estadistica y probabilidades cap VII

x

µ = 4 σ = 1.5 Hallar P ( x > 6 )

?6

1.- 1.- transformar x en un valor de z

0.40824

0.09176

z = (6 - 4)/1.5 = 1.33

2.- Hallar P ( 0 < z < 1.33) = =

3.- 0.5000 - 0.40824 =

σμx

z−=

0.5

-0.5 1 2.5 4 5.5 7 8.5-0.5 1 2.5 4 5.5 7 8.5-3 -2 -1 0 1 1.33 2 3 z

Page 45: Estadistica y probabilidades cap VII

Hasta ahora vimos como dado un valor x de la variable, hallar probabilidades transformando (estandarización) la variable en valores de x - µ

σ

¿Cómo hallar un valor de x, dada la probabilidad?

x = ?

38.20%

Ejemplo: Sea una variable distribuida normalmente con µ =4 yy

σ =2 . Hallar el valor de x que deja por encima de él un 38.20% (0.3820)Se debe desestandarizar : :

xx = z = z σ + µ 0.5000 - 0.382 = 0.118 Se busca en la tabla el valor más aproximado :0.1179

corresponde a z =+ 0.30

4.60

Se busca en la tabla de acuerdo al área. Con su signo

Sustituyendo en la fórmula

0.30x2+4 =4.60

z =

Page 46: Estadistica y probabilidades cap VII
Page 47: Estadistica y probabilidades cap VII
Page 48: Estadistica y probabilidades cap VII
Page 49: Estadistica y probabilidades cap VII
Page 50: Estadistica y probabilidades cap VII
Page 51: Estadistica y probabilidades cap VII
Page 52: Estadistica y probabilidades cap VII