estadistica y probabilidades cap vii

VARIABLES ALEATORIAS Y DISTRIBUCIONES DE

PROBABILIDAD

VARIABLE ALEATORIA

Una variable aleatoria se define asignando un valor numérico a cada suceso simple de un experimento que conduzca a resultados aleatorios.

VARIABLES ALEATORIAS DISCRETAS

VARIABLES ALEATORIAS CONTINUAS

Una variable aleatoria discreta es una variable que puede tomar solo valores de un conjunto predeterminado

Una variable aleatoria continua se mide en una escala numérica. Cada observación de la variable aleatoria puede tomar cualquier

valor dentro de un rango específico

Las distribuciones de probabilidad son idealizaciones de los polígonos de frecuencias.

Las DP de variable continua se definen mediante una función y=f(x) llamada función de probabilidad o función de densidad. La probabilidad viene dada por el área bajo la curva, por lo que: •El área encerrada bajo la totalidad de la curva es 1. •Para obtener la probabilidad P(a≤X≤b) obtenemos la proporción de área que hay bajo la curva desde a hasta b. •La probabilidad de sucesos puntuales es 0, P(X=a)=0

Distribución de Probabilidad

Empleados ausentespor día, x

Numero de días,

ni

Probabilidad, P(x)

12345678

1825394627252210

0.0850.1180.1840.2170.1270.1180.1040.047

212 1.000

Ejemplo

1 2 3 4 5 6 7 8

Número de días, x

P(x)

Parámetros en una distribución de probabilidadPor analogía con las variables estadísticas podemos definir también aquí la media µ y la desviación típica σ de la variable aleatoria.

•La media µ , también llamada esperanza matemática, es un valor representativo de todos los valores que toma la variable aleatoria X, lo podemos imaginar como el punto sobre el eje de abscisas donde al poner una cuña la figura plana definida por la función de densidad quedará en equilibrio. Para calcularla hemos de hacer:

•La desviación típica σ es una medida de la dispersión de los valores que toma la variable aleatoria de la media. Como ocurría con las variables estadísticas la desviación típica será más pequeña o más grande según la gráfica de la función de densidad sea más estrecha o más ancha en torno a la media. En este caso se calcula:

Ejemplo: Al lanzar dos dados la suma de ambos puede asumir 11 valores diferentes en 36 puntos muestrales

En este caso vemos que la distribución de p(x) obtenida es simétrica.

Para el caso de 1 solo dado, donde todos los valores tienen la misma probabilidad de salir (1/6), obtendríamos una

distribución uniforme

http://www.fvet.edu.uy/estadis/probabilidad.htm

Supongamos que un experimento aleatorio tiene las siguientes

características:

•En cada prueba del experimento sólo son posibles dos

resultados: el suceso A (éxito) y su contrario A’ (fracaso).

•El resultado obtenido en cada prueba es independiente de los

resultados obtenidos anteriormente.

•La probabilidad del suceso A es constante, la representamos

por p, y no varía de una prueba a otra. La probabilidad de A’

es 1- p y la representamos por q .

El experimento consta de un número n de pruebas.

Distribución Binomial

Todo experimento que tenga estas características diremos que sigue el modelo de la distribución Binomial. A la variable X que expresa el número de éxitos obtenidos en cada prueba del experimento, la llamaremos variable aleatoria binomial.

Función de probabilidad de la distribución Binomialo también denominada función de la distribución de Bernoulli (para n=1).

Verificándose: 0 ≤ p ≤ 1

Distribución BinomialLa variable binomial es una variable aleatoria discreta, sólo puede tomar los valores 0, 1, 2, 3, 4, ..., n suponiendo que se han realizado n pruebas.Como hay que considerar todas las maneras posibles de obtener k-éxitos y (n-k) fracasos debemos calcular éstas por combinaciones (número combinatorio n sobre k).

Se suele representar por B(n,p) siendo n y p los parámetros de dicha distribución.

Probabilidad de obtener K éxitos

qpknk

k

nkXp

−••

== )(

Parámetros de la Distribución Binomial


Función de Distribución de la variable aleatoria Binomial

Esta función de distribución proporciona, para cada número real xi, la probabilidad

de que la variable X tome valores menores o iguales que xi.

Siendo K el mayor número entero menor o igual a xi

qpqpqpknknn

k

nnnxXpxF

−−••

++••

+••

=≤= ....

10)()(

110

11

Resumen Distribución Binomial


Sea X una variable aleatoria discreta correspondiente a una distribución binomial.

xnx

xnx

qpxxn

npnxP

ppxxn

npnxP

−

−

−=

−−

=

!)!(

!),;(

)1(!)!(

!),;(

Distribución BinomialEjemplo La probabilidad de éxito de una determinada vacuna es 0.72. Calcula la probabilidad de a que una vez administrada a 15 pacientes:a) Ninguno sufra la enfermedadb) Todos sufran la enfermedadc) Dos de ellos contraigan la enfermedadSolución :Se trata de una distribución binomial de parámetros B(15, 0.72)

Distribución de PoissonEsta distribución aparece en algunos procesos que tienen una dimensión temporal o espacial, y en fenomenos que tienen un alto número de experimentos (alto n) y una baja probabilidad de que ocurran (baja p).Ejemplos:• número de llamadas telefónicas que recibe un servicio de atención a urgencias durante un intervalo de tiempo determinado•número de cultivos infectados por una plaga en una cierta región geográfica

La función de probabilidad de una variable aleatoria de Poisson con media λ > 0, que simplificamos con la notación P(λ), es

siendo su función de distribución el sumatorio de cada uno de los valores menores.La media y varianza de X son ambas iguales a λ ,

E[X] = V[X] = λ .

Distribución de Poisson

EjemploEl número de enfermos que solicitan atención de urgencia en un hospital durante un periodo de 24 horas tiene una media de m = 43.2 pacientes. Unas obras en las instalaciones mermarán las capacidades de atención del servicio, el cual se sabe que colapsará si el número de enfermos excede de 50. ¿Cual es la probabilidad de que colapse el servicio de urgencias del hospital?

Bajo las condiciones del modelo de Poisson, se trata de una distribución P(43.2). La probabilidad solicitada es

P(X > 50) = 1 – P(X <= 50) = 1 - F(50) = 0.13.

El responsable del servicio deberá valorar si esta probabilidad es lo suficientemente alta como para reforzar la atención de urgencias con más efectivos, materiales, espacios, etc.

Distribución de PoissonEjemploCierta enfermedad tiene una probabilidad muy baja de ocurrir, p=1/100.000. Calcular la probabilidad de que en una ciudad con 500.000 habitantes haya más de 3 personas con dicha enfermedad.Calcular el número esperado de habitantes que la padecen.

Consideramos la v.a. X que contabiliza el número de personas que padecen la enfermedad, es claro que sigue un modelo binomial, pero que puede ser muy bien aproximado por un modelo de Poisson, de modo que

Así el número esperado de personas que padecen la enfermedad es

Existe una gran dispersión, y no sería extraño encontrar que en realidad hay muchas más personas o menos que están enfermas. La probabilidad de que haya más de tres personas enfermas es:

DISTRIBUCIÓN HIPERGEOMÉTRICA

• Está estrechamente relacionada con la distribución de probabilidad binomial. La diferencia entre ambas está en la independencia de los intentos y en que la probabilidad de éxito cambia de uno a otro

• Se usa para calcular la probabilidad de que una muestra aleatoria de n artículos seleccionados sin reemplazo, obtengamos x elementos identificados como éxitos, y n-x como fracasos. Para que suceda esto debemos obtener x éxitos de los r de la población, y n-x fracasos de los N-r de la población

CARACTERISTICAS:1. En cada prueba solo hay dos resultados éxitos y fracasos.2. Las probabilidades asociadas a cada uno de los resultados no son constantes.3. Cada ensayo o repetición del experimento no es independiente de los demás.4. El número de repeticiones del experimento (n) es constante.5. La población es finita

N

rnxE =)(

)1

)(1(2

−−−=

N

nN

N

r

N

rnσ

1.

.2.

0 x r≤ ≤( )( )

( )Nn

rx

rNxnxP

−−=)(

Donde N= tamaño de la población n = tamaño de la muestra r = numero de éxitos en un población x = numero de éxitos en una muestra para los cuales se desea la probabilidad

1. Un círculo de calidad esta formado por 5 miembros, 3 mujeres y 2 varones; se debe elegir 2 miembros del círculo para ser capacitados. ¿Cuál es la probabilidad de elegir 2 mujeres al azar?

• Solución

N=5, n=2, r=3 mujeres en la población

x=2 mujeres en la muestra

Ejemplos.

( )( )( )

( )( )( ) 10

3)( 5

2

32

20 ===

−−

Nn

rx

rNxnxP

2. En cierta clínica hay 20 pacientes de los cuales se sabe que el 25% tienen cáncer. Se extrae aleatoriamente sin reemplazo 4 pacientes para el despistaje de cáncera) ¿Cuál es la probabilidad de que al menos uno tenga cáncer?b) ¿Cuál es el número esperado de pacientes con cáncer?

3. Un jurado de 7 jueces va a decidir entre dos finalistas quién es la ganadora del concurso de belleza, para lo cual bastará una mayoría simple de los jueces. Suponga que 4 jueces votan por María y que los otros 3 votan por Susana. Se eligen al azar 3 jueces y se les pregunta por quién van a votar. ¿Cuál es la probabilidad de que la mayoría de los jueces de la muestra estén a favor de María?

La distribución Normal o de Gauss es el modeloprobabilístico más importante. Se utiliza paramodelar gran número de fenómenos aleatorios,entre ellos el ruido y los errores en la medida.Aparece además como distribución límite en elTeorema Central del Límite. Sus parámetros sonla media μ y la desviación típica σ ,X ~ N(μ,σ)

DISTRIBUCIÓN NORMAL

• Está caracterizada por dos parámetros: la media, μ y la desviación típica, σ.

• Su función de densidad es:

0) (σ π2σ

1)(σ)μ,(

2

2

σ2

μ)(

>==−− x

exPN

La curva normal adopta un número infinito de formas, determinadas por sus parámetros μ y σ.

− ∞ + ∞

Características de la distribución Normal

µ , Mo, Mn

σ σµ - σ µ + σ

• Tiene forma de campana, es asintótica al eje de las abscisas

(para x = ±∞ )

• Los puntos de inflexión tienen como abscisas los valores µ ± σ

• Simétrica con respecto a la media (µ) donde coinciden la mediana (Me) y la moda (Mo )

Puntos de

inflexión

Distribución normal con µ=0 para varios valores σ

0

0.4

0.8

1.2

1.6

-2.50 -1.50 -0.50 0.50 1.50 2.50

x

σ=0.25σ=0.5σ=1

p(x)

20 30 40 50 60 70 80 90 100 110 120

σ = 5 σ = 5

10=σ

Curvas normales con distintas medias y desviaciones estándar.

0) (σ π2σ

1)(σ)μ,(

2

2

σ2

μ)(

>==−− x

exPN

N(μ, σ): Interpretación probabilista• Entre la media y una

desviación típica tenemos siempre la misma probabilidad: aproximadamente el 68%.

•Si tomamos intervalos centrados en μ, y cuyos extremos están…–a distancia σ, tenemos probabilidad 68%

–a distancia 2 σ, tenemos probabilidad 95%

–a distancia 2’5 σ tenemos probabilidad 99%

• Entre la media y dos desviaciones típicas aprox. 95%

Podemos obtener la función de distribución F(x) integrando la función de densidad de probabilidad:

π2σ

1)(

2

2

σ2

μ)(

dvexFx v

∫∞−

−−=

De modo que la probabilidad de una variable aleatoria normal X en un intervalo a ≤ x ≤ b es:

π2σ

1)()()(

2

2

σ2

μ)(

dveaFbFbXaPb

a

v

∫−−

=−=≤≤

¡No podemos calcular analíticamente el valor de la integral!Tabularemos sus valores numéricos...

2

2

σ2

μ)(

π2σ

1)(σ)μ,(

−−==

x

exPN

1 π2σ

1 2

2

σ2

μ)(

=∫∞

∞−

−−dve

v

En particular:

¿Cómo calcular probabilidades asociadas ¿Cómo calcular probabilidades asociadas a una curva normal específica?a una curva normal específica?

Dado que tanto µ como σ pueden asumir infinitos valores lo que hace impracticable tabular las probabilidades para todas las posibles distribuciones normales, se utiliza la distribución normal reducida o tipificada.

Se define una variable z = xx - - µµ

σσ

Es una traslación , y un cambio de escala de la variable original.

La nueva variable z se distribuye como una

NORMAL con media µ = 0 y desviación típica σ = 1

-3 -2 -1 0 1 2 3-3 -2 -1 0 1 2 3

zz

68%95%99%

Recordemos de nuevo que en cualquier distribución normal las probabilidades delimitadas entre : ± σ = 68 %

± 2σ = 95 %± 3σ = 99 %

68%

99%

95%

Tipificación• Dada una variable de media μ y desviación típica

σ, se denomina valor tipificado z, de una observación x, a la distancia (con signo) con respecto a la media, medido en desviaciones típicas, es decir:

σµ−= x

z

• En el caso de variable X normal, la interpretación es clara: asigna a todo valor de N(μ, σ), un valor de N(0,1) que deja exáctamente la misma probabilidad por debajo.

• Nos permite así comparar entre dos valores de dos distribuciones normales diferentes, para saber cuál de los dos es más extremo.

Se quiere dar una beca a uno de dos estudiantes de sistemas educativos diferentes y se asignará al que tenga mejor expediente académico:– El estudiante A tiene una calificación de 8 en un sistema

donde la calificación de los alumnos se comporta como N(6,1).

– El estudiante B tiene una calificación de 80 en un sistema donde la calificación de los alumnos se comporta como N(70,10).

110

7080

21

68

=−=−=

=−=−=

B

xz

xz

BBB

A

AAA

σµ

σµ

–No podemos comparar directamente 8 puntos de A frente a los 80 de B, pero como ambas poblaciones se comportan de modo normal, podemos tipificar y observar las puntuaciones sobre una distribución de referencia N(0,1).

–Como zA > zB, podemos decir que el porcentaje de compañeros del mismo sistema de estudios que ha superado en calificación al estudiante A es mayor que el que ha superado B. En principio A es mejor candidato para la beca.

duezZpzF

zezp

∫∞−

−

−

=≤=

∞<<∞−=

z

2

u

2

z

2

2

π2

1)()(

;π2

1)(

Característica de la distribución normal tipificada (reducida o estándar):

No depende de ningún parámetro.

Su media es 0, su varianza es 1 y su desviación típica es 1.

La curva f(x) es simétrica respecto al eje de ordenadas y tiene un máximo en este eje.

Tiene dos puntos de inflexión en z =1 y z = -1.

Hay varios tipos de tablas de la distribución normal

La que se explica aquí representa las áreas para los diferentes valores de z desde 0 hasta +∞.

00+∞

Los valores Los valores negativos de z negativos de z NONO están tabulados, ya están tabulados, ya que la distribución que la distribución es simétricaes simétrica

0.00.00.10.10.20.20.30.30.40.4

0.50.5

0.00.00.10.10.20.20.30.30.40.4

0.50.5

0 1 2 3 4 5 6 7 8 90 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 90 1 2 3 4 5 6 7 8 9

.0000 .0040 .0080 .0120 .0160 .0199 .0239 .0279 .0319 .0359

.0398 .0438 .0478 .0517 .0557 .0596 .0363 .0675 .0675 .0754

.0793 .0832 .0871 .0910 .0948 .0987 .1026 .... ...... ......

.1179 ..... ...... ...... ......

.1554 .... ..... ....

.1915 ....

La tabla consta de:La tabla consta de: *Margen izquierdo : Los enteros de z y su primer decimal.* * Margen superior: segundo decimal* * Cuerpo de la tabla: áreas correspondientes,

acumuladas, desde 0 hasta 3.99

EJEMPLOS:EJEMPLOS:

1.-¿Cuál es la probabilidad de que un

valor de z esté entre 0 y -2.03?

2.-¿Cuál es la probabilidad de que un

valor de z esté entre -2.03 y +2.03?

3. Hallar P( z >1.25 ) 4. Hallar P ( -0.34 < z <∞ )

5. Hallar P ( 0.34 < z < 2.30 )

?

Ejemplo 1

¿Cuál es la probabilidad de que un valor de z esté entre 0 y -2.03?¿Cuál es la probabilidad de que un valor de z esté entre 0 y -2.03?

zz

Cómo la curva es simétrica

P (-2.03 < z < 0) = P (0 < z < 2.03)

-3 -2 -1 0 1 2 3-3 -2 -1 0 1 2 3

0 1 2 3 4

1.8

1.9

2.0

2.1

47. 88%

Ejemplo 1

¿Cuál es la probabilidad de que un valor de z esté entre 0 y -2.03?¿Cuál es la probabilidad de que un valor de z esté entre 0 y -2.03?

-3 -2 -1 0 1 2 3-3 -2 -1 0 1 2 3

zz

Se busca en la tabla el área correspondiente a z = 2.03

0.47882

?47.88% 47.88%

Ejemplo 2

¿Cuál es la probabilidad de que un valor de z esté entre -2.03 y 2.03 ?¿Cuál es la probabilidad de que un valor de z esté entre -2.03 y 2.03 ?

-3 -2 -1 0 1 2 3-3 -2 -1 0 1 2 3

zz

En el ejemplo 1, vimos que la probabilidad de que z estuviera entre 0 y 2.03= 0.47882

La misma área hay entre 0 y -2.03 , por lo tanto

P ( -2.03< z< 2.03) = 0.95764

95.76%

Ejemplo 3

¿Cuál es la probabilidad de que un valor de z sea mayor a 1.25 ?¿Cuál es la probabilidad de que un valor de z sea mayor a 1.25 ?

zz -3 -2 -1 0 1 2 3-3 -2 -1 0 1 2 3

??

1.- La probabilidad de 0 < z < +∞ = 0.5002.- La probabilidad de 0 < z < 1.25 = 0.39435

39.44%

3.- La probabilidad de z > 1.25 =

0.500 - 0.39435= 0.10565

10.56%

50%50%

Hallar P( -0.34 < z < Hallar P( -0.34 < z < ∞∞ ) )

zz

P(0 < z <0.34) = 0.13307 = P(-0.34 < z < 0)

13.31% 50%

63.31%

P( -0.34 < z < ∞) =0.13307 + 0.50000 = 0.63307

-3 -2 -1 0 1 2 -3 -2 -1 0 1 2 33

Ejemplo 4

P (0 < z < ∞ ) = 0.50000

Ejemplo 5

Hallar P( 0.34 < z < 2.30)Hallar P( 0.34 < z < 2.30)

zz

-3 -2 -1 0 1 2 3-3 -2 -1 0 1 2 3

P(0< z <0.34) = 0.13307P( 0 < z < 2.30) = 0.4893

P (0.34 < z < 2.30) = 0.48930 - 0.13307 = 0.35623

35.62%

EJEMPLOEJEMPLO

Sea una variable distribuida normalmente con media µ = 4 y desviación típica σ = 1.5.

¿Cuál es la probabilidad de encontrar un valor x ≥ 6 (P(x ≥ 6 ))?

x

µ = 4 σ = 1.5 Hallar P ( x > 6 )

?6

1.- 1.- transformar x en un valor de z

0.40824

0.09176

z = (6 - 4)/1.5 = 1.33

2.- Hallar P ( 0 < z < 1.33) = =

3.- 0.5000 - 0.40824 =

σμx

z−=

0.5

-0.5 1 2.5 4 5.5 7 8.5-0.5 1 2.5 4 5.5 7 8.5-3 -2 -1 0 1 1.33 2 3 z

Hasta ahora vimos como dado un valor x de la variable, hallar probabilidades transformando (estandarización) la variable en valores de x - µ

σ

¿Cómo hallar un valor de x, dada la probabilidad?

x = ?

38.20%

Ejemplo: Sea una variable distribuida normalmente con µ =4 yy

σ =2 . Hallar el valor de x que deja por encima de él un 38.20% (0.3820)Se debe desestandarizar : :

xx = z = z σ + µ 0.5000 - 0.382 = 0.118 Se busca en la tabla el valor más aproximado :0.1179

corresponde a z =+ 0.30

4.60

Se busca en la tabla de acuerdo al área. Con su signo

Sustituyendo en la fórmula

0.30x2+4 =4.60

z =

estadistica y probabilidades cap vii

Education