unidad n° iv - mdp...módulo teórico estadística básica prof. dr. juan ignacio pastore veamos el...

33
Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore Unidad N° IV Variables aleatorias. Definición de variable aleatoria. Variable aleatoria discreta: función de probabilidad y de distribución acumulada. Variable aleatoria continua. Función de densidad de probabilidad. Función de distribución acumulada. Valor esperado. Varianza. Momentos. Mediana. Modo. Variables aleatorias independientes.

Upload: others

Post on 26-Mar-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Unidad N° IV - MDP...Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore Veamos el caso particular de k 8 8 : 8 2,6 , 6,2 , 4,4 , 5,3 , 3,5 ^ 5 ` ^ ` 36 P X P s S

Módulo Teórico Estadística Básica

Prof. Dr. Juan Ignacio Pastore

Unidad N° IV

Variables aleatorias. Definición de variable aleatoria. Variable aleatoria discreta: función

de probabilidad y de distribución acumulada. Variable aleatoria continua. Función de

densidad de probabilidad. Función de distribución acumulada. Valor esperado. Varianza.

Momentos. Mediana. Modo. Variables aleatorias independientes.

Page 2: Unidad N° IV - MDP...Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore Veamos el caso particular de k 8 8 : 8 2,6 , 6,2 , 4,4 , 5,3 , 3,5 ^ 5 ` ^ ` 36 P X P s S

Módulo Teórico Estadística Básica

Prof. Dr. Juan Ignacio Pastore

Variable aleatoria.

Al describir el espacio muestral de un experimento no especificamos que un resultado

individual necesariamente tiene que ser un valor numérico.

En numerosas situaciones experimentales deseamos asignar un número real x a cada

uno de los elementos s del espacio muestral S .

Ejemplo: Consideremos el experimento: de una urna que contiene todos los nombres de

los empleados de una empresa se extrae un nombre al azar.

S={nombre de los empleados de la empresa}

X: número de hijos del empleado.

: XX S R , ( )X s x

Y: antigüedad en el cargo del empleado.

: YY S R , ( )Y s y

X e y son variables aleatorias.

Definición: Sea un experimento y S el espacio muestral asociado al experimento, Una

función X que asigna a cada uno de los elementos del espacio muestral S un número

real, se llama variable aleatoria.

Gráficamente:

S: espacio muestral asociado a un experimento. XR : valores posibles de X (recorrido de

la v.a).

Observación: Si ( )X s s , es decir la función identidad, entonces XR S . En este caso

el resultado del experimento es ya la característica numérica que queremos estudiar.

Page 3: Unidad N° IV - MDP...Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore Veamos el caso particular de k 8 8 : 8 2,6 , 6,2 , 4,4 , 5,3 , 3,5 ^ 5 ` ^ ` 36 P X P s S

Módulo Teórico Estadística Básica

Prof. Dr. Juan Ignacio Pastore

Ejemplo: Consideremos el experimento.

5 : Se arroja una moneda tres veces y se observa la sucesión de resultados (cara (c),

cruz (X)) .

5 ,ccx,cxc,xcc,xxc,xcx,cxx,xxxS ccc

Consideremos la variable aleatoria X: número de caras que se obtienen en los tres

lanzamientos.

0,1,2,3XR ,

La v.a. 5: XX S R queda definida de la siguiente manera:

3X ccc

2X ccx X xcc X cxc

1X xxc X xcx X cxx

0X xxx

Ejemplo: Se lanzan dos dados normales y se anotan los resultados 1 2,x x donde ix es

el resultado observado en el i-ésimo dado 1,2i .

1 2, 1,6 1,6S x x

Sobre este experimento podemos estar interesados en ciertas características numéricas.

Por ejemplo:

a) X: suma de los valores observados.

2,3, ,12XR

La v.a. : XX S R queda definida de la siguiente manera:

1 2X s x x

b) Y: valor máximo de los valores observados

1,2,3, ,6YR

La v.a. : YY S R queda definida de la siguiente manera:

1 2max ,Y s x x

Page 4: Unidad N° IV - MDP...Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore Veamos el caso particular de k 8 8 : 8 2,6 , 6,2 , 4,4 , 5,3 , 3,5 ^ 5 ` ^ ` 36 P X P s S

Módulo Teórico Estadística Básica

Prof. Dr. Juan Ignacio Pastore

c) Z: promedio de los valores observados

1,6ZR

La v.a. Z: zS R queda definida de la siguiente manera:

1 2

2

x xZ s

¿Cómo podemos calcular la probabilidad de eventos asociados a XR ? Para esto

daremos la definición de eventos equivalentes.

Definición: Sea un experimento y S el espacio muestral asociado al experimento. Sea

X una variable aleatoria definida en S y sea XR su recorrido.

A S y XB R son eventos equivalentes si :A s S X s B

Gráficamente:

A y B son eventos equivalentes siempre que ocurren juntos, esto es, siempre que A

ocurre B ocurre y viceversa. Si A ocurrió, entonces se obtuvo un resultado s para el cual

X s B y, por lo tanto, ocurrió B . Recíprocamente, si B ocurrió, se observó un valor

X s para el cual s A y por lo tanto A ocurrió.

Page 5: Unidad N° IV - MDP...Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore Veamos el caso particular de k 8 8 : 8 2,6 , 6,2 , 4,4 , 5,3 , 3,5 ^ 5 ` ^ ` 36 P X P s S

Módulo Teórico Estadística Básica

Prof. Dr. Juan Ignacio Pastore

Definición: Sea B un evento en el recorrido XR , entonces definimos P B como sigue.

P B P A , donde y A S es un evento equivalente a B , :A s S X s B

Ejemplo: Consideremos el experimento.

5 : Se arroja una moneda tres veces y se observa la sucesión de resultados (cara (c),

cruz (X)) . Supongamos que la moneda no está cargada. Por lo tanto 12

P C P X

5 ,ccx,cxc,xcc,xxc,xcx,cxx,xxxS ccc

Consideremos la variable aleatoria X: número de caras que se obtienen en los tres

lanzamientos.

0,1,2,3XR , y consideremos el evento XB R definido por 2B

Puesto que 2X ccx X xcc X cxc

ccx,cxc,xccA es equivalente al evento B .

Por lo tanto:

3 3 3

1 1 1 32

2 2 2 8P X P A P ccx P xcc P cxc

Ejercicio: Calcular 0P X , 1P X , 3P X

Ejemplo: Se lanzan dos dados normales y se anotan los resultados 1 2,x x donde ix es

el resultado observado en el i-ésimo dado 1,2i .

1 2, 1,6 1,6S x x

a) X: suma de los valores observados.

2,3, ,12XR

La v.a. : XX S R queda definida de la siguiente manera:

1 2X s x x

Determinar P X k para Xk R

Page 6: Unidad N° IV - MDP...Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore Veamos el caso particular de k 8 8 : 8 2,6 , 6,2 , 4,4 , 5,3 , 3,5 ^ 5 ` ^ ` 36 P X P s S

Módulo Teórico Estadística Básica

Prof. Dr. Juan Ignacio Pastore

Veamos el caso particular de 8k

5

8 : 8 2,6 , 6,2 , 4,4 , 5,3 , 3,536

P X P s S X s P . Dado que

los 36 elemento del espacio muestral son igualmente posibles o probables.

De la misma manera podemos realizar el cálculo para todo 2, ,12k

k 2 3 4 5 6 7 8 9 10 11 12

P X k

136

236

336

436

536

636

536

436

336

236

136

b) Y: máximo de los valores observados.

1,2, ,6YR

La v.a. : YY S R queda definida de la siguiente manera:

1 2max ,Y s x x

Determinar P X k para Xk R

Veamos el caso particular de 2k

3

2 : 2 1,2 , 2,1 , 2,236

P X P s S X s P . Dado que los 36

elemento del espacio muestral son igualmente posibles o probables.

De la misma manera podemos realizar el cálculo para todo 1, ,6k

k 1 2 3 4 5 6

P X k

136

336

536

736

936

1136

Page 7: Unidad N° IV - MDP...Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore Veamos el caso particular de k 8 8 : 8 2,6 , 6,2 , 4,4 , 5,3 , 3,5 ^ 5 ` ^ ` 36 P X P s S

Módulo Teórico Estadística Básica

Prof. Dr. Juan Ignacio Pastore

Variables aleatorias discretas

Definición: Se dice que X es una variable aleatoria discreta (v.a.d) si su rango o

recorrido XR es finito o infinito numerable y a cada valor posible i Xx R se le puede

asociar un número iP X x llamado probabilidad de ix tal que:

:i i iP x P X x s S X s x

a) 0i i XP x x R

b) 1i

i

x

P x

La función así definida se llama función de probabilidad de la v. a. X. El conjunto de

pares ordenados ,i ix P x se llama distribución de probabilidades de la v. a. X.

Interpretación gráfica:

Función de distribución acumulada de una variable aleatoria discreta

Sea X una variable aleatoria discreta (v.a.d), la función de distribución acumulada se

define como:

j

j X

x x

F x P X x x x R

(la suma se toma sobre todos los índices j tal que

jx x )

Page 8: Unidad N° IV - MDP...Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore Veamos el caso particular de k 8 8 : 8 2,6 , 6,2 , 4,4 , 5,3 , 3,5 ^ 5 ` ^ ` 36 P X P s S

Módulo Teórico Estadística Básica

Prof. Dr. Juan Ignacio Pastore

Ejemplo: Un lote de 8 calculadoras contiene 3 defectuosas. Consideremos el siguiente

experimento: Se selecciona una calculadora al azar y se la prueba, repitiéndose la

operación hasta obtener una calculadora no defectuosa. Hallar la distribución de

probabilidades de la v.a. X: número de extracciones que se realizan hasta obtener una

claculadora no defectuosa.

, , , 1,2,3,4XS D DD DDD DDDD R

ix iP X x

1 5

8 2 3 5 35

8 7 56

3 3 5 52

8 7 6 56

4 3 2 1 11

8 7 6 56

1i

i

P X x

2) Sea X una v. a. discreta cuyo recorrido es 1,2,3.XR y además 1

2j j

P X x

a) Probar que es una legítima función de probabilidades.

0iP x se cumple por definición

?

1j

i

P X x

1

1serie geométrica de razón

2

11 1 1 1 1 2 1

12 2 4 8 16 1 12

j ji i

aP X x

q

b) Calculas es parP X

1

2

11 1 4 1 es par

312 4 1 14

j ji i i

aP X

q

Page 9: Unidad N° IV - MDP...Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore Veamos el caso particular de k 8 8 : 8 2,6 , 6,2 , 4,4 , 5,3 , 3,5 ^ 5 ` ^ ` 36 P X P s S

Módulo Teórico Estadística Básica

Prof. Dr. Juan Ignacio Pastore

Algunas distribuciones discretas teóricas:

Distribución de Bernoulli.

Experimento Bernoulli: es dicotómico, sólo son posibles dos resultados: éxito o fracaso.

Su espacio muestral asociado puede definirse como: ,S éxito fracaso . Podemos

definir una v.a. : 0,1X S tal que 1X éxito y 0X fracaso .

Si la probabilidad de éxito es p ( 0 1p ) y la probabilidad de fracaso es 1 p

podemos construir la siguiente “distribución de probabilidades”:

ix ip x

0 1 p

1 p

1 1p p

La anterior distribución de probabilidades se denomina distribución de Bernoulli.

Ejemplos:

a) El lanzamiento de una moneda con probabilidad p de cara y probabilidad 1 p

de cruz.

b) Que un artículo extraído al azar de una línea de producción sea defectuoso o no

defectuoso.

c) Obtener un número par o impar al arrojar un dado.

Función de distribución acumulada (FDA)

0 0

1 0 1

1 1

si x

F x p si x

si x

Page 10: Unidad N° IV - MDP...Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore Veamos el caso particular de k 8 8 : 8 2,6 , 6,2 , 4,4 , 5,3 , 3,5 ^ 5 ` ^ ` 36 P X P s S

Módulo Teórico Estadística Básica

Prof. Dr. Juan Ignacio Pastore

Distribución Binomial

Una variable aleatoria Binomial puede considerarse como una suma de n variables

aleatorias Bernoulli independientes, esto es, “una v. a. Binomial aparece cuando estamos

interesados en el número de veces que un suceso A acurre (éxito) en n pruebas

independientes de un experimento de tipo Bernoulli” .

Consideremos un experimento y sea A un evento o suceso asociado a .

Consideremos también que la probabilidad de que A ocurra en un intento es p

(probabilidad de éxito), entonces la probabilidad de que A no ocurra es 1 p .

Definimos la v. a. iX cómo:

1

0i

si A ocurreX

si A no ocurre

iX tiene una distribución Bernoulli con “distribución de probabilidades” dada por:

ix ip x

0 1 p

1 p

Consideremos n repeticiones independientes del experimento . Por lo tanto el espacio

muestral queda definido por 1: A, o

n

i i iiS a a a A

(el cardinal de este conjunto es

2n ).

Definimos la v. a. X: “números de veces que ocurre el evento A en las n repeticiones

independientes”

0,1,2, ,XR n , 1

n

i

i

X X

Consideremos un elemento particular del espacio muestral del experimento que

satisfaga la condición X k , es decir, el número de veces que ocurre el suceso A es k .

Page 11: Unidad N° IV - MDP...Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore Veamos el caso particular de k 8 8 : 8 2,6 , 6,2 , 4,4 , 5,3 , 3,5 ^ 5 ` ^ ` 36 P X P s S

Módulo Teórico Estadística Básica

Prof. Dr. Juan Ignacio Pastore

Tal resultado aparecería, por ejemplo, si las primeras k repeticiones del experimento

resultan en la ocurrencia de A , mientras que las últimas n k repeticiones resultan A .

k n k

AA A AA A

Puesto que todas las repeticiones son independientes la probabilidad de esta secuencia

particular es:

1n kkp p

¿De cuantas maneras puedo elegir k posiciones para A en n ? ¿Cuántos resultados

están asociados con P X k ?

Número combinatorio, nos permite determinar el número de formas de escoger k

elementos a partir de un conjunto de n elementos.

!

!(n )!

n n

k k k

1 0,1, ,n kk

nP X k p p k n

k

Formalmente:

Definición: X es una variable aleatoria con distribución Binomial, ,X B n p si su

distribución de probabilidades está dada por:

1 0,1, ,n kk

nP X k p p k n

k

donde 0 1p ( p constante) y n es un número entero positivo.

Características:

Mide el número de éxitos en una secuencia de n ensayos independientes de

Bernoulli con una probabilidad fija p de ocurrencia del éxito entre los ensayos.

Para usar el modelo se requiere que haya:

a) N repeticiones independientes.

b) el resultado de cada prueba es dicotómica.

c) P A p , 0 1p constante, en las n pruebas independientes.

Page 12: Unidad N° IV - MDP...Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore Veamos el caso particular de k 8 8 : 8 2,6 , 6,2 , 4,4 , 5,3 , 3,5 ^ 5 ` ^ ` 36 P X P s S

Módulo Teórico Estadística Básica

Prof. Dr. Juan Ignacio Pastore

Veamos que P así definida es una legítima distribución de probabilidades.

a) 0 1,2 ,P X k k n por definición.

b) 0

1n

k

P X k

, se prueba fácilmente a partir del teorema del binomio de Newton

1

nn k n k

i

nx y x y

k

.

0 0

1 1 1 1n n

nn kk n

k k x y

nP X k p p p p

k

Ejemplo: Se sabe por experiencias anteriores que la probabilidad de que una máquina

produzca un artículo defectuoso es 0.01. En una hora una máquina produce 20 artículos.

a) ¿Cuál es la probabilidad de que una máquina produzca algún artículo defectuoso en

una hora de producción?

Solución/

Sea X: número de artículos defectuosos producidos por una máquina durante una hora de

producción. 20,0.01X B

Al menos un artículo defectuoso, debemos calcular

20 00

20( 1) 1 ( 0) 1 ( 0) 1 0.01 1 0.01 0.182

0P X P X P X

b) Si la fábrica posee 12 máquinas, ¿cuál es la probabilidad de que a lo sumo 2 de ellas

produzcan algún artículo defectuoso durante una hora de producción?

Solución/

Sea Y: número de máquinas que producen al menos un artículos defectuosos durante una

hora de producción. 12,0.182Y B

A lo sumo dos produzcan al menos un artículo defectuoso, debemos calcular

12 0 12 1 12 20 1 2

( 2) ( 0) ( 1) ( 2)

12 12 120.182 1 0.182 0.182 1 0.182 0.182 1 0.182 0.6226

0 1 2

P Y P X P X P X

Page 13: Unidad N° IV - MDP...Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore Veamos el caso particular de k 8 8 : 8 2,6 , 6,2 , 4,4 , 5,3 , 3,5 ^ 5 ` ^ ` 36 P X P s S

Módulo Teórico Estadística Básica

Prof. Dr. Juan Ignacio Pastore

Análisis de la gráfica de la distribución binomial a partir del n y p

Simétrica: Si 0.5p la distribución binomial será simétrica independientemente del

tamaño de la muestra.

Sesgada a derecha: Si 0p la distribución binomial tendrá sesgo hacia la derecha.

Sesgada a izquierda: Si 1p la distribución binomial tendrá sesgo hacia la izquierda.

Page 14: Unidad N° IV - MDP...Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore Veamos el caso particular de k 8 8 : 8 2,6 , 6,2 , 4,4 , 5,3 , 3,5 ^ 5 ` ^ ` 36 P X P s S

Módulo Teórico Estadística Básica

Prof. Dr. Juan Ignacio Pastore

Distribución Hipergeométrica:

Cuando estudiamos la distribución Binomial la probabilidad p de éxito permanecía

constante para cada una de las pruebas independientes.

Consideremos el siguiente caso:

De una caja que contiene N bolas de las cuales a son rojas ( a N ) se escoge al azar

una bola sin reemplazo o sustitución y definimos la variable aleatoria:

X: número de bolas rojas extraídas en las n repeticiones, 1,2, ,XR a

¿Cuál será la probabilidad de obtener k bolas rojas? 0 k a

n de casos favorables

P X kn de casos posibles

Número de casos posibles N

n

diferentes formas de tomar n bolas de las N .

Para calcular el número de casos favorables observemos que N a N a . De las a

bolas rojas queremos k y de las N a bolas no rojas queremos n k

a

k

diferentes formas de tomar k bolas rojas de a .

N a

n k

diferentes formas de tomar n k bolas no rojas de las N a .

Por lo tanto los casos favorables son a N a

k n k

Por lo tanto:

, 0,1, ,

a N a

k n kP X k k a

N

n

Page 15: Unidad N° IV - MDP...Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore Veamos el caso particular de k 8 8 : 8 2,6 , 6,2 , 4,4 , 5,3 , 3,5 ^ 5 ` ^ ` 36 P X P s S

Módulo Teórico Estadística Básica

Prof. Dr. Juan Ignacio Pastore

Formalmente:

Definición: Se dice que X es una variable aleatoria con distribución hipergeométrica,

con parámetros , ,N n a si su distribución de probabilidades está dada por:

0,1, ,

a N a

k n kP X k k a

N

n

Donde: n: Tamaño de la muestra. N: Tamaño de la población a: número de éxitos en la población. N-a: número de fracasos en la población. k: número de éxitos en la muestra.

Observaciones:

Una variable Hipergeométrica es generada según las siguientes condiciones

1) N pruebas no independientes.

2) El resultado de cada prueba es dicotómico.

3) La probabilidad de éxito P A no se mantiene constante, es decir, varía con cada

prueba.

Ejemplo: La producción diaria de 850 partes contiene 50 que no cumplen con los

requerimientos del cliente. Se toman 4 partes al azar, sin sustitución, de la producción del

día, cuál es la probabilidad de que ninguna de las partes cumpla con los requerimientos

del cliente?

X: “número de partes que no cumplen con los requerimientos del cliente.”

800 50

0 4( 4) 0.00001066 0

850

4

P X

Page 16: Unidad N° IV - MDP...Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore Veamos el caso particular de k 8 8 : 8 2,6 , 6,2 , 4,4 , 5,3 , 3,5 ^ 5 ` ^ ` 36 P X P s S

Módulo Teórico Estadística Básica

Prof. Dr. Juan Ignacio Pastore

Variable aleatoria de Poisson.

Muchos hechos no ocurren como resultado de n pruebas de un experimento, sino en

puntos de tiempo, espacio o volumen, es decir, estamos interesados en el número de

ocurrencias (defectos) por unidad de medida.

Sea X una variable aleatoria que toma los valores posibles 0,1,2,k . Si su función de

probabilidades está dada por:

0,1,!

keP X k k

k

decimos que X tiene una distribución de Poisson con parámetro 0 (frecuencia de

ocurrencias medias), y se nota Po .

Interpretación: La distribución de Poisson expresa, a partir de una frecuencia de

ocurrencia media , la probabilidad de que ocurra un determinado número de eventos

durante cierta unidad de medida.

Veamos que P así definida es una legítima distribución de probabilidades.

a) 0 0,2P X k k por definición.

b) ?

0

1k

P X k

,

0 0 0

.

1! !

k k

k k k

e por Taylore es cte

eP X k e e e

k k

Observaciones:

Una variable de Poisson es generada según las siguientes condiciones:

1) El número de ocurrencias es independiente de una unidad a otra, es decir los

sucesos ocurren independientemente.

2) La frecuencia de ocurrencia media , es proporcional al tamaño de la unidad.

3) La probabilidad de más de una ocurrencia en una unidad cada vez más pequeña

tiende a cero, es decir es despreciable.

Page 17: Unidad N° IV - MDP...Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore Veamos el caso particular de k 8 8 : 8 2,6 , 6,2 , 4,4 , 5,3 , 3,5 ^ 5 ` ^ ` 36 P X P s S

Módulo Teórico Estadística Básica

Prof. Dr. Juan Ignacio Pastore

Ejemplo: El sistema de estacionamiento medido impulsado por la municipalidad de

Gral. Pueyrredon está 100% informatizado. Esto permitió modelar el número de

infracciones mediante un modelo de Poisson con una tasa de cinco infracciones por

hora. a) ¿Cuál es la probabilidad de que exactamente cuatro infracciones se expidan

durante una hora en particular?

Solución:

X: número de infracciones en 1 hora. , 5X P

5 4.5

4 0.1754674!

eP X

b) ¿Cuál es la probabilidad de que por lo menos cuatro infracciones se expidan

durante una hora en particular?

Solución:

X : número de infracciones en 1 hora. , 5X P

5 0 5 1 5 2 5 3

4 1 0 1 2 3

.5 .5 .5 .54 1 0.734974

0! 1! 2! 3!

P X P X P X P X P X

e e e eP X

c) ¿Cuántas infracciones se espera expedir durante un período de 45 minutos?

Solución:

Y: número de infracciones en 45 minutos. Y P , debemos ajustar el al

nuevo intervalo. 3.75 3.75E Y

La distribución de Poisson como aproximación a la Binomial.

Cuando en una distribución binomial el número de intentos ( n ) es grande y la probabilidad

de éxito ( p ) es pequeña, la distribución binomial converge a la distribución de Poisson

con parámetro np .

¿Qué sucede con las probabilidades Binomiales 1n kk

nP X k p p

k

cuando

n y 0p de manera tal que np permanezca constante, es decir, np .

En la práctica podemos aproximar la distribución Binomial por la distribución de Poisson si

50 5n y np

Page 18: Unidad N° IV - MDP...Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore Veamos el caso particular de k 8 8 : 8 2,6 , 6,2 , 4,4 , 5,3 , 3,5 ^ 5 ` ^ ` 36 P X P s S

Módulo Teórico Estadística Básica

Prof. Dr. Juan Ignacio Pastore

Consideremos la expresión general para una v. a. con distribución Binomial con

parámetros n y p , es decir, ,X B n p .

!1 1

! !

1 1 1 !

n k n kk kn n

P X k p p p pk k n k

n n n n k n k

! !k n k

1

1 1 11

!

n kk

n kk

p p

n n n n kp p

k

Lamemos np , entonces pn

y 1 1p

n

. Sustituyendo todos los términos que

contienen a p por su expresión equivalente en función de , obtenemos:

1 1 11

!

1 1 11

!

1 2 11 1 1 1 1 1

!

n kk

k

n kk

k

k

n kk

n n n n kP X k

k n n

n n n n k

k n nn n n

k

k n n n n n

Si hacemos tender n

1 1

1 1 11

!

1 1 11

!

1 2 11 1 1 1 1 1

!

n kk

k

n kk

k

k

n kk k

e

n n n n kP X k

k n n

n n n n k

k n nn n n

k e

k n n n n n k

!

Es decir en el límite obtenemos la distribución de Poisson con parámetro np . En la

práctica podemos aproximar la distribución Binomial por la distribución de Poisson si se

verifica que 50n y 5np .

Page 19: Unidad N° IV - MDP...Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore Veamos el caso particular de k 8 8 : 8 2,6 , 6,2 , 4,4 , 5,3 , 3,5 ^ 5 ` ^ ` 36 P X P s S

Módulo Teórico Estadística Básica

Prof. Dr. Juan Ignacio Pastore

Variables aleatorias continuas

Definición: Se dice que una v.a. X es una variable aleatoria continua, si existe una

función :f , llamada función de densidad de probabilidades (fdp) de X que

satisface las siguientes condiciones.

a) 0f x x

b) 1f x dx

c) ,a b tal que a b b

a

P a X b f x dx

Interpretación gráfica:

Algunas consideraciones

a) 0

0

0 0

x

x

P X x f x dx

La probabilidad cero no significa que el suceso sea imposible, es decir si A es el

conjunto vacío entonces P(A)=0, pero el recíproco no es cierto.

Por lo tanto

P a X b P a X b P a X b P a X b

b) Si * 0f x x y *f x dx k

entonces no es una legitima fdp. Pero

podemos convertirla de la siguiente manera:

*f x

f x xk

c) Si X toma valores en el intervalo ,a b podemos definir 0f x ,x a b .

d) f x no representa ninguna probabilidad. Sólo cuando se la integra entre los

límites expresa alguna probabilidad.

Page 20: Unidad N° IV - MDP...Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore Veamos el caso particular de k 8 8 : 8 2,6 , 6,2 , 4,4 , 5,3 , 3,5 ^ 5 ` ^ ` 36 P X P s S

Módulo Teórico Estadística Básica

Prof. Dr. Juan Ignacio Pastore

Ejemplo: Sea f x definida por

1 si 0,1

0 si 0,1

kx x xf x

x

Halla un valor de k de manera tal que f x sea una legítima f.d.p

0

1 1 0f x dx dx

1

0 1

1 0kx x dx dx

1

2

0

1k x x dx

11

2 2 3

00

1 1 1 1 11 6

2 3 2 3 6k x x dx k x x k k k

Ejemplo: con la f.d.p anterior hallar:

a)

1 12 2

2 2 3

1144

1 1 1 1 116 6

4 2 2 3 32P x x x dx x x

b)

1 1 13

2081 1 1 3 2 54111 13 4 2 297

324 2A B

P xP A B

P x xP B

P x

Función de distribución acumulada (FDA)

Sea X una variable aleatoria discreta o continua. La función de distribución acumulada F

se define como:

F x P X x x

1) Si X es una v.a.d entonces j

j

x x

F x P x

. La suma se toma sobre todos los índices

j que satisfacen jx x .

2) Si X es una v.a.c entonces x

F x f s ds

siendo f s la f.d.p. asociada a la v. a.

X.

Page 21: Unidad N° IV - MDP...Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore Veamos el caso particular de k 8 8 : 8 2,6 , 6,2 , 4,4 , 5,3 , 3,5 ^ 5 ` ^ ` 36 P X P s S

Módulo Teórico Estadística Básica

Prof. Dr. Juan Ignacio Pastore

Propiedades de la FDA

1- F es no decreciente, es decir si 1 2 1 2x x F x F x

2- lim 1x

F x

y lim 0x

F x

3- Si f es la fdp de X entonces 'f x F x x donde F es diferenciable.

4- P a X b F b F a Regla de Barrow.

Ejemplo: Sea X una v.a discreta con la siguiente distribución de probabilidades

ix 1 2 3 4

ip x

14

13

16

14

0 1

1 1 24

1 1 2 34 3

1 1 1 3 44 3 6

1 4

si x

si x

si xF x

si x

si x

Ejemplo: Sea

6 1 si 0,1

0 si 0,1

x x xf x

x

Hallar la FDA.

1- Si 0 0 0

x x

x F x f s ds ds

2- Si 0 1 0

x x

x F x f s ds ds

0

2 3 2 3

00

1 16 1 6 3 2

2 3

xx

s s dx s s x x

3- Si 1 0

x x

x F x f s ds ds

01

0 1

1

6 1 0s s dx ds

0

2 3

0

1 16 1

2 3

x

s s

2 3

0 si 0

3 2 si 0 1

1 si 1

x

F x x x x

x

Page 22: Unidad N° IV - MDP...Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore Veamos el caso particular de k 8 8 : 8 2,6 , 6,2 , 4,4 , 5,3 , 3,5 ^ 5 ` ^ ` 36 P X P s S

Módulo Teórico Estadística Básica

Prof. Dr. Juan Ignacio Pastore

Características numéricas de las variables aleatorias:

Con cada distribución de probabilidades podemos asociar ciertos parámetros que dan

información valiosa acerca de la distribución.

Momentos: El momento k-ésimo para una variable aleatoria discreta respecto al

origen se define como:

1

k k

i i

i

E X x p x

Definición: Sea X una variable aleatoria discreta con función de probabilidades

,i ix P x para 1,2,i . Se llama valor esperado de X o esperanza matemática de

X a:

1

i i

i

E X x p x

E X existe si la serie 1

i i

i

x p x

converge en valor absoluto, es decir,

1

i i

i

x p x

. A este número también se lo llama valor promedio de X.

Observaciones:

1) Si X toma un número finito de valores 0,2, ,ni

1

n

i i

i

E X x p x

Podemos interpretar la esperanza matemática como un promedio ponderado de

los valores posibles de la v.a.

2) Si todos los valores posibles de la variable son igualmente probables, es decir,

1

ip xn

, la esperanza matemática queda definida como:

1

1 n

i

i

E X xn

(Promedio de los ix )

Page 23: Unidad N° IV - MDP...Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore Veamos el caso particular de k 8 8 : 8 2,6 , 6,2 , 4,4 , 5,3 , 3,5 ^ 5 ` ^ ` 36 P X P s S

Módulo Teórico Estadística Básica

Prof. Dr. Juan Ignacio Pastore

Ejemplo: Un lote de 8 calculadoras contiene 3 defectuosas. Se selecciona una al

azar y se la prueba, repitiendo la operación hasta que aparezca una calculadora

no defectuosa. La distribución de probabilidades de la variable aleatoria X: número

de extracciones que se hacen está dada por

, , , 1,2,3,4XS D DD DDD DDDD R

La distribución de probabilidades queda definida por:

ix

1 2 3 4

ip x

58

1556

556

156

4

1

5 15 5 11 2 3 4 1,5

8 56 56 56i i

i

E x x p x

Interpretación: se espera que la calculadora no defectuosa aparezca entre la

primera y segunda extracción.

Observación: si el valor esperado de una v.a. discreta no es exacto, la

interpretación debe hacerse entre los extremos comprendidos, ya que la variable

es discreta.

Ejemplo: Consideremos el experimento de lanzar dos dados y sea X la variable

“aleatoria suma de los valores observados”.

1 2 1 2, : , 1,6 2,3, ,12XS x x x x R

La distribución de probabilidades queda definida por:

ix

2 3 4 5 6 7 8 9 10 11 12

ip x

136

236

336

436

536

636

536

436

336

236

136

12

2

1 2 3 4 12 3 4 5 12 7

36 36 36 36 36i i

i

E x x p x

Interpretación: se espera que la suma de los puntos obtenidos al arrojar dos

dados sea 7 o que la esperanza de la suma sea 7.

Page 24: Unidad N° IV - MDP...Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore Veamos el caso particular de k 8 8 : 8 2,6 , 6,2 , 4,4 , 5,3 , 3,5 ^ 5 ` ^ ` 36 P X P s S

Módulo Teórico Estadística Básica

Prof. Dr. Juan Ignacio Pastore

Definición: Sea X una v. a. continua con f.d.p, f , definida para todo x . Se

llama valor esperado de la v. a. continua X o esperanza matemática de X a:

.E x x f x dx

E X existe si existe .x f x dx

.

Ejemplo: Hallar la esperanza matemática de la v. a. continua con f.d.p dada por:

2 si 0,1

0 si 0,1

x xf x

x

0

. .0E x x f x dx x dx

1 1

0 0

.2 .0x x dx x dx 1

2

0

22

3x dx

Ejemplo: Hallar la esperanza matemática de la v. a. continua con f.d.p dada por:

6 1 si 0,1

0 si 0,1

x x xf x

x

0

. .0E x x f x dx x dx

1 1

0 0

.6 1 .0x x x dx x dx 1

2 3

0

16

2x x dx

La esperanza matemática coincide, en este ejemplo, con el punto medio del

intervalo. Esto se da porque la función entre 0 y 1 es simétrica.

Page 25: Unidad N° IV - MDP...Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore Veamos el caso particular de k 8 8 : 8 2,6 , 6,2 , 4,4 , 5,3 , 3,5 ^ 5 ` ^ ` 36 P X P s S

Módulo Teórico Estadística Básica

Prof. Dr. Juan Ignacio Pastore

Ejemplo: la duración en horas de cierto dispositivo electrónico es una v. a. con

función densidad de probabilidades dada por:

si 0

0 si 0

xe xf x

x

Suponiendo que el costo de fabricación de tal dispositivo es de $20 y que el

fabricante vende el artículo en $50, pero garantiza un reembolso total del dinero si

la duración en horas es menor a 0.2 y devuelve la mitad si la duración en horas es

mayor o igual a 0.2 y menor o igual a 0.4. ¿cuál es la utilidad neta esperada por

artículo?

X: duración en horas del dispositivo.

U: utilidad

20,5,30UR

El suceso 0.2x es equivalente a U=-20

El suceso 0.2 0.4x es equivalente a U=5

El suceso 0.4x es equivalente a U=30

iu

-20 5 30

ip u

0.18 0.15 0.67

0.2 0.2

0.20.2

00

20 0.2 1 0.18x xP U P x f x dx e dx e e

0.4 0.4

0.40.4 0.2

0.20.2 0.2

5 0.2 0.4 0.15x xP U P x f x dx e dx e e e

1

11 0.4

0.40.4 0.4 1

30 0.4 0 0.67x xP U P x f x dx e dx dx e e e

Luego,

20 0.18 5 0.15 30 0.67 17,25E U

Interpretación: Si se produce un gran número de dispositivos electrónicos, el

fabricante espera ganar 17,25 por dispositivo, ya que perderá $20 el 18% de las

veces, ganará $5 alrededor del 15% de las veces y ganará $30 el 67% de las

veces.

Page 26: Unidad N° IV - MDP...Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore Veamos el caso particular de k 8 8 : 8 2,6 , 6,2 , 4,4 , 5,3 , 3,5 ^ 5 ` ^ ` 36 P X P s S

Módulo Teórico Estadística Básica

Prof. Dr. Juan Ignacio Pastore

Propiedades del valor esperado:

1) Si X cte entonces E X c

2) E cX cE X para toda constante c.

3) E X Y E X E Y , (X e Y v.a.)

4) E X Y E X E Y

5) E XY E X E Y si X e Y son v.a. independientes.

6) Considerando las propiedades 1,2 y 3 tenemos que E aX b aE X b

Demostración:

1) Si X cte entonces E X c

Por definición de E X tenemos que:

1por fdp

E X x f x dx c f x dx c f x dx c

2) E cX cE X para toda constante c.

Por definición de E X tenemos que:

E x

E cX cx f x dx c x f x dx c x f x dx cE X

3) E X Y E X E Y , (X e Y v.a.)

4) E X Y E X E Y

( )E X Y E X Y E X E Y E X E Y

Page 27: Unidad N° IV - MDP...Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore Veamos el caso particular de k 8 8 : 8 2,6 , 6,2 , 4,4 , 5,3 , 3,5 ^ 5 ` ^ ` 36 P X P s S

Módulo Teórico Estadística Básica

Prof. Dr. Juan Ignacio Pastore

Medidas de Variabilidad:

Definición: Llamaremos desviación respecto de la media a la v. a.

D X E X

Propiedad de la desviación:

0E D E X E X

Demostración:

0

cte

E D E X E X E X E E X E X E X

Definición: La varianza de una v. a. X se define como:

22V X E X E X

En palabras, la varianza de una v. a. X es la esperanza matemática del cuadrado

de la desviación de X respecto de su esperanza.

a) Si X es una v.a.d

2

1

i i

i

V X x E X p x

b) Si X es una v.a.c

2

V X x E X f x dx

Definición: La dispersión o desviación estandar de una v.a. X se define como

X V X .

Ambos valores miden la “dispersión de los datos”. Observar que la dispersión lo

hace con las mismas unidades de los datos.

Page 28: Unidad N° IV - MDP...Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore Veamos el caso particular de k 8 8 : 8 2,6 , 6,2 , 4,4 , 5,3 , 3,5 ^ 5 ` ^ ` 36 P X P s S

Módulo Teórico Estadística Básica

Prof. Dr. Juan Ignacio Pastore

Otra forma de expresar la varianza es la siguiente:

22V X E X E X

Dem/

2 22

2 2 2 22 2 2

2

2 2

cte cte

V X E X E X E X XE X E X

E X E X E E X E E X E X E X E X E X E X

Propiedades de la Varianza:

1) Si X cte entonces 0V X

2) V X c V X para toda constante c.

3) 2V cX c V X para toda constante c.

4) V X Y V X V Y , (X e Y v.a. independientes)

5) V X Y V X V Y

Demostración/

1) Si X cte entonces 0V X

2 22 2 2 2 0V X E X E X E c E c c c

2) V X c V X para toda constante c.

2 22 2 2

2 22 2 2 2

2

2 2

V X c E X c E X c E X cX c E X c

E X cE X c E X cE X c E X E X V X

Page 29: Unidad N° IV - MDP...Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore Veamos el caso particular de k 8 8 : 8 2,6 , 6,2 , 4,4 , 5,3 , 3,5 ^ 5 ` ^ ` 36 P X P s S

Módulo Teórico Estadística Básica

Prof. Dr. Juan Ignacio Pastore

Ejemplo: consideremos el ejemplo de las calculadoras: Un lote de 8 calculadoras

contiene 3 defectuosas. Se selecciona una al azar y se la prueba, repitiendo la

operación hasta que aparezca una calculadora no defectuosa. La distribución de

probabilidades de la variable aleatoria X: número de extracciones que se hacen

está obtener una calculadora no defectuosa está dada por:

, , , 1,2,3,4XS D DD DDD DDDD R

La distribución de probabilidades queda definida por:

2 2 2 25 15 5 1

1 1,5 2 1,5 3 1,5 4 1,5 0,53578 56 56 56

V x

2

2 2 2 2 2 22 5 15 5 11 2 3 4 1,5 0,5357

8 56 56 56

E X

V x E X E X

Luego 0,5357 0,7319X .

Ejemplo: Calcular la varianza y la dispersión de la v.a. X cuya f.d.p está dada por:

2 si 0,1

0 si 0,1

x xf x

x

2

22 1 2 1

2 3 18V X E X E X

0

2 2 2. .0E x x f x dx x dx

1

2 2

0 1

.2 .0x x dx x dx

11

3 4

00

1 12

2 2x dx x

Ejercicio: calcular la varianza utilizando la otra definición

2

2.2

3V x x x dx

ix 1 2 3 4

ip x

58

1556

556

156

Page 30: Unidad N° IV - MDP...Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore Veamos el caso particular de k 8 8 : 8 2,6 , 6,2 , 4,4 , 5,3 , 3,5 ^ 5 ` ^ ` 36 P X P s S

Módulo Teórico Estadística Básica

Prof. Dr. Juan Ignacio Pastore

Características numéricas de algunas distribuciones teóricas

Distribución de Bernoulli.

ix ip x

0 1 p

1 p

1 1p p

Esperanza matemática:

2

1

0 1 1i i

i

E X x p x p p p

Varianza:

22V X E X E X

2

2 2 2

1

0 1 1i i

i

E X x p x p p p

22 2 1V X E X E X p p p p

Esperanza y varianza de matemática de la distribución binomial

00

0 0 1

0

1

1 0 1 10

!1

! !

n n nn k n n kk k

k k k

nn kk

k

n n nE X kP X k k p p p p k p p

k k

nk p p k

k n k

1 !n n

k

1

1

11 ! !

nn kk

k

pp pk n k

Llamemos 1 0,1, , 1 1y k y n k y tenemos:

E X k 1 !n n

k

1

11

1 0

1

1 !1 1

1 ! ! ! 1 !

n nn k n yk y

k y

npp p np p p np

k n k y n y

Page 31: Unidad N° IV - MDP...Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore Veamos el caso particular de k 8 8 : 8 2,6 , 6,2 , 4,4 , 5,3 , 3,5 ^ 5 ` ^ ` 36 P X P s S

Módulo Teórico Estadística Básica

Prof. Dr. Juan Ignacio Pastore

Otra forma: consideremos a X como una suma de n variables aleatorias

Bernoulli independientes cada una con iE X p y varianza 1iV X p p

1 2 3

1

n

i n

i

X X X X X X

1 2 3 1

1

n

i n n

i

E X E X E X X X X E X E X np

1 2 3 1

1

n

i n n

i

V X V X V X X X X V X V X np n p

Esperanza y varianza de matemática de la distribución hipergeométrica

p

aE X n

N 1

1

a a N nV X n

N N N

Esperanza y varianza de matemática de la distribución hipergeométrica

Sea X una v. a. tal que X P

E X V X

0 0 1

0! !

k kn

k k k

e eE X kP X k k k k

k k

ke

k

1

1

1 0 1

1 !

1 ! !

k

k tn n

k t

e por Taylor

k

e e e ek t

De forma análoga se prueba que V X

Cuantiles de una v. a. continua:

En estadística descriptiva dijimos, por ejemplo, que el percentil 10 deja

aproximadamente el 10% de los datos a la izquierda. O equivalentemente el 10%

de los datos son menores que el percentil 10.

Si X es una variable aleatoria continua, su percentil 10 es el valor que deja un área

de 0,1 a la izquierda en la fdp de la variable.

Definición: se llama cuantil al valor x tal que:

x

P X x f x dx

Page 32: Unidad N° IV - MDP...Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore Veamos el caso particular de k 8 8 : 8 2,6 , 6,2 , 4,4 , 5,3 , 3,5 ^ 5 ` ^ ` 36 P X P s S

Módulo Teórico Estadística Básica

Prof. Dr. Juan Ignacio Pastore

Ejemplo: la demanda semanal de una determinada marca de gaseosas, medida

en miles de litros, es una v.a. continua con fdp dada por:

2 1 si 1,2

0 si 1,2

x xf x

x

a) Determinar la demanda esperada semanal e interpretar.

1

. .0E x x f x dx x dx

2

2

1 2

.2 1 .0x x dx x dx

11

3 4

00

1 12

2 2x dx x

Rta: se espera que la demanda semanal sea del 1,6 miles de litros.

b) ¿Cuántos litros corresponden al menos al 75% de la demanda semanal?

1

1 0,25

q

P X q f x dx

Ejemplo: La siguiente fdp representa el tiempo de llenado de cierto recipiente,

expresado en horas:

2320 1,5

45

81,5 2

35

0 en otro caso

x x

f x x x

a) Determinar en forma analítica el percentil 85.

85

85 0,85

P

P X P f x dx

Veamos en que tramo se encuentra.

1.5

2

0

320,8

45x dx Por lo tanto el P85 está en el otro tramo.

8585 85

2

1.51,5 1,5

8 8 80.8 0,85 0.05 0.05

35 35 70

PP P

x dx x dx x

Buscando las raíces de la ecuación cuadrática tenemos que 85 1.639P

(descartamos el valor -1.639 por no pertenecer al intervalo)

¿Cómo determinarían el 85P gráficamente? Buscamos la FDA

Page 33: Unidad N° IV - MDP...Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore Veamos el caso particular de k 8 8 : 8 2,6 , 6,2 , 4,4 , 5,3 , 3,5 ^ 5 ` ^ ` 36 P X P s S

Módulo Teórico Estadística Básica

Prof. Dr. Juan Ignacio Pastore

Mediana de una v.a. continua:

La mediana de una v.a continua es el valor em tal que

0,5em

eP X m f x dx

o 0,5

e

e

m

P X m f x dx

Ejemplo: Una v.a. continua X tiene la siguiente fdp

213 1 1,1

4

0 1,1

x xf x

x

a) Determinar analíticamente la mediana.

1

10

2

em

eP X m f x dx dx

2 3

11

3 3 3

1 13 1

4 4

1 1 11 1 1 1 4 0 0, 1

4 2 2

ee mm

e e e e e e e

x dx x x

m m m m m m m m

Moda de una v.a continua: es el valor de X para el cual f x toma su valor

máximo (si la fdp tiene un solo máximo)

Si f y 'f son derivables en a, a es un máximo relativo o local si cumple

1) ' 0f a

2) '' 0f a

Ejercicio: determinar la moda de la v.a. continua cuya función densidad de

probabilidades está dada por:

6 1 si 0,1

0 si 0,1

x x xf x

x

1

2om