tema 1. probabilidad y modelos probabil´ısticos · 1 tema 1. probabilidad y modelos...

58
1 Tema 1. Probabilidad y modelos probabil´ ısticos En este tema: Probabilidad Variables aleatorias Modelos de variables aleatorias m´ as comunes Vectores aleatorios Estad´ ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1 2 Tema 1. Probabilidad y modelos probabil´ ısticos Probabilidad: Experimentos aleatorios, espacio muestral, sucesos. Interpretaciones de la probabilidad. Propiedades de la probabilidad. Probabilidad condicionada. Sucesos Independientes. Teoremas fundamentales del c´ alculo de probabilidades: regla de la multiplicaci´ on, th. de la probabilidad total y th. de Bayes. Variables aleatorias: Concepto de variable aleatoria. Variables aleatorias discretas: funci´ on de probabilidad, funci´ on de distribuci´ on, momentos. Variables aleatorias continuas: funci´ on de densidad, funci´ on de distribuci´ on, momentos. Algunas propiedades de la esperanza y la varianza. Estad´ ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

Upload: buituong

Post on 16-Oct-2018

244 views

Category:

Documents


1 download

TRANSCRIPT

1

Tema 1. Probabilidad y modelos probabilısticos

En este tema:

• Probabilidad

• Variables aleatorias

• Modelos de variables aleatorias mas comunes

• Vectores aleatorios

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

2

Tema 1. Probabilidad y modelos probabilısticos

• Probabilidad:• Experimentos aleatorios, espacio muestral, sucesos.• Interpretaciones de la probabilidad.• Propiedades de la probabilidad.• Probabilidad condicionada.• Sucesos Independientes.• Teoremas fundamentales del calculo de probabilidades: regla de lamultiplicacion, th. de la probabilidad total y th. de Bayes.

• Variables aleatorias:• Concepto de variable aleatoria.• Variables aleatorias discretas: funcion de probabilidad, funcion dedistribucion, momentos.

• Variables aleatorias continuas: funcion de densidad, funcion dedistribucion, momentos.

• Algunas propiedades de la esperanza y la varianza.

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

3

Tema 1. Probabilidad y modelos probabilısticos

• Modelos de variables aleatorias mas comunes:• Distribucion Bernoulli• Distribucion Binomial• Distribucion de Poisson• Distribucion uniforme continua• Distribucion exponencial• Distribucion normal• Teorema Central del Lımite• Distribuciones asociadas a la normal (Tema 4. Introduccion a la Inferencia Estadıstica)

• Vectores aleatorios:• Concepto de vector aleatorio.• Vectores aleatorios discretos: distribucion conjunta, distribucionesmarginales, distribuciones condicionadas, independencia.

• Vectores aleatorios continuos: distribucion conjunta, distribucionesmarginales, distribuciones condicionadas, independencia.

• Covarianza, correlacion y esperanza condicionada.• Algunas propiedades de la esperanza y la varianza

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

4

Conceptos basicos

• Experimento aleatorio: proceso de observar un fenomeno del que seconocen de antemano todos sus posibles resultados, pero a partir de lascondiciones iniciales no puede predecirse exactamente cual de estosresultados se producira.

• Espacio muestral: es el conjunto de todos los posibles resultados de unexperimento aleatorio.Se denota por Ω = e1, e2, . . . , en, . . . y cada uno de sus elementos sedenomina suceso elemental o punto muestral.

• Un espacio muestral (correspondiente a un determinado experimentoaleatorio) tiene asociada una coleccion F no vacıa de subconjuntos de Ω.Los elementos de F se denominan sucesos y se denotan por las letrasA,B ,C , . . ..

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

5

Conceptos basicos: ejemplos• Experimento aleatorio: lanzamiento de un dado

• Espacio muestral finito: Ω = 1, 2, 3, 4, 5, 6• Sucesos elementales (o puntos muestrales): 1, 2,3,4, 5 y 6• Sucesos aleatorios: A =“obtener una puntuacion par”= 2, 4, 6,B =“obtener una puntuacion superior a 3”= 4, 5, 6.

• Exp. aleatorio: numero de accesos a la pagina web de la universidad elproximo lunes

• Espacio muestral infinito numerable: Ω = 0, 1, 2, . . . , n, . . . = N ∪ 0• Sucesos elementales: 0, 1, 2, 3, . . .• Sucesos aleatorios: A =“se reciben al menos 100 accesos”= 100, 101, . . .y B =“se reciben menos de 500 accesos”= 0, 1, . . . , 499.

• Exp. aleatorio: precio de una cierta accion al cierre de sesion del proximolunes

• Espacio muestral infinito no numerable: Ω = (0,+∞), o siendo realistas,Ω = (0,M)

• Sucesos elementales: x ∈ (0,M)• Sucesos aleatorios: A =“el precio de cierre es superior a 5 euros”= (5,M)y B =“precio de cierre entre 3 y 8 euros”= (3, 8).

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

6

Sucesos: conceptos basicosSucesos triviales• Suceso seguro: siempre se verifica despues del experimento aleatorio. Elpropio espacio muestral Ω

• Suceso imposible: nunca se verifica como resultado del experimentoaleatorio. El conjunto vacıo ∅ ⊆ Ω

Suceso complementario o contrario a un suceso A: suceso que se verificacuando no se verifica A. Es el conjunto de todos los sucesos elementales de Ωque no estan en A. Se suele denotar por Ac o A

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

7

Operaciones basicas con sucesos aleatorios

Interseccion de sucesos: Si A y B son dos sucesos del espacio muestral Ω,entonces el suceso interseccion, A ∩ B , es el conjunto de todos los elementosde Ω que estan en A y en B a la vez.

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

8

Operaciones basicas con sucesos aleatorios

A y B son sucesos incompatibles si no tienen ningun suceso elemental encomun, i.e., el suceso interseccion es el suceso imposible, A ∩ B = ∅

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

9

Operaciones basicas con sucesos aleatorios

Union de sucesos: Si A y B son dos sucesos de un espacio muestral Ω,entonces el suceso union, A ∪ B , es el conjunto de todos los sucesoselementales de Ω que pertenecen a cualquiera de los dos, A o B .

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

10

Operaciones basicas con sucesos aleatorios

Diferencia de sucesos: Si A y B son dos sucesos de un espacio muestral Ω,entonces el suceso diferencia, A \ B , es el conjunto de todos los sucesoselementales de Ω que pertenecen a A pero no a B .

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

11

Operaciones basicas con sucesos aleatorios

Leyes de Morgan

Relacion entre la union, interseccion y suceso complementario

A ∪ B = A ∩ B

A ∩ B = A ∪ B

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

12

Ejemplo: lanzamiento de un dado

Consideremos el experimento aleatorio “resultado observado al lanzar undado”:

• suceso elemental: el 1, el 2, el 3, el 4, el 5, el 6

• espacio muestral: Ω = 1, 2, 3, 4, 5, 6• suceso: A = 2, 4, 6 B = 4, 5, 6

El suceso A es “sale un numero par”.El suceso B es “sale un numero mayor que tres”.

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

13

Ejemplo: lanzamiento de un dado

Ω = 1, 2, 3, 4, 5, 6 A = 2, 4, 6 B = 4, 5, 6

• Complementario:A = 1, 3, 5 B = 1, 2, 3

• Interseccion:A ∩ B = 4, 6 A ∩ B = 1, 3

• Union:A ∪ B = 2, 4, 5, 6 A ∪ B = 1, 2, 3, 5

A ∪ A = 1, 2, 3, 4, 5, 6 = Ω

• Sucesos incompatibles:A ∩ A = ∅

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

14

Probabilidad. Intuicion

La probabilidad es una medida subjetiva sobre la incertidumbre de que sucedacierto suceso.

Al tirar un dado:• la probabilidad de que salga un 1 es mas pequena que la probabilidad deque salga un numero mayor que uno

• la probabilidad de que salga un 4 es igual que la probabilidad de que salgaun 6.

• la probabilidad de que salga un 7 es mınima, igual a la probabilidad delsuceso imposible

• la probabilidad de que salga un numero positivo es maxima, igual a laprobabilidad del suceso seguro

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

15

Tres enfoques/interpretaciones

Probabilidad clasica (regla de Laplace): Considera un experimento para elque todos los sucesos elementales son equiprobables. Si A es un sucesoformado por n(A) puntos muestrales, entonces se define la probabilidad de A

como

P(A) =numero de casos favorables a A

numero de casos posibles=

n(A)

n(Ω).

Enfoque frecuentista: Si repetieramos el experimento muchas veces, lafrecuencia con que ocurre el suceso serıa una aproximacion de la probabilidad.

Probabilidad – el valor lımite de la frecuencia

Probabilidad subjetiva: Depende de la informacion que tengamos en esemomento.

Probabilidad – creencia o certeza de que ocurra

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

16

Propiedades de la probabilidad

Definicion Sea F la coleccion no vacıa de todos los sucesos de Ω. Laprobabilidad es una aplicacion P : F → [0, 1], que asigna a cada suceso A ∈ Fun valor numerico P(A), verificando:

• P(A) ≥ 0, para todo suceso A ∈ F• P(Ω) = 1

• Probabilidad de la union de sucesos disjuntos: si A y B son incompatibles,entonces P(A ∪ B) = P(A) + P(B).

Propiedades

• Probabilidad del complementario: P(A) = 1− P(A).

• P(∅) = 0.

• Si A ⊆ B ⇒ P(A) ≤ P(B)

• Si A = e1, . . . , en finito (o infinito numerable) ⇒ P(A) =∑n

i=1 P(ei )

• Probabilidad de la union: P(A ∪ B) = P(A) + P(B)− P(A ∩ B).

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

17

Ejemplo: lanzamiento de un dado

• Probabilidad de un suceso elemental: P(ei ) =16

• Probabilidad de que salga par: A = 2, 4, 6, luego

P(A) = P(”2”) + P(”4”) + P(”6”) =1

6+

1

6+

1

6=

1

2=

n(A)

n(Ω)

• Probabilidad de que salga mayor que 3: B = 4, 5, 6, luego

P(B) = P(”4”) + P(”5”) + P(”6”) =1

6+

1

6+

1

6=

1

2=

n(B)

n(Ω)

• Probabilidad de que salga impar

P(A) = 1− P(A) = 1− 1

2=

1

2

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

18

Ejemplo: lanzamiento de un dado

• Probabilidad de que salga par o mayor que tres

P(A ∪ B) = P(A) + P(B)− P(A ∩ B)

Como A ∩ B = 4, 6, entonces P(A ∩ B) = 26 = 1

3 = n(A∩B)n(Ω)

P(A ∪ B) =1

2+

1

2− 1

3=

4

6=

2

3=

n(A ∪ B)

n(Ω)

• Probabilidad de que salga par o igual a uno.Los sucesos A = 2, 4, 6 y C = 1 son incompatibles (A ∩ C = ∅) portanto

P(A ∪ C ) = P(A) + P(C ) =1

2+

1

6=

4

6=

2

3=

n(A ∪ C )

n(Ω)

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

19

Probabilidad condicionada: ejemploSe clasifica un grupo de 100 ejecutivos de acuerdo a su peso y a si sufren o node hipertension. La tabla muestra el numero de ejecutivos en cada categorıa.

Insuficiente Normal Sobrepeso Total

Hipertenso 2 8 10 20Normal 20 45 15 80

Total 22 53 25 100

• Experimento aleatorio: seleccionar al azar a uno de esos 100 ejecutivospara medir su tension y su peso.

• Espacio muestral: Ω = (H, I ), (H,N), (H, S), (N, I ), (N,N), (N, S)• Si se elige un ejecutivo al azar, ¿cual es la probabilidad de que tengahipertension?

P(H) =20

100= 0, 2 6= n(H)

n(Ω)

• Si se elige a una persona al azar, y se descubre que tiene sobrepeso, ¿cuales la probabilidad de que tenga hipertension? ¿Es la misma que antes?

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

20

Probabilidad condicionada: ejemplo

Probabilidad de que sea hipertenso, sabiendo que tiene sobrepeso:

P(H|S)

Para calcularla, nos fijamos solo en los ejecutivos con sobrepeso:

P(H|S) = 10

25= 0, 4 > 0, 2 = P(H)

La probabilidad de un suceso depende de la mayor o menor informacion quetengamos

La probabilidad condicionada, (o probabilidad condicional) es la probabi-lidad de que ocurra un suceso, dado que sabemos que ha ocurrido otrosuceso.

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

21

Probabilidad condicionada. Sucesos Independientes

Probabilidad condicionadaSean dos sucesos A y B , la probabilidad de A condicionada por el suceso B es:

P(A|B) = P(A ∩ B)

P(B)

Para que tenga sentido: P(B) > 0.

Sucesos Independientes• Intuitivamente: la ocurrencia de uno de ellos no nos dice nada nuevo

sobre la ocurrencia del otro

• Definicion: se dice que dos sucesos A y B son independientes si

P(A ∩ B) = P(A)P(B).

• Propiedad: dos sucesos A y B son independientes si, y solo si,P(A|B) = P(A) y P(B |A) = P(B).

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

22

Teoremas fundamentales del calculo de probabilidades

Regla de la multiplicacion o formula de las probabilidadescompuestas

Es util para calcular la probabilidad de la ocurrencia simultanea de variossucesos cuando las probabilidades condicionadas son faciles de calcular.

• P(A ∩ B) = P(A|B)P(B), siempre que P(B > 0).

• P(A ∩ B ∩ C ) = P(A)P(B |A)P(C |A ∩ B), siempre que P(A ∩ B) > 0.

• Se generaliza al calculo de la probabilidad de la interseccion de n sucesosA1, . . . ,An.

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

23

Regla de la multiplicacion: ejemplo

Se extraen dos cartas de una baraja espanola. Probabilidad de que:

• la primera carta sea copa: P(A) = 1248 .

• la segunda sea copa, sabiendo que la primera lo fue: P(B |A) = 1147 .

• las dos cartas sean copas: P(A ∩ B) = P(B |A)P(A) = 1147

1248 .

Se lanzan dos dados. Probabilidad de que:

• en el primer dado salga un 1: P(C ) = 16 .

• en el segundo dado salga un 1, sabiendo que en el primero salio 1:P(D|C ) = P(D) = 1

6 .

• en el primer dado salga un uno, si en el segundo salio uno:P(C |D) = P(C ) = 1

6 .

• en los dos dados salga uno:P(C ∩ D) = P(D|C )P(C ) = P(D)P(C ) = 1

616 (sucesos independientes)

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

24

Teoremas fundamentales: teorema de la probabilidad totalUn conjunto de sucesos B1,B2, . . . ,Bk son mutuamente excluyentes si

Bi ∩ Bj = ∅, ∀i 6= j .

Si ademas de eso cumplen

Ω = B1 ∪ B2 ∪ . . . ∪ Bk ,

se dice que forman una particion del espacio muestral.

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

25

Teoremas fundamentales: teorema de la probabilidad total

Si B1,B2, . . . ,Bk es una particion del espacio muestral tal que P(Bi ) 6= 0,i = 1, . . . , k , y A es un suceso cualquiera, entonces

P(A) = P(A ∩ B1) + P(A ∩ B2) + . . .+ P(A ∩ Bk) =

= P(A|B1)P(B1) + P(A|B2)P(B2) + . . .+ P(A|Bk)P(Bk).

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

26

Teorema de la probabilidad total: ejemplo

En una fabrica se embalan galletas en cuatro cadenas de montaje: A1, A2, A3,y A4. El 35% de la produccion total se embala en la cadena A1, el 20%, 24%y 21% en las cadenas A2, A3 y A4 respectivamente.Los datos indican que no se embalan correctamente un porcentaje pequeno delas cajas: el 1% en la cadena de montaje A1, el 3% en A2, el 2.5% en A3 y el2% en A4.¿Cual es la probabilidad de que una caja elegida al azar de la produccion totalsea defectuosa (suceso D)?

P(D) = P(D ∩ A1) + P(D ∩ A2) + P(D ∩ A3) + P(D ∩ A4)

= P(D|A1)P(A1) + P(D|A2)P(A2) + P(D|A3)P(A3) + P(D|A4)P(A4)

= 0′01× 0′35 + 0′03× 0′20 + 0′025× 0′24 + 0′02× 0′21 = 0′0197.

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

27

Teoremas fundamentales: teorema de Bayes

Para dos sucesos A y B se tiene que

P(A|B) = P(B |A)P(A)P(B)

Ejemplo: (continuacion del anterior) Supongamos que descubrimos una cajadefectuosa, ¿cual es la probabilidad de que la caja haya sido embalada en lacadena de montaje A1?

P(A1|D) =P(D|A1)P(A1)

P(D)=

=0.01× 0.35

0.0197= 0.17766

donde la probabilidad de que una caja elegida al azar sea defectuosa P(D) seha calculado aplicando el teorema de la probabilidad total.

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

28

Teoremas fundamentales: teorema de Bayes

Dada una particion del espacio muestral, B1,B2, . . . ,Bk , tal que P(Bi ) 6= 0,i = 1, . . . , k , y dado un suceso A, se tiene que

P(Bj |A) =P(A|Bj)P(Bj)

P(A|B1)P(B1) + P(A|B2)P(B2) + . . .+ P(A|Bk)P(Bk)

para todo j = 1 . . . , k

• Probabilidades a priori: p(B1), . . . , p(Bk)

• Probabilidades a posteriori: p(B1|A), . . . , p(Bk |A)• Verosimilitudes: p(A|B1), . . . , p(A|Bk)

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

29

Teoremas fundamentales: utilidad

La aplicacion del teorema de la probabilidad total y del teorema de Bayes esespecialmente util cuando:

• El experimento aleatorio se puede separar en 2 etapas

• Es sencillo dar una particion de todo el espacio muestral Ω mediantesucesos B1, . . . ,Bk correspondientes a resultados en la primera etapa.

• Son conocidas, o facilmente calculables, las probabilidades a priori,p(B1), . . . , p(Bk).

• Son conocidas, o facilmente calculables, las verosimilitudes:p(A|B1), . . . , p(A|Bk), donde A es un suceso correspondiente a resultadosde la segunda etapa.

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

30

Variables aleatorias

• Variable aleatoria: definicion

• Variables aleatorias discretas:

• Funcion de probabilidad

• Funcion de distribucion

• Momentos

• Variables aleatorias continuas:

• Funcion de densidad

• Funcion de distribucion

• Momentos

• Algunas propiedades de la esperanza y la varianza

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

31

Variables aleatoria: definicion

Sea Ω el espacio muestral asociado a cierto experimento aleatorio y F elcorrespondiente conjunto de sucesos.

Se denomina variable aletoria (v.a.) a una funcion X : Ω→ R, que a cadaelemento ei ∈ Ω le asigna un valor numerico X (ei ) = xi ∈ R.

Intuitivamente, una variable aleatoria es una medida o cantidad que varıa enfuncion del resultado concreto ei que se observa al realizar el experimentoaleatorio.

La v.a. se denota con letras mayusculas, mientras que las letras minusculasindican el valor concreto que toma la v.a. cuando se evalua en un puntomuestral.

Ejemplo:Lanzar un dado una vez. Considerar la v.a. X =“resultado de la tirada”.¿Cuantos sucesos elementales hay? ¿Que valores puede tomar X?

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

32

Variables aleatoria: ejemplo

• Experimento aleatorio: lanzamiento de 3 dados

• Espacio muestral: Ω = 111, 112, . . . , 665, 666, de cardinaln(Ω) = 63 = 216

• Variable aleatoria X = numero de unos

X : Ω→ R

X (abc) = 0, ∀a, b, c = 2, 3, . . . , 6

X (1ab) = X (a1b) = X (ab1) = 1, ∀a, b = 2, 3, . . . , 6

X (a11) = X (1a1) = X (11a) = 2, ∀a = 2, 3, . . . , 6

X (111) = 3

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

33

Variables aleatorias: tipos

V.a. discretaSi X toma valores sobre un conjunto S ⊆ R finito o infinito numerable, se diceque X es una variable aleatoria discreta.

V.a. continua

Si X toma valores sobre un conjunto S ⊆ R infinito no numerable (porejemplo, en intervalo o una union de intervalos), se dice que X es una variablealeatoria continua.

El conjunto S ⊆ R se denomina soporte de la variable aleatoria X .

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

34

Variables aleatorias: ejemplos

Variables aleatorias discretas• “resultado al tirar un dado”, con soporte S = 1, 2, 3, 4, 5, 6 finito

• “numero de 1’s obtenidos al lanzar 3 dados”, con soporte S = 0, 1, 2, 3finito

• “numero de coches que pasan por cierto peaje en una semana”, consoporte S = 0, 1, 2, . . . = N ∪ 0 infinito numerable.

Variables aleatorias continuas• “altura de una persona”, puede considerarse S = [0,+∞).

• “el tiempo de reaccion a cierto medicamento”, puede considerarseS = [0,+∞).

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

35

Variables aleatorias discretas

Funcion de probabilidad

Sea X una variable aleatoria discreta que toma valores en el conjuntoS = x1, x2, . . ., finito o infinito numerable, con probabilidadesp1 = P(X = x1), p2 = P(X = x2), . . . .

Se define la funcion de probabilidad de X o funcion de masa de X como

P(X = x) =

pi , si x = xi ∈ S ,0, si x /∈ S .

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

36

Variables aleatorias discretasEjemploX =“numero de 1’s obtenidos al lanzar 3 dados”. ¿Como calculamosprobabilidades de X?

La probabilidad P : F → R definida sobre los elementos de Ω se transmite a X

P(X = 0) = P(abc / a, b, c = 2, . . . , 6) =5

6·5

6·5

6= 0.5787

P(X = 1) = P(1ab ∪ a1b ∪ ab1, a, b = 2, . . . , 6) = 3 ·1

6·5

6·5

6= 0.3472

P(X = 2) = P(a11 ∪ 1a1 ∪ 11a, a = 2, . . . , 6) = 3 ·1

6·1

6·5

6= 0.0695

P(X = 3) = P(111) =1

6·1

6·1

6= 0.0046

x 0 1 2 3P(X = x) 0.5787 0.3472 0.0695 0.0046

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

37

Variables aleatorias discretas

Funcion de probabilidad. Propiedades

X variable aleatoria discreta que toma valores en el conjunto S = x1, x2, . . .con probabilidades p1 = P(X = x1), p2 = P(X = x2), . . . .

• 0 ≤ P(X = x) ≤ 1, para todo x ∈ R.

x∈S

P(X = x) =∑

i

P(X = xi ) =∑

i

pi = 1.

• P(X ∈ A) =∑

x∈A

P(X = x).

• P(X ≤ x) = P(X ∈ (−∞, x ]) =∑

i,xi≤x

P(X = xi ) =∑

i,xi≤x

pi .

• P(X > x) = 1− P(X ≤ x).

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

38

Variables aleatorias discretas

Funcion de probabilidad. Representacion grafica

La funcion de probabilidad se representa mediante un diagrama de barras

Ejemplo

X =“numero de 1’s obtenidos al lanzar 3 dados”

X P(x)

0 0,5787037

1 0,3472222

2 0,0694444

3 0,0046296

0,0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0 1 2 3

Función de probabilidad

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

39

Variables aleatorias discretas

Funcion de distribucionLa funcion de distribucion o funcion de probabilidad acumulada de una variablealeatoria X es una aplicacion F : R→ [0, 1], que a cada valor x ∈ R le asignala probabilidad F (x) = P(X ≤ x) = P(X ∈ (−∞, x ]).

Atencion! F (x) esta definida para todo x ∈ R y no solo para los x ∈ S .

Propiedades

• 0 ≤ F (x) ≤ 1 para todo x ∈ R.

• F (y) = 0 para todo y < min S . Por tanto, F (−∞) = limx→infty = 0.

• F (y) = 1 para todo y ≥ max S . Por tanto, F (∞) = limx→infty = 1.

• Si x1 ≤ x2, entonces F (x1) ≤ F (x2), es decir, F (x) es monotona nodecreciente.

• Para todo a, b ∈ R,P(a < X ≤ b) = P(X ∈ (a, b]) = P((X ∈ (−∞, b]) \ (X ∈ (−∞, a])) =P(X ∈ (−∞, b])− P(X ∈ (−∞, a]) = F (b)− F (a).

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

40

Variables aleatorias discretas

Funcion de distribucion: ejemplo

X =“numero de 1’s al lanzar 3 dados”.

F (x) =

0, si x < 0,

0.5787, si 0 ≤ x < 1,

0.5787 + 0.3472 = 0.9259, si 1 ≤ x < 2,

0.5787 + 0.3472 + 0.0695 = 0.9954, si 2 ≤ x < 3,

0.5787 + 0.3472 + 0.0695 + 0.0046 = 1, si x ≥ 3.

OJO! valores x /∈ S pueden tomar valores F (x) > 0.

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

41

Variables aleatorias discretas

Funcion de distribucion: representacion grafica

Si X es una v.a. discreta, su funcion de distribucion es de tipo escalon(discontinuidades de salto).

Cada escalon corresponde a un xi ∈ S y el salto correspondiente es laprobabilidad P(X = xi ) = pi .

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

42

Momentos de una variable aleatoria discreta

Los momentos sirven para resumir alguna informacion sobre la variablealeatoria

Sea X una v.a. discreta con soporte S = x1, x2, . . . , y funcion deprobabilidad p1 = P(X = x1), p2 = P(X = x2), . . . .

Esperanza de X : momento de primer orden

E (X ) = µ =∑

x∈S

xP(X = x) =∑

i

xiP(X = xi ) =∑

i

xipi

Es una medida de localizacion

En general, se define el momento de orden k como

E (X k) =∑

x∈S

xkP(X = x) =∑

i

xki P(X = xi ) =∑

i

xki pi

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

43

Momentos de una variable aleatoria discreta

X =“numero de 1’s al lanzar 3 dados”, con soporte S = 0, 1, 2, 3El numero esperado de 1’s al lanzar 3 dados equilibrados es:

E (X ) = 0P(X = 0) + 1P(X = 1) + 2P(X = 2) + 3P(X = 3) =

= 0.3472 + 0.139 + 0.0138 = 0.5

X =“resultado de lanzar un dado”, con soporte S = 1, 2, 3, 4, 5, 6, y funcionde probabilidad

x 1 2 3 4 5 6

P(X = x) 16

16

16

16

16

16

Su valor esperado es:

E (X ) =∑

x∈S

x P(X = x) = 1 · 16+ 2 · 1

6+ 3 · 1

6+ 4 · 1

6+ 5 · 1

6+ 6 · 1

6=

=1 + 2 + 3 + 4 + 5 + 6

6=

21

6= 3.5

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

44

Momentos de una variable aleatoria discretaSea X una v.a. discreta con soporte S = x1, x2, . . . , y funcion deprobabilidad p1 = P(X = x1), p2 = P(X = x2), . . . .

Varianza: momento centrado de segundo orden

V (X ) = σ2 = E [(X − E (X ))2] =∑

x∈S

(x − µ)2P(X = x) =∑

i

(xi − µ)2P(X = xi ) =

=∑

i

(xi − µ)2pi =∑

i

x2i pi − µ2 = E (X 2)− E (X )2

Desviacion tıpica: σ =√σ2 =

E [(X − µ)2]

Son medidas de dispersion (alrededor del valor esperado)

En general, se define el momento centrado de orden k como

E ((X−µ)k) =∑

x∈S

(x−µ)kP(X = x) =∑

i

(xi−µ)kP(X = xi ) =∑

i

(xi−µ)kpi

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

45

Momentos de una variable aleatoria discreta

X =“numero de 1’s al lanzar 3 dados”, con soporte S = 0, 1, 2, 3. Suvarianza es:

V (X ) = E((X − µ)2) = (0− 0.5)2 · P(X = 0) + (1− 0.5)2 · P(X = 1)+

+ (2− 0.5)2 · P(X = 2) + (3− 0.5)2 · P(X = 3) =

= 0.25 · 0.5787 + 0.25 · 0.3472 + 2.25 · 0.0695 + 6.25 · 0.0046 = 0.4167

X =“resultado de lanzar un dado”, con soporte S = 1, 2, 3, 4, 5, 6. Suvarianza es:

V (X ) = E((X − µ)2) = E(X 2)− µ2 =∑

x∈S

x2P(X = x)− µ2 =

=1

6

(

1 + 22 + 32 + 42 + 52 + 62)

− 3.52 =91

6− 12.25 = 2.9167

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

46

Esperanza y varianza de una variable aleatoria discreta

Ejemplo

X =“numero de caras al tirar una moneda dos veces”.

El espacio muestral asociado al experimento aleatorio “lanzamiento de dosmonedas” es Ω = (cara, cara), (cara, cruz), (cruz , cara), (cruz , cruz). Lavariable X toma valores en S = 0, 1, 2 con probabilidades P(X = 0) = 1/4,P(X = 1) = 1/4 + 1/4 = 1/2, P(X = 2) = 1/4.

Por tanto, la funcion de probabilidad de X es

x 0 1 2

P(X = x) 14

12

14

Calculamos su esperanza y varianza:

E (X ) =∑

x∈S

x P(X = x) = 01

4+ 1

1

2+ 2

1

4= 1,

V (X ) =∑

x∈S

(x − E (X ))2P(X = x) = (0−1)2

1

4+(1−1)2

1

2+(2−1)2

1

4=

1

2.

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

47

Variables aleatorias continuas

Funcion de densidadLas probabilidades de una variable aleatoria continua se calculan a partir deuna funcion f : R→ [0,+∞) denominada funcion de densidad.

Propiedades

• f (x) ≥ 0 para todo x ∈ R.

•∫∞

−∞f (x) dx = 1, es decir, el area total de la funcion de densidad es 1.

• Para todo a, b ∈ R, P(a ≤ X ≤ b) = P(X ∈ [a, b]) =∫ b

af (x) dx es el

area que determina la funcion de densidad de X sobre el intervalo [a, b].

• Los intervalos [a, b], (a, b), (a, b] y [a, b) tienen la misma probabilidad.

• Soporte de X : S = x ∈ R / f (x) > 0Atencion! La funcion de densidad juega el mismo papel que la funcion deprobabilidad para v.a. discretas.

Solo tiene sentido calcular probabilidades de intervalos: P(X = x) = 0 paratodo x ∈ R .Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

48

Variables aleatorias continuas

Funcion de distribucionPara una v.a. continua X , la funcion de distribucion se define como la funcionF (x) = P(X ≤ x) = P(X ∈ (−∞, x ]) =

∫ x

−∞f (t) dt, para todo x ∈ R.

Igual que en el caso discreto, la funcion F (x) da las probabilidades acumuladashasta el punto x ∈ R, pero ahora se trata de una funcion continua y no de tipoescalon. Dos ejemplos son:

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

49

Variables aleatorias continuas

Propiedades

• 0 ≤ F (x) ≤ 1, para todo x ∈ R.

• F (−∞) = 0.

• F (∞) = 1.

• Si x1 ≤ x2, entonces F (x1) ≤ F (x2), es decir, F (x) es no decreciente.

• Para todo a, b ∈ R, P(a ≤ X ≤ b) = F (b)− F (a).

• La funcion de densidad de X se obtiene derivando la funcion dedistribucion, es decir, f (x) = F ′(x).

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

50

Variables aleatorias continuas

Ejemplo

Una variable aleatoria X tiene funcion de densidad

f (x) =

3 x2, si x ∈ (0, 1),0, si x /∈ (0, 1)

¿Como es la grafica de la funcion de densidad de X?

Indicar cual es el area asociada a la probabilidad P(X > 1/2).

Calcular la probabilidad P(X > 1/2).

Obtener la funcion de distribucion de X .

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

51

Variables aleatorias continuas

Ejemplo

Una variable aleatoria X tiene funcion de densidad

f (x) =

12x2(1− x), si 0 < x < 1,0, en otro caso.

P(X ≤ 0.5) =

∫ 0.5

−∞

f (u)du =

∫ 0.5

0

12u2(1− u)du = 0.3125

P(0.2 ≤ X ≤ 0.5) =

∫ 0.5

0.2

f (u)du =

∫ 0.5

0.2

12u2(1− u)du = 0.2853

F (x) = P(X ≤ x) =

∫ x

−∞

f (u)du =

0, si x ≤ 0,

12(

x3

3 − x4

4

)

, si 0 < x ≤ 1,

1, si x > 1.

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

52

Momentos de una variable aleatoria continua

Sea X una v.a. continua con soporte S ⊆ R, y funcion de densidad f .

Esperanza de X : momento de primer orden

E (X ) = µ =

S

xf (x)dx

Es una medida de localizacion

En general, se define el momento de orden k como

E (X k) =

S

xk f (x)dx

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

53

Momentos de una variable aleatoria continua

Ejemplo

Una variable aleatoria X tiene funcion de densidad

f (x) =

12x2(1− x), si 0 < x < 1,0, en otro caso.

Calculamos su esperanza:

E (X ) =

R

x · f (x)dx =

∫ 1

0

x · 12x2(1− x)dx

=

∫ 1

0

12(x3 − x4)dx = 12(x4

4− x5

5

)∣

1

0= 12

(

1

4− 1

5

)

=3

5

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

54

Momentos de una variable aleatoria continua

Sea X una v.a. continua con soporte S ⊆ R, y funcion de densidad f .

Varianza: momento centrado de segundo orden

V (X ) = σ2 = E [(X − E (X ))2] =

S

(x − µ)2f (x)dx =

= E (X 2)− E (X )2 =

S

x2f (x)dx − µ2

Desviacion tıpica: σ =√σ2 =

E [(X − µ)2]

Son medidas de dispersion (alrededor del valor esperado)

En general, se define el momento centrado de orden k como

E ((X − µ)k) =

S

(x − µ)k f (x)dx

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

55

Momentos de una variable aleatoria continua

Ejemplo

f (x) =

12x2(1− x), si 0 < x < 1,0, en otro caso.

Calculamos su varianza:

var(X ) = E [(X − E (X ))2]

=∫

R(x − E (X ))

2 · f (x)dx

=∫ 1

0

(

x − 35

)2 · 12x2(1− x)dx

=∫ 1

012

(

−x5 + 115 x

4 − 3925x

3 + 925x

2)

dx

= 12(

− 16x

6 + 115

15x

5 − 3925

14x

4 + 925

13x

3)∣

10

= 12(

− 16 + 11

515 − 39

2514 + 9

2513

)

= 0.04

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

56

Ejemplo de repaso: distribucion uniforme en (3,5)

Algunas probabilidades

Una variable aleatoria X que sigue una distribucion uniforme en el intervalo(3, 5) tiene funcion de densidad

f (x) =

15−3 = 1

2 , si x ∈ (3, 5)

0, si x /∈ (3, 5).

dist. uniforme

Calculamos algunas probabilidades:

P(X ≤ 0.5) =∫ 0.5

−∞f (u)du = 0

P(X ≤ 4) =∫ 4

−∞f (u)du =

∫ 4

312du = 1

2u|43 = 12

P(3.5 ≤ X ≤ 4.5) =∫ 4.5

3.5f (u)du =

∫ 4.5

3.512du = 1

2

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

57

Ejemplo de repaso: distribucion uniforme en (3,5)

Funcion de distribucion

F (x) = P(X ≤ x) =

∫ x

−∞

f (u)du = . . .

• Si x ≤ 3 entonces F (x) = P(X ≤ x) = 0.

• Si 3 ≤ x < 5 entonces F (x) = P(X ≤ x) =∫ x

312du = u

2 |x3 = x−32 .

• Si x ≥ 5 entonces F (x) = P(X ≤ x) =∫ 5

312du = u

4

53 = 5−3

2 = 1.

F (x) =

0, si x ≤ 3,x−32 , si 3 < x < 5,

1, si x ≥ 5.

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

58

Ejemplo de repaso: distribucion uniforme en (3,5)

Esperanza

E (X ) =∫

Rx · f (x)dx =

∫ 5

3x · 12dx = x2

4

5

3= 52−32

4 = 4

Varianza

var(X ) =∫

Rx2 · f (x)dx − E 2[X ]

=∫ 5

3x2

2 dx − 42 = x3

6

5

3− 16 = 0.33

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

59

Esperanza de una transformacionSea X una variable aleatoria y sea g(X ) una transformacion de X . Entonces:

E (g(X )) =

x∈S

g(x)P(X = x), si X v.a. discreta

S

g(x)f (x)dx , si X v.a. continua

Ejemplo: si tomamos g(X ) = kX , con k ∈ R constante, entonces

E (kX ) =

x∈S

kxP(X = x) = kE (X ), si X v.a. discreta

S

kxf (x)dx = kE (X ), si X v.a. continua

Para la varianza tenemos,

V (kX ) =

x∈S

(kx − kµ)2P(X = x) = k2V (X ), si X v.a. discreta

S

(kx − kµ)2f (x)dx = k2V (X ), si X v.a. continua

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

60

Algunos modelos probabilısticos

Variables aleatorias discretas mas comunes• Ensayos de Bernoulli

• Distribucion Binomial

• Distribucion de Poisson

Variables aleatorias continuas mas comunes• Distribucion uniforme continua

• Distribucion exponencial

• Distribucion normal

• Teorema Central del Lımite

• Distribuciones asociadas a la normal (Tema 4. Introduccion a la Inferencia Estadıstica)

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

61

Ensayos de Bernoulli

Descripcion / Definicion

Es una forma de modelar estadısticamente cualquier experimento aleatorio quetenga solamente dos resultados posibles, mutuamente excluyentes, que suelenllamarse exito y fracaso, con la condicion de que la probabilidad de estos dosresultados se mantenga constante en cada realizacion del experimento(experimentos o ensayos de Bernoulli).

Si la probabilidad de exito es p (por tanto, la de fracaso es 1− p), se define lavariable aleatoria de Bernoulli como

X =

1, si se observa un exito,0, si se observa un fracaso.

Soporte de X : S = 0, 1, con probabilidades P(X = 0) = 1− p = q,P(X = 1) = p.

Para denotar que X sigue una distribucion Bernoulli de parametro p

escribiremos X ∼ Ber(p).

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

62

Ensayos de Bernoulli

Ejemplo

Resultado de lanzar una moneda al aire

X =

1, sale cara,0, si sale cruz.

Es un ensayo Bernoulli, donde se ha considerado como exito el observar unacara. X sigue una distribucion Bernoulli de parametro 1/2 (si la moneda noesta trucada).

Ejemplo

Una lınea aerea estima que los pasajeros que compran un billete no sepresentan al embarque con una probabilidad de 0.05.Definimos

Y =

1, si el pasajero se presenta,0, si el pasajero no se presenta.

Y sigue una distribucion Bernoulli con parametro 0.95.

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

63

Ensayos de Bernoulli

Funcion de Probabilidad:

P(X = 0) = 1− p P(X = 1) = p

Funcion de distribucion:

F (x) =

0, si x < 01− p, si 0 ≤ x < 11, si x ≥ 1

Propiedades

• E (X ) = 0P(X = 0) + 1P(X = 1) = 0 (1− p) + 1 p = p

• E (X 2) = 02 P(X = 0) + 12 P(X = 1) = 02 (1− p) + 12 p = p

• V (X ) = E (X 2)− E (X )2 = p − p2 = p(1− p) = pq

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

64

Distribucion Binomial

Descripcion / Definicion

Se realizan n ensayos de Bernoulli independientes con la misma probabilidad deexito p. La v.a. X que cuenta el numero de exitos observados en estos nensayos se dice que sigue una distribucion Binomial de parametros n y p y seescribe X ∼ B(n, p).

La v.a. X toma valores en S = 0, 1, 2, . . . , n y su funcion de probabilidadviene dada por la formula

P(X = x) =(n

x

)

px (1− p)n−x , x = 0, 1, . . . , n, 0 ≤ p ≤ 1,

donde(

nx

)

= n!x!(n−x)! , para 0 ≤ x ≤ n. Recordad que, por convenio, 0! = 1.

Propiedades

E (X ) = np, V (X ) = np(1− p) = npq.

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

65

Distribucion Binomial

Ejemplo

La lınea aerea del ejemplo anterior ha vendido 80 billetes para un vuelo. Laprobabilidad de que un pasajero no se presente al embarque es de 0.05.Definimos X = numero de pasajeros que se presentan al embarque. Entonces(suponiendo independencia)

X ∼ B(80, 0.95)

• La probabilidad de que los 80 pasajeros se presenten es

P(X = 80) =

(

80

80

)

0.9580 × (1− 0.95)80−80 = 0.0165

• La probabilidad de que al menos un pasajero no se presente es

P(X < 80) = 1− P(X = 80) = 1− 0.0165 = 0.9835

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

66

Distribucion Binomial: funcion de probabilidadLa funcion de probabilidad de X ∼ B(80, 0.95) es

68 70 72 74 76 78 80

0.0

00

.05

0.1

00

.15

0.2

0

Binomial Distribution: Trials = 80, Probability of success = 0.95

Number of Successes

Pro

ba

bili

ty M

ass

Cambiando la probabilidad de exito:

25 30 35 40 45 50 55

0.0

00

.02

0.0

40

.06

0.0

8

Binomial Distribution: Trials = 80, Probability of success = 0.5

Number of Successes

Pro

ba

bili

ty M

ass

5 10 15

0.0

00

.05

0.1

00

.15

Binomial Distribution: Trials = 80, Probability of success = 0.1

Number of Successes

Pro

ba

bili

ty M

ass

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

67

Distribucion de Poisson: sucesos raros

Descripcion / Definicion

Cuenta el numero de sucesos raros que ocurren en una determinada unidad detiempo o de espacio. Por ejemplo, llamadas de telefono en una hora, erratas enuna pagina, accidentes de trafico a la semana, . . .

Una v.a. X sigue una distribucion de Poisson de parametro λ, y se denotarapor X ∼ Pois(λ), si su funcion de probabilidad es

P(X = x) = e−λ λx

x!, para x = 0, 1, 2, . . .

Observad que X toma valores en S = 0, 1, 2, . . . = N ∪ 0.

Propiedades

E (X ) = λ, V (X ) = λ.

λ representa el numero medio de sucesos que se producen por unidad detiempo o de espacio.

Exponencial

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

68

Distribucion de Poisson: sucesos raros

Propiedad de la Poisson

Si X ∼ Pois(λ) y representa el numero de sucesos raros en una unidad detiempo o de espacio, e Y es una variable aleatoria que representa el numero dedichos sucesos raros en s unidades, se tiene que:

Y ∼ Pois(sλ)

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

69

Distribucion de Poisson: sucesos raros

Ejemplo

El numero medio de erratas por transparencias es de 0.2. Sea X es la v.a. quecuenta el numero de erratas por transparencia, entonces

X ∼ Pois(0.2)

¿Cual es la probabilidad de que en una transparencia no haya erratas?

P(X = 0) = e−0.2 0.20

0!= e−0.2 = 0.8187.

¿Cual es la probabilidad de que en 4 transparencias haya exactamente unaerrata?Sea Y la v.a. que cuenta el numero de erratas en 4 transparencias. Entonces:

Y ∼ Pois(0.2 · 4) = Pois(0.8)

P(Y = 1) = e−0.8 0.81

1!= e−0.8 0.8 = 0.3595.

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

70

Distribucion uniforme

Descripcion / Definicion

Se dice que una variable X sigue una distribucion uniforme en el intervalo(a, b), y se denota por X ∼ U(a, b), si su funcion de densidad es

f (x) =

1b−a

, si x ∈ (a, b),

0, si x /∈ (a, b).

Esta v.a. queda definida por los extremos del intervalo, es decir, a y b son susparametros.

Propiedades

E (X ) = a+b2 , V (X ) = (b−a)2

12 .

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

71

Distribucion uniforme

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

72

Distribucion exponencial

Descripcion / Definicion

La distribucion exponencial es aquella que modela el tiempo transcurrido entredos sucesos que se producen de forma independiente, separada y uniforme enel tiempo.

Se dice que una v.a. X sigue una distribucion exponencial de parametro λ, yse denota por X ∼ exp(λ), si su funcion de densidad es

f (x) = λ e−λx , para x ≥ 0.

Observad que X toma valores en el conjunto S = [0,+∞).

Ejemplos• Tiempo entre llegadas de camiones al punto de descarga.

• Tiempo entre llamadas de emergencia.

• Tiempo de vida de una bombilla.

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

73

Distribucion exponencial

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

74

Distribucion exponencial

Propiedades

• E (X ) = 1λ

• V (X ) = 1λ2

• Funcion de distribucion:

F (x) =

1− e−λx , si x ≥ 0,0, si x < 0.

• Esta relacionada con la distribucion de Poisson. Poisson

• λ es el numero medio de ocurrencias del suceso por unidad de tiempo.

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

75

Distribucion exponencial

Ejemplo

Hemos observado que en cierta provincia se producen, en promedio, 50incendios serios cada ano. Suponemos que estos incendios se producen deforma independiente y decidimos modelar el numero de incendios por anomediante una distribucion Poisson.

• ¿Cual es el tiempo medio que transcurre entre dos incendios consecutivos?

• Si acaba de ocurrir un incendio ¿cual es la probabilidad de que el proximose produzca al cabo de dos semanas?

Sabemos que:

• El numero de incendios por ano N ∼ Pois(λ) con λ = 50.

• El tiempo entre dos incendios X ∼ exp(λ) con λ = 50.

• El tiempo medio entre dos incendios E (X ) = 1λ= 1/50 anos, 7.3 dıas.

• Dos semanas, en anos son: 2·7365 = 0.03836,

• P[X > 0.03836] = 1− P[X ≤ 0.03836] = 1− (1− e−50·0.03836) = 0.147.

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

76

Distribucion normal

Descripcion / Definicion

La distribucion normal describe una variable aleatoria “ideal”. Se trata de unmodelo teorico que aproxima bien muchas situaciones reales.La inferencia estadıstica se fundamenta basicamente en la distribucion normaly en distribuciones que se derivan de ella.

Se dice que una v.a. X sigue una distribucion normal o gausiana conparametros µ y σ, y se denota por X ∼ N (µ, σ), si su funcion de densidad es

f (x) =1

σ√2π

exp

− 1

2σ2(x − µ)2

Propiedades

E (X ) = µ, V (X ) = σ2.

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

77

Distribucion normal

Funcion de densidad para 3 valores distintos de µ y σ

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

78

Distribucion normal

Propiedad

Si X ∼ N (µ, σ), entonces:

• P(µ− σ < X < µ+ σ) ≈ 0.683

• P(µ− 2σ < X < µ+ 2σ) ≈ 0.955

• P(µ− 3σ < X < µ+ 3σ) ≈ 0.997

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

79

Distribucion normal

Transformacion lineal

Y = a+ b X ∼ N (a+ bµ, |b|σ)

Estandarizacion o Tipificacion

Si X ∼ N (µ, σ), considero

Z =X − µ

σ∼ N (0, 1)

Se llama distribucion normal estandar.

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

80

Distribucion normal: EjemploSea Z ∼ N(0, 1). Calculemos algunas probabilidades:

P(Z < 1.5) = 0.9332 = DISTR.NORM(1.5;0;1;VERDADERO)

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

81

Distribucion normal: Ejemplo (cont.)

P(Z > −1.5) = P(Z < 1.5) = 0.9332 ¿por que?

P(Z < −1.5) = P(Z > 1.5) = 1− P(Z < 1.5) =

= 1− 0.9332 = 0.0668 ¿por que no ≤ ?

P(−1.5 < Z < 1.5) = P(Z < 1.5)− P(Z < −1.5) =

= DISTR.NORM(1.5;0;1;VERDADERO)− DISTR.NORM(-1.5;0;1;VERDADERO)

= 0.9332− 0.0668 = 0.8664

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

82

Distribucion normal: Ejemplo

Sea X ∼ N(µ = 2, σ = 3). Para calcular P(X < 4), si no tenemos ordenador,hay que recurrir a las tablas de la distribucion normal estandar. Para ello,tipificamos la variable original:

P(X < 4) = P

(

X − 2

3<

4− 2

3

)

= P(

Z < 0.666)

≈ 0.7454

donde Z ∼ N(0, 1)

¿Cual es P(−1 < X < 3.5)?

P(−1 < X < 3.5) = P(−1− 2 < X − 2 < 3.5− 2) =

P

(−1− 2

3<

X − 2

3<

3.5− 2

3

)

= P(−1 < Z < 0.5) =

P(Z < 0.5)− P(Z < −1) = 0.6915− 0.1587 = 0.5328

donde Z ∼ N(0, 1)

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

83

Distribucion normal: Ejemplo (cont.)

Sea X ∼ N(µ = 2, σ = 3). Si usamos Excel no hace falta tipificar X .Directamente calculamos

P(X < 4) = DISTR.NORM(4;2;3;VERDADERO) = 0.7475

P(−1 < X < 3.5) = P(X < 3.5)− P(X < −1) =

= DISTR.NORM(3.5;2;3;VERDADERO)− DISTR.NORM(-1;2;3;VERDADERO) =

= 0.6915− 0.1587 = 0.5328

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

84

Distribucion normal: otro ejemplo

Es difıcil etiquetar la carne empaquetada con su peso correcto debido a losefectos de perdida de lıquido (definido como porcentaje del peso original de lacarne). Supongamos que la perdida de lıquido en un paquete de pechuga depollo puede modelarse mediante una distribucion normal con media 4% ydesviacion tıpica 1%.Sea X la perdida de lıquido de un paquete de pechuga de pollo elegido al azar.

• ¿Cual es la probabilidad de que 3% < X < 5%?

• ¿Cual es el valor de x para que un 90% de paquetes tengan perdidas delıquido menores que x?

• En una muestra de 4 paquetes, hallar la probabilidad de que todos tenganperdidas de peso de entre 3% y 5%.

Sexauer, B. (1980) Drained-Weight Labelling for Meat and Poultry: An Economic

Analysis of a Regulatory Proposal, Journal of Consumer Affairs, 14, 307-325.

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

85

Distribucion normal: otro ejemplo (cont.)

La variable aleatoria X sigue una distribucion N(4, 1). Entonces:

P(3 < X < 5) = P(X < 5)− P(X < 3) =

= DISTR.NORM(5;4;1;VERDADERO)− DISTR.NORM(3;4;1;VERDADERO) =

= 0.8413− 0.1587 = 0.6827

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

86

Distribucion normal: otro ejemplo (cont.)

Queremos encontrar el valor de x0 para el que P(X < x0) = 0.9. Tenemos quecalcular la funcion inversa de la funcion de distribucion de X . En Excel

x0 = DISTR.NORM.INV(0,9;4;1) = 5.2816

Conclusion: un 90% de los paquetes tienen perdidas de menos del 5.28%.

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

87

Distribucion normal: otro ejemplo (cont.)

Todas las probabilidades normales anteriores se pueden obtener a partir de lanormal estandar como sigue.

P(3 < X < 5) = P

(

3− 4

1<

X − 4

1<

5− 4

1

)

= P(−1 < Z < 1)

= P(Z < 1)− P(Z < −1) = 0.8413− 0.1587 = 0.6827

Queremos P(X < x) = 0.9. Entonces

P

(

X − 4

1<

x − 4

1

)

= P(Z < x − 4) = 0.9

Mirando las tablas, tenemos x − 4 ≈ 1.28 que implica que un 90% de laspaquetes tienen perdidas de menos de x = 5.28%.

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

88

Distribucion normal: otro ejemplo (cont.)

binomial

Y = numero de paquetes en la muestra que tienen perdidas de entre 3% y 5%.Y ∼ B(4, p), siendo

p = P(exito) = P(perdida de peso entre 3% y 5%) = P(3 < X < 5) = 0.6827

Entonces,

P(Y = 4) =

(

44

)

0.68274(1− 0.6827)4 = 0.2172

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

89

Teorema Central del Lımite (TCL)El siguiente teorema nos habla de la distribucion de la media de un conjuntode v.a. independientes e identicamente distribuidas (i.i.d.), es decir, todas conla misma ley de probabilidad,

X =1

n

n∑

i=1

Xi

y nos dice que, para n grande, la media de v.a. independientes e igualmentedistribuidas es normal, sea cual sea la distribucion de las v.a.De aquı el papel “central” que juega la distribucion normal o de Gauss.

Teorema

Sean X1,X2, . . . ,Xn v.a. i.i.d. con media µ y desviacion tıpica σ (ambasfinitas). Si n es suficientemente grande, se tiene que

X − µ

σ/√n∼ N (0, 1)

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

90

Aproximaciones

Binomial (Teorema de De Moivre-Laplace)

Si X ∼ B(n, p) con n suficientemente grande

X − np√

np(1− p)∼ N (0, 1)

Poisson

Si X ∼ Pois(λ) con λ suficientemente grande

X − λ√λ

∼ N (0, 1)

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

91

TCL y aproximaciones: EjemploSea X ∼ B(100, 1/3). Estimar P(X < 40).

binomial propiedades

Calculamos primero la media y varianza de X .

E (X ) = 100× 1

3= 33.3

var(X ) = 100× 1

3× 2

3= 22.2

D.T .(X ) =√

22.2 = 4.714

Usamos la aproximacion normal

P(X < 40) = P

(

X − 33.3

4.714<

40− 33.3

4.714

)

≈ P (Z < 1.414) ≈ 0.921,

donde Z ∼ N(0, 1).

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

92

Vectores aleatorios

• Concepto de vector aleatorio.

• Vectores aleatorios discretos: distribucion conjunta, distribucionesmarginales, distribuciones condicionadas, independencia.

• Vectores aleatorios continuos: distribucion conjunta, distribucionesmarginales, distribuciones condicionadas, independencia.

• Covarianza, correlacion y esperanza condicionada.

• Algunas propiedades de la esperanza y la varianza

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

93

Concepto de vector aleatorio

¿Que relacion hay entre el precio de las acciones y los tipos de interes?

¿Que relacion hay entre los anos de escolarizacion y el salario medio por hora?

¿Como influye en los habitos de consumo la cantidad de tarjetas de credito de

las que se dispone?

Para contestar a estas preguntas necesitamos estudiar conjuntamente estascaracterısticas, ¿como?

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

94

Concepto de vector aleatorio

Se denomina vector aleatorio (o v.a. multidimensional) a una funcion(X1, . . . ,Xn) : Ω→ R

n, que a cada elemento ei ∈ Ω le asigna un vectornumerico (X1, . . . ,Xn)(ei ) = (X1(e1), . . . ,Xn(ei )) ∈ R

n.

X1(e1), . . . ,Xn(ei ) representan las n caracterısticas que queremos analizarconjuntamente.

Para ganar claridad nos restringiremos al caso n = 2,

Denotaremos los vectores aleatorios por las letras mayusculas (X ,Y ).

Las letras minusculas (x , y) indican el valor concreto que toma el vectoraleatorio cuando se evalua en un punto muestral.

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

95

Vectores aleatorios: tipos

Vector aleatorio discreto

Un vector aleatorio (X ,Y ) es discreto cuando solo puede tomar un numerofinito o numerable de valores.

Vector aleatorio continuo

Un vector aleatorio (X ,Y ) es continuo cuando los posibles valores que puedetomar son todos los puntos de R

2, o del cuadrante [0,+∞)× [0,+∞), o deun cuadrado, o de un triangulo etc.

El conjunto de valores S ⊆ R2 que puede tomar se denomina soporte del

vector aleatorio (X ,Y ).

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

96

Vectores aleatorios: ejemplos

Vectores aleatorios discretos• “numero de 1’s y 2’s obtenidos al lanzar 3 dados”, con soporteS ⊆ 0, 1, 2, 3 × S = 0, 1, 2, 3 finito

• “numero de coches que pasan por cierto peaje en un dıa y dıa de lasemana de que se trata”, con soporte S = 0, 1, 2, . . . × 1, . . . , 7,donde 1 = lunes, . . . , 7 =domingo.

• “numero de tarjetas de credito y numero de compras que se realizan a lasemana”, con soporte S = 0, 1, 2, . . . ,M1 × 0, 1, . . . ,M2

Vectores aleatorios continuos• “altura y peso de una persona”

• “anos de escolarizacion y salario medio por hora de una persona”

• “ındice compuesto S&P 500 (1941-1943=10) y tipo (%) de las Letras delTesoro estadounidense a tres anos en un ano”

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

97

Vectores aleatorios discretos: distribucion conjuntaFuncion de probabilidad (o de masa) conjunta de (X ,Y )Determina el modelo de probabilidad conjunta de un vector aleatorio discreto.Nos da la probabilidad de cada uno de los posibles valores que puede tomar:

p(xi , yj) = P(X = xi ,Y = yj), (xi , yj) ∈ S = x1, . . . , xm × y1, . . . , ynRepresentacion

y1 · · · yj · · · yn

x1...

......

xi · · · · · · P(X = xi ,Y = yj) · · · · · ·...

...

xm...

Propiedades• 0 ≤ p(xi , yj) ≤ 1 para todo i = 1, . . . ,m, j = 1, . . . , n.

•∑m

i=1

∑nj=1 p(xi , yj) = 1.

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

98

Vectores aleatorios discretos: distribucion conjuntaSe clasifica un grupo de 100 ejecutivos de acuerdo a su peso y a si sufren o node hipertension. La tabla muestra el numero de ejecutivos en cada categorıa.

Insuficiente Normal Sobrepeso Total

Hipertenso 2 8 10 20Normal 20 45 15 80

Total 22 53 25 100

• Experimento aleatorio: seleccionar al azar a uno de esos 100 ejecutivospara medir su tension y su peso.

• (X ,Y ) : Ω→ 0, 1 × 0, 1, 2, siendo Ω el conjunto de los 100ejecutivos, definido por

(X ,Y )(ei ) = (0, 0), si el individuo ei es Hipertenso y de peso Insuf.

(X ,Y )(ei ) = (0, 1), si ei es Hipertenso y de peso Normal

(X ,Y )(ei ) = (0, 0), si ei es Hipertenso y tiene Sobrepeso

(X ,Y )(ei ) = (1, 0), si ei tiene la tension Normal y es de peso Insuf.

(X ,Y )(ei ) = (1, 1), si ei tiene la tension Normal y es de peso Normal

(X ,Y )(ei ) = (1, 0), si ei tiene la tension Normal y tiene Sobrepeso

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

99

Vectores aleatorios discretos: distribucion conjunta

La funcion de de probabilidad (o de masa) conjunta es:

X \ Y 0 1 20 0.02 0.08 0.11 0.2 0.45 0.15

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

100

Vectores aleatorios discretos: distribuciones marginales

Las distribuciones marginales de un vector aleatorio (X ,Y ) son las que seobtienen al considerar cada caracterıstica por separado (como si la otra noexistiera). En el caso discreto tenemos:

• Distribucion marginal de X : v.a. discreta con funcion de probabilidad

pX (xi ) = P(X = xi ) =

n∑

j=1

P(xi , yj), i = 1, . . .m

• Distribucion marginal de Y : v.a. discreta con funcion de probabilidad

pY (yj) = P(Y = yj) =

m∑

i=1

P(xi , yj), j = 1, . . . n

Las distribuciones marginales de X e Y son simplemente v.a. unidimensionalesdiscretas. Podemos obtener su media, su varianza, etc.

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

101

Vectores aleatorios discretos: distribuciones marginales

En el ejemplo anterior las distribuciones marginales de X e Y son:

X \ Y 0 1 2 pX0 0.02 0.08 0.1 0.21 0.2 0.45 0.15 0.8

pY 0.22 0.53 0.25

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

102

Vectores aleatorios discretos: distribuciones condicionadas

La distribucion de la v.a. X , condicionada por un valor fijo yj de la v.a. Y talque P(Y = yj) > 0, viene dada por la funcion de probabilidad

P(X = xi |Y = yj) =P(X = xi ,Y = yj)

P(Y = yj)=

p(xi , yj)

pY (yj), i = 1, . . . ,m

La distribucion de Y condicionada por X = xi (con PX (xi ) > 0) se define deforma analoga

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

103

Vectores aleatorios discretos: distribuciones condicionadas

Volviendo al ejemplo:

X \ Y 0 1 2 pX

0 0.02 0.08 0.1 0.21 0.2 0.45 0.15 0.8

pY 0.22 0.53 0.25

• Distribucion de X condicionada a que el individuo tiene sobrepeso:

X 0 1

p(X = xi |Y = 2) 0.10.25 = 0.4 0.15

0.25 = 0.6

• Distribucion de Y condicionada a que el individuo tiene hipertension:

Y 0 1 2

p(Y = xj |X = 0) 0.020.2 = 0.1 0.08

0.2 = 0.4 0.10.2 = 0.5

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

104

Vectores aleatorios discretos: independencia

Intuitivamente: no hay relacion entre X e Y

Definicion: dos variables aleatorias discretas, X e Y , son independientescuando

p(xi , yj) = P(X = xi ,Y = yj) = P(X = xi )P(Y = yj) = pX (xi )pY (yj), ∀i , ∀j

Propiedades: Si X e Y son independientes, las distribuciones condicionadascoinciden con las marginales correspondientes

P(X = xi |Y = yj) =P(X = xi ,Y = yj)

P(Y = yj)=

p(xi , yj)

pY (yj)=

pX (xi )pY (yj)

pY (yj)= pX (xi )

para todo i = 1, . . . ,m, y para todo valor yj con P(Yj = yj) > 0.En el ejemplo, X e Y no son independientes.

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

105

Vectores aleatorios discretos: ejemplo

Lanzamos 3 veces una moneda equilibrada y consideramos el vector aleatorio(X ,Y ) que se obtiene definiendo:X =”numero de caras”Y =”diferencia, en valor absoluto, entre numero de caras y de cruces

• Determina el espacio muestral del experimento y define la aplicacioncorrespondiente al vector aleatorio (X ,Y )

• Calcula la funcion de probabilidad conjunta de (X ,Y )

• Obten las distribuciones marginales a partir de la distribucion conjunta

• Si estamos interesados en conocer la probabilidad de obtener un numerodeterminado de caras cuando la diferencia entre caras y cruces es 1, ¿quedistribucion tenemos que obtener? obtenla.

• ¿Son independientes X e Y ?

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

106

Vectores aleatorios continuos: distribucion conjunta

Funcion de densidad conjunta de (X ,Y )Determina el modelo de probabilidad conjunta de un vector aleatorio continuo.Se trata de una funcion f : R2 → R

2 verificando:

• f (x , y) ≥ 0 para todo (x , y) ∈ R2.

• El volumen total bajo la funcion de densidad es 1:

R2

f (x , y) dx dy =

∫ ∞

−∞

∫ ∞

−∞

f (x , y) dx dy = 1

La probabilidad de cualquier suceso A ⊆ R2 se obtiene resolviendo la integral

correspondiente:

P(A) =

A

f (x , y) dx dy

Nota. No se exigira que se sepan resolver integrales dobles. No se pediracalcular probabilidades de sucesos A en R

2

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

107

Vectores aleatorios continuos: distribuciones marginales

Las distribuciones marginales de un vector aleatorio (X ,Y ) son las que seobtienen al considerar cada caracterıstica por separado (como si la otra noexistiera). En el caso continuo tenemos:

• Distribucion marginal de X : v.a. continua con funcion de densidad

fX (x) =

R

f (x , y)dy , ∀ x ∈ R

• Distribucion marginal de Y : v.a. continua con funcion de densidad

fY (y) =

R

f (x , y)dx , ∀ y ∈ R

Las distribuciones marginales de X e Y son simplemente v.a. unidimensionalescontinuas. Podemos obtener su media, su varianza, etc.

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

108

Vectores aleatorios discretos: distribuciones marginalesNota. Al integrar con respecto a una de las dos variables, la otra actua comouna constante.Sea (X ,Y ) el vector aleatorio con soporte S = [0, 1]× [0, 1] y funcion dedensidad conjunta

f (x , y) =

x + y , si 0 ≤ x ≤ 1, 0 ≤ y ≤ 1,

0, en otro caso.

• La densidad marginal de X es:

fX (x) =

∫ 1

0

(x + y)dy =

[

xy +y2

2

]y=1

y=0

= x +1

2, 0 ≤ x ≤ 1

En la integral anterior x actua como una constante.• La densidad marginal de Y es:

fY (y) =

∫ 1

0

(x + y)dx =

[

x2

2+ xy

]x=1

x=0

=1

2+ y , 0 ≤ y ≤ 1

En la integral anterior y actua como una constante.Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

109

Vectores aleatorios continuos: distribuciones condicionadas

La distribucion de la v.a. X , condicionada por un valor fijo y0 de la v.a. Y talque fY (y0) > 0, viene dada por la funcion de densidad

f (x |Y = y0) =f (x , y0)

fY (y0), ∀x ∈ R

La distribucion de Y condicionada por X = x0 (con fX (x0) > 0) se define deforma analogaVolviendo al ejemplo:

f (x |Y = 0.2) =f (x , 0.2)

fY (0.2)=

x + 0.2

0.7, 0 ≤ x ≤ 1

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

110

Vectores aleatorios discretos: independencia

Intuitivamente: no hay relacion entre X e Y

Definicion: dos variables aleatorias continuas, X e Y , son independientescuando

f (x , y) = fX (x)fY (y), ∀ x ∈ R, y ∈ R

Propiedades: Si X e Y son independientes, las distribuciones condicionadascoinciden con las marginales correspondientes

f (x |Y = y0) =f (x , y0)

fY (y0)= fX (x), ∀ x ∈ R

En el ejemplo, X e Y no son independientes:

f (x , y) = x + y 6= (x +1

2)(1

2+ y)

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

111

Covarianza, correlacion y esperanza condicionadaSe define la covarianza entre X e Y como

Cov(X ,Y ) = σXY = E [(X − E [X ])(Y − E [Y ])] = E [XY ]− E [X ]E [Y ]

• Si X e Y son v.a. discretas, entonces

Cov(X ,Y ) =m∑

i=1

n∑

j=1

(xi − E [X ])(yj − E [Y ])p(xi , yj) =

=m∑

i=1

n∑

j=1

xiyjp(xi , yj)− E [X ]E [Y ]

• Si X e Y son v.a. continuas, entonces

Cov(X ,Y ) =

R2

(x − E [X ])(y − E [Y ])f (x , y) dx dy =

=

R2

xyf (x , y) dx dy − E [X ]E [Y ]

En este caso, no se pedira que se calculen covarianzas, dado que implican laintegracion en R2

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

112

Covarianza, correlacion y esperanza condicionadaLa covarianza es una medida de asociacion lineal

Cuando Cov(X ,Y ) = 0 se dice que X e Y estan incorreladasSean X e Y variables aleatorias, la correlacion entre X e Y es

Cor(X ,Y ) = rxy =Cov(X ,Y )

σxσy

donde σX =√

V (X ) y σY =√

V (Y ) denotan, respectivamente, lasdesviaciones tıpicas de las distribuciones marginales X e Y .Propiedades

• Si X e Y son independientes, entonces X e Y estn incorreladas

• En general, Cov(X ,Y ) = 0 no implica independencia.

• Si X e Y son normales y Cov(X ,Y ) = 0, entonces son independientes

• −1 ≤ Cor(X ,Y ) ≤ 1

• Cor(X ,Y ) > 0 ⇒ las variables son dependientes positivamente

• Cor(X ,Y ) < 0 ⇒ las variables son dependientes negativamente

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

113

Covarianza, correlacion y esperanza condicionadaDado le vector aleatorio (X ,Y ), las variables aleatorias:

• X , condicionada por un valor fijo y0 de la v.a. Y potencialmente

observable

• Y , condicionada por un valor fijo x0 de la v.a. X potencialmente

observable

son variables aleatorias unidimensionales continuas o discretas dependiendo dela naturaleza de X e Y . Podemos calcular sus medias y varianzas.Se define la esperanza condicionada de X a un valor de Y como

E (X |Y = y0) =

∑mi=1 xiP(X = xi |Y = y0), si (X ,Y ) es discreto,

Rxf (x |Y = y0) dx , si (X ,Y ) es continuo

Para cada valor fijo y0 de Y , la esperanza condicionada es un numeroSe puede definir la funcion esperanza condicionada:

E (X |Y ) : Sop(Y ) → R

y0 → E (X |Y = y0)

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

114

Algunas propiedades de la esperanza y la varianza

Como ya vimos en el caso unidimensional, la esperanza de cualquier funciong(X ,Y ) se obtiene como

E [g(X ,Y )] =m∑

i=1

n∑

j=1

g(xi , yj)p(xi , yj) si (X ,Y ) es discreto

E [g(X ,Y )] =

R2

g(x , y) · f (x , y)dxdy si (X ,Y ) es continuo

Ejemplo Esperanza del producto

E [XY ] =

∑mi=1

∑nj=1 xiyjp(xi , yj), si (X ,Y ) es discreto,

R2 xyf (x , y) dx dy , si (X ,Y ) es continuo.

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1

115

Algunas propiedades de la esperanza y la varianza

Esperanza y varianza de funciones lineales

• E [X + Y ] = E [X ] + E [Y ]

• E [X − Y ] = E [X ]− E [Y ]

• V [X ± Y ] = V [X ] + V [Y ]± 2 · Cov(X ,Y )

Si Cov(X ,Y ) = 0V [X ± Y ] = V [X ] + V [Y ]

• E [X1 + X2 + . . .+ Xn] = E [X1] + E [X2] + . . .+ E [Xn]

• V [X1 + X2 + . . .+ Xn] = V [X1] + V [X2] + . . .+ V [Xn]

si la covarianza entre cada par de variables es 0

Estadıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 1