repaso probabilidades

49
Econometra I 2. Repaso de Probabilidad Rafael SÆnchez F. Agosto 2015 Rafael SÆnchez F. (UAI) Econometra I Agosto 2015 1 / 49

Upload: sebastian-alejandro-guevara-rivano

Post on 01-Sep-2015

251 views

Category:

Documents


3 download

DESCRIPTION

Aspectos básicos sobre probabilidades

TRANSCRIPT

  • Econometra I2. Repaso de Probabilidad

    Rafael Snchez F.

    Agosto 2015

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 1 / 49

  • Introduccin

    La teora econmica sugiere importantes relaciones entre variables, amenudo con implicancias de poltica pblica, sin embargopracticamente nunca sugiere las magnitudes de los efectos causales.

    Para estimar dichas magnitudes, idealmente a uno le gustara contarcon un experimento (similares a los utilizados con los frmacos enbio-qumica y medicina).

    Sin embargo rara vez ello ocurre con economa. Mucho mas comnen economa es contar con datos quasi-experimentales (tambinconocidos como observacionales).

    Por ello es que este curso introductorio se centra en herramientas ymetodologas que buscan lidiar de la mejor forma posible con lasdicultades que surgen al utilizar datos quasi-experimentales paraestimar efectos causales.

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 2 / 49

  • Introduccin (cont.)

    Ya vimos una pequea introduccin en la clase anterior, sin embargopara poder avanzar de mejor manera en el curso, antes de entrar delleno al contenido realizaremos un breve repaso de probabilidades yestadstica. Ntese la palabra breve.Este repaso DEBE ser complementado con las lecturas sealadas en elprograma del curso u otras adicionales si el alumno lo estimaconveniente. Ello es particularmente importante si el alumnoencuentra que su conocimiento de estadstica es dbil e incompleto.

    Para el que esta con conociemientos muy dbiles se recomiendarepasar de su material del curso estadstica II.

    Para estar mas seguros del manejo de esta materia el primer controldel curso ser de probabilidad y estadstica. Adicionalmente losalumnos contarn con una ayudanta y una gua de ejercicios del tema(Gua 1 en webcursos).

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 3 / 49

  • Motivacin

    Comencemos con una pregunta emprica para motivar el repaso:

    Cul es el efecto de reducir el tamao de la clase en un estudiantepor curso sobre los puntajes del SIMCE?....Cual sera el efecto dereducir la clase en 8 alumnos por curso?

    Para responder esta pregunta debemos utilizar datos......o existe otraforma de responder esta pregunta?....

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 4 / 49

  • Motivacin (cont.)

    Con un Grco?

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 5 / 49

  • Motivacin (cont.)

    Quizs con alguna medida numrica?....por ejemplo mostrando queaquellas comunas con escuelas con menos estudiantes por curso les vamejor en el SIMCE? (Clculo de promedios)

    Quizs podramos calcular los puntajes SIMCE promedio de aquellascomunas que tienen escuelas con cursos pequeos versus aquellas concursos grandes y de ah pdramos testear la hiptesis nula de queambos promedios son similares versus la hiptesis alternativa de queambos son diferentes? (test de hiptesis)

    Los mecanismos de estimacin y test de hiptesis deberan serfamiliares.

    Estos conceptos sern relevantes para el anlisis de regresin queviene a continuacin en el curso.

    Debido a ello revisaremos brevemente la teora que esta detrs de laestimacin y test de hiptesis para luego extender el anlisis almodelo de regresin.

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 6 / 49

  • Motivacin (cont.)

    Por lo tanto lo que viene a continuacin es:

    1 Conceptos bsicos de probabilidad para inferencia estadistica2 Estimacin3 Testeo de hiptesis.

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 7 / 49

  • Conceptos Bsicos

    El gnero de la prxima persona que conozca, su calicacin en unexamen y el nmero de veces que su computador se estropearamientras redacta un trabajo, presentan todos ellos un componente deazar o aleatoriedad.En cada uno de estos ejemplos, existe algo que no es todavaconocido pero que a la larga se revelar.Los resultados potencialmente excluyentes de un proceso aleatorio sedenominan resultados. Por ejemplo su computador puede noestropearse nunca, o puede estropearse 2 veces, etc. Solo uno deestos resultados puede ocurrir en realidad (los resultados sonmutuamente excluyentes), y los resultados no necesariamente sonigualmente probables.La probabilidad de un resultado es la proporcin de veces que elresultado ocurre a largo plazo. Si la probabilidad de que sucomputador no se estropee mientras redacta un documento es del80%, entonces durante el proceso de redactar muchos trabajos el 80%de las veces terminar sin averas.

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 8 / 49

  • Conceptos Bsicos (cont.)

    Variables aleatorias (v.a.): Una variable aleatoria puede ser discretao continua. Una v.a. discreta es un resumen numrico de unresultado aleatorio. El nmero de veces que su computador seestropea mientras redacta un documento es aleatorio y toma un valornumrico, por lo que es una v.a..

    Una v.a. discreta toma valores solamente sobre un conjunto discreto,como: 0,1, 2, .... etc, mientras que una v.a. contnua toma valores enun contnuo de posibles valores.

    En el ejemplo del tamao de la clase sobre los puntajes SIMCEtendramos como variables aleatorias: el promedio de los tamaos delas clases de cada colegio de la comuna y tambin el promedio de lospuntajes SIMCE de cada colegio de la comuna.

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 9 / 49

  • Conceptos Bsicos (cont.)

    Otro ejemplo: si se dene la variable aleatoria X = nmero de puntosen la cara del dado que d hacia arriba en un lanzamiento tendremosque esta variable aleatoria X podr tomar uno de los siguientesvalores = {1,2,3,4,5,6}.

    Es decir, se sabe que ser uno de esos valores pero no se sabe cul deellos ocurrir en el lanzamiento del dado (por eso es aleatoria). En elcaso del lanzamiento de una moneda X={0=cara, 1=sello}. No sesabe cual va a salir, pero uno de esos dos resultados se tiene que dar.

    En el caso de una aerolinea, la variable aleatoria es cuntas personasutilizaran su reserva del pasaje. Ello por cuanto, antes de un vuelo nose sabe cuantas reservas (de 100%) se utilizarn. El nmeroresultante puede estar entre 0% o 100% de las reservas.

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 10 / 49

  • Conceptos Bsicos (cont.)

    Funcin de Distribucin de Probabilidad de una variablealeatoria (v.a.): en el caso de las v.a. discretas, la distribucin deprobabilidad es una relacin de todos los valores posibles de lavariable junto con la probabilidad de que ocurra cada valor. Esasprobabilidades suman 1.Mas formalmente, la Funcin de Distribucin de Probabilidad(fdp): es una funcin f (xj ) que asigna una probabilidad a cada valorxj de las variable aleatoria X . f (xj ) = pj = P(X = xj ) = P(xj )

    Donde f (xj ) se puede expresar como una frmula, un grco o una tabla.

    Resultado x f(x)

    1

    2

    3

    4

    5

    6Rafael Snchez F. (UAI) Econometra I Agosto 2015 11 / 49

  • Conceptos Bsicos (cont.)

    f(x)

    x

    Donde la gura representa un histograma (grco de distribucin deprobabilidades. Se lee como que el valor 1 tiene una probabilidad de16 , el valor 2 tambin tiene una probabilidad de

    16 y as

    sucesivamente.Para otros ejemplos el histograma puede tomar otrasformas, dependiendo de las probabilidades con las que puedan resultarciertos valores.

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 12 / 49

  • Conceptos Bsicos (cont.)

    Probabilidad de los sucesos: puede calcularse a travs de ladistribucin de probabilidad (fdp). Por ejemplo: la Pr(x=1 ox=2)=Pr(x=1)+Pr(x=2)= 16 +

    16 =

    26 =

    13

    Distribucin de Probabilidad Acumulada (fda): es la probabilidad deque la v.a. sea menor o igual a un cierto valor.Mas formalmente,funcin de densidad acumulada (fda): se denomina F (x) yespecica que, para cada valor de x , la probabilidad queX x : F (x) = P(X x) = P(1) + P(2) + P(3) + .......+ P(x)En el ejempo del lanzamiento del dado: Cul es la probabilidad queuno lance un dado y obtenga 3 puntos o menos?.

    F (x) = P(X x) = P(1) + P(2) + P(3) + .......+ P(x)F (3) = P(X 3) = P(1) + P(2) + P(3) = 16 + 16 + 16 = 12

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 13 / 49

  • Conceptos Bsicos (cont.)

    Debido a que una v.a. continua puede tomar sus valores posibles enun continuo, la fdp utilizada para variables discretas, que presenta laprobabilidad de cada posible valor de la v.a., no es aplicable a lasvariables contnuas. En su lugar, la probabilidad viene recogida por lafuncin de densidad de probabilidad. El rea bajo la funcin dedensidad de probabilidad entre dos puntos cualquiera es laprobabilidad de que la variable aleatoria se encuentre entre esos dospuntos. La fdp tambin se conoce como densidad.

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 14 / 49

  • Conceptos Bsicos (cont.)

    Para el caso de una v.a. contnua tenemos que su fda se deneexactamente igual a como se hizo con la v.a. discreta. Es decir, ladistribucin de probabilidad acumulada de una v.a. es la probabilidadde la la v.a. sea menor o igual a un cierto valor.

    Formalmente: la fda estima la probabilidad de que X x , se expresacomo F (x) y debe cumplir las siguientes condiciones :

    1. 0 F (x) 12.

    Zf (x)dx = 1

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 15 / 49

  • Conceptos Bsicos (cont.)

    Propiedades para cualquier constante c:

    P(X c) = F (c)p(X > c) = 1 F (c)

    Para cualquier par de constantes a y b donde a

  • Conceptos Bsicos (cont.)

    Un ejemplo de v.a. contnua: la distribucin uniforme. sta ocurrecuando la probabilidad de todos los valores de una variable debieranser el mismo.

    Por ejemplo si yo quisiera estudiar el RUT que es un nmero de 8dgitos para la poblacin de menos de 45 aos. Los valores van entre10.000.000 y 22.000.000 aproximadamente. El nmero de RUT esuna v.a. que puede tener 12 millones de valores posibles para stamuestra y ningn valor es ms probable que otro. Por lo tanto, lasprobabilidades de los valores del RUT son uniformes (todas iguales).

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 17 / 49

  • Momentos de una Distribucin: Media

    Media o Valor Esperado: El valor esperado de una v.a. X ,denominado como E (X ), es el valor que X toma en promedio luegode varias repeticiones del experimento (i.e. es el valor medio de largoplazo).

    Caso de v.a. discreta:

    E (X ) = x1f (x1) + x2f (x2) + ........+ xk f (xk ) =k

    j=1xj f (xj )

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 18 / 49

  • Momentos de una Distribucin: Media (cont.)

    Regla del valor esperado: el valor esperado es lineal

    Demostrar que:

    E (X + a) = E (X ) + aSabemos que:

    E (X ) = x1f (x1) + x2f (x2) + ........+ xk f (xk ) =k

    j=1xj f (xj )

    E (X ) = x1Pr1 + x2Pr2 + .....+ xkPrk =k

    j=1xjPrj

    E (X + a) =k

    j=1(xj + a)Prj =

    k

    j=1[xjPrj + aPrj ] =

    k

    j=1xjPrj| {z }E (X )

    +k

    j=1aPrj| {z }

    k

    aj=1

    Prj

    =

    E (X ) + a

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 19 / 49

  • Momentos de una Distribucin: Media (cont.)

    En forma similar podemos demostrar que: E (aX ) = aE (X ).Sabemos que:

    E (X ) = x1Pr1 + x2Pr2 + .....+ xkPrk =k

    j=1xjPrj

    E (aX ) =k

    j=1(axj )Prj = a

    k

    j=1xjPrj| {z }E (X )

    = aE (X )

    Ejemplo: suponga que X toma los valores -1, 0 y 2 con probabilidades18 ,12 y

    38 respectivamente. Entonces

    E (X ) = 1 ( 18 ) + 0 ( 12 ) + 2 ( 38 ) = 58Cul sera el valor esperado de g(X ) = X 2?. En este caso seraE (X 2) = (1)2 ( 18 ) + (0)2 ( 12 ) + (2)2 ( 38 ) = 138Tarea: Calcule la esperanza (i.e. valor esperado) de una v.a.Bernoulli

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 20 / 49

  • Momentos de una Distribucin: Varianza y DesviacinEstndar

    La varianza y la desviacin estndar (i.e. desviacin tpica) miden ladispersin de una distribucin de probabilidad. La varianza de unav.a. X se expresa como:

    Var(X ) = 2x = E [(X )2] =k

    j=1(Xj )2Prj

    Donde E (X ) =

    Tambin se puede expresar como:

    2x = E [(X )2] = E [(X 2 2X+ 2)]2x = E (X

    2) 2E (X ) + 2 = E (X 2) 2+ 22x = E (X

    2) 2 = E (X 2) E (X )2

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 21 / 49

  • Momentos de una Distribucin: Varianza y DesviacinEstndar

    Demostrar:

    1 Var(X + a) = Var(X )E[(X + a) (+ a)]2 = E [(X )2] = Var(X )

    2 Var(aX ) = a2Var(X )E [(aX a)2] = E [a2(X )2] = a2E [(X )2] = a2Var(X )

    3 Var(Xa ) =Var (X )a2

    E [(Xa a )2] = E [ 1a2 (X )2] = 1a2E [(X )2] = Var (X )a2

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 22 / 49

  • Momentos de una Distribucin: Varianza y DesviacinEstndar

    Debido a que la varianza incluye trminos al cuadrado, suinterpretacin es complicada. Por lo tanto, es usual medir ladispersin mediante la desviacin estndar o desviacin tpica que essimplemente la raz cuadrada de la varianza. Se expresa como: =p2(raz positiva) = +

    p2

    La media y d.s. miden dos caractersticas importantes de unadistribucin: su centro (la media) y su dispersin (la desviacintpica).

    Adicionalmente existen otras caractersticas de las distribuciones queson tiles:

    1 Asmetra (o sesgo): que mide la falta de simetra de una distribucin.2 Curtosis: que mide el grosor o el peso de sus colas.

    Todas estas caractersticas (media, varianza, asimetra y curtosis) sedenominan momentos de una distribucin.

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 23 / 49

  • Momentos de una Distribucin: Asimetra y Curtosis

    Asimetra=E [(X)3]

    3

    Curtosis=E [(X)4]

    4

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 24 / 49

  • Momentos de una Distribucin: Asimetra y Curtosis

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 25 / 49

  • Dos Variables Aleatorias: Dist. Conjunta

    La mayora de las cuestiones econmicas implican dos o ms variables.

    Por ejemplo:Cmo es la distribucin de ingresos de las mujerescomparadas con la de los hombres?.

    Esta pregunta atae a las distribuciones de dos variables aleatorias,considerandolas en forma conjunta (ingresos y gnero). Pararesponder a estas preguntas se requiere la comprensin de losconceptos de distribucin de probabilidad conjunta, marginal ycondicional.

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 26 / 49

  • Dos Variables Aleatorias: Dist. Conjunta

    Distribucin Conjunta: a usted le podra interesar la probabilidad quellueva y adems la probabilidad que haya mucho trco. Es decir,ambas probabilidades en conjunto.

    Lluvia (X=0) No Lluvia (X=1) TotalMucho Trco (Y=0) 0.15 0.07 0.22Poco Trco (Y=1) 0.15 0.063 0.78Total 0.30 0.70 1.00

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 27 / 49

  • Dos Variables Aleatorias: Dist. Conjunta

    Para este tipo de problemas es til la distribucin de probabilidadconjunta de dos v.a..

    Esta distribucin es la probabilidad de que ambas v.a.simultneamente tomen valores especcos llamense x e y.

    La distribucin de probabilidad conjunta se denominaP(X = x ,Y = y) para el caso discreto y fx ,y (x , y) = Px ,y (x , y) parael caso contnuo.

    La suma de las probabilidades de todas las posibles combinaciones dex e y debe ser igual a 1.

    Ejemplo: la probabilidad de que llueva y haya mucho trco seexpresa como P(X = 0,Y = 0) = 0, 15 o 15%.Los cuatro eventosson mutuamente excluyentes y sus probabilidades suman 1.

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 28 / 49

  • Dos Variables Aleatorias: Dist. Marginal

    La distribucin marginal de una v.a. Y es otro nombre para su fdp.Se utiliza solamente para distinguir entre la probabilidad de Ysolamente de la distribucin conjunta de Y y otra variable aleatoria.

    Se puede obtener la probabilidad marginal de Y desde su distribucinconjunta con otra variable (digamos, X) sumando las probabilidadesde todos los eventos para los que Y toma un valor especco.

    En nuestro ejemplo: la probabilidad de mucho trco con lluvia es0,15 y la probabilidad de mucho trco sin lluvia es 0,07 entonces laprobabilidad marginal de mucho trco (con o sin lluvia) es0,15+0,07 = 0,22 22%.

    Mas generalmente: si X puede tomar m diferentes valoresx1, x2, .......xm , entonces la probabilidad de que Y tome valor y es:

    Pr(Y = y) =m

    i=1Pr(X = xi ,Y = y)

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 29 / 49

  • Dos Variables Aleatorias: Dist. Condicional

    La distribucin de una v.a. Y condicionada a que otra v.a. X tome unvalor especco se denomina distribucin condicional de Y dado X. Laprobabilidad condicional de que Y tome el valor y cuando X toma elvalor x se expresa como: Pr(Y = y jX = x) o fY jX (y j x).La distribucin condicionada de Y dado X es:Pr(Y = y j X = x) = Pr (X=x ,Y=y )Pr (X=x ) = probabilidad conjuntaprobabilidad marginal de XEjemplo: Lanzamiento de tiros libres en basquetbol. Sea X una v.a.Bernoulli iguala 1 si el jugador anota el primer tiro libre y 0 si falla.Sea Y una v.a. Bernoulli igual a 1 si el jugador anota el segundo tirolibre. Suponga que la densidad condicional es:

    fY jX (1 j 1) = 0, 85fY jX (0 j 1) = 0, 15fY jX (1 j 0) = 0, 70fY jX (0 j 0) = 0, 30

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 30 / 49

  • Dos Variables Aleatorias: Dist. Condicional

    Esto signica que la probabilidad de que un jugador anote en elsegundo tiro libre depende de si anot o no el primero: si anot ste,la probabilidad de que anote el segundo es 0,85 pero si fall elprimero la probabilidad de anotar el segundo es slo 0,70. Estosignica que X e Y no son independientes, son dependientes.

    En este caso se podra calcular P(X = 1,Y = 1) siempre y cuando seconozca P(X = 1). Suponga que la probabilidad de anotar el primertiro libre P(X = 1) es 0,80. Entonces se tiene que:

    P(X = 1,Y = 1) = P(Y = 1jX = 1) P(X = 1) = 0, 85 0, 80 = 0, 68

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 31 / 49

  • Dos Variables Aleatorias: Esperanza y Varianza Condicional

    Esperanza Condicional: cuando conocemos los valores que toma Xpodemos calcular el valor promedio que tomar Y. Se dene comoE (Y jX = x) o E (Y jX ).DondeE (Y jX = x) =

    m

    i=1yiP(Y = yi jX = x)

    Propiedades de E (Y jX ) :1 E [E (Y )jX ] = E (Y ).Ley de esperanzas iteradas.E [E (Y )jX ] =

    i=1E (Y jX = xi )P(X = xi ). Ej: El peso promedio de

    los adultos es igual al peso promedio de los adultos hombres por laprobabilidad de ser adulto y hombre mas el peso promedio de seradulto y mujer por la probabilidad de ser mujer.

    2 Si X e Y son independientes entonces: E (Y jX ) = E (Y )Varianza Condicional: dadas X e Y, la varianza de Y dado que X=x:Var(Y jX = x) = E (Y 2jX ) E [(Y jX )]2

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 32 / 49

  • Dos Variables Aleatorias: Independencia

    Se dice que dos variables aleatorias (X ,Y ) son independientes si alconocer el valor de una de ella no ofrece informacin respecto de laotra.

    Especicamente, v.a.s X e Y son independientes si la distribucincondicionada de Y dado X es igual a la distribucin marginal de Y :

    Independencia: P(Y = y jX = x) = P(Y = y)Intuicin: el hecho que X tome un valor no afecta la probabilidad deque Y tome valores, y viceversa.

    El concepto de independencia es til pues en estos casos laprobabilidad conjunta se puede obtener de las marginales. Enparticular: P(X = x ,Y = y) = P(X = x) P(Y = y)En palabras: la probabilidad de que X=x e Y=y (en conjunto) es elproducto de probabilidades de que P(X=x) e P(Y=y).

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 33 / 49

  • Dos Variables Aleatorias: Independencia (cont.)

    Ejemplo: Lanzamiento de un tiro libre en basquetbol. Sea X una v.a.Bernoulli iguala 1 si el jugador anota el primer tiro libre y 0 si falla.Sea Y una v.a. Bernoulli igual a 1 si el jugador anota el segundo tirolibre. Suponga que en tiros libres el jugador tiene una probabilidad deacertar de 80%. Entonces P(X = 1) = P(Y = 1)=0,8.

    Cul es la probabilidad de que el jugador anote los dos tiros libres?.Si X e Y son independientes entoncesP(X = 1,Y = 1) = P(X = 1) P(Y = 1)=0,8*0,8=0,64. Por lotanto, la probabilidad de que anote los dos tiros libres es de 64%.

    Si X e Y no fuesen independientes, quiere decir que lasprobabilidades de anotar el segundo tiro libre depende de si acerto ono el primero, por lo que ya no sera posible hacer el clculoutilizando la metodologa recin descrita.

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 34 / 49

  • Dos Variables Aleatorias: Covarianza y Correlacin

    Para entender como dos v.a. evolucionan conjuntamente se utilizan lacovarianza y la correlacin. stas miden la relacin lineal entre dosvariables aleatorias tratndolas simtricamente.

    Covarianza: mide el grado de dependencia lineal entre dos variablesaleatorias.

    Si tiene signo positivo se mueven juntas mientras que si tiene signonegativo se mueven en sentido contrario.

    Su magnitud no es fcil de interpretar. Se denomina XY Cov(X ,Y ).

    Sean X e Y dos v.a con E (X ) = X ,E (Y ) = Y :

    Cov(X ,Y ) E [(X X )(Y Y )] = E [(X X )Y (X X )Y ] =E [(XY ) (Y X ) (XY ) + X Y ]= E (XY ) E (Y )X E (X )Y + X Y =E (XY ) Y X X Y + X Y = E (XY ) X Y

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 35 / 49

  • Dos Variables Aleatorias: Covarianza y Correlacin

    Si X e Y son independientes entonces la covarianza es 0.La Covarianza a pesar de ser til por la informacin que entregarespecto de la asociacin entre dos v.a., presenta un graveproblema.....que su valor depender de las unidades en que se midanlas v.a.!!!Esto es, que dadas las constantes a1, b1, a2, b2:Cov(a1X + b1, a2Y + b2) = a1a2Cov(X ,Y )Esto es importante en economa pues hay mltiples variables quepueden ser denidas en diversas unidades de medicin sin que estocambie su signicado. Por esta razn los economistas utilizan conmayor frecuencia el coeciente de correlacin.Suponga que se quiere conocer la relacin entre el peso (X) y laestatura (Y) de una persona y se calcula su covarianza. El problemaes que la respueta que se obtenga va a depender de como se midanestatura y peso. Aparte como el resultado son mezclas de ambasunidades son diciles de interpretar.

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 36 / 49

  • Dos Variables Aleatorias: Covarianza y Correlacin

    Correlacin: es un ndice que ajusta por unidad de medicin aldividir la covarianza por las desviaciones estandar.

    Corr(X ,Y ) = XY =Cov (X ,Y )pVar (X )Var (Y )

    = XYX YCorr(X ,Y ) = 0 slo si Cov(X ,Y ) = 0Rango: 1 XY 1

    Esta medida esta libre del problema de unidades! y es de fcilinterpretacin.

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 37 / 49

  • Dos Variables Aleatorias: Operaciones con Medias yVarianzas de v.a.

    E (X + Y ) = E (X ) + E (Y ) = X + YE (aX + bY ) = aE (X ) + bE (Y ) = aX + bYVar(X + Y ) = Var(X ) + Var(Y ) + 2Cov(X ,Y )

    Var(aX + bY ) = a2Var(X ) + b2Var(Y ) + 2abCov(X ,Y )

    Si X e Y no estn correlacionadas, i.e.Cov(X ,Y ) = 0 : Var(X + Y ) = Var(X Y ) = Var(X ) + Var(Y )Sean {X1,X2, .....XNg v.a. incorrelacionadas entre s, i.e.Cov(XiXj ) = 0 8i 6= j y fa1, a2, .....aNg son constantes:Var(a1X1 + a2X2 + .....aNXN ) =a21Var(X1) + a

    22Var(X2) + ........+ a

    2NVar(XN )

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 38 / 49

  • Dos Variables Aleatorias: Operaciones con Medias yVarianzas de v.a.

    Demostrar que:Var(aX + bY ) = a2Var(X ) + b2Var(Y ) + 2abCov(X ,Y )

    Var(aX + bY ) = En[(aX + bY ) (aX + bY )]2

    oVar(aX + bY ) = E

    n[a (X X ) + b (Y Y )]2

    oVar(aX + bY ) =

    Eha2 (X X )2

    i| {z }

    a2Var (X )

    + 2E [ab(X X )(Y Y )]| {z }2abCov (X ,Y )

    + Ehb2 (Y Y )2

    i| {z }

    b2Var (Y )

    Var(aX + bY ) = a2Var(X ) + b2Var(Y ) + 2abCov(X ,Y )Var(aX + bY ) = a22x + b

    22y + 2abxy

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 39 / 49

  • La Distribucin Normal

    La distribucin normal es la distribucin ms habitual en estadstica yeconometra, porque (i) frecuentemente se cumple; y (ii) suponer queuna v.a. tiene distribucin normal simplica los clculosprobabilsticos.

    Si la media de una v.a. con distribucin normal es y su varianza es2, se dice que x N(, 2)

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 40 / 49

  • La Distribucin Normal (cont.)

    En trminos matemticos: f (x) = 1p2piexp

    h (x)222

    i, donde

    = E (x) y 2 = Var(x).Algunas variables aleatorias parecen seguirpoco ms o menos una distribucin normal. Las estaturas y los pesosde los seres humanos y las puntuaciones de test son algunos ejemplos.

    Un caso particular de la distribucin normal se llama distribucinnormal estandar. Tal como su nombre lo indica es igual a ladistribucin normal pero estandarizada. Por convencin seestandarizan con media = 0 y varianza = 1 y sus v.a.s se denominancon letra Z. La FDP de la distribucin normal estndar se denomina(z) y la FDA se denomina (z).

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 41 / 49

  • La Distribucin Normal (cont.)

    La tabla de FDA de desviacin normal estndar permite encontrar laprobabilidad de que Z sea < o > a algn valor:

    Pr(Z < z) = (z)Pr(Z > z) = 1(z)Pr(Z < z) = (z) = Pr(Z > z) = 1(z)Pr(a Z b) = (b)(a)Pr(jZ j > c) = Pr(Z > c) + Pr(Z < c) 8c >0, esto es lo mismo que 2Pr(Z > c) = 2 [1(c)]

    Por tanto, la probabilidad de que el valor absoluto de Z sea mayor quealguna constante positiva c es simplemente el doble de la probabilidadPr(Z > c); esto reeja la simetra de la distribucin normal estndar.

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 42 / 49

  • La Distribucin Normal (cont.)

    Propiedades de la distribucin normal estndar1 Si x N(, 2) entonces x

    2 N(0, 1). Ejemplo: suponga que

    x N(3, 4) y que se quiere calcular P(x 1).Para esto se debe restarla media y dividir por la varianza:P(x 1) = P(x 3 1 3) = P( x34 134 ) = P( x34 12 ) =P(x 32| {z }Z

    1) = P(Z 1) = (1) = 0, 159

    2 Si x N(, 2) entonces ax + b N(a+ b, a22) Ejemplo: six N(1, 9) y se quiere estimar la distribucin de y = 2x + 3.Sabemosque su distribucin ser normal con media: 2E (x) + 3 = 5 y varianza:22 9 = 36 por lo tanto y N(5, 36)

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 43 / 49

  • La Distribucin Normal (cont.)

    Toda combinacin lineal de v.a.s normales independientes eidenticamente distribuidas (i.i.d.), tiene una distribucin normal.Ejemplo: sea xi , donde i = 1, 2, 3 v.a.s independientes condistribucin normal N(, 2).Se dene W = x1 + 2x2 3x3.EntoncesW esta distribuida normalmente, solo falta estimar su media yvarianza.

    E (W ) = E (x1) + 2E (x2) 3E (x3) = + 2 3 = 0Var(W ) = Var(x1) + 4Var(x2) + 9Var(x3) = 142

    La propiedades anteriores tambin implican que el promedio devariables aleatorias independientes y normalmente distribuidas tieneuna distribucin normal. Si y1, ....yn son variables aleatoriasindependientes y cada una tiene una distribucin normalN(, 2) entonces: y N(, 2n )

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 44 / 49

  • La Distribucin Chi-Cuadrado

    Esta distribucin se obtiene de la suma de variables normales estandar(al cuadrado):Si z1, .....zn v.a.s y zi N(0, 1) y son independientes, entonces:ni=1z2i = z

    21 + z

    22 + .....+ z

    2n 2n esta suma distribuye chi-cuadrado

    con n grados de libertad.De acuerdo a la frmula anterior, es claro que las variables aleatoriaschi-cuadrado son siempre no negativas, y que, a diferencia de ladistribucin normal, la distribucin Chi-cuadrada no es simtricarespecto a ningn punto. Se puede demostrar que si x 2n entoncesel valor esperado de x es n y la varianza de x es 2n.

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 45 / 49

  • Los Grados de Libertad

    Los grados de libertad estn dados por el nmero de valores quepueden ser asignados de forma arbitraria, antes de que el resto de lasvariables tomen un valor automticamente, producto de establecerselas que son libres, esto, con el n de compensar e igualar un resultadoel cual se ha conocido previamente.

    Ejemplo: Si tenemos que escoger a 10 personas de un grupo grandede modo tal que el peso promedio sea de 60 Kg, tenemos la libertadde elegir a los diez que nosotros consideremos. Obviamente puedenexistir muchas muestras de diez diferentes personas, pero siempredebemos tener en cuenta que el promedio de los pesos debe ser 60 Kg.

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 46 / 49

  • Los Grados de Libertad (cont.)

    Fcilmente nos podemos dar cuenta que solo podemos elegirlibremente a las primeras 9 personas, dado que para elegir al dcimoeste debe ser elegido de manera tal que el promedio del grupo no seamayor ni menor de 60 Kg. Es decir, podemos elegir con libertad a los9 primeros, y el dcimo queda automticamente restringido por lacondicin de que su peso debe ser tal que la media de los diez pesosdebe ser 60 Kg. Por lo tanto, para una muestra de 10 personasescogidas al azar, bajo la condicin de que la media de los pesos sea60 Kg, tenemos 9 grados de libertad.

    En trminos de economtricos, los grados de libertad son el nmerode observaciones nmenos el nmero de variables utilizadas para laproyeccin.

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 47 / 49

  • La Distribucin t de Student

    Esta es la distribucin mas utilizada en econometra y en estadstica,principalmente para estimar y probar una media y una diferencia demedias cuando no se conoce la desviacin estandar poblacional (y porlo tanto se debe estimar con la muestral). Se obtiene a partir de larazon entre una distribucin normal estandar y una chi-cuadrado. Siz1 N(0, 1) y z2 2n entonces las v.a. T se dene como:T = z1p z2

    n

    tnA medida que va aumentando el nmero de observaciones, ceterisparibus, la distribucin t es cada vez ms parecida a la normalestndar, o alternativamente, a medida que aumentan los grados delibertad la distribucin t se tiende a parecer a la distribucin normalestandar). En general se observa que con n 30 se aproximabastante a la normal estndar.

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 48 / 49

  • La Distribucin F

    Para el anlisis de regresin mltiple que veremos ms adelante, ladistribucin F nos ser de gran utilidad. Esta distribucin surge de larazn de dos distribuciones chi-cuadrado.

    En particular, sean: x1 y x2 v.a.s independientes, y seanx1 2m y x2 2n entonces la dsitribucin F se dene:F =

    x1mx2n F(m,n)

    Rafael Snchez F. (UAI) Econometra I Agosto 2015 49 / 49

    IntroduccinIntroduccin

    Repaso de ProbabilidadConceptos BsicosDistribuciones de Probabilidad ms utilizadas