introducción a la econometría - universidad autónoma … · breve resumen del curso la ciencia...

54
Introducción a la Econometría Análisis estadístico de datos económicos

Upload: trinhnhi

Post on 20-Aug-2018

221 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

Introducción a la Econometría

Análisis estadístico de datos económicos

Page 2: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con implicaciones de política económica, pero casi nunca sugiere la magnitud cuantitativa del efecto causal.

• ¿Cuál es la elasticidad precio del tabaco? • ¿Qué efecto tiene una reducción del número de

alumnos en clase sobre sus notas?

• ¿Y un año de educación sobre el salario futuro?

• ¿Y un incremento del 1% en el tipo de interés sobre el crecimiento?

Page 3: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

Este curso estará enfocado a la utilización de métodos estadísticos y econométricos para cuantificar efectos causales. Idealmente, nos gustaría poder experimentar con:

El precio del tabaco; el tamaño de la clase; el rendimiento de la educación; el Banco Central Europeo Pero casi siempre tendremos que trabajar con datos no experimentales, lo que plantea importantes problemas:

• efectos confusos (variables omitidas)

• causalidad simultánea

• “correlación no implica causalidad”

Page 4: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

En este curso:

• Aprenderá distintos métodos de estimación de efectos causales utilizando datos observados;

• Aprenderá otro tipo de herramientas para utilizar, por ejemplo, en la predicción de series temporales;

• Nos centraremos en aplicaciones – la teoría se utilizará cuando sea necesaria para el entendimiento del “por qué” de los métodos;

• Aprenderá a producir (llevar a cabo el análisis) y consumir (evaluar el trabajo de otros) aplicaciones econométricas; y

• Practicará “produciendo” en sus series de problemas.

Page 5: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

Revisión de Probabilidad y Estadística (SW Capítulos 2,3)

Problema empírico: Número de alumnos y notas

• Cuestión clave: ¿Cuál es el efecto de reducir el número de alumnos en uno por clase? ¿y en 8?

• ¿Cómo se mide la variable dependiente (“notas”)? § Satisfacción de los padres § Desarrollo personal del estudiante § Bienestar futuro y/o salario § contrastes estándar

¿Qué nos dicen los datos sobre la relación entre el

número de alumnos y el resultado de los exámenes?

Page 6: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

Los datos del California Test Score Todos los distritos escolares K-6 (Infantil a 6º curso) y K-8 de California (n = 420) Variables: § Examen de 5º grado (matemáticas y lectura):

media de los distritos § STR = Ratio estudiantes/profesores

Page 7: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

Visión inicial de los datos:

Page 8: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

¿Mejores notas con menos estudiantes?

Page 9: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

¿Cómo obtener evidencia empírica sobre si los distritos con menor STR tienen resultados mejores?

1. Comparar la nota media de los distritos de bajo

STR con la de los de alto STR (“estimación”) 2. Verificar la hipótesis de que la nota media es la

misma en ambos tipos de distrito, contra la alternativa de que es distinta (“ test de hipótesis”)

3. Estimar un intervalo para la diferencia de notas medias (“intervalo de confianza”)

Page 10: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

Análisis inicial de los datos: Comparar distritos “pequeños” (STR < 20) y “grandes” (STR � 20):

Tamaño Nota media

(Y )

Desviación

estándar (sY)

n

Pequeño 657.4 19.4 238

Grande 650.0 17.9 182

1. Estimación de ∆ = diferencia entre medias de grupos

2. Contraste de la hipótesis ∆ = 0

3. Construir un intervalo de confianza para ∆

Page 11: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

1. Estimación

pequeño grandeY Y− = 657.4 – 650.0 = 7.4

donde pequeño

pequeño1pequeño

1 n

ii

Y Yn =

= ∑ y grande

grande1grande

1 n

ii

Y Yn =

= ∑

¿Es esta diferencia significativa?

• Desviación estándar de las notas = 19.1

• Diferencia entre los percentiles 60 y 75 de las notas es 667.6 – 659.4 = 8.2

• Esta diferencia es lo suficientemente importante como para tenerla en cuenta en las posibles discusiones del comité escolar

Page 12: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

2. Verificación de hipótesis Contraste de la diferencia de medias: estadístico t,

2 2

g

( )p g

p

p g p g

s sp g

n n

Y Y Y Yt

SE Y Y

− −= =

−+ (¿lo recuerda?)

donde SE( sY – lY ) es el “error estándar” de pY – gY ; los

subíndices p y g hacen referencia a distritos con STR

“pequeño” y “grande” ; y 2 2

1

1( )

1

sn

p i pip

s Y Yn =

= −− ∑ (etc.)

Page 13: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

Cálculo del t de la diferencia de medias:

Tamaño Y sY n

Pequeño 657.4 19.4 238

grande 650.0 17.9 182

2 2 2 219.4 17.9238 182

657.4 650.0 7.41.83p g

p g

p g

s s

n n

Y Yt

− −= = =++

= 4.05

|t| > 1.96, entonces rechazamos al nivel del 5% la hipótesis nula de que las dos medias son iguales.

Page 14: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

3. Intervalo de confianza Un intervalo de confianza del 95% para la diferencia de medias es

( pY – gY ) ± 1.96×SE( pY – gY )

= 7.4 ± 1.96×1.83 = (3.8, 11.0)

Dos afirmaciones equivalentes:

1. El intervalo de confianza del 95% para ∆ no incluye al cero;

2. La hipótesis de que ∆ = 0 es rechazada al nivel de significación del 5%

Page 15: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

Todo esto debería resultar familiar. Pero: 1. ¿Qué es lo que justifica todos estos resultados?

2. Estimación: ¿Por qué estimar ∆ mediante pY – gY ?

3. Verificación: ¿Cuál es realmente el error estándar de

sY – lY ? ¿Por qué rechazar ∆ = 0 si |t| > 1.96?

4. Intervalos de confianza (estimación de intervalos): ¿Qué es, en realidad, un intervalo de confianza?

Page 16: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

1. Estructura probabilística de la inferencia 2. Estimación

3. Verificación

4. Intervalos de confianza

Población • El grupo o colección de entidades de interés

• Aquí, “todos los posibles” distritos escolares

• “Todos los posibles” significa “todas las posibles” circunstancias que nos llevan a unos valores específicos de STR

• Si la población es muy grande, tendremos que hacer inferencia a partir de una muestra de dicha población

Page 17: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

Variable Aleatoria Y

• Resumen numérico de un suceso aleatorio • Aquí, el valor numérico de la nota media o del STR

en un determinado año y distrito de la muestra.

Distribución Poblacional de Y • Las probabilidades de que diferentes valores de Y

ocurran en la población, por ejemplo Pr[Y = 650] (cuando Y es discreta)

• ó: Las probabilidades sobre conjuntos de dichos

valores, por ejemplo Pr[Y ≤ 650] (cuando Y es

continua).

Page 18: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

“Momentos” de la distribución poblacional media = valor esperado

= E(Y)

= µY = valor medio de múltiples repeticiones de Y

varianza = E(Y – µY)2

= 2Yσ

= media del cuadrado de la dispersión

desviación estándar = varianza = σY

Page 19: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

Distribuciones condicionadas

• La distribución de Y, dados los valores de otra variable aleatoria, X

• Ejemplo: distribución de las notas, dado un STR < 20

Momentos de las distribuciones condicionadas • Media condicional = media de la distribución

condicional = E(Y|X = x)

• Varianza condicional = varianza de la distribución condicional

• Ejemplo: E(notas|STR < 20), la nota media en aquellos distritos con menor número de alumnos

Page 20: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

Diferencia de las medias de dos distribuciones

condicionadas:

∆ = E(nota|STR < 20) – E(nota|STR � 20) Otros ejemplos de medias condicionadas:

• Salario de la mujer (Y = salario, X = sexo)

• Tasa de mortalidad anual de personas bajo tratamiento (Y = vivo/muerto; X = tratado/no tratado)

La media condicionada es un nuevo término para la idea familiar de la media del grupo

Page 21: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

Inferencia sobre medias, medias condicionadas, y

diferencia en medias condicionadas

Queremos conocer ∆ (diferencia de notas ; de sexo, de tratamiento). Por tanto, debemos reunir y usar datos que nos permitan

llevar a cabo inferencias estadísticas sobre ∆.

• Datos experimentales

• Datos observables

Page 22: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

Muestreo aleatorio simple

• Elija un individuo (distrito, entidad) aleatoriamente de la población

Aleatoriedad y datos

• Antes de la selección, el valor de Y es aleatorio ya que el individuo seleccionado también lo es

• Tras la selección, el valor de Y es observado, tan sólo un número – no aleatorio

• Los datos serían (Y1, Y2,…, Yn), donde Yi = valor de Y para el i-ésimo individuo muestreado

Page 23: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

Implicaciones del muestreo aleatorio simple Puesto que los individuos #1 y #2 se eligen al azar, el valor de Y1 no posee información sobre Y2. Por tanto:

• Y1, Y2 se distribuyen independientemente

• Y1 e Y2, provienen de la misma distribución, es decir, se distribuyen idénticamente

• Luego, una consecuencia del muestreo aleatorio simple es que Y1 e Y2 se distribuyen idéntica e independientemente (i.i.d.).

• De forma más general, con muestreo aleatorio simple, {Yi}, i = 1,…, n, son i.i.d

Page 24: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

1. Estructura probabilística de la inferencia

2. Estimación 3. Verificación 4. Intervalos de confianza

Y es el estimador natural de la media. Pero:

• ¿Qué propiedades tiene este estimador?

• ¿Por qué utilizamos Y y no otro estimador? § Y1 (la primera observación) § quizás con ponderaciones distintas – no medias

simples § mediana(Y1,…, Yn)

Page 25: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

Para contestar estas cuestiones necesitamos caracterizar la distribución muestral de Y

• Los individuos se eligen de forma aleatoria.

• Tal que los valores de (Y1,…, Yn) son aleatorios

• Funciones de (Y1,…, Yn), como Y , son aleatorias: si hubiéramos elegido otra muestra, ésta daría valores distintos

• La distribución de Y sobre posibles muestras distintas de tamaño n es la distribución muestral de Y .

• La media y la varianza de Y son la media y la varianza de su distribución muestral, E(Y ) y var(Y ).

• Para calcular var(Y ), necesitamos la covarianza

Page 26: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

La covarianza entre X y Z es,

cov(X,Z) = E[(X – µX)(Z – µZ)] = σXZ

• La covarianza es una medida de asociación lineal entre

X y Z; sus unidades son unidades de X × unidades de Z • cov(X,Z) > (<) 0: relación positiva (negativa) entre X y

Z

• Si X y Z son independientes, entonces cov(X,Z) = 0 (¡pero no viceversa!)

• La covarianza consigo misma es su varianza:

cov(X,X) = E[(X – µX)(X – µX)] = E[(X – µX)2] = 2Xσ

Page 27: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

La covarianza entre Notas y STR es negativa:

Page 28: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

El coeficiente de correlación viene definido en términos de la covarianza:

corr(X,Z) = cov( , )var( ) var( )

XZ

X Z

X ZX Z

σσ σ

= = rXZ

• –1 � corr(X,Z) � 1

• corr(X,Z) = 1, asociación lineal positiva perfecta

• corr(X,Z) = –1, asociación lineal negativa perfecta

• corr(X,Z) = 0, ningún tipo de asociación lineal • Si E(X|Z) = constante, entonces corr(X,Z) = 0 (no

necesariamente viceversa, sin embargo)

Page 29: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

El coeficiente de correlación mide la asociación lineal

Page 30: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

El coeficiente de correlación mide la asociación lineal

Page 31: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

La media y la varianza de la

distribución muestral de Y

media: E(Y ) = E(1

1 n

ii

Yn =∑ ) =

1

1( )

n

ii

E Yn =∑ =

1

1 n

Yin

µ=∑ = µY

Varianza: var(Y ) = E[Y – E(Y )]2

= E[Y – µY]2

= E2

1

1( )

n

i Yi

Yn

µ=

− ∑

= E2

1 1

1( )( )

n n

i Y j Yi j

Y Yn

µ µ= =

− −

∑∑

Page 32: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

var(Y ) = 2

1 1

1( )( )

n n

i Y j Yi j

E Y Yn

µ µ= =

− −∑∑

= 2

1 1

1cov( , )

n n

i ji j

Y Yn = =

∑∑

= 2 2

1 1 1,

1 1var( ) cov( , )

n n n

i i ji i j j i

Y Y Yn n= = = ≠

+∑ ∑ ∑

= 22

1

10

n

Yin

σ=

+∑

= 2Y

Page 33: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

Resumen: E(Y ) = µY y var(Y ) = 2Y

nσ .

Consecuencias:

• Y es un estimador insesgado de µY (esto es, E(Y ) =

µY)

• var(Y ) es inversamente proporcional a n

• la dispersión de la distribución muestral es

proporcional a 1/ n

• en este sentido, la incertidumbre muestral que aparece

al utilizar Y para realizar inferencias sobre µY es

proporcional a 1/ n

Page 34: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

¿Qué sucede con la distribución muestral completa de Y , y no sólo con la media y la varianza?

En general, la distribución muestral exacta de Y es muy complicada y depende de la distribución poblacional de Y.

Ejemplo: Supongamos que Y toma los valores 0 ó 1 (una variable aleatoria de Bernoulli) con la distribución de probabilidad,

Pr[Y = 0] = .22, Pr(Y =1) = .78

Entonces, E(Y) = .78 y 2Yσ = (1–.78) ×.78 = 0.1716

Page 35: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con
Page 36: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

Para pequeños tamaños de la muestra, la distribución de Y es complicada. PERO: ¡cuando n es elevado, no lo es! A medida que n aumenta, la distribución de Y se centra

progresivamente alrededor de µY: la incertidumbre muestral decrece conforme n aumenta (recuérdese que

var(Y ) = 2Yσ /n)

Un estimador es consistente si la probabilidad de que caiga dentro de un intervalo alrededor del valor poblacional verdadero tiende a 1 conforme aumenta el tamaño muestral

Page 37: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

La Ley de los Grandes Números:

Si (Y1,…,Yn) son i.i.d. y 2Yσ < ∞, entonces Y es un

estimador consistente de µY, esto es,

Pr[|Y – µY| < ε] → 1 según n → ∞

lo que puede escribirse como Y p

→ µY (“Y converge en

probabilidad a µY”)

(Demostración: según n → ∞, var(Y ) = 2Y

nσ → 0, lo que

implica que Pr[|Y – µY| < ε] → 1.)

Page 38: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

Teorema Central del Límite (TCL): Si (Y1,…,Yn) son i.i.d. y 0

< 2Yσ < ∞, entonces cuando n es elevado la distribución de Y

está bien aproximada por una distribución normal:

• Y se distribuye aproximadamente N(µY, 2Y

nσ )

(“distribución normal con media µY y varianza 2Yσ /n”)

• n (Y – µY)/σY se distribuye aproximadamente N(0,1) (normal estándar)

• Es decir, “Y estandarizada” = ( )

var( )

Y E Y

Y

− = /

Y

Y

Yn

µσ

− se

distribuye aproximadamente como una N(0,1)

• La aproximación mejora conforme n aumenta

Page 39: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

Ejemplo: Y sigue una distribución de Bernoulli, p = 0.78:

Page 40: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

Mismo ejemplo: distribución de ( )

var( )

Y E Y

Y

− :

Page 41: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

Resumen: para (Y1,…,Yn) i.i.d. con 0 < 2Yσ < ∞,

• La distribución muestral exacta (muestra finita) de Y

tiene media µY (“Y es un estimador insesgado de µY”)

y varianza 2Yσ /n

• Aparte de su media y de su varianza, la distribución exacta de Y es complicada y depende de la distribución de Y

• Y p

→ µY (Ley de los grandes números)

• ( )

var( )

Y E Y

Y

− se distribuye aproximadamente N(0,1)

(TCL)

Page 42: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

Entonces, ¿Por qué utilizar Y para estimar µY?

• insesgadez: E(Y ) = µY

• consistencia: Y p

→ µY

• Y es el estimador de “mínimos cuadrados” de µY;

Y resuelve: 2

1

min ( )n

m ii

Y m=

−∑ (véase Ap. 3.2)

• Y tiene la menor varianza de todos los estimadores

lineales: considérese el estimador, 1

1ˆn

Y i ii

a Yn

µ=

= ∑ ,

donde {ai} es tal que ˆYµ es insesgado; entonces

var(Y ) ≤ var( ˆYµ ).

Page 43: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

Estructura probabilística de la inferencia 1. Estimación 2. Contrastación de hipótesis 3. Intervalos de confianza

El problema de la contrastación de hipótesis (para la media): adoptar una decisión provisional, basada en la evidencia disponible, sobre si una hipótesis nula es verdadera, o, en su lugar, sobre si alguna hipótesis alternativa es verdadera. Es decir, contrastar

H0: E(Y) = µY,0 vs. H1: E(Y) > µY,0 (unilateral, >)

H0: E(Y) = µY,0 vs. H1: E(Y) < µY,0 (unilateral, <)

H0: E(Y) = µY,0 vs. H1: E(Y) ≠µY,0 (bilateral)

Page 44: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

p-valor = probabilidad de obtener un valor (de Y ) al menos tan adverso para la nula como el realmente calculado a partir de nuestros datos, suponiendo que la hipótesis nula es verdadera. El nivel de significación de un contraste es una probabilidad preestablecida de rechazar incorrectamente la hipótesis nula, cuando ésta es verdadera. Cálculo del p-valor basado en Y :

p-valor = 0 ,0 ,0Pr [| | | |]obs

H Y YY Yµ µ− > − ,

donde obsY es el valor de Y realmente observado (no aleatorio)

Page 45: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

p-valor = 0 ,0 ,0Pr [| | | |]obs

H Y YY Yµ µ− > − ,

Para calcula el p-valor, es necesario conocer la distribución de Y . Si n es elevado, podemos utilizar la aproximación normal para n elevado:

p-valor = 0 ,0 ,0Pr [| | | |]obs

H Y YY Yµ µ− > − ,

= 0

,0 ,0Pr [| | | |]/ /

obsY Y

HY Y

Y Y

n n

µ µ

σ σ

− −>

≅ suma de las probabilidades bajo las colas

derecha e izquierda de la N(0,1)

Page 46: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con
Page 47: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

En la práctica, σY es desconocida, por lo que debe estimarse

Estimador de la varianza de Y: 2Ys = 2

1

1( )

1

n

ii

Y Yn =

−− ∑

Resultado:

Si (Y1,…,Yn) son i.i.d. y E(Y4) < ∞, entonces 2Ys

p

→ 2Yσ

§ ¿Por qué se aplica la ley de los grandes números?

Porque 2Ys es una media muestral; véase el Apéndice 3.3

§ Nota: suponemos que E(Y4) < ∞ porque aquí la media

no es la de Yi, sino la de su cuadrado; véase Ap. 3.3

Page 48: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

§ Cálculo del p-valor con 2Yσ estimado:

p-valor = 0 ,0 ,0Pr [| | | |]obs

H Y YY Yµ µ− > − ,

= 0

,0 ,0Pr [| | | |]/ /

obsY Y

HY Y

Y Y

n n

µ µ

σ σ

− −>

≅ 0

,0 ,0Pr [| | | |]/ /

obsY Y

HY Y

Y Y

s n s n

µ µ− −> (n elevado)

= 0

Pr [| | | |]obsH t t>

≅ probabilidad bajo las colas de la normal

donde t = ,0

/Y

Y

Y

s n

µ− (el estadístico t habitual)

Page 49: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

El p-valor y el nivel de significación Con un nivel de significación preestablecido (e.g. 5%):

• Rechazamos si |t| ≥ 1.96

• De forma equivalente: rechazamos si p ≤ 0.05.

• Al p-valor se le denomina en ocasiones nivel marginal de significación.

Page 50: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

La distribución t de Student

Si Y se distribuye N(µY,2Yσ ), el estadístico t sigue una

distribución t de Student (tabulada al final de todos los libros de estadística)

Algunos comentarios:

• Para n > 30, la distribución t y la N(0,1) están muy próximas

• El supuesto de que Y se distribuye N(µY,2Yσ ) es poco

admisible en la práctica (¿la renta? ¿el número de hijos?)

• La distribución t se comenzó a utilizar históricamente cuando los tamaños muestrales resultaban muy reducidos

• En este curso, no utilizaremos la distribución t, sino la aproximación para n elevado dada por el TCL

Page 51: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

Estructura probabilística de la inferencia 1. Estimación

2. Contrastación 3. Intervalos de confianza

Un intervalo de confianza del 95% para µY es un

intervalo que contiene el valor verdadero de µY en un 95% de muestras repetidas. (¿Qué es lo aleatorio aquí? El intervalo de confianza que diferirá de una muestra a otra; el parámetro poblacional,

µY, no es aleatorio, puesto que es desconocido)

Page 52: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

Un intervalo de confianza del 95% puede construirse siempre

como el conjunto de valores de µY no rechazados por un contraste de hipótesis con un nivel de significación del 5%.

{µY: /

Y

Y

Ys n

µ− ≤ 1.96} = {µY: –1.96 ≤ /

Y

Y

Ys n

µ− ≤ 1.96}

= {µY: –1.96 Ysn

≤ Y – µY ≤ 1.96 Ysn

}

= {µY ∈ (Y – 1.96 Ysn

, Y + 1.96 Ysn

)}

Este intervalo de confianza se basa en los dos siguientes resultados para n elevado: Y se distribuye aproximadamente

normal, y 2Ys

p

→ 2Yσ

Page 53: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

Resumen: A partir de los supuestos de:

(1) Muestreo aleatorio simple de una población, esto es, {Yi, i =1,…,n} son i.i.d.

(2) 0 < E(Y4) < ∞

desarrollamos, para grandes muestras (n elevado):

• Una teoría de la estimación (distribución muestral de Y )

• Una teoría de la contrastación de hipótesis (distribución para n elevado del estadístico t y cálculo del p-valor)

• Una teoría de los intervalos de confianza (construida invirtiendo el contraste estadístico)

¿Los supuestos (1) y (2) son admisibles en la práctica? Sí.

Page 54: Introducción a la Econometría - Universidad Autónoma … · Breve Resumen del Curso La ciencia económica suele indicarnos relaciones interesantes entre variables, a menudo con

Pregunta inicial de política educativa:

¿Qué efecto tiene sobre las notas la reducción en la ratio estudiantes por profesor de un estudiante por clase?

¿Hemos respondido a esta pregunta?

• Examinamos ∆ = la diferencia de medias, clases pequeñas vs. grandes

• Pero ∆ no responde realmente a la pregunta mencionada.

• En su lugar, el objetivo de interés es NotaSTR

∆∆

• Pero esta es la pendiente de la recta que relaciona la nota y la ratio estudiantes por profesor

• Por lo cual, necesitamos estimar esta pendiente…