tema 4- regresión lineal de dos variables
DESCRIPTION
Laboratorio de economtería usando STATA para describir un ejercicio de regresión lineal simple con dos variables. La base de datos puede consultarse enviando un correo a : [email protected]TRANSCRIPT
Modelo de Regresión Lineal con 2 Variables (Capítulo 6)
4. Análisis de Regresión con Dos Variables
4.1 Análisis de Regresión
Estudio de la relación entre la variable dependiente y otras variables independientes
4.1.1 Objetivos del Análisis de Regresión
Estimar la media de la variable Y dados los valores de la X´s Contrastar hipótesis sobre la naturaleza de la dependencia Predecir Y dados X´s Combinar Objetivos
4.2 Función de Regresión de la Población (FRP)
FRP No estocástica
siendo los parámetros de la regesión.
es la esperanza de Y condicionada a los valores de X
4.2.1 Especificación Estocástica de la Función de Regresión de la Población
FRP estocástica
donde:
son los parámetros poblacionales es el término de error, el cual es una variable estocástica incluye lo siguiente:
Variables no incluidas en el modelo Aleatoriedad del comportamiento de las variables Errores de medición Influencia de variables no muy relevantes (Navaja de Ockham)
4.2.2 Función de Regresión Poblacional FRP y de la muestra FRM
FRP
FRP No estocástica
FRM Estocástica
donde
4.3 Regresión Lineal Múltiple
Matricialmente esto se sintetiza como:
Así tenemos que en general ocurre que:
FRP
FRM
4.3.1 Método MCO-OLS
Técnica para ajustar la línea recta óptima a la muestra de observaciones X Y a fin de obtener estimadores de las La base del método consiste en minimizar la suma de cuadrados de las desviaciones entre los puntos y observaciones de la muestra y la línea de regresión teórica.
4.3.2 Derivación de estimaciones de MCO-OLS
donde
CPO
|
Tomamos
Ahora tomamos
Las ecuaciones y forman un sistema:
siendo las incógnitas
Solución: Reescribo el sistema:
Resolvemos por sustitución:
Ahora, dado obtenemos
Sustituyendo obtenemos los estimadores de MCO-OLS para dos variables
Ahora bien, ¿cómo sabemos que se trata de un mínimo?
CPO
Se trata de un mínimo
Notas:
No hay correlación
No hay correlación
no tiene necesariamente un significado económico específico.Estadísticamente es el efecto medio sobre Y de todas las variables en el modelo de regresión
Linealidad en el contexto del modelo MCO-OLS implica linealidad de los parámetros independientemente de que sean las lineales las
variables Lineal
No Lineal
Lineal
Modelo de Regresión Lineal con 2 Variables (Capítulo 7)4.4 Modelo de Regresión Lineal con 2 Variables
4.4.1 Supuesto del modelo de regresión lineal clásico
Linealidad de los parámetros
Las variables x´s no están correlacionadas "no multicolinealidad" Homocesdasticidad
No autocorrelación El modelo está correctamente especificado
4.4.2 Varianzas y Covarianzas Caso
Es el caso de 2 variables
Varianza de
Varianza de
Covarianza
Dado que no conocimos
Error Estandar de
Error Estandar de
4.4.3 Teorema de Gauss-Markov y MCO-OLS
Asumimos los supuestos del model de regresión lineal clásico, los estimadores de MCO son MELI (Mejores Estimadores Lineales Insesgados)
Propiedades:
son lineales
son insesgados
son eficientes
4.4.4 Distribuciones Muestrales de MCO-OLS
Dado
Tenemos que:
4.4.5 Contrastación de Hipótesis
¿Sirven los estimadores como variables explicativas?
Eso lo averiguamos con una prueba de hipótesis
Hipótesis Nula: la variable no sirve Hipótesis Alternativa: la variable sirve
¿Cómo la aplicamos?Idealmente dado que es una normal:
sin embargo depende de desconocida usamos como sustituto a
Criterio de Decisión
Rechazo
Aveces nos interesa saber en donde sepuede ubicar Esto lo podemos saber con un intervalo de confianza
Dado
Sustituyo:
Intervalo de Confianza al para
4.4.6 Bondad de Ajuste
¿Qué tan buena es la regresión?Analíticamente:
Despejo:
Coeficiente de Determinación
Coeficiente de Alineación
Coeficiente de Correlación
Propiedades:
4.4.7 Test de Normalidad
MCO-OLS funciona suponiendo normalidad. ¿Cómo lo verificamos?
1) Graficar residuos (Histograma de Residuos)2) Test Jarque-Bera
siendo S=sesgo y K=curtosis
En muestras grandes: AsintóticamenteSi hay Normalidad
3) Criterio de Decisión: Rechazo
Ejemplo:
¿Es normal? Acepto
4.4.8 P-valores e Hipótesis Nula
Si me interesa rechazar debiera tener un p-value cuyo valor sea pequeño (menor a 0.10)Si me interesa aceptar debiera tener un p-value cuyo valor sea grande (mayor a 0.10)
4.4.9 Calidad de la Predicción
Supongamos
dado valor numérico especificado
Predicción asociada a
En general se distribuye como
Dados desconocidos, usamos los estimadores muestrales y la normal ya no aplica, se usa la distribución :
Límite Superior:
Límite Inferior: