0. inferencia estadistica[1].pptx

64
CARLOS MENDOZA ASTROZ Econometría 2015-I INTRODUCCIÓN ESTADÍSTICA Pag . INFERENCIA ESTADÍSTICA TEORÍA Y PRACTICA FINANCIERA CARLOS MENDOZA ASTROZ 1

Upload: arturomartinez

Post on 13-Dec-2015

249 views

Category:

Documents


13 download

TRANSCRIPT

Page 1: 0. INFERENCIA ESTADISTICA[1].pptx

CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

INFERENCIA ESTADÍSTICATEORÍA Y PRACTICA FINANCIERACARLOS MENDOZA ASTROZ

1

Page 2: 0. INFERENCIA ESTADISTICA[1].pptx

2CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Agenda1. Definición de inferencia estadística2. Estimadores y métodos de estimación3. Propiedades de los estimadores4. Intervalos de confianza5. Pruebas de hipótesis

Page 3: 0. INFERENCIA ESTADISTICA[1].pptx

CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

-4.000 -2.000 0.000 2.000 4.000 6.000 8.000 10.000 12.000

3

INFERENCIA ESTADÍSTICA CLÁSICA. Suponga un conjunto de datos que se definen como valores observados de variable(s) aleatoria(s) (v.a) representando resultados de algún evento repetido. La distribución de probabilidad de las v.a. son desconocidas y se desea utilizar los datos disponibles (espacio muestral) para aprender de las características de la distribución poblacional. [𝑘:𝑗 ]Desconocido

Conocido

FDPDatos

PGD

Inferencia

PGDInferencia

Definición. Estimador. Dada una muestra aleatoria {Y1,Y2,…,Yn} extraída de una distribución de la población que depende de un parámetro desconocido (Θ), un estimador del parámetro desconocido (Θ) es una regla que asigna a cada resultado posible de la muestra un valor de Θ.

Page 4: 0. INFERENCIA ESTADISTICA[1].pptx

4CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

INFERENCIA ESTADÍSTICA CLÁSICA. En términos mas generales, un estimador de un parámetro Θ se puede expresar como una formula matemática abstracta: = h(Y1, Y2,…, Yn)para alguna función conocida h de las variables aleatorias Y1, Y2,…, Yn. es una variable aleatoria (v.a.) pues depende de la muestra aleatoria conforme se obtienen diferentes muestras aleatorias de la población, el valor de puede cambiar.Cuando un conjunto de números en particular, por ejemplo {y1, y2,…, yn}, se inserta a la función h, se obtiene una estimación de Θ, denotada como =h(y1,…, yn). En ocasiones, es llamado un estimador puntual y 0 es una realización del estimador.

Page 5: 0. INFERENCIA ESTADISTICA[1].pptx

5CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

INFERENCIA ESTADÍSTICA CLÁSICA. Un experimento se describe por un único numero y repetido T_veces entonces la muestra consiste en (y1,y2,…,yT)=Yt. La FDP conjunta de la muestra y asume una forma matemática f(y|Θ) que depende de uno o mas parámetros Θ=[θ1, θ2,… θk]. Los parámetros Θ desconocidos se encuentran en un conjunto de posibles valores Ω conocido como espacio de parámetros. Un investigador asume conocer f(y|Θ) y Ω constituyendo un modelo estadístico (inferencia estadística clásica).Dado un modelo, la inferencia estadística clásica, consiste en utilizar valores muéstrales de y para especificar valores plausibles para Θ (problema del punto de estimación) o al menos determinar un subconjunto de Ω que puede o no contener Θ (intervalos de estimación o pruebas de hipótesis).

Page 6: 0. INFERENCIA ESTADISTICA[1].pptx

6CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Como un ejemplo de un estimador, sea {Y1,…, Yn} una muestra aleatoria de una población con media. Un estimador natural de μ es el promedio de la muestra aleatoria:

De esta manera recibe nombre de promedio muestral, ahora el promedio muestral de un conjunto de números no es un estadístico descriptivo, ahora se considera como un estimador.

Page 7: 0. INFERENCIA ESTADISTICA[1].pptx

7CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Ejemplo. Suponga el promedio de los retornos de la acción de ECOPETROL es 2.3% mensual durante el ultimo año con una distribución normal N(μ,σ2) con parámetros desconocidos de localización (μ) y escala (σ2). Ver ejercicio de Excel. La estimación de parámetros implica utilizar datos muéstrales de los rendimientos de Ecopetrol para hacer inferencia estadística de los parámetros poblacionales del promedio de rendimiento (μ) y volatilidad (σ2) de los retornos. La estimación puede tomar un valor puntual (rendimiento promedio mensual es 2.0%) o valores en un intervalo (se encontrara entre 1.0% y 3.0%) .La prueba de hipótesis relaciona los datos para probar evidencia a cerca de una conjetura sobre la población. Por ejemplo, basado en una distribución normal N(μ,σ2) es estadísticamente significativo encontrar rendimientos en la acción de Ecopetrol inferiores a 1.0%?

Page 8: 0. INFERENCIA ESTADISTICA[1].pptx

8CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Agenda1. Definición de inferencia estadística2. Estimadores y métodos de estimación3. Propiedades de los estimadores4. Intervalos de confianza5. Pruebas de hipótesis

Page 9: 0. INFERENCIA ESTADISTICA[1].pptx

9CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

⊛ Preguntas:¿A partir de datos (muestra) como se pueden estimar parámetros (población)?¿Cual es la mejor estimación de un parámetro poblacional desconocido?⊛ Respuesta:Metodologías que buscan encontrar un estimador que mejor se acerque desde la muestra hacia la población. Las técnicas mas utilizadas son:1. Máxima verosimilitud2. Mínimos cuadrados3. Método de momentos Técnicas de optimización matemática

Page 10: 0. INFERENCIA ESTADISTICA[1].pptx

10CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Para comprender algunas ideas sobre procesos de estimación es necesario tener claro el concepto de muestreo aleatorio.Definición. Muestreo aleatorio. Sean x1, x2…..xu variables aleatorias independientes, cada con la misma distribución de probabilidad f(x). Se define X1,X2….Xu como una muestra aleatoria de tamaño u de la población f(x) y se escribe su distribución de probabilidad conjunta como: f(x1, x2…..xu)=f(x1)*f(x2 )*…..*f(xu)

Page 11: 0. INFERENCIA ESTADISTICA[1].pptx

11CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Definición. Estimación por máxima verosimilitud. Sean x1, x2…..xu una muestra aleatoria de una distribución de probabilidad f(X;Θ) y sea L(x1,x2…..xu) la verosimilitud de la muestra como función de Θ. Entonces, si =u(x1, x2…..xu) es el valor de Θ para el cual el valor de la función de verosimilitud es máxima, entonces, = u(x1, x2…..xu) es el estimador de máxima verosimilitud de Θ y .1. Utiliza el conocimiento de la muestra para estimar (hacer inferencia) al valor de un parámetro poblacional.2. Selecciona el valor del parámetro poblacional a través de una muestra para el cual la probabilidad observada (verosimilitud) es máxima. 3. La muestra tiene la mayor probabilidad de ocurrencia para una distribución f(X;Θ). La información del parámetro esta en la muestra

Page 12: 0. INFERENCIA ESTADISTICA[1].pptx

12CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

ESTIMACION MAXIMO VEROSIMIL PARA EL PROMEDIO

-60,000.0000

-50,000.0000

-40,000.0000

-30,000.0000

-20,000.0000

-10,000.0000

0.00000 20 40 60 80 100

Ir a ejercicio en EXCEL

F()Θ

Page 13: 0. INFERENCIA ESTADISTICA[1].pptx

13CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Una dificultad en el método de máxima verosimilitud radica en elegir una distribución de probabilidad especifica. El método de mínimos cuadrados no requiere una distribución especifica.Definición. Estimación por mínimos cuadrados. Encuentra el valor de los parámetros estimados Θ mediante al minimización de la suma de cuadrados de las diferencias entre los valores observados y aquellos proporcionados por la ecuación de predicción. Los valores se conocen como estimadores de mínimos cuadrados. Existen varios tipos entre ellos:• Mínimos cuadrados ordinarios (OLS)• Mínimos cuadrados generalizados (GLS)• Mínimos cuadrados en dos etapas (2LS)

Page 14: 0. INFERENCIA ESTADISTICA[1].pptx

14CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Ir a ejercicio en EXCEL

ESTIMACION LS PARA EL PROMEDIO

0.0000

50,000.0000

100,000.0000

150,000.0000

200,000.0000

250,000.0000

300,000.0000

350,000.0000

400,000.0000

0 20 40 60 80 100 120

F()

Θ

Page 15: 0. INFERENCIA ESTADISTICA[1].pptx

15CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Ejemplo. Suponga en la mesa de dinero XXX donde se informa que se tiene una correlación (de 70% entre la tasa de los TES24 y TES18. Usted efectuaría alguna cobertura dada estas características? Yo no. Porque:1. El calculo de la correlación asume la muestra como población y NO utilizan un proceso para su estimación, es solo un estadístico.2. Asume estimación puntual ( y no es consecuencia de un proceso de inferencia estadística. Además, No se indagan las propiedades de los estimadores, ni su estabilidad cuando crece la muestra.3. No se efectúa un análisis por intervalo o pruebas de hipótesis sobre el valor de la correlación.CONCLUSIÓN. Es necesario incluir propiedades de los estimadores, significancia estadística, análisis por intervalo y pruebas de hipótesis para determinar adecuadamente un análisis de inversión.

Page 16: 0. INFERENCIA ESTADISTICA[1].pptx

16CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Agenda1. Definición de inferencia estadística2. Estimadores y métodos de estimación3. Propiedades de los estimadores4. Intervalos de confianza5. Pruebas de hipótesis

Page 17: 0. INFERENCIA ESTADISTICA[1].pptx

17CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Que tan bueno es un estimador? Es imposible responder en la medida que se desconoce el valor poblacional, un estimador es una variable aleatoria. Para encontrar una buena respuesta es necesario utilizar muestras repetidas para indagar las propiedades de los estimadores y resultados sobre valores estimados. Además, es necesario determinar sus propiedades, las cuales se dividen en dos grandes ramas:1. Muestra pequeña 2. Muestra grande o asintótica (n→∞)Cuales son sus características:a) Insesgamiento (1)b) Consistencia (2)c) Eficiencia (1,2)d) Suficiencia (1,2)

Page 18: 0. INFERENCIA ESTADISTICA[1].pptx

18CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Porque muestra grande supera en el análisis a muestra pequeña?1. Muestra pequeña (no tiene en cuenta el tamaño de muestra) son intratables para muchos de los estimadores en distintas situaciones. La muestra grande (consistencia n→∞) es mucho más general.2. Muchos de los estimadores utilizados en distintas situaciones no tienen propiedades deseables en muestra pequeña como insesgamiento.3. Análisis asintótico permite un tratamiento unificado de los procesos de estimación.4. El análisis asintótico no deja de tener inconvenientes. La solución puede conducir a un mal camino. En aquellos casos donde las propiedades de muestra finita pueden ser derivadas

Page 19: 0. INFERENCIA ESTADISTICA[1].pptx

19CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Las propiedades de la muestra pequeña son limitadas y es necesario verificar si los estimadores deben ser comparados con sus propiedades asintóticas, es decir, cuando el tamaño de muestra es grande y se aproxima al infinito.Muestra pequeña Muestra grande

insesgamiento Consistencia

Convergencia en distribución

Eficiencia Eficiencia asintótica

Pero para que? Es necesario encontrar las características asintóticas en la medida que trabajamos con muestra pequeña y deseamos estar seguros que a medida que aumente el tamaño de la muestra se converge a un valor poblacional

Page 20: 0. INFERENCIA ESTADISTICA[1].pptx

20CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Definición. Estimador insesgado. El valor esperado de un estimador es igual a su valor poblacional. F()

�̂�

F(= función de estimación= Estimador de ΘΘ = Valor poblacional

Función de estimación en su valor máximo

Θ

Si un estimador es insesgado, entonces su distribución de probabilidad tiene un valor esperado igual al parámetro que se supone estimara.

Page 21: 0. INFERENCIA ESTADISTICA[1].pptx

21CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

1. Una debilidad de la insesgamiento es que algunos estimadores razonables, e incluso algunos muy buenos, no son insesgados.2. El insesgamiento en algunos casos tiene resultados muy pobres. Algunos estimadores insesgados pueden tener una varianza demasiado grande para ser considerados aceptables. Una forma de comparar los estimadores que no necesariamente son insesgados, es calcular el error cuadrático medio (ECM) de los estimadores. Si es un estimador de Θ, entonces el ECM de se define como ECM() E[(-Θ)2]. El ECM mide, en promedio, que tan alejado esta el estimador de Θ. Se puede mostrar que ECM()=Var()+[Bias()]2. Así que ECM() depende de la varianza y el sesgo (si lo hubiera). Esto permite comparar dos estimadores cuando uno o ambos son sesgados.

Page 22: 0. INFERENCIA ESTADISTICA[1].pptx

22CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Definición. Estimador eficiente. Sobre dos estimadores insesgados siempre será preferido un estimador con la varianza mas pequeña. Se dice que es un estimador de varianza mínima. En otras palabras, un estimador es un estimador eficiente de Θ si E()=Θ y var()> var(). Una metodología para determinar si un estimador es eficiente se conoce como la desigualdad de CRAMER-RAO. Establece que si es un estimador insesgado de Θ tiene la siguiente propiedad.:Si el estimador es insesgado con una varianza igual a –1/E[d2L(·)/dΘ2] la cual es conocida como la cuota interior de CRAMER-RAO indica su eficiencia puesto que no existe una varianza mas pequeña para un estimador insesgado. La inversa de la matriz de información [I(Θ)]-1 es la cuota inferior de CRAMER RAO.

Page 23: 0. INFERENCIA ESTADISTICA[1].pptx

23CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Es razonable exigir que a medida que el tamaño de la muestra aumente para que cualquier procedimiento de estimación mejore.Definición. Consistencia. Asegura que los estimadores, , producirán un valor estimado cercano al verdadero parámetro poblacional, Θ, con una alta probabilidad si el tamaño de muestra es lo suficientemente grande. De manera mas precisa, sea un estimador de Θ sobre la muestra de tamaño T. Entonces es un estimador consistente de Θ si: =1Donde ε es un numero arbitrariamente pequeño. Esto significa que la probabilidad que el valor [+ ε, -ε,] puede ser arbitrariamente cercana a 1 si el tamaño de muestra, T, crece, no importa cuan pequeño sea ε. Se dice que converge en probabilidad a Θ (probabilidad limite) y se nota como: plim = Θ

Page 24: 0. INFERENCIA ESTADISTICA[1].pptx

24CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Consistencia en probabilidad (plim). Sea Y1,Y2,…YT una muestra aleatoria que viene de una población N(β,σ2) y considere el estimador de β, la cual es la media muestral. Si conocemos que T se distribuye N(β,σ2) y se consideran 2 tamaños muestrales T2>T1. Se muestra de la siguiente manera: f(T) β

-0.10

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

-4.000 -2.000 0.000 2.000 4.000 6.000 8.000 10.000 12.000

Asintóticamente insesgado

Ir a ejercicio de Excel

los estimadores insesgados no son necesariamente consistentes, pero aquellos con varianzas que se reducen a cero a medida que el tamaño muestral aumenta son consistentes.

Page 25: 0. INFERENCIA ESTADISTICA[1].pptx

25CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

La consistencia es una propiedad de los estimadores puntuales. Aunque esta expresa que la distribución del estimador se esta colapsando en torno al parámetro a medida que el tamaño de la muestra aumenta, no expresa esencialmente nada acerca de la forma de esa distribución para un tamaño muestral dado. Para construir estimadores de intervalo y pruebas de hipótesis, se necesita una forma de aproximar la distribución de los estimadores. La mayoría de los estimadores econométricos tiene distribuciones que se aproximan bien mediante una distribución normal para muestras grandes,

Page 26: 0. INFERENCIA ESTADISTICA[1].pptx

26CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Ley de los grandes números. Sean Y1,Y2,…,Yn variables aleatorias independientes, idénticamente distribuidas (vaiid) con media μ. Entonces: plim(n) = μLa ley de los grandes números significa que, si se esta interesado en estimar el promedio poblacional μ, es posible aproximarse arbitrariamente a μ si se elige una muestra suficientemente grande. Este resultado fundamental se puede combinar con las propiedades básicas de la probabilidad limite (plim) para mostrar que estimadores muy complejos son consistentes.

Page 27: 0. INFERENCIA ESTADISTICA[1].pptx

27CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Defunción. teorema del límite central (TLC) es uno de los resultados mas poderosos en probabilidad y estadística. Indica que el promedio de una muestra aleatoria para cualquier población (con varianza finita), cuando se estandariza, tiene una distribución normal estándar asintótica.Teorema del límite central. Sea {Y1,Y2,…,Yn} una muestra aleatoria para cualquier población con una media μ y una con varianza finita σ2. Entonces:Tiene una distribución normal estándar asintótica. Ir a ejercicio excel

Page 28: 0. INFERENCIA ESTADISTICA[1].pptx

28CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Definición. Convergencia en distribución (asy). Es la función de distribución de probabilidad (FDP) de un estimador a la cual converge progresivamente en la medida que el tamaño de la muestra se incrementa (asintótico). Un buen ejemplo de ello es el teorema del limite central.

0.00

0.05

0.10

0.15

0.20

0.25

0.30

-4.000 -2.000 0.000 2.000 4.000 6.000 8.000 10.000 12.000

Page 29: 0. INFERENCIA ESTADISTICA[1].pptx

29CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Si deseamos tener una visión de múltiples estimadores y verificar sus propiedades (análisis multivariado) es especial la Convergencia en distribución (asy), se utilizan los vectores de estimación. Si es un estimador consistente de y (T-) converge en distribución N[0,𝚺], entonces se dice asintóticamente distribuido (aproximación por muestra grande) N[0,(1/T)𝚺], es decir en términos notacionales ∼ N[0,(1/T)𝚺], asy

0.00

0.05

0.10

0.15

0.20

0.25

0.30

-4.000 -2.000 0.000 2.000 4.000 6.000 8.000 10.000 12.000

Page 30: 0. INFERENCIA ESTADISTICA[1].pptx

30CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

La mayoría de los estimadores encontrados en estadística y econometría se puede escribir como funciones de promedios muestrales, en cuyo caso se puede aplicar la ley de los grandes números y el teorema del limite central. Cuando dos estimadores consistentes tiene distribuciones normales asintóticas, se elige el estimador con la varianza asintótica menor.La asimetría muestral o kurtosis muestral de los retornos son estadísticos informativos para muestras grandes, como las financieras. Las distribuciones asintóticas pueden ser utilizadas para ejecutar pruebas estadísticas sobre los supuestos distribucionales de los retornos. Esta es la idea basica de las pruebas de normalidad como la Jarque-Bera.

Page 31: 0. INFERENCIA ESTADISTICA[1].pptx

31CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Definición. Eficiencia asintótica. Suponga dos estimadores consistentes y del parámetro poblacional Θ, para el primero tal que (T-Θ)→ N(0, ) y (T-Θ)→ N(0, ). Si ≥, entonces es asintóticamente eficiente respecto a .Si se necesita un análisis simultaneo de múltiples estimadores e indagar su eficiencia asintótica, por ejemplo, se tienen vectores de la forma (T-Θ)→N(0,Σ) y (T-Θ)→ N(0,Ω), entonces es asintóticamente eficiente respecto a si Ω-Σ es semidefinida positiva.

dd

Page 32: 0. INFERENCIA ESTADISTICA[1].pptx

32CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Con los insumos anteriores es posible establecer la propiedad mas importante y atractiva para los estimadores de máxima verosimilitud. Bajo condiciones suficientemente generales, los estimadores de máxima verosimilitud son consistentes, por tanto, asintóticamente insesgados, asintóticamente normales y asintóticamente eficientes. Es decir, (T-) →N Estas propiedades, y su potencia, implican que es posible realizar intervalos de confianza y pruebas de hipótesis sin ningún problema.d

Page 33: 0. INFERENCIA ESTADISTICA[1].pptx

33CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Ejemplo. Suponga se encuentra en una mesa de dinero y desea investigar los spreads que se mantienen en las dos referencias mas liquidas del mercado Colombiano, es decir, TES TF18 y TF24. El spread promedio histórico se mantiene en 300pb y la correlación estimada entre TF24 y TF18 es 84%.Es la información suficiente y adecuada?

NO ES UNA TÉCNICA ESTADÍSTICA MAS, ES UNA NUEVA MANERA DE PENSAR EN FINANZAS.

NOEl promedio histórico de spreads, y la correlación son estimadores? SI es así, lo deseable es que debe cumplir con consistencia y suficiencia asintoticaPorque? Si no fueran CONSISTENTES ASINTÓTICAMENTE el promedio histórico de 300pb no será cierto, ya que puede existir un sesgo ubicando el spread entre 500 o 100, es un error tomar esa decisión.

Y TODO ESTO PARA QUE???? TIENE ALGUNA UTILIDAD PRACTICA????.

Page 34: 0. INFERENCIA ESTADISTICA[1].pptx

34CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Agenda1. Definición de inferencia estadística2. Estimadores y métodos de estimación3. Propiedades de los estimadores4. Intervalos de confianza5. Pruebas de hipótesis

Page 35: 0. INFERENCIA ESTADISTICA[1].pptx

35CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Definición. INTERVALO DE CONFIANZA. Si se deseara realizar un proceso en donde los valores estimados son requeridos para investigación se tiene que relacionar la confiabilidad de sus resultados. Con la información de la varianza del estimador (necesidad de varianza mínima) y el conocimiento de la distribución se transmite esta información. El rango del punto de estimación (valor del estimador) y medidas de precisión (varianza del estimador) se conoce como intervalo de confianza.Sea Y1,Y2,….,YN una muestra aleatoria con distribución poblacional N(β,σ2) donde σ2 es conocida. El estimador MV de β es ~N(β,σ2/T). Por lo tanto: Z=(- β)/(σ2/T) ~N(0,1) P[-Z(α/2) ≤ Z ≤ Z(α/2)]=(1-α)P[β-Z(α/2) (σ2/T) ≤ Z ≤ β+Z(α/2) (σ2/T)]=(1-α) es una v.a.

Page 36: 0. INFERENCIA ESTADISTICA[1].pptx

36CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Agenda1. Definición de inferencia estadística2. Estimadores y métodos de estimación3. Propiedades de los estimadores4. Intervalos de confianza5. Pruebas de hipótesis

Page 37: 0. INFERENCIA ESTADISTICA[1].pptx

37CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Un test o prueba estadística es un problema de decisión que involucra un parámetro desconocido Θ al cual debe encontrarse en un espacio de parámetros Ω. El espacio Ω puede dividirse en dos subconjuntos disjuntos Ω0 y Ω1 y se debe decidir utilizando una muestra de datos si Θ se encuentra en Ω0 o Ω1.Suponga H0 denotado como hipótesis nula que establece que Θ∈H0 y H1 se denota como hipótesis alternativa donde establece que Θ∈H1 . Puesto que los conjuntos son disjuntos solo una de las hipótesis no se rechaza y la otra es rechazada simultáneamente.La prueba de hipótesis implica la ejecución de toma de decisiones al rechazar o no la hipótesis nula (Ho) y efectuar la decisión contraria sobre la hipótesis alternativa (H1) a la luz de potenciales costos de ejecutar decisiones incorrectas y utilizar cualquier conjunto de datos de la manera mas eficientemente posible.

Page 38: 0. INFERENCIA ESTADISTICA[1].pptx

38CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

LECTURA DE PRUEBAS DE HIPOTESIS DESDE EL P-VALUESuponga la prueba individual de la siguiente forma:Ho: βi=0 H1: βi≠0LECTURA. Si la prueba de hipótesis nula no se rechazara, es decir βi=0, manteniendo los demás términos constantes, la probabilidad de encontrar valores en términos absolutos iguales o superiores al t estadístico es de XX% sobre una distribución. Si la totalidad del área se encuentra en la región de rechazo, la hipótesis nula (Ho) se rechaza.

(Manteniendo las demás variables constantes ,la variable Xi NO tiene influencia sobre la variable explicativa).(Manteniendo las demás variables constantes, la variable Xi tiene influencia sobre la variable explicativa).

Page 39: 0. INFERENCIA ESTADISTICA[1].pptx

39CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

LECTURA DE PRUEBAS DE HIPOTESIS DESDE EL P-VALUE

Distribucion t studentP-value =0.055% Estadístico t=5.32RECHAZO HoPr>|t|

Distribucion t studentP-value =55% Estadístico t=5.32NO RECHAZO H1

Pr>|t|

Nivel del significancia del 95%

Región Rechazo

Región Rechazo

P VALUE

P VALUE

Page 40: 0. INFERENCIA ESTADISTICA[1].pptx

40CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

ERRORES EN LAS PRUEBAS DE HIPÓTESIS

Page 41: 0. INFERENCIA ESTADISTICA[1].pptx

41CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Un ejemplo en el otorgamiento de un crédito: Se desea determinar si un cliente se le puede o no ejecutar un préstamo.Ho: El señor Pepito Pérez es mal cliente H1: El señor Pepito Pérez es buen clienteP[rechazar Ho|Ho es verdadera]=α⟶ Error tipo IP[No rechazar Ho|Ho es falsa]=β⟶ Error tipo II1. Es mas grave el error tipo I que el error tipo II. La conformación de la hipótesis nula y alternativa debe estar basada en lo anterior.2. Las probabilidades α y β son probabilidades condicionales.3. La evaluación de una prueba de hipótesis debe efectuarse en relación de su función de potencia.

Page 42: 0. INFERENCIA ESTADISTICA[1].pptx

42CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Un ejemplo en el otorgamiento de un crédito: Se desea determinar si un cliente se le puede o no ejecutar un préstamo.Ho: El señor Pepito Pérez es mal cliente H1: El señor Pepito Pérez es buen clienteP[es buen cliente | es mal cliente]=α⟶ Error tipo I P[es mal cliente | es buen cliente]=β⟶ Error tipo II1. Es mas grave el error tipo I que el error tipo II. La conformación de la hipótesis nula y alternativa debe estar basada en lo anterior.2. Las probabilidades α y β son probabilidades condicionales.3. La evaluación de una prueba de hipótesis debe efectuarse en relación de su función de potencia.

Page 43: 0. INFERENCIA ESTADISTICA[1].pptx

43CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

RealidadMatriz de confusión Ho es falsa Ho es verdadera

Pruebade

hipótesis

Rechazar Ho Correcto IncorrectaError tipo I

P[rechazar Ho|Ho es cierta]0≤α≤1No rechazar

HoIncorrectoError tipo II

P[No rechazar Ho|Ho es falsa]0≤β≤1

Correcto

Page 44: 0. INFERENCIA ESTADISTICA[1].pptx

44CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Existe una relación inversa entre error tipo I y error tipo II. Reducir la probabilidad de 𝛂 implica el incremento de la probabilidad de β.La probabilidad no cero de rechazar Ho cuando es verdadera, P[rechazar Ho|Θ es verdadera], se conoce como error tipo I o nivel de significancia estadística. La probabilidad se encuentra acotada por un nivel de confianza (𝛂=5%). Es decir, el tamaño del nivel de significancia 𝛂 es el valor mas grande de Π(Θ)=P[rechazar Ho|Θ es verdadera]. Por lo tanto: P[error tipo I]=P[rechazar Ho|H1 es verdadera]= 𝛂1-P[error tipo I]=P[NO rechazar Ho|H1 es verdadera]= 1-𝛂El segundo tipo se conoce como error tipo II y significa que probando una hipótesis no rechaza una hipótesis falsa. β=P[Error Tipo II]=P[no rechazar Ho|H1 es falsa] β=1-Π(Θ) ∈Ω1 .

Page 45: 0. INFERENCIA ESTADISTICA[1].pptx

45CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Definición. función de potencia. La función p(Θ)= 1-β(Θ) recibe el nombre de función de potencia y representa la probabilidad de rechazar la hipótesis nula Ho cuando esa es falsa (tomar una decisión correcta). β(Θ) representa la función Característica De La Operación (CO), es decir, es la probabilidad que un valor de la estadística de prueba no se encuentre en la región critica cuando Ho es falsa, o mejor, P[No rechazar Ho|Ho es falsa] (error tipo II).La potencia de la prueba de hipótesis detecta que Ho es falsa y determina que tan potente es la prueba en relación con los valores de α y β

Page 46: 0. INFERENCIA ESTADISTICA[1].pptx

46CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

FUNCIÓN DE POTENCIA:Puesto que las pruebas de hipótesis implican efectuar una decisión existe al posibilidad que las decisiones sean incorrectas. Suponga H0: Θ∈Ω1 y H1: Θ∈Ω2. Una vez el estadístico y la región critica han sido definidos, entonces la probabilidad de rechazo de Ho puede ser determinada para cada Θ∈Ω. Sea Π(Θ)=P[rechazar Ho|Θ es falsa] donde Ho es rechazada cuando la prueba estadística cae en la región critica. Es conocida como la función de potencia de la prueba. Esto indica que el procedimiento siempre conduce a una decisión correcta, rechazar la hipótesis cuando es falsa y no rechazar cuando es verdadera. Esta perfección NO EXISTE EN LA REALIDAD.

Page 47: 0. INFERENCIA ESTADISTICA[1].pptx

47CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

ALGUNOS TIPS:1. La magnitud del error tipo I es convencionalmente pequeña y fija en un valor, la razón corresponde a que es la probabilidad de rechazar la hipótesis nula incorrectamente y es el error que mas deseamos evitar. Es decir, no se desea rechazar la hipótesis nula a menos que exista evidencia suficiente para demostrar lo contrario.2. Sobre la potencia de una prueba con un nivel dado de significancia, 𝛂, a medida que el tamaño muestral aumenta (tiende hacia infinito) La potencia de la prueba se incrementa (tiene a 1) para cada β≠1. Se justifica en el hecho de estimadores consistentes. A medida que la muestra aumenta el estimador colapsa en el parámetro poblacional y la probabilidad de rechazar una hipótesis falsa se dirige a la unidad.

Page 48: 0. INFERENCIA ESTADISTICA[1].pptx

48CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

UNA PREGUNTA?Dado un tamaño de muestra existe un procedimiento de prueba (una prueba estadística y una región de rechazo) que es uniformemente mas poderosa, es decir, un procedimiento estadístico que tenga la mas alta potencia sobre cualquier prueba de tamaño similar para cualquier parámetro desconocido?En la realidad es muy difícil encontrar estas pruebas por tal motivo es necesario procedimientos que efectúen un buen trabajo en términos de las características de potencia de pruebas. Es necesario presentar este tipo en términos de razones de verosimilitud (likelihood ratio).

Page 49: 0. INFERENCIA ESTADISTICA[1].pptx

49CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Prueba de razón de verosimilitudesCompara el valor máximo de la función de verosimilitud bajo el supuesto que la hipótesis nula es correcta para el valor máximo de la función de verosimilitud no restringida. En otros términos:1. La hipótesis nula restringe el conjunto de posibles valores de los parámetros. 2. Este conjunto reducido de posibles valores reducidos, dado por la hipótesis nula, restringe el valor máximo de la función de verosimilitud. 3. Suponga que obtenemos la estimación máximo verosímil de los parámetros basados sobre la muestra observada y compramos estos resultados sobre el conjunto definidos por la hipótesis nula.4. Si los dos resultados fueran suficientemente cercanos, debería soportarse que la hipótesis nula es cierta.

Page 50: 0. INFERENCIA ESTADISTICA[1].pptx

50CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Suficientemente cercanos? Puede ser caracterizado por valores de la función de verosimilitud en cada uno de los conjuntos estimados (el completo y el determinado por la hipótesis nula). Si el valor de la función de verosimilitud es cercano, entonces los dos conjuntos de estimación son cercanos. Por otra parte, si el valor de la función de verosimilitud difieren sustancialmente, la validez de la hipótesis debería ser cuestionada.Sea una variable aleatoria Y~N(β,σ2) el espacio de parámetros completo (no restringido) para esta variable aleatoria es:Ω={(β,σ2)|-∞< β < ∞,-∞< σ2 < ∞}La hipótesis nula y alternativa son:H0: β=β0 y H1: β ≠β0

Page 51: 0. INFERENCIA ESTADISTICA[1].pptx

51CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Como no existe alguna conjetura sobre el parámetro σ2 la hipótesis nula determina un subespacio dentro del espacio de parámetros no restringido Ω. El subespacio será denotado por:𝛚={(β,σ2)| β=β0 ,-∞< σ2 < ∞} Dentro del espacio de parámetros 𝛚 y Ω son valores de los parámetros desconocidos que maximizan la función de verosimilitud. Los valores de la función de verosimilitud en los puntos máximo es denotado por l(𝛚) y l(Ω). La noción del procedimiento de razón de verosimilitudes: El valor de λ se encontrara entre cero y uno.

Page 52: 0. INFERENCIA ESTADISTICA[1].pptx

52CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

El principio de razón de verosimilitudes establece que la hipótesis nula definida sobre un subespacio es rechazado si: λ0≥λDonde λ0 es convenientemente elegido como una constante. Esto implica el criterio de elección de λ0. Puesto que λ es una variable aleatoria, el nivel de significancia estadística es definido como:α=P[λ0≥λ|Ho es verdadera]Ahora bien, λ0 es elegido para tomar valores de α igual al nivel de significancia previamente asignado.

Page 53: 0. INFERENCIA ESTADISTICA[1].pptx

53CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Pruebas asintóticas:La razón de verosimilitudes se basan en muestra finita o resultados en pequeñas muestras. Es posible utilizar resultados asintóticos para efectuar pruebas de hipótesis en casos donde una prueba de hipótesis de muestra finita no es posible. Existen tres (3) aproximaciones las cuales pueden ser utilizadas bajo condiciones adecuadas y son asintóticamente equivalentes. Las pruebas son:1. Razón de verosimilitudes (LR)2. Test de Wald (W)3. Multiplicador de Lagrange (LM)Los 3 procedimientos están enmarcados en estimaciones de máxima verosimilitud y el uso de normalidad asintótica de los estimadores ML.

Page 54: 0. INFERENCIA ESTADISTICA[1].pptx

54CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Sea una estimación de máxima verosimilitud y se utilice su distribución asintóticamente normal de sus estimadores máximo verosimiles . Sea l(θ) la función del logaritmo de la verosimilitud, donde θ es un único parámetro desconocido que se encuentre dentro del espacio de parámetros Ω, y es el estimador de máxima verosimilitud no restringido de θ. Suponga la hipótesis nula de la forma:H0: θ0 = θH1: θ0 ≠ θEl espacio de parámetros restringido ω consiste en un único punto θ0 y el estimador de máxima verosimilitud de θ sobre ω es θ*=θ0. La razón de verosimilitud esta dada por :

Page 55: 0. INFERENCIA ESTADISTICA[1].pptx

55CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Se puede demostrar que si la hipótesis nula no se rechaza, entonces:LR=-2logλ =-2[l(θ0)-l()]=2[l() - l(θ0)] La prueba estadística LR se distribuye asintóticamente con J grados de libertad, igual al numero de hipótesis a contrastar, en este caso, es igual a 1. La hipótesis nula es rechazada si el valor del estadístico LR es demasiado grande, es decir, si LR≥ donde es el percentil α-esimo superior de una distribución .

Page 56: 0. INFERENCIA ESTADISTICA[1].pptx

56CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

ESTIMACION MAXIMO VEROSIMIL PARA EL PROMEDIO

-60,000.0000

-50,000.0000

-40,000.0000

-30,000.0000

-20,000.0000

-10,000.0000

0.00000 20 40 60 80 100

θ̂θ0

l(θ0)

l()

PRUEBA DE RAZÓN DE VEROSIMILITUDES: Si los valores de l() y l(θ0) se encuentran demasiado distantes se puede rechazar la hipótesis nula

Variables clave: distancia entre l() y l(θ0) y la curvatura de la función de verosimilitud.

Page 57: 0. INFERENCIA ESTADISTICA[1].pptx

57CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

ESTIMACION MAXIMO VEROSIMIL PARA EL PROMEDIO

-60,000.0000

-50,000.0000

-40,000.0000

-30,000.0000

-20,000.0000

-10,000.0000

0.00000 20 40 60 80 100

θ̂θ0

l(θ0)

lA()

Tienen el mismo máximo con distinta curvatura.: para funciones mas curvas la distancia entre l() y l(θ0) aumenta y es una medida para el contraste de hipótesis

Variables clave: distancia entre l() y l(θ0) y la curvatura de la función de verosimilitud.

lB()

Page 58: 0. INFERENCIA ESTADISTICA[1].pptx

58CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Es una medida razonable construir una prueba estadística ponderando la raíz cuadrada de la distancia entre y θ0 ponderada por la curvatura de la función del logaritmo de la verosimilitud. Esta es la metodología que realiza el test de Wald . Es decir, Donde, la curvatura esta dada por la segunda derivada de la función L(θ) evaluada en evaluada en el estimador de máxima verosimilitud no restringido o =θ0. Si la hipótesis nula no se rechaza el test de Wald, W, superior de una distribución . Valores grandes de W implican valores grandes de LR y viceversa. Los dos conjuntos son asintóticamente equivalentes. Una forma usual de notarlo es: I()Donde, I() es la matriz de información.

Page 59: 0. INFERENCIA ESTADISTICA[1].pptx

59CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

La prueba e multiplicadores de Lagrange (LM) se deriva de una estimación de máxima verosimilitud restringida utilizando multiplicadores de Lagrange. Es decir, se maximiza la función l(θ) sujeto a una restricción que θ=θ0, es decir: Maximizar l(θ) S.A. θ=θ0Consecuentemente una función Lagrangiana de la forma:ℒ(λ,θ)= l(θ)-λ(θ-θ0)Encontrando las CPO, es decir, diferenciando con respecto a λ y θ e igualando a cero se encuentra un estimador de máxima verosimilitud restringido θ*=θ0 y el valor del multiplicador de Lagrange iguala a: λ*=S(θ*)=S(θ0)Con S(θ) como la pendiente de la función del log de la verosimilitud: S(θ)=

Page 60: 0. INFERENCIA ESTADISTICA[1].pptx

60CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Puesto que maximiza l(θ), satisface las CPO para un máximo encontrando S()=0. Para demostrar que la hipótesis nula θ=θ0 no se rechaza de demuestra a través de si existe un valor cercano entre θ0 y , además de, si tiende a cero la pendiente de la función del logaritmo de la verosimilitud o λ*=S(θ0). La magnitud de S(θ0) mide en este caso la distancia entre θ0 y . Sin embargo, dos conjuntos de datos pueden tener dos funciones de verosimilitud distintas con una misma pendiente S(θ0) e implican diferentes valores de la razón de verosimilitudes (LR) y diferentes distancias entre θ0 y dependiendo de la curvatura de l(θ) evaluada en θ0.

Page 61: 0. INFERENCIA ESTADISTICA[1].pptx

61CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

ESTIMACION MAXIMO VEROSIMIL PARA EL PROMEDIO

-60,000.0000

-50,000.0000

-40,000.0000

-30,000.0000

-20,000.0000

-10,000.0000

0.00000 20 40 60 80 100

θ̂θ0

l(θ0)

l()

Variables clave: distancia entre l() y l(θ0) y la curvatura de la función de verosimilitud.

Page 62: 0. INFERENCIA ESTADISTICA[1].pptx

62CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

ESTIMACION MAXIMO VEROSIMIL PARA EL PROMEDIO

-60,000.0000

-50,000.0000

-40,000.0000

-30,000.0000

-20,000.0000

-10,000.0000

0.00000 20 40 60 80 100

θ̂θ0

l(θ0) Dos funciones de verosimilitud distintas con la misma pendiente y distintos valores de LR y distancias entre θ0 y

Variables clave: distancia entre l() y l(θ0) y la curvatura de la función de verosimilitud.

Page 63: 0. INFERENCIA ESTADISTICA[1].pptx

63CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Construir un aprueba estadística basada sobre un punto de partida de la pendiente de la función del logaritmo de la verosimilitud S(θ0) es necesario ponderar [S(θ0)]2 por el reciproco de la curvatura de l(θ) puesto que mayor curvatura implica menor diferencia entre θ0 y y valores mas pequeños de la razón de verosimilitud (LR). La prueba puede ser escrita como: Asintóticamente equivalente a: LM = [S(θ0)]2 [I(θ0)]-1Donde I(θ0) es la matriz de información. LM se distribuye . Se rechaza si la hipótesis nula se encuentra en la región de rechazo (LM es grande).

Page 64: 0. INFERENCIA ESTADISTICA[1].pptx

64CARLOS MENDOZA ASTROZ Econometría 2015-I

INTRODUCCIÓN ESTADÍSTICA

Pag.

Muchas Gracias