modelizaci´on estad´ıstica en el tiempo y en el espacio · datos bivariados espaciales ejemplo:...

190
Introducci´on Modelizaci´ on estad´ ıstica e introducci´on a R Modelizaci´ on temporal Modelizaci´ on espacial Modelizaci´ on estad´ ıstica en el tiempo y en el espacio Pierre Tandeo [email protected] UNNE FaCENA Febrero y Marzo 2012 Pierre Tandeo Modelizaci´ on estad´ ıstica en el tiempo y en el espacio Febrero y Marzo 2012 1/ 190

Upload: doandien

Post on 08-Sep-2018

236 views

Category:

Documents


1 download

TRANSCRIPT

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    Modelizacion estadsticaen el tiempo y en el espacio

    Pierre [email protected]

    UNNEFaCENA

    Febrero y Marzo 2012

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 1/ 190

    [email protected]

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    DefinicionesEjemplosPreguntasObjetivosBibliografa

    Plan

    1 IntroduccionDefinicionesEjemplosPreguntasObjetivosBibliografa

    2 Modelizacion estadstica eintroduccion a R

    3 Modelizacion temporal

    4 Modelizacion espacial

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 2/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    DefinicionesEjemplosPreguntasObjetivosBibliografa

    IntroduccionEstadstica

    Estadstica:

    ciencia del estadoanalizar e interpretar datostomar decisiones

    Estadstica descriptiva:

    descripcionresumen

    Estadstica inferencial:

    modelizacionprediccion

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 3/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    DefinicionesEjemplosPreguntasObjetivosBibliografa

    IntroduccionDatos temporales (1D)

    Terminologa:

    serie temporalanalisis cronologicodatos univariadostemporales

    Ejemplo:

    muertos por mesbronquitis, enfisema oasmaReino Unido1974-1979

    Figura: Ejemplo de serie temporal

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 4/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    DefinicionesEjemplosPreguntasObjetivosBibliografa

    IntroduccionEstadstica descriptiva (1D)

    Figura: Estadsticas descriptivas: funcion de autocorrelacion

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 5/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    DefinicionesEjemplosPreguntasObjetivosBibliografa

    IntroduccionEstadstica inferencial (1D)

    Figura: Modelizacion estadstica: extrapolacion temporal

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 6/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    DefinicionesEjemplosPreguntasObjetivosBibliografa

    IntroduccionDatos espaciales (2D)

    Terminologa:

    geoestadsticaanalisis espacialdatos bivariadosespaciales

    Ejemplo:

    concentracion en zincpartes por millon(ppm)ro Meuse, Franciazona 15m 15m

    Figura: Ejemplo de datos espaciales

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 7/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    DefinicionesEjemplosPreguntasObjetivosBibliografa

    IntroduccionEstadstica descriptiva (2D)

    Figura: Estadsticas descriptivas: variograma

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 8/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    DefinicionesEjemplosPreguntasObjetivosBibliografa

    IntroduccionEstadstica inferencial (2D)

    Figura: Modelizacion estadstica: interpolacion espacial

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 9/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    DefinicionesEjemplosPreguntasObjetivosBibliografa

    IntroduccionDatos temporales e espaciales

    Indexacion:

    lugarfecha

    En la naturaleza:

    dificilmente separablecomo geografia ehistoria

    Figura: Evolucion espacial y temporal del hieloen el Artico

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 10/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    DefinicionesEjemplosPreguntasObjetivosBibliografa

    IntroduccionMotivaciones

    Tema de mi tesis:

    interpolacion temporaly espacialtemperatura desuperficie del mardatos de satelites

    Figura: Interpolacion temporal y espacial dedatos de temperatura de superficie del mar

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 11/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    DefinicionesEjemplosPreguntasObjetivosBibliografa

    IntroduccionOtros ejemplos - Seguimiento

    Seguimientos

    Figura: Ejemplos de seguimiento temporal y espacial

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 12/ 190

    http://www.irisa.fr/vista/Equipe/People/Papadakis/Research/tracking.html

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    DefinicionesEjemplosPreguntasObjetivosBibliografa

    IntroduccionPreguntas

    Como reconocer:

    una dinamica temporal?una estructura espacial?un link entre el tiempo y espacio?

    Como modelizar una variable:

    en el tiempo?en el espacio?en el tiempo y espacio?

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 13/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    DefinicionesEjemplosPreguntasObjetivosBibliografa

    IntroduccionObjetivos

    Modelizacion estadstica (captulo 1):

    estadstica inferencial:

    tests estadsticosseleccion de modeloscriterios numericos y graficos

    modelo simple y explicable

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 14/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    DefinicionesEjemplosPreguntasObjetivosBibliografa

    IntroduccionObjetivos

    Modelizar datos:

    temporales (captulo 2)

    serie temporal1D

    espaciales (captulo 3)

    geoestadstica2D

    temporales y espaciales (captulo 4)

    3D

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 15/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    DefinicionesEjemplosPreguntasObjetivosBibliografa

    IntroduccionObjetivos

    Utilizar software estadstico:

    R (www.r-project.org)gratisflexibleextendido

    Programar

    Interpretar las salidas

    Trabajar solo

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 16/ 190

    www.r-project.org

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    DefinicionesEjemplosPreguntasObjetivosBibliografa

    IntroduccionEvaluacion

    Grupo de 2

    15 h en clase

    Buscar datos:

    sus datos propiosotros datosformato:

    tiempoespaciotiempo y espacio

    Presentacion:

    10 mina la claseintercambio de ideas

    Informe:

    10 paginasextraer una problematicacon figuras, tablas, modelosin codigo R

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 17/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    DefinicionesEjemplosPreguntasObjetivosBibliografa

    IntroduccionComentario importante

    Modelizacion temporal (1D):

    interpolacionextrapolacion

    Modelizacion espacial (2D):

    interpolacion

    Modelizacion temporal y espacial (3D):

    interpolacionextrapolacion

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 18/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    DefinicionesEjemplosPreguntasObjetivosBibliografa

    IntroduccionBibliografa

    Modelizacion estadstica (captulo 1):

    Wasserman, L. All of Statistics, Springer New York, 2004

    Modelizacion temporal (captulo 2):

    Box, G.E.P. and Jenkins, G.M.Time series analysis:forecasting and control, Prentice Hall PTR, 1994

    Modelizacion espacial (captulo 3):

    Cressie, N.Statistics for spatial data, Wiley New york, 1992

    Modelizacion temporal y espacial (captulo 4):

    Cressie, N. and Wikle, K.Statistics for spatio-temporal data,Wiley Series in Probability and Statistics, 2011

    Software R (captulos 1, 2, 3, 4):

    Dalgaard, P.Introductory Statistics with R, Springer, 2002

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 19/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Plan

    1 Introduccion

    2 Modelizacion estadstica eintroduccion a R

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    3 Modelizacion temporal

    4 Modelizacion espacial

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 20/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadstica e introduccion a RPre-requisito

    Probabilidad:

    esperanzavarianzadistribuciones

    Estadistica:

    histograma, boxplotcorrelacion, covarianza

    Computacion:

    programacionmanejo de softwarematematico

    Matematica:

    algebra:

    manipulacion de matrizoperaciones con matrices

    funciones:

    derivadasintegralesbuscar extremos

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 21/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadstica e introduccion a RObjetivos

    Estadstica descriptiva:

    mirar, transformar datosantes de la inferencia

    Estadstica inferencial:

    modelizarestimar parametrosseleccionar modelos

    Aplicar en R

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 22/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadsticaModelizacion estadstica VS Modelizacion fsica

    Modelizacion fsica:

    teoria fsicacon a priorimodelo explicativosin error

    Modelizacion estadstica:

    datos realessin a priorimodelo explicativo y predictivocon error

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 23/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadsticaVocabulario

    Tipos de datos:

    discretos:

    sexo (macho | hembra)color (rojo | verde | azul)situacion (soltero | casado | divorciado | viudo)

    continuos:

    medidasmasa (g)temperatura (C)

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 24/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadsticaVocabulario y notaciones

    Tipos de variables:

    explicativa:

    se denota Y{y1, . . . , yn} son n observaciones de Yvariable aleatoria

    covariables:

    se denotan X = (X1, . . . , Xp)son n p observaciones de Xvariables deterministas

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 25/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadsticaNotaciones

    Y X1 . . . Xj . . . Xp

    y1......

    yi . . . . . . xi ,j

    yn

    Cuadro: Esquematizacion de datos en modelizacion

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 26/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadsticaEjemplo

    Descripcion de los datos:

    n = 47 estados de USA en 1960variable de interes Y :

    numeros de delitos por million de habitantes

    p = 9 covariables X :

    indicatores socio-culturaldatos demograficasdatos del gobierno

    Fuente:

    http://lib.stat.cmu.edu/DASL/Stories/USCrime.html

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 27/ 190

    http://lib.stat.cmu.edu/DASL/Stories/USCrime.html

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadsticaEjemplo

    Descripcion de las variables:

    Y (R): delitosX1 (Age): machos (14-24)X2 (Ed): anos a estudiarX3 (Ex): gastos de la policaX4 (LF): fuerza de trabajoX5 (M): hombres para mujeresX6 (N): poblacion del estadoX7 (U1): desempleos (14-24)X8 (U2): desempleos (25-39)X9 (I): familias abajo del nivel medio

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 28/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadsticaEjemplo

    R Age Ed Ex1 LF M N U1 U2 I

    79.1 151 91 56 510 950 33 108 41 261163.5 143 113 95 583 1012 13 96 36 194

    ......

    ......

    ......

    ......

    ......

    50.8 126 104 97 599 989 40 78 593 17184.9 130 121 91 623 1049 3 113 588 160

    Cuadro: Datos de los delitos de n = 47 estados de USA en 1960

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 29/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadsticaEstadsticas descriptivas

    Etapa inevitable:

    antes de la modelizacion

    Estudio univarido:

    distribucion de las variables

    Estudio bivariado:

    link entre variables

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 30/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadsticaEstudio univariado

    Distribuciones de las variables:

    distribucion conocida?distribuciones multiples?detectar datos extremos:

    errores?cosas atpicas?

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 31/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadsticaEjemplo

    Figura: Salidas R: histograma y boxplot

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 32/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadsticaEstudio bivariado

    Link entre 2 variables:

    lineal?no lineal?correlacion, covarianza fuerte?

    Cambio de variable:

    logartmico?exponencial?inverso?

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 33/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadsticaEjemplo

    Figura: Salida R: bi-plot

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 34/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadsticaEjemplo

    R Age Ed Ex1 LF M N U1 U2 IR 1.00 -0.09 0.32 0.67 0.19 0.21 0.34 -0.05 0.18 -0.18

    Age -0.09 1.00 -0.53 -0.51 -0.16 -0.03 -0.28 -0.22 -0.24 0.64Ed 0.32 -0.53 1.00 0.50 0.56 0.44 -0.02 0.02 -0.22 -0.77

    Ex1 0.67 -0.51 0.50 1.00 0.11 0.02 0.51 -0.05 0.17 -0.65LF 0.19 -0.16 0.56 0.11 1.00 0.51 -0.12 -0.23 -0.42 -0.27M 0.21 -0.03 0.44 0.02 0.51 1.00 -0.41 0.35 -0.02 -0.17N 0.34 -0.28 -0.02 0.51 -0.12 -0.41 1.00 -0.04 0.27 -0.13

    U1 -0.05 -0.22 0.02 -0.05 -0.23 0.35 -0.04 1.00 0.75 -0.06U2 0.18 -0.24 -0.22 0.17 -0.42 -0.02 0.27 0.75 1.00 0.02

    I -0.18 0.64 -0.77 -0.65 -0.27 -0.17 -0.13 -0.06 0.02 1.00

    Cuadro: Salida R: matriz de correlacion

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 35/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadsticaModelo aditivo y parametrico

    Esquematizacion de la modelizacion estadstica

    Y = modelo (X ) + error

    Modelo:

    simple, explicableparametrico:

    linealpolinomiallog, exp

    no parametrico:

    splines, loess, etc...

    Error:

    se denota hypotesis (iid):

    misma distribucionindependientes

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 36/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadsticaEscritura clasica

    Modelo de regresion multiple

    Y = 0 + 1X1 + . . . + pXp +

    Con:

    0 ordenada al origeni , i = 1..p, el efecto de la covariable Xi el error

    Hipotesis:

    (variable aleatoria), N(0, 2

    )i 6= j , i y j son independientes

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 37/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadsticaEscritura en forma de matriz

    Modelo de regresion multiple

    Y = X +

    Con:

    X Rn(p+1), X =

    1 x1,1 . . . x1,p... ... ...1 xn,1 . . . xn,p

    Y Rn1, Y = (y1 . . . yn) R(p+1)1, = (0 . . . p) Rn1, = (1 . . . n)

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 38/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadsticaObjetivo y notaciones

    Modelo de regresion multiple

    Y = X +

    Objetivo:

    Estimacion de , Var () y 2

    Notaciones:

    loas estimadores se denotan , Var()

    y 2

    los valores ajustados se denotan ylos residuos se denotan = y y

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 39/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadsticaCriterio de los mnimos cuadrados

    Modelo de regresion multiple

    Y = X +

    Minimizar la suma de los residuos cuadrados:

    Residuals Sum of Squaresse denota RSSRSS =

    ni=1

    2i

    Estimador de los mnimos cuadrados:

    = arg min

    (RSS)

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 40/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadsticaCriterio de los mnimos cuadrados

    Modelo de regresion multiple

    Y = X +

    Estimadores:

    = (X X )1

    X Y

    Var()

    = 2 (X X )1

    2 =(

    1np1

    )RSS

    Condiciones:

    X X invertiblecovariables no correlacionadas...

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 41/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadsticaEjemplo

    Cuadro: Modelo de regresion multiple

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 42/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadsticaValidez del modelo

    Modelo de regresion multiple

    Y = 0 + 1X1 + . . . + pXp +

    Preguntas importantes:

    hipotesis:

    el modelo esta bien escrito?las hipotesis sobre errores son repetadas?

    simplificaciones:

    podemos simplificar el modelo?que covariables X affectan Y ?covariables significativas?parametros j 6= 0?

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 43/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadsticaValidez del modelo

    Validacion del modelo:

    tests estadsticos:

    Fisher-testStudent-test

    graficas:

    lnea de regresiondistribucion de los residuos

    Seleccion de modelo:

    criterio numericoR2 ajustado

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 44/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadsticaTests estadsticos

    Hipotesis nula:

    se denota H0siempre una igualdadejemplo:

    1 = 2j = 0

    Hipotesis alternativa:

    se denota H1siempre una desigualdadejemplo:

    1 > 2j 6= 0

    Pregunta:

    acceptamos H0?rechazamos H0?

    Repuesta:

    p-valorporcentaje

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 45/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadsticaP-valor

    Definicion:

    probabilidadmas chiquita es la p-valor,...mas fuerte es la prueba que rechazamos H0

    P-valor Significacion Codificacion en R

    < 0,001 pruebas muy altas contra H0 ***[0,001; 0,01] pruebas altas contra H0 **[0,01; 0,05] pruebas contra H0 *

    > 0,05 sin pruebas contra H0

    Cuadro: Explicacion de los niveles de p-valores

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 46/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadsticaFisher-test y Student-test

    Modelo de regresion multiple

    Y = 0 + 1X1 + . . . + pXp +

    Fisher-test (f-test):

    testear la hipotesis globalH0 : j , j = 0 VS H1 : j , j 6= 0hay, al menos, un parametro i significativo?

    Student-test (t-test):

    hacerlo solo si f-test es significativohacerlo para cada jH0 : j = 0 VS H1 : j 6= 0

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 47/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadsticaEjemplo

    Variable Parametro P-valor

    Intercept 685,95 4,6 105Age 0,93 0,021Ed 1,78 0,008Ex1 1,14 1,0 105U2 2,10 0,014I 0,56 0,001

    Cuadro: Variables significativas

    Cuadro: Testos estadsticosPierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 48/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadsticaDistribucion de los residuos

    Teoricamente:

    residuos Gausianos N

    (0, 2

    )Verificar:

    las hipotesis sobre los residuos

    Graficos de los residuos:

    histograma emprica y teoricaqq-plot

    No es una manera de selecion de modelo

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 49/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadsticaEjemplo

    Figura: Salidas R: Distribucion emprica, teorica y qq-plot de los residuos

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 50/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadsticaSeleccion de modelo

    Objetivo:

    modelo mas simplereducir el numero p de covariables Xbuena prediccion

    Criterio de seleccion de modelo:

    coeficiente de determinacion ajustadose denota R2adjvariabilidad explicada por el modelo R2...con una penalizacion sobre el numero p de covariables

    R2adj =(n 1) R2 p

    n p 1con R2 =

    Var(Y)

    Var (Y )

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 51/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadsticaSeleccion de modelo

    Maneraa mano:

    sacar las covariables no significativasguardar las covariables significativas

    Manera exhaustiva:

    traer todas las combinacionesfuncion regsubsets()package leaps

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 52/ 190

    regsubsets()leaps

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Estadstica inferencialSeleccion de modelo exhaustiva

    Calcular todos los modelos posibles:

    con 1 covariable:

    Y = 0 + 1X1 + Y = 0 + pXp +

    con 2 covariables:

    Y = 0 + 1X1 + 2X2 + Y = 0 + p1Xp1 + pXp +

    con p covariables:

    Y = 0 + 1X1 + . . . + pXp +

    Queremos un modelo con:

    buen R2adjpocos parametros

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 53/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Estadstica inferencialEjemplo

    Figura: Seleccion de modeloexhaustiva

    Modelo 1:

    R Ex1R2adj = 0,43

    Modelo 2:

    R Ex1 + IR2adj = 0,53

    Modelo 3:

    R Ex1 + I + EdR2adj = 0,61

    Modelo 4:

    R Ex1 + I + Ed + AgeR2adj = 0,64

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 54/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Estadstica inferencialEjemplo

    Cuadro: Regresion multiple del Modelo 3

    Elegimos el Modelo 3 porque:

    pocos parametros (p = 3)calidad del ajuste(R2adj = 0,61)

    Resultados:

    efectos significativos(p-valores< 0,05)

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 55/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Estadstica inferencialPrediccion del modelo

    Finalidad principal

    Generalmente olvidada...

    Aplicar modelo

    Nuevos datos

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 56/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Estadstica inferencialEjemplo

    Modelo 3

    R = 326,10 + 1,31Ex1 + 0,76I + 1,55Ed +

    Nuevo estado con:

    Ex1 = 97I = 302Ed = 120

    Estimacion de los delitos:

    R = 326,10 + 1,31 97 + 0,76 302 + 1,55 120R = 216,5

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 57/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Introduccion a RHistoria de R

    Software de matematica y estadstica:

    MatlabSASS-PlusR

    Qualidad de R:

    utilizado en muchas universidadesflexible:

    packagesevolucion perpetua

    lnea de comandosgratis

    Disponible en www.r-project.org

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 58/ 190

    www.r-project.org

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Introduccion a RManera de ensenar R

    A partir de:

    datos creadosdatos clasicos

    Disposicion:

    izquierda:

    explicaciones

    derecha:

    lneas de comandos Rsalida grafica R

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 59/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Introduccion a RScript

    Siempre escribir su programa en un script:

    ej: script curso.R

    Comentar su programa:

    con #ej: # Importacion de datosintercambio de scripts

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 60/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Introduccion a RFuncion

    Descripcion:

    hacer una casa preprogamada

    Entrada:

    argumentosentre ()

    Salida:

    resultadoantes =

    Ejemplo:

    media=mean(x=misdatos,na.rm=TRUE)argumentosxyna.rmsalidamedia

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 61/ 190

    ()=media=mean(x=misdatos, na.rm=TRUE)

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Introduccion a RPackage

    Descripcion:

    coleccion de funcionestema particularejemplos:

    gstat: geoestadisticamatlab: funciones Matlabspacetime: metodos espacial y temporal

    Instalacion:

    con la funcion install.packages()ej: install.packages("matlab",dependencies=TRUE)

    Cargar:

    con la funcion library()ej: library(matlab)

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 62/ 190

    gstatmatlabspacetimeinstall.packages()install.packages("matlab", dependencies=TRUE)library()library(matlab)

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Introduccion a RAyuda

    Buscar una funcion:

    utilizar ??ejemplo:

    buscar funcion que empieza conread??read

    Ayuda de una funcion:

    utilizar ?ejemplo:

    ?mean

    ?read.table

    Descripcion de un package:

    ejemplo: library(help=matlab)

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 63/ 190

    ????read??mean?read.tablelibrary(help=matlab)

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Introduccion a RTipos de datos

    Clases:

    vectores (vector)matrices (matrix)tablas (array)tablas de datos (data.frame)listas (list)series temporales (time.series)

    Modos:

    no definido (null)logico (logical)numerico (numeric)complejo (complex)caracter (character)

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 64/ 190

    vectormatrixarraydata.framelisttime.seriesnulllogicalnumericcomplexcharacter

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Introduccion a RCreacion de vectores

    Valores consecutivos:

    :

    Valores definidos:

    c()

    Valores repetitos:

    rep()

    Secuencia de valores:

    seq()

    Figura: Creacion de vectores

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 65/ 190

    :c()rep()seq()

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Introduccion a RFunciones matematicas sobre vectores

    Logaritmo y exponencial:

    log() y exp()

    Sinusoidal:

    sin() y cos()

    Valor absoluto:

    abs()

    Raices:

    sqrt() y ^

    Figura: Funciones matematicas basicasPierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 66/ 190

    log()exp()sin()cos()abs()sqrt()^

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Introduccion a RFunciones estadsticas sobre vectores

    Sumas:

    sum() y cumsum()

    Media y variabilidad:

    mean(), sd() y var()

    Quantiles:

    median() y quantile()

    Extremos:

    min() y max()

    Figura: Funciones estadsticas basicasPierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 67/ 190

    sum()cumsum()mean()sd()var()median()quantile()min()max()

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Introduccion a RFunciones sobre las distribuciones estadsticas

    Distribuciones en R:

    d funcion densidadp funcion reparticionq funcion del quantilergeneracion aleatoria

    Distribucion Gausiana:

    dnorm(), pnorm(), qnorm(), rnorm()

    Distribucion Uniforme:

    dunif(), punif(), qunif(), runif()

    Muestreo sin/con reposicion:

    sample() Figura: Funciones de distribucionPierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 68/ 190

    dnorm()pnorm()qnorm()rnorm()dunif()punif()qunif()runif()sample()

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Introduccion a RCreacion de matrices

    Funcion:

    matrix()

    Argumentos:

    nrow, ncolbyrow

    Salida:

    una matriz

    Ejemplos:

    cf. Figura

    Figura: Creacion de matricesPierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 69/ 190

    matrix()

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Introduccion a RManipulacion de vectores y matrices

    Tamano (vector y matrices):

    length() y dim()

    Extraer filas i1 y i2 de lascolumna j1 y j2:

    [c(i1,i2),c(j1,j2)]

    Suprimir filas i1 y i2 de lascolumnas j1 y j2:

    [-c(i1,i2),-c(j1,j2)]

    Seleccion sobre condicion:

    which() Figura: Manipulacion de matrices

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 70/ 190

    length()dim()[c(i1,i2),c(j1,j2)][-c(i1,i2),-c(j1,j2)]which()

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Introduccion a ROperaciones sobre matrices

    Productos:

    * y %* %

    Inversa, traspuesta y diagonal:

    solve(), t() y diag()

    Applicacion de funciones:

    apply()

    Figura: Operaciones sobre matrices

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 71/ 190

    solve()t()diag()apply()

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Introduccion a RCreacion y manipulacion de listas

    Funcion:

    list()

    Argumentos:

    datos de cualquier modo

    Salida:

    una lista

    Descripcion:

    agrega numeric, character, etc...extraer elementos con [[]] o $conocer los elementos con names() Figura: Manipulacion de listas

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 72/ 190

    list()numericcharacter[[]]$names()

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Introduccion a RImportacion de datos (data frame)

    Funcion:

    read()

    Argumentos:

    file, header, sep, dec

    Salida:

    un data frame

    Descripcion:

    lee datos txt, csv, xls, etc...descripcion con summary()

    Figura: Resultado de la importacionPierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 73/ 190

    read()summary()

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Introduccion a RVisualizacion univariada de los datos

    Histograma:

    hist()

    Boxplot:

    boxplot()

    Multi-graficos:

    par(mfrow=c(i,j))subgraficos con i filas y jcolumnas

    Figura: Visualizacion univariadaPierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 74/ 190

    hist()boxplot()par(mfrow=c(i,j))

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Introduccion a RModelizacion de los datos

    Funcion:

    lm()

    Argumentos:

    formula:

    se escribe Y~Xse leeY en funcion de X

    data

    Salida:

    parametrosresiduosvalores predictivas Figura: Modelo lineal

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 75/ 190

    lm()Y~X

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Introduccion a RManipulacion de los modelos

    Tests, parametros, diagnosticosnumericos:

    summary()

    Diagnosticos graficos:

    plot()

    Extracion de los parametros:

    coef()

    Aplicar modelo sobre datosnuevos:

    predict() Figura: Manipulacion de modelo

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 76/ 190

    summary()plot()coef()predict()

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Introduccion a RVisualizacion bivariada de los datos

    Biplot:

    plot():

    primer graficotype=l (linea)type=p (puntos)

    lines() y points():

    despues plot()

    Linea de regresion:

    abline()

    a (intercept)b (pendiente)v (vertical)h (horizontal) Figura: Visualizacion bivariada

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 77/ 190

    plot()lines()points()plot()abline()

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Introduccion a RElementos de programacion

    Condiciones:

    if(), else==, !=, >=, =

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Introduccion a RCreacion de funcion

    Funcion:

    conjunto de instruccionespara simplificar el codigo

    Creacion:

    mi_funcion=function(argumentos)

    {instrucciones}

    en las instrucciones:

    identificar la salidareturn()

    Utilizacion:

    res=mi_funcion(argumentos) Figura: Creacion de funcion

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 79/ 190

    mi_funcion=function(argumentos){instrucciones}mi_funcion=function(argumentos){instrucciones}return()res=mi_funcion(argumentos)

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadstica e introduccion a REjercicio 1: vectores y bucles

    Crear un vector x = (x1, . . . , xn):

    con n = 50numeros aleatorios de ley uniforme [0; 1]

    Crear un vector y = (y1, . . . , yn):

    yi = 0 si xi < 0,5yi = 1 si xi 0,5

    Deducir la proporcion z :

    elementos de x > 0,5

    Repetir la misma experiencia:

    con n = 50, 100, . . . , 2000trazar z n

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 80/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadstica e introduccion a REjercicio 2: bucles y funciones

    Supongamos que:

    = 4+k=0

    (1)k

    2k + 1

    Proponer una funcion R:

    se llama pi_hatpara aproximar

    Testear la funcion y verificar:

    la aproximacion para k = 100, 200, . . . , 10000 = 3,141593

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 81/ 190

    pi_hat

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadstica e introduccion a REjercicio 3: matrices

    Crear la matriz A =

    2 23 810 6 904 7 12

    Calcular:

    medias de las filassumas de las columnas

    Que hacen los comandos:

    A2, A*A, A%* %A1/A, A(-1), solve(A)

    Resolver el sistema:2x + 23y + 8z = 5

    10x + 6y + 90z = 6

    4x + 7y + 12z = 7

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 82/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadstica e introduccion a REjercicio 4: modelizacion (regresion simple)

    272 observaciones deOld Faithfulgeyseren Yellowstone National Park,Wyoming, USA

    2 variables:

    eruption, la duracion de la erupcion(min)waiting, el tiempo de espera (min)para la proxima erupcion

    cf. http://www.stat.cmu.edu/~larry/all-of-statistics/=data/faithful.dat

    Figura: El geiser del YellowstoneNational Park

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 83/ 190

    http://www.stat.cmu.edu/~larry/all-of-statistics/=data/faithful.dathttp://www.stat.cmu.edu/~larry/all-of-statistics/=data/faithful.dathttp://www.stat.cmu.edu/~larry/all-of-statistics/=data/faithful.dat

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadstica e introduccion a REjercicio 4: preguntas

    Importar los datos eruption.csv:

    utilizar read.table()utilizar summary() para resumir los datos

    Describir los datos:

    estudio univariado:

    utilizar boxplot() y hist()algun comentario?

    estudio bivariado:

    utilizar plot()que podra preguntar?relacion lineal?

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 84/ 190

    eruption.csvread.table()summary()boxplot()hist()plot()

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadstica e introduccion a REjercicio 4: preguntas

    Realizar la regresion simple:

    escribir el modeloutilizar lm()

    Comentar los coeficientes:

    utilizar summary()estimacion del intercept (0) y de la pendiente (1)?coeficientes significativos?decribir los coeficientes

    Calcular RSS , y R2:

    utilizar las formulas del cursoutilizar sum(), sqrt() y var()comparar con la salida de summary()

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 85/ 190

    lm()summary()sum()sqrt()var()summary()

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadstica e introduccion a REjercicio 4: preguntas

    Salidas graficas:

    trazar y x y la lnea de regresion:utilizar plot() y abline()

    trazar la distribucion emprica y teorica de los residuos:

    utilizar hist(), lines() y dnorm()son buenos los supuestos sobre los residuos?

    hacer predicciones:

    predecir la duracion de erupcion para los siguientes tiempos deespera: 40, 70 y 100 minutosutilizar data.frame() y predict()

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 86/ 190

    plot()abline()hist()lines()dnorm()data.frame()predict()

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadstica e introduccion a REjercicio 4: preguntas

    Pregunta adicional:

    recordar y x y los histogramas de x e yalgun comentario?describir su intuicionseparar los individuos:

    utilizar kmeans()hacer una regresion para cada grupo de datostrazar las lneas de regresion y los gruposcomparar las ordenadas al origen y las pendientescual es la diferencia? por que?

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 87/ 190

    kmeans()

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadstica e introduccion a REjercicio 5: modelizacion (regresion simple)

    Datos:

    1000 observaciones2 variables:

    YZ

    Fuente

    secreto...

    Figura: Datos secretosPierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 88/ 190

    secreto...

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadstica e introduccion a REjercicio 5: preguntas

    Importar los datos secret.csv

    Describir los datos:

    estudio univariado:

    algun comentario?

    estudio bivariado:

    trazar y zrelacion lineal?

    Para el Modelo 1: Y = 0 + 1Z + , con N(0, 2

    )calcular el modelotrazar la lnea de regresiontrazar la distribucion teorica y emprica de los residuosalgun comentario?

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 89/ 190

    secret.csv

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadstica e introduccion a REjercicio 5: preguntas

    Pensar otro modelo...

    Cual es la relacion entre Y y Z?crear la variable X = log (Z )anadir X a los datos

    Para el Modelo 2: Y = 0 + 1X +

    , con N(0, 2

    )trazar y xrelacion lineal?trazar la distribucion teorica y emprica de los residuosson buenos los supuestos sobre los residuos?

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 90/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadstica e introduccion a REjercicio 5: preguntas

    Modelo 1 VS Modelo 2:

    comparar R2

    comparar la distribucion de los residuoscual es el mejor modelo?

    Por ultimo, cual es la relacion entre Y y Z?

    escribir el modelotrazar y z y la lnea de regresion que corresponde

    En realidad, fueron datos simulados...

    cf. script_modelizacion_ejercicio.Robservar que 0, 1 y estan perfectamente estimados!

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 91/ 190

    script_modelizacion_ejercicio.R

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadstica e introduccion a REjercicio 6: modelizacion (regresion multiple)

    n = 507 individuos de California

    1 variable de interes:

    weight (kg)

    p = 23 covariables:

    medidas del cuerpowrist.girth (cm), elbow.diam (cm),age, etc...

    cf. http://www.amstat.org/publications/jse/v11n2/datasets.heinz.html

    Figura: Medidas del cuerpo

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 92/ 190

    http://www.amstat.org/publications/jse/v11n2/datasets.heinz.htmlhttp://www.amstat.org/publications/jse/v11n2/datasets.heinz.htmlhttp://www.amstat.org/publications/jse/v11n2/datasets.heinz.html

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadstica e introduccion a REjercicio 6: preguntas

    Descargar y cargar el package leaps

    Importar los datos body.csv

    Separar los datos en 2 partes:

    individuos 1 hasta 400 en data.body1individuos 401 hasta 507 en data.body2

    Hacer el estudio univariado:

    algun comentario?comentario sobre la distribucion de shoulder.girth?

    Hacer el estudio bivariado:

    que tipo de relaciones? lineal?como son las pendientes? positivas o negativas?

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 93/ 190

    leapsbody.csvdata.body1data.body2shoulder.girth

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadstica e introduccion a REjercicio 6: preguntas

    Hacer la correlacion entre las variables:

    como son los datos?puedes predecir un problema?

    Calcule el modelo de regresion multiple con todas lascovariables (denotarloModelo 1):

    escribir el modeloque variables son importantes?que pasa con wrist.girth?

    efecto significativo?cual es el signo del coeficiente?adecuacion con el estudio bivariado?

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 94/ 190

    wrist.girth

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadstica e introduccion a REjercicio 6: preguntas

    Hacer la investigacion exhaustiva de las variables:

    utilizar regsubsets()package leaps

    Elegir un modelo (denotarloModelo 2)

    Hacer la regresion multiple de este modelo

    Comentar los resultados

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 95/ 190

    regsubsets()leaps

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionEstadsticas descriptivasModelizacion estadsticaIntroduccion al software REjercicios

    Modelizacion estadstica e introduccion a REjercicio 6: preguntas

    Comparar el comportamiento predictivo de los diferentesmodelos:

    tenemos 2 modelos:

    Modelo 1: todas las covariablesModelo 2: con la seleccion exhaustiva de modelo

    para cada modelo:

    hacer una prediccion de la masa sobre los datos data.body2calcular el RSS

    cual es el mejor modelo? por que?

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 96/ 190

    data.body2

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Plan

    1 Introduccion

    2 Modelizacion estadstica eintroduccion a R

    3 Modelizacion temporalIntroduccionTendencia temporalEstacionalidadComponente estacionariatemporalEjercicios

    4 Modelizacion espacial

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 97/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalDefiniciones y notaciones

    Variable aleatoria:

    se denota Y

    Indexacion en el tiempo:

    t Dtdiscreto Dt = {0, 1, 2, . . .}continuo Dt = (0;+)

    Proceso estocastico:

    sucesion de variables aleatoriasque evolucionan en funcion del tiempose denota {Yt , t Dt}

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 98/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalEjemplo

    Datos:

    pasajes en avion en el mundoen milespor mes1949 hasta 1960

    Fuente:

    package datasets

    Figura: Pasajes en avion en el mundo

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 99/ 190

    datasets

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalOtros cunjuntos de datos

    Internet:

    http://robjhyndman.com/TSDL/

    R:

    package datasets??time.series

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 100/ 190

    http://robjhyndman.com/TSDL/datasets??time.series

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalObjetivos

    Tener un modelo:

    simpleexplicableparametrico

    Hacer predicciones:

    interpolacionextrapolacion (en el futuro)

    Tener informacion:

    media de prediccionvarianza de prediccion

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 101/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalDescomposicion temporal

    Esquematizacion de la modelizacion temporal

    Yt = Tt + St + Zt , t Dt

    Tendencia temporal {Tt , t Dt}Estacionalidad {St , t Dt}Componente estacionaria temporal {Zt , t Dt}

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 102/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalModelizacion aditiva y multiplicativa

    Modelizacion aditiva

    Yt = Tt + St + Zt , t Dt

    Modelizacion multiplicativa

    Yt = Tt St Zt , t Dtlog (Yt) = log (Tt) + log (St) + log (Zt) , t Dt

    Siempre transformar en un modelo aditivo!

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 103/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalEjemplo

    Figura: Modelo multiplicativo - Transformacion logartmica

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 104/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalTendencia temporal (definicion)

    Modelizacion temporal aditiva

    Yt = Tt + St + Zt , t Dt

    Se denota {Tt , t Dt}Evolucion a largo plazoInteranualParametrica:

    polinomial de orden p 3funcion basica: log, exp, inverso, etc...si pocas variaciones

    No parametrica:

    splinesondculasi muchas variaciones

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 105/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalInferencia

    Modelizacion de la tendencia temporal

    Tt = 0 + 1t + 2t2 + 3t

    3 + t , t Dt

    Estimacion de 0, . . . , 3:

    modelo de regresion multiplemnimos cuadrados

    Criterio:

    modelo simplemodelo explicableR2adj

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 106/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalEjemplo

    Figura: Tendencias polinomiales yR2adj

    Figura: Regresion multiple de la tendencia

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 107/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalEjemplo

    Figura: Tendencia retenida - Serie temporal {Yt Tt , t Dt} sintendencia

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 108/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalEstacionalidad (definicion)

    Modelizacion temporal aditiva

    Yt = Tt + St + Zt , t Dt

    Se denota {St , t Dt}Evolucion que se repite

    Parametrica:

    sinusoide:

    cos y sinamplitudes y periodos diferentes

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 109/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalInferencia

    Modelizacion de la estacionalidad

    St =k

    i=1 (i cos (2i t) + i sin (2i t)) + t , t Dt

    Estimacion de las frecuencias de Fourier 1, . . . , k :

    espectro (periodograma)frecuencias con muchas energas

    Estimacion de los 1, . . . , k y 1, . . . , k :

    modelo de regresion multiplemnimos cuadrados

    Criterio:

    modelo simplemodelo explicableR2adj

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 110/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalEspectro (periodograma)

    Objetivo:

    detectar frecuencias con muchas energas

    Calculo:

    transformada rapida de Fourier (FFT)descomposicion en frecuencias

    Representacion:

    eje de abcisas:

    frecuencia1/periodo

    eje de ordenadas:

    densidad espectral

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 111/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalEstimacion de los 1, . . . , k (ejemplo)

    Figura: Serie temporal {Yt Ts , t Dt} sin tendencia - Periodograma

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 112/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalEstimacion de los 1, . . . , k (ejemplo)

    Figura: Periodograma suavisado

    Frecuencias importantes:

    1 = 1 (periodo de 1 ano)2 = 2 (periodo de 6 meses)3 = 3 (periodo de 4 meses)3 = 4 (periodo de 3 meses)5 = 5 (periodo de 72 das)6 = 1/4 (periodo de 4 anos)

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 113/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalEstimacion de los 1, . . . , k y 1, . . . , k (ejemplo)

    Figura: Regresion multiple de la estacionalidad

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 114/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalEjemplo

    Figura: Estacionalidad retenida - Serie temporal {Yt Tt St , t Dt}sin tendencia ni estacionalidad

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 115/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalComponente estacionaria temporal (definicion)

    Modelizacion temporal aditiva

    Yt = Tt + St + Zt , t Dt

    Lo que queda lluego de quitar:

    la tendencia temporal {Tt , t Dt}la estacionalidad {St , t Dt}

    Se denota {Zt , t Dt}Olvidamos la hipotesis iid

    Dependencia posible entre valores sucesivos

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 116/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalHipotesis

    Proceso estacionario de:

    sentido ampliosegundo orden

    Orden 1:

    E (Zt) = 0, t Dt

    Orden 2:

    Cov (Zt , Zt) = E (ZtZt)= CZ (t)

    con t = |t t |

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 117/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalFunciones de covarianza temporal

    Funcion de covarianza temporal emprica:

    CZ (t) =1

    N (t)

    (t,t)N(t)

    (ZtZt) , t = 0, 1, . . . , T 1

    Propriedades:

    CZ (t) = CZ (t)

    CZ (0) = Var (Zt) = 2Z

    En R:

    funcion acf()argumento type=covariance

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 118/ 190

    acf()type=''covariance''

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalFunciones de correlacion temporal

    Funcion de correlacion temporal emprica:

    Z (t) =CZ (t)

    2Z

    Propriedades:Z (t) = Z (t)

    Z (0) = 1

    En R:

    funcion acf()argumento type=correlation

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 119/ 190

    acf()type=''correlation''

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalFunciones de correlacion temporal parcial

    Funcion de correlacion temporal parcial emprica

    Correlacion condicional

    En R:

    funcion acf()argumento type=partial

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 120/ 190

    acf()type=''partial''

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalProcesos estocasticos discretos clasicos

    Ruido blanco Gausiano

    Autoregresivo (AR)

    Media movil (MA)

    Autoregresivo de media movil (ARMA)

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 121/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalProceso de ruido blanco (definicion)

    Se denota {Wt , t Dt}Idea:

    no hay informacioncompletamente aleatorio:

    elementos independientesmisma distribucion:

    W = 0

    CW (t) =

    (2W , t = 0

    0 , t 6= 0

    Proceso de ruido blanco Gausiano (WGN):

    Wt N(0; 2W

    ), t Dt

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 122/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalProceso de ruido blanco (simulacion)

    Figura: Proceso de ruido blanco Gausiano W N (0, 1) con su funcionde correlacion temporal

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 123/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalProceso autoregresivo (definicion)

    Proceso autoregresivo AR(p)

    Zt = 1Zt1 + . . . + pZtp + Wtcon {Wt , t Dt} un WGN Wt N

    (0; 2W

    ), t Dt

    Idea:

    proceso que depende de las observaciones pasadasciencia medioambiental, ecologa y biologa

    Identificacion del orden p:

    funcion de correlacion temporal parcial

    Estimacion de 1, . . . , p:

    criterio de los mnimos cuadrados

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 124/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalProceso autoregresivo (simulacion)

    Figura: Proceso autoregresivo AR(2) con 1 = 0,5 y 2 = 0,25 y sufuncion de correlacion temporal parcial

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 125/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalProceso de media movil (definicion)

    Proceso autoregresivo MA(q)

    Zt = Wt + 1Wt1 + . . . + qWtqcon {Wt , t Dt} un WGN Wt N

    (0; 2W

    ), t Dt

    Idea:

    proceso que depende de los errores pasadas

    Identificacion del orden q:

    funcion de correlacion temporal

    Estimacion de 1, . . . , q:

    criterio de los mnimos cuadrados

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 126/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalProceso de media movil (simulacion)

    Figura: Proceso autoregresivo AR(2) con 1 = 0,5 y 2 = 0,25 y sufuncion de correlacion temporal

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 127/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalProceso autoregresivo de media movil (definicion)

    Proceso autoregresivo ARMA(p,q)

    Zt = 1Zt1 + . . . + pZtp + Wt + 1Wt1 + . . . + qWtqcon {Wt , t Dt} un WGN Wt N

    (0; 2W

    ), t Dt

    Idea:

    proceso acumulado (AR y MA)

    Identificacion de los ordenes p y q:

    difcil con las funciones de correlacion...seleccion del modelo:

    package tseriesfunctiones arma() y summary.arma()

    Estimacion de 1, . . . , p y 1, . . . , q:

    criterio de los mnimos cuadrados

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 128/ 190

    tseriesarma()summary.arma()

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalProceso autoregresivo de media movil (simulacion)

    Figura: Proceso autoregresivo ARMA(2,2) con 1 = 0,5, 2 = 0,25,1 = 0,5 y 2 = 0,25

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 129/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalProceso autoregresivo de media movil (simulacion)

    Figura: Modelo de regresion multiple de un proceso autoregresivoARMA(2,2) con 1 = 0,5, 2 = 0,25, 1 = 0,5 y 2 = 0,25

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 130/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalDiagnostico del orden p (ejemplo)

    Figura: Diagnostico del proceso autoregresivo

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 131/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalDiagnostico del orden q (ejemplo)

    Figura: Diagnostico del proceso de media movil

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 132/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalEstimacion de los 1, . . . , p, 1, . . . , q y

    2 (ejemplo)

    Figura: Regresion multiple de la componente estacionaria

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 133/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalEjemplo

    Figura: Componente estacionaria retenida - Serie temporal{Yt Tt St Zt , t Dt} sin tendencia, estacionalidad, nicomponente estacionaria

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 134/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalEjemplo

    Figura: Serie temporal {Yt Tt St Zt , t Dt} - Funcion decorrelacion temporal

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 135/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalResumen

    Modelizacion temporal aditiva

    Yt = Tt + St + Zt , t Dt , con:

    Tt = 0 + 1t + 2t2 + 3t

    3

    St =1 sin (21t) + 1 cos (21t)

    + . . . +k sin (2kt) + k cos (2kt)

    Zt =1Zt1 + . . . + pZtp

    +Wt+1Wt1 + . . . + qWtq

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 136/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalPrediccion

    Reconstruir el modelo completo

    Interpolacion:

    utilizar fitted.values del modelo completo

    Extrapolacion:

    parte tendencia temporal {Tt} y estacionalidad {St}:funcion predict()argumentos newdata, se.fit=TRUE yinterval=prediction

    parte componente estacionaria temporal {Zt}:funcion predict.arima()argumentos n.ahead y se.fit=TRUE

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 137/ 190

    fitted.valuespredict()newdatase.fit=TRUEinterval=''prediction''predict.arima()n.aheadse.fit=TRUE

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalEjemplo

    Figura: Interpolacion y extrapolacion temporal

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 138/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalEjercicio 1

    Datos:

    500 observaciones42 anos de datos

    Fuente:

    secreto...

    Figura: Datos secretos

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 139/ 190

    secreto...

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalEjercicio 1

    Importar datos ej1_temporal.txt

    Transformar Y en time.series:

    funcion ts()argumentos frequency, start y names

    Crear el vector de tiempo t:

    funcion tsp()funcion seq()

    Trazar Yt :

    funcion plot()modelo aditivo?modelo multiplicativo? pasar al log?

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 140/ 190

    ej1_temporal.txttime.seriests()frequencystartnamestsp()seq()plot()

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalEjercicio 1

    Escribir la forma general de la modelizacion temporal aditiva

    Introducir las notaciones de:

    tendencia temporalestacionalidadcomponente estacionaria temporal

    Modelizar la tendencia temporal {Tt}:polinomios de grados 1, 2 o 3escribir el modelo de tendencia:

    elegir el mejor modelocon R2adj

    crear la serie temporal {Tt}trazar {Yt}, {Tt} y {Yt Tt}comentario?

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 141/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalEjercicio 1

    Modelizar la estacionalidad {St}:identificar las frecuencias fuertes:

    periodograma suavizadofuncion spectrum() con argumento spansfuncion abline() con argumento v

    escribir el modelo de estacionalidad:

    elegir el mejor modelocon R2adj

    crear la serie temporal {St}trazar {Yt Tt}, {St} y {Yt Tt St}comentario?

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 142/ 190

    spectrum()spansabline()v

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalEjercicio 1

    Modelizar la componente estacionaria temporal {Zt}:verificar si es un ruido blanco Gaussiano:

    funcion acf()comentario?

    Escribir el modelo temporal completo

    Hacer una interpolacion de {Yt}Hacer una extrapolacion de {Yt}:

    por t = 43, 44, . . . , 70funcion predict()argumentos newdata y interval="prediction"

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 143/ 190

    acf()predict()newdatainterval="prediction"

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalEjercicio 2

    Datos:

    produccion de cervezaen Australiaenero 1956 hasta julio 1995

    Fuente:

    http://134.76.173.220/beer.zip

    Figura: Produccion de cerveza por mesen Australia

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 144/ 190

    http://134.76.173.220/beer.ziphttp://134.76.173.220/beer.zip

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalEjercicio 2

    Importar datos beer.csv

    Transformar en time.series

    Denotar beer la serie temporal

    Trazar beer:

    modelo aditivo?modelo multiplicativo? pasar al log?

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 145/ 190

    beer.csvtime.seriesbeerbeer

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalEjercicio 2

    Modelizar la tendencia temporal:

    se denota beer.tendencia

    Modelizar la estacionalidad:

    se denota beer.estacionalidad

    Modelizar la componente estacionaria temporal:

    verificar si es un ruido blanco Gaussianocomentario?

    Escribir el modelo temporal completo:

    se denota beer.lm

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 146/ 190

    beer.tendenciabeer.estacionalidadbeer.lm

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalEjercicio 2

    Calcular y trazar la interpolacion de beer:

    utilizar beer.lm

    Calcular y trazar la extrapolacion de beer:

    de agosto 1995 hasta agosto 1996con un intervalo de prediccion de 95 %utilizar beer.lm

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 147/ 190

    beerbeer.lmbeerbeer.lm

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalEjercicio 3

    Generar un ruido blanco Gausiano:

    se denota {Wt}con = 0 y 2 = 1con un tamano T = 1000trazar su funcion de correlacion temporal

    Generar un proceso autoregresivo AR(2):

    se denota {Xt}1 = 0,5 y 2 = 0,25con un tamano T = 1000trazar su funcion de correlacion temporal parcial

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 148/ 190

  • IntroduccionModelizacion estadstica e introduccion a R

    Modelizacion temporalModelizacion espacial

    IntroduccionTendencia temporalEstacionalidadComponente estacionaria temporalEjercicios

    Modelizacion temporalEjercicio 3

    Generar un proceso autoregresivo MA(2):

    se denota {Yt}1 = 0,5 y 2 = 0,25con un tamano T = 1000trazar su funcion de correlacion temporal

    Generar un proceso autoregresivo ARMA(2, 2):

    se denota {Zt}1 = 0,5, 2 = 0,25, 1 = 0,5 y 2 = 0,25con un tamano T = 1000trazar sus funciones de correlacion temporal clasica y parcialajustar un modelo arma:

    package tseriesfunciones arma() y summary.arma()

    Pierre Tandeo Modelizacion estadstica en el tiempo y en el espacio Febrero y Marzo 2012 149/ 190

    tseriesarma()summary.ar