pepió, m - series temporales

154
7/27/2019 Pepió, M - Series temporales http://slidepdf.com/reader/full/pepio-m-series-temporales 1/154  AULA POLITÈCNICA 64 Series temporales

Upload: vendingboy

Post on 14-Apr-2018

235 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 1/154

 AULA POLITÈCNICA 64

Series temporales

Page 2: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 2/154

 AULA POLITÈCNICA / ETSEIT

Series temporales

Montserrat Pepió Viñals

Page 3: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 3/154

Primera edición: septiembre 2001

Diseño de la cubierta: Manuel Andreu

© Montserrat Pepió Viñals, 2001

© Edicions UPC, 2001

Edicions de la Universitat Politècnica de Catalunya, SL

Jordi Girona Salgado 31, 08034 Barcelona

Tel.: 934 016 883 Fax: 934 015 885

Edicions Virtuals: www.edicionsupc.esE-mail: [email protected]

Producción: Barcelona Digital, SLRosselló 77, 08029 Barcelona

Depósito legal: B-29.192-2001ISBN: 84-8301-526-9

Quedan rigurosamente prohibidas, sin la autorización escrita de los titulares del copyright, bajo las san-

ciones establecidas en las leyes, la reproducción total o parcial de esta obra por cualquier medio o pro-

cedimiento, comprendidos la reprografía y el tratamiento informático, y la distribución de ejemplares de

ella mediante alquiler o préstamo públicos.

Page 4: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 4/154

Índice   p9

Í NDICE

TEORÍ  A DE SERIES TEMPORALES

1 Introducción

2 Análisis de una serie temporal

2.1 Modelización por componentes ..............................................................................142.2 Enfoque Box – Jenkins ...........................................................................................19

3 Descomposición de una serie temporal

3.1 Medias móviles: tendencia......................................................................................243.2 Estacionalidad ........................................................................................................273.3 Caso temperaturas .................................................................................................313.4 Caso usuarios transporte público............................................................................37

4 Modelización con variables categóricas

4.1 Comparación del método de descomposición con el de variables categóricas .......484.2 Caso usuarios de un teléfono .................................................................................52

5 Autocorrelación

5.1 Correlograma..........................................................................................................585.2 Interpretación de los correlogramas........................................................................63

6 Otras técnicas de previsión: ponderación exponencial

6.1 Suavizado exponencial...........................................................................................656.2 Selección del factor de ponderación .......................................................................676.3 Método de Brown ...................................................................................................72

7 Otros ejemplos

7.1 Ventas de papel......................................................................................................77

7.2 Generación de electricidad .....................................................................................81

Page 5: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 5/154

p10 Series temporales

PR Á CTICAS DE SERIES TEMPORALES CON EXCEL

 

Práctica1. Descomposición clásica de una serie aditiva1.1 Recuperación de los datos .....................................................................................891.2 Análisis de la evolución de la serie cronológica ......................................................901.3 Estabilización de la serie ........................................................................................941.4 Estacionalidad ........................................................................................................961.5 Estimación de la tendencia...................................................................................1001.6 Modelo y residuos ................................................................................................1031.7 Previsiones...........................................................................................................1051.8 Resultados ...........................................................................................................107

Práctica 2. Autocorrelación y correlograma

2.1 Recuperación de los datos ...................................................................................1152.2 Cálculo de los coeficientes de autocorrelación .....................................................1152.3 Autocorrelograma.................................................................................................1182.4 Resultados ...........................................................................................................120

Práctica 3. Modelización de una serie con variables categóricas

3.1 Recuperación de los datos ...................................................................................1223.2 Análisis de la evolución de la serie cronológica ....................................................1233.3 Modelización con variables categóricas................................................................1243.4 Estimaciones y residuos .......................................................................................1273.5 Previsiones...........................................................................................................128

3.6 Resultados ...........................................................................................................130

Práctica 4. Modelización y previsiones por suavizado exponencial (Método de Brown)

4.1 Recuperación de los datos ...................................................................................1364.2 Análisis de la evolución de la serie cronológica ....................................................1374.3 Método de Brown .................................................................................................1384.4 Resultados ...........................................................................................................141

EVALUACIONES DE SERIES TEMPORALES

1 Evaluaciones propuestas1.1 13.5.98 .................................................................................................................1471.2 3.5.99 ...................................................................................................................1481.3 23.6.99 .................................................................................................................1491.4 12.1.00 .................................................................................................................1501.5 17.5.00 .................................................................................................................151

 2 Evaluaciones resueltas

2.1 13.5.98 .................................................................................................................1532.2 3.5.99 ...................................................................................................................1562.3 23.6.99 .................................................................................................................159

2.4 12.1.00 .................................................................................................................1612.5 17.5.00 ..............................................................................................................164

Page 6: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 6/154

Series temporales p167

BIBLIOGRAFÍA BÁSICA 

n  Anderson, O.D., Time Series Analysis and Forecasting , (1977).

n  Ardanuy, R., Martín, Q. , Estadística para Ingenieros , Hespérides (1993).

n  Chatfield, C., The Analysis of Time Series , Chapman & Hall (1996).

n  Diebold, F.X., Elementos de pronósticos , International Thomson Editores (1998).

n  Makridakis, S. , Wheelwright, S., McGee, V., Forecasting: Methods and Applications ,John Wiley (1983).

n  Newbold, P., Estadística para los negocios y la economía , Prentice Hall (1997).

Page 7: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 7/154

Introducción p11

TEORÍ  A DE SERIES TEMPORALES

1 INTRODUCCIÓN

Una serie temporal es un conjunto de observaciones ordenadas en el tiempo o, también, laevolución de un fenómeno o variable a lo largo de él. Esta variable puede ser económica(ventas de una empresa, consumo de cierto producto, evolución de los tipos de interés,...),física (evolución del caudal de un río, de la temperatura de una región, etc.) o social (númerode habitantes de un país, número de alumnos matriculados en ciertos estudios, votos a unpartido,...).

El objetivo del análisis de una serie temporal, de la que se dispone de datos en períodosregulares de tiempo, es el conocimiento de su patrón de comportamiento para prever laevolución futura, siempre bajo el supuesto de que las condiciones no cambiarán respecto alas actuales y pasadas.

Si al conocer la evolución de la serie en el pasado se pudiese predecir su comportamientofuturo sin ningún tipo de error, estaríamos frente a un fenómeno determinista cuyo estudiono tendría ningún interés especial. Esto correspondería a una situación como la de la figura1.1, que muestra la intensidad de corriente, I, que circula a través de una resistencia, R,sometida a un voltaje sinusoidal, V(t) = a cos (vt + θ); por tanto I(t) = a cos (vt + θ)/R.

-1,5

-1

-0,5

0

0,5

1

1,5

0 20 40 60 80 t

I(t)

Fig. 1.1.- Observaciones de la serie I(t) = cos (0,5t +π /2)

En general, las series de interés llevan asociados fenómenos aleatorios, de forma que elestudio de su comportamiento pasado sólo permite acercarse a la estructura o modeloprobabilístico para la predicción del futuro. Estos modelos se denominan también procesosestocásticos. Así, un proceso estocástico es una sucesión de variables aleatorias {Y

t}, con

t = 1, 2, ..., n, que evolucionan con el tiempo ( representado éste por el subíndice t).

Cuando se dispone de n datos de un proceso estocástico, se está frente a n muestras, detamaño unidad, extraídas de la población (variable aleatoria), correspondientes al tiempo enque se realizó la medición, y esto es lo que constituye la serie temporal o cronológica.

Como ejemplo puede servir la evolución a lo largo de un año del índice IBEX35, que recogelos 35 valores de mayor cotización de la bolsa española, representada en la figura 1.2.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 8: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 8/154

p12 Series temporales

Lógicamente, el valor del IBEX35 dependerá del valor alcanzado en los días previos,además de recoger la influencia de un conjunto de factores sociales, políticos, económicos,

etc., que son continuamente cambiantes en el tiempo y cuya conjunción, en un determinadoinstante, configuraría una hipotética distribución de probabilidad del citado índice económico.

En casos como éste, es evidente que puede obtenerse un modelo que explique elcomportamiento de la serie en el período estudiado, pero puede ser muy arriesgada lautilización de este modelo para hacer previsiones a medio o largo plazo. Así, en todas lasseries cronológicas, es necesaria una gran cautela en la previsión a causa de la muyprobable inestabilidad del modelo en un futuro más o menos alejado del último instante delque se conocen datos.

3

3,5

4

4,5

5

enero diciembre

IBEX35

Fig. 1.2.- Evolución del índice IBEX35

Otro ejemplo puede ser el constituido por la sucesión de variables aleatorias {Y1, ...,Y

t,...},

tales que t t 1 tY 0,80Y −= + ε , con Y0= 0 y los

tε distribuidos N(0; 1), independientes para todo

t = 1, 2,...

Esta serie puede expresarse también comot

t it i

i 1

Y 0,8 −

=

= ε∑ y la distribución de

probabilidad de cualquier Yt

corresponde a una ley Normal, con esperanza matemática

t tt it

i 1

1 0,8E(Y ) 0,80,2

=

−= =∑ y varianciat t2(t i)

t

i 1

1 0,64V(Y ) 0,80,36

=

−= =∑ .

La figura 1.3 muestra la ley de probabilidad de la variable Y en los instantes t = 1, t = 4 y t =20, junto con la serie cronológica compuesta por las 25 primeras observaciones de lamisma.

La particular forma de la información disponible de una serie cronológica, n muestras detamaño unidad procedentes de otras tantas poblaciones de distribución y característicasdesconocidas, hacen que las técnicas de inferencia estadística, usualmente aplicadas enmuestras de tamaño superior a la unidad, no sean válidas para estos casos.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 9: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 9/154

Introducción p13

En los capítulos siguientes se pretende presentar, de forma simple, distintos criteriosmetodológicos que permitan el estudio de estos fenómenos, y en particular la previsión de

su evolución futura, para aplicarlos a campos técnicos y económicos, como por ejemploprevisión de las ventas de una empresa, de los usuarios de un medio de transporte, de lacaracterística de interés de un proceso continuo, etc.

 Yt

-10

-5

0

5

10

15

20

0 5 10 15 20 25

Fig. 1.3.- Distribución de Yty 25 observaciones de la serie

Todas las formas de estudio de una serie cronológica, tal como se irá viendo, no conllevancálculos complicados, pero sí reiterativos, con gran volumen de datos manipulados y conabundancia de gráficos; es por ello que para su estudio se hace muy necesario el disponerde un programa informático que permita su correcta aplicación y la obtención de cuantosgráficos sean necesarios.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 10: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 10/154

p14 Series temporales

2. AN Á LISIS DE UNA SERIE TEMPORAL

Antes de abordar cualquier estudio analítico de una serie temporal, se impone unarepresentación gráfica de la misma y la observación detenida de su aspecto evolutivo.

Para estudiar el comportamiento de cualquier serie temporal, y predecir los valores quepuede tomar en un futuro, puede hablarse de distintas metodologías, que denominaremosmodelización por componentes y enfoque Box-Jenkins.

2.1 Modelizacion por componentes

Este método consiste en identificar, en la serie Yt, cuatro componentes teóricas, que no

tienen por qué existir todas, y que son:

  Tendencia: Tt.

  Estacionalidad: Et.

  Ciclos: Ct.

  Residuos: Rt.

Cada una de estas componentes es una función del tiempo y el análisis consistirá en laseparación y obtención de cada una de ellas, así como en determinar de qué forma seconjugan para dar lugar a la serie original. Estas componentes se pueden observar en lafigura 2.1, en donde se ha considerado que actúan de forma aditiva para dar lugar a la seriecronológica.

La tendencia es la componente general a largo plazo y se suele expresar como una función

del tiempo de tipo polinómico o logarítmico, por ejemplo Tt= α

0+ α

1t+ α

2t

2+ …

Las variaciones estacionales son oscilaciones que se producen, y repiten, en períodos detiempo cortos. Pueden estar asociadas a factores dinámicos, por ejemplo la ocupaciónhotelera, la venta de prendas de vestir, de juguetes, etc., cuya evolución está claramenteligada a la estacionalidad climática, vacacional, publicitaria, etc.

Las variaciones cíclicas se producen a largo plazo y suelen ir ligadas a etapas deprosperidad o recesión económica. Suelen ser tanto más difíciles de identificar cuanto máslargo sea su período, debido, fundamentalmente, a que el tiempo de recogida deinformación no aporta suficientes datos, por lo que a veces quedarán confundidas con lasotras componentes.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 11: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 11/154

 Análisis de una serie temporal p15

TENDENCIA

ESTACIONALIDAD

CICLOS

RESIDUOS

100

125

150

175

200

-40

-20

0

20

40

-60

-30

0

30

60

-5

-3

0

3

5

0

100

200

300

SERIE

CRONOLÓGICA

Fig. 2.1.- Componentes de una serie cronológica

La componente residual es la que recoge la aportación aleatoria de cualquier fenómenosujeto al azar.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 12: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 12/154

p16 Series temporales

Para evaluar las distintas componentes se utilizan técnicas estadísticas tales como modelolineal, medias móviles, diferencias finitas, etc.

Admitiendo que el componente aleatorio (residuo) es aditivo, una vez identificadas las otrascomponentes surge un nuevo problema que es el cómo conjuntar tendencia, estacionalidady ciclos para dar lugar a la serie definitiva.

Así se proponen, entre otros, modelos genéricamente denominados aditivos ymultiplicativos.

  Modelo aditivo: Y = T + E + C + R

  Modelo multiplicativo: Y = T x E x C + R

Para una primera identificación visual del caso, se puede considerar que si el patrónestacional se mantiene con amplitud constante se tratará de modelo aditivo (figuras 2.1 y2.2). Cuando dicho patrón se vaya amplificando con el tiempo, será multiplicativo (figura2.3).

50

100

150

200

250

t

Y

Fig. 2.2.- Serie aditiva

0

100

200

300

400

t

Y

Fig. 2.3.- Serie multiplicativa

 © Los autores, 2001; © Edicions UPC, 2001.

Page 13: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 13/154

 Análisis de una serie temporal p17

Un modelo aditivo se puede interpretar como aquel en que la estacionalidad actúamodificando la ordenada en el origen de la tendencia.

Supongamos que no hay ciclos, que la tendencia es de tipo lineal, Tt= α

0+ α

1t, y que la

estacionalidad es de período p = 4, es decir, cada 4 unidades de tiempo se repite el patrón(tal como ocurre en la figura 2.2). Representando sus valores por E

1, E

2, E

3y E

4,

respectivamente, el modelo aditivo se puede escribir como

Y1

= α0

+ α1× 1 + E

1+ R

1= γ 

1+ α

1 × 1 + R

1

Y2

= α0

+ α1× 2 + E

2+ R

2= γ 

2+ α

1 × 2 + R

2

Y3

= α0

+ α1× 3 + E

3+ R

3= γ 

3+ α

1 × 3 + R

3

Y4

= α0

+ α1× 4 + E

4+ R

4= γ 

4+ α

1 × 4 + R

4

Y5 = α0 + α1× 5 + E1 + R5 = γ 1 + α1 × 5 + R5

… …. ….

Yt= α

0+ α

1× t + E

s+ R

t= γ 

s+ α

1 × t + R

tcon t = p$ + s; s = 1, …, p

Así pues, cada estación (s) componente del período conforma una recta con ordenada en elorigen distinta para cada caso y pendiente común a todos; es decir, según muestra la figura2.4, el modelo es un conjunto de rectas paralelas, cada una de ellas asociada a unaestación.

En el modelo multiplicativo, el componente estacional actúa sobre la ordenada en el origen y

sobre la pendiente.

50

100

150

200

250

t

Y

Fig. 2.4.- Interpretación de una serie con modelo aditivo

Prescindiendo de los ciclos, supuesta una tendencia lineal tipo Tt

= α0

+ α1t y una

estacionalidad de período p, para cualquier t = p$ + s, con s = 1, …, p, resulta

 © Los autores, 2001; © Edicions UPC, 2001.

Page 14: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 14/154

p18 Series temporales

Yt= T

t × E

s+ R

t= (α

0+ α

1t) E

s+ R

t,

es decir Yt = (α0 Es ) + ( α1Es ) t + Rt

o sea Yt= γ 

0s+ γ 

1st + R

t

De esta forma, cada una de las p estaciones del período configura una recta distinta, tantoen lo que se refiere a la ordenada en el origen (γ 

0s) como a la pendiente (γ 

1s).

El conjunto de las p rectas constituye el modelo de comportamiento de la serie (figura 2.5).

Es evidente que esta división, en modelo estrictamente aditivo o estrictamente multiplicativo,es bastante restrictiva, ya que puede darse el caso de que en algunas estaciones cambiesólo la pendiente, o sólo la ordenada en el origen. Esto constituiría un modelo mixto muchomás general que los propuestos hasta ahora, los cuales pasarían a ser meros casosparticulares de éste. En la figura 2.6 se presenta una situación de este tipo.

0

100

200

300

400

500

t

Y

Fig. 2.5.- Interpretación de una serie con modelo multiplicativo

 

0

50

100

150

200

t

Y

Fig. 2.6.- Modelo general

 © Los autores, 2001; © Edicions UPC, 2001.

Page 15: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 15/154

 Análisis de una serie temporal p19

2.2 Enfoque Box - Jenkins

La forma de encarar el análisis de las series temporales a través de la metodología de Box-Jenkins es dirigir el esfuerzo a determinar cuál es el modelo probabilístico que rige elcomportamiento del fenómeno a lo largo del tiempo. Es decir, partiendo de la premisa deque no siempre va a ser posible identificar los componentes de la serie, se trata de estudiarel componente aleatorio puro, reflejado en los residuos.

La metodología estadística utilizada en el estudio de una serie temporal por este sistema, sebasa en los siguientes pasos:

  Identificación del modelo.

  Estimación de los parámetros.

  Validación de los supuestos admitidos en el análisis, también llamado diagnosis delmodelo.

Para poder abordar esta metodología es imprescindible, en primer lugar, estudiar unconjunto de modelos de comportamiento que cubran el mayor espectro posible de losprocesos estocásticos objeto de nuestro interés. Entre ellos se pueden destacar losprocesos de ruido blanco, medias móviles (MA), autorregresivos (AR), integrados (I) y susconjunciones (ARMA y ARIMA). A partir de aquí se podrá identificar la serie de datos conalguno de los modelos estudiados, estimar sus parámetros y validar la admisibilidad delmodelo adoptado.

En general, se suele asumir que el componente aleatorio, el cual se representa por Z, sigueuna distribución Normal de media cero y variancia σ

2. Un proceso estocástico en que todos

sus componentes son independientes y están constituidos sólo por componente aleatorio sedenomina proceso de ruido blanco, es decir, Y

t= Z

tcon Z

t ∼ NINDEP(0; σ

2) ∀t.

Un proceso se denomina de media móvil de orden q, y se representa por MA(q), si suestructura es del tipo Y

t= Z

t+ α

t-1Z

t-1+ … + α

t-qZ

t-q. En la figura 2.7 se muestra un MA(4).

-4

-3

-2

-1

0

1

23

4

t

Y

Fig. 2.7.- Proceso de media móvil MA(4)

 © Los autores, 2001; © Edicions UPC, 2001.

Page 16: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 16/154

p20 Series temporales

Un proceso es autorregresivo de orden p, y se representa por AR(p), cuando cadacomponente es función de los anteriores más el término aleatorio; su estructura corresponde

a

Yt= Z

t+ β

t-1Y

t-1+ … + β

t-pY

t-p

En la figura 2.8 se muestra un AR(2).

Cuando a las estructuras de autorregresión y media móvil se une una dependencia con eltiempo se llega a un ARIMA(p, r, q), donde p es el orden del AR, q el del MA y r el delproceso integrado, o, lo que es lo mismo, el grado del polinomio que representa la funcióndel tiempo. En la figura 2.9 se presenta un proceso ARIMA(2,1,3).

-4

-3

-2

-1

0

1

2

3

4

t

Y

Fig. 2.8.- Proceso autorregresivo AR(2)

0

10

20

30

40

50

60

70

80

90

t

Y

Fig. 2.9.- Proceso ARIMA(2, 1, 3)

 © Los autores, 2001; © Edicions UPC, 2001.

Page 17: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 17/154

Descomposición de una serie temporal p21

3 DESCOMPOSICIÓN DE UNA SERIE TEMPORAL

Este método, también denominado sistema clásico, descompone la serie en tendencia,estacionalidad, ciclos y residuos Una vez decidida la conjunción entre ellos, aditiva omultiplicativa, se obtiene el modelo con el que hacer previsiones.

La tendencia es la componente más importante de la serie, al definir lo que se podríainterpretar como comportamiento a largo plazo. Cada observación va ligada a un valor deltiempo, lo que permite plantear un modelo del tipo

Y (t)= φ + ε

donde la función φ(t) puede ser:

lineal: φ(t) = α0

+ α1t

polinómica: φ(t) = α0+ α

1t + α

2t2+ ...

exponencial: φ(t) = α0t α1

 

Si la serie no presenta estacionalidad, el método de estimación mínimo-cuadrática y todaslas pruebas de hipótesis relativas a la explicación del modelo y a la significación de loscoeficientes estimados, propios del modelo lineal ordinario, permiten estimar los

coeficientes del modelo de tendencia sobre los datos directos.

Caso de existir componente estacional, para que ésta no enmascare la tendencia, esnecesario estabilizar previamente la serie.

Para desarrollar la metodología de la descomposición clásica sobre un ejemplo, se disponede los datos relativos a las ventas de material deportivo en una gran superficie comercial,recogidos en la tabla 3.I y representados en la figura 3.1. En esta tabla el tiempo (t) se hamedido tomando como referencia el inicio del período de recogida de datos, y, en este caso,su unidad es el trimestre.

La observación de la figura 3.1, permite pensar en una tendencia lineal creciente y una

estacionalidad clara, cuyo patrón se repite anualmente, es decir, cada 4 valores del tiempo(trimestres). Esto se puede interpretar como una tendencia sostenida de un aumento de lasventas en esta superficie comercial, unida a un comportamiento distinto para cada uno delos cuatro trimestres; debido, posiblemente, a que el precio del material deportivo es muydistinto según sea el adecuado para una estación concreta (material de esquí frente aentretenimiento de playa, por ejemplo). Por otra parte, el patrón estacional se mantiene conuna amplitud aproximadamente constante, lo que conduce a la utilización de un modeloaditivo.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 18: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 18/154

p22 Series temporales

Año Trimestre Ventas (Y) t

1990 1

23

4

40,22

54,8963,51

111,35

1

23

4

1991 1

2

3

4

46,95

51,62

61,47

108,58

5

6

7

8

1992 1

2

3

4

41,38

65,30

64,25

113,82

9

10

11

12

1993 1

23

4

53,34

59,3766,15

121,5

13

1415

16

1994 1

2

3

4

67,38

56,09

75,11

124,39

17

18

19

20

1995 1

2

3

4

55,90

61,25

75,44

126,50

21

22

23

24

Tabla 3.I.- Ventas de material deportivo

40

70

100

130

0 4 8 12 16 20 24 t

Y

Fig. 3.1.- Evolución cronológica de las ventas de material deportivo

En este ejemplo se ha identificado un patrón estacional compuesto por los cuatro trimestresy que se repite de año en año, además de una tendencia aparentemente lineal. Si sedecidiese ajustar el modelo de tendencia directamente sobre los datos, se obtendrían los

resultados de la tabla 3.II.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 19: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 19/154

Descomposición de una serie temporal p23

nu S. C. C. M. F p-val

Regresión 1 1901,300 1901,300 2,677 0,116

Residuos 22 15623,686 710,168Total 23 17524,985

Coef. Error típico t p-val

Ord. Origen 57,501 11,229 5,121 0,000

t 1,286 0,786 1,636 0,116

R 2 = 0,10849

Tabla 3.II.- Modelo de tendencia ajustado sobre todos los datos: Y = α0+ α

1t + ε

El modelo presenta un coeficiente de determinación (R^2) tan sólo del 10,8% y no resultaestadísticamente significativo, ya que el nivel de significación (p-val), tanto del ajuste comode la pendiente de la recta de tendencia, son claramente superiores a un riesgo de primeraespecie del 5%. Así, se demuestra que este procedimiento no es válido ya que incluye en elresiduo todo el componente estacional, lo cual produce una inflación de la suma decuadrados residual que desvirtúa el modelo y cualquier prueba de significación de laregresión y de sus coeficientes.

Para evitar esto es necesario estabilizar la serie liberándola de la estacionalidad; esto sepodría conseguir trabajando con los valores medios anuales, que son los de la tabla 3.III. Enla tabla 3.IV se detallan los resultados del cálculo del modelo de tendencia, considerado tiporectilíneo.

Y a t (años) Y a t (años)

67,4925

67,1550

71,1875

1

2

3

75,0900

80,7425

79,7725

4

5

6

Tabla 3.III.- Medias anuales de ventas de material deportivo

nu S.C. C.M. F p-val

Regresión 1 160,711 160,711 42,073 0,003

Residuos 4 15,279 3,820

Total 5 175,991

Coef. Error típico t p-val

Ord. Origen 62,967 1,819 34,607 0,000

t(años) 3,030 0,467 6,486 0,003

R^2 = 0,91318

Tabla 3.IV.- Modelo lineal para las medias anuales

 © Los autores, 2001; © Edicions UPC, 2001.

Page 20: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 20/154

p24 Series temporales

Ahora ya se ha obtenido un modelo de tendencia altamente significativo y con un buenajuste (R^2 = 91,3%). En la figura 3.2 se han representado las medias anuales junto a la

estimación del modelo de tendencia; se observa la estabilización conseguida en los valoresde las medias anuales, ya que mientras los datos directos oscilaban entre 40 y 130, lasmedias anuales van desde 67 hasta 81.

Hay que destacar que con esta estabilización se ha conseguido un modelo de tendenciasignificativo; sin embargo, ¿es aceptable este procedimiento? La respuesta sería no, ya queeste sistema tiene el inconveniente de la gran pérdida de información, pues de los 24 datosiniciales, se ha acabado estimando el modelo con sólo 6 puntos. Este inconveniente quedapaliado desestacionalizando la serie con las medias móviles.

65

70

75

80

85

0 1 2 3 4 5 6 7

t(años)

Ya

Fig. 3.2.- Evolución y tendencia de la media anual

3.1 Medias móviles: tendencia

Con este método se consiguen suavizar tanto las oscilaciones periódicas de una serie comolas aleatorias. Su aplicación requiere decidir, previamente, el período en que se repite ciertopatrón de comportamiento, que pueda atribuirse a variaciones estacionales; la observaciónde la evolución gráfica de la serie puede ayudar a tomar la decisión.

Una vez fijado el período p, se calculan las medias de los valores de la serie tomados de pen p, sucesivamente desde el inicio. Asociando cada una de estas medias al valor deltiempo del punto central del período estudiado, se obtiene una nueva serie de valoresmucho más estables, debido, por una parte, a la reducción de la variabilidad ocasionada alpromediar y, por otra, a que, si el período escogido es el correcto, al pasar de una mediamóvil a la siguiente, el nuevo dato incorporado es del mismo comportamiento que el datosaliente.

Si p es impar la asociación es directa :

p + 1t =

2

⇔  

p

i1 2 pi 1

(p 1) / 2

YY Y Y

Y

p p

=+

+ + += =

∑A

 © Los autores, 2001; © Edicions UPC, 2001.

Page 21: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 21/154

Descomposición de una serie temporal p25

p + 3

t = 2   ⇔  

p 1

i2 3 p 1i 2

(p 3) / 2

YY Y Y

Y p p

+

+=

+

+ + +

= =

∑A

•••

Si p es par, el centro del grupo de cada p valores promediados corresponde a un valor noobservado del tiempo; para subsanarlo, la nueva serie queda constituida por los promediosde las medias móviles tomadas dos a dos. Es decir:

p + 2t =

2⇔ (p 1) / 2 (p 3) / 2

(p 2) / 2

Y YY

2

+ +

+

+=

p + 4t =

2  ⇔ (p 3) / 2 (p 5) / 2

(p 4) / 2

Y YY

2

+ +

+

+=

• • •

La representación gráfica de las medias móviles, o la regresión de dichos valores frente altiempo, permiten evaluar la tendencia de la serie liberada de la componente estacional.

Uno de los inconvenientes de este sistema es la pérdida de valores en los dos extremos dela serie, tanto mayor cuanto mayor es p. En ocasiones, se propone como alternativa a esteproblema la sustitución de los valores extremos de las medias móviles por los resultantes deuna extrapolación lineal de los observados; sin embargo, si el número de datos disponibleses grande, la pérdida de información es negligible.

En el caso del ejemplo de las ventas de material deportivo, ya se ha comentado que laestacionalidad se manifiesta de forma anual, es decir, cada cuatro trimestres; ello conduceal cálculo de las medias móviles tomando p = 4.

En la tabla 3.V se detalla el cálculo de los primeros valores de la nueva serie, y la tabla 3.VI

resume la totalidad de los mismos.

t Y Y t

123

45…

 

40,22

54,89

63,51

111,35

46,95

67,4925

69,175068,3337

34

5…

Tabla 3.V.- Detalle del cálculo de las medias móviles con p = 4

 © Los autores, 2001; © Edicions UPC, 2001.

Page 22: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 22/154

p26 Series temporales

t Y t Y t Y t Y

3

4567

68,3337

68,766268,102567,501266,4588

8

9101112

67,4725

69,530070,532572,682573,4363

13

14151617

72,9325

74,130076,845078,190078,9000

18

19202122

80,3812

79,307578,517579,203779,5088

Tabla 3.VI.- Medias móviles con p = 4

Los resultados del modelo lineal, 0 1Y t= α +α +ε para el cálculo de la tendencia constan en

la tabla 3.VII.

nu S.C. C.M. F p-val

Regresión 1 393,692 393,692 162,810 0,000

Residuos 17 41,108 2,418

Total 18 434,800

Coef. Error típico t p-val

Ord. Origen 63,0065 0,9188 68,5739 0,0000

t 0,8311 0,0651 12,7597 0,0000

R^2 = 0,905

Tabla 3.VII.- Modelo de tendencia sobre las medias móviles

Trabajando sobre 19 puntos, los 19 valores de las medias móviles, se ha obtenido un buenajuste, con un coeficiente de determinación del 90,5 %. En consecuencia, el modelo detendencia resultante es

T = 63,0065 + 0,8311 t

Evidentemente, la interpretación de la ecuación de la tendencia permite afirmar que lasventas se incrementan 0,8311 unidades cada trimestre (ya que el tiempo se ha medido entrimestres). En la figura 3.3 puede observarse el suavizado conseguido con las mediasmóviles junto con el modelo de tendencia estimado a partir de los citados valores.

40

70

100

130

0 4 8 12 16 20 24 t

Fig. 3.3.- Evolución ( • ), medias móviles ( 1 ) y tendencia (    ), para p = 4

 © Los autores, 2001; © Edicions UPC, 2001.

Page 23: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 23/154

Descomposición de una serie temporal p27

3.2 Estacionalidad

La componente estacional, que provoca una oscilación sistemática de período corto,generalmente no superior al año, puede enmascarar la evolución a largo plazo, tendencia, sino se aísla convenientemente.

Se entiende como componente estacional, en modelos aditivos, la diferencia entre el valorde la estación y la media de todas las estaciones componentes del período.

El análisis de la estacionalidad queda ligado al método que se decida emplear paramodelizar la tendencia; así, en este punto estudiaremos la situación para el caso de trabajarcon medias móviles.

Para calcular los valores de los índices estacionales hay que seguir la siguiente sistemática:

n  Calcular las medias móviles, tY , sobre los datos, tY , de la serie original, tomando el

período de agrupación, p, que se considere oportuno.

n  Proponer un modelo de agrupación de las componentes, aditivo o multiplicativo.

n  Separar la parte explicada por la tendencia. Supuesto el modelo aditivo, esto equivale a

calcular tW = tY −  tY ; si fuese multiplicativo, en lugar de diferencias serían cocientes, es

decir, tW = tY /  tY . Hay que destacar que en tW están incluidas las componentes

asociadas a la estacionalidad, los ciclos y los residuos.

n  Asumiendo que los residuos son variables aleatorias de media nula y que lacomponente cíclica, caso de existir, es de período suficientemente largo como para noser recogida por los datos, se procede a evaluar la estacionalidad asociada a cadacomponente del período, a cada trimestre en el caso del ejemplo. Para ello se calculan

los promedios de los tW de la misma estación

t

t s p*s

s

W

En

= +=

∑&

s = 1, …, p

donde s representa el índice estacional y ns

el número de valores asociados a esteíndice que se promedian.Ya que los índices estacionales miden discrepancias respecto a la media, ésta senecesita como valor de referencia; por tanto es necesario calcular la media general:

p

*s

s = 1

  E

E =p

n  Calcular los índices estacionales en modelo aditivo 

Los índices estacionales son las diferencias entre los promedios de las tW de cada

estación y la media general que se acaba de definir, es decir

*s sE E E= −

 © L o s a u t o r e s , 2 0

Page 24: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 24/154

p28 Series temporales

Es obvio destacar que la suma de estos índices es cero:p

s

s 1

E 0=

=∑ .

n  Calcular los índices estacionales en modelo multiplicativo .

En este caso, los índices estacionales son el cociente entre los promedios de last

W de

cada estación y la media general, es decir*s

s

EE

E=

Ahora, la suma de estos índices es igual al período,p

s

s 1

E p=

=∑ . En modelo

multiplicativo, no es extraño que los índices estacionales se representen en %.

En la tabla 3.VIII se detallan los cálculos del caso de modelo aditivo de las ventas dematerial deportivo. Por ejemplo, para el tercer trimestre (s = 3), el promedio de las Wt, cuyosvalores del tiempo correspondiesen al tercer trimestre, por ser múltiplos de 4 más 3 (t = 3, 7,11, 15, 19), sería:

*3

-4,8237 - 4,9888 - 8,4325 - 10,6950 - 4,1975= = - 6,6275E

5

t tYtY t

W Estación: s

12345678910111213

1415161718192021222324

40,2254,8963,51

111,3546,9551,6261,47

108,5841,3865,3064,25

113,8253,34

59,3766,15121,567,3856,0975,11

124,3955,9061,2575,44126,5

------

68,333768,766268,102567,501266,458867,472569,530070,532572,682573,436372,9325

74,130076,845078,190078,900080,381279,307578,517579,203779,5088

------

------

-4,823742,5838

-21,1525-15,8812-4,988841,1075

-28,1500-5,2325-8,432540,3837

-19,5925

-14,7600-10,695043,3100

-11,5200-24,2912-4,197545,8725

-23,3037-18,2588

------

1234123412341

23412341234

Tabla 3.VIII.- Evaluación de la estacionalidad por medias móviles.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 25: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 25/154

Descomposición de una serie temporal p29

Análogamente, para cada trimestre, se obtiene:

* * * *1 2 3 4E 20,7438 E 15,68477 E 6,6275 E 42,6515= − = − = − =

La media general es:

4*s

s 1

E

E 0,1011254

== = −

y los índices estacionales, resultan

E1

= –20,6426 E2

= –15,5836 E3

= –6,5264 E4= 42,7526

Los valores de los índices estacionales recién obtenidos se interpretan de la siguiente forma:respecto a la media, el primer trimestre tiene una venta inferior en 20,6426 unidades; elsegundo está 15,5836 unidades por debajo de la media; el tercero 6,5264; mientras que elcuarto supera a la media en 42,7526 unidades de venta.

Con el modelo de tendencia de la tabla 3.VII y la estacionalidad, se ha obtenido ladescomposición de la serie original, mostrada en la figura 3.4.

Evidentemente, los residuos se calculan como : R = Y - T - E. La buena modelizaciónconseguida queda confirmada por los residuos, ya que en su mayoría están en el intervalo±5 y sólo en 3 puntos se llega a valores de 10 u 11 unidades.

Tal como se ha ido repitiendo, el objetivo de la modelización de la serie es poder realizarprevisiones para los próximos valores del tiempo. En la tabla 3.IX se presentan lasprevisiones para los 2 años inmediatos siguientes. Atendiendo a que el período estacionales igual a 4, para realizar la previsión hay que identificar el tiempo como un múltiplo de 4más s (s = 1, 2, 3, 4), para añadir a la tendencia el valor correcto de la estacionalidad. Así,la previsión se calcula como:

tY# = 63,0065 + 0,8311 t + E

scon t = 4$ + s

La figura 3.5 muestra la evolución de las previsiones y su buena concordancia con laevolución histórica de los datos recogidos en el estudio.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 26: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 26/154

p30 Series temporales

40

70

100

130

Y

64

69

74

79

84

T

-30

-10

10

30

50

E

-11

0

11

t

R

40

70

100

130

T

+

E

Fig. 3.4.- Descomposición de la serie de ventas de material deportivo por medias móviles

 © Los autores, 2001; © Edicions UPC, 2001.

Page 27: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 27/154

Descomposición de una serie temporal p31

Año t Estación: sTendencia:

T = 63,0065+0,8311 tEstacionalidad: E Previsión: Y#

1996 25

26

27

28

1

2

3

4

83,7840

84,6151

85,4462

86,2773

 –20,6426

 –15,5836

 –6,5264

42,7526

63,1414

69,0315

78,9198

129,0299

1997 29

30

31

32

1

2

3

4

87,1084

87,9395

88,7706

89,6017

 –20,6426

 –15,5836

 –6,5264

42,7526

66,4658

72,3559

82,2442

132,3543

Tabla 3. IX.- Previsiones para 1996 y 1997, según el modelo de descomposición clásica

40

90

140

0 4 8 12 16 20 24 28 32 t

Y

Fig. 3.5.- Evolución histórica ( • ), modelo ( –– ) y previsiones ( p )

3.3 Caso temperaturas

La tabla 3.X presenta las temperaturas medias mensuales registradas en una ciudad delhemisferio sur, en el período de tiempo que abarca desde enero de 1986 a diciembre de1995. Interesa estudiar el modelo de comportamiento y realizar una previsión de lastemperaturas de la década siguiente.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 28: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 28/154

p32 Series temporales

Año

Mes 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995

IIIIIIIVVVIVIIVIIIIXXXI

XII

26,827,227,126,325,423,923,823,625,325,826,4

26,9

27,127,527,426,424,824,323,423,424,625,425,8

26,7

26,926,325,725,724,824,023,423,524,825,626,2

26,5

26,826,926,726,126,224,723,923,724,725,826,1

26,5

26,327,126,225,725,524,924,224,625,525,926,4

26,9

27,127,127,426,825,424,823,623,925,025,926,3

26,6

26,827,127,426,425,524,724,324,424,826,226,3

27,0

27,127,526,228,227,125,425,624,524,726,026,5

26,8

26,326,726,625,825,225,123,323,825,225,526,4

26,7

27,027,427,026,325,924,624,124,325,226,326,4

26,7

Tabla 3.X.- Registro de las temperaturas mensuales

La evolución cronológica de los datos se muestra en la figura 3.6, en donde se pone demanifiesto que la tendencia es prácticamente inapreciable, por la aparente horizontalidad deleje virtual de la serie. Por otra parte se observa la existencia de una componente estacionalclara que se repite, lógicamente, cada año y mantiene la amplitud, dando idea de que es unmodelo aditivo. Al ser los datos mensuales, la longitud del período es igual a 12.

El cálculo de las medias móviles, con p = 12, y su representación gráfica (figura 3.7)confirman la estacionalidad, por la estabilización conseguida en la serie, pero ponen enentredicho la ausencia de tendencia.

La observación del gráfico hace recomendable ajustar un modelo de tendencia, que se haráposteriormente y que ya se ha representado en esta figura.

22

24

26

28

30

0 24 48 72 96 120 t

Y

Fig. 3.6.- Evolución cronológica de las temperaturas

 © Los autores, 2001; © Edicions UPC, 2001.

Page 29: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 29/154

Descomposición de una serie temporal p33

22

24

26

28

30

0 24 48 72 96 120 t

Y

Fig. 3.7.- Temperaturas mensuales ( • ), medias móviles ( ♦ ) y línea de tendencia ajustada ( −−−− )

Para evaluar la estacionalidad es necesario calcular los índices estacionales, tal como se hadetallado en el apartado 3.2. Los resultados obtenidos se encuentran en la tabla 3.XI, y sepresentan gráficamente en la figura 3.8.

Mes (s) Índice Es

Mes (s) Índice Es

I 1

II 2

III 3

IV 4

V 5

VI 6

1,07496

1,31478

0,97867

0,62126

−0,15883

−1,03569

VII 7

VIII 8

IX 9

X 10

XI 11

XII 12

−1,78846

−1,80143

−0,77967

0,05413

0,52959

0,99070

Tabla 3.XI.- Índices estacionales

La interpretación de los índices es simple: desde octubre (X) a abril (IV), la temperatura estápor encima de la media anual; mientras que de mayo (V) a septiembre (IX) está por debajode la media. No olvidemos que los datos corresponden a una ciudad del hemisferio sur; portanto, de octubre a abril son los meses cálidos, y los demás son los fríos. Es de destacarque la oscilación térmica media, del mes más cálido al más frío, es relativamente pequeña(1,31 + 1,80 = 3,01°C). Esto, unido a los valores medios mensuales, que oscilan entre 23 y29°C permite afirmar que el estudio se está haciendo sobre una ciudad de clima muy suavey casi permanentemente primaveral.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 30: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 30/154

p34 Series temporales

-2

-1

0

1

2

0 4 8 12 s

T

Fig. 3.8.- Componente estacional: índices

La tendencia, aunque débil, existe y es de tipo lineal. Su evaluación se efectuará medianteel modelo lineal aplicado a las medias móviles (tabla 3.XII).

nu S.C. C.M. F p-val

Regresión 1 2,186 2,186 44,512 0,000Residuos 106 5,205 0,049

Total 107 7,391

Coeficientes Error típico t p-val

Ord. Origen 25,4733 0,0459 554,4281 0,0000

t 0,00456 0,0007 6,6717 0,0000

R^2 = 0,295735

Tabla 3.XII.- Modelo lineal para la tendencia: tY = α0+ α

1t + ε

A pesar del valor del coeficiente de determinación del ajuste, (29,57 %), la explicación delmodelo es significativa. Así, se puede deducir que parece existir una tendencia muy ligera aun incremento de la temperatura, que se ha estimado en un aumento de 0,00456 gradosmensuales en promedio.

La evolución del modelo, junto con los datos reales, se presentan en la figura 3.9. Para suobtención, hay que tener en cuenta que, conocidos los índices estacionales y el modelo detendencia, la suma mes a mes de los dichos valores darán lugar al modelo propuesto, esdecir:

tY#

= 25,4733 + 0,00456 t + sE con t = 12$

+ s s = 1, …, 12

 © Los autores, 2001; © Edicions UPC, 2001.

Page 31: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 31/154

Descomposición de una serie temporal p35

22

24

26

28

30

0 24 48 72 96 120 t

Y

Fig. 3.9.- Datos ( • ) y modelo ajustado ( − )

Solamente hay que destacar la buena concordancia entre ambos, a pesar de que hayalgunos puntos que parecen presentar mayores discrepancias.

Esto ocurre, principalmente, desde abril hasta julio de 1993 que como, puede observarse, yaen los datos iniciales presentaron unas temperaturas medias bastante superiores a las de

los demás años (es decir hizo un otoño especialmente cálido).

En la figura 3.10, se muestran los residuos resultantes de la descomposición de esta serie,

obtenidos como t t tR Y Y= −# . Hay que destacar la buena modelización conseguida, pues

en la mayoría de las 120 observaciones, el error es inferior a un grado, excepto en losmeses ya comentados.

-2

-1

0

1

2

0 24 48 72 96 120 t

R

Fig. 3.10.- Residuos del modelo

 © Los autores, 2001; © Edicions UPC, 2001.

Page 32: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 32/154

p36 Series temporales

A partir de la descomposición, y suponiendo que no cambiase el comportamientometeorológico de la zona, la previsión de la temperatura para los 10 años siguientes sería la

de la tabla 3.XIII, que se muestra en la figura 3.11 junto a los datos disponibles. Aquí seobserva que, de mantenerse la tendencia, la temperatura media mensual, poco a poco, seva incrementando.

Comparando los datos reales con las previsiones, se ve en estas últimas la ausencia delcomponente aleatorio. Se está haciendo una previsión de temperaturas medias, pero el azarmeteorológico se unirá a la previsión alterándola en aquellos períodos de tiempo en los quelas temperaturas sean distintas a las de la tónica general: inviernos muy fríos o muy suaves,veranos más extremos, etc.

Año

Mes 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005

IIIIIIIVVVIVIIVIIIIX

XXIXII

27,127,327,026,725,925,024,324,325,3

26,126,627,1

27,227,427,126,725,925,024,324,325,3

26,226,727,1

27,227,527,126,826,025,124,424,425,4

26,226,727,2

27,327,527,226,826,125,124,424,425,5

26,326,827,2

27,327,627,226,926,125,224,524,525,5

26,326,827,3

27,427,627,326,926,225,224,524,525,6

26,426,927,3

27,427,727,327,026,225,324,624,625,6

26,526,927,4

27,527,727,427,026,325,324,724,625,7

26,527,027,5

27,527,827,527,126,325,424,724,725,7

26,627,027,5

27,627,827,527,226,425,524,824,825,8

26,627,127,6

Tabla 3.XIII.- Temperatura prevista para los 10 años siguientes a la recogida de datos

22

24

26

28

30

0 48 96 144 192 240 t

Fig. 3.11.- Datos desde 1986 a 1995 ( • ) y previsiones desde 1996 a 2005 ( 1 )

 © Los autores, 2001; © Edicions UPC, 2001.

Page 33: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 33/154

Descomposición de una serie temporal p37

3.4 Caso usuarios transporte público

En la tabla 3.XIV se recogen los datos relativos al número de usuarios de un determinadotransporte público en el período que abarca desde 1984 hasta 1995, y la figura 3.2 muestrasu evolución cronológica.

Año

Mes 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995

IIIIII

IVVVIVIIVIIIIXXXIXII

9088109

10310312213413211510191112

111115129

121112125164158133127110120

127107141

135133154175174158139112140

142139145

162144176192190160151134140

146155182

165165191195205182165138155

164151180

164184206198235197163148163

175161179

195189208227249224193170166

176194197

211191235248273202189167168

208189232

226222245252242229202192198

199190228

220222233303253253223191185

207198251

231234251316285250232190201

219206229

223231266290294258214206199

Tabla 3. XIV.- Usuarios de un transporte público.

80

160

240

320

0 24 48 72 96 120 144 t

Y

Fig. 3.12.- Evolución cronológica del número de usuarios.

La observación de la figura 3.12 permite realizar las siguientes consideraciones:

  Se detecta una clara tendencia creciente en el tiempo.

  Hay una estacionalidad manifiesta que se repite anualmente. Ya que los datos sonmensuales, su período será igual a 12.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 34: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 34/154

p38 Series temporales

  El patrón de estacionalidad tiene una forma constante pero presenta una amplificacióncontinua en el tiempo. Esta situación es la que indica que el modelo subyacente es

multiplicativo.

Para obtener la descomposición de la serie cronológica, es necesario estabilizarlapreviamente, mediante medias móviles de p = 12; y después modelizar la tendencia ycalcular los índices estacionales.

La evolución de las medias móviles se muestra en la figura 3.13, y se aprecia un crecimientoque no es proporcional al tiempo, sino que parece sufrir un amortiguamiento al final de laserie; es decir, probablemente se tratará de un modelo parabólico.

80

160

240

320

0 24 48 72 96 120 144 t

Fig. 3.13.- Tendencia a través de las medias móviles (p =12)

La estimación mínimo-cuadrática conduce al modelo de tendencia, sobre las mediasmóviles, cuya estimación se muestra en la tabla 3.XV. En ella se observa, además de unmuy buen ajuste reflejado por una R2 del 99,74%, que el término cuadrático es altamentesignificativo. El signo negativo de este término da idea de una especie de freno en elcrecimiento sostenido del número de usuarios, representado por el coeficiente positivo deltiempo.

nu S.C. C.M. F p-val

Regresión 2 194340,33 97170,17 25069,58 7,937E-168

Residuos 129 500,01 3,88

Total 131 194840,34

Coeficientes Error típico t p-val

Ord. Origen 100,4749 0,6227 161,3636 1,08E-150

t 1,4326 0,0197 72,8823 1,08E-106

t^2 -0,00297 0,0001 -22,5088 1,66E-46

R^2 = 0,9974

Tabla 3.XV.- Estimación del modelo de tendencia:  Y = α0+ α

1t + α

2t2+ ε

 © Los autores, 2001; © Edicions UPC, 2001.

Page 35: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 35/154

Descomposición de una serie temporal p39

Así pues, el modelo de tendencia puede escribirse como:

T = 100,4749 + 1,4326 t – 0,00297 t

2

En modelos multiplicativos, como el del actual ejemplo, la componente estacional representala relación entre cada estación y la media general. Recordemos que, en estos casos, elcálculo de la estacionalidad se realiza de acuerdo con los siguientes pasos:

a) Calcular las medias móviles tY , a partir de los datos, Yt, de la serie.

b) Separar la tendencia, es decir, calcular tt

t

YW

Y= .

c) Asumiendo que los ciclos, caso de existir, son de período suficientemente largo comopara no ser recogidos por los datos, calcular los promedios de las Wt de cada estación y lamedia general. s es el indicador de la estación (mes, en el ejemplo), y n

sel número de

valores de W que se promedian en la citada estación

t

t s p*s

s

W

En

= +=

∑$

s = 1, ..., p y

p*s

s 1

E

Ep

==

d) Finalmente, los valores de las componentes estacionales, generalmente expresados en %en modelos multiplicativos, se obtienen como:

*s

s

EE 100

E= ×

En la tabla 3.XVI se muestran los valores de las componentes estacionales del presenteejemplo, y se representan gráficamente en la figura 3.14.

Mes Es

Mes Es

Mes Es

I

II

III

IV

92,38

88,41

101,72

99,21

V

VI

VII

VIII

97,04

109,53

121,91

121,31

IX

X

XI

XII

105,50

94,11

81,54

87,33

Tabla 3.XVI.- Componente estacional.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 36: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 36/154

p40 Series temporales

80

90

100

110

120

130

0 4 8 12 t

E

Fig. 3.14.-Índices estacionales

La interpretación de los índices podría ser en el sentido de que, por ejemplo, los usuarios delos meses de julio y agosto son del orden de un 121% superior a la media, mientras que ennoviembre se está en un 81% de la media. Ello podría aconsejar una promoción en losmeses de noviembre, diciembre, enero y febrero, con el fin de conseguir una mayorocupación de las plazas disponibles.

La figura 3.15 muestra la concordancia entre los datos y su modelización, a partir de latendencia y estacionalidad calculadas, de acuerdo con el modelo multiplicativo:

( )2 s

t

E

Y 100,4749 1,4326 t 0,00297 t 100= + −

#

s = 1, ..., 12 t = s + 12$

80

160

240

320

0 24 48 72 96 120 144 t

Fig. 3.15.- Serie cronológica experimental ( • ) y ajustada (!!!!).

Observando la figura 3.15 se puede destacar que hay unos desajustes más acusados enciertos meses de julio o agosto, en concreto, los de los años 1989, 90, 91, 93 y 94, por loque es posible afirmar que en los casos citados ha habido un comportamientosustancialmente distinto del esperado en los mismos meses de otros años; en principio,sería discutible afirmar la presencia de un cambio en los hábitos de utilización de este

transporte, ya que ni el año 1993 ni el 1995, pertenecientes al período en cuestión,presentan semejantes discrepancias.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 37: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 37/154

Descomposición de una serie temporal p41

A pesar de todo, en este caso, sería prudente tomar con ciertas precauciones lasprevisiones para años venideros, mientras no se confirme la consolidación en el futuro de un

cambio o de una permanencia de comportamiento. También podría ser interesante intentaraveriguar qué ocurrió en estos meses (quizás una campaña publicitaria, quizás unadisminución de alternativas de la competencia,...).

La figura 3.16 muestra la evolución de los residuos entre los datos experimentales y el

modelo ajustado, Rt= Y

t − tY# . Se observa que, en la mayoría de los casos, oscilan entre ±16,

aunque en algún caso la discrepancia se aproxima a 30 unidades.

Asumiendo que se mantiene el mismo modelo, la previsión de usuarios hasta el año 2000 sepresenta en la figura 3.17. Hay que tener en cuenta, para realizar correctamente loscálculos, que el último valor de t para el que se dispone de datos, diciembre de 1995, es144; por tanto, para las predicciones, que abarcan el período de los próximos 60 meses, losvalores de t irán desde 145 hasta 204.

-32

-16

0

16

32

0 24 48 72 96 120 144 t

R

Fig. 3.16.- Residuos del modelo ajustado

En el gráfico de la previsión se puede observar la reducción de la velocidad de crecimientoinicial de la serie que se ha comentado en la modelización de la tendencia.

80

130

180

230

280

330

0 24 48 72 96 120 144 168 192 t

PrevisionesDatos

Fig. 3.17.- Serie observada y previsiones hasta el año 2000

 © Los autores, 2001; © Edicions UPC, 2001.

Page 38: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 38/154

p42 Series temporales

4 MODELIZACIÓN CON VARIABLES CATEGÓRICAS

Tal como se ha comentado en el capítulo anterior, si hubiera estacionalidad, estimar el modelode tendencia sobre los datos directos, por procedimientos usuales de ajuste mínimo-cuadrático, sería improcedente. Ello es debido a que se produciría una inflación de losresiduos no atribuible a la aleatoriedad sino a la variabilidad ocasionada por el componenteestacional. Para evitarlo, se pueden modelizar conjuntamente la tendencia y la estacionalidadcon variables categóricas asociadas a cada estación, o bien desestacionalizar previamente laserie y entonces ajustar el modelo de tendencia, como ya se ha expuesto.

La modelización conjunta, con variables categóricas, de la tendencia y la estacionalidadpresenta como principal ventaja la generalidad del método. Por este procedimiento no esnecesario, a priori, asumir un modelo aditivo o multiplicativo, sino que se plantea un modelo

general que incluye todas las posibilidades.

Sea p el período estacional, es decir, el número de unidades de tiempo que conforman elpatrón de comportamiento que se repite sistemáticamente. Cada uno de los valores deltiempo contenidos en p corresponde a una estación, la cual se designará por el subíndice s,de forma que s = 1, 2, ..., p.

Cada estación debe estar ligada biunívocamente a una variable categórica. Dicha variablees un indicador que toma el valor 1 en la estación a la que está asociada y 0 en todas lasdemás, excepto para la primera estación, en que todas toman el valor 0. Ésta es la razónpor la cual con p-1 variables categóricas es suficiente para estudiar una serie de período p.Las variables categóricas, Q, quedan, pues, definidas como

 j

 j

Q 0 j scon s 1 , 2 , , p y j 2 , , p

Q 1 j s

= ≠ = == = @ @

Con estas variables se plantea un modelo tipop p

Y = ( t ) + Q t+Q j j  j j j 2 j = 2

φ + γ εβ ∑∑=

donde φ(t) es una función polinómica del tiempo, o sea,k

i0 i

i 1

(t) + t=

φ = α α∑ , que viene a

recoger la tendencia o evolución general, a largo plazo, de los datos con el tiempo. Los

términos del grupop

 j j j 2

Q=

β∑ indican los cambios que las distintas estaciones, componentes

del período estacional, introducen en la ordenada en el origen del modelo, parte aditiva

según el sistema clásico. Mientras que los del grupop

 j j j 2

Q t=

γ ∑ representan la influencia de la

estacionalidad sobre la función del tiempo, lo que en el método clásico se interpreta comoparte multiplicativa.

El estudio de la significación de cada uno de los coeficientes α, β y γ , y la consiguienteeliminación de los no significativos conducirá el modelo que definitivamente explica elcomportamiento de la serie.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 39: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 39/154

Modelización con variables categóricas p43

Para desarrollar la metodología de las variables categóricas sobre un ejemplo, se van a utilizar

los datos relativos a las ventas de material deportivo estudiados por el método clásico, con elfin de poder comparar posteriormente los resultados obtenidos. En la tabla 4.I se vuelven areproducir los datos de la serie cronológica, junto a los valores de las variables categóricas. Larepresentación gráfica de los mismos ya se presentó en la figura 3.1, cuya observacióncondujo a pensar en una tendencia lineal creciente y una estacionalidad de período p = 4.

A fin de no confundir los dos efectos, procede la creación de variables categóricas queidentifiquen cada una de las cuatro estaciones, que en este ejemplo constituyen el períodode repetición del patrón estacional. Por otra parte, suponiendo que hubiese ciclos, elintervalo de tiempo de recogida de datos es totalmente insuficiente para tomarlos, por lo quesu posible existencia quedará enmascarada en los residuos.

En la tabla 4.I están las variables categóricas Q2, Q3 y Q4, cuya conjunción representa deforma unívoca cada trimestre. Se insiste en que no es necesaria una Q1, puesto que elprimer trimestre es el que toma como referencia Q2 = Q3 = Q4 = 0, y son los demás que, através del indicador, aportarán la parte del efecto estacional correspondiente.

En este caso, al ser la tendencia rectilínea, se plantea el modelo

0 1 2 2 3 3 4 4 2 2 3 3 4 4Y t Q Q Q Q t Q t Q t= + + + + + + + +α α β β β γ γ γ ε  

La estimación de sus parámetros conduce a los resultados expuestos en la tabla 4.II.

 Año Trimestre (s) Ventas (Y) Q2 Q3 Q4 t

1990 1

2

3

4

40,22

54,89

63,51

111,35

0

1

0

0

0

0

1

0

0

0

0

1

1

2

3

4

1991 12

3

4

46,9551,62

61,47

108,58

01

0

0

00

1

0

00

0

1

56

7

8

1992 1

2

3

4

41,38

65,30

64,25

113,82

0

1

0

0

0

0

1

0

0

0

0

1

9

10

11

12

1993 12

3

4

53,3459,37

66,15

121,5

01

0

0

00

1

0

00

0

1

1314

15

16

1994 1

2

3

4

67,38

56,09

75,11

124,39

0

1

0

0

0

0

1

0

0

0

0

1

17

18

19

20

1995 1234

55,9061,2575,44126,50

0100

0010

0001

21222324

Tabla 4.I.- Ventas de material deportivo

 © Los autores, 2001; © Edicions UPC, 2001.

Page 40: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 40/154

p44 Series temporales

Los resultados del modelo lineal general evidencian que todos los términos del tipo Q jt no

son estadísticamente significativos, (p-val < 0,05), por tanto procede recalcular el modelo

prescindiendo de ellos.

Cabe destacar que este hecho manifiesta que la estacionalidad no modifica la pendiente dela recta del tiempo, es decir, el incremento de las ventas es el mismo para cada trimestre.Esto simplifica el caso al corresponder a un modelo aditivo puro, que puede ser,alternativamente, estudiado por la metodología de la descomposición clásica, tal como se hahecho en el capítulo 3. Si alguno de esos términos hubiese resultado significativo, el sistemaclásico proporcionaría un modelo bastante precario.

nu S.C. C.M. F p-val

Regresión 7 17166,997 2452,428 109,609 0,000

Residuos 16 357,988 22,374Total 23 17524,985

Coeficientes Error típico t p-val

Ord. Origen 38,9463 3,660 10,640 0,000

Q2 15,7735 5,351 2,948 0,009

Q3 19,1936 5,535 3,468 0,003

Q4 65,6577 5,726 11,466 0,000

t 1,0832 0,283 3,832 0,001

t*Q2 -0,8026 0,400 -2,008 0,062

t*Q3 -0,3513 0,400 -0,879 0,393

t*Q4 -0,1485 0,400 -0,371 0,715

R^2 = 0,9796

Tabla 4.II.- Resultados del modelo lineal general

La tabla 4.III contiene los resultados del ajuste del modelo definitivo, es decir, de

0 1 2 2 3 3 4 4Y t Q Q Q= + + + + +α α β β β ε  

nu S.C. C.M. F p-val

Regresión 4 17064,626 4266,157 176,073 0,000Residuos 19 460,359 24,229

Total 23 17524,985

Coeficientes Error típico t p-val

Ord. Origen 42,5280 2,580 16,484 0,000

Q2 6,4674 2,846 2,273 0,035

Q3 15,2781 2,857 5,347 0,000

Q4 64,5555 2,876 22,447 0,000

t 0,7576 0,147 5,151 0,000

R^2 = 0,97373

Tabla 4.III.- Resultados del modelo definitivo

 © Los autores, 2001; © Edicions UPC, 2001.

Page 41: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 41/154

Modelización con variables categóricas p45

Los gráficos de residuos y probabilístico Normal se presentan en la figura 4.1, y nopresentan ninguna peculiaridad especial.

En consecuencia queda validado el modelo obtenido.

Res

4 7 

Res

0 4 8 

t%P

0  

Res

Fig. 4.1.- Gráficos de los residuos del modelo

Como resumen de todo lo anterior, el modelo que explica el comportamiento de la serie, yque va a ser utilizado para hacer previsiones de las ventas futuras, ha resultado ser

t 2 3 4Y 42,5280 0,7576 t 6,4674Q 15,2781Q 64,5555Q= + + + +#

La interpretación de los coeficientes del modelo permite identificar tendencia yestacionalidad.

En cuanto a la primera, se detecta un incremento de las ventas de 0,7576 unidades cadaunidad de tiempo (trimestre); incremento que se mantiene constante sea cual sea laestación.

En consecuencia, la estacionalidad sólo afecta a la ordenada en el origen de cada una delas cuatro estaciones (trimestres) que componen el período.

Tomando como referencia el primer trimestre, en el que Q2

= Q3

= Q4

= 0, se observa que enél las ventas dependen del tiempo, según la ecuación

tY# = 42,5280 + 0,7576 t con t = 1 + 4$

 © Los autores, 2001; © Edicions UPC, 2001.

Page 42: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 42/154

p46 Series temporales

Para un tiempo correspondiente a un segundo trimestre, las variables categóricas toman losvalores Q

2= 1 y Q

3= Q

4= 0 y el modelo es

tY# = 42,5280 + 0,7576 t + 6,4674 = 48,9954 + 0,7576 t con t = 2 + 4$

Para un tiempo de tercer trimestre, las variables categóricas toman los valores Q3= 1 y Q

2=

Q4= 0 y el modelo es

tY# = 42,5280 + 0,7576 t + 15,2781 = 57,8061 + 0,7576 t con t = 3 + 4$

Y, en el caso del cuarto trimestre, las variables categóricas toman los valores Q4

= 1 yQ

2= Q

3= 0; el modelo es

tY# = 42,5280 + 0,7576 t + 64,5555 = 107,0835 + 0,7576 t con t = 4 + 4$

Así, para cada trimestre (estación del período), se obtiene un modelo del mismo tipo,rectilíneo con igual pendiente, en este caso, pero con distinta ordenada en el origen.

Esto se puede interpretar como que, tomando siempre como referencia el primer trimestre,en el segundo el volumen de ventas añade a la función del tiempo 6,4674 unidades, en eltercero el incremento es de 15,2782 y en el cuarto de 64,5555 unidades. Estos valores son,evidentemente, los coeficientes de las variables categóricas.

En consecuencia los coeficientes de las variables categóricas representan la cantidad en

que una estación, sistemáticamente, supera (o no alcanza, según sea el signo) el valor de laprimera estación del período. Es decir, estos coeficientes son una forma de medir elcomponente estacional.

Para evaluar la bondad del modelo, en la figura 4.2 se muestra la comparación de losvalores medidos con los estimados a partir del modelo ajustado; se observa la buenaconcordancia entre ambos.

La modelización tiene como objetivo principal el poder hacer previsiones para un futuropróximo. En este caso se procede a calcular las previsiones para los próximos 2 años, abase de sustituir los valores del tiempo y de las variables categóricas en el modelo obtenido.Los resultados se muestran en la tabla 4.IV y en la figura 4.3.

40

70

100

130

0 4 8 12 16 20 24 t

Y

Fig. 4.2.- Datos reales ( • ) y modelo ajustado (    )

 © Los autores, 2001; © Edicions UPC, 2001.

Page 43: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 43/154

Modelización con variables categóricas p47

Aquí se detecta la coherencia de la previsión con los datos históricos, siempre que nocambie el modelo de comportamiento de la serie en el período previsto. Esto podría ocurrir,

por ejemplo, si hubiese una recesión económica, la apertura de otro comercio de similarescaracterísticas en las inmediaciones, un cambio de hábitos en la población, una campañapropagandística con éxito de la competencia, etc.

t 2 3 4Y 42,5280 0,7576 t 6,4674Q 15,2781Q 64,5555Q= + + + +#

Año t Q2

Q3

Q4 tY#

1996 25

26

27

28

0

1

0

0

0

0

1

0

0

0

0

1

61,4680

68,6930

78,2613

128,2963

1997 29

30

31

32

0

1

0

0

0

0

1

0

0

0

0

1

64,4984

71,7234

81,2917

131,3267

Tabla 4.IV.- Previsiones para 1996 y 1997

Y

40

90

140

0 4 8 12 16 20 24 28 32 t

1990 1995 1996 1997  ←  datos  →← previsiones →

Fig. 4.3.- Datos, modelo y previsiones para los dos años siguientes

 © Los autores, 2001; © Edicions UPC, 2001.

Page 44: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 44/154

p48 Series temporales

4.1 Comparación del método de descomposición con el de variables categóricas

Se han expuesto dos métodos para la descomposición de la serie y ambos se han aplicadoa un caso de modelo aditivo puro, es decir, en el que la estacionalidad no afecta a lapendiente de la recta de tendencia. El de variables categóricas es más simple en cuanto amanipulación y cálculos, aunque, si el período tiene muchas componentes, adquiere mayoraparatosidad por el número de variables categóricas que se manejan. El clásico, queidentifica los componentes del modelo por medio del uso de medias móviles, conduce aresultados similares, en un caso en que se insiste que es aditivo puro; en casos másgenerales la descomposición clásica no sería capaz de conseguir un buen modelo.

La comparación de ambos, sobre el ejemplo desarrollado, se presenta en las figuras 4.4 y

4.5. La primera compara los resultados de los dos modelos dentro del período de recogidade información; la segunda confronta los valores de los residuos obtenidos mediante los dossistemas. Ambos gráficos confirman la gran concordancia de los resultados.

En las tablas 3.IX y 4.IV se han presentado las previsiones de ventas del material deportivopara los ocho trimestres siguientes a la recogida de información, es decir, para los años1996 y 1997, siempre bajo el supuesto que el comportamiento de la serie no va a cambiaren este período de tiempo. La figura 4.6 da idea de la casi coincidencia de las previsionespara las dos formas de análisis estudiadas.

40

70

100

130

0 4 8 12 16 20 24 t

   V  a   l  o  r  e  s  m  o   d  e   l   i  z  a   d  o  s

Fig. 4.4.- Modelo según la descomposición clásica ( • ) y las variables categóricas (» )

 © Los autores, 2001; © Edicions UPC, 2001.

Page 45: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 45/154

Modelización con variables categóricas p49

-10

-5

0

5

10

15

-10 -5 0 5 10 15R(descomp. clásica)

   R   (  c  a   t  e  g   ó  r   i  c  a  s   )

Fig. 4.5.- Residuos de la descomposición frente a los del modelo en variables categóricas

Ya que el objetivo del sistema clásico es descomponer la serie como un modelo aditivo, omultiplicativo si fuese el caso, de tendencia, estacionalidad, ciclos y residuos, es necesarioidentificar cada componente.

40

65

90

115

140

24 28 32t

      P     r     e     v      i     s      i     o     n     e     s

Fig. 4.6.- Previsiones para los dos años siguientes según la descomposición clásica ( • )y las variables categóricas ( » )

Refiriéndonos sólo a tendencia y estacionalidad, y considerando el modelo puramenteaditivo, como es el caso de los datos de las ventas de material deportivo, se tratará de pasardel modelo en variables categóricas

q pi

t 0 i  j ji = 1 j = 2

= + +QtY ∑ ∑ β α α 

 © L o s a u t o r e s , 2 0 0 1 ; © E d i c i o n s U P C , 2 0 0 1 .

Page 46: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 46/154

p50 Series temporales

a otro con sus componentes aisladas. Considerando el modelo aditivo, y suponiendo que losciclos, caso de existir, no sean identificables con los datos disponibles, tendremos

Yt=T

t+ E

t

En este caso, después de estabilizar la serie, se habrá modelizado la tendencia como

qi

t 0 ii 1

T = a t=

+ ∑α 

Debido a que es posible tener dos contadores del tiempo, uno asociado al momento de tomade datos y otro que identifica la estación a la que pertenece el dato, cualquier instante t

puede escribirse como t = s + k p = s + p$ , con k = 0, 1, 2, y s = 1, 2,..., p, es decir, t

es un múltiplo del período, p, más el indicador de la estación, s. Así, resulta

qi

t t t 0 i si 1

Y = T E a t E=

+ = + +∑α 

dondep

s

s = 1

= 0E∑ ya que se ha definido cada componente estacional como la diferencia

respecto a la media del período.

Se asume que, en caso de modelo aditivo puro, los coeficientes asociados a las potenciasdel tiempo deben ser los mismos, sea cual sea el procedimiento empleado para su estudio;en consecuencia, las posibles discrepancias entre los valores estimados por ambos

métodos serán muy pequeñas.

Desarrollando las ecuaciones del modelo clásico y del de variables categóricas para s = 1,. .. , p, igualándolas para cada s se obtiene

q qi i

t 1 p 0 i 0 i 1i 1 i 1

q qi i

t 2 p 0 i 2 0 i 2i 1 i 1

q qi it p p 0 i p 0 i p

i 1 i 1

Y t a t E

Y t a t E

Y t a t E

= +

= =

= +

= =

= +

= =

= + = + +

= + + = + +

= + + = + +

∑ ∑

∑ ∑

∑ ∑

$

$

$

A

α α α 

α α β α  

α α β α  

y sumando miembro a miembro, resultap

 jp j = 2

0 0 0 0 j j = 2

 

p + = p a a = +p

∑∑

β 

α α β 

de donde se deduce la expresión que da directamente la tendencia global, T, en función delos parámetros estimados en el modelo de variables categóricas:

 © Los autores, 2001; © Edicions UPC, 2001.

Page 47: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 47/154

Modelización con variables categóricas p51

p

 j q j = 2 i

t 0 ii 1

 

T + + tp ==

β 

α α 

Para cualquier estación, s, componente del período p, el modelo en variables categóricaspuede escribirse como

qi

t 0 i si 1

Y + t=

= +∑α α β  s = 1, …, p t = s + p$

Al ser la estacionalidad s t s p t s pE Y T= + = += −$ $

, restando las dos últimas expresiones de Yty

Ttresulta

p

 j j 2

s s

 E =

p

=− ∑β 

β 

Para el caso del ejemplo del material deportivo, p = 4, con variables categóricas se obtuvo elmodelo

t 2 3 4Y 42,5280 0,7576 t 6,4674Q 15,2781Q 64,5555Q= + + + +#

del cual resulta

4

 j j = 2

 

= 21,57525

4

∑ β 

. A partir de este modelo la ecuación pura de la tendencia,

o esqueleto de la serie, esp

 j q j = 2 i

t 0 ii 1

 

T + + tp =

=

∑∑

β 

α α  = 42,5280 + 21,57525 + 0,7576 t = 64,10325 + 0,7576 t

Cuando, a partir de la estabilización por medias móviles, se estimó el modelo de tendencia(sistema clásico), el resultado fue

Tt= 63,0065 + 0,8311 t

Es evidente que ambos resultados, procedentes de técnicas de modelización distintas, sonmuy parecidos; su similitud ya ha quedado puesta de manifiesto en las comparacionesgráficas de modelos , residuos y previsiones de las figuras 4.4, 4.5 y 4.6.

En cuanto a los valores de la estacionalidad, referidos a la media general, es decir, segúnlos define el modelo clásico, se obtiene

E1

= 0 – 21,57525 = –21,57525

E2

= 6,46475 – 21,57525 = –15,10785

E3

= 15,2781 – 21,57525 = – 6,29715

E4

= 64,5555 – 21,57525 = 42,98025

 © Los autores, 2001; © Edicions UPC, 2001.

Page 48: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 48/154

p52 Series temporales

Se comprueba que4

s

s = 1

= 0E∑ .

Estos valores, como era de esperar, son muy similares a los obtenidos por ladescomposición clásica (capítulo 3), que resultaron ser −20,6426; −15,5836; −6,5264 y

42,7526, respectivamente.

Como resumen, se puede reiterar la gran similitud de valores de los coeficientes del modelode tendencia y de los índices estacionales obtenidos por los dos métodos desarrollados.

Esta concordancia es buena para un caso como el que se acaba de estudiar, que se podríaetiquetar como modelo aditivo puro. Si se hubiera dado la circunstancia de una serie dondela estacionalidad hubiese afectado a la tendencia de distinta forma en cada componente del

período, es decir, variando ya la pendiente, ya la ordenada en el origen, la descomposiciónclásica no hubiese conseguido modelizarla correctamente.

Es por todo ello que se puede afirmar que la modelización global con variables categóricases un procedimiento mucho más general para el estudio del comportamiento de una serietemporal y la realización de previsiones.

4.2 Caso usuarios de un teléfono

En la tabla 4.5 se exponen unos datos cronológicos correspondientes al número de usuariosde un teléfono de atención al cliente de lunes a viernes, recogidos durante las 12 primeras

semanas de puesta en marcha del servicio.

t Y t Y t Y t Y

1 99,30 16 117,66 31 127,52 46 149,66

2 65,27 17 52,67 32 30,42 47 34,13

3 48,27 18 63,96 33 92,71 48 118,31

4 20,58 19 40,85 34 60,22 49 64,06

5 75,17 20 76,12 35 88,61 50 106,09

6 104,76 21 116,48 36 136,60 51 150,28

7 58,96 22 52,86 37 32,16 52 25,74

8 67,18 23 79,80 38 104,76 53 114,62

9 28,44 24 44,25 39 60,62 54 74,64

10 83,71 25 88,39 40 93,53 55 106,34

11 121,13 26 125,34 41 142,92 56 149,02

12 51,52 27 46,45 42 33,34 57 29,06

13 64,30 28 80,05 43 103,53 58 121,42

14 25,60 29 50,67 44 68,86 59 76,33

15 76,50 30 94,03 45 92,50 60 114,29

Tabla 4.V.- Usuarios del teléfono de atención al cliente

 © Los autores, 2001; © Edicions UPC, 2001.

Page 49: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 49/154

Modelización con variables categóricas p53

En la figura 4.7 se muestra la evolución de la demanda de utilización de este servicio, y seobserva que la simplicidad del método clásico de considerar la serie aditiva o multiplicativa,

no está nada clara pues el patrón estacional ni se mantiene constante ni se amplificasistemáticamente.

Es natural que, de haber estacionalidad, ésta sea de período 5, correspondiente a posiblesdiferencias de utilización de dicho servicio en los distintos días de la semana. La observacióndel gráfico confirma esta estacionalidad. En cuanto a la tendencia, tampoco se ve muy claro sila hay; si se observan los datos del primer día de cada semana (lunes) parece que haya uncrecimiento sostenido de la demanda, mientras que viendo el comportamiento de los martes(tabla 4.V) la tendencia es a una disminución. Si sólo se dispusiese del método clásico dedescomposición de la serie sería difícil analizar esta situación, ya que la tendencia general, allídefinida como esqueleto de la serie, parece mantenerse más o menos constante.

0

40

80

120

160

0 20 40 60 t

Y

Fig. 4.7.- Evolución cronológica de la demanda

Aplicando la sistemática de análisis de variables categóricas, corresponde definir 4variables, Q

2, Q

3, Q

4y Q

5, que identificarán cada uno de los cinco días de la semana. En la

tabla 4.VI, se muestra un fragmento de los valores de dichas variables asociados a los datosdisponibles.

t Y Q2 Q3 Q4 Q5

1 99,3 0 0 0 0

2 65,27 1 0 0 0

3 48,27 0 1 0 0

4 20,58 0 0 1 0

5 75,17 0 0 0 1

6 104,76 0 0 0 0

7 58,96 1 0 0 0

8 67,18 0 1 0 0

9 28,44 0 0 1 0

10 83,71 0 0 0 1

11 121,13 0 0 0 0

12 51,52 1 0 0 0

... ... ... ... ... ...

Tabla 4. VI.- Variables categóricas

 © Los autores, 2001; © Edicions UPC, 2001.

Page 50: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 50/154

p54 Series temporales

El modelo inicial que debe plantearse es del tipo

0 1 2 2 3 3 4 4 5 5 2 2 3 3 4 4 5 5Y t Q Q Q Q Q t Q t Q t Q t= + + + + + + + + + +α α β β β β γ γ γ γ ε  

y los resultados de la estimación mínimo-cuadrática de los coeficientes se muestran en latabla 4.VII. De ella se deduce que el término t=Q

4no es significativo (p-val > 0,05) y puede

ser eliminado del modelo. Al recalcular el nuevo modelo se obtienen los resultadosmostrados en la tabla 4.VIII.

nu S.C. C.M. F p-valRegresión 9 73631,982 8181,331 355,132 0,000Residuos 50 1151,873 23,037Total 59 74783,855

Coef. Error típico t p-valOrd. Origen 101,580 2,675 37,978 0,000Q2 -38,364 3,832 -10,012 0,000Q3 -53,757 3,882 -13,849 0,000Q4 -83,296 3,933 -21,179 0,000Q5 -31,512 3,985 -7,908 0,000t 0,941 0,080 11,718 0,000t*Q2 -1,636 0,114 -14,408 0,000t*Q3 0,385 0,114 3,387 0,001t*Q4 0,106 0,114 0,935 0,354t*Q5 -0,288 0,114 -2,539 0,014

R^2 = 0,9846

Tabla 4.VII.- Resultados del modelo lineal inicial

nu S.C. C.M. F p-valRegresión 8 73611,831 9201,479 400,398 0,000Residuos 51 1172,023 22,981Total 59 74783,855

Coef. Error típico t p-valOrd. Origen 100,067 2,127 47,038 0,000Q2 -36,851 3,469 -10,622 0,000Q3 -52,244 3,524 -14,824 0,000Q4 -80,110 1,964 -40,780 0,000Q5 -29,999 3,637 -8,247 0,000t 0,994 0,057 17,529 0,000t*Q2 -1,689 0,098 -17,198 0,000t*Q3 0,331 0,098 3,376 0,001t*Q5 -0,341 0,098 -3,476 0,001

R^2 = 0,9843

Tabla 4.VIII.- Resultados del modelo lineal definitivo

 © Los autores, 2001; © Edicions UPC, 2001.

Page 51: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 51/154

Modelización con variables categóricas p55

El modelo que explica el comportamiento de la serie presenta un elevado grado de ajuste(R

2= 98,43%) y, según los coeficientes de la tabla 4.VIII, toma la expresión

tY# = 100,07 − 36,85 Q2 − 52,24 Q

3 − 80,11 Q

4 − 30 Q

5

+ 0,99 t − 1,69 t Q2

+ 0,33 t Q3 − 0,34 t Q

5

La figura 4.8 presenta el modelo ajustado junto a los datos, y la figura 4.9 los residuos delmodelo. Se observa que la mayoría de los valores están en el intervalo ± 4 unidades, y sólo

en algún caso la discrepancias alcanza 10 unidades; ello confirma el buen ajuste.

Y

0

40

80

120

160

200

0 20 40 60 t

Fig. 4.8.- Datos experimentales ( • ) y modelo ajustado (    )

-12

-8

-4

0

4

8

12

0 20 40 60 t

R

Fig. 4.9.- Residuos del modelo: R = Y −  Y#

La interpretación del modelo obtenido, se puede hacer determinando la ecuación de

previsión asociada a cada uno de los días de la semana, es decir, a cada componente de laestación. A título de ejemplo, los modelos para el lunes y el viernes son:

 © Los autores, 2001; © Edicions UPC, 2001.

Page 52: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 52/154

p56 Series temporales

Lunes: s = 1 Q2

= Q3= Q

4= Q

5= 0 Y# = 100,07 + 0,99 t con t = 5$ +1

Viernes: s = 5 Q2

= Q3= Q

4= 0 Q

5= 1 Y# = 70,07 + 0,65 t con t = 5$ +5

En la figura 4.10, se puede observar cada una de las cinco rectas que componen el modelo,sobre el fondo de los datos experimentales. Cada recta, a la derecha del gráfico, lleva elindicador estacional que le corresponde (lunes: s =1; martes: s = 2…). De la ecuación delmodelo general y del estudio de este gráfico se puede concluir que el lunes y el juevestienen la misma tendencia (las rectas 1 y 4 son paralelas); sin embargo el lunes tiene,sistemáticamente, un mayor número de usuarios que el jueves. Esta discrepancia constantees la diferencia de ordenadas de ambas rectas, o sea el coeficiente de Q

4, que en este caso

es igual a −80,11. La tendencia común indica un aumento sostenido de usuarios que se

evalúa en un incremento de 0,99 usuarios al día (coeficiente de t en las rectas 1 y 4).

0

40

80

120

160

0 20 40 60

Y 1

3

5

4

2

t

Fig. 4.10.- Modelos asociados a cada día de la semana

En cuanto a los miércoles y viernes (rectas 3 y 5), se puede decir que tienen uncomportamiento similar. En los primeros días había algo más de usuarios el viernes que elmiércoles; sin embargo, dicho número ha aumentado en ambos, pero con mayor velocidadel miércoles, de forma que actualmente éste ya supera al viernes.

Especial atención merece el martes (recta 2), ya que inicialmente tenía un número deusuarios situado más o menos en el promedio de los otros días, pero ha sufrido undecrecimiento progresivo que actualmente lo sitúa en un valor muy inferior a los demás díasde la semana, los cuales, en mayor o menor grado, han presentado un incremento dedemanda del servicio.

Está claro que, en la práctica, una situación como ésta requeriría de un estudio enprofundidad de las causas que han conducido a esta situación: quizás la persona queatiende la línea no es la misma, o hay mayores dificultades para establecer comunicación yel público deja de llamar los martes,...

La obtención del modelo tiene como principal objetivo el poder hacer previsiones delcomportamiento de la demanda del servicio durante los próximos días, a fin de programar un

 © Los autores, 2001; © Edicions UPC, 2001.

Page 53: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 53/154

Modelización con variables categóricas p57

aumento del número de líneas telefónicas, del número de personas que atienden a losusuarios, plantearse una redistribución en el tiempo, etc.

La tabla 4.IX muestra las previsiones para las dos semanas próximas, junto a los valores deltiempo y de las variables categóricas, necesarios para ser sustituidos en el modelo general.

t Q2 Q3 Q4 Q5 Y prevista

61 0 0 0 0 160,686

62 1 0 0 0 20,129

63 0 1 0 0 131,312

64 0 0 1 0 83,557

65 0 0 0 1 112,478

66 0 0 0 0 165,655

67 1 0 0 0 16,654

68 0 1 0 0 137,938

69 0 0 1 0 88,526

70 0 0 0 1 115,741

Tabla 4.IX.- Previsiones para dos semanas

En la figura 4.11 se pueden observar los valores de las previsiones como extrapolación delmodelo ajustado sobre los datos disponibles, constatándose la gran disminución del númerode usuarios del martes.

0

30

60

90

120

150

180

0 10 20 30 40 50 60 70 t

Y

Fig. 4.11. - Datos ( • ), modelo ( --- ) y previsiones (1)

Dichas previsiones serán válidas siempre que se mantenga el modelo de comportamientoque han puesto de manifiesto los datos disponibles. Es evidente que si se encontrase lacausa de la disminución de llamadas producida en los martes, y se corrigiese, sería

necesario llevar a cabo una nueva recogida de información para elaborar los modeloscorrespondientes y hacer previsiones en la nueva situación.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 54: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 54/154

p58 Series temporales

5 AUTOCORRELACIÓN

En este capítulo se presenta una herramienta de análisis, el correlograma, o representacióngráfica de la función de autocorrelación, que tiene una doble utilidad. Por una parte, puedeservir para confirmar la presencia de estacionalidad y determinar su período; por otra, indicacuántas previsiones son admisibles, a partir del último tiempo de recogida de información.

El concepto de autocorrelación es bien simple; supongamos que se dispone de la seriecronológica Y

1, Y

2,... , Y

1+k,... , Y

N, y se desplaza dicha serie k unidades de tiempo; se

pueden formar las parejas (Y1; Y

1+k), (Y

2; Y

2+k), (Y

3; Y

3+k),..., (Y

N–k; Y

N).

El coeficiente de correlación entre ambas series, es decir, de las parejas citadas, se denotapor ρ

ky recibe el nombre de coeficiente de autocorrelación de orden k; el desplazamiento k

también se denomina retardo, y representando gráficamente ρk

en función del retardo k, se

obtiene el autocorrelograma de la serie. De la estructura del planteamiento se deduce queρ

k=ρ−k

.

5.1 Correlograma

Un valor no nulo de ρk

indica que existe correlación entre informaciones separadas k

unidades de tiempo, es decir, la historia se transmite k unidades de tiempo más allá. Enconsecuencia, si el último valor del tiempo del que se dispone de datos es el T, seráadmisible hacer previsiones para un tiempo igual a T+k. Evidentemente, si ρ

kfuese nulo,

sería inadmisible una predicción para T+k, ya que los datos disponibles no transmiten

ninguna información relevante a una distancia como la considerada.

Sea que se dispone de una serie cronológica de datos y1, y

2,..., y

t,..., y

N, para elaborar el

correlograma o gráfico de la función de autocorrelación. Se estiman las siguientescaracterísticas:

  Media:

N

ii 1

y

m yN

== =∑

  Autocovariancia:

N k

i i ki 1

k

(y y) (y y)

ˆN

+=

− −

= ∑γ   k = 0, 1,..., N–1

  Autocorrelación: kk k

0

ˆˆ r

ˆ= =

γ  ρ 

γ  

Para poder estimar la autocovariancia, γ k, el número de componentes de la serie debe ser tal

que N > k+1, y es recomendable N ≥ 50 y k ≤ N/4.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 55: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 55/154

 Autocorrelación p59

Para identificar los coeficientes de autocorrelación que sean significativamente distintos decero, es necesario estudiar el comportamiento estadístico de los estimadores. Bartlett ha

estudiado el estadístico rk y, bajo el supuesto de que ρk = 0 para todo k ≥ K, obtiene que

K 12

k i(K 1)

1V(r )

N

− −

≅ ∑ ρ ∀ k ≥ K

al sustituir ρipor su estimador, r

i, y, dado que ρ

0= 1 y ρ

i= ρ−i

, resulta que la estimación de la

variancia de rkes igual a

kK 12

k i K 12(K 1)

k i

1

1V(r ) k K K 1

N1V(r ) r1N

V(r ) 1 2 r k K K 1N

−− −

≅ ≥ =≅ ⇒   ≅ + ≥ >    

∑∑

Anderson indica que para valores de k tales que ρk

= 0 y N suficientemente grande, rk

se

distribuye aproximadamente N(0; V(rk)). De esta forma, con una probabilidad del orden del

95%, si ρk

= 0, su estimador rk

se encontrará en el intervalo ± 2 S(rk), donde S(r

k) representa

la desviación tipo estimada de rk, es decir, k k

ˆS(r ) V(r )= .

El intervalo ± 2 S(rk) se denomina intervalo de no significación de ρk, y es el conjunto devalores que puede tomar r

kpara que, con un riesgo del 5%, se pueda admitir la ausencia de

correlación entre valores de la serie, desplazados k unidades de tiempo. Por todo ello, alcalcular la función de autocorrelación de una serie, es bueno representarla gráficamente junto al intervalo ± 2 S(r

k), con objeto de considerar únicamente como coeficientes de

autocorrelación no nulos aquellos cuya estimación esté fuera del citado intervalo.

Las autocorrelaciones suelen disponerse matricialmente, lo que da lugar a la matriz deautocorrelaciones P

N, simétrica, definida positiva, cuya estructura es

1 2 N - 1

1 1 N - 2

N 2 1 N - 3

N - 1 N - 2 N - 3

1 . . . . .1 . . . . .

1 . . . . .=P

. . . . . . . . . . . . . . . . .

. . . . . 1

               

ρ ρ ρρ ρ ρρ ρ ρ

ρ ρ ρ

Como aplicación se va a analizar la serie cronológica de la tabla 5.I, que corresponde alvalor de los stocks  en I.C.I. (Serie D* de Time Series Analysis and Forecasting , O.D.Anderson, ed. Butterworths, 1977). Su evolución se muestra en la figura 5.1.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 56: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 56/154

p60 Series temporales

t Y t Y t Y t Y t Y t Y

1 304 19 278 37 282 55 273 73 291 91 282

2 303 20 277 38 283 56 272 74 288 92 286

3 307 21 279 39 279 57 273 75 288 93 286

4 299 22 278 40 280 58 271 76 290 94 287

5 296 23 270 41 280 59 272 77 293 95 284

6 293 24 268 42 279 60 271 78 288 96 283

7 301 25 272 43 278 61 273 79 289 97 286

8 293 26 273 44 283 62 277 80 291 98 282

9 301 27 279 45 278 63 274 81 293 99 287

10 295 28 279 46 270 64 274 82 293 100 286

11 284 29 280 47 275 65 272 83 290 101 28712 286 30 275 48 273 66 280 84 288 102 292

13 286 31 271 49 273 67 282 85 287 103 292

14 287 32 277 50 272 68 292 86 289 104 294

15 284 33 278 51 275 69 295 87 292 105 291

16 282 34 279 52 273 70 295 88 288 106 288

17 278 35 283 53 273 71 294 89 288 107 289

18 281 36 284 54 272 72 290 90 285

Tabla 5.I.- Valor de los stocks en I.C.I

260

270

280

290

300

310

0 40 80 120 t

Y

Fig. 5.1.- Evolución de la serie de la tabla 5.I

En la tabla 5.II se presenta el detalle del cálculo de las autocorrelaciones para los casos dek =1 y k = 2, de los valores de la tabla 5.I. En primer lugar es necesario calcular la media detodos los datos

1

m = y = ( 304 + . . . + 295 ) = 299,210

 © Los autores, 2001; © Edicions UPC, 2001.

Page 57: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 57/154

 Autocorrelación p61

t 1 2 3 4 5 ... 105 106 107

y 304 303 307 299 296 291 288 289k = 0y - y 20,44 19,44 23,44 15,44 12,44 ... 7,44 4,44 5,44

y 304 303 307 299 ... 294 291 288k = 1

y - y 20,44 19,44 23,44 15,44 ... 10,44 7,44 4,44

y 304 303 307 ... 292 294 291k = 2

y - y 20,44 19,44 23,44 ... 8,44 10,44 7,44

Tabla 5.II.- Detalle del cálculo de las autocorrelaciones de la tabla 5.I

Las estimaciones se obtienen como

2 21072

0 i1

1 20,44 ... 5,44ˆ = ( - y = 74,695y )

107 107

+ +=∑γ  

107

1 i i - 1

2

1 19,44 20,44 ... 5,44 4,44ˆ = ( - y ) ( - y ) 66,123y y

107 107

× + + ×= =∑γ  

11 1

0

ˆ 66,123ˆr 0,885

ˆ 74,695= = = =

γ  ρ 

γ  

107

2 i i - 23

1 23,44 20,44 ... 5,44 7,44ˆ = ( - y ) ( - y ) 59,775y y

107 107

× + + ×= =∑γ  

22 2

0

ˆ 59,775ˆr 0,800ˆ 74,695

= = = =γ  ρ γ  

etc.

Según Bartlett las desviaciones tipo estimadas para r1

y r2

son:

1

1 1S(r ) 0,097

N 107= = =

( )2

2

2 1

1 1 2 0,885S(r ) 1 2 r 0,155

N 107

+ ×= + = =

etc.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 58: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 58/154

p62 Series temporales

Y los intervalos ± 2 S(rk) son, respectivamente, ± 0,194 y ± 0,310 para k=1 y k=2. En

consecuencia, con un riesgo del 5%, ρ1y ρ

2pueden ser significativamente distintos de cero.

Analizando los 107 valores de la serie completa para k = 1, 2,..., 10, se obtienen los valoresmostrados en la tabla 5.III y presentados en la figura 5.2. De estos resultados, se verificaque a partir de k = 7 ya se puede considerar ρ

kcomo nulo, es decir, no es admisible hacer

previsiones separadas en más de 7 unidades de tiempo del último momento de recogida dedatos.

k 1 2 3 4 5 6 7 8 9 10

rk

0,89 0,80 0,70 0,63 0,58 0,55 0,48 0,40 0,31 0,23

S(rk) 0,10 0,15 0,19 0,21 0,23 0,24 0,25 0,26 0,27 0,27

Tabla 5.III.- Valores de las autocorrelaciones y sus desviaciones tipo

-1

-0,5

0

0,5

1

k

rk

Fig. 5.2.- Correlograma

Con los valores de la tabla 5.III, se puede escribir la matriz de autocorrelaciones que, para k=3, adquiere la siguiente forma:

3

1 0,885 0,800 0,699

0,885 1 0,885 0,800ˆ =P

0,800 0,885 1 0,885

0,699 0,800 0,885 1

           

 

 © L o s a u t o r e s ,

Page 59: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 59/154

 Autocorrelación p63

5.2 Interpretacion de los correlogramas

En la figura 5.3 se muestran los correlogramas de las series analizadas hasta ahora.

El primero, que corresponde a los datos de la figura 1.2 de la evolución del índice IBEX35,muestra que sólo son significativos los tres primeros coeficientes de autocorrelación; portanto, las previsiones dejan de ser válidas a partir de tres unidades de tiempo después delúltimo dato. Es decir, lo que ocurra en un instante se transmite hasta tres unidades detiempo más adelante.

El segundo, de los datos de la tabla 3.I y de la figura 3.1 sobre las ventas trimestrales dematerial deportivo, confirma la estacionalidad de período cuatro, ya que cada cuatro barrasde autocorrelación se repite la misma estructura de comportamiento. En este caso esposible hacer previsiones a cuatro trimestres vista, ya que para k = 4 el coeficiente deautocorrelación es significativamente distinto de cero, aunque no lo sean los de k = 1, 2 y 3.Este hecho se puede interpretar como que la información de un trimestre se transmitedirectamente hasta una distancia temporal de cuatro trimestres, sin que afecte elcomportamiento de los tres trimestres intermedios. Así, por ejemplo, una vez conocidas lasventas de invierno, se puede hacer la previsión para el invierno próximo puesto que lo queocurra en primavera, verano y otoño no afectará al invierno siguiente.

El tercero y el cuarto corresponden, respectivamente, a las temperaturas medias mensuales(tabla 3.X y figura 3.6), y a los usuarios mensuales de un transporte público (tabla 3.XIV yfigura 3.12). En ambos casos se confirma la estacionalidad de período 12, y se puedenhacer previsiones a 18 meses para la temperatura, y a 13 para los usuarios. A diferencia delsegundo caso, en el último la información de un mes afecta directamente al resto de mesesdel mismo grupo de 12; es decir, si bien es cierto que se puede predecir el número deusuarios para dentro de un año, lo que ocurra en los meses venideros puede afectar estaprevisión; por tanto interesa incorporar los datos disponibles lo más rápidamente posible almodelo, para una mayor fiabilidad de las previsiones.

El último de los correlogramas es el de los usuarios de un teléfono de atención al cliente,(tabla 4.V y figura 4.7). Además de confirmar la estacionalidad de período 5, pone demanifiesto que es aceptable hacer previsiones para los próximos 10 días, es decir, a dossemanas vista.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 60: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 60/154

p64 Series temporales

IBEX DEPORTE

-1

-0,5

0

0,5

1

k

rk

-1,0

-0,5

0,0

0,5

1,0

k

rk

TEMPERATURAS USUARIOS TRANSPORTE

-1

-0,5

0

0,5

1

k

rk

-1,0

-0,5

0,0

0,5

1,0

k

rk

USUARIOS TELÉFONO

-1

-0,5

0

0,5

1

k

rk

Fig. 5.3.- Correlogramas

 © Los autores, 2001; © Edicions UPC, 2001.

Page 61: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 61/154

Otras técnicas de previsión: ponderación exponencial p65

6 OTRAS TÉCNICAS DE PREVISIÓN: PONDERACIÓN EXPONENCIAL

Cuando la serie presenta componente estacional y tendencia que se mantienen de formasostenida a lo largo de todo el período de recogida de datos, se han expuesto dos formas demodelizarla y poder hacer previsiones: la descomposición clásica y las variablescategóricas.

Sin embargo, son frecuentes las situaciones en que la tendencia, caso de existir, puede serdifícil modelizarla a través de un simple modelo polinómico de menor o mayor grado. Podríaentonces pensarse en un modelo de evolución que cambiase a lo largo del tiempo; en estoscasos las técnicas asociadas a la metodología de la ponderación exponencial son útiles parahacer previsiones sobre la evolución futura.

6.1 Suavizado exponencial

La ponderación exponencial, o suavizado exponencial, es otra técnica destinada también aestabilizar la serie, eliminando en lo posible la influencia del componente aleatorio. Para ello

se construye una nueva serie, la serie suavizada tS , a partir de los datos iniciales, tY , de

manera que

t t t 1S Y ( 1 ) S−

= + −λ λ  con 0 < λ < 1

Para que la serie suavizada quede definida, es necesario concretar los valores de S0, que

generalmente se considera igual a Y1, y el del coeficiente de ponderación λ. En la selección

del valor de λ se pueden emplear distintos criterios de minimización de errores, que se

expondrán a continuación.

Sustituyendo repetitivamente St-1

, St-2

,... por su expresión de St, se obtiene

2 it t t 1 t 2 t i

t 1 t1 0

S Y (1 )Y (1 ) Y (1 ) Y

(1 ) Y (1 ) S

− − −

= λ +λ − λ +λ − λ + +λ − λ +

+λ − λ +λ − λ

@

@

El valor de Stes la previsión para el tiempo siguiente, es decir, t 1 tY S

+=# .

El análisis de la expresión anterior permite interpretar este tipo de suavizado, de forma queel valor de Y previsto para el período t+1, es decir S

t, se obtenga como promedio ponderado

de los valores reales que ha presentado la serie cronológica desde el inicio de la recogidade información. La discrepancia entre los valores obtenidos y los previstos, Y

t+1  − S

t, es

atribuible en parte al componente aleatorio y, posiblemente, a cambios bruscos en elcomportamiento de la serie.

El coeficiente de ponderación λ juega el siguiente papel: cuanto mayor sea su valor, tanto

más peso se dará a los valores recientes, en detrimento de los antiguos; mientras quevalores de λ próximos a cero dan gran peso a la historia y poca importancia a los valores

próximos.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 62: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 62/154

p66 Series temporales

Así, si la serie se mantiene estable, serán interesantes valores pequeños del coeficiente de

ponderación ya que amortiguarán fuertemente la oscilación aleatoria, mientras que si laserie presentara cambios bruscos, la serie suavizada tardaría mucho en detectarlos si su λ

fuese pequeña, mientras que respondería prontamente a ellos con valores altos delcoeficiente λ.

Analizando la expresión del valor suavizado, para distintos valores de λ, se puede escribir,

por ejemplo,

λ = 0,10 ⇒ Y#5

= S4= 0,10 Y

4+ 0,09 Y

3+ 0,081 Y

2+ 0,729 Y

1

λ = 0,50 ⇒ Y#

5 = S4 = 0,50 Y4 + 0,25 Y3 + 0,125 Y2 + 0,125 Y1

λ = 0,90 ⇒ Y#5

= S4= 0,90 Y

4+ 0,09 Y

3+ 0,009 Y

2+ 0,001 Y

1

Es decir, con un valor del factor de ponderación de 0,10, la previsión para t = 5 estáconstituida por un 10% del valor observado en t = 4, un 9% del de t = 3, un 8,1% del de t = 2y un 72,9 % del de t = 1; o sea, con un valor pequeño de λ, la previsión está constituida

mayoritariamente por el valor más antiguo.

Cuando λ es igual a 0,50, los pesos aplicados a cada valor recogido están más

uniformemente repartidos y, cuandoλ

es grande, por ejemplo 0,90, el mayor componente dela previsión es el último valor observado; los demás tendrán un valor de ponderación tantomás pequeño cuanto más alejados estén en el tiempo.

El suavizado exponencial puede verse como un método alternativo a las medias móviles,con sus ventajas e inconvenientes.

Entre las primeras hay que citar que con la ponderación exponencial no se pierde ningunainformación, al contrario que con las medias móviles, pues cuanto mayor era la longitud delperíodo a promediar, tanta más información se perdía, en el inicio y en el fin de la serie.Además una serie con cambios de tendencia, más o menos bruscos, se puede modelizarpor suavizado exponencial y no podría hacerse ni por descomposición ni por variablescategóricas. Por el contrario, si la serie presenta estacionalidad con las medias móviles,siempre que se escoja correctamente el período, ésta desaparece totalmente y da lugar auna serie estabilizada que permite modelizar directamente la tendencia, hecho que noocurre con la ponderación exponencial simple, que no es capaz de suavizar la oscilacióndebida a la estacionalidad.

Para solucionar este inconveniente, se han desarrollado técnicas basadas en el suavizadoexponencial, que permiten incorporar un modelo de tendencia o bien una componenteestacionaria; éstas son las técnicas de Brown, para el primer caso, o de Winters para elsegundo.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 63: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 63/154

Otras técnicas de previsión: ponderación exponencial p67

6.2 Selección del factor de ponderación

Tal como se ha expuesto, en función del valor de λ, se puede dar mayor o menor peso a la

historia, y detectar con más o menos rapidez cambios bruscos en la serie; es por ello que laselección del valor más adecuado para el factor de ponderación es crucial en el éxito de lamodelización de la serie y la previsión de valores futuros.

Todos los métodos utilizados para esta selección se basan en minimizar alguna función delos errores de ponderación.

Recordando que t t 1Y S−=% , los errores más destacables son:

n Error medio:  promedio de los errores de previsión; atendiendo a que para hacerprevisiones hay que disponer de datos, el primer valor previsto posible será el de t = 2:

n

t t

t=2

( - )SY

M E =n - 1

n  Error cuadrático medio : promedio de los cuadrados de los errores de previsión:

n2

t t

t=2

( - )SY

M S E =n - 1

n  Error absoluto medio : promedio de los valores absolutos de los errores de previsión:

n

t t

t=2

- SY

M A E =n - 1

n  Media del porcentaje del error : promedio de los porcentajes de los errores relativos deprevisión:

n

t t

t=2 t

Y Y 100Y

M P E =n - 1

− ×∑%

n  Media del porcentaje de error absoluto :  promedio de los porcentajes de los valoresabsolutos de los errores de previsión relativos:

nt t

tt=2

-Y Yx 100

YM A P E =n - 1

∑%

Hay que insistir en que en una serie en la que el tiempo es t = 1, 2,..., n, el suavizadoexponencial no ofrece ninguna previsión para t = 1, y, por tanto, no existe error de previsión

 © Los autores, 2001; © Edicions UPC, 2001.

Page 64: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 64/154

p68 Series temporales

en este punto; consecuentemente, en este caso los errores siempre son promedios de n −1

valores.

De los errores expuestos, aquellos que no toman valor absoluto, ME y MPE, tienen pocointerés ya que, a causa de la compensación de valores positivos y negativos, pueden darvalores de los promedios muy próximos a cero aun cuando existan errores de previsión muygrandes. En general, se selecciona aquel valor de λ para el cual los valores del error

absoluto medio y del cuadrático medio, MAE y MSE, alcancen los valores más bajos.

Como ejemplo consideremos los datos de la tabla 6.I, serie cronológica de 50 valores, cuyarepresentación gráfica puede verse en la figura 6.1.

t Yt

t Yt

t Yt

t Yt

t Yt

12345678910

9,95810,09611,5529,113

13,89811,48711,1149,505

17,93412,339

11121314151617181920

16,51012,67417,50413,46216,94518,65318,94215,08416,56820,733

21222324252627282930

26,26720,40118,74820,80021,68327,06923,72824,89026,13224,663

31323334353637383940

25,21724,65328,06227,31726,12229,83728,85427,12930,19434,104

41424344454647484950

28,44835,72630,60231,01131,73231,53832,17535,54335,53437,336

Tabla 6.I.- 50 valores de una serie cronológica

0

10

20

30

40

0 10 20 30 40 50 t

Y

Fig. 6.1.- Evolución cronológica de los datos de la tabla 6.I

 © Los autores, 2001; © Edicions UPC, 2001.

Page 65: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 65/154

Otras técnicas de previsión: ponderación exponencial p69

Observando el gráfico, difícilmente se aprecia una estacionalidad, mientras que es evidenteuna tendencia creciente y casi seguramente lineal. La figura 6.2 es el correlograma de la

serie que pone de manifiesto la ausencia de estacionalidad, junto con una autocorrelaciónsignificativa hasta un retardo de 4 unidades de tiempo.

-1,0

-0,5

0,0

0,5

1,0

k

rk

Fig. 6.2.- Correlograma de la serie de la tabla 6.I

Aplicando la ponderación exponencial a estos datos, en función del valor de λ, los errores

evolucionan según muestra la tabla 6.II.

λλλλ ME MSE MAE MPE MAPE

0,100 4,278 25,408 4,363 17,577 18,494

0,150 3,092 15,628 3,196 12,719 13,812

0,200 2,416 11,731 2,627 9,817 11,622

0,250 1,984 9,904 2,351 7,896 10,632

0,300 1,685 8,975 2,217 6,531 10,214

0,350 1,467 8,496 2,174 5,510 10,157

0,400 1,300 8,270 2,171 4,716 10,271

0,450 1,169 8,200 2,183 4,079 10,449

0,500 1,062 8,233 2,214 3,556 10,696

0,550 0,974 8,341 2,251 3,119 10,960

0,600 0,899 8,507 2,289 2,746 11,233

0,650 0,835 8,722 2,330 2,425 11,508

0,700 0,780 8,981 2,371 2,145 11,786

0,750 0,731 9,283 2,418 1,898 12,082

0,800 0,689 9,628 2,470 1,677 12,396

0,850 0,651 10,019 2,525 1,479 12,723

0,900 0,617 10,461 2,581 1,299 13,052

0,950 0,586 10,961 2,643 1,133 13,406

Tabla 6.II.- Evolución de los errores en función de λ.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 66: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 66/154

p70 Series temporales

Analizando detenidamente la evolución de errores mostrada en la citada tabla, se observaque, tanto el error medio (ME) como la media del porcentaje del error (MPE) disminuyen al

aumentar λ, mientras que los otros errores (MSE, MAE y MAPE) alcanzan el mínimo parael intervalo 0,35 ≤  λ ≤ 0,45. Dado que el error cuadrático medio (MSE) es el que, en

general, presenta mejores propiedades, se va a tener en cuenta para seleccionardefinitivamente el coeficiente de ponderación; así, en el caso del ejemplo, se va a trabajarcon λ = 0,45.

Para entender mejor lo que representa la selección de uno u otro valor de λ, en la figura 6.3

se pueden comparar las evoluciones de las series ponderadas respecto a los datoscronológicos para distintos valores del parámetro de ponderación.

λ=0,10 λ=0,30

0

10

20

30

40

0 10 20 30 40 50 60 t

0

10

20

30

40

0 10 20 30 40 50 60 t

λ=0,45 λ=0,95

0

10

20

30

40

0 10 20 30 40 50 60 t

0

10

20

30

40

0 10 20 30 40 50 60 t

Fig. 6.3.- Serie original (•) y suavizada (       ) para distintas λ.

Directamente se observa que, en este caso, para valores pequeños de λ la serie suavizada

va por detrás de la real, es decir, tarda mucho en responder a la evolución. Sin embargo,cuando λ = 0,95, la suavizada está totalmente ligada a la oscilación aleatoria de la serie, es

decir, la previsión para el tiempo inmediato siguiente es prácticamente igual al último valormedido. Cuando λ = 0,45, valor para el que ha resultado un error cuadrático medio mínimo,

la serie suavizada exponencialmente, sigue más claramente el esqueleto de la seriecronológica y queda amortiguada la oscilación aleatoria.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 67: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 67/154

Otras técnicas de previsión: ponderación exponencial p71

La figura 6.4 muestra los residuos, Rt= Y

t − tY# = Y

t − S

t-1, para tres valores de λ. En ella se

observa que para λ = 0,10 la mayoría de los residuos son positivos, es decir, la previsión va

por detrás del valor real, mientras que para λ = 0,45 están, casi siempre, entre los de λ =0,10 y los de λ = 0,90, es decir, son más próximos a cero, y por tanto, más pequeños.

-6

0

6

12

0 10 20 30 40 50 t

R

Fig. 6.4.- Residuos en función de λ. λ = 0,10 (…◊◊◊◊

…) λ = 0,45 ( −−−−••••−−−−) λ = 0,90 (

…××××…

)

Para el valor del coeficiente de ponderación seleccionado (λ = 0,45), se calculan los valores

de la serie suavizada, (St= 0,45 × Y

t+ 0,55 × S

t-1), las previsiones ( tY# = S

t-1) y los residuos

(Rt=Y

t− tY# ), cuyos valores se muestran parcialmente en la tabla 6.III. En dicha tabla figuran

también los valores previstos para los tiempos 51, 52 y 53, de los que ya no se dispone dedatos.

La previsión para cualquier valor de t = 51, se ha calculado como

5050 4951ˆ = = + ( 1- ) = 0,45 x 37,3364 + 0,55 x 34,4142 = 35,7292S SYY λ λ 

La estimación para cualquier otro valor de t superior a éste, se tendrá que hacer tomandocomo Y

tel valor de la previsión, ya que no se dispone de datos reales. Así

5050 4951ˆ = = + ( 1- ) = 0,45 x 37,3364 + 0,55 x 34,4142 = 35,7292S SYY λ λ 

es decir, con este sistema la previsión es idéntica para cualquier tiempo futuro, tal como seaprecia en las últimas filas de la tabla 6.III. Ello evidencia que la previsión no concuerda conla evolución cronológica presente (figura 6.5), aunque dentro del período estudiado la seriesuavizada sigue de forma muy razonable a los datos disponibles.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 68: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 68/154

p72 Series temporales

t Yt

St tY# R

t

123

……484950

9,95810,09611,552……

35,54335,53437,336

9,95810,02010,709……

33,49834,41435,729

9,95810,020……

31,82533,49834,414

0,1381,532……3,7182,0362,922

515253

35,72935,72935,729

35,72935,72935,729

Tabla XXIII.- Datos, previsiones y residuos

0

10

20

30

40

0 5 10 15 20 25 30 35 40 45 50 55 t

Fig. 6.5.- Suavizado exponencial ( • ) y previsión ( 1 ), con λ = 0,45

Aquí se manifiesta la necesidad de incorporar de alguna forma la tendencia al suavizadoexponencial, tal como hace el método de Brown que se expondrá en el apartado siguiente.

6.3 Método de Brown

Cuando la serie cronológica presenta tendencia, el suavizado exponencial simple no escapaz de incorporarla para poder hacer previsiones. Este problema fue abordado por Brown,que elaboró la metodología necesaria para aunar a la ponderación exponencial laestimación de la tendencia. Así, supongamos una tendencia lineal tipo

Yt= a + b t + ε

que puede interpretarse como un componente aleatorio (ε) unido a un modelo o previsión

( Y# ), es decir, tY a b t= +# .

En el apartado 6.1. se ha expuesto que la serie suavizada exponencialmente puede

escribirse como

 © Los autores, 2001; © Edicions UPC, 2001.

Page 69: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 69/154

Otras técnicas de previsión: ponderación exponencial p73

t 1i t

t t i 0i 0

S = (1 ) Y (1 ) S−

=

− + −∑λ λ λ

y sustituyendo en ella Yt-i por su expresión de tendencia, Yt-i = a + b (t−i), se obtiene

[ ]t 1

i tt 0

i 0

t 1 t 1i i t

0i 0 i 0

S = (1 ) a b(t i) (1 ) S

(a bt) (1 ) b i (1 ) (1 ) S

=

− −

= =

− + − + − =

= + − − − + −

∑ ∑

λ λ λ

λ λ λ λ λ

Considerando que se dispone de suficiente información como para considerar que t esgrande, la convergencia de las series anteriores es tal que

t 1i

i 0

1(1 )

=− →∑ λ λ

t 1i

2i 0

1i (1 )

=

− →∑λ

λ λ y 0)1(t

→λ−

En consecuencia,

t t2

1 1S (a bt) b Y b

− λ − λ= + − λ = −

λλ

%

Se observa que la serie ponderada de unos datos cronológicos con tendencia lineal es una

recta paralela a los datos con un desplazamiento igual a −1-

λ.

Análogamente, la serie resultante de volver a suavizar S t, será

(2) (2)t t t 1S S (1 ) S −= + −λ λ

que, por desarrollo análogo con el del primer suavizado, se puede expresar como

(2)t t t

1 1S S b Y 2 b

− −= − = −%

λ λ

λ λ

Restando las expresiones de (2)t tS y S se obtiene la estimación, asociada al instante t, de

la pendiente de la recta que ajusta la tendencia:

( )(2)

t t tb S S1

= −−

λ

λ

Si se dispone del valor de la serie para el tiempo t, se puede calcular la pendiente estimada

en ese instante, es decir, tb , que representa el incremento del valor de la serie por unidad

de tiempo. En ese momento, la previsión para un valor del tiempo igual a t + T se puede

obtener como el valor previsto para el tiempo t, más T veces tb , es decir,

t T t tˆY Y b T+ = +% % .

En la ecuación anterior tY% hace las veces de ordenada cuando se toma como origen del

tiempo el valor t, es decir, equivale a ta .

 © Los autores, 2001; © Edicions UPC, 2001.

Page 70: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 70/154

p74 Series temporales

A partir de esta consideración y de las expresiones del primer y segundo suavizado, sepuede escribir

(2)t t t t t t

1 1 ˆ2S S 2 Y b Y 2 b Y a− − − = − − − = =

# # #λ λ λ λ 

Como consecuencia, a partir de los datos disponibles hasta un cierto instante se puedepredecir el inmediato siguiente. De esta manera la serie cronológica formada por lasprevisiones (estimaciones) de Y, según el modelo lineal suavizado, estará constituida por losvalores

t t 1 t 1 t 1 t 1ˆ ˆY â b 1 â b− − − −= + × = +#

y los residuos, o errores de ponderación, se podrán evaluar como

t t tR Y Y= − #

Cuando la última información disponible es la del tiempo t, y se desea hacer la previsiónpara T unidades de tiempo a partir de este instante, suponiendo que se mantenga el mismocomportamiento de la serie, la previsión será

t T t tˆˆY a b T+ = +#

Como ejemplo, se va a aplicar esta metodología a los datos de la tabla 6.I. Para ello hay que

dar valores a λ y, para cada valor de t, calcular (2)t t t t t t

ˆˆS , S , a , b , Y y R# . La evolución

de los errores en función deλ

se muestra en la figura 6.6.

λλλλ MSE MAE

0,10 7,164 1,995

0,15 6,563 2,004

0,20 6,848 2,094

0,30 7,979 2,266

0,40 9,466 2,4430,50 11,325 2,683

0,60 13,684 2,956

0,70 16,752 3,258

0,80 20,879 3,5770,90 26,643 4,047 0

10

20

30

0 0,2 0,4 0,6 0,8 1

MSE

λλλλ

Fig. 6.6.- Selección de λ con tendencia lineal

El factor de ponderación seleccionado es λ = 0,15; con él la aplicación del método de Brown

conduce a las ponderaciones que numéricamente se detallan, para los últimos datos en latabla 6.IV.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 71: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 71/154

Otras técnicas de previsión: ponderación exponencial p75

Las previsiones desde t = 51 hasta t = 55, (T = 1,..., 4), que son las aceptables según indicóel correlograma de la figura 6.2, se obtienen a partir de la expresión de las previsiones, es

decir,

t T t tˆˆY a b T

+= +# = 35,794 + 0,549 × T

La evolución gráfica de las series suavizada y prevista se muestran en la figura 6.7, dondese observa una muy buena concordancia entre los datos reales y los suavizados, y seaprecia que la previsión sigue la tendencia marcada por la serie cronológica real.

t Yt

St

(2)tS

tâ tb tY#

...48

4950

...35,543

35,53437,336

...31,216

31,86432,685

...28,526

29,02729,576

...33,906

34,70135,794

...0,475

0,5010,549

...33,278

34,38135,202

Tabla 6.IV.- Ponderaciones con λ=0,15 y tendencia lineal

0

10

20

30

40

0 20 40 60 t

Fig. 6.7.- Suavizado exponencial de Brown (•) y previsión (1), con λ = 0,15

La figura 6.8 contiene los residuos del modelo, o sea t t tR Y Y= − # , y da idea de la

buena concordancia entre los datos reales y el modelo resultante del suavizado exponencialde Brown. Este hecho avala la veracidad de las previsiones siempre y cuando no semodifique el patrón de comportamiento que regía durante el período de recogida de datos.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 72: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 72/154

p76 Series temporales

-4

-2

0

2

4

6

8

t

R

Fig. 6.8.- Residuos

En el próximo capítulo se expondrán otros casos prácticos de análisis de series temporalespara efectuar su modelización y realizar las previsiones oportunas.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 73: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 73/154

Otros ejemplos p77

7 OTROS EJEMPLOS

En este capítulo se van a desarrollar algunos casos prácticos de aplicación de las técnicaspropuestas anteriormente.

7.1 Ventas de papel

La tabla 7.I contiene las ventas mensuales de papel de impresión, en cientos de francos.(Forecasting. Methods and Applications.; Makridakis, Wheelwright, McGee; página 433.)

En todos los ejemplos desarrollados hasta ahora, se disponía de unos datos, se procedía asu modelización y a hacer previsiones, pero en ningún caso se han podido contrastar dichasprevisiones. De los 120 valores disponibles en el presente ejemplo se van a hacer dos

grupos, los 108 primeros, 9 años, serán utilizados para modelizar la serie y hacerprevisiones y los últimos 12 datos, un año, se utilizarán para validar las previsionesefectuadas

t Y t Y t Y t Y t Y

1 562,674 25 646,783 49 747,636 73 843,038 97 895,217

2 599,000 26 658,442 50 773,392 74 847,000 98 856,075

3 668,516 27 712,906 51 813,788 75 941,952 99 893,268

4 597,798 28 687,714 52 766,713 76 804,309 100 875,000

5 579,889 29 723,916 53 728,875 77 840,307 101 835,088

6 668,233 30 707,183 54 749,197 78 871,528 102 934,5957 499,232 31 629,000 55 680,954 79 656,330 103 832,500

8 215,187 32 237,530 56 241,424 80 370,508 104 300,000

9 555,813 33 613,296 57 680,234 81 742,000 105 791,443

10 586,935 34 730,444 58 708,326 82 847,152 106 900,000

11 546,136 35 734,925 59 694,238 83 731,675 107 781,729

12 571,111 36 651,812 60 772,071 84 898,527 108 880,000

13 634,712 37 676,155 61 795,337 85 778,139 109 875,024

14 639,283 38 748,183 62 788,421 86 856,075 110 992,968  

15 712,182 39 810,681 63 889,968 87 938,833 111 976,804

16 621,557 40 729,363 64 797,393 88 813,023 112 968,697  

17 621,000 41 701,108 65 751,000 89 783,417 113 871,675

18 675,989 42 790,079 66 821,255 90 828,110 114 1006,85219 501,322 43 594,621 67 691,605 91 657,311 115 832,037  

20 220,286 44 230,716 68 290,655 92 310,032 116 345,587  

21 560,727 45 617,189 69 727,147 93 780,000 117 849,528  

22 602,530 46 691,389 70 868,355 94 860,000 118 913,871

23 626,379 47 701,067 71 812,390 95 780,000 119 868,746  

24 605,508 48 705,777 72 799,556 96 807,993 120 993,733

Tabla 7.I.- Ventas mensuales de papel

Las figuras 7.1 y 7.2 muestran, respectivamente, la evolución cronológica de los datos y el

correlograma. De ellas se deduce la existencia de una estacionalidad de período 12,naturalmente ligada a la evolución mensual de los datos, y una tendencia creciente en losprimeros años y más estables en los últimos; esto hace pensar en la posibilidad de un

 © Los autores, 2001; © Edicions UPC, 2001.

Page 74: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 74/154

p78 Series temporales

modelo parabólico. Las previsiones, según el correlograma, son aceptables a tres añosvista.

0

200

400

600

800

1000

0 24 48 72 96 120 t

Y

Fig. 7.1.- Evolución cronológica de los datos de los primeros 9 años

 

-1

-0,5

0

0,5

1

k

Fig. 7.2.- Correlograma

Dada la generalidad del método, para tratar modelos aditivos, multiplicativos o mixtos, seoptará por la modelización con variables categóricas.

Inicialmente se plantea el modelo que incluye el término lineal y el cuadrático del tiempo, las11 variables categóricas y su conjunción con el tiempo, es decir:

Y = α0

+ α1

t + α2t2+ β

2Q

2+ β

3Q

3+ β

4Q

4+ β

5Q

5+ β

6Q

6+ β

7Q

7+ β

8Q

8

+ β9Q

9+ β

10Q

10+ β

11Q

11+ β

12Q

12+ γ 

2Q

2t + γ 

3Q

3t +γ 

4Q

4t +γ 

5Q

5t

+γ 6 Q6 t +γ 7 Q7 t +γ 8 Q8 t +γ 9 Q9 t +γ 10 Q10 t +γ 11 Q11 t +γ 12 Q12 t + ε

 © Los autores, 2001; © Edicions UPC, 2001.

Page 75: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 75/154

Otros ejemplos p79

Después de eliminar todos los términos no significativos, el modelo definitivamente ajustadose presenta en la tabla 7.II donde es destacable el buen ajuste (R

2= 95,59%) obtenido.

El modelo definitivo es

Y = 579,34 + 4,12 t – 0,011 t2

+80,1576 Q3 −113,66 Q

7

  − 399,06 Q8 − 83,26 Q

9 − 1,55 t Q

8 −0,83 t Q

11

es decir, se trata de un modelo mixto, en donde la ecuación de la tendencia es distinta paraalgunos meses. Así los meses de enero (Q

1), febrero (Q

2), abril (Q

4), mayo (Q

5), junio (Q

6),

octubre (Q10) y diciembre (Q

12) tienen el mismo comportamiento puesto que sus variables

categóricas no aparecen en el modelo, hecho que los haría distinguibles entre sí. Los meses

de marzo (Q3), julio (Q7), agosto (Q8) y septiembre (Q9) tienen distinta ordenada en el origen,es decir, su volumen de ventas tiene la misma evolución parabólica con el tiempo pero condistinto valor inicial de salida. Además agosto (Q

8) y noviembre (Q

11) tienen distinta

pendiente que los demás; al ser su coeficiente negativo, indica que su velocidad decrecimiento es sistemáticamente inferior a la del resto de meses del año.

nu S.C. C.M. F p-val

Regresión 8 2782737,3 347842,16 268,54 1,5011E-63

Residuos 99 128237,3 1295,33

Total 107 2910974,6

Coeficientes Error típico t p-val

Ord. Origen 570,3432 10,9786 51,9503 0,0000

t 4,1152 0,4487 9,1704 0,0000

t^2 -0,0113 0,0040 -2,8242 0,0057

Q3 80,1576 12,8019 6,2614 0,0000

Q7 -113,6589 12,8057 -8,8756 0,0000

Q8 -399,0648 25,9335 -15,3880 0,0000

Q9 -83,2560 12,8143 -6,4971 0,0000

tQ8 -1,5549 0,4051 -3,8384 0,0002

tQ11 -0,8270 0,1932 -4,2797 0,0000

R^2 = 0,9559

Tabla 7.II.- Modelo resultante

La figura 7.3. muestra el ajuste del modelo obtenido sobre los datos reales de los nueveaños estudiados, y la 7.4 los residuos, diferencia entre el valor real y el modelizado,observándose un buen ajuste general a todos los puntos. En la figura 7.3, a través de lostriángulos de los valores modelizados, se ve claramente la homogeneidad decomportamiento de un conjunto de meses, frente a la disparidad de los otros

 © Los autores, 2001; © Edicions UPC, 2001.

Page 76: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 76/154

p80 Series temporales

0

100

200

300

400

500

600

700

800900

1000

0 20 40 60 80 100 120 t

Fig. 7.3.- Datos reales ( • ) y modelizados ( u )

-100

-75

-50

-25

0

25

50

75

100

0 20 40 60 80 100 120 t

R

Fig. 7.4.- Residuos

Con el modelo disponible se puede proceder a hacer previsiones, por ejemplo para lospróximos doce meses. En la tabla 7.III se presentan los valores previstos junto a los querealmente se obtuvieron en estos meses y que han sido separados y guardados a la hora dehacer la modelización anterior; también se han calculado las diferencias entre ellas y elporcentaje de error de previsión sobre el valor real. Hay que resaltar que las pequeñasdiscrepancias entre la previsión y el valor real, en parte, deben ser atribuidas al componentealeatorio, cuya presencia en cada momento no hay que olvidar. La figura 7.5 muestra ambosconjuntos de datos, de los que sólo hay que comentar la gran concordancia entre la

previsión y la realidad, lo cual valida lo precedente de la aplicación de la metodología delanálisis mediante variables categóricas.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 77: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 77/154

Otros ejemplos p81

t Y Previsión Diferencia %

109 875,024 884,998 -9,974 -1,14

110 992,968 886,645 106,323 10,71111 976,804 968,430 8,374 0,86

112 968,697 889,872 78,825 8,14

113 871,675 891,451 -19,776 -2,27

114 1006,852 893,008 113,844 11,31

115 832,037 780,882 51,155 6,15

116 345,587 316,626 28,961 8,38

117 849,528 814,283 35,245 4,15

118 913,871 899,010 14,861 1,63

119 868,746 802,041 66,705 7,68

120 993,733 901,876 91,857 9,24

Tabla 7.III. - Previsiones y valores reales obtenidos en el mismo período

200

400

600

800

1000

1200

108 110 112 114 116 118 120 122 t

Fig. 7.5.- Previsiones ( u ) y valores reales ( • ) del año siguiente

7.2 Generacion de electricidad

En la tabla 7.IV se presenta la generación mensual de electricidad, por la industria eléctricade Estados Unidos, durante 8 años, (Forecasting. Methods and Applications.; Makridakis,Wheelwright, McGee; página 469).

Como en el caso anterior, de los 96 valores disponibles en el presente ejemplo se van ahacer dos grupos, los 84 primeros, 7 años, serán utilizados para modelizar la serie y hacer

previsiones y los últimos 12 datos, resaltados en cursiva en la tabla y que corresponden alúltimo año, se utilizarán para validar las previsiones efectuadas

 © Los autores, 2001; © Edicions UPC, 2001.

Page 78: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 78/154

p82 Series temporales

t Y t Y t Y t Y1 144,58 25 164,33 49 196,37 73 209,69

2 137,3 26 147,08 50 162,73 74 186,35

3 140,06 27 155,48 51 169,16 75 182,85

4 132,14 28 146,22 52 156,85 76 169,96

5 137,75 29 153,23 53 169,33 77 178,07

6 145,52 30 162,44 54 180,79 78 186,68

7 147,85 31 176,82 55 198,92 79 202,25

8 162,82 32 179,72 56 196,09 80 204,85

9 147,36 33 155,22 57 176,26 81 180,75

10 143,74 34 154,94 58 166,39 82 179,71

11 143,87 35 152,79 59 167,07 83 177,5

12 154,35 36 169,35 60 184,21 84 188,7113 157,24 37 178,31 61 197,83 85 200

14 142,46 38 156,67 62 173,5 86 188,72

15 150,02 39 164,16 63 173,19 87 187,47  

16 142,02 40 153,15 64 159,74 88 168,72

17 153,49 41 157,35 65 175,24 89 175,73

18 156,13 42 173,36 66 188,31 90 189,43

19 177,91 43 186,41 67 202,68 91 216,78  

20 173,81 44 186,38 68 206,41 92 215,39

21 152,16 45 164,97 69 185,57 93 191,48  

22 151,87 46 163,63 70 175,8 94 178,56  

23 149,73 47 168,99 71 176,17 95 178,55

24 159,6 48 183,09 72 191,87 96 195,59

Tabla 7.IV.- Generación mensual de electricidad

Las figuras 7.6 y 7.7 corresponden, respectivamente, a la evolución cronológica de los datosde los siete años utilizados en la modelización, y su correlograma. Al ser los datosmensuales, parece que de haber alguna estacionalidad, ésta debería ser de período 12, esdecir anual, sin embargo no es esta la situación del caso estudiado. El correlogramamuestra de forma inequívoca que existe una estacionalidad de período 6, la cual, aunquemenos evidente, también se detecta en la evolución cronológica. Intentando buscar unaexplicación a dicha periodicidad, quizás sería posible pensar que el consumo eléctrico, y portanto la electricidad generada por las centrales, tiene similar comportamiento en los mesescálidos que en los fríos como consecuencia del consumo por los aires acondicionados,mientras que la parte del consumo atribuible a la industria en general, no tiene porquepresentar distinto comportamiento de un mes a otro. En cuanto a la tendencia, es posibleque sea cuadrática, tal como se detecta en la evolución cronológica de los datos.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 79: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 79/154

Otros ejemplos p83

100

120

140

160

180

200

220

0 12 24 36 48 60 72 84t

Y

Fig.7.6.- Evolución cronológica de la electricidad generada en siete años

-1

-0,5

0

0,5

1

k

rk

Fig.7.7.- Correlograma

El modelo inicial por variables categóricas debe incluir la tendencia, la estacionalidad,reflejada en las variables Q, y sus posibles cambios en el tiempo, términos Q

 jt, es decir:

Y = α0+ α

1t + α

2t2 + β

2Q

2+ β

3Q

3+ β

4Q

4+ β

5Q

5+ β

6Q

6

+ γ 2Q

2t + γ 

3Q

3t +γ 

4Q

4t +γ 

5Q

5t + γ 

6Q

6t + ε

Después de eliminar los términos no significativos, regresión paso a paso, el modeloresultante se presenta en la tabla 7.V. Hay que destacar especialmente el buen ajuste,reflejado en un coeficiente de determinación, R2, del 86,64 %.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 80: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 80/154

p84 Series temporales

nu S.C. C.M. F p-val

Regresión 7 24674,8398 3524,9771 70,4316 1,2626E-30

Residuos 76 3803,6637 50,0482Total 83 28478,5035

Coeficientes Error típico t p - val

Ord. Origen 143,8383 1,7040 84,4105 0,0000

t 0,9072 0,0511 17,7608 0,0000

Q4 -8,7533 4,2164 -2,0760 0,0413

tQ2 -0,2042 0,0567 -3,6025 0,0006

tQ3 -0,4053 0,0562 -7,2125 0,0000

tQ4 -0,4006 0,0934 -4,2904 0,0001

tQ5 -0,4800 0,0553 -8,6822 0,0000

tQ6 -0,2707 0,0549 -4,9352 0,0000

R^2 = 0,8664Tabla 7.V.- Modelo resultante

En consecuencia, el modelo es

Y = 143,838 + 0,907 t − 8,753 Q4 − 0,204 Q

2t − 0,405 Q

3t

  − 0,401 Q4t − 0,480 Q

5t − 0,271 Q

6t

y de él se deduce que el término cuadrático del tiempo no ha resultado significativo, pero la

serie presente una tendencia lineal y creciente, pendiente igual a 0,907. La figura 7.8muestra la modelización de la energía eléctrica producida para cada uno de los 6 meses quecomponen un período. El comportamiento estacional no es fácil de interpretar; el cuarto mesde cada período pierde 8,753 unidades (coeficiente de Q

4) respecto a todos los demás, que

tienen una ordenada en el origen común. En cada mes la evolución con el tiempo es distinta,pero frente al primer mes al que correspondería un crecimiento asociado a una pendientede 0,907, se podrían hacer dos agrupaciones, los meses 2 y 6, con una pérdida dependiente del orden de 0,2÷0,3, (rectas casi coincidentes en la figura 7.8) y los 3, 4 y 5 con

una pérdida, respecto al primero, de 0,4÷0,5 unidades en la pendiente, que dan lugar a una

evolución similar, tal como se observa en el gráfico.

120

140

160

180

200

220

240

0 12 24 36 48 60 72 84 t

Y

Fig. 7.8.- Modelo para cada componente del período estacional

 © Los autores, 2001; © Edicions UPC, 2001.

Page 81: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 81/154

Otros ejemplos p85

La figura 7.9 contiene el gráfico del modelo ajustado sobre los datos iniciales, y la 7.10 losresiduos. En ambas se puede apreciar la buena adecuación del modelo a los datos. Quizás

se podría destacar que en el inicio de los datos (figura 7.9), hay algunos valores reales deproducción de energía eléctrica claramente distintos, en cuanto a su comportamiento delresto. Esto incide en un mayor valor del residuo, y si no es posible conocer las causas deestas producciones más altas que lo previsto deberían atribuirse al azar.

100

120

140

160

180

200

220

240

0 12 24 36 48 60 72 84 t

Y

Fig. 7.8.- Datos reales • y modelizados >

 

-20

-15

-10

-5

0

5

10

15

20

0 12 24 36 48 60 72 84 t

R

Fig. 7.9.- Residuos

Con el modelo resultante, se pueden hacer previsiones para un período no superior al año,según evidencia el correlograma. Esto es suficiente para comprobar la adecuación de laprevisión, según el modelo obtenido, con los 12 datos reales de los que se dispone y quehan sido reservados en la modelización para comprobar la fiabilidad de las predicciones. La

tabla 7.VI contiene los valores reales las previsiones según el modelo obtenido y el errorrespecto al valor medido, salvo el primero, los demás presentan una buena aproximación

 © Los autores, 2001; © Edicions UPC, 2001.

Page 82: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 82/154

p86 Series temporales

t Y Previsión Diferencia %

85 200 220,95 -20,95 -10,48

86 188,72 204,30 -15,58 -8,25

87 187,47 187,50 -0,03 -0,02

88 168,72 179,67 -10,95 -6,49

89 175,73 181,86 -6,13 -3,49

90 189,43 201,12 -11,69 -6,17

91 216,78 226,40 -9,62 -4,44

92 215,39 208,52 6,87 3,19

93 191,48 190,51 0,97 0,50

94 178,56 182,70 -4,14 -2,32

95 178,55 184,00 -5,45 -3,05

96 195,59 204,31 -8,72 -4,46

Tabla 7.VI.- Previsiones y valores reales obtenidos en el mismo período

La figura 7.10 muestra ambos conjuntos de valores, en donde a pesar de la buenaaproximación, es destacable que los valores reales, casi siempre son inferiores a losprevistos.

En esta situación cabría la posibilidad de pensar en un posible cambio en el comportamientodel modelo, es decir, quizás la tendencia al crecimiento ha sufrido un frenazo en el últimoaño; esto se confirmaría con la evolución futura, sin embargo si se examina la historia, sepuede detectar que en los últimos 12 meses incluidos en la modelización, los residuosnegativos predominan sobre los positivos, figura 7.9, o sea que, en muchos casos, losvalores del modelo superan a los valores reales. La figura 7.11, une a los datos reales y lasprevisiones, las líneas de evolución del modelo en cada componente del período, mostrandoel mismo hecho de una situación de los valores reales por debajo de la previsión.

160

170

180

190

200

210

220

230

84 86 88 90 92 94 96 t

Y

Fig. 7.10.- Previsiones > y valores reales • del año siguiente

 © Los autores, 2001; © Edicions UPC, 2001.

Page 83: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 83/154

Otros ejemplos p87

 

160

180

200

220

240

84 86 88 90 92 94 96 t

Y

Fig. 7.11.- Previsiones y valores reales junto al modelo

 © Los autores, 2001; © Edicions UPC, 2001.

Page 84: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 84/154

Práctica 1. Descomposición clásica de una serie aditiva p89

PRÁCTICAS DE SERIES TEMPORALES CON EXCEL

En este texto se presentan un conjunto de cuatro prácticas realizadas sobre unos archivosde datos disponibles en formato Excel.

El objetivo de estas prácticas es mostrar, en cada caso, la sistemática de análisis de losdatos utilizando la hoja de cálculo. No pretenden ser un manual de Excel, pero sí dar unainformación detallada de cómo se puede llevar a cabo el estudio en cuestión, a demás deservir de guía para la realización de la práctica que cada alumno tiene encomendada.

PRÁCTICA 1. DESCOMPOSICIÓN CLÁSICA DE UNA SERIE ADITIVA 

OBJETIVO: Se dispone del valor diario de la caja resultante de las ventas de unsupermercado a lo largo de 12 semanas. Es necesario analizar los datos de esta seriecronológica, estimar el modelo de comportamiento, estudiar su ajuste y hacer lasprevisiones necesarias. Todo ello se realizará mediante la hoja de cálculo Excel 97 deMicrosoft.

1.1 Recuperacion de los datos

Desde Excel se debe recuperar el archivo que contiene los datos objeto de la práctica, y que

se encuentran en el directorio habitual de la red. Para ello, se debe seguir la secuencia(figura 1.1):

Archivo6666  Abrir

y, ahora, ir al directorio donde se encuentra el archivo Práctica 1.xls, seleccionarlo ypresionar Abrir.

Fig. 1.1

Una vez tenemos el archivo abierto, observamos que consta de una hoja llamada Datos

donde figuran 3 columnas de 72 valores cada una, con la estructura mostrada parcialmenteen la figura 1.2. En cada columna hay 72 valores, es decir, cada columna comienza en la fila1 (con el título) y acaba en la 73.

La columna A, llamada Semana contiene valores de 1 a 12 correspondientes a las 12

semanas en que se ha recogido la información; laB

,Día

, indica el día de la semana; y laC

contiene los valores de las ventas diarias, que se llaman Y.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 85: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 85/154

p90   Series temporales

Fig. 1.2

En primer lugar, se debe preparar una nueva hoja donde es situarán los sucesivos gráficos,

y que se denominará Gráficos. Para ello, al hacer doble clic en la pestaña Hoja2 (figura1.3), esta palabra quedará en vídeo inverso y permitirá escribir Gráficos.

Fig. 1.3

De forma similar, a la Hoja3 la denominaremos Tendencia-Modelo.

1.2 Análisis de la evolución de la serie cronológica

Situados en la hoja Datos, es necesario crear una columna con los valores consecutivos deltiempo y, para mayor facilidad al hacer los gráficos, es bueno que esta columna preceda a lade los valores de las ventas (Y). Hacer clic sobre la letra C del encabezado de la columnaque quedará toda negra; pulsando el botón derecho, seleccionar Insertar (figura 1.4). Eneste momento la columna de los datos se habrá desplazado a la D y habrá dejado la Cvacía; aquí es donde se introducirán los valores correlativos del tiempo. En C1 escribir

tiempo, hacer C2 = 1 y arrastrar (tecleando también Ctrl) desde C2+ hasta C73; aquíaparecerá el valor 72 (página 108 de esta práctica).

Para obtener el gráfico de la evolución de las ventas frente al tiempo, se selecciona desdeC1 hasta C73 (tiempo), y desde D1 hasta D73 (ventas =Y) y se pincha el icono de gráficos

o también, en la barra de herramientas, Insertar y después Gráfico.

Entonces surge el Asistente para Gráficos (figura 1.5), donde se debe seleccionar

XY (Dispersión)

y, entonces la opción (3; 1), es decir, Dispersión con puntos conectados por líneas ySiguiente.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 86: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 86/154

Práctica 1. Descomposición clásica de una serie aditiva p91

Fig. 1.4

Fig. 1.5

 © Los autores, 2001; © Edicions UPC, 2001.

Page 87: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 87/154

p92   Series temporales

En el paso 2 del asistente de gráficos se hace directamente Siguiente y en el paso 3 (figura1.6), se pueden editar los títulos a voluntad.

Fig. 1.6

Por ejemplo, en la pestaña Títulos

Título del gráfico: Evolución cronológicaEje de categorías (X): tiempoEje de valores (Y): ventas

En la pestaña Leyenda

eliminar la marca Z de Mostrar leyenda, pinchando sobre la misma, para dejar sólo .

Siguiente

El paso 4 (figura 1.7), permite situar el gráfico donde se desee, para ello se marca

¿ Como objeto en

y pinchando la marca v aparece el conjunto de hojas disponibles; allí se seleccionaGráficos.

Finalmente

Terminar

 © Los autores, 2001; © Edicions UPC, 2001.

Page 88: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 88/154

Práctica 1. Descomposición clásica de una serie aditiva p93

Fig. 1.7

Con el gráfico seleccionado (de forma que se muestre recuadrado externamente con lasmarcas en el entorno), se puede situar en el lugar adecuado y darle el tamaño que seanecesario.

Si se quiere editar el gráfico y, por ejemplo, eliminar el fondo gris del mismo:

  Pinchar sobre este fondo, Área de trazado

  Presionar el botón derecho

  Formato del área de trazado

  Área

  ¿  Ninguna Aceptar

Para cambiar la escala del eje vertical y aprovechar toda la superficie de la figura:

  Situar el cursor sobre el eje de ordenadas, Eje de valores

  Hacer doble clic o bien presionar el botón derecho

  Formato de ejes (figura 1.8)

Pestaña Escala: Poner el mínimo a 0, el máximo a 12000, la unidad mayora 4000 y la menor a 1000 Aceptar

 © Los autores, 2001; © Edicions UPC, 2001.

Page 89: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 89/154

p94   Series temporales

Fig. 1.8

Si se quiere cambiar la escala del tiempo, por ejemplo para que vaya de 6 en 6 unidades,que son los valores que forman una semana, hay que situar el cursor sobre el eje deabscisas (Eje de valores (X)) y con el botón derecho seguir los mismos pasos que antes,para dejar un mínimo de 1, un máximo de 78, la unidad mayor a 6 y la menor a 1.

El resultado es el gráfico de la página 111 de esta práctica.

Conclusiones: Se detecta una clara estacionalidad, de período p=6, y posiblemente unatendencia decreciente.

1.3 Estabilización de la serie

Para poder modelizar la serie, en primer lugar se debe estabilizar calculando las mediasmóviles de período p; en el caso del ejemplo p=6.

  Cálculo de las medias móviles

Situados en la casilla E1 escribir como título de la columna Y(p=6). Al ser de período 6, lamedia de los 6 primeros valores se debe situar entre el tercer y el cuarto lugar, filas 4 y 5;

 © Los autores, 2001; © Edicions UPC, 2001.

Page 90: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 90/154

Práctica 1. Descomposición clásica de una serie aditiva p95

como eso no lo podemos hacer en la hoja de cálculo optamos por empezar en la casilla 5.Situados entonces en E5, hacemos

= Promedio (D2:D7) ↵↵↵↵ (aparece como resultado 6135)

Arrastramos hasta E71, que contendrá la media de los 6 últimos valores de la serie(Promedio(D68:D73)), en este caso 5256,33.

Al ser de período par debemos volver a la media de 2 en 2: la primera media móvil ocuparáel cuarto valor (5ª fila), y la última el 69

º(70

ªfila), ya que en total se pierden 3 valores al inicio

y 3 al final. Situados en F5 escribiremos

= Promedio (E5:E6) ↵↵↵↵ (aparece como resultado 6103,75)

Arrastramos hasta F70, que contendrá la media de los 2 últimos valores de la columnaanterior (Promedio(E70:E71)), en este caso 5262,33.

Titularemos la columna F, Y móvil, y lo escribiremos en F1. En las páginas 107 y 108 sepuede ver el conjunto de valores que resultan.

  Gráfico de medias móviles

Seleccionar, manteniendo presionada la tecla Control, desde C2 hasta C73, (tiempo), desdeD2 hasta D73, (Y) y desde F2 hasta F73, (Y móvil).

Con el icono de gráficos

Paso 1: Asistente para Gráficos (figura 1.5),XY (Dispersión)(3; 1), Dispersión con puntos conectados por líneasSiguiente

Paso 2: Siguiente

Paso 3: Poner los títulos, por ejemplo medias móviles (p=6), sacar la leyenda y

Siguiente

Paso 4: Situar el gráfico como ¿  Objeto en la hoja gráficos. Terminar

Es aconsejable editar el gráfico, tal como se ha hecho con el anterior, para que la escala deordenadas vaya de cero a doce mil; también se puede cambiar la escala de tiempo comoantes. El resultado es el gráfico de la página 111.

Conclusiones: Se detecta una tendencia decreciente, casi seguramente lineal, pero ¿podría

ser cuadrática? Se deberá estudiar en el momento oportuno.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 91: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 91/154

p96   Series temporales

1.4 Estacionalidad

El estudio de la estacionalidad incluye el cálculo de los índices estacionales, en modeloaditivo que es el caso del ejemplo, y su representación gráfica.

  Cálculo de los índices estacionales

Este cálculo es muy cómodo hacerlo con una tabla dinámica. En primer lugar se debenobtener los valores de W, que son las diferencias entre los valores de la serie (Y, columnaC) y las medias móviles (Y móvil, columna E). Estos valores se situarán en la columna G.

En la casilla G1 escribir W. Situados en G5, hacer

= D5 – F5 (Y – Y móvil)

y arrastrar hasta G70.

En la barra de herramientas

Datos 6666 Asistente para tablas dinámicas

Paso 1: ¿Dónde están los datos?¿ Lista o base de datos de Microsoft ExcelSiguiente

Paso 2: ¿Dónde están los datos que desea usar?Rango: $AEL:$G$73 (es la opción por defecto,

que incluye todos los datos)

Siguiente

Paso 3: arrastrar W a DATOS y Día a FILA (figura 1.9)

Doble clic sobre Contar de WPromedio

Aceptar (ahora el cuadro es Promedio de W )

Siguiente

 © Los autores, 2001; © Edicions UPC, 2001.

Page 92: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 92/154

Práctica 1. Descomposición clásica de una serie aditiva p97

Fig. 1.9

Paso 4: ¿Dónde desea situar la tabla dinámica? (figura 1.10)¿ Hoja de cálculo existente

  B80 Indicar una casilla tal que ella y lascontiguas estén libres para situar la tabla

Fig. 1.10

 © Los autores, 2001; © Edicions UPC, 2001.

Page 93: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 93/154

p98   Series temporales

El resultado es la siguiente tabla, copiada de la página 108.

A B C D

80 Promedio de W

81 día Total

82 lunes -2331,37

83 martes -939,924

84 miércoles -1963,33

85 jueves 304,7803

86 viernes 3098,348

87 sábado 1898,394

88 Total general 11,14899

Los valores de las casillas C82 – C87 son, respectivamente, E*1, E*

2, …, E*

6; la casilla C88

(llamada Total general en B88) es la media de las anteriores, o sea, E* .

Para calcular los índices estacionales, en la casilla E81 se escribe Ind. Est. como título, y sedefine E82 con la expresión

= C82 - $C$88 (anclar la casilla C88 de la media para que no cambieal arrastrar la fórmula)

Arrastrar hasta E87

Los resultados obtenidos se pueden observar en las páginas 107 y 108.

Repetir los valores de la estacionalidad por los 72 valores de la serie. Situados en lacolumna H, en H1 escribir Ind. Est.

Seleccionar las casillas E82 – E87

Edición6666 CopiarSituarse en H2

Edición 6666 Pegado especial 6666 Valores Aceptar

Llenar toda la columna (72 valores) cortando de H2 a H7 y pegando sucesivamente desde

H8 hasta H73; también se puede hacer marcando como bloque H2−−−−H7 y, presionando la

tecla de Ctrl, arrastrarlo desde el extremo inferior derecho del cuadro (+) hasta H73.

  Gráfico de la estacionalidad

Seleccionar los valores de los índices estacionales, casillas E82 hasta E87 (o también desdeH2 hasta H7).

Con el icono de gráficos

Paso 1: Líneas6666 Línea con marcadores (2, 1) de la figura 1.11 Siguiente

 © Los autores, 2001; © Edicions UPC, 2001.

Page 94: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 94/154

Práctica 1. Descomposición clásica de una serie aditiva p99

Fig. 1.11

Paso 2: Siguiente

Paso 3: Poner los títulos, por ejemplo Índices estacionales, quitar la leyenda ySiguiente

Paso 4: Situar el gráfico como ¿ Objeto en la hoja Gráficos. Terminar

Situar el gráfico en la posición y con tamaño deseado.

Si se quiere que los valores del eje de abscisas queden fuera del gráfico, situar el cursorsobre el eje de ordenadas (Eje de valores), y haciendo doble clic sale la pantalla Formatode ejes (figura 1.12). En la pestaña Escala se debe entrar al Eje de categorías (X) cruzaen:y cambiar el 0 por −−−−3000

Fig. 1.12

El resultado es el gráfico de la página 113.

Conclusiones: Analizar qué se puede decir de cada día de la semana referente a la

estacionalidad. ¿Cuál es el día con más ventas?, ¿y el de menor número? ¿En cuánto difierende la media semanal cada uno de estos días?

 © Los autores, 2001; © Edicions UPC, 2001.

Page 95: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 95/154

p100   Series temporales

1.5 Estimación de la tendencia

Observando el gráfico de las medias móviles, superpuesto a la evolución de los datoscronológicos de la página 111, no se ve nada claro si la tendencia es de tipo lineal ocuadrático; eso, en parte puede ser atribuido al hecho de que la escala vertical del citadográfico no es adecuada para estudiar las medias móviles. De modo que, lo primero que sedebe hacer es un nuevo gráfico con una escala lo más amplia posible.

Seleccionar, manteniendo presionada la tecla Ctrl, desde C2 hasta C73 (Tiempo), y desdeF2 hasta F73 (Y móvil) de la hoja Datos.

Con el icono de gráficos

Asistente para Gráficos (figura 1.5)

XY (Dispersión)(3; 1), Dispersión con puntos conectados por líneasSiguiente

Paso 2: Siguiente

Paso 3: Poner los títulos, por ejemplo Media móvil (tendencia), sacar la leyenda ySiguiente

Paso 4: Situar el gráfico como ¿ Objeto en la hoja gráficos. Terminar

Es necesario editar el gráfico, tal como se ha hecho con el anterior, para que la escala deordenadas vaya desde cinco mil hasta siete mil. El resultado es el gráfico de la página 112.

Con la nueva escala parece bastante claro que puede haber una tendencia cuadrática, poreso, se ha de proceder a ajustar un modelo parabólico con el bien entendido de que si eltérmino cuadrático no fuese significativo ya se detectaría en el análisis de los resultados, yse procedería en consecuencia; es decir, se debería ajustar un nuevo modelo sin el términoque ha resultado no significativo.

Para aligerar la presentación de la hoja de cálculo, realizaremos el estudio de la tendencia,de los residuos y de las previsiones en una nueva hoja, que ya tenemos preparada desde elinicio con el nombre Tendencia-Modelo.

En primer lugar copiaremos todo lo que nos haga falta de la hoja Datos. Situados aquí:

Seleccionar las columnas Tiempo, Y, Y móvil y Ind. Est., es decir, C1−−−−C73, D1−−−−D73, (y

manteniendo presionada la tecla Ctrl) F1−−−−F73 y H1−−−−H73

Edición6666 Copiar

Acceder a la hoja de Tendencia-Modelo, haciendo clic sobre la pestaña con su nombre.Situados en la casilla A1

Edición6666 Pegar

En este momento están ocupadas las columnas A, B, C y D. Para poder hacer el ajustemínimo cuadrático para la tendencia, mediante un modelo parabólico, se debe disponer de

 © Los autores, 2001; © Edicions UPC, 2001.

Page 96: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 96/154

Práctica 1. Descomposición clásica de una serie aditiva p101

una columna con los valores del tiempo al cuadrado, que necesariamente ha de estarsituada al lado de la columna del tiempo; por eso tendremos que insertarla entre las

columnas A y B.

Hacer clic sobre la letra B del encabezado de la columna, que quedará toda negra;presionar el botón derecho para seleccionar Insertar (figura 1.4). La columna de los datosse ha desplazado a la C y ha dejado la B vacía; aquí se introducirán los valores del tiempoal cuadrado.

En B1 escribir Tiempo^2

Situados en B2 escribir la expresión =A2*A2

Arrastrar hasta B73; aquí habrá el valor 5184, que es el cuadrado de 72. En las páginas 109

y 110, se puede ver la disposición de los valores.

Abrir Herramientas6666 Análisis de datos6666 Regresión

Llenar los campos según se presenta en la figura 1.13, es decir:

Rango Y de entrada D5:D70 (medias móviles)Rango X de entrada A5:B70 (tiempo y tiempo^2)

Opciones de salida:

¿ Rango de salida: A93 (casilla vacía, a partir de donde se presentarán los

resultados de la regresión)

Fig. 1.13

 © Los autores, 2001; © Edicions UPC, 2001.

Page 97: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 97/154

p102   Series temporales

Los resultados obtenidos se muestran en la figura 1.14, extraída de la página 110.

Conclusiones: El nivel de significación (valor p) de los coeficientes asociados al tiempo y altiempo^2 es inferior a 0,05. Por lo tanto, con un riesgo de la primera especie del 5%, sedebe aceptar el modelo cuadrático, que en este caso es:

2T 6311,51 27,30 t 0,18 t= − +

con un R2

del 85,6 %.

9293

94

95

96

97

98

99

100

101

102

103

104105

106

107

108

109

110

111

112

113

A B C D E F G

Resumen

stad st cos 

R 0,92513

R^2 0,85587

R^2 ajust 0,85130

Error típico 114,20021

n 66

ANOVA

u S de C C a o p  

Regresión 2 4879153,47 2439576,7 187,059889 3,1646E-27Residuos 63 821626,351 13041,688

Total 65 5700779,82

Coefs o t p co t Va o p  

Ord. Origen 6311,5139 51,8296 121,7743 1,7087E-76

Tiempo -27,3032 3,2473 -8,4079 6,9185E-12

Tiempo^2 0,1832 0,0433 4,2298 7,7177E-05

Fig. 1.14

Una vez obtenida la ecuación de la tendencia, podemos calcular su valor para los diferentestiempos de los que se dispone de información. Para ello crearemos una nueva columna.

Situados en F1 escribir Tendencia, que será el título de la columna

En F2 escribir la expresión que acabamos de obtener,

= 6311,51 −−−− 27,3*A2 + 0,18*B2

y arrastrarla hasta F73

Para ver la bondad del ajuste, se puede hacer un gráfico que compare los valores de lasmedias móviles y los de la tendencia ajustada. Por eso seleccionar, presionando la teclaCtrl, desde A1 hasta A73, desde D1 hasta D73 y desde F1 hasta F73

 © Los autores, 2001; © Edicions UPC, 2001.

Page 98: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 98/154

Práctica 1. Descomposición clásica de una serie aditiva p103

Con el icono de gráficos

Asistente para Gráficos (figura 1.5)XY (Dispersión)(3; 1) Dispersión con puntos conectados por líneas

Siguiente

Paso 2: Siguiente

Paso 3: Poner los títulos, por ejemplo Tendencia, sacar la leyenda y Siguiente

Paso 4: Situar el gráfico como ¿ Objeto en la hoja Gráficos. Terminar

Es necesario editar el gráfico, tal como se ha hecho con el anterior, para que la escala deordenadas vaya desde cinco mil hasta a siete mil.

Si se quiere, situados sobre uno de los puntos de la Serie “tendencia”, con el botónderecho seleccionar

Formato de punto de datosMarcador ¿ Ninguno

El resultado es el gráfico de la página 112, donde se puede valorar el ajuste.

1.6 Modelo y residuos

En una serie aditiva, el modelo se obtiene como resultado de sumar la tendencia y laestacionalidad de cada punto.

Situados en G1 escribir, como título, Y mod.

En G2 la expresión = F2 + E2 (tendencia + estacionalidad)

Arrastrar hasta G73, que evidentemente contendrá la expresión F73+E73

Los residuos son la diferencia entre los valores originales, Y, y el modelo, Y mod.

Situados en H1 escribir, como título, Residuos

En H2 la expresión = C2 −−−− G2 (Y − Y mod)

Arrastrar hasta H73

Para hacer la representación gráfica del modelo ajustado en comparación con los valores

originales, se debe seleccionar, de la hoja Tendencia−−−−Modelo, los valores del tiempo, de la

Y y de la Y modelizada, o sea, A1−−−−

A73, C1−−−−

C73 y G1−−−−

G73.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 99: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 99/154

p104   Series temporales

Con el icono de gráficos

Asistente para Gráficos (figura 1.5)XY (Dispersión)(3; 1), Dispersión con puntos conectados por líneasSiguiente

Paso 2: Siguiente

Paso 3: Poner los títulos, por ejemplo Modelo ajustado, sacar la leyenda ySiguiente

Paso 4: Situar el gráfico como ¿ Objeto en la hoja Gráficos. Terminar

Si se desea dejar con puntos la serie original y con línea la del modelo ajustado, hay quesituarse sobre uno de los puntos de la Serie “Y”, y con el botón derecho del ratónseleccionar:

Formato de punto de datosLínea ¿ Ninguna

Situarse, luego, sobre un punto de la Serie “Y mod”, y con el botón derecho seleccionar

Formato de punto de datos

Marcador¿

 Ninguno

El resultado es el gráfico de la página 113, donde se puede valorar el modelo.

Para hacer la representación gráfica de los residuos en función del tiempo, seleccionar, de

la hoja Tendencia−−−−Modelo, los valores del tiempo y de los residuos, o sea, A1−−−−A73 y

H1−−−−H73.

Con el icono de gráficos

Asistente para Gráficos (figura 1.5)

XY (Dispersión)(3; 1), Dispersión con puntos conectados por líneasSiguiente

Paso 2: Siguiente

Paso 3: Poner los títulos, por ejemplo Residuos, sacar la leyenda y Siguiente

Paso 4: Situar el gráfico como ¿ Objeto en la hoja Gráficos. Terminar

Editar el gráfico para, entre otras cosas, sacar los valores del eje de abscisas fuera delmismo, para ello se sitúa el cursor sobre el eje de ordenadas, Eje de valores (Y), yhaciendo doble clic sale la pantalla Formato de ejes.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 100: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 100/154

Práctica 1. Descomposición clásica de una serie aditiva p105

En la pestaña Escala, modificar

Mínimo:−−−−800

Eje de Valores (X) cruza en: −−−−800

En la pestaña Número, en Posiciones decimales poner un cero.El resultado es el gráfico de la página 114.

Conclusiones: La correspondencia entre los datos y el modelo es lo suficientemente buena.No se detecta ningún punto especialmente alejado del comportamiento modelizado por elconjunto. La mayoría de los residuos se mueven en el intervalo de −400 a 400, el más

alejado de cero correspondiendo a los valores del tiempo 2, 27 y 33, que no parecenespecialmente anómalos en el gráfico del modelo ajustado.

1.7 Previsiones

Si se quieren conocer las previsiones de las ventas del supermercado que estamosestudiando, a lo largo de las tres próximas semanas (18 días) en la hoja

Tendencia−−−−Modelo prolongar las columnas del tiempo, la tendencia, la estacionalidad y

crear una nueva columna para las previsiones.

Para la columna A, Tiempo, arrastrar presionando la tecla Ctrl desde la casilla A73 hasta laA91, donde ha de aparecer el valor 90.

En la E74, Estacionalidad, el primer valor que se debe añadir es el que corresponde altiempo 73, es decir múltiple de 6 más 1; por tanto, hay que copiar desde el primer valor delíndice hasta el 18. Marcar como bloque las casillas E2−E19 y hacer Edición6666 Copiar.

Situados en E74, Edición6666 Pegar.

En la F, Tendencia, arrastrar la expresión desde el último valor disponible, el 73, hasta eldeseado, el 91.Situados en I1, poner como título Previsiones.

En I74 escribir la expresión = E74 + F74 y arrastrarla hasta E91.

Haciendo eso, obtenemos los resultados que se muestran en la página 110.

El gráfico de las previsiones, junto con la serie original, se obtendrá seleccionando A1−−−−A91,

C1−−−−C91 y I1−−−−I91 de la hoja Tendencia−−−−Modelo.

Con el icono de gráficos

Asistente para Gráficos (figura 1.5)XY (Dispersión)(3; 1), Dispersión con puntos conectados por líneasSiguiente

 © Los autores, 2001; © Edicions UPC, 2001.

Page 101: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 101/154

p106   Series temporales

Paso 2: Siguiente

Paso 3: Poner los títulos, por ejemplo Serie y previsiones, tiempo y ventas, sacarla leyenda y Siguiente

Paso 4: Situar el gráfico como ¿ Objeto en la hoja Gráficos. Terminar

Puede ser necesario editar el gráfico por que la escala de abscisas vaya desde cero hastaochenta, y también modificar los tipos de líneas y puntos de la serie Y y de la serieprevisiones, para destacar claramente los dos grupos de puntos.

El resultado es el gráfico de la página 114.

Conclusiones: Las previsiones siguen el mismo tipo de comportamiento que los datosoriginales y, dada la bondad del modelo, pueden considerarse lo suficientemente fiables.

Pero, ¿tenemos derecho a hacer previsiones de aquí a 18 días?; ¿podríamos hacerprevisiones a más largo plazo? La práctica 2 nos dará herramientas para contestar a estaspreguntas.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 102: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 102/154

Práctica 1. Descomposición clásica de una serie aditiva p107

1.8 Resultados

1

2

3

4

5

6

7

8

9

10

1112

13

14

15

16

17

18

19

20

21

22

23

2425

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

A B C D E F G H

Semana Dia Tiempo Y Y(p=6) Y móvil W Ind. Est

1 lunes 1 3968 -2342,52

1 martes 2 4572 -951,07

1 miércoles 3 3964 -1974,48

1 jueves 4 6326 6135,00 6103,75 222,25 293,63

1 viernes 5 9673 6072,50 6138,75 3534,25 3087,20

1 sábado 6 8307 6205,00 6188,25 2118,75 1887,24

2 lunes 7 3593 6171,50 6202,92 -2609,92 -2342,52

2 martes 8 5367 6234,33 6218,67 -851,67 -951,07

2 miércoles 9 3763 6203,00 6194,67 -2431,67 -1974,48

2 jueves 10 6703 6186,33 6196,67 506,33 293,632 viernes 11 9485 6207,00 6152,42 3332,58 3087,20

2 sábado 12 8207 6097,83 6079,08 2127,92 1887,24

3 lunes 13 3717 6060,33 5981,58 -2264,58 -2342,52

3 martes 14 4712 5902,83 5871,75 -1159,75 -951,07

3 miércoles 15 3538 5840,67 5781,83 -2243,83 -1974,48

3 jueves 16 5758 5723,00 5672,25 85,75 293,63

3 viernes 17 9112 5621,50 5626,42 3485,58 3087,20

3 sábado 18 7501 5631,33 5640,08 1860,92 1887,24

4 lunes 19 3108 5648,83 5720,33 -2612,33 -2342,52

4 martes 20 4771 5791,83 5774,75 -1003,75 -951,07

4 miércoles 21 3643 5757,67 5798,67 -2155,67 -1974,48

4 jueves 22 6616 5839,67 5882,17 733,83 293,63

4 viernes 23 8907 5924,67 5896,00 3011,00 3087,204 sábado 24 7993 5867,33 5923,25 2069,75 1887,24

5 lunes 25 3618 5979,17 5895,83 -2277,83 -2342,52

5 martes 26 4427 5812,50 5801,75 -1374,75 -951,07

5 miércoles 27 4314 5791,00 5735,08 -1421,08 -1974,48

5 jueves 28 5616 5679,17 5619,25 -3,25 293,63

5 viernes 29 8778 5559,33 5600,25 3177,75 3087,20

5 sábado 30 7322 5641,17 5633,83 1688,17 1887,24

6 lunes 31 2899 5626,50 5660,58 -2761,58 -2342,52

6 martes 32 4918 5694,67 5689,17 -771,17 -951,07

6 miércoles 33 4226 5683,67 5713,92 -1487,92 -1974,48

6 jueves 34 6025 5744,17 5786,58 238,42 293,63

6 viernes 35 8712 5829,00 5824,92 2887,08 3087,20

6 sábado 36 7685 5820,83 5767,75 1917,25 1887,24

7 lunes 37 3408 5714,67 5665,67 -2257,67 -2342,52

7 martes 38 4869 5616,67 5577,25 -708,25 -951,07

7 miércoles 39 3589 5537,83 5510,75 -1921,75 -1974,48

7 jueves 40 5437 5483,67 5442,58 -5,58 293,63

7 viernes 41 8239 5401,50 5348,83 2890,17 3087,20

7 sábado 42 7360 5296,17 5303,67 2056,33 1887,24

8 lunes 43 2915 5311,17 5363,08 -2448,08 -2342,52

8 martes 44 4237 5415,00 5458,00 -1221,00 -951,07

8 miércoles 45 3679 5501,00 5510,58 -1831,58 -1974,48

8 jueves 46 6060 5520,17 5525,50 534,50 293,63

8 viernes 47 8755 5530,83 5508,67 3246,33 3087,20

8 sábado 48 7475 5486,50 5454,17 2020,83 1887,24

9 lunes 49 2979 5421,83 5361,50 -2382,50 -2342,52

Hoja: Datos

 © Los autores, 2001; © Edicions UPC, 2001.

Page 103: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 103/154

p108   Series temporales

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

67

68

69

70

71

72

73

74

75

76

77

78

79

80

81

82

83

84

85

86

87

88

89

90

A B C D E F G H

9 martes 50 3971 5301,17 5270,92 -1299,92 -951,07

9 miércoles 51 3291 5240,67 5183,58 -1892,58 -1974,48

9 jueves 52 5336 5126,50 5173,17 162,83 293,63

9 viernes 53 8392 5219,83 5280,08 3111,92 3087,20

9 sábado 54 6790 5340,33 5326,08 1463,92 1887,24

10 lunes 55 3539 5311,83 5369,33 -1830,33 -2342,52

10 martes 56 4694 5426,83 5376,83 -682,83 -951,07

10 miércoles 57 3120 5326,83 5368,83 -2248,83 -1974,48

10 jueves 58 6026 5410,83 5387,08 638,92 293,63

10 viernes 59 7792 5363,33 5365,92 2426,08 3087,20

10 sábado 60 7294 5368,50 5377,42 1916,58 1887,24

11 lunes 61 3254 5386,33 5349,83 -2095,83 -2342,52

11 martes 62 4725 5313,33 5357,33 -632,33 -951,07

11 miércoles 63 3227 5401,33 5376,42 -2149,42 -1974,48

11 jueves 64 5588 5351,50 5349,42 238,58 293,63

11 viernes 65 8320 5347,33 5340,92 2979,08 3087,20

11 sábado 66 6995 5334,50 5353,08 1641,92 1887,24

12 lunes 67 3229 5371,67 5333,42 -2104,42 -2342,52

12 martes 68 4648 5295,17 5281,75 -633,75 -951,07

12 miércoles 69 3450 5268,33 5262,33 -1812,33 -1974,48

12 jueves 70 5129 5256,33 293,63

12 viernes 71 8159 3087,20

12 sábado 72 6923 1887,24

Promedio de W

dia Total Ind. Est

lunes -2331,37 -2342,5202

martes -939,924 -951,07323

miércoles -1963,33 -1974,4823

 jueves 304,7803 293,631313

viernes 3098,348 3087,19949

sábado 1898,394 1887,24495

Total general 11,14899

Hoja: Datos (continuación)

 © Los autores, 2001; © Edicions UPC, 2001.

Page 104: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 104/154

Práctica 1. Descomposición clásica de una serie aditiva p109

1

2

3

4

5

6

7

89

10

11

12

13

14

15

16

17

18

19

20

21

22

2324

25

26

27

28

29

30

31

32

33

34

35

36

37

3839

40

41

42

43

44

45

46

47

48

49

50

A B C D E F G H I

Tiempo Tiempo^2 Y Y móvil Ind. Est Tendencia Y mod Residuos Previsiones

1 1 3968 -2342,52 6284,39 3941,87 26,13

2 4 4572 -951,07 6257,63 5306,56 -734,56

3 9 3964 -1974,48 6231,23 4256,75 -292,75

4 16 6326 6103,75 293,63 6205,19 6498,82 -172,82

5 25 9673 6138,75 3087,20 6179,51 9266,71 406,29

6 36 8307 6188,25 1887,24 6154,19 8041,43 265,57

7 49 3593 6202,92 -2342,52 6129,23 3786,71 -193,718 64 5367 6218,67 -951,07 6104,63 5153,56 213,44

9 81 3763 6194,67 -1974,48 6080,39 4105,91 -342,91

10 100 6703 6196,67 293,63 6056,51 6350,14 352,86

11 121 9485 6152,42 3087,20 6032,99 9120,19 364,81

12 144 8207 6079,08 1887,24 6009,83 7897,07 309,93

13 169 3717 5981,58 -2342,52 5987,03 3644,51 72,49

14 196 4712 5871,75 -951,07 5964,59 5013,52 -301,52

15 225 3538 5781,83 -1974,48 5942,51 3968,03 -430,03

16 256 5758 5672,25 293,63 5920,79 6214,42 -456,42

17 289 9112 5626,42 3087,20 5899,43 8986,63 125,37

18 324 7501 5640,08 1887,24 5878,43 7765,67 -264,67

19 361 3108 5720,33 -2342,52 5857,79 3515,27 -407,27

20 400 4771 5774,75 -951,07 5837,51 4886,44 -115,44

21 441 3643 5798,67 -1974,48 5817,59 3843,11 -200,11

22 484 6616 5882,17 293,63 5798,03 6091,66 524,3423 529 8907 5896,00 3087,20 5778,83 8866,03 40,97

24 576 7993 5923,25 1887,24 5759,99 7647,23 345,77

25 625 3618 5895,83 -2342,52 5741,51 3398,99 219,01

26 676 4427 5801,75 -951,07 5723,39 4772,32 -345,32

27 729 4314 5735,08 -1974,48 5705,63 3731,15 582,85

28 784 5616 5619,25 293,63 5688,23 5981,86 -365,86

29 841 8778 5600,25 3087,20 5671,19 8758,39 19,61

30 900 7322 5633,83 1887,24 5654,51 7541,75 -219,75

31 961 2899 5660,58 -2342,52 5638,19 3295,67 -396,67

32 1024 4918 5689,17 -951,07 5622,23 4671,16 246,84

33 1089 4226 5713,92 -1974,48 5606,63 3632,15 593,85

34 1156 6025 5786,58 293,63 5591,39 5885,02 139,98

35 1225 8712 5824,92 3087,20 5576,51 8663,71 48,29

36 1296 7685 5767,75 1887,24 5561,99 7449,23 235,77

37 1369 3408 5665,67 -2342,52 5547,83 3205,31 202,6938 1444 4869 5577,25 -951,07 5534,03 4582,96 286,04

39 1521 3589 5510,75 -1974,48 5520,59 3546,11 42,89

40 1600 5437 5442,58 293,63 5507,51 5801,14 -364,14

41 1681 8239 5348,83 3087,20 5494,79 8581,99 -342,99

42 1764 7360 5303,67 1887,24 5482,43 7369,67 -9,67

43 1849 2915 5363,08 -2342,52 5470,43 3127,91 -212,91

44 1936 4237 5458,00 -951,07 5458,79 4507,72 -270,72

45 2025 3679 5510,58 -1974,48 5447,51 3473,03 205,97

46 2116 6060 5525,50 293,63 5436,59 5730,22 329,78

47 2209 8755 5508,67 3087,20 5426,03 8513,23 241,77

48 2304 7475 5454,17 1887,24 5415,83 7303,07 171,93

49 2401 2979 5361,50 -2342,52 5405,99 3063,47 -84,47

Hoja: Tendencia−Modelo

 © Los autores, 2001; © Edicions UPC, 2001.

Page 105: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 105/154

p110   Series temporales

51

52

5354

55

56

57

58

59

60

61

62

63

64

65

66

67

68

69

70

71

72

73

74

75

76

77

78

79

80

81

8283

84

85

86

87

88

89

90

91

92

9394

95

96

97

98

99

100

101

102

103

104

105

106

107

108

109

110

111112

A B C D E F G H I

50 2500 3971 5270,92 -951,07 5396,51 4445,44 -474,44

51 2601 3291 5183,58 -1974,48 5387,39 3412,91 -121,91

52 2704 5336 5173,17 293,63 5378,63 5672,26 -336,2653 2809 8392 5280,08 3087,20 5370,23 8457,43 -65,43

54 2916 6790 5326,08 1887,24 5362,19 7249,43 -459,43

55 3025 3539 5369,33 -2342,52 5354,51 3011,99 527,01

56 3136 4694 5376,83 -951,07 5347,19 4396,12 297,88

57 3249 3120 5368,83 -1974,48 5340,23 3365,75 -245,75

58 3364 6026 5387,08 293,63 5333,63 5627,26 398,74

59 3481 7792 5365,92 3087,20 5327,39 8414,59 -622,59

60 3600 7294 5377,42 1887,24 5321,51 7208,75 85,25

61 3721 3254 5349,83 -2342,52 5315,99 2973,47 280,53

62 3844 4725 5357,33 -951,07 5310,83 4359,76 365,24

63 3969 3227 5376,42 -1974,48 5306,03 3331,55 -104,55

64 4096 5588 5349,42 293,63 5301,59 5595,22 -7,22

65 4225 8320 5340,92 3087,20 5297,51 8384,71 -64,71

66 4356 6995 5353,08 1887,24 5293,79 7181,03 -186,03

67 4489 3229 5333,42 -2342,52 5290,43 2947,91 281,09

68 4624 4648 5281,75 -951,07 5287,43 4336,36 311,64

69 4761 3450 5262,33 -1974,48 5284,79 3310,31 139,69

70 4900 5129 293,63 5282,51 5576,14 -447,14

71 5041 8159 3087,20 5280,59 8367,79 -208,79

72 5184 6923 1887,24 5279,03 7166,27 -243,27

73 -2342,52 5277,83 2935,31

74 -951,07 5276,99 4325,92

75 -1974,48 5276,51 3302,03

76 293,63 5276,39 5570,02

77 3087,20 5276,63 8363,83

78 1887,24 5277,23 7164,47

79 -2342,52 5278,19 2935,67

80 -951,07 5279,51 4328,44

81 -1974,48 5281,19 3306,7182 293,63 5283,23 5576,86

83 3087,20 5285,63 8372,83

84 1887,24 5288,39 7175,63

85 -2342,52 5291,51 2948,99

86 -951,07 5294,99 4343,92

87 -1974,48 5298,83 3324,35

88 293,63 5303,03 5596,66

89 3087,20 5307,59 8394,79

90 1887,24 5312,51 7199,75

Resumen

stad st cos 

R 0,92513

R^2 0,85587

R^2 ajust 0,85130

Error típico 114,20021

n 66

ANOVA

u S de C C Va o p  

Regresión 2 4879153,47 2439576,7 187,059889 3,1646E-27

Residuos 63 821626,351 13041,688

Total 65 5700779,82

Coefs o t p co t Va o p  

Ord. Origen 6311,5139 51,8296 121,7743 1,7087E-76

Tiempo -27,3032 3,2473 -8,4079 6,9185E-12

Tiempo^2 0,1832 0,0433 4,2298 7,7177E-05

Hoja: Tendencia−Modelo (continuación)

 © Los autores, 2001; © Edicions UPC, 2001.

Page 106: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 106/154

Práctica 1. Descomposición clásica de una serie aditiva p111

 Evolución cronológica 

4000 

8000 

12000 

0  12  24  36  48  60  72 tiempo 

Vent

as 

Medias móviles (p=6) 

4000 

8000 

12000 

0  12  24  36  48  60  72 Tiempo 

Hoja: Gráficos

 © Los autores, 2001; © Edicions UPC, 2001.

Page 107: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 107/154

p112   Series temporales

Media móvil (tendencia)

5000

6000

7000

0 12 24 36 48 60 72

tiempo

 Tendencia 

5000 

6000 

7000 

0  12  24  36  48  60  72 tiempo 

Hoja: Gráficos (continuación)

 © Los autores, 2001; © Edicions UPC, 2001.

Page 108: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 108/154

Práctica 1. Descomposición clásica de una serie aditiva p113

Índices estacionales

-3000

-2000

-10000

1000

2000

3000

4000

1 2 3 4 5 6

 Modelo ajustado 

4000 

8000 

12000 

0  12  24  36  48  60  72 tiempo 

Ventas

Hoja: Gráficos (continuación)

 © Los autores, 2001; © Edicions UPC, 2001.

Page 109: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 109/154

p114   Series temporales

 Residuos 

-800 -400 

0 400 800 

0  12  24  36  48  60  72 tiempo 

Serie y previsiones 

0 2000 4000 6000 8000 

10000 12000 

0  30  60  90 tiempo 

V

enta

Hoja: Gráficos (continuación)

 © Los autores, 2001; © Edicions UPC, 2001.

Page 110: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 110/154

Práctica 2. Autocorrelación y correlograma p115

PR Á CTICA 2. AUTOCORRELACIÓN Y CORRELOGRAMA 

OBJETIVO: Con los datos del valor diario de la caja, resultado de las ventas de unsupermercado a lo largo de 12 semanas, que han sido analizados en la práctica anterior, sehan de calcular los coeficientes de autocorrelación, estudiar su significación estadística yobtener el correlograma; el objetivo final es ver hasta qué valor del tiempo se pueden hacerprevisiones.

Todo eso se realizará mediante la hoja de cálculo Excel 97 de Microsoft.

2.1 Recuperacion de los datos

Desde Excel hay que recuperar el archivo que contiene los datos objeto de la práctica, y que

se encuentra en el directorio habitual de la red, siguiendo la secuencia,

Archivo6666 Abrir

y ahora ir al directorio donde se encuentra el archivo Practica 2.xls, seleccionarlo ypresionar sobre Abrir.

Una vez tenemos el archivo abierto, observamos que consta de una hoja llamada Datosdonde figuran 3 columnas de 72 valores cada una. En cada columna hay 72 valores, esdecir, empieza en la fila 1 (con el título) y acaba en la 73. Recordemos que son los mismosvalores de la práctica 1.

2.2 Cálculo de los coeficientes de autocorrelación

Según hemos visto en el texto sobre series temporales, el coeficiente de autocorrelación secalcula como

kk

0

ˆr s

ˆ=

γ  

γ  

donde

N k

i i k

i 1k

(Y Y ) (Y Y )

ˆN

+

=

− −

=

∑γ   y

N2

i

i 10

(Y Y)

ˆN

=

=

∑γ  

con la recomendación de N > 50 y k ≤ N/4.

En el caso de la práctica, el número de observaciones es N = 72, hecho que nos permitellegar hasta un valor de k igual a 18.

En primer lugar debemos disponer de los valores de la variable centrada, o sea de

iY Y− . Escribimos Y−−−−Ybar como título en la casilla D1, y en la D2 la expresión

= C2 - PROMEDIO(C$2:C$73)

 © Los autores, 2001; © Edicions UPC, 2001.

Page 111: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 111/154

p116   Series temporales

Observaremos que se ha fijado el conjunto de valores de Y (columna C) con el símbolo $,con la finalidad de que al arrastrar la fórmula no vayan cambiando los valores con los que se

calcula la media. Extendemos la expresión hasta D73.

En la casilla G1 escribimos como título gamma_0, y en la G2 la expresión que permitecalcular su valor

= VARP(C2:C73)

Aquí se ha utilizado VARP en lugar de VAR para que el divisor sea N y no N−1 como seríaen el otro caso.

Para comenzar a preparar la tabla de resultados, se titulan

F8 ÄÄÄÄ k G8 ÄÄÄÄ gamma_k H8 ÄÄÄÄ r_k I8 ÄÄÄÄ r_k^2

J8 ÄÄÄÄV(r_k) K8 ÄÄÄÄ −−−−2S(r_k) L8 ÄÄÄÄ +2S(r_k)

En F9 se introduce el valor 1, y se arrastra en forma de incremento (presionandosimultáneamente la tecla de Ctrl) hasta F26; aquí habrá un 18.

En la columna G introducimos la expresión de la covariancia, γ k, de la página anterior, que

en el numerador tiene el producto escalar de dos vectores: el primero va desde Y1−Y

hasta 72 KY Y−

− , o sea, de D2 a D(73–k), y el segundo de Y1+k

−Y hasta Y72

−Y , o sea, de

D(2+k) a D73. Esto es un problema para arrastrar la fórmula de una casilla a las siguientes,ya que al aumentar el desplazamiento k un subíndice aumenta, (el 2+k), pero el otrodisminuye, (el 73−k). Este hecho obligará a escribir la fórmula, arrastrarla y, después,manualmente, y casilla a casilla, modificar el contador que tiene que decrecer. Ateniéndonosa ello en G9 debemos introducir la expresión de la covariancia para Kl, que se puede hacermediante la función SUMAPRODUCTO; es decir, presionaremos sobre el icono de

funciones y seleccionaremos, de entre las Matemáticas y trigonométricas, laSUMAPRODUCTO (figura 2.1), que no es más que el producto escalar de dos vectores,

Fig. 2.1

 © Los autores, 2001; © Edicions UPC, 2001.

Page 112: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 112/154

Práctica 2. Autocorrelación y correlograma p117

En el cuadro siguiente (figura 2.2), especificaremos los valores que vamos a utilizar,teniendo cuidado de fijar las posiciones inamovibles ($2 del primer vector y $73 por el

segundo), ya que, como se ha comentado, el primer vector siempre empieza en el primervalor de la Y centrada, eso es, D2, mientras que el segundo siempre acaba en el últimovalor de Y centrada, o sea, D73. Así el primer vector va de D$2 hasta D72 y el segundo deD3 hasta D$73. Una vez se presiona la tecla Aceptar, en la ventana superior queda escritala expresión = SUMAPRODUCTO(D$2... D$73): dicha expresión hay que ponerla entreparéntesis y dividirla por el número total de observaciones (72 en este caso) a fin de obtenerla autocovariancia para k=1. En la figura 2.3 se muestra cómo finalmente queda definida lacasilla G9.

Fig. 2.2

Fig. 2.3

Esta expresión se debe arrastrar hasta G26 y, de momento, no hacer caso de lo que

resulte. Ahora hay que cambiar la posición final del segundo elemento de la fórmula en cadacasilla de esta columna. Así

 © Los autores, 2001; © Edicions UPC, 2001.

Page 113: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 113/154

p118   Series temporales

Celda k expresión actual expresión definitiva

G10 2 =(SUMAPRODUCTO(D$2:D73 ... =(SUMAPRODUCTO(D$2:D71...G11 3 =(SUMAPRODUCTO(D$2:D74 ... =(SUMAPRODUCTO(D$2:D70...

••• ••• •••

G25 17 =(SUMAPRODUCTO(D$2:D88 ... =(SUMAPRODUCTO(D$2:D56...

G26 18 =(SUMAPRODUCTO(D$2:D89 ... =(SUMAPRODUCTO(D$2:D55...

Observar los valores resultantes en la página 120.

En H9, escribir la expresión del coeficiente de autocorrelación, eso es: = G9/G$2, y arrastrarhasta H26, donde figurará =G26/G$2.

La columna I tiene los cuadrados de los coeficientes de autocorrelación; para ello hay quehacer I9 =H9*H9 y extenderlo hasta I26.

En la columna J se ha de calcular la variancia de cada coeficiente, que según el texto deteoría es

1

1V(r )

N≅ y

k 12

k ii 1

1V(r ) 1 2 r

N

=

≅ +

Hacer J9   = 1/72J10 = (1+2*SUMA(I$9:I9))/72

y arrastrar hasta J26 donde habrá la expresión =(1+2*SUMA(I$9:I25))/72. Los extremos delintervalo de no significación, ± 2S(r_k), estarán en las columnas K y L.

K9 = −−−−2*RAIZ(J9)

L9 = 2*RAIZ(J9)

Arrastrar estas expresiones hasta K26 y L26. La tabla completa de resultados está en laspáginas 120 y 121.

2.3 Autocorrelograma

El gráfico se obtiene seleccionando F9 − F26, H9 − H26, K9 − K26 y L9 − L26.

Con el icono de gráficos

Asistente para GráficosXY (Dispersión)(3; 1), Dispersión con puntos conectados por líneas

  Siguiente

Paso 1: Siguiente

 © Los autores, 2001; © Edicions UPC, 2001.

Page 114: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 114/154

Práctica 2. Autocorrelación y correlograma p119

Paso 2: SiguientePaso 3: Poner los títulos, por ejemplo Autocorrelograma, quitar la leyenda y

Siguiente

Paso 4: Situar el gráfico con ¿ Objeto en la actual hoja Datos. Terminar

Situar el gráfico en la posición y el tamaño deseado, y editarlo para que presente el aspectohabitual de un correlograma.

Seleccionando un punto de la Serie 1, y haciendo clic con el botón derecho del ratón, sale elcuadro de la figura 2.4. Seleccionar: 

Tipo de gráfico 6 Columnas Aceptar

Fig. 2.4

Igualmente, sobre un punto de la Serie 2, en la pantalla de la figura 2.4, hacer

Formato de serie de datos

Carpeta Tramas:

Z Línea suavizada   Marcador ¿Ninguno

Repetir la misma operación, una vez situados en un punto de la Serie 3.

Si es necesario, se pueden quitar decimales del eje de ordenadas; para eso tendremos quesituarnos sobre el Eje de valores, y entonces, con doble clic, o presionando el botónderecho del ratón, seguir la secuencia

Formato de ejesCarpeta Número Posiciones decimales

y para quitar los valores de k de dentro del gráfico, en el Eje de categorías, eje de abscisas,

Formato de ejesCarpeta Tramas Rótulos de marca de graduación  ¿ Ninguno

El resultado es el gráfico de la página 121.

Comentarios: En el correlograma se confirma claramente la estacionalidad de período 6.

El coeficiente de autocorrelación asociado a k=18 aún es significativo, por eso se puedenhacer previsiones para los próximos 18 días, o sea, 3 semanas de ventas.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 115: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 115/154

p120   Series temporales

2.4 Resultados

1

2

3

4

5

67

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

2627

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

A B C D E F G H I J K L

Sema Dia Y Y-Ybar gamma_0

1 lunes 3968 -1653,36 4003801

1 martes 4572 -1049,36

1 miércoles 3964 -1657,36

1 jueves 6326 704,639

1 v iernes 9673 4051,641 sábado 8307 2685,64

2 lunes 3593 -2028,36 k gamma_k r_k r_k^2 V(r_k) - 2S(r_k) + 2S(r_k)

2 martes 5367 -254,361 1 1089260,8 0,2721 0,0740 0,0139 -0,2357 0,2357

2 miércoles 3763 -1858,36 2 -1528643 -0,3818 0,1458 0,0159 -0,2525 0,2525

2 jueves 6703 1081,64 3 -2302898 -0,5752 0,3308 0,0200 -0,2828 0,2828

2 viernes 9485 3863,64 4 -1654914 -0,4133 0,1708 0,0292 -0,3417 0,3417

2 sábado 8207 2585,64 5 873463,57 0,2182 0,0476 0,0339 -0,3684 0,3684

3 lunes 3717 -1904,36 6 3551137,5 0,8869 0,7867 0,0353 -0,3755 0,3755

3 martes 4712 -909,361 7 978459,2 0,2444 0,0597 0,0571 -0,4779 0,4779

3 miércoles 3538 -2083,36 8 -1429667 -0,3571 0,1275 0,0588 -0,4848 0,4848

3 jueves 5758 136,639 9 -2118164 -0,5290 0,2799 0,0623 -0,4992 0,4992

3 viernes 9112 3490,64 10 -1510880 -0,3774 0,1424 0,0701 -0,5294 0,5294

3 sábado 7501 1879,64 11 775336,95 0,1937 0,0375 0,0740 -0,5442 0,5442

4 lunes 3108 -2513,36 12 3213971,1 0,8027 0,6444 0,0751 -0,5480 0,5480

4 martes 4771 -850,361 13 902365,54 0,2254 0,0508 0,0930 -0,6098 0,6098

4 miércoles 3643 -1978,36 14 -1276624 -0,3189 0,1017 0,0944 -0,6144 0,6144

4 jueves 6616 994,639 15 -1892155 -0,4726 0,2233 0,0972 -0,6236 0,6236

4 viernes 8907 3285,64 16 -1373896 -0,3431 0,1178 0,1034 -0,6432 0,6432

4 sábado 7993 2371,64 17 700396,45 0,1749 0,0306 0,1067 -0,6533 0,6533

5 lunes 3618 -2003,36 18 2879249,8 0,7191 0,5171 0,1075 -0,6559 0,65595 martes 4427 -1194,36

5 miércoles 4314 -1307,36

5 jueves 5616 -5,36111

5 v iernes 8778 3156,64

5 sábado 7322 1700,64

6 lunes 2899 -2722,36

6 martes 4918 -703,361

6 miércoles 4226 -1395,36

6 jueves 6025 403,639

6 v iernes 8712 3090,64

6 sábado 7685 2063,64

7 lunes 3408 -2213,36

7 martes 4869 -752,361

7 miércoles 3589 -2032,36

7 jueves 5437 -184,361

7 v iernes 8239 2617,64

7 sábado 7360 1738,64

8 lunes 2915 -2706,36

8 martes 4237 -1384,36

8 miércoles 3679 -1942,36

8 jueves 6060 438,639

8 v iernes 8755 3133,64

8 sábado 7475 1853,64

9 lunes 2979 -2642,36

9 martes 3971 -1650,36

Hoja: Datos

 © Los autores, 2001; © Edicions UPC, 2001.

Page 116: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 116/154

Práctica 2. Autocorrelación y correlograma p121

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

6768

69

70

71

72

73

74

75

76

A B C D E F G H I J K L

9 miércoles 3291 -2330,36

9 jueves 5336 -285,361

9 v iernes 8392 2770,64

9 sábado 6790 1168,64

10 lunes 3539 -2082,36

10 martes 4694 -927,361

10 miércoles 3120 -2501,36

10 jueves 6026 404,639

10 viernes 7792 2170,64

10 sábado 7294 1672,64

11 lunes 3254 -2367,36

11 martes 4725 -896,361

11 miércoles 3227 -2394,36

11 jueves 5588 -33,3611

11 viernes 8320 2698,64

11 sábado 6995 1373,6412 lunes 3229 -2392,36

12 martes 4648 -973,361

12 miércoles 3450 -2171,36

12 jueves 5129 -492,361

12 viernes 8159 2537,64

12 sábado 6923 1301,64

Hoja: Datos (continuación)

AUTOCORRELOGRAMA

-1,0

-0,5

0,0

0,5

1,0

 © Los autores, 2001; © Edicions UPC, 2001.

Page 117: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 117/154

p122   Series temporales

PR Á CTICA 3. MODELIZACIÓN DE UNA SERIE CON VARIABLES CATEGÓRICAS

OBJETIVO: Se dispone de la evolución de un indicador económico a lo largo de 62trimestres. Tenemos que analizar los datos de esta serie cronológica, estimar el modelo decomportamiento con variables categóricas, estudiar su ajuste y hacer las previsionespertinentes. Todo esto se realizará mediante la hoja de cálculo Excel 97 de Microsoft.

3.1 Recuperación de los datos

Desde Excel recuperar el archivo que contiene los datos objeto de la práctica, y que seencuentran en el directorio habitual de la red. Por esto hemos de seguir la secuencia (figura3.1):

Archivo 6 Abrir

Y ahora ir al directorio donde se encuentra el archivo Practica 3.xls, seleccionarlo y Abrir.

Fig. 3.1

Una vez tenemos el archivo abierto, observamos que consta de una hoja denominada Datos

donde figuran 2 columnas de 62 valores cada una, con la estructura mostrada parcialmenteen la figura 3.2. En cada columna hay 62 valores, es decir, se empieza en la fila 1 (con eltítulo) y se acaba en la 63.

La columna A, llamada t, contiene valores de 1 a 62, correspondientes a los 62 intervalos detiempo (trimestres) en que se ha recogido la información, y la B, con el nombre de Y,contiene los valores del indicador económico que se está estudiando.

Fig. 3.2

 © Los autores, 2001; © Edicions UPC, 2001.

Page 118: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 118/154

Práctica 3. Modelización de una serie con variables categóricas p123

3.2 Análisis de la evolución de la serie cronológica

En primer lugar, hemos de analizar la evolución de la serie, cosa que ya hemos hecho en lapráctica nº1, pero es suficientemente rápido como para hacerlo de nuevo. Se selecciona

desde A1 hasta B63 (columnas t y Y) y se presiona el icono de gráficos , o también,en la barra de herramientas, Insertar y después Gráfico.

En el Asistente para Gráficos (figura 3.3) hemos de seleccionar XY (Dispersión) y ahorala opción (3; 1), es decir, Dispersión con puntos de datos conectados con líneas yTerminar.Situar el gráfico en el lugar que se desee, y editarlo según convenga.

Fig. 3.3

El resultado es el primer gráfico de la página 134 de esta práctica.Parece detectarse una estacionalidad de período 4, hecho que debemos confirmar medianteel correlograma. Este gráfico ha sido el objetivo de la práctica 2; aplicando la metodologíaexpuesta a los datos actuales resulta el correlograma mostrado en la página 132, donde sepuede ver, por una parte, la evidencia de una estacionalidad de período 4 y, por otra, que esadmisible hacer previsiones para cinco intervalos de tiempo.

Conclusiones: Se detecta una clara estacionalidad, de período p=4, y posiblemente unatendencia creciente y cuadrática. El modelo que se tendrá que estudiar será

Y = αααα0

+ αααα1t + αααα

2t

2+ ββββ

2Q

2+ ββββ

3Q

3+ ββββ

4Q

4+ ββββ

5Q

2t + ββββ

6Q

3t + ββββ

7Q

4t + εεεε

 © Los autores, 2001; © Edicions UPC, 2001.

Page 119: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 119/154

p124   Series temporales

3.3 Modelización con variables categóricas

  Creación de las variables

Para poder modelizar la serie, en primer lugar hemos de crear las variables categóricas, oindicatrices, teniendo en cuenta que, en el caso de la práctica, el período p es igual a 4.Para ello, se preparan los títulos de las columnas que contendrán los valores de lasvariables categóricas. Recordando que las representamos por Q y que sus índices vandesde 2 hasta p (teoría de series temporales), en las casillas C1, D1 y E1 escribiremos Q2,Q3, y Q4, tal como muestra la figura 3.4.

A continuación rellenaremos cada variable categórica con sus valores. Al ser el período iguala 4, hay 4 combinaciones diferentes de ceros y unos, una para cada componente del

período, y sabiendo que Qi vale la unidad si el orden del tiempo asociado es igual a i, y valecero en cualquier otro caso, el conjunto de valores es el que se muestra en el bloque C2−

E5, de la figura 3.4.

Una vez lleno el bloque anterior, sólo hemos de seleccionarlo y con Cortar y Pegar, llenartodas las casillas C ... E hasta la fila 63, o bien arrastrar el bloque presionandosimultáneamente el Ctrl (página 130).

Además, para estudiar el modelo, es necesario disponer de las columnas con los valorestQ

2, tQ

3y tQ

4, tiempo (t) y tiempo al cuadrado (t^2). Estos valores están en las columnas F,

... J. Para llenar estas columnas, es ya evidente que lo que debemos hacer es definirlas

como F2 = A2*C2, G2 = A2*D2, H2 = A2*E2, I2 =A2 y H2 = A2*A2.

Después arrastrar hasta la fila 63. En la figura 3.4 se puede ver la estructura que tomanestas columnas, y en la página 130 todos los valores.

Es una exigencia de Excel que todas las columnas de los términos que constituyen elmodelo hayan de ser consecutivas y contiguas.

Fig. 3.4

 © Los autores, 2001; © Edicions UPC, 2001.

Page 120: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 120/154

Práctica 3. Modelización de una serie con variables categóricas p125

  Obtención del modelo

De acuerdo con la naturaleza de los datos hay que plantear el modelo

20 1 2 2 2 3 3 4 4 5 2 6 3 7 4

ˆ ˆ ˆ ˆ ˆ ˆˆ ˆ ˆ ˆY t t Q Q Q Q t Q t Q t= + + + + + + + +α α α β β β β β β  

Para estimar los coeficientes y estudiar su significación, el procedimiento es:

Herramientas 6666 Análisis de datos6666 Regresión

En este momento aparece la pantalla de la figura 3.5, donde debemos rellenar los campossiguientes

Rango Y de entrada: $B$1:$B$63 (los valores de Y)

Rango X de entrada: $C$1:$J$63 (los valores de los regresores)

Z Rótulos

n Rango de salida  $A$125 (una casilla que esté vacía)

Los resultados se pueden ver en la página 133, con el título •••• Primer paso

Conclusiones: El coeficiente del término Q2 no es significativo (su nivel de significación es p= 0,292 > 0,05). Debemos eliminarlo del modelo lineal y volver a estimar los coeficientes.

Fig. 3.5

 © Los autores, 2001; © Edicions UPC, 2001.

Page 121: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 121/154

p126   Series temporales

Para eliminar el término Q2 y rehacer la regresión, con la rutina Regresión de Excel, esnecesario que todos los términos del modelo estén juntos; por tanto hemos de eliminar la

columna de Q2. Hacerlo así directamente podría ocasionar problemas y modificaciones enotras columnas ligadas a ésta. Para evitarlo recomendamos lo siguiente:

  Seleccionar con el ratón desde B1 hasta J63, presionar el botón derecho y hacerCopiar.

  Situarse, por ejemplo, en la casilla S1 (fila a partir de la cual todo está vacío) ydesplegar el menú Insertar (figura 3.6).

Fig. 3.6

  Seleccionar Pegado especial y ahora ¿¿¿¿Valores (figura 3.7)

Fig. 3.7

 © Los autores, 2001; © Edicions UPC, 2001.

Page 122: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 122/154

Práctica 3. Modelización de una serie con variables categóricas p127

  Ahora eliminar la columna asociada a Q2 (la T en el caso del ejemplo): para ello sepincha sobre la letra T distintiva de la columna, que quedará enmarcada por una línea

que parpadea; entonces se presiona el botón derecho y se selecciona Eliminar. Deesta manera las columnas siguientes avanzan un lugar y vuelven a estar todas juntas,es decir, empiezan en la S (valores de Y) y acaban en la Z (valores de t^2)

Y ahora hay que proceder como antes:

Herramientas 6666 Análisis de datos6666 Regresión

modificando los campos siguientes:

Rango X de entrada: $S$1:$Z$63 (los nuevos regresores)

n Rango de salida  $A$150 (una casilla que esté vacía)

Los resultados se pueden ver en la página 133 con el título • Segundo paso

Conclusiones: El modelo definitivo es

Y = 97,81 + 2,03 t + 0,014 t2 − 7,75 Q3+ 20,57 Q

4+ 0,39 t Q

2+ 0,85 t Q

3+ 0,99 t Q

4

• Analizar y comentar los valores de los coeficientes del modelo, su significación y el valor

del coeficiente de determinación (R^2) del ajuste.

3.4 Estimaciones y residuos

  Valores estimados

Una vez establecido el modelo tenemos que examinar el ajuste entre los datos y los valoresestimados según el modelo ajustado.

Por eso, en primer lugar cogemos un bloque con los términos y los coeficientes del modelodefinitivamente obtenido y hacemos un Cortar y Pegar en L2; en L1 escribimos Modelo:resultarán las casillas destacadas en azul en la página 131.

Después, en N1 escribimos el título de la columna, Yest, y en N2 el modelo, es decir

= M$2+M$3*D2+M$4*E2+M$5*F2+M$6*G2+M$7*H2+M$8*I2+M$9*J2

Debemos destacar la exigencia de fijar las celdas que contienen los coeficientes del modelo,para que al arrastrar la fórmula se mantengan constantes.

Arrastrando la casilla N2 hasta la N63 se obtienen los valores calculados, comoestimaciones de la variable estudiada, que se pueden ver en la página 131.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 123: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 123/154

p128   Series temporales

  Gráfico de los valores reales enfrente de los estimados

Es necesario seleccionar desde B2 hasta B63 y, presionando la tecla Ctrl, desde N2 hasta

N63. Después se presiona el icono de los gráficos yAsistente para Gráficos

Líneas(2, 1) Línea con marcadores… Terminar

Situaremos el gráfico como Objeto en la misma hoja, y lo editaremos, en la posición, laamplitud y el estilo deseados. El resultado se puede ver en el segundo gráfico de lapágina 134.

  Gráfico de residuos

En primer lugar debemos calcular los residuos; para esto es prepara la columna con eltítulo y se calculan los valores:

O1 : Res   O2 = B2 −−−− N2 (arrastrar hasta O63 (página 131))

Para hacer el gráfico se selecciona desde O2 hasta O63, se presiona y

Asistente para Gráficos

Líneas(2, 1) Línea con marcadores… Terminar

Situaremos el gráfico como Objeto en la misma hoja, y lo editaremos, en la posición, laamplitud y el estilo deseados. El resultado se puede ver en el primer gráfico de la página135.

Conclusiones: Observar y analizar detalladamente la evolución de los dos gráficos.

3.5 Previsiones

Atendiendo a que, según el correlograma (página 132), se pueden hacer previsiones paralos próximos 5 valores del tiempo, es necesario ampliar las columnas de las variablescategóricas y del tiempo con los 5 valores nuevos, del 63 hasta el 67. Estos valores se hande incorporar al final de la columna A, es decir desde A64 hasta A68 (página 130).

El primer valor para el que hay que hacer previsiones corresponde a t = 63, que es unmúltiple de 4 (15×4 = 60) más 3. Por tanto, la variable categórica Q3 valdrá 1 y las demás 0.

Situados en C64 podemos copiar el bloque C4 – E8, que es el de las categóricas que se

inicia en una tercera estación. Ahora seleccionaremos con el ratón desde F63 hasta J63 yarrastraremos hasta llenar la fila 68, que corresponde a la última previsión (página 130).

 © Los autores, 2001; © Edicions UPC, 2001.

Page 124: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 124/154

Práctica 3. Modelización de una serie con variables categóricas p129

Prepararemos la columna de las previsiones:

K1 = Y Prev (título)

y en K64 escribiremos el modelo , es decir,

=M$2+M$3*D64+M$4*E64+M$5*F64+M$6*G64+M$7*H64+M$8*I64+M$9*J64

arrastraremos hasta K68 y tendremos los valores de las 5 previsiones (página131).

Para hacer el gráfico se selecciona desde B2 hasta B68 y, presionando el Ctrl, desde K2

hasta K68 y desde N2 hasta N68. Se presiona el icono de los gráficos y

Asistente para GráficosLíneas

(2, 1) Línea con marcadores…Terminar

Situaremos el gráfico como Objeto en la misma hoja, y lo editaremos, en la posición, el

tamaño y el estilo deseados. El resultado se puede ver en el segundo gráfico de la página135.

Conclusiones: Analizar detalladamente el gráfico de las observaciones y las previsiones.Pensando que los datos corresponden a un indicador económico medido trimestralmente,comentar su evolución actual y futura así como el comportamiento diferencial propio decada trimestre.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 125: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 125/154

p130   Series temporales

3.6 Resultados

1

2

3

4

5

6

7

8

9

1011

12

13

14

15

16

17

18

19

20

A B C D E F G H I J

t Y Q2 Q3 Q4 tQ2 tQ3 tQ4 t t^2

1 105,86 0 0 0 0 0 0 1 1

2 97,79 1 0 0 2 0 0 2 4

3 96,1 0 1 0 0 3 0 3 9

4 127,44 0 0 1 0 0 4 4 16

5 108,78 0 0 0 0 0 0 5 25

6 112,61 1 0 0 6 0 0 6 36

7 111,43 0 1 0 0 7 0 7 49

8 145,71 0 0 1 0 0 8 8 64

9 118,37 0 0 0 0 0 0 9 8110 121,89 1 0 0 10 0 0 10 100

11 124,25 0 1 0 0 11 0 11 121

12 159,55 0 0 1 0 0 12 12 144

13 125,41 0 0 0 0 0 0 13 169

14 135,4 1 0 0 14 0 0 14 196

15 137,86 0 1 0 0 15 0 15 225

16 171,44 0 0 1 0 0 16 16 256

17 132,38 0 0 0 0 0 0 17 289

18 147,59 1 0 0 18 0 0 18 324

19 153,92 0 1 0 0 19 0 19 361

5051

52

53

54

55

56

57

58

59

60

61

6263

64

65

66

67

68

A B C D E F G H I J

49 232,76 0 0 0 0 0 0 49 240150 256,84 1 0 0 50 0 0 50 2500

51 271,36 0 1 0 0 51 0 51 2601

52 311,42 0 0 1 0 0 52 52 2704

53 243,9 0 0 0 0 0 0 53 2809

54 268,42 1 0 0 54 0 0 54 2916

55 291,25 0 1 0 0 55 0 55 3025

56 331,96 0 0 1 0 0 56 56 3136

57 255,46 0 0 0 0 0 0 57 3249

58 283,53 1 0 0 58 0 0 58 3364

59 307,82 0 1 0 0 59 0 59 3481

60 354,72 0 0 1 0 0 60 60 3600

61 276,58 0 0 0 0 0 0 61 372162 304,72 1 0 0 62 0 0 62 3844

63 0 1 0 0 63 0 63 3969

64 0 0 1 0 0 64 64 4096

65 0 0 0 0 0 0 65 4225

66 1 0 0 66 0 0 66 4356

67 0 1 0 0 67 0 67 4489

Hoja: Datos

 © Los autores, 2001; © Edicions UPC, 2001.

Page 126: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 126/154

Práctica 3. Modelización de una serie con variables categóricas p131

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

K L M N O

Y Prev Modelo Y est Res

Ord. Origen 97,8112 99,856 6,004

Q3 -7,7472 102,701 -4,911

Q4 20,5667 98,828 -2,728

tQ2 0,3863 130,677 -3,237

tQ3 0,8484 108,319 0,461

tQ4 0,9877 112,823 -0,213

t 2,0302 110,913 0,517

t^2 0,0143 143,433 2,277

117,238 1,132

123,402 -1,512

123,454 0,796

156,645 2,905

126,613 -1,203

134,437 0,963

136,451 1,409

170,314 1,126

136,445 -4,065

145,928 1,662

149,905 4,015

50

51

52

53

54

55

56

57

58

5960

61

62

63

64

65

66

67

68

K L M N O

231,526 1,234

254,283 2,557

273,960 -2,600

313,863 -2,443

245,464 -1,564

269,881 -1,461

291,520 -0,270

332,095 -0,135

259,859 -4,399

285,935 -2,405309,537 -1,717

350,782 3,938

274,710 1,870

302,445 2,275

328,010

369,926

290,018

319,412

346,939

Hoja: Datos (continuación)

 © Los autores, 2001; © Edicions UPC, 2001.

Page 127: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 127/154

p132   Series temporales

1

2

34

5

6

7

8

9

10

11

12

13

14

15

16

1718

19

20

21

22

23

24

25

26

27

28

A B C D E F G H I J K

t Y Y-Ybar gamma_0

1 105,86 -94,918 4277,898

2 97,79 -102,9883 96,1 -104,678

4 127,44 -73,338 k gamma_k r_k r_k^2 V(r_k) - 2S(r_k) + 2S(r_k)

5 108,78 -91,998 1 3562,405 0,833 0,693 0,016 -0,254 0,254

6 112,61 -88,168 2 3408,788 0,797 0,635 0,038 -0,392 0,392

7 111,43 -89,348 3 3149,145 0,736 0,542 0,059 -0,486 0,486

8 145,71 -55,068 4 3466,645 0,810 0,657 0,076 -0,553 0,553

9 118,37 -82,408 5 2791,202 0,652 0,426 0,098 -0,625 0,625

10 121,89 -78,888 6 2671,875 0,625 0,390 0,111 -0,667 0,667

11 124,25 -76,528 7 2435,804 0,569 0,324 0,124 -0,704 0,704

12 159,55 -41,228 8 2711,854 0,634 0,402 0,134 -0,733 0,733

13 125,41 -75,368 9 2076,334 0,485 0,236 0,147 -0,768 0,768

14 135,4 -65,378 10 1964,898 0,459 0,211 0,155 -0,787 0,787

15 137,86 -62,918 11 1745,883 0,408 0,167 0,162 -0,804 0,804

16 171,44 -29,338 12 1990,675 0,465 0,217 0,167 -0,818 0,81817 132,38 -68,398 13 1385,336 0,324 0,105 0,174 -0,835 0,835

18 147,59 -53,188 14 1281,548 0,300 0,090 0,178 -0,843 0,843

19 153,92 -46,858 15 1082,582 0,253 0,064 0,180 -0,850 0,850

20 179,39 -21,388 16 1282,895 0,300 0,090 0,182 -0,854 0,854

21 141,59 -59,188 17 717,469 0,168 0,028 0,185 -0,861 0,861

22 159,6 -41,178 18 636,614 0,149 0,022 0,186 -0,863 0,863

23 163,23 -37,548

24 205,54 4,762

25 161,71 -39,068

26 172,24 -28,538

27 173,17 -27,608

AUTOCORRELOGRAMA

-1,0

-0,5

0,0

0,5

1,0

Hoja: Correl

 © Los autores, 2001; © Edicions UPC, 2001.

Page 128: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 128/154

Práctica 3. Modelización de una serie con variables categóricas p133

  Resultados de la regresión

Primer paso

Coef. de determinaciónR^2 0,99803327

AN LISIS DE VARIANZAnu S.C. C.M. F p-val

Regresión 8 264708,064 33088,508 3361,908 7,37E-69

Residuos 53 521,636 9,842

Total 61 265229,699

Coefs Error típico t p-valOrd. Origen 98,9145 1,7628 56,1129 6,95E-49

Q2 -2,3396 2,1976 -1,0646 2,92E-01

Q3 -8,8900 2,2637 -3,9271 2,50E-04

Q4 19,4201 2,2980 8,4508 2,15E-11

tQ2 0,4416 0,0602 7,3341 1,31E-09

tQ3 0,8756 0,0633 13,8337 3,15E-19

tQ4 1,0150 0,0634 16,0203 5,78E-22

t 2,0067 0,0965 20,7852 3,82E-27

t^2 0,0142 0,0014 10,1580 4,85E-14

Segundo paso

Coef. de determinaciónR^2 0,99799121

AN LISIS DE VARIANZAnu S.C. C.M. F p-val

Regresión 7 264696,908 37813,844 3832,546 2,00E-70Residuos 54 532,791 9,867

Total 61 265229,699

Coefs Error típico t p-valOrd. Origen 97,8112 1,4278 68,5071 3,52E-54

Q3 -7,7472 1,9955 -3,8823 2,84E-04

Q4 20,5667 2,0325 10,1186 4,50E-14

tQ2 0,3863 0,0304 12,6897 7,78E-18

tQ3 0,8484 0,0580 14,6299 1,97E-20

tQ4 0,9877 0,0580 17,0261 2,29E-23

t 2,0302 0,0941 21,5725 3,26E-28

t^2 0,0143 0,0014 10,1963 3,42E-14

 © Los autores, 2001; © Edicions UPC, 2001.

Page 129: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 129/154

p134   Series temporales

 Evolución cronológica de los datos 

90 130 170 210 250 290 330 370 

0  8  16  24  32  40  48  56  64  t 

Datos reales y modelizados 

90 130 170 210 250 290 330 370 

0  8  16  24  32  40  48  56  64 t 

Y  Serie1  Serie2 Real  Model 

 © Los autores, 2001; © Edicions UPC, 2001.

Page 130: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 130/154

Práctica 3. Modelización de una serie con variables categóricas p135

 Residuos 

-10 -5 0 5 

10 

0  8  16  24  32  40  48  56  64  t 

Valores reales, modelizados y previsiones

90  130 170 210 250 290 330 370 410 

0  8  16   24   32   40   48   56   64   72   t 

Y Serie1  Serie2  Serie3 Real  Model  Prev 

 © Los autores, 2001; © Edicions UPC, 2001.

Page 131: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 131/154

p136   Series temporales

PR Á CTICA 4. MODELIZACIÓN Y PREVISIONES POR SUAVIZADO EXPONENCIAL

(MÉTODO DE BROWN)

OBJETIVO: Se dispone de la evolución de un indicador económico durante 31 días. Hay queanalizar los datos de esta serie cronológica, estimar el modelo de comportamiento y hacerlas previsiones pertinentes. Todo esto se realizará mediante la hoja de cálculo Excel 97 deMicrosoft.

4.1 Recuperación de los datos

Desde Excel recuperar el archivo que contiene los datos objeto de la práctica, y que seencuentran en el directorio habitual de la red. Para ello, debemos seguir la secuencia (figura4.1)

Archivo 6 Abrir

y ahora ir al directorio donde se encuentra el archivo Práctica 4.xls, seleccionarlo ypresionar Abrir.

Fig. 4.1

Una vez está abierto el archivo, observamos que consta de una hoja denominada Datos con2 columnas de 31 valores cada una y la estructura mostrada en la figura 4.2.La columna A, llamada Tiempo, contiene valores de 1 a 31 y la B, llamada Y, contiene losvalores del índice económico que se está estudiando.

Fig. 4.2

 © Los autores, 2001; © Edicions UPC, 2001.

Page 132: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 132/154

Práctica 4. Modelización y previsiones por suavizado exponencial  p137

4.2 Análisis de la evolución de la serie cronológica

En primer lugar, hay que analizar la evolución de la serie: para ello se selecciona desde B1

hasta B32 (valores de Y) y se presiona el icono de gráficos , o también, en la barra deherramientas, Insertar y después Gráfico. En el Asistente para Gráficos (figura 4.3),seleccionar Líneas.

Fig. 4.3

Y ahora la opción (2; 1), es decir, Línea con marcadores en cada valor de datos yTerminar.

Situar el gráfico como Objeto en la misma hoja, y editarlo en la posición y el tamañodeseados.

El resultado es el gráfico de la página 142.

Se muestra una tendencia creciente y no parece detectarse ningún tipo de estacionalidad,cosa que se confirmará mediante el correlograma. Este gráfico ha sido el objetivo de lapráctica 2; para obtenerlo copiamos todos los datos de la práctica en una nueva hoja quellamaremos Correl.  Aplicando la sistemática se obtienen los resultados mostrados en lapáginas 143 y 144, que confirman la no estacionalidad y la posibilidad de hacer previsionespara los tres próximos días. Se debe recalcar que no se está en las mejores condicionespara hacer un correlograma, porque tan sólo se dispone de 30 valores.

Conclusiones: Sin estacionalidad y con tendencia creciente, se puede estudiar la serieaplicando el suavizado exponencial según el método de Brown que incorpora una tendenciarectilínea y cambiante a lo largo del tiempo.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 133: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 133/154

p138   Series temporales

4.3 Método de Brown

Para modelizar una serie con este procedimiento hemos de seleccionar un valor delparámetro λ y calcular la serie suavizada, la doble suavizada, la ordenada en el origen, la

pendiente, el valor de la serie estimada, el error en cada instante y el error cuadrático medio.Cambiando el valor de λ se repite el proceso y se selecciona, como parámetro de

modelización, el que minimice el error cuadrático medio.

  Selección de λ

En la casilla A40 escribimos el valor inicial de λ, λ = 0,1 para empezar, y etiquetamos las

columnas según el contenido que tenemos destinado. Así:

A B C D E F G H I

1 Tiempo Y S S(2) a^ b^ Y est Error Y prevista2

Las expresiones utilizadas serán según el texto de series temporales, y su ubicación en lahoja de cálculo será:

casilla Expresión

S1

= Y1

St= λ Y

t+ ( 1 - λ) S

t−1

C2

C3

= B2

= $A$40*B3+(1−−−−$A$40)*C2 arrastrar hasta C32

S1

(2)= Y

1

St

(2)= λ S

t+ ( 1 - λ) S

t−1

(2)

D2

D3

= B2

= $A$40*C3+(1−−−−$A$40)*D2 arrastrar hasta D32

(2)

t t ta 2S S= − E2 = 2*C2−−−−D2 arrastrar hasta E32

(2)

t tb (S S )1

λ 

λ = −

− F2 = ($A$40/(1−−−−$A$40))*(C2−−−−D2) arrastrar hasta F32

t t 1 t 1ˆ ˆˆY a b

− −= + G3 = E2+F2 arrastrar hasta G32

t t t tˆR e Y Y= = − H3 = B3−−−−G3 arrastrar hasta H32

La casilla G33 se etiqueta como ECM para escribir en H34 la expresión

= SUMA.CUADRADOS(H3:H32) / 30 (error cuadrático medio)

Observaremos que se dispone de 31 valores de la serie y sólo hay 30 estimaciones y, portanto, 30 errores.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 134: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 134/154

Práctica 4. Modelización y previsiones por suavizado exponencial  p139

Se deben guardar los valores de cada λλλλ y su ECM, a fin de escoger la óptima. En casillas

vacías preparamos una tabla como la que muestra la figura 4.4, donde etiquetamos C40

como Lambda y D40 como E.C.M. A continuación escribimos en C41 el valor 0,1 ( λutilizada en los cálculos) y en D41  7,777, valor resultante de ECM según ha salido en lacasilla H34. (Esto lo podemos hacer manualmente o con Cortar y Pegar sólo valores).

Sustituyendo el valor de λ de la casilla A40 por 0,2, automáticamente cambiarán todos los

valores de los cálculos de las columnas C − H. Ahora anotamos 0,2 en C42 y el valor de

H34 (2,679 en este caso) en D42.

Sucesivamente se van cambiando los valores de λ (A40) por 0,3,… 0,9, y anotando junto

con sus ECM, desde C43−−−−D43 hasta C49

−−−−D49. Con los datos actuales, se detecta que elóptimo estará entre 0,4 y 0,5; por tanto, ponemos 0,45 en A40 y lo pasamos a C50

 juntamente con su ECM (H34), que en este caso es igual a 1,822 y que anotamos en D50.

39

40

41

42

43

4445

46

47

48

49

50

51

A B C D E F G H

0,45 Lambda E.C.M.

0,1 7,777

0,2 2,679

0,3 1,989

0,4 1,8360,5 1,833

0,6 1,917

0,7 2,077

0,8 2,321

0,9 2,669

0,45 1,822

0

2

4

6

8

0 0,5 1

ECM

λ

Fig. 4.4

  Previsiones

Una vez escogida la λ de trabajo, se puede pasar a calcular los valores previstos para los

próximos tres días, según se ha deducido del correlograma. Por eso prolongamos lacolumna A con los tres nuevos valores del tiempo (A33 = 32; A34 =33; A35 = 34).

El valor previsto para el instante t + T (31+T, en el caso de la práctica) es

t T t tˆˆY a b T

+= +#

En la casilla I33, perteneciente a la columna I etiquetada como Y prevista, se deberáescribir la expresión

= E$32+F$32*(A33-A$32)

 © Los autores, 2001; © Edicions UPC, 2001.

Page 135: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 135/154

p140   Series temporales

y arrastrarla hasta I35. Así acabamos de calcular los valores previstos para los próximos tresdías del índice económico estudiado. Todos los resultados se muestran en la página 141.

  Análisis de los gráficos

Seguidamente, y como ya es habitual, se procederá a la obtención del gráfico de los valoresreales, los modelizados y los previstos, y del gráfico de los errores.

Para ello se selecciona, presionando la tecla Ctrl, desde B1 hasta B32 (valores de Y), desdeG1 hasta G32 (valores de Y estimada) y desde I1 hasta I35 (valores de Y prevista), y se

presiona el icono de gráficos , o también, en la barra de herramientas, Insertar ydespués Gráfico.

En el Asistente para Gráficos seleccionar

XY (Dispersión)

(3,1) Dispersión con puntos de datos conectados por líneas

Terminar

Situaremos el gráfico como Objeto en la misma hoja, y lo editaremos en la posición y eltamaño deseados. El resultado es el gráfico de la página 142.

Para obtener el gráfico de los errores se procede seleccionando desde H1 hasta H32(valores de los errores) y exactamente igual que en el gráfico anterior. El resultado es elgráfico de la página 143.

Conclusiones: Las previsiones siguen muy bien todos los datos, a lo largo del tiempo derecogida de información. Los errores no muestran ninguna particularidad destacable.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 136: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 136/154

Práctica 4. Modelización y previsiones por suavizado exponencial  p141

4.4 Resultados

1

2

3

4

5

6

7

8

9

10

11

12

1314

15

16

17

18

19

20

21

22

23

24

25

26

2728

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

A B C D E F G H I

Tiempo Y S S(2) a^ b^ Y est Error Y prevista

1 9,51 9,51 9,51 9,51 0,00

2 7,71 8,70 9,15 8,25 -0,36 9,51 -1,800

3 6,39 7,66 8,48 6,84 -0,67 7,89 -1,500

4 6,67 7,21 7,91 6,52 -0,57 6,18 0,494

5 9,14 8,08 7,99 8,18 0,08 5,95 3,188

6 7,66 7,89 7,94 7,84 -0,04 8,25 -0,593

7 7,74 7,82 7,89 7,76 -0,05 7,80 -0,057

8 9,36 8,51 8,17 8,86 0,28 7,70 1,657

9 10,03 9,20 8,63 9,76 0,46 9,14 0,890

10 8,38 8,83 8,72 8,94 0,09 10,22 -1,842

11 7,12 8,06 8,42 7,70 -0,30 9,03 -1,906

12 9,06 8,51 8,46 8,56 0,04 7,40 1,66113 9,6 9,00 8,70 9,30 0,24 8,60 1,004

14 11,44 10,10 9,33 10,86 0,63 9,54 1,901

15 10,93 10,47 9,85 11,10 0,51 11,49 -0,562

16 13,1 11,65 10,66 12,65 0,81 11,61 1,487

17 13,51 12,49 11,48 13,50 0,82 13,46 0,045

18 13,93 13,14 12,23 14,05 0,74 14,32 -0,390

19 13,54 13,32 12,72 13,92 0,49 14,79 -1,253

20 15,65 14,37 13,46 15,27 0,74 14,41 1,240

21 15,13 14,71 14,02 15,40 0,56 16,02 -0,887

22 17,06 15,77 14,81 16,73 0,79 15,96 1,099

23 19,03 17,24 15,90 18,57 1,09 17,51 1,517

24 21,38 19,10 17,34 20,86 1,44 19,66 1,717

25 22,82 20,77 18,89 22,66 1,55 22,30 0,519

26 22,76 21,67 20,14 23,20 1,25 24,21 -1,44827 23,02 22,28 21,10 23,45 0,96 24,45 -1,430

28 23,62 22,88 21,90 23,86 0,80 24,41 -0,795

29 23,45 23,14 22,46 23,82 0,56 24,66 -1,212

30 24,57 23,78 23,05 24,51 0,60 24,37 0,197

31 24,17 23,96 23,46 24,45 0,41 25,11 -0,936

32 ECM = 1,822 24,86

33 25,27

34 25,67

0,45 Lambda E.C.M.

0,1 7,777

0,2 2,679

0,3 1,989

0,4 1,836

0,5 1,833

0,6 1,917

0,7 2,077

0,8 2,321

0,9 2,669

0,45 1,822

0

2

4

6

8

0 0,5 1

ECM

λ

Hoja: Datos

 © Los autores, 2001; © Edicions UPC, 2001.

Page 137: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 137/154

p142   Series temporales

Evolución cronológica

0

10

20

30

0 10 20 30 40

Tiempo

Y

Valores medidos y previsiones

0

10

20

30

0 10 20 30 40

Tiempo

Y Y est Y prevista

 © Los autores, 2001; © Edicions UPC, 2001.

Page 138: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 138/154

Práctica 4. Modelización y previsiones por suavizado exponencial  p143

Errores

-3-2-101234

0 10 20 30 40Tiempo

 1 2 3 4 5 6 7 8 9 

10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 

A  B  C  D  E  F  G  H  I  J  K Tiempo Y  Y - Ybar  gamma_0 

1  9,51  -4,602  37,975 2  7,71  -6,402 3  6,39  -7,722 4  6,67  -7,442 5  9,14  -4,972 6  7,66  -6,452 7  7,74  -6,372  k  gamma_k  r_k  r_k^2  V(r_k)  -2S(r_k)  +2S(r_k) 8  9,36  -4,752  1  35,107  0,924  0,855  0,032  -0,359  0,359 9  10,03  -4,082  2  31,592  0,832  0,692  0,087  -0,591  0,591 

10  8,38  -5,732  3  28,034  0,738  0,545  0,132  -0,727  0,727 11  7,12  -6,992  4  24,355  0,641  0,411  0,167  -0,818  0,818 12  9,06  -5,052  5  20,478  0,539  0,291  0,194  -0,880  0,880 13  9,6  -4,512  6  16,437  0,433  0,187  0,213  -0,922  0,922 14  11,44  -2,672  7  12,353  0,325  0,106  0,225  -0,948  0,948 15  10,93  -3,182  8  8,665  0,228  0,052  0,231  -0,962  0,962 16  13,1  -1,012  9  5,129  0,135  0,018  0,235  -0,969  0,969 17  13,51  -0,602  10  1,730  0,046  0,002  0,236  -0,972  0,972 18  13,93  -0,182 19  13,54  -0,572 20  15,65  1,538 21  15,13  1,018 22  17,06  2,948 23  19,03  4,918 24  21,38  7,268 25  22,82  8,708 26  22,76  8,648 27  23,02  8,908 28  23,62  9,508 29  23,45  9,338 30  24,57  10,458 31  24,17  10,058 

Hoja: Correl

 © Los autores, 2001; © Edicions UPC, 2001.

Page 139: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 139/154

p144   Series temporales

Autocorrelograma

-1,0

-0,5

0,0

0,5

1,0

 © Los autores, 2001; © Edicions UPC, 2001.

Page 140: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 140/154

Evaluaciones p145

EVALUACIONES DE SERIES TEMPORALES

ÍNDICE TEMÁTICO

1. DESCOMPOSICIÓN CLÁSICA

13.5.98................................................................... 1 − 2 − 3 − 4

3.5.99..................................................................... 1 − 2 − 3

23.6.99................................................................... 1 − 2 − 6

12.1.00................................................................... 1 − 2 − 3

17.5.00................................................................... 1 − 2 − 10

2. MODELIZACIÓN CON VARIABLES CATEGÓRICAS

13.5.98................................................................... 7 − 8 − 9

3.5.99..................................................................... 4 − 5 − 6

23.6.99................................................................... 3 − 4

12.1.00................................................................... 4 − 5

17.5.00................................................................... 3 − 4 − 5

3. AUTOCORRELACIÓN

13.5.98................................................................... 5 − 10

3.5.99..................................................................... 7

23.6.99................................................................... 7

12.1.00................................................................... 6 − 717.5.00................................................................... 6 − 7

4. SUAVIZADO EXPONENCIAL

13.5.98................................................................... 6

3.5.99..................................................................... 8 − 9 − 10

23.6.99................................................................... 5 − 8

12.1.00................................................................... 8 − 9

17.5.00................................................................... 8 − 9

 © Los autores, 2001; © Edicions UPC, 2001.

Page 141: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 141/154

p146 Series temporales

1 EVALUACIONES PROPUESTAS

Respuesta correcta +1; incorrecta −0,2

? 1. El modelo de tendencia ha sido T = 76,23 + 0,54 t − 0,02 t2. Los respectivos niveles de

significación de los términos t y t2

han sido 0,002 y 0,423. El modelo definitivo es

76,23+0,54t−0,02t2  76,23+0,54t Hay que recalcularlo ….…………….

 © Los autores, 2001; © Edicions UPC, 2001.

Page 142: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 142/154

Evaluaciones p147

13.5.98

? 1 Los valores disponibles de una serie temporal son: 11,2; 13,4; 9,9; 11,9; 14,2; 11,0; 13,1; 14,8;

12,2; 14,1; 16,3; .... Se trata de un modelo:

multiplicativo tendencia rectilínea estacionalidad de p=2

aditivo tendencia parabólica estacionalidad de p=3

. . . . . . . . . . ninguna tendencia estacionalidad de p=4

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

? 2 Por los datos anteriores, el valor de la tercera media móvil es:

11,75 12 12,15 13,36 . . . . . . . . . .

? 3 Los primeros datos de una serie multiplicativa p = 4 son: 32; 26; 22; 45; 52; 42; 29; ... El valor

de la media móvil asociada a t = 4 es:

31,25 36,25 38,25 40,25 . . . . . . . . . .

? 4 En una serie multiplicativa de p = 4, * * * *1 2 3 4= 43.4 = 37.9 = 52.5 = 66.2E E E E ; ¿cuál es el

valor de E3?

2.5 44.6 52.5 105 . . . . . . . . . .

? 5. Sobre 106 valores, la tendencia estimada es 254,9 + 0,25 t ; los índices estacionales son E1=

35,5; E2= 72,8; E

3= –60,7 y E

4= –47,6 y el último coeficiente de autocorrelación significativo es ρ

3.

El valor más alejado que se puede prever de la serie es:317,65 282,15 221,45 194,95 . . . . . . . . .

? 6. Se dispone de los datos cronológicos: Y1= 45,74; Y

2= 47,95; Y

3= 49,23; Y

4= 51,47; ...

Para un valor λ = 0,8, cuál es el cuarto valor de la serie suavizada (S4)?

48,89 51,37 41,18 50,95 . . . . . . . . . .

? 7. Un modelo aditivo de período 3, ha dado los siguientes índices estacionales: E1= 10; E

2= 20 y E

3=

 –30. Los coeficientes β2y β

3del modelo en variables categóricas se estiman como:

20 y 30 10 y –40 25 y 45  –10 y 10 . . . . . . . . . . .

? 8. La modelización de una serie aditiva con variables categóricas ha dado

Y = 104,8 –0,5 t –8,2 Q2+ 15,4 Q

3. El valor previsto para t = 50 es:

71,6 87 95,2 79,8 . . . . . . . . . . .

? 9. En la serie de la pregunta anterior, el último valor observado ha sido y = 81,5 para t = 49. ¿Qué

valor tiene el residuo?

 –13,2 0 1,2 9,4 . . . . . . . . . . .

? 10 Con 252 datos se han obtenido los coeficientes de autocorrelación: r1= 0,983; r

2= 0,537;

r3= 0,684; r

4= 0,322; ... ¿En qué intervalo de valores se puede considerar nulo ρ

3?

±0,266 ±0,236 ±0,299 ±0,225 . . . . . . . . . . .

 © Los autores, 2001; © Edicions UPC, 2001.

Page 143: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 143/154

p148 Series temporales

3.5.99

???Se dispone de 100 valores de una serie siendo los 6 últimos 53,0; 89,3; 66,6; 29,1; 194,8 y61,2. Se detecta que tiene una estacionalidad de periodo 5 y que es de tipo multiplicativo.

? 1. El valor de la última media móvil es:

74,02 86,56 88,2 87,38 ......................

? 2. Se ha obtenido E1= 108,3; E

2= 75,1; E

4= 220,6 y E

5= 65,6. ¿Qué valor tiene E

3?

25,8 30,4 −469,6 220,6 ....……………

? 3. Por la tendencia se han probado los modelos rectilíneo y parabólico, obteniendo

Modelo T = a + b t T = a + b t + c t2

Coeficientes a = 65,24 b = 0,79 a = 65,62 b = 0,68 c= 0,0050

p−−−−value − 0,0000 − 0,0221 0,6943

R2 0,893 0,900

¿Cuál es la previsión para t = 104?

420,07 97,21 126,05 325,16 ......………… .

???  Una serie de la que tenemos 92 valores se ha modelizado con variables categóricas

obteniéndose 22 3 4 5Y 250,83 1,27t 0,006t 5,35Q 8,27Q 10,2Q 15,60Q= + − + − − +

? 4. ¿Cuál es la longitud de la estacionalidad (p)?

3 4 5 6 no se sabe ..............................

? 5. Siendo Y92

= 320, ¿qué valor tiene su residuo?

−2,236 13,154 11,224 −6,137 ..............................

? 6. ¿Qué valor tiene el índice estacional E2?

no se sabe −0,496 4,854 −8,766 ..............................

? 7. En una serie de 100 datos, los coeficientes de autocorrelación calculados son r1= 0,952 r

2=

0,741 r3= 0,583 r

4= 0,492. ρ

4será considerado nulo si r

4, en valor absoluto, es menor que

0,2792 0,4050 0,4285 0,5412 ..............................

??  Los valores de una serie son 40,22; 54,89; 63,51; ....

? 8. En un suavizado exponencial con λ = 0,4, ¿cuál es el valor de S3?

58,338 53,0568 49,0220 52,1252 ..................

? 9. Según el método de Brown, ¿cuál es el valor modelado para t = 3 ( 3Y ) ?

63,790 56,614 51,956 40,220 ..................

? 10. Los valores de una serie son 67,38; 56,09; 75,11; 55,90 y 61,25 y los estimados según el

modelo resultante del análisis han sido 56,44; 62,29; 72,13; 59,60; y 65,45.¿Cuál es el valor

del error cuadrático medio (MSE)?

42,931 40,697 40,374 39,667 ...............................

 © Los autores, 2001; © Edicions UPC, 2001.

Page 144: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 144/154

Evaluaciones p149

23.6.99

????? Los primeros valores de una serie, de la que se dispone de 141 observaciones, son: 225;219; 196; 197; 235; 208; 191; 212; 216; .... Se trata de un modelo aditivo con estacionalidad de

período 4. Por el sistema clásico se ha obtenido como tendencia Tt= 200 + 0,10 t y como índices

estacionales E1

= 0,73; E2= 0,87 y E

3= –0,4.

? 1. ¿Cuál es el valor de la primera media móvil?

207,500 208,250 208,375 209,625 210,500 ...............

? 2. ¿Y cuál el del residuo para t = 8?

12,20 12,30 12,32 12,40 12,42 ...............

? 3. ¿Cuáles son los valores de les variables categóricas asociadas a t = 10?

(0; 0; 0) (1; 0; 0) (0; 1; 0) (0; 0; 1) (1; 1; 1) ..............

?  4. Si se hubiese modelado con variables categóricas, ¿cuál habría sido el valor de la

constante α0?

200,63 200,65 200,73 200,75 200,83 ................

? 5. En una ponderación exponencial simple ha resultado S3= 211,96. ¿Cuál es el valor de λ?

2,63 3,20 3,30 4,50 5,43 ................

? 6. En la modelización de una serie multiplicativa de p = 3, se ha obtenido Tt= 50 + 0,2 t + 0,1 t

2; E

1

= 150; E2= 50 y para t=3 el residuo ha sido R

3= 0,8. ¿Cuál es el valor de Y

3?

72,10 61,80 55,75 46,35 52,30 ...............

? 7. Con los 50 valores de una serie se ha obtenido50

2i

i 1

(y y) 4=

− =∑ ;49

i i 1

i 1

(y y) (y y) 3,6+

=

− − =∑ ;

48

i i 2

i 1

(y y) (y y) 3,2+

=

− − = −∑ y47

i i 3

i 1

(y y) (y y) 2,8+

=

− − = −∑ ¿Qué valor tiene la variancia de r3?

0,0600 0,0652 0,0712 0,0754 0,0780 ..............

? 8. Los valores de una serie sin estacionalidad y con tendencia rectilínea son 7,3; 7,8; 8,1; 8,5; 8,8;

9,0; .... Con λ = 0,4, ¿cuál es el valor modelizado para t=3?

7,700 7,380 7,004 7,540 7,860 ...............

 © Los autores, 2001; © Edicions UPC, 2001.

Page 145: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 145/154

p150 Series temporales

12.1.00

?? Unos datos cronológicos trimestrales han dado lugar a una tendencia T=120+1,4 t−0,2 t2

y a

una estacionalidad E1

= −10; E2= −8; E

3= 15 y E

4= 3.

? 1. ¿Qué diferencia existirá entre los valores estimados del primer trimestre del primer año

y el segundo del año siguiente?

−2   −25 −13 −4 18 ………

? 2. El último dato disponible es el de t = 47. ¿Cuál es el valor previsto para t = 50?

−310   −348 −378 −318   −345 ………

?3. En una serie aditiva de p= 7, los pares de valores (t, Yt) son (1; 15), (2; 19), (3; 17),…, (6;25), (7;

28), (8; 32), (9; 35), ... La media móvil para t = 4 es igual a 26. ¿Qué vale la de t = 5?

faltan datos 28,86 28,43 29,52 ………

?? Un modelo en variables categóricas, con ordenada en el origen igual a 500, ajustado sobre una

serie de período p=3, ha evidenciado que la serie crece 0,5 unidades por unidad de tiempo y que

la segunda estación supera a la primera en 20 unidades, mientras que la tercera está 30 unidades

por debajo de la segunda.

? 4. El valor del coeficiente Q3

es igual a

−30 −35 −5 −10 −15 ………

? 5. La previsión para t = 53 es

528 529,5 546,5 548 549,5 ….……

? 6. En una serie de 100 valores se ha obtenido100

i

i 1

y 0=

=∑ ;i

1002

i 1

y 125=

=∑ y97

i i 3

i 1

y y 120+

=

=∑ .

¿Qué vale r3?

faltan datos 0 0,80 0,96 1 ……… .

? 7. En una serie con 80 datos se ha obtenido r1 = 0,90; r2 = 0,80; r3 = 0,70; r4 = 0,60. ¿Cuál es elvalor absoluto límite de r

5para ser considerado distinto de cero?

0,43 0,50 0,53 0,61 0,64 ……… .

? 8. Los valores de una serie son 16,4; 16,9; 18,1; 18,5; 19,3; 19,8;… en un suavizado exponencial

con λ = 0,6. ¿Cuál es el error de previsión para t = 4?

0,805 0,925 0,960 1,115 1,300 ...…….

? 9. En la misma serie del apartado anterior y con igual factor de ponderación, ¿cuál sería el valor

estimado para t = 4 ( 4Y ) utilizando el método de Brown?

17,920 19,076 18,672 19,137 ……………

 © Los autores, 2001; © Edicions UPC, 2001.

Page 146: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 146/154

Evaluaciones p151

17.5.00

?? En la descomposición clásica de una serie aditiva de período estacional p = 7, se ha obtenidocomo tendencia T=223,82 + 0,63 t. La previsión para t = 102 ha sido 187,25.

? 1. ¿Qué vale la previsión para t = 109?faltan datos 292,49 191,66 182,66 .....................

? 2. Siendo Eila i-ésima estacionalidad, y sabiendo que E

6= E

4 − 27,16. ¿Cuál es la

previsión para t = 104?faltan datos 262,18 305,18 161,35 195,35 ................

??? Unos datos bimensuales se modelizan como

Y =187,52 + 0,42 t + 10 Q2 +12 Q3 + 16 Q4 −8 Q5 −2 Q6

? 3.¿En qué cantidad se diferencian el segundo y el sexto bimestre de un mismo año? (6º − 2

º)

−12 −10,32 −18 −16,74 ...........................

? 4. Si el último valor disponible es Y106

= 250,27, ¿ qué vale el residuo de este punto?−9,77 −30,27 5,73 2,23 ...........................

? 5. ¿Cuál es la previsión para t = 107?232,88 250,69 230,61 224,46 ............................

?? Con 100 datos se ha obtenido94

i i 6

i 1

(y y ) (y y )+

=

− −∑ = −483,22 y100

2i

i 1

(y y)=

−∑ = 793,42

? 6. ¿Qué vale r6?

hay un error   −0,371 −0,609 −0,684 ............

? 7. ¿Cuál es el intervalo de no significación para r6si r

1= −0,95; r

2= 0,32; r

3= −0,84; r

4= 0,60

y r5= 0,90?

±0,464   ±0,179   ±0,520 ±1,323 ............

? 8. Se dispone de los valores 23,87; 15,22; 42,75; 54,23 y 50,80. En una ponderación exponencialsimple con λ = 0,8, ¿qué vale el error cuadrático medio?

410,17 350,72 254,34 180,69 ...........................

? 9. En un suavizado exponencial por Brown, con λ = 0,7, sobre 50 datos, ha resultado Y50

= 55,87;

S50

= 49,32;(2)50S = 47,54. ¿Cuál es la previsión para t = 52?

70,25 59,41 40,23 36,44 ...........................

? 10. En una serie multiplicativa de período p = 3, se ha obtenido *1E = 15,25; *

2E = 30,50 y

*3E = 45,75. ¿Cuál es el valor del primer índice estacional?

25 50 100 150 200 ............

 © Los autores, 2001; © Edicions UPC, 2001.

Page 147: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 147/154

Evaluaciones p123

2 EVALUACIONES RESUELTAS

Respuesta correcta +1; incorrecta −0,2

l 1. En un análisis de componentes principales los valores propios, de la matriz de correlacio-nes, son {2,78; 2; 0,16; 0,05; 0,01} y g

13= 0,768. ¿Qué vale r

13?.

0,143¨ 0,527¨ 0,12¨ 0,3072n .............................................. ¨

Puesto que Σ di= 5 es un valor entero, coincidente con el número de valores propios, necesa-

riamente se trabaja con variables estandarizadas y se ha diagonalizado la matriz de correla-ciones. Entonces,

1 3 1 3 3r g d 0,768 0,16 0,3072= = =

 © L o s a u t o r e s , 2 0 0 1 ; © i i

Page 148: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 148/154

p124 Estadística industrial

17.3.99

En una tabla de correspondencias la 3ª columna es 13; 23; 17 y 20, y los totales de les colum-nas son 100; 97; 73; 133 y 152.

l 1. ¿Cuántos valores propios no triviales hay?

2¨ 3 n 4¨ 5¨ ......................................................................... ¨

Dado que hay p = 4 files y q = 5 columnas, resulta min (p–1, q–1) = 3.

l 2. ¿Cuál es la masa de la 2ª columna?

0,314¨ 0,240¨ 0,175 n 0,711¨ .............................................. ¨

Las masas de las columnas son

p

i j

 j i 1

 j p

 j

i 1

nn

fn

n

• =

=

= =

que, para j=2, es

2

2

 j

n 97f 0,175

n 555

= = =∑

l 3. ¿Cuál es el valor del perfil medio de las filas asociado a la 3ª columna?

0,714¨ 0,132 n 0,312¨ 0,511¨ ......................................... ¨

El perfil medio de las filas coincide con las masas de las columnas

3

3

n 73f 0,132

n 555

• = = =

l 4. ¿Qué vale la masa total?

1 n 0,13¨ 0,312¨ 0,811¨ .....................................................  ¨

La masa total es, obviamente,

p q

i j

i 1 j 1

nf f 1

n• •

= =

= = =∑ ∑

En un análisis de componentes principales los valores propios de la matriz de correlaciones

son {2,78; 2; 0,16; 0,05; 0,01} y g13

= 0,768.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 149: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 149/154

Evaluaciones p125

l 5. ¿De qué dimensión es el vector aleatorio?

4¨ 5 n 6¨ 7¨ ......................................................... ¨

La dimensión del vector aleatorio X, coincide con el número de valores propios. En este ca-

so p = 5.

l 6. ¿Qué vale r13

?.

0,143¨ 0,527¨ 0,12¨ 0,3072n .............................................. ¨

Dado que Σ di= 5, un valor entero coincidente con el nombre de valores propios, necesaria-

mente se trabaja con variables estandardizadas y se ha diagonalizado la matriz de correlacio-

nes. Entonces

1 3 1 3 3r g d 0,768 0,16 0,3072= = =

l 7. ¿Cuántos componentes principales se utilizarían?

1¨ 2 n 3¨ 4¨ .............................................................. ¨

La proporción acumulada que representan los valores propios (variancias de los componentes

principales) con relación al total es: 2,78/5 = 0,556 (2,78 + 2)/5 = 0,956 etc. Entonces los

dos primeros ya son suficientes ya que explican el 95,6% del total.

l 8. Al estudiar los componentes principales ha resultado

t

g1 = {0,48 0,32 0,47 0,48 0,46},tg

2= {0,40 0,21 0,8 –0,28 0,26} y Q = diag{4 9 6,25 7,75 8}. ¿Qué vale

p

i

i 1

d=

∑ ?

No se sabe¨ –3,14¨ 4¨ 35n ............................................. ¨

En las se indican Q = diag (s1

2s

2

2. . . s

p

2) y

p p2

i i

i 1 i 1

d s= =

=∑ ∑ resultando

p

i

i 1

d=

∑ = 35

 © Los autores, 2001; © Edicions UPC, 2001.

Page 150: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 150/154

p126 Estadística industrial

19.4.99

En una tabla de correspondencias les 3ª y 4ª filas son {47; 65; 78; 35} y {82; 42; 76; 23};

Además, las masas de las filas son {0,134; 0,268; 0,225; 0,223; 0,150}

l 1. ¿Cuál es la suma total, n?

225¨ 223¨ 777¨ 1000 n ............................................... ¨

Resulta3

3

n 225n 1000

f 0,225

= = =

l 2. Si la masa de la 3ª columna es 0,232, ¿qué vale X33?

1¨ 0,2141¨ 0,7197 n 0,0682¨ ............................................. ¨

Por definición 333 3

3 3

f 0,078X 0,7197

f f 0,225 0,232• •

= = =

Al estudiar los componentes principales ha resultadotg

1= {0,47 0,32 0,48 0,46 0,48},

tg

2=

{0,40 –0,28 0,8 0,21 0,26} y Q = diag{4 9 6,25 7,75 3,8}

l 3. Si r12

= 0,632, ¿qué vale d2?

22,14¨ 36,48¨ –25,78¨ 9,99 n .............................................. ¨

Las variancias, expuestas en la diagonal de la matriz Q, son razonablemente homogéneas,

indicando que se ha diagonalizado la matriz S, y teniendo en cuenta que

12 212

1

g dr

s= resulta

2 212 1

2 212

r s 0,632 4d 9,99

g 0,40

  ×= = =  

 

l 4. Si los dos primeros componentes expliquen un 95% de la variabilidad total, ¿qué vale d1+d

2?

27¨ 32¨ 64¨ 25,65 n ...................................................... ¨

Dado quep p

2i i

i 1 i 1

d s= =

=

∑ ∑= 27 y que 1 2

i

i

d d0,95

d

+=

∑resulta

d1+d

2= 0,95×27 = 25,65

l 5. Si la primera fila de la matriz RXY

es (0,942 0,265 0,202 –0,011 0,004), ¿qué porcentaje

de la variabilidad de X1es explicado por los tres primeros componentes?.

1¨ 0,5236¨ 0,9984 n 0,9763¨ .......................................¨

La explicación es3

2 2 2 2i j

 j 1

r 0,942 0,265 0,202 0,9984=

= + + =∑

 © L o s a u t o r e

Page 151: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 151/154

Evaluaciones p127

5.11.99

l 1. Habiendo diagonalizado la matriz de variancias-covariancias, ¿qué valep

2i 2

i 1

r=∑ ?

d2 ¨ 1¨ 0,9¨ Es una función cuadrática de g

i2 n ……..……..……..¨

Si se ha diagonalizado la matriz variancias-covariancias

RXY

= Q-1/2

G D1/2

según aparece en la Pág. 6 de los apuntes, por lo que el producto escalar estR

XYR

XY= D

1/2 tG Q

 –1G D

1/2

y siendo Q = diag ( S1

2. . . S

p

2), resulta

2p pi 22

i 2 22i 1 i 1 i

gr d

S= =

=∑ ∑función cuadrática de g

i2.

l 2. Si U23=33, U

32=44, 2 3U 10, U 30= = , S

2=5, S

3=10 y se estandariza, ¿qué vale X

23?

0,3n 4,6¨ 6,8¨ 1,4¨ ……………………………………..………..¨

2 3 3

2 3

3

U U 33 30X 0,3

S 10

− −= = =

l 3. Si el mayor valor absoluto de la matriz de correlaciones es 0,307, ¿qué procede?

Calcular los componentes principales¨ Estandarizar¨ Factorizar¨Analizar las variables directas n …………........…..............................………. ¨

Si máx |ρ| = 0,307, las correlaciones entre las variables son muy reducidas, la informaciónredundante es prácticamente nula y se requeriría un número muy elevado de componentespara explicar razonablemente la variabilidad total. Por todo ello los componentes principalesson inútiles.

Si D = diag(3,24 0,7 0,045 0,015) y G = 0,5

1 1 1 1

1 1 1 11 1 1 1

1 1 1 1

   

− −    − −    − −  

l 4. ¿Qué proporción de X3es explicada por Y

2?

17,5% n 92,3%¨ 1,125%¨ No se sabe¨ …………………………..…..¨

Puesto que la suma de los valores dies 4, el orden de la matriz, se ha diagonalizado la matriz

de correlaciones y la proporción de X3explicada por Y

2es

r32

2

= g32

2

d2 = (–0,5)2

×0,7 = 0,175

 © Los autores, 2001; © Edicions UPC, 2001.

Page 152: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 152/154

p128 Estadística industrial

l 5. ¿Qué vale la correlación experimental entre X3e Y

1?

  −1,2¨  −0,9 n  −0,1061¨ 3,4¨ ………………………………..…..…..

Teniendo en cuenta que la matriz D, de valores propios, así como la matriz G, de vectorespropios, son de orden 4×4, se trata de un análisis de p=4 variables y como la suma de los va-

lores dies cuatro, se ha diagonalizado la matriz de correlaciones y

r31

= g31 √ d

1= (–0,5) √ 3,24 = −0,9

l 6. El primer componente principal es

un factor de tamaño ¨ un contraste n una media¨ no se sabe¨ ……........... ¨

Un contraste de X1

y X2

con X3

y X4

ya que los correspondientes coeficientes gi1

cambian designo.

l 7. ¿Cuál es la variancia experimental de Y5?

No existe n 4¨ 3¨ 0,25¨ ………………...………………………¨

Dado que las matrices D y G son de orden 4×4, sólo hay cuatro variables y, por tanto, el nú-

mero de Componentes Principales es, también, 4 y no existe Y5.

l 8 ¿Cuál es la medida relativa de la información compartida por dos variables?

La razón de medias ¨ la razón de variancias ¨ la covariancia¨ la correlación n...................................................................................... ¨

La correlación es la medida adimensional relativa de la información compartida (covariancia)por dos variables aleatorias.

l 9 La homogeneidad entre modalidades de un criterio de clasificación es medida por

los factores comunes¨ el factor específico¨las correspondencias n la covariancia¨

.............…………………………....................... .¨Las correspondencias, comparando los perfiles mediante la distancia de χ2

.

ATENCIÓN, MARCAR LA ÚNICA RESPUESTA INCORRECTA

l 10 Los componentes principales:reducen la masa de datos¨ conservan la información ¨

eliminan información redundante¨ reducen el nº de individuosn

reducen el número de variables¨

Reducen el número de individuos es incorrecto, ya que disminuyen el número de variables.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 153: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 153/154

Evaluaciones p129

20.3.00

l 1. Una fila de una tabla de correspondencias es {13 26 39 22}, ¿cuál es el tercer elemento

de su perfil?

Falta n¨ 0,39 n 39¨ 1¨ ……………...............................………… ¨

El tercer elemento de su perfil es

i3 i3 i3

i i ij j

f n n 390,39

f n n 13 26 39 22• •

= = = =+ + +∑

l 2. Si el perfil de la 3ª fila es {0,31 0,60 0,74 0,26} y 3n • = 500, ¿qué vale el tercer elemento

de esa fila?

Hay un error n 370¨ 0,025¨ 0,01¨ .................…………..….....……. ¨

Hay un error ya que si fuese un perfil la suma de sus elementos sería 1 y aquí, obviamente, no

se cumple este requisito.

l 3. Si hay 14 puntos fila y 23 puntos columna, ¿cuántos valores propios nulos hay en total?

10n

13¨

……………........................…………….…....¨

Los valores propios no triviales (distintos de cero) son mín(p–1, q–1) = 13, por lo que los nulos

son

máx(p; q) – mín(p–1; q–1) = 23 – 13 = 10.

l 4. Si n13

= 24, n1• = 100, n•3

= 90 y n = 900, ¿qué vale el elemento correspondiente de la ma-

triz Z para el estudio de las distancias de χ2entre las columnas?

0,99¨ 0,95¨ 0,05¨ 0,8 n ………….......………….....….……… ¨

El elemento de la matriz Z será

13 13 13

1 3 1 3 1 3

f n / n n n 24 9000,8

f f n /n (n /n) n n 100 90• • • • • •

= = = =×

l 5. Si una columna es { 0,15 0,18 0,22 0,45 }, ¿es un perfil o es de frecuencias?

Hay un error ¨ Faltan datos¨ Es un perfil n Son frecuencias¨ ....................... ¨

Se reconoce que es un perfil si suma 1. Dado que la columna en cuestión cumple dicha condi-

ción se trata, efectivamente, de un perfil.

 © Los autores, 2001; © Edicions UPC, 2001.

Page 154: Pepió, M - Series temporales

7/27/2019 Pepió, M - Series temporales

http://slidepdf.com/reader/full/pepio-m-series-temporales 154/154

p130 Estadística industrial

l 6. Con Q = diag(2 4 1600 725), D = diag(3,5 0,4 0,07 0,03), si r12

= 0,87, ¿cuál es la parte

de V(X1) explicada por el segundo componente?

Falta g12 ¨ 0,87¨ 0,4¨ 0,7569n …………….....…….….…………¨

La matriz Q muestra que las variancias Si

2son harto heterogéneas, por lo que se ha estandar-

dizado (Opción B), circunstancia corroborada por el hecho de que traza D = p = 4, y la parte

de V(X1) = 1 explicada por el segundo componente principal coincide con la proporción, es

decir

r12

2= 0,87

2= 0,7569.

l 7. Si Q = diag(16 9 25 4) y cov(X1, X

3) = –18, ¿qué vale

3 1

X Xr ?

Falta n¨ –1,8¨ –0,9 n 0,361¨ …………….........………...…………¨

Resulta

X X X X3 1 1 3

1 3

1 3

cov(X , X ) 18r r 0,9

S S 16 25= = = − = −

×

l 8. Si los puntos de dos variables se oponen, representa que

se trata de un error ¨ son no correlacionadas¨