análisis de series de tiempo de caudales

13
Universidad Nacional Agraria La Molina Trabajo Semestral ANÁLISIS DE SERIES DE TIEMPO DE CAUDALES DEL RIO EL TALA Lucio Vergara Saturno Cod. 20090742 Diciembre - 2009 Escuela de Post Grado - Maestría en Recursos Hídricos Especialidad : Ingeniería de Recursos Hídricos Métodos Estadísticos en Hidrología

Upload: unalm

Post on 21-Jul-2015

1.174 views

Category:

Education


3 download

TRANSCRIPT

Universidad Nacional Agraria La Molina

Trabajo Semestral

ANÁLISIS DE SERIES DE TIEMPO DE CAUDALES DEL RIO EL TALA

Lucio Vergara Saturno

Cod. 20090742

Diciembre - 2009

Escuela de Post Grado - Maestría en Recursos Hídricos

Especialidad : Ingeniería de Recursos Hídricos

Métodos Estadísticos en Hidrología

METODOLOGÍAIngreso de Datos: Se incorporan los datos disponibles como un vector, es

decir en una única columna con el nombre X=”caudal” (m3/s).

Gráfica de la serie: Con el graficador de SPSS se representa la serie

histórica a fin de decidir la estacionariedad de la serie.

Fecha

MA

Y 1

960

JU

L 1

95

9

SE

P 1

958

NO

V 1

95

7

JA

N 1

957

MA

R 1

956

MA

Y 1

955

JU

L 1

95

4

SE

P 1

953

NO

V 1

95

2

JA

N 1

952

MA

R 1

951

MA

Y 1

950

JU

L 1

94

9

SE

P 1

948

NO

V 1

94

7

JA

N 1

947

MA

R 1

946

MA

Y 1

945

JU

L 1

94

4

SE

P 1

943

NO

V 1

94

2

JA

N 1

942

MA

R 1

941

MA

Y 1

940

JU

L 1

93

9

SE

P 1

938

NO

V 1

93

7

JA

N 1

937

Cau

dal(

m3/s

)

4,00

3,00

2,00

1,00

0,00

Serie temporal de caudales de río El Tala. Período 1937-1960

METODOLOGÍATransformaciones: antes de aplicar el método, conviene transformar la

serie original X. Esta transformación es imprescindible en caso de que la

varianza no sea constante.

Eliminación de la tendencia: La observación del gráfico indicará si existe

o no tendencia.

Año

196019581957195519531952195019481947194519431942194019381937

Ln

Q

1,00

0,00

-1,00

-2,00

Serie de Caudales del río El Tala transformada por Ln. Período 1937-1960

METODOLOGÍAIdentificación del modelo: Determinar el tipo de modelo más adecuado

para la serie. La decisión se tomara en base de los correlogramas de las

ACF y de la PACF que corresponden a los procesos autoregresivos y de

medias móviles de las componentes regular y estacional.

Para analizar la estabilidad de la varianza en la serie transformada se aplica

la prueba de Levene (Prueba de homogeneidad de las varianzas),

obteniéndose una significación de p=0.058.

196019591958195719561955195419531952195119501949194819471946194519441943194219411940193919381937

2.52.01.51.00.50.0

o

Intervalos de confianza de Bonferroni de 95% para Desv.Est.

Estadística de prueba 29.13

Valor P 0.176

Estadística de prueba 0.92

Valor P 0.565

Prueba de Bartlett

Prueba de Levene

Igualdad de Varianzas

Paquete MINITAB

Paquete SPSS

Prueba de homogeneidad de varianzas

LnQ

1.540 23 264 .058

Estadístico

de Levene gl1 gl2 Sig.

METODOLOGÍAEstimación de los coeficientes del modelo como se trata de un proceso

iterativo de cálculo, pueden indicarse valores iniciales.

Para determinar si la serie presenta tendencia se recurre a la función de

autocorrelación simple.

Función de autocorrelación simple de la serie de caudales sobre los 60 primeros retardos. Río El Tala 1937-1960 - SPSS

Núm. de retardos

5957555351494745434139373533312927252321191715131197531

AC

F

1,0

0,5

0,0

-0,5

-1,0

LnQ

Límite de confianza inferior

Límite de confianza superior

Coeficiente

METODOLOGÍADado que la serie no presenta tendencia, no será necesario diferenciarla y

el parámetro d será igual a 0.

Se considera ahora las funciones de autocorrelación simple y parcial sobre

los 16 primeros retardos después de tomar una diferenciación estacional

(D=1) que se presenta en el Gráfico. Los parámetros “P” y “Q” se estiman a

partir de estas funciones.

Núm. de retardos

16151413121110987654321

AC

F

1,0

0,5

0,0

-0,5

-1,0

LnQ

Límite de confianza inferior

Límite de confianza superior

Coeficiente

Funciones de autocorrelación simple de la serie caudales, diferenciada estacionalmente sobre los 16

primeros retardos.

METODOLOGÍALa serie observada tiene estacionalidad de período 12, y por lo tanto el

modelo se ajustaría a un ARIMA (p, d, q) (P, D, Q)12 .

Como los dos primeros coeficientes de la PACF son no nulos y el resto

tienden a cero, y en tanto los coeficientes en la ACF decrecen con el retardo

en forma exponencial o sinusoidal, el modelo será autoregresivo AR(p), de

orden P=2 y Q=0.

Núm. de retardos

16151413121110987654321

AC

F p

arc

ial

1,0

0,5

0,0

-0,5

-1,0

LnQ

Límite de confianza inferior

Límite de confianza superior

Coeficiente

Funciones de autocorrelación parcial de la serie caudales, diferenciada estacionalmente sobre los 16

primeros retardos.

METODOLOGÍAPara obtener los valores de p y q, se realiza similar análisis que el

determinado para p y q, pero con cinco retardos solamente, que se presenta

en el gráfico N 5. Se observa en el ACF dos valores no significativos, lo que

determina que p=2 y q=0.

Función de autocorrelación y de autocorrelación parcial de la serie de caudales

diferenciada estacionalmente sobre los 5 primeros retardos estacionales

Núm. de retardos

54321

AC

F p

arc

ial

1,0

0,5

0,0

-0,5

-1,0

LnQ

Límite de confianza inferior

Límite de confianza superior

Coeficiente

Núm. de retardos

54321

AC

F

1,0

0,5

0,0

-0,5

-1,0

LnQ

Límite de confianza inferior

Límite de confianza superior

Coeficiente

METODOLOGÍAVerificación: Se usan procedimientos para evaluar los modelos

preseleccionados, contraste de significación de parámetros, covarianza

entre estimadores, coef. de correlación, suma de cuadrado de errores,

etc.

METODOLOGÍA

Análisis de los errores: Las diferencias entre los valores observados y los

estimados por el modelo es una fuente de interés para valorarlo.

RESULTADOS

Selección del modelo: con los resultados de las etapas anteriores se

decide sobre el modelo definitivo.

MODELO FINAL ARIMA(2,0,0)(2,1,0)12

Predicción: el modelo seleccionado se usará como fórmula de predicción.

SERIE TEMPORAL DE CAUDALES DE RIO EL TALA. PERIODO 1937-1960

0.00

0.50

1.00

1.50

2.00

2.50

3.00

3.50

JAN 1

937

JUL 1

937

JAN 1

938

JUL 1

938

JAN 1

939

JUL 1

939

JAN 1

940

JUL 1

940

JAN 1

941

JUL 1

941

JAN 1

942

JUL 1

942

JAN 1

943

JUL 1

943

JAN 1

944

JUL 1

944

JAN 1

945

JUL 1

945

JAN 1

946

JUL 1

946

JAN 1

947

JUL 1

947

JAN 1

948

JUL 1

948

JAN 1

949

JUL 1

949

JAN 1

950

JUL 1

950

JAN 1

951

JUL 1

951

JAN 1

952

JUL 1

952

JAN 1

953

JUL 1

953

JAN 1

954

JUL 1

954

JAN 1

955

JUL 1

955

JAN 1

956

JUL 1

956

JAN 1

957

JUL 1

957

JAN 1

958

JUL 1

958

JAN 1

959

JUL 1

959

JAN 1

960

JUL 1

960

FECHA

CA

UD

AL

(m

3/s

)

Q-ORIG

Q-SPSS

Q-MINITAB

CONCLUSIONES

El modelo desarrollado permite realizar predicciones para períodos de

tiempo anteriores y posteriores al considerado en este análisis (1937-

1960). Del Gráfico Nº1 puede observarse la excesiva variabilidad de la

serie, lo que dificulta la obtención de un modelo que contemple tales

variaciones.

Así mismo, el análisis del fuerte efecto estacional de las series muestra la

existencia de un patrón semestral sobre el régimen de caudales del río El

Tala de la estación La Brea que viene a confirmar los resultados

obtenidos con técnicas de análisis mas sofisticados.

Con respecto a la comparación de los programas usados como el SPSS

y MINITAB, podemos mencionar que las metodologías de análisis que

realizan dichos programas son semejantes, pero teniendo una

considerable diferencia en los resultados de los modelos (Anexo),

incluyendo a las pruebas estadísticas, también la diferencia radica en la

forma de presentación y las ventanas de interfaz.