predicciones web a través de google analytics

10

Click here to load reader

Upload: alvaro-fierro

Post on 09-Jul-2015

87 views

Category:

Data & Analytics


0 download

DESCRIPTION

Acercamiento a la validación de un modelo ARIMA que prediga las visitas que va tener una determinada web en tres puntos: *Sesiones *Usuarios *Nº de páginas vistas La extracción de datos se realiza a través de Google Analytics en una muestra de 106 observaciones diarias, y las predicciones se realizarán a una semana vista.

TRANSCRIPT

Page 1: Predicciones web a través de google analytics

Predicciones web a través de Google Analytics

Un resumen metodológico mediante modelos ARIMA a través de Gretl

Álvaro Fierro: [email protected]

Jon Osés: [email protected]

Page 2: Predicciones web a través de google analytics

Objeto del Análisis

• Contrastar una metodología que permita identificar un modelo que permita predecir cuántas visitas va a tener una determinada página web, cuyo nombre omitimos en este estudio.

• Así, este trabajo excluimos los gráficos de series temporales, gráfico media- rango, correlogramas, etc.

Page 3: Predicciones web a través de google analytics

Definición del Análisis -Para tal fin, se utilizan como series históricas los datos que permite descargar Google Analytics en tres ámbitos objeto de predicciones: • Sesiones: Es el número total de sesiones que se han realizado en el

periodo. Una sesión es el periodo durante el cual un usuario interactúa con su sitio web, aplicación, etc. Todos los datos de uso (visitas a una pantalla, eventos, comercio electrónico, etc.) están asociados a una sesión.

• Usuarios: Usuarios que han interactuado con la aplicación, incluidos tanto los usuarios nuevos como los recurrentes

• Número de páginas vistas : Número total de páginas vistas; las visitas repetidas a una misma página también se contabilizan

(fuente: Google Analytics)

Page 4: Predicciones web a través de google analytics

Esquema de Datos

• Se toma la siguiente horquilla temporal: 17/02/2014 – 02/06/2014

• Los datos son de carácter diario • Se trabajan con 106 observaciones • La predicción se realiza a una semana vista

Page 5: Predicciones web a través de google analytics

Metodología (II)

Etapas del proceso de predicción: • Análisis de estacionariedad

– Gráfico Serie Temporal – Gráfico Media-Rango – FAC y FACP – Contrastes de raíz unitaria: ADF, Phillips-Perron,

KPSS • Identificación

– Modelo propuesto

Page 6: Predicciones web a través de google analytics

ANÁLISIS DE ESTACIONARIEDAD: Primeros Resultados

• No se tiene muy claro si la serie es estacionaria

en la parte regular, por lo que realizaremos los diferentes contrastes de existencia de raíz unitaria.

• En función de los resultados, tomaremos primeras diferencias regulares o no.

• En cambio, sí se ve claramente una fuerte estacionalidad. Hay retardos estacionales claramente significativos y decrecen lentamente; parece claro que tenemos que tomar diferencias estacionales.

Page 7: Predicciones web a través de google analytics

ANÁLISIS DE ESTACIONARIEDAD: Primeros Resultados

• Para conseguir que la serie se estacionaria en varianza

tomamos logaritmos de la serie original; normalmente esta transformación estabiliza la varianza e induce homocedasticidad. Una vez realizado el gráfico media-rango, se concluye que serie ya es estacionaria en varianza.

• En cuanto a la estacionariedad en media, es necesario tomar primeras diferencias regulares. Además en contraste ADF nos indica que no se rechaza la hipótesis nula de existencia de raíz unitaria.

• La estacionalidad permanece y se ve claramente los correlogramas de la serie de primeras diferencias de los logaritmos. Para ello, tomamos diferencias estacionales.

Page 8: Predicciones web a través de google analytics

ANÁLISIS DE ESTACIONARIEDAD: Resultados

• Finalmente, la serie de logaritmos con diferencias regulares y estacionales, es decir: integrada de orden uno en ambas partes, regular y estacional I(1,1).

• Esta será, por tanto, la serie a la cual se le va a identificar un modelo ARMA.

Page 9: Predicciones web a través de google analytics

IDENTIFICACIÓN

• Solamente un retardo estacional es significativo.

• Probaremos diferentes modelos; a priori comenzaríamos con un AR(1) para la parte estacional y no ajustaríamos nada para la parte regular ARIMA(0, 1, 0)x(1,1,0)

• En posteriores análisis se validará el modelo

Page 10: Predicciones web a través de google analytics