comparacion entre un sistema neuro difuso autoorganizado

9
INGENIERÍA Vol. 17 No. 2 ISSN 0121-750X UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS 26 Resumen En este artículo se presenta el estudio de una acción volátil de la Bolsa de Valores de Colombia la cual es analizada usando un modelo estadístico ARIMAX (Modelo autorregresivo integrado de media móvil con entrada exógena) y un SONFS (sistema neuro difuso auto organizado). Estos métodos son comparados teniendo en cuenta tres características: el menor EMA (Error Medio Absoluto), el residual entendido como un proceso de ruido blanco (evaluado mediante seis pruebas) y el AIC (criterio de información de Akaike); así se elige el modeloque mejor se ajusta para la predicción de la serie. Palabras clave: ARIMAX, SONFS, Series Temporales Volátiles. Abstract This paper presents the selection of a volatile share from Colombian Stock Exchange, which is analyzed using ARIMAX (autoregressive integrated moving ave- rage with exogeneous input) and SONFS (self organizing neural fuzzy sytem) models. These methods are compared using three features: the MAE ( mean absolute error ), residuals as a white noise process and the AIC (Akaike Information Criterion). Key words: ARIMAX, SONFS, Volatile Time Series. 1. Introducción El mercado bursátil se caracteriza por la alta variabilidad en sus rendimien- tos, es decir que presenta alto riesgo, pero a su vez entrega mayores rendimientos que otras alternativas de inversión [1]. Por estas razones es importante antici- parse al movimiento de los precios mediante el desarrollo de diferentes métodos en los que se obtengan resultados adecuados de predicción. Los economistas emplean convencionalmente tres métodos para estimar los precios: modelos econométricos [2], análisis técnico [3] y análisis funda- mental [4]. Sin embargo las técnicas de inteligencia computacional han presentado mejores resultados en algunos problemas de predicción de se- ries económicas [5]-[7]. En este artículo se selecciona una acción de la Bolsa de Valores de Colom- bia que presenta volatilidad, la cual es un caso de estudio interesante dada su complejidad. Luego se compara la predicción de la acción del modelo ARIMAX con la obtenida del sistema neuro difuso auto organizado me- Fecha recibido: Agosto 27/2012 Fecha modificado: Septiembre 23/2012 Fecha aceptado: Noviembre 15/2012 Citación: Avellaneda, J., Ochoa, C., y Figueroa-García, J. (2012). Comparación entre un sistema neuro difuso auto organizado y un modelo ARIMAX en la predicción de series económicas volátiles. En: Ingeniería, Vol. 17, No. 2, pág. 26 - 34. Jose A. Avellaneda G. Ingeniero Electrónico Universidad Distrital [email protected] Cynthia M. Ochoa R. Ingeniero Electrónico Universidad Distrital [email protected] Juan Carlos Figueroa García Profesor asistente Universidad Distrital [email protected] Comparación entre un sistema neuro difuso auto organizado y un modelo ARIMAX en la predicción de series económicas volátiles Comparison between a self organizing neural fuzzy system and an ARIMAX model to forecasting volatile economic series

Upload: marcela-paz-azocar-pizarro

Post on 25-Sep-2015

217 views

Category:

Documents


1 download

DESCRIPTION

Serie de tiempo

TRANSCRIPT

  • INGENIERA Vol. 17 No. 2 ISSN 0121-750X UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS26

    ResumenEn este artculo se presenta el estudio de una accin voltil de la Bolsa de

    Valores de Colombia la cual es analizada usando un modelo estadsticoARIMAX (Modelo autorregresivo integrado de media mvil con entrada exgena) y unSONFS (sistema neuro difuso auto organizado). Estos mtodos son comparadosteniendo en cuenta tres caractersticas: el menor EMA (Error Medio Absoluto),el residual entendido como un proceso de ruido blanco (evaluado medianteseis pruebas) y el AIC (criterio de informacin de Akaike); as se elige el modeloquemejor se ajusta para la prediccin de la serie.

    Palabras clave: ARIMAX, SONFS, Series Temporales Voltiles.

    AbstractThis paper presents the selection of a volatile share from Colombian Stock

    Exchange, which is analyzed using ARIMAX (autoregressive integrated moving ave-rage with exogeneous input) and SONFS (self organizing neural fuzzy sytem) models.These methods are compared using three features: the MAE (mean absolute error),residuals as a white noise process and the AIC (Akaike Information Criterion).

    Key words: ARIMAX, SONFS, Volatile Time Series.

    1. IntroduccinEl mercado burstil se caracteriza por la alta variabilidad en sus rendimien-

    tos, es decir que presenta alto riesgo, pero a su vez entrega mayores rendimientosque otras alternativas de inversin [1]. Por estas razones es importante antici-parse al movimiento de los precios mediante el desarrollo de diferentes mtodosen los que se obtengan resultados adecuados de prediccin.

    Los economistas emplean convencionalmente tres mtodos para estimarlos precios: modelos economtricos [2], anlisis tcnico [3] y anlisis funda-mental [4]. Sin embargo las tcnicas de inteligencia computacional hanpresentado mejores resultados en algunos problemas de prediccin de se-ries econmicas [5]-[7].

    En este artculo se selecciona una accin de la Bolsa de Valores de Colom-bia que presenta volatilidad, la cual es un caso de estudio interesante dada sucomplejidad. Luego se compara la prediccin de la accin del modeloARIMAX con la obtenida del sistema neuro difuso auto organizado me-

    Fecha recibido: Agosto 27/2012Fecha modificado: Septiembre 23/2012Fecha aceptado: Noviembre 15/2012

    Citacin: Avellaneda, J., Ochoa, C., y Figueroa-Garca, J. (2012). Comparacin entre un sistemaneuro difuso auto organizado y un modelo ARIMAX en la prediccin de series econmicas voltiles.En: Ingeniera, Vol. 17, No. 2, pg. 26 - 34.

    Jose A.Avellaneda G.

    Ingeniero ElectrnicoUniversidad Distrital

    [email protected]

    Cynthia M.Ochoa R.

    Ingeniero ElectrnicoUniversidad Distrital

    [email protected]

    Juan CarlosFigueroa Garca

    Profesor asistenteUniversidad Distrital

    [email protected]

    Comparacin entre un sistema neuro difusoauto organizado y un modelo ARIMAX en laprediccin de series econmicas voltiles

    Comparison between a self organizing neural fuzzy systemand an ARIMAX model to forecasting volatile economic series

  • INGENIERA Vol. 17 No. 2 ISSN 0121-750X UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS 27

    Jose A. Avellaneda G. Cynthia M. Ochoa R. Juan Carlos Figueroa Garca

    diante el EMA y ciertas caractersticas que deben encontrarse en los residuales. De este modo seconsigue una interpretacin del error en las unidades de la serie (peso colombiano, COP) y sedeterminar si el modelo generaliza o no, as puede esperarse un comportamiento adecuadoante datos desconocidos. Conforme al anlisis de los resultados se establecen las ventajas ydesventajas de cada uno de los modelos.

    2. Seleccin del caso de estudioPara escoger la accin voltil de la Bolsa de Valores de Colombia, se consider la capitalizacin

    burstil correspondiente al producto entre la totalidad de las acciones de un emisor que estn encirculacin y su precio de cotizacin [8]. De esta manera se cuantifica la dimensin econmica de laempresa y por consiguiente, se toman las acciones ms importantes de la lista de capitalizacinburstil disponible en el sitio web de la BVC (Bolsa de Valores de Colombia) [9]. Luego cada una de lasacciones se grafic para elegir las que presentan variabilidad en sus precios. Finalmente para el casode estudio se calcul el ndice de volatilidad para los periodos anual, semestral y trimestral, el cualcompara la accin con la variabilidad del mercado [10], en este caso representado por el IGBC(ndice General de la Bolsa de Valores), por medio de la ecuacin (1).

    = cov ( IGBC, Accin BVC )var ( Accin BVC )

    (1)

    En la tabla I se muestran los valores del ndice paracuatro de las acciones elegidas. Si ste ndice es mayor a1, se considera que la accin es voltil con respecto almercado [10]. Como se registra en la Tabla 1, la accinde Pacific Rubiales es la nica que presenta mayorvolatilidad respecto al mercado en los tres periodos,por esto se escoge esta accin la cual se muestra en laFigura 1 (a), correspondiente a los das comprendidosentre el 26-07-2010 al 22-07-2011, para tener un totalde 289 muestras.

    2.1. Anlisis estadsticoLa Figura 1 (a) muestra que la serie de precios no tie-

    ne varianza ni media constantes, as se aplica la primeradiferencia en la serie para tratar de estabilizarla [7], deeste proceso se obtiene la serie diferenciada de la Figu-ra 1 (b). Para comprobar el comportamiento voltil serealiza la prueba F de Fisher, ARCH(heteroscedasticidad condicional autorregresiva) y t-Student sobre la serie diferenciada, para determinar sitiene varianza y media constantes [10]. El valor de pro-babilidad y el estadstico respectivo a ambas pruebasse presentan en la Tabla II, considerando un valor designificancia () de 0.05. De acuerdo a estos resultados,desde el punto de vista estadstico la serie es voltil pues-to que rechaza la hiptesis de las pruebas anteriores, loque indica adems un comportamiento no lineal en sumedia y varianza.

    Ecopetrol Pacific Cementos GrupoRubiales Argos Aval

    Anual 1.0434 1.5233 0.8792 0.8398Semestral 0.7451 1.9278 0.9170 0.4432Trimestral 0.8789 1.7295 0.9056 0.6232

    Tabla I. Clculo del ndice de volatilidad

    Figura 1. (a) Histrico de precios de la accin dePacific Rubiales del 26 de julio del 2010 al 22 de

    julio del 2011. (b) Serie diferenciada con operadorrezago de orden 1.

    (a)

    (b)

  • INGENIERA Vol. 17 No. 2 ISSN 0121-750X UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS28

    Por otro lado, al tener en cuenta que la serie esergdica [12], es decir que la influencia entre va-riables disminuye al aumentar la diferenciatemporal entre ellas, como se evidencia en la ACF(funcin de auto correlacin) de la Figura 2 y en base asta, se divide la base de datos en 250 muestraspara el diseo del modelo ARIMAX y para el en-trenamiento del SONFS y 39 muestras para llevara cabo la validacin de ambos modelos.

    3. Modelo ARIMAXEste modelo se obtiene de tres partes: La pri-

    mera es auto regresiva que relaciona la serie conobservaciones de periodos anteriores de ella mis-ma. La segunda parte son medias mviles (MA)que relaciona la serie como una funcin de unasucesin de errores correspondientes a periodosanteriores ponderados. La tercera parte (X) sonlas observaciones anteriores de una serie exgena,que en este caso es un indicador tcnico de losocho que comnmente se utilizan en la economapara estimar los precios [16], estos son: la mediamvil, las bandas de Bollinger, el momentum, latasa de cambio, el ndice de fortaleza relativa, laconvergencia/divergencia de media mvil, losestocsticos %K y %D y Larry Williams %R.

    (2)

    Figura 2. Funcin de auto correlacin en la que seevidencia el comportamiento ergdico de la serie.

    Prueba F Prueba TIntervalo P-valor Estadstico P-valor Estadstico24/06/201018/11/2010 6,70E-04 1,9981 0,029 2,199830/04/201125/08/2011

    Tabla II. Prueba F de Fisher y T student

    Rezagos P-Valor Estadistico1 7,72E-12 46,834857442 6,76E-11 46,836268813 8,30E-11 49,922684714 3,16E-10 50,280488075 9,18E-10 50,874169946 3,02E-09 50,958484627 9,93E-09 50,82854693

    Tabla III. Test ARCH

    Adicionalmente, al considerar la serie diferenciada, que se espera que sea estacionaria se obtieneel modelo ARIMAX [13].Para encontrar el orden correcto del modelo ARIMAX, se emplea lametodologa propuesta por Box y Jenkins [13] resumida en 5 puntos:

    1. Identificar el orden del modelo ARIMAX(p,d,q,b).2. Estimar los coeficientes.3. Validar el modelo.4. Verificar el ajuste.5. Seleccionar el mejor modelo disponible.

    As el mejor modelo lineal obtenido con esta metodologa es un ARIMAX(6,1,5,7) que em-plea el indicador de la tasa de error de cambio para la prediccin como entrada exgena U, elmodelo es representado por la ecuacin:

    4. Sistema nuero difuso auto organizado (SONFS)Este sistema es neuro difuso, debido a que el sistema difuso se muestra en una distribucin de

    capas y neuronas. Por otro lado, se denomina auto organizado a causa de la creacin de reglas apartir de los datos que entran [14]. As el SONFS es conformado por cinco capas como muestra el

    Comparacin entre un sistema neuro difuso auto organizado y un modelo ARIMAX en la prediccin de series econmicas voltiles

  • INGENIERA Vol. 17 No. 2 ISSN 0121-750X UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS 29

    esquema de la Figura 3, las cuales cumplen con di-ferentes funciones como se describe a continuacin:

    Capa 1 (entrada): las entradas son valorespuntuales, cada entrada debe estar normali-zada, as los nodos en la capa de entrada xiestn en los rangos de [-1,1] o [0,1].

    Capa 2 (fuzzificacin): Esta capa desempe-a la operacin de fuzzificacin tiposingleton y cada nodo en esta capa defineuna funcin de pertenencia gaussiana.

    Capa 3 (Capa de interseccin): Cada nodo enesta capa es una regla y desarrolla la opera-cin difusa de interseccin usando la t-nor-ma producto. La salida de un nodo es el nivelde activacin de la regla denotado como f i.

    Capa4 (capa de normalizacin): El nmerode nodos en esta capa es igual al de la capatres. Cada nivel de activacin calculado enla capa anterior es normalizado por lasumatoria de todos los niveles de activacincalculados en dicha capa.

    Capa 5 (capa del consecuente): En esta capase hace la defuzzificacin por promedio decentros, de la que se obtiene la salida pun-tual del sistema.

    En la Figura 4 se presenta el algoritmo de gene-racin de reglas, donde el criterio para crear unanueva regla es la comparacin de un umbralpredefinido TH con el mximo de los niveles deactivacin [13]. Modificando el trabajo de Juang yTsao [14] y Juang y Lin [15], se propone lainicializacin de la media m y la desviacin estndar de los antecedentes, y los centros w del conse-

    Figura 3. Estructura en capas del SONFS.

    Figura 4. Algoritmo de generacin dereglas para el SONFS [14].

    cuente a travs de las siguientes ecuaciones: (3)

    (4)

    (5)

    De acuerdo a lo anterior, sea M un nmero actual de reglas, la media de una nueva reglacorresponder a un nuevo dato de entrada denotado como xj, cuya desviacin estndar est enfuncin de que es un parmetro predefinido propio del SONFS (diferente al ndice de volatilidad) y por ltimo, el centro se inicializa aleatoriamente. Adicionalmente, para sintonizar estosparmetros se utiliz el algoritmo de gradiente descendente [16].

    Las entradas al sistema no son solamente los rezagos de la serie, tambin ingresan como seriesadicionales ocho indicadores tcnicos. El diseo del SONFS inicia estableciendo el nmero de

    Jose A. Avellaneda G. Cynthia M. Ochoa R. Juan Carlos Figueroa Garca

  • INGENIERA Vol. 17 No. 2 ISSN 0121-750X UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS30

    rezagos iniciales tanto de la serie que se va a predecir como el de los indicadores tcnicos, me-diante la ACF y la CCF (Funcin de correlacin cruzada). Posteriormente se sigue una metodologasimilar a la de Box y Jenkins para buscar el mejor modelo siguiendo los siguientes pasos:

    1. Cambio de entradas y parmetros del SONFS.2. Entrenamiento del SONFS.3. Validacin del modelo.4. Verificacin del ajuste del modelo.5. Seleccin del mejor modelo disponible.

    De esta manera se realizan varias pruebas cambiando los parmetros del SONFS incluyendola tasa de aprendizaje del algoritmo de gradiente descendente, las entradas y rezagos del sistema.Una vez establecidas las caractersticas anteriores se entrena y se valida el SONFS. Posterior-mente se verifica el ajuste que tiene el modelo a la serie y finalmente se escoge el mejor. Elsistema seleccionado gener 38 reglas a travs de 1000 iteraciones, como entradas emple latasa de cambio y el ndice de fortaleza relativa con 3 rezagos de cada una, tiene una tasa deaprendizaje de 0.05, de 0.8 y un umbral TH de 0.3.

    5. Resultados

    5.1. Metodologa de seleccin experimentalComo se mostr en la Seccin 4, el diseo y entrenamiento de un SONFS va en funcin de sus

    parmetros que deben ser sintonizados de manera adecuada, a saber: , m, , w y . As pues ydado que la inicializacin de los centros es aleatoria, se hicieron una serie de experimentos con elfin de obtener los mejores resultados posibles. La metodologa utilizada se muestra en la Figura5, iniciando con la seleccin manual de las series que van a ingresar entre los indicadores tcnicosy la serie de precios de Pacific Rubiales, tambin se seleccionan los rezagos y los parmetros delsistema. Con las caractersticas anteriores establecidas, se realizan 50 iteraciones con el fin deobtener una exploracin del espacio de bsqueda y finalmente seleccionar el mejor conjunto deparmetros entrenados para cada combinacin, teniendo en cuenta el sistema con menor RMSE(Root Mean Square Error). A ste sistema se le analizan sus residuales y si cumple con ciertascaractersticas se calcula el EMA o se cambian los parmetros nuevamente.

    5.2. Seleccin de entradas al SONFSUno de los aspectos ms lgidos en prediccin de series de tiempo es la seleccin de entradas

    al modelo, de lo que depende el nmero de parmetros que los algoritmos de entrenamiento u

    Figura 5. Evaluacin y seleccin de los SONFS.

    optimizacin deben calcular. Esto afecta di-rectamente el costo computacional en lamedida que se tendr mayor nmero deparmetros para calcular, haciendo que losalgoritmos de entrenamiento tengan un tiem-po de convergencia mayor.

    La estrategia utilizada en este estudio fuela siguiente:

    1. Determinar los indicadores tcni-cos que presentan correlacin en-

    Comparacin entre un sistema neuro difuso auto organizado y un modelo ARIMAX en la prediccin de series econmicas voltiles

  • INGENIERA Vol. 17 No. 2 ISSN 0121-750X UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS 31

    tre s (Usualmente esto se observa a travs de la inspeccin de la definicin decada indicador).

    2. Determinar las posibles combinaciones de las entradas seleccionadas.3. Realizar pruebas de entrenamiento para cada combinacin.

    Dicha metodologa permite determinar las combinaciones de entradas que podran ser rele-vantes para prediccin y hacer una bsqueda de parmetros y reglas del SONFS que minimice elerror para cada combinacin. Evidentemente este proceso puede llegar a ser costosocomputacionalmente, pero garantiza una adecuada exploracin de la informacin disponible.De esta manera, se evidencia que aunque este tipo de tcnicas puedan parecer costosascomputacionalmente, dicho costo se reduce dado el constante incremento en las capacidades declculo que existen en la actualidad. Finalmente, los resultados de los mejores modelos encon-trados se muestran en el siguiente apartado.

    5.3. Resultados de prediccinLa evaluacin de los mejores modelos obtenidos del ARIMAX y del SONFS, se evalan con-

    siderando el EMA obtenido en el entrenamiento y la validacin. Estos errores se muestran en eldiagrama de barras de la Figura 6 (a), donde se puede ver que tanto para el entrenamiento y lavalidacin hay una disminucin del error promedio al pasar del modelo ARIMAX al SONFScorrespondiente a una reduccin del error de 29,77% y 22,36% para cada conjunto de datos.Tambin al comparar los mximos errores adquiridos expuestos en la Figura 6 (b), se consideraque el modelo que tiene menor error es el SONFS.

    Figura 6. (a) EMA de entrenamiento y validacin para el modelo ARIMAX y el SONFS.(b) Mximos errores de entrenamiento y validacin para los modelos ARIMAX y SONFS.

    Adicionalmente a la cuantificacin del error se realiza un anlisis sobre los errores en cadainstante de tiempo. A este conjunto de errores se le denomina residuales o residuos, en la Figura7 se presentan los residuales de cada modelo para cada conjunto de datos. Lo que se busca esobtener residuos carentes de estructura, es decir que sean ruido blanco (()WN (0,2)), estoindica que el modelo se ajusta correctamente a la serie y que ha extrado toda la informacin deella, implicando que ante nuevos datos va obtener resultados adecuados. Para comprobar si elresidual es ruido blanco debe tener las siguientes caractersticas [17] [18]:

    1. Homoscedasticidad (varianza constante).2. Media cero.3. Aleatoriedad.4. Ausencia de autocorrelacin.

    Una serie de pruebas y test pueden verificar cada una de las propiedades sobre el residual delconjunto de entrenamiento. Para la prueba de varianza constante se realiza la prueba F y la

    (a) (b)

    Jose A. Avellaneda G. Cynthia M. Ochoa R. Juan Carlos Figueroa Garca

  • INGENIERA Vol. 17 No. 2 ISSN 0121-750X UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS32

    prueba ARCH, las siguientes caractersticas sonevaluadas por las pruebas T, de Wald-Wolfowitzy de Ljung-Box respectivamente, con designificancia de 0.05. Adicionalmente se realizala prueba de Kolmogorov-Smirnov para verifi-car si el residual tiene distribucin normal. Cadauna de estas pruebas registran su significancia op-valor y estadsticos (Stat) en las tablas IV a VIIpara los modelos ARIMAX(6,1,5,7) y SONFS.

    De los p-valores de las pruebas F y ARCH enlas tablas IV y V, se determina que ambos mode-los tienen varianza constante. Adicionalmente, losresultados de la tabla IV indican que los residualesderivados de ambos modelos no tienen distribu-cin normal, aunque ambos residuales son unasecuencia de valores aleatorios con media cero yvarianza constante. Respecto a ausencia de autocorrelacin, los residuales del SONFS cumplencon esta caracterstica como indican los p valo-res de la tabla V y VI, sin embargo el ARMAXpresenta correlacin serial en los rezagos 5, 6 y 7.

    Para resumir estos resultados, el supuesto denormalidad es una propiedad deseable ms nonecesaria, no afecta considerablemente el com-portamiento de los modelos. As que respecto alanlisis de los residuales, el SONFS es una mejoropcin para la prediccin puesto que cumple contodas las caractersticas.

    Para finalizar la comparacin se calcul el AIC(Akaike Information Criterion), que pondera el ajustedel modelo a la serie teniendo en cuenta su n-

    ARIMAX(6,1,5,7) SONFS Estadstico P-valor Estadstico P-valorPrueba F* 1,1215 0,5241 0.3985 0,4869 Prueba T 0,2128 0,8316 12.946 0.1967Runs Test -0,3169 0,7512 0.0666 0,9798Prueba deNormalidad 0,5160 5,1774E-59 0,5463 4,66E-65*Intervalos del 29/06/2010 al 27/12/2010 y del 28/12/2010 al24/06/2011

    Tabla IV. Prueba F, prueba T, prueba Wald-Wolfowitz de aleatoriedad(Runs test) y prueba de Kolmogorov-Smirnov para la normalidad

    ARIMAX(6,1,5,7) SONFSRezago Estadstico P-valor Estadstico P-valor1 3,5197 0,0606 0,2708 0,60282 3,4518 0,1780 0,4211 0,81013 4,3812 0,2231 1,1349 0,76864 4,3673 0,3585 1,1239 0,89055 7,3399 0,1965 1,5953 0,90186 7,2054 0,3022 3,0644 0,80077 7,7112 0,3587 3,4887 0,8364

    Tabla V. Prueba ARCH

    ARIMAX(6,1,5,7) SONFSRezago Estadstico P-valor Estadstico P-valor1 0,0041 0,9483 2,9695 0,08492 1,0123 0,6027 3,4888 0,17473 6,8397 0,0771 4,4958 0,21274 17,869 0,0013 5,1388 0,27345 28,881 2,4460E-05 5,5389 0,35376 30,271 3,4896E-05 6,1265 0,40927 33,241 2,3869E-05 6,1642 0,5207

    Tabla VI. Prueba de Ljung-Box

    ARIMAX(6,1,5,7) SONFSVariables de entrada AIC Variables de entrada AIC 18 14,222 6 13,684

    Tabla VII. AIC

    mero de variables; se considera que el mejor modelo es el que tenga el AIC ms bajo. Segn losvalores de la tabla VII el SONFS es el que tiene el menor AIC. Adicionalmente, los resultadosdel mejor modelo obtenido, tanto para ARIMAX como para SONFS se muestran representa-dos a travs de sus residuales en la Figura 7. Adems la prediccin resultante en las Figuras 8 y9 respectivamente, donde se observa que el modelo ARIMAX tiende a apartarse del precio realms veces que el SONFS.

    6. ConclusionesEn este trabajo se present una comparacin entre un modelo ARIMAX y un sistema neuro

    difuso auto organizado aplicado a la prediccin de una serie temporal escogida de la Bolsa deValores de Colombia que expone un comportamiento voltil. De acuerdo al anlisis estadsticode la serie seleccionada, se encuentra que el ndice de volatilidad revela informacin til acercade las posibles fuentes de incertidumbre que intervienen en una serie temporal.

    La inclusin de indicadores tcnicos como entradas al SONFS fue importante, debido a queproporcionan informacin adicional, muestra de ello son las entradas del mejor modelo las

    Comparacin entre un sistema neuro difuso auto organizado y un modelo ARIMAX en la prediccin de series econmicas voltiles

  • INGENIERA Vol. 17 No. 2 ISSN 0121-750X UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS 33

    Figura 7. Grfica de los residuales de entrenamientoy validacin de cada uno de los modelos.

    (a) Residuales de entrenamiento para el modelo ARIMAX.(b) Residuales de validacin para el modelo ARIMAX.

    (c) Residuales de entrenamiento para el modelo SONFS.(d) Residuales de validacin para el modelo SONFS.

    (a)

    (b)

    (c)

    (d)

    cuales fueron la tasa de cambio y el ndice de fortaleza relativa. Respecto a los resultados obte-nidos, se evidencia que para este caso de estudio el SONFS tiene mejor desempeo que el modelolineal ARIMAX, como seala la disminucin del Error Medio Absoluto (EMA). Adems elanlisis de los residuos obtenidos de la prediccin con cada tcnica sugiere que el SONFS cum-ple con todas las propiedades que se espera del residual contrario al modelo ARIMAX, as sepuede decir que el SONFS tiene mayor capacidad de generalizacin. Como un tem adicional se

    Figura 8. Prediccin en el conjunto de entrenamiento y validacin parala accin de Pacific Rubiales con el modelo ARIMAX(6,1,5,7).

    Figura 9. Prediccin en el conjunto de entrenamiento y validacin parala accin de Pacific Rubiales con el SONFS.

    tiene el criterio de informacin de Akaike es mejor enel modelo obtenido con el SONFS. Este comporta-miento es causado por la no estacionaridad de la serie,lo que puede limitar el desempeo del modeloARIMAX ya que este hace una aproximacin lineal dela serie mientras que el SONFS hace una aproxima-cin no lineal adaptndose mejor a la no linealidadexpuesta en la varianza y media de la serie. Por las ven-tajas que ofrece el SONFS se concluye que esta es unamejor opcin que el modelo ARIMAX para la pre-diccin del precio de la accin de Pacific Rubiales.

    Si bien es cierto que el principal inconveniente de laaplicacin de las tcnicas de inteligencia computacionalrespecto a mtodos estadsticos es el incremento delcosto computacional, se observ en la realizacin delas pruebas que el SONFS es una tcnica que no exigeun costo computacional alto, pues tarda en promedioveinte minutos en realizar su sintonizacin.

    Referencias bibliogrficas[1] Paul Samuelson y William Nordhaus, Economa. 15 ed. McGraw-Hill, Ma-

    drid, Espaa, 1998.[2] Damodar Gujarati, Basic Econometrics.McGraw Hill, New York City, New

    York, 2004.

    Jose A. Avellaneda G. Cynthia M. Ochoa R. Juan Carlos Figueroa Garca

  • INGENIERA Vol. 17 No. 2 ISSN 0121-750X UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS34

    [3] Steven Achelis, Technical Analysis from A to Z. McGraw Hill, New York City, New York, 2000.[4] Michael Steinberg, Gua para invertir en bolsa.Ediciones Deusto, Bilbao, Portugal, 2001.[5] Gioqinang Zhang y Michael Y. Hu, Neural network forecasting of the British Pound/US Dollar exchange rate. Omega Elsevier Science,

    Volumen 26, Nmero 4, Agosto, 1998, pp. 495-506.[6] Andr AlvesPortela, Newton CarneiroAffonso y Leandro dos Santos, Computational intelligence approaches and linear models in case studies

    of forecasting exchange rates. Expert Systems with Application Elsevier Science, Volumen 33, Nmero 4, Noviembre, 2007, pp. 816-823.[7] Juan Carlos Figueroa y Jose Jairo Soriano, A comparison on ANFIS, ANN and DBR systems on volatile time series identification, Annual

    Meeting of the North American Fuzzy Information Processing Society, 2007, pp. 321-326.[8] Orlando Greco, Diccionario de Economa. Valletta Ediciones, Buenos Aires, Argentina, 2006.[9] Bolsa de Valores de Colombia, Ranking por capitalizacin burstil, 26 de Julio de 2011, disponible en http://www.bvc.com.co/pps/tibco/

    portalbvc/Home/Empresas/.[10] Gordon Alexander, William F. Sharpe y Jeffery V. Bailey, Fundamentos de inversiones: Teora y Prctica. Pearson Eduacacin, Mxico,

    2003.[11] Sheldon M. Ross, Introduccin a la estadstica. Editorial Revert, Barcelona, Espaa, 2007.[12] Jos Hernandez, Anlisis de series temporales econmicas II. Esic, Madrid, Espaa, 2007.[13] George Box y Gwlym Jenkins, Times Series Analysis: Forecasting and Control. Editorial Holden Day, Oakland, California, 1976.[14] Chia-FengJuang y Yu-Wei Tsao, A Type-2 Self-Organizing Neural Fuzzy System and Its FPGA Implementation. IEEE Transactions on

    Systems, man and cybernetics, Part B, Cybernetics, Volumen 38, Nmero 6, Diciembre, 2008, pp. 1537-1548.[15] Chia-FengJuang y Chin-Teng Li, An on-line self-constructing neural fuzzy inference network and its application. IEEE Transactions on Fuzzy

    Systems, Volumen 6, Nmero 1, Febrero, 1998, pp. 12-32.[16] Li-Xin Wang and Jerry Mendel, Back-propagation fuzzy system as nonlinear dynamic system identifiers, Conference on Intelligent Computing

    and Intelligent Systems, 2010, pp. 684-688.[17] Peter A. Brockwell y Richard A. Davis, Introduction to time series and forecasting, Springer-Verlag, New York, New York, 1987.[18] Armando Aguirre, Introduccin al tratamiento de series temporales. Ediciones Daz de Santos, Madrid, Espaa, 2010.

    Jos Alejandro Avellaneda GonzlezJos Alejandro Avellaneda GonzlezJos Alejandro Avellaneda GonzlezJos Alejandro Avellaneda GonzlezJos Alejandro Avellaneda GonzlezNaci en Bogot, Colombia. Es ingeniero electrnico de la Universidad Distrital Francisco Jos de Caldas, de Bogot.e-mail: [email protected]

    Cynthia Mara Ochoa ReyCynthia Mara Ochoa ReyCynthia Mara Ochoa ReyCynthia Mara Ochoa ReyCynthia Mara Ochoa ReyNaci en Bogot, Colombia. Es ingeniero electrnico de la Universidad Distrital Francisco Jos de Caldas, de Bogot.e-mail: [email protected]

    Juan Carlos Figueroa GarcaJuan Carlos Figueroa GarcaJuan Carlos Figueroa GarcaJuan Carlos Figueroa GarcaJuan Carlos Figueroa GarcaNaci en Ciudad, Pas. Es Ingeniero industrial de la Universidad Distrital, de Bogot. Obtuvo su ttulo de Maestra en Ingeniera Industrial en laUniversidad Distrital. Actualmente se desempea como profesor asistente de la Universidad Distrital y pertenece como investigador al grupo LAMIC. e-mail: [email protected]

    Comparacin entre un sistema neuro difuso auto organizado y un modelo ARIMAX en la prediccin de series econmicas voltiles

    /ColorImageDict > /JPEG2000ColorACSImageDict > /JPEG2000ColorImageDict > /AntiAliasGrayImages false /CropGrayImages true /GrayImageMinResolution 300 /GrayImageMinResolutionPolicy /OK /DownsampleGrayImages true /GrayImageDownsampleType /Bicubic /GrayImageResolution 300 /GrayImageDepth -1 /GrayImageMinDownsampleDepth 2 /GrayImageDownsampleThreshold 1.50000 /EncodeGrayImages true /GrayImageFilter /DCTEncode /AutoFilterGrayImages true /GrayImageAutoFilterStrategy /JPEG /GrayACSImageDict > /GrayImageDict > /JPEG2000GrayACSImageDict > /JPEG2000GrayImageDict > /AntiAliasMonoImages false /CropMonoImages true /MonoImageMinResolution 1200 /MonoImageMinResolutionPolicy /OK /DownsampleMonoImages true /MonoImageDownsampleType /Bicubic /MonoImageResolution 1200 /MonoImageDepth -1 /MonoImageDownsampleThreshold 1.50000 /EncodeMonoImages true /MonoImageFilter /CCITTFaxEncode /MonoImageDict > /AllowPSXObjects false /CheckCompliance [ /None ] /PDFX1aCheck false /PDFX3Check false /PDFXCompliantPDFOnly false /PDFXNoTrimBoxError true /PDFXTrimBoxToMediaBoxOffset [ 0.00000 0.00000 0.00000 0.00000 ] /PDFXSetBleedBoxToMediaBox true /PDFXBleedBoxToTrimBoxOffset [ 0.00000 0.00000 0.00000 0.00000 ] /PDFXOutputIntentProfile () /PDFXOutputConditionIdentifier () /PDFXOutputCondition () /PDFXRegistryName () /PDFXTrapped /False

    /Description > /Namespace [ (Adobe) (Common) (1.0) ] /OtherNamespaces [ > /FormElements false /GenerateStructure true /IncludeBookmarks false /IncludeHyperlinks false /IncludeInteractive false /IncludeLayers false /IncludeProfiles true /MultimediaHandling /UseObjectSettings /Namespace [ (Adobe) (CreativeSuite) (2.0) ] /PDFXOutputIntentProfileSelector /NA /PreserveEditing true /UntaggedCMYKHandling /LeaveUntagged /UntaggedRGBHandling /LeaveUntagged /UseDocumentBleed false >> ]>> setdistillerparams> setpagedevice