universidad autÓnoma de nuevo leÓn -...

196
UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN FACULTAD DE INGENIERÍA MECÁNICA Y ELÉCTRICA DIVISIÓN DE ESTUDIOS DE POSGRADO PRONÓ REDES NEURONALES ARTIFICIALES (RNAs) EN LA INDUSTRIA DE POR TESIS EN INGENIERÍA DE SISTEMAS San Nicolás de los Garza, N. L. Noviembre de 2005 STICO DE DEMANDA POR MEDIO DE TELECOMUNICACIONES” MARÍA ANGÉLICA SALAZAR AGUILAR EN OPCIÓN AL GRADO DE MAESTRO EN CIENCIAS

Upload: vuongngoc

Post on 11-Oct-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN  

FACULTAD DE INGENIERÍA MECÁNICA Y ELÉCTRICA 

DIVISIÓN DE ESTUDIOS DE POSGRADO 

 

“PRONÓ  REDES 

NEURONALES  ARTIFICIALES (RNAs) 

 EN LA INDUSTRIA DE  

POR 

 

 

TESIS 

EN INGENIERÍA DE SISTEMAS 

San Nicolás de los Garza, N. L.                                        Noviembre de 2005 

STICO DE DEMANDA POR MEDIO DE

 TELECOMUNICACIONES”

MARÍA ANGÉLICA SALAZAR AGUILAR 

EN OPCIÓN AL GRADO DE MAESTRO EN CIENCIAS 

 

Page 2: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN  

FACULTAD DE INGENIERÍA MECÁNICA Y ELÉCTRICA 

DIVISIÓN DE ESTUDIOS DE POSGRADO 

 

 

 

 “PRONÓSTICO DE DEMANDA POR MEDIO DE REDES 

NEURONALES  ARTIFICIALES (RNAs) 

 EN L ES” 

OR 

 

 

EN O AS 

EN INGENIERÍA DE SISTEMAS 

A INDUSTRIA DE TELECOMUNICACION

P

MARÍA ANGÉLICA SALAZAR AGUILAR 

TESIS  

PCIÓN AL GRADO DE MAESTRO EN CIENCI

 

San Nicolás de los Garza, N. L.                                        Noviembre de 2005 

Page 3: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN  

Facultad de Ingeniería Mecánica y Eléctrica 

Divisió sgrado 

Los miembros del Comité de Tesis recomendamos que la tesis “Pronóstico de

Demanda por medio de Redes Neuronales Artificiales (RNAs) en la Industria de

Telecomunicaciones”, realizada por la alumna María Angélica Salazar Aguilar con

número de matrícula 01294370, sea aceptada para su defensa como opción al grado de

Maestro en Ciencias en Ingeniería de Sistemas.

El Comité de Tesis 

 

n de Estudios de Po

Dr. Mauricio Cabrera RíosAsesor 

r. Francisco R. Angel‐Bello Acosta 

Dr. J. Arturo Berrones Santos

Revisor D

Ciudad Universitaria, Noviembre de 2005 

Dr. Guadalupe Alan Castillo Rodríguez Subdirector 

División de Estudios de Posgrado 

Revisor

Page 4: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

 

 

“La incertidumbre es una margarita  

cuyos pétalos no se terminan  

jamás de deshojar…” 

A Dios, 

               Mi fuente inagotable de vida.

 A mi familia, 

            Mi más preciado tesoro.

Page 5: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

RESUMEN

NAs) con el objetivo de resolver un problema real para una

vital importancia la determinación precisa del pronóstico de demanda.

e técnicas estadísticas y optimización

para la selección adecuada de los parámetros del modelo de RNAs en esta aplicación. El

esarrollo de esta metodología constituye una de las contribuciones más importantes de

ste trabajo.

Probamos la metodología con los datos que nos brindó la empresa y finalmente

construimos modelos de RNAs para pronóstico de uno y doce períodos. En la literatura

e encontraron muy pocas referencias de RNAs para el pronóstico simultáneo de

múltiples períodos, por lo que se espera que este trabajo contribuya importantemente en

Una de las tareas más importantes en el ámbito de los negocios es hacer pronósticos

de demanda. En el presente trabajo se realiza esta tarea utilizando modelos de Redes

Neuronales Artificiales (R

empresa de telecomunicaciones.

El principal problema al que se enfrenta la empresa es la determinación de la

capacidad requerida en la red de transmisión de manera tal que la demanda se satisfaga

al 100% sin incurrir en costos excesivos por mantener capacidad instalada no utilizada.

Por ello, es de

La empresa nos brindó información del comportamiento de la demanda en los

últimos años de operación. Optamos por un modelo de RNAs para pronóstico pues éstas

han sido muy utilizadas en trabajos recientes con buenos resultados. Sin embargo, el

desempeño de la RNA depende de la selección adecuada de los parámetros que

intervienen en el modelo.

La ausencia de una metodología estándar para la selección de los parámetros nos

motivó a proponer una metodología que hace uso d

d

e

s

v

Page 6: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

este aspecto. Los resultados obtenidos mediante RNAs fueron comparados contra los

que se obtuvieron con métodos lineales tradicionales y en nuestro caso, los modelos de

NAs desarrollados de acuerdo a la metodología propuesta mostraron mejor calidad en

l pronóstico que los métodos lineales utilizados.

R

e

vi

Page 7: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

ESTRUCTURA DE LA TESIS

La tesis está organizada de la manera siguiente:

En el Capítulo 1 se presenta la descripción general del problema, algunos

acerca de las diferentes áreas que se conjugan

odelo de

métodos lineales tradicionales contra los obtenidos mediante RNAs. Los resultados aquí

descritos sustentan la validez de la metodología propuesta en el Capítulo 3.

En el Capítulo 7 se describe de manera general la herramienta de soporte a la toma de

decisiones que permite realizar un experimento de tipo factorial con modelos de RNAs.

antecedentes, el método de solución propuesto, así como el objetivo, justificación e

hipótesis del mismo.

El Capítulo 2 contiene los antecedentes

en el desarrollo del presente trabajo, éstas son: Series de Tiempo, Redes Neuronales

Artificiales (RNAs), Análisis y Diseño de Experimentos y Optimización.

En el Capítulo 3 se describe de manera detallada la metodología propuesta para la

selección de parámetros de RNA para pronóstico de series de tiempo.

El Capítulo 4 contiene el análisis de una serie de tiempo mediante un m

RNAs para predecir un solo período. El modelo de RNA fue creado siguiendo la

metodología propuesta en el Capítulo 3.

El Capítulo 5 es de los más relevantes en este trabajo. En él se describe el desarrollo

de dos modelos de RNAs para la predicción de demanda de múltiples períodos.

En el Capítulo 6 se presenta una comparación de los resultados obtenidos a partir de

vii

Page 8: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

Para finalizar, el Capítulo 8 contiene las conclusiones, aportaciones y trabajo futuro.

as referencias bibliográficas, lista de tablas, lista de figuras y los apéndices están

isponibles al finalizar la sección de capítulos.

L

d

viii

Page 9: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

 

INDICE 

RESUMEN v

ESTRUCTURA DE LA TESIS vii

Capítulo 1. INTRODUCCIÓN 1

1.1. Descripción del Problema ………………...…………………………….……… 1

1.2. Antecedentes …………………………………………………………….……... 3

1.3. Objetivo ………………………………………………………………………… 4

1.4. Justificación …………………………………………………………………...… 5

1.5. Hipótesis ……………………………………………………………………...… 6

Capítulo 2. ANTECEDENTES 7

2.1. Análisis de Series de Tiempo ………………………………………………...… 8

2.2. Redes Neuronales Artificiales (RNAs) ……………………………………..… 10

Page 10: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

2.2.1. Aplicaciones de las RNAs en pronósticos de series de tiempo …..... 14

2.2.2 Decisiones en la aplicación de RNAs para pronósticos de series de tiempo

………………………………………………………………..……………… 19

2.3. Análisis y Diseño de Experimentos ………………………………………….... 20

2.4. Optimización ………………………………………………………………..… 22

Capítulo 3. METODOLOGÍA PROPUESTA 28

3.1 Descripción de la Metodología ……………………...………………………… 29

Capítulo 4. PRONÓSTICO DE SERIES DE TIEMPO DE UN SOLO

PERÍODO 37

4.1. Pronóstico de Demanda en telecomunicaciones ……………...………………. 38

4.2. Construcción del Modelo de RNA para Pronóstico de Series de Tiempo de un solo

período ………………………………………………………………………..…… 40

4.2.1. Descripción de la RNA como Sistema ……………………………… 40

4.2.2. Análisis y Diseño de Experimentos ………………….……………… 45

4.2.3. Metamodelación ………………………………………………….…. 48

4.2.4. Problemas de Optimización y Solución ……………………………... 53

4.3. Conclusiones ……………..…………………………………………………… 56

Page 11: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

Capítulo 5. PRONÓSTICO DE SERIES DE TIEMPO DE

MÚLTIPLES PERÍODOS 57

5.1. Pronóstico de Demanda en telecomunicaciones: múltiples períodos ………….. 58

5.2. Construcción de un Modelo de RNA para Pronóstico de Series de Tiempo de

múltiples períodos ………………………………………………………………… 61

5.2.1. Descripción de la RNA como Sistema …...…….….…………...…… 61

5.2.2 Análisis y Diseño de Experimentos para la Serie 1 ….………………. 65

5.2.2.1. Metamodelación ………………………….…………...…... 67

5.2.2.2. Problemas de Optimización y Solución, Serie 1 ……….…. 74

5.2.3. Análisis y Diseño de Experimentos para la Serie 2 …………….….. 77

5.2.3.1. Metamodelación …………….…………………...……...… 78

5.2.3.2. Problemas de Optimización y Solución, Serie 2 ….……..… 84

5.3. Conclusiones ……………………………………………………..…………… 87

Capítulo 6. COMPARACIÓN DE RESULTADOS DE RNAs CONTRA

MÉTODOS LINEALES TRADICIONALES 88

6.1. Pronóstico de demanda de un período en telecomunicaciones mediante métodos

lineales tradicionales …………………………………………………....………… 89

6.1.1. Comparación de Resultados …………...…………………………… 90

Page 12: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

6.2. Pronóstico de Demanda de n períodos en telecomunicaciones mediante métodos

lineales tradicionales ……………………………………………...………………. 92

6.2.1. Comparación de Resultados ………...……………………………… 94

6.3. Conclusiones ……………………………..…………………………………… 97

Capítulo 7. INSTAURACIÓN DE LA HERRAMIENTA DE

SOPORTE A LA TOMA DE DECISIONES 98

7.1. Descripción de la herramienta de soporte a la toma de decisiones ………….. 99

7.2 Conclusiones …………………………………………………………….…… 104

Capítulo 8. CONCLUSIONES, CONTRIBUCIÓN Y TRABAJO

FUTURO 105

BIBLIOGRAFÍA 108

LISTA DE FIGURAS 115

LISTA DE TABLAS 119

APÉNDICES 121

Apéndice A1 ………………………….………………………………………….. 121

Page 13: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

Apéndice A2 …………………………………….……………………………….. 138

Apéndice A3 …………………………………….……………………………….. 145

Apéndice B1 …………………………………….……………………………….. 148

Apéndice B2 ……………………………………..…………………………...….. 150

Apéndice B3 ………………………………………………………………….….. 154

Apéndice B4 ………………………………………………………………….….. 155

Apéndice B5 ………………………………………………………………….….. 156

Apéndice C ………………………………………………………………….…… 160

AUTOBIOGRAFÍA 183

Page 14: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

CAPÍTULO 1

INTRODUCCIÓN

En toda industria, la planeación es una necesidad. Un objetivo importante de la tarea

de planear es tratar de prever lo que puede suceder en el futuro.

La motivación de este trabajo proviene de una empresa de telecomunicaciones que

tiene la necesidad de planear a nivel operacional, estratégico y táctico para mantenerse

competitiva ante las fluctuaciones de mercado y cursos de acción de sus competidores.

Esta empresa, como la mayoría de las empresas, tiene como objetivo principal generar

utilidades y brindar un alto nivel de servicio a sus clientes.

1.1. Descripción del Problema

Como se observa en la Figura 1.1, el principal recurso de la empresa es una red de

transmisión, que puede ser definida como un conjunto de equipos interconectados que

poseen una capacidad finita de transmisión. Los clientes demandan la utilización de la

red en forma estocástica.

Page 15: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

2

Capítulo1. Introducción

Para cumplir con el alto nivel de servicio y maximizar las utilidades, la red de

transmisión debe tener capacidad suficiente para satisfacer la demanda de los clientes sin

incurrir en exceso de capacidad ociosa, dado el alto costo de los equipos. Ahora bien, le

corresponde al tomador de decisiones determinar ¿Cuál debe ser la capacidad de esta

red?.

1. Objetivo2. Misión

Transmitir información

de sus clientes, a

cualquier hora y en

cualquier lugar

3. Recursos

Red de transmisión con

“capacidad finita”

¿Cómo planear la capacidad de la

Red?

4.Clie

ntes

Deman

dan se

rvicio

de man

era

estocá

stica

1. Objetivo

1. Objetivo2. Misión

Transmitir información

de sus clientes, a

cualquier hora y en

cualquier lugar

2. Misión

Transmitir información

de sus clientes, a

cualquier hora y en

cualquier lugar

3. Recursos

Red de transmisión con

“capacidad finita”

3. Recursos

Red de transmisión con

“capacidad finita”

¿Cómo planear la capacidad de la

Red?

4.Clie

ntes

Deman

dan se

rvicio

de man

era

estocá

stica

4.Clie

ntes

Deman

dan se

rvicio

de man

era

estocá

stica

Figura 1.1. Descripción del problema de Telecomunicaciones.

El tomador de decisiones lleva a cabo un proceso de planeación de capacidad, a

través de una estimación del comportamiento futuro de la demanda. Esta estimación,

muchas veces es realizada de manera intuitiva, considerando únicamente la experiencia

del tomador de decisiones. Sin embargo, cuando es posible obtener información

Page 16: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

3

Capítulo1. Introducción

cuantitativa acerca del comportamiento de la demanda a través del tiempo, es decir,

cuando se dispone de una serie de tiempo, una técnica típicamente utilizada es el

Análisis de Series de Tiempo. La Figura 1.2 muestra un ejemplo de una serie de tiempo.

Una vez que se tienen pronósticos, el tomador de decisiones puede determinar la

capacidad que se requiere en la red de transmisión para satisfacer la demanda. Puede

además determinar con anticipación si se requiere una expansión de capacidad,

resultando en una mejor planeación del presupuesto anual, así como en un mejor

aprovechamiento de los recursos económicos de la empresa.

0

100

200

300

400

500

600

700

800

1 7 13 19 25 31 37 43 49

t

Valo

r Reg

istr

ado

Figura 1.2: Ejemplo de una Serie de Tiempo.

1.2. Antecedentes

Por muchos años, el análisis de series de tiempo ha estado dominado por la

utilización de métodos estadísticos lineales que se pueden implementar de manera

conveniente, sin embargo, la existencia de relaciones no lineales entre los datos pueden

limitar la aplicación de estos modelos (Makridakis et al., 1982). En la práctica es muy

posible encontrar relaciones no lineales en los datos, tal como sucede en nuestro caso de

Page 17: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

4

Capítulo1. Introducción

estudio. Por ello es necesaria la utilización de técnicas capaces de reflejar dicho

comportamiento.

La utilización de Redes Neuronales Artificiales (RNAs) para pronósticos de series de

tiempo es relativamente nueva en la literatura, sin embargo, lo positivo de los resultados

en las aplicaciones prácticas la convierten en un área prometedora.

En nuestro caso, la empresa nos brindó información histórica de registros mensuales

acerca de la utilización de la red de transmisión de los últimos 6 años. Aprovechando

esta información, realizamos el pronóstico de la demanda para períodos posteriores,

mediante el uso de RNAs.

Al intentar desarrollar el modelo de RNAs para esta aplicación de pronóstico de

series de tiempo, nos encontramos que la exactitud del pronóstico de la RNA depende de

varias decisiones sumamente importantes en cuanto a la definición de los parámetros

que intervienen en el modelo así como de la arquitectura de RNA que se esté utilizando

(Zhang, 2004). Algunas de estas decisiones pueden ser tomadas en el proceso de

construcción del modelo, mientras que otras requieren ser especificadas antes de que

comience la modelación. Este es un problema, ya que no existe una regla establecida que

nos permita tomar tales decisiones de manera adecuada. Por esta razón, planteamos el

siguiente objetivo en este trabajo de tesis.

1.3. Objetivo

El objetivo de esta tesis consiste en proponer y probar una metodología para la

selección de parámetros de un modelo de RNAs para este caso de estudio que garantice

pronósticos confiables para hasta doce períodos. Adicionalmente se desarrollará la

herramienta computacional correspondiente con el fin de ayudar al tomador de

decisiones a planear la capacidad de la red de transmisión en la empresa de

telecomunicaciones.

Page 18: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

5

Capítulo1. Introducción

1.4. Justificación

Decidimos analizar los datos históricos mediante RNAs ya que éstas surgieron como

una herramienta de modelación cuantitativa y han sido aplicadas con éxito en un amplio

número de problemas de predicción en casi todas las áreas de negocios, industria y

ciencia (Widrow et al., 1994). Los trabajos realizados a través de éstas han mostrado que

tienen características atractivas para la predicción y clasificación de patrones.

Además, aunque el análisis de series de tiempo ha provisto una cantidad de

herramientas estadísticas disponibles para este fin, esto es, para hacer pronósticos, la

mayoría de estas herramientas presuponen un modelo generador central con un error

aleatorio al cual se le asocia una distribución probabilística. La verificación de este

supuesto demanda un cierto nivel de entendimiento de los métodos estadísticos

utilizados. Este hecho puede dificultar la exitosa instauración de un sistema de

pronósticos en la industria.

Las redes neuronales artificiales son fáciles de utilizar y por otro lado, sus

capacidades de adaptación y de modelación no lineal las hacen atractivas para su

utilización en pronósticos de series de tiempo.

Aún cuando el comportamiento de la serie es lineal, las RNAs han mostrado ser

exitosas y competitivas como herramientas de modelación (Hwarng, 2001; Medeiros et

al., 2001; Zhang et al., 2001). A continuación se describen las hipótesis bajo las cuales

se desarrolló el presente trabajo.

Page 19: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

6

Capítulo1. Introducción

1.5. Hipótesis

Existe una dependencia del valor de la demanda en un instante de tiempo t con los

valores registrados en instantes de tiempo anteriores a t y el modelo generador de dichos

valores es desconocido. Por otra parte, dado que la dependencia es muchas veces no

lineal, podemos capitalizar en la capacidad de las RNAs para aproximar adecuadamente

este tipo de dependencia. En la construcción de un modelo de RNAs partimos del

supuesto de que una selección adecuada de los parámetros de las RNAs traerá consigo

una precisión de pronósticos mejor que la que se puede obtener a través de métodos

basados en dependencias lineales.

Page 20: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

CAPÍTULO 2

ANTECEDENTES

Introducción

Es del interés del área de planeación de la empresa obtener pronósticos confiables que

le permitan llevar a acabo la planeación de capacidad de la red de transmisión mediante

un buen aprovechamiento del capital. Por ello la importancia de obtener pronósticos

confiables.

La realización del pronóstico en este trabajo se llevó a cabo mediante el análisis de la

serie de tiempo utilizando RNAs. Para obtener pronósticos confiables es necesario

seleccionar de manera adecuada los parámetros que intervienen en el modelo de RNA.

No hay una metodología estándar para ajustar dichos parámetros. En este trabajo se

propone una metodología para la selección sistemática de los mismos.

En este capítulo se presenta la información teórica de diferentes técnicas integradas en

la metodología propuesta. En la Sección 2.1 se describe brevemente el análisis de series

de tiempo así como las principales aplicaciones y técnicas utilizadas para llevarlo a cabo.

La Sección 2.2 contiene los antecedentes de las RNAs, algunas aplicaciones prácticas y

cómo han sido utilizadas en el análisis de series de tiempo. En la Sección 2.3 se describe

Page 21: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

8 Capítulo 2. Antecedentes

lo que es un análisis de experimentos de tipo factorial y por último, la Sección 2.4

contiene información básica acerca de la optimización de modelos.

2.1. Análisis de Series de Tiempo

A lo largo de la historia, pronosticar el comportamiento de algún fenómeno ha ido

adquiriendo una gran importancia que se puede ver reflejada en la diversidad de

aplicaciones desarrolladas en las diferentes áreas del conocimiento. Las situaciones en las

que se requiere un pronóstico tratan de estimar un comportamiento futuro, por tanto, el

tiempo está directamente involucrado y existe la presencia de incertidumbre.

Para la elaboración de un pronóstico se requiere especificar el punto específico en el

tiempo para el cual se desea obtener el pronóstico. La calidad del pronóstico depende en

gran medida de esta especificación, así como de la disponibilidad de la información

histórica acerca de la variable de interés. Es posible decir entonces que a mayor período

de tiempo, habrá mayor incertidumbre en pronósticos puntuales.

Existen diversas metodologías que nos permiten elaborar pronósticos. La selección de

una de ellas depende de diversos factores tales como: la relevancia y disponibilidad de

los datos históricos, el grado de exactitud deseado, el período de tiempo que se desea

pronosticar y el análisis costo- beneficio del pronóstico, entre otros.

La elaboración de pronósticos se lleva a cabo en una diversidad impresionante de

áreas que abarcan desde la familia, la escuela, hasta el gobierno y los negocios. En los

negocios para obtener ventajas comerciales competitivas en un ambiente constantemente

cambiante, los dirigentes de una organización deben tomar decisiones correctas en el

tiempo dependiendo de la información que se tenga a la mano (R. J. Kuo et al., 1999).

Sin embargo, esta decisión está orientada por rangos de tiempo que van desde muchas

horas hasta muchos años dependiendo del tipo de negocio. Esto es, el tomar una decisión

exacta en un tiempo adecuado, juega un papel muy importante en las organizaciones. En

áreas como la mercadotecnia, los pronósticos son utilizados para estimar el tamaño del

Page 22: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

9 Capítulo 2. Antecedentes

mercado y la tendencia de precios. En finanzas es común utilizarlos en la estimación de

tasas de interés, mientras que en el área de producción un uso frecuente de éstos es para

estimar el crecimiento de líneas de producción.

Los pronósticos pueden llegar a disminuir la incertidumbre sobre el futuro,

permitiendo la elaboración de planes y campos de acción acorde a los objetivos de la

organización, también permiten tomar acciones correctivas apropiadas y a tiempo cuando

ocurren situaciones fuera de lo planeado.

Un pronóstico es, por lo general, la base para la toma de decisiones estratégicas,

tácticas y operacionales en muchas organizaciones. Dada su importancia, no es

sorprendente que se haya constituido en un área activa de investigación (Makridakis and

Wheelwright, 1987; Zhang, 2004).

Cuando es posible obtener información cuantitativa acerca del comportamiento de la

variable o fenómeno de interés a través del tiempo, es decir, cuando se dispone de una

serie de tiempo, como el ejemplo que se muestra en la Figura 1.2, el pronóstico

típicamente se realiza utilizando Análisis de Series de Tiempo.

Existen dos tipos de procedimientos de modelación de series de tiempo que se

clasifican de acuerdo a los supuestos bajo los cuales se desarrolla el modelo:

procedimientos paramétricos y procedimientos no-paramétricos. Los procedimientos

paramétricos son aquéllos en los cuales los parámetros del modelo tienen un significado

de acuerdo a un modelo físico, químico, económico, etc. Dentro de esta clasificación se

encuentran los métodos estadísticos tradicionales tales como, promedios móviles,

suavizado exponencial, regresión y descomposición de series de tiempo. Estos métodos

han sido ampliamente utilizados durante varias décadas y todos ellos asumen que el valor

futuro de la serie de tiempo está linealmente relacionada con las observaciones pasadas.

Uno de los métodos más populares es el de promedios móviles autoregresivo integrado

(ARIMA), que fue popularizado por Box-Jenkins (1976). Por otro lado, los métodos no–

paramétricos, son aquéllos que sólo dependen de los datos y sus parámetros están libres

de interpretación o sujeción a otro modelo, tal es el caso de las RNAs.

Page 23: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

10 Capítulo 2. Antecedentes

2.2. Redes Neuronales Artificiales (RNAs)

Las RNAs surgieron como una analogía de la neurona biológica mostrada en la

Figura 2.1, las dendritas reciben las señales de entrada procedentes de otras neuronas a

través de uniones llamadas sinapsis, el cuerpo de la neurona es llamado soma y el axón

lleva la salida de la neurona a las dendritas de otras neuronas.

Figura 2.1: Neurona Biológica.

En general, una neurona envía su salida a otras por medio de su axón. El axón lleva la

información por medio de diferencias de potencial, u ondas de corriente, que depende del

potencial de la neurona. La neurona recoge las señales por su sinapsis sumando todas las

influencias excitadoras e inhibidoras. Si las influencias excitadoras positivas dominan,

entonces la neurona da una señal positiva y manda este mensaje a otras neuronas por su

sinapsis de salida (Ghaziri , 1996).

En el caso de la Neurona Artificial representada en la Figura 2.2, ésta recibe un

conjunto de señales entradas y las acumula hasta alcanzar un umbral, una vez alcanzado

este umbral, lo transforma mediante la función de transferencia (generalmente una

función no-lineal) y envía el resultado ponderado de acuerdo a los pesos de las

conexiones hacia otras neuronas.

Page 24: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

11 Capítulo 2. Antecedentes

w1

w2

wi

wn

x 1 x 2

x i x n

( )f w xt ⋅ y

Neurona

Pesos multiplicativos

Función de transferencia

En

trad

as

Salida

V1

Figura 2.2: Neurona Artificial.

El concepto de neurona artificial fue introducido en 1943 (McCulloch and Pitts,

1943). En la actualidad, las RNA han mostrado ser un procedimiento efectivo de

propósito general para el reconocimiento de patrones, clasificación, agrupamiento y

predicción (Ghiassi et al., 2005).

Existen diferentes tipos de RNAs dependiendo de la forma en que se interconectan las

neuronas dentro de la RNA. En pronóstico de series de tiempo, la RNA utilizada la

abrumadora mayoría de las veces, es una RNA multicapa de propagación hacia adelante

entrenada por retropropagación del error y con una neurona en la capa de salida. Tener

una sola neurona en la capa de salida indica que solamente se predice un solo período a

futuro. Esto nos da una idea del enfoque dominante en el área.

De manera general, una RNA multicapa de propagación hacia adelante (Feedforward)

está compuesta de tres o más capas formadas por conjuntos de neuronas que poseen

características similares (Figura 2.3). La primera capa se denomina capa de entrada y es

donde se recibe la información externa. La última capa es conocida como capa de salida

y es donde se obtiene la solución final del problema que se esté tratando. La capa de

entrada y la capa de salida están separadas por una o más capas denominadas capas

Page 25: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

12 Capítulo 2. Antecedentes

ocultas, estas capas son las encargadas de brindarle flexibilidad a la RNA para aproximar

relaciones complejas entre los datos. Las neuronas en las capas adyacentes están

completamente conectadas y estas conexiones van de la capa baja a la capa alta. Por

ejemplo, en la Figura 2.3 se muestra una RNA multicapa de propagación hacia adelante,

que contiene tres capas: una capa de entrada, una capa oculta y una capa de salida. La

cantidad de neuronas en cada capa varía dependiendo de la aplicación.

.

.

jiWsjV

.

.

.

.

Capa de Entrada Capa de Salida Capa Oculta

Figura 2.3: RNA multicapa de propagación hacia adelante.

Antes de utilizar un modelo de RNA para que realice una tarea específica, éste

necesita ser entrenado y validado. Básicamente el entrenamiento es el proceso de

determinación de los pesos de las conexiones, elementos clave del modelo de RNA. El

conocimiento que adquiere la RNA durante el entrenamiento es almacenado en los pesos

de las conexiones. Recordemos que las neuronas transforman la información que reciben

mediante la función de transferencia y la envían de manera ponderada de acuerdo a los

Page 26: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

13 Capítulo 2. Antecedentes

pesos de las conexiones hacia las neuronas con las cuales tienen conexión. Se dice que el

entrenamiento es supervisado, cuando para cada vector de entrada (conocido como

patrón de entrenamiento) se conoce el valor de la salida (denominado salida deseada).

Los pesos de las conexiones se determinan durante el proceso de entrenamiento mediante

un algoritmo que minimiza una medida del error de aproximación de la RNA. Los

algoritmos de entrenamiento más comunes son los de retropropagación del error tales

como Levenberg-Marquard (lm) y el de Regularización Bayesiana (br). En estos

algoritmos, una vez que se conoce la salida de la RNA, se calcula el error de la

aproximación con respecto al valor deseado y se propaga hacia atrás a través de las

conexiones de la RNA actualizando los pesos de las mismas.

Generalmente, los patrones disponibles se separan en dos subconjuntos, uno de

entrenamiento y otro de validación. El subconjunto de validación ayuda a evaluar o

medir la capacidad de predicción o generalización de la RNA, por un proceso que se

denomina validación cruzada. En la validación se utilizan los patrones de datos que no

fueron utilizados durante el entrenamiento y se calcula el error de la aproximación. Con

esta información se pueden tomar medidas para evitar el sobreentrenamiento de la RNA.

En resumen, el proceso de entrenamiento sirve para que la RNA adquiera conocimiento

del comportamiento de los datos y la validación se utiliza para preservar la capacidad de

generalización del modelo. En la literatura se ofrece poca información acerca de la

selección de estos subconjuntos. Según Zhang et al. (1998), muchos autores seleccionan

éstos siguiendo una regla de 90% vs. 10%, 80% vs. 20% ó 70% vs. 30%, etc. Algunos

otros los seleccionan dependiendo de la aplicación que estén desarrollando, por ejemplo

Granger (1993) sugirió que para modelos no lineales en pronósticos al menos el 20% de

los datos deberían ser usados para validar el modelo de RNAs.

De acuerdo con Zhang (2004), las RNAs se destacan porque son modelos

matemáticos no lineales lo que las hace adecuadas para aproximar este comportamiento

en múltiples aplicaciones. Son además modelos no paramétricos que no requieren

suposiciones muy restrictivas acerca del proceso bajo el cual se están generando los

datos. Por esta razón son menos susceptibles a especificaciones erróneas de un modelo

que los métodos paramétricos. Esta característica de las RNAs es atractiva en la mayoría

Page 27: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

14 Capítulo 2. Antecedentes

de las situaciones de pronóstico donde los datos son fáciles de obtener pero el mecanismo

de generación de los mismos no es conocido.

Ha sido matemáticamente demostrado que las RNAs poseen la capacidad de

aproximación universal de funciones continuas que tienen primera y segunda derivada en

todo su dominio. Además muchos estudios realizados demuestran que pueden aproximar

con exactitud diversos tipos de relaciones funcionales complejas (Irie and Miyake, 1988;

Hornick et al., 1989; Cybenko, 1989). Esta última característica es muy importante y

poderosa, ya que de cualquier modelo de predicción se espera que detecte con exactitud

la relación funcional entre la variable a predecir y otros factores o variables relevantes.

La combinación de modelación no lineal y aprendizaje a partir de los datos hace que

las RNA’s sean una herramienta flexible de modelación general para la realización de

pronósticos. A continuación se describen algunas de las aplicaciones de las RNAs para

pronósticos de series de tiempo.

2.2.1. Aplicaciones de las RNAs en pronósticos de series de tiempo

La idea de utilizar RNAs en pronóstico de series de tiempo data de 1964 cuando Hu

aplicó una RNA lineal adaptable de Widrow para el pronóstico del tiempo (Zhang, et al.,

1998). Debido a la ausencia de un algoritmo de entrenamiento para RNA multicapa en el

tiempo, la investigación quedó limitada. En 1974 Werbos formuló primero la

retropropagación pero no fue conocido por los investigadores en RNAs. A partir de 1986

cuando el algoritmo de retropropagación (del inglés backpropagation) fue introducido

por Rumelhart et al., (1986) el desarrollo de RNAs para pronóstico de series de tiempo

ha ido en incremento (Zhang et al., 1998). Werbos (1988) encontró que la RNA

entrenada por retropropagación superó el desempeño de los métodos estadísticos

tradicionales tales como los procedimientos de regresión y Box- Jenkins.

En años recientes, las RNAs han llegado a ser extremadamente populares en el

pronóstico de series de tiempo, en un gran número de áreas, incluyendo finanzas,

Page 28: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

15 Capítulo 2. Antecedentes

generación de energía, medicina, recursos del agua y ciencias ambientales, entre otras

(Maier et al., 2000).

Por ejemplo, han sido desarrollados modelos de RNAs para pronosticar la calidad

del aire (Gardner and Dorling, 1999; Kolehmainen et al., 2001; Niska et al., 2004). Por

otra parte, R.J. Kuo, et al., (1999) utilizaron datos de una cadena de supermercados de

China y encontraron que un modelo de RNA como el de la Figura 2.3, supera en gran

medida el desempeño del método estadístico autoregresivo de promedios móviles o

ARMA.

Otras aplicaciones se han concentrado en los recursos del agua, (Maier et al., 2000 ).

Por ejemplo, Ashu et al., (2001) realizaron la modelación de una RNA para el pronóstico

a corto plazo de la demanda de agua con el fin de que los sistemas que distribuyen este

vital líquido proporcionaran un servicio eficiente. Utilizaron la RNA de propagación

hacia adelante con retropropagación y utilizaron una y dos capas ocultas; los resultados

de las RNAs fueron comparados con modelos estadísticos de regresión. Observaron que

las RNAs encontraron pronósticos con mayor calidad que los modelos de regresión

empleados. Cigizoglu (2003) utilizó un modelo de RNA para pronosticar la magnitud

del flujo de un río en el este mediterráneo de Turquía, los resultados obtenidos con la

RNA fueron más precisos que los encontrados con métodos de Box-Jenkins.

En otra aplicación de los recursos del agua, Daliakopoulos et al., (2005) utilizaron

RNAs para pronosticar el nivel de agua subterránea. Analizaron datos del valle de

Messara en la parte sur de la isla de Creta en Grecia, probaron seis arquitecturas

diferentes de RNAs y variaron el algoritmo de entrenamiento así como la cantidad de

neuronas en la capa oculta. Encontraron que la RNA con mejor desempeño fue la RNA

de propagación hacia adelante con una capa oculta, entrenada mediante el algoritmo de

retropropagación de Levenberg- Marquart, utilizando 20 neuronas en la capa de entrada,

3 neuronas en la capa oculta y una en la capa de salida. Con este modelo de RNA

pronosticaron hasta 18 meses adelante. A partir del pronóstico del primer período

pronosticaron los siguientes mediante iteración del modelo.

User
Usarlo para RNA múltiple.
Page 29: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

16 Capítulo 2. Antecedentes

Gutiérrez-Estrada et al., (2004) realizaron una comparación de un modelo de RNA

contra métodos estadísticos tradicionales tales como regresión múltiple, suavizado

exponencial y ARIMA, en el pronóstico de la concentración de Amonio, utilizaron datos

de un criadero de peces (del inglés fishfarm) del sur de España. Probaron un modelo de

RNA parecido al de la Figura 2.3, sólo que con dos capas ocultas. En promedio, la RNA

realizó mejores predicciones que los métodos convencionales. Preprocesaron la

información de la siguiente manera: utilizaron como datos las diferencias existentes

entre períodos adyacentes y posteriormente, transformaron esas diferencias a la escala

[0, 1]. El pronóstico fue de un solo período.

En el área de finanzas, Qing et al., (2005) utilizaron RNAs para pronosticar el

comportamiento de la bolsa de valores; los resultados que obtuvieron mostraron que las

RNAs son una buena herramienta para pronosticar el precio de las acciones en mercados

emergentes como China. Otro trabajo desarrollado en esta área es el desarrollado por

West et al., (2005).

Otra área de aplicación de las RNAs es en la predicción de demanda de algún

producto o servicio. En los últimos años se ha reportado que las RNAs en la predicción

de carga eléctrica han demostrado ser una de las técnicas más exitosas en esta área.

González et al., (2005) pronosticaron el consumo de energía/hora en edificios.

Correlacionaron las condiciones climáticas, los días y horarios, con las variaciones de

carga, para predecir la carga y el consumo total en cada hora. Utilizaron una RNA de

avance con tres capas y manejaron los datos en diferencias en la escala [-0.9, 0.9]. La

calidad de los resultados obtenidos con el modelo de RNA fueron muy precisos, de

acuerdo con su reporte.

Sözen, et al., (2005) desarrollaron un modelo de RNA para pronosticar la radiación

solar en Turquía, compararon los resultados con los que otros autores habían encontrado

al utilizar métodos estadísticos de descomposición clásica. Su estudio confirmó que el

modelo de RNA pronostica los valores de la radiación solar de manera más precisa que

los métodos utilizados en estudios anteriores.

Page 30: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

17 Capítulo 2. Antecedentes

Estudios recientes acerca de la aplicación de RNAs en problemas de investigación de

operaciones y negocios, incluyendo pronóstico en finanzas, se pueden encontrar en

Zhang (2004) y Smith et al., (2000).

En las aplicaciones mencionadas anteriormente, hacen uso de RNAs multicapa

entrenadas por retropropagación del error para pronósticos a corto plazo y se limitan a

utilizar RNAs con una sola neurona en la capa de salida. Sin embargo, en aplicaciones

prácticas es común que se desee estimar más de un período futuro, este tipo de pronóstico

se caracteriza por la incertidumbre causada por la distancia u horizonte de tiempo

utilizado.

Cuando se desea pronosticar múltiples períodos, muchos investigadores (Zhang et al.,

1998; Hwarng, 2001; Hill et al., 1996; Nelson et al., 1999) han utilizado como recurso un

modelo de RNA con una neurona en la capa de salida, como en los casos anteriores. Esta

RNA se ha utilizado como base para generar pronósticos de múltiples períodos de la

manera siguiente: una vez que tiene el pronóstico para el primer período, se itera el

modelo considerando a éste como dato real para calcular el pronóstico del segundo

periodo, y así sucesivamente hasta alcanzar el horizonte de planeación deseado. Esta

técnica obviamente trae consigo la desventaja de propagar el error de cada uno de los

pronósticos a lo largo de todos los períodos que le siguen. Esto es, si en el pronóstico del

primer período se tuvo un error grande, éste afectará el pronóstico del segundo período y

éste a su vez el del tercero y así sucesivamente. En otras palabras, un mal pronóstico

generado en los primeros períodos podría afectar de manera adversa los pronósticos de

los últimos períodos.

Una técnica utilizada por Duhoux et al., (2001) es utilizar cadenas de RNAs. Esta

técnica consiste en utilizar n RNAs simples, con diferentes tamaños del vector de

entradas que van desde 1 hasta n. La entrada de una RNA será la misma que la entrada de

la RNA anterior más el valor pronosticado por la RNA anterior. Las desventajas que

reportaron en cuanto al uso de este método son que: 1) El modelo requiere un número

muy grande de RNAs y de datos y 2) el conocimiento adquirido en un modelo de RNA

no es usado para la construcción del siguiente modelo.

User
Usarlo para RNA múltiple.
Page 31: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

18 Capítulo 2. Antecedentes

Otra técnica comúnmente utilizada para el pronóstico de múltiples períodos es la

creación de RNAs independientes para cada horizonte de pronóstico deseado, es decir, se

crean modelos de RNAs independientes, uno para pronosticar el valor de la serie en el

primer período, otro para pronosticar el del segundo período, otro para el pronóstico del

tercero, y así para cada uno de los períodos. Este método tiene la ventaja de no propagar

el error de cada pronóstico hacia los que le siguen, sin embargo se tendrían varios

modelos independientes, desarrollados y seleccionados de manera diferente, dependiendo

del horizonte de pronóstico. Hanh et al., (2004) utilizan esta técnica para pronóstico de

series de tiempo con horizonte de planeación largo, utilizando series de tiempo de la

demanda de gas en una estación compresora en Saskatchewan, Canadá. Los resultados

obtenidos fueron comparados contra un modelo iterativo y observaron que crear

múltiples RNAs, una para cada horizonte de planeación resultó con mejor aproximación

que utilizar un modelo simple en el que consideran como dato real el pronóstico

calculado en el o los períodos anteriores.

Una técnica más de RNAs para el pronóstico de múltiples períodos es crear un solo

modelo que simultáneamente genere los pronósticos de múltiples períodos, es decir, una

RNA con múltiples salidas. Este método, se espera que conduzca a mejores resultados

(Zhang, 2004) que las técnicas descritas anteriormente, sin embargo, aún no está

teóricamente demostrado. Tenemos poco conocimiento de trabajos desarrollados con la

aplicación de esta técnica.

A pesar de que son numerosas las aplicaciones desarrolladas mediante RNAs para

pronóstico de series de tiempo y que los resultados han sido satisfactorios, no ha sido

posible estandarizar una metodología que garantice la construcción de modelos de RNAs

con buen desempeño. El desempeño de la RNA está determinado por la exactitud del

pronóstico y ésta depende de varias decisiones sumamente importantes en cuanto a la

definición de los parámetros que intervienen en el modelo. Estas decisiones se discuten a

continuación.

Page 32: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

19 Capítulo 2. Antecedentes

2.2.2 Decisiones en la aplicación de RNAs para pronósticos de series de

tiempo

Dentro de las decisiones críticas en la construcción de una RNA multicapa (ver Figura

2.3) para pronósticos de series de tiempo se encuentran la especificación de la

arquitectura en términos de la cantidad de variables de entrada (el número de neuronas en

la capa de entrada), así como el número de neuronas en la capa oculta y en la capa de

salida (Qi et al, 2001).

Al determinar el número de neuronas en la capa de entrada, se determina la cantidad

de datos históricos que se deben utilizar para la realización del pronóstico. En este

documento, a los datos históricos se les denominará con el término en inglés lags. Así

mismo, es bien sabido que el número de neuronas en la capa oculta determina la

capacidad de la RNA para aproximar las relaciones no lineales entre los lags y las

variables de salida o pronósticos (Zhang et al., 1998). La selección de número de

neuronas en la capa oculta ha sido anteriormente estudiada por diversos autores (Zhang,

2004; Hansen et al., 2003; Sexton et al., 2005), sin embargo, no existe aún una manera

definitiva para abordar este problema. Otra decisión implica determinar si se

preprocesan los datos o no. Son numerosas las aplicaciones de RNAs en las que los

autores aconsejan el preprocesamiento de los datos para mejorar el desempeño de la

RNA. Por ejemplo, Piramuthu et al. (1998) documentan la importancia del mismo. Se ha

observado que al construir nuevas representaciones de los datos se pueden atenuar las

dificultades durante la fase de entrenamiento, en la que la RNA trata de aprender

(representar) los datos que se le presentan. El preprocesamiento reduce el grado de

dispersión y complejidad de los datos en el espacio de búsqueda bajo el cual se lleva a

cabo el entrenamiento (Hansen et al., 2003) y es por tanto un factor importante si se

busca mejorar el desempeño de la RNA.

Por otra parte, seleccionar el algoritmo de entrenamiento que se utilizará para

modificar los pesos de las conexiones de la RNA es otro factor importante para la gran

mayoría de aplicaciones de RNAs. Pronósticos de series de tiempo en este caso, no es la

excepción.

Page 33: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

20 Capítulo 2. Antecedentes

Para la selección de los parámetros que intervienen en el modelo de RNA, algunos

autores utilizan prueba y error; otros más han utilizado algoritmos genéticos o

procedimientos híbridos, sin embargo existe poca información y evidencia acerca de la

efectividad de los mismos. Por ejemplo, Liao et al., (2005) proponen un procedimiento

para la selección de parámetros de la RNA que consiste en tres etapas, en cada una de

ellas fijan algunos de los parámetros y utilizan un diseño de experimentos. La desventaja

en este método es que en cada etapa se ajusta uno de los parámetros, es decir, el ajuste se

realiza de manera independiente ignorando por completo la posible interacción entre los

diferentes parámetros del modelo.

En este trabajo se propone que la selección de los parámetros de RNA para pronóstico

de series de tiempo se realice de una manera sistemática y consistente por medio de la

utilización de métodos estadísticos experimentales y técnicas de optimización siguiendo

la metodología que se describe en el siguiente capítulo. La información relevante en

cuanto al diseño de experimentos se presenta a continuación.

2.3. Análisis y Diseño de Experimentos

El Diseño y Análisis de Experimentos (ADE) es una colección de herramientas

estadísticas que se relacionan con la planeación, la ejecución y la interpretación de un

experimento. Tiene como objeto estudiar los efectos de variables de interés dispuestas en

varios niveles en una o varias respuestas cuantificables. Sir Ronald A. Fisher introdujo

los principios básicos de ADE en las décadas de 1920 y 1930 en el área agrícola

(Montgomery 2004; Martínez 1988).

De manera general, un experimento se puede definir como una prueba planeada donde

se introducen cambios controlados en las variables de entrada de un proceso o sistema

con el objetivo de analizar la variación inducida por estos cambios en una repuesta o

salida (Montgomery, 2004). Un proceso o sistema puede ser visto como el modelo

representado en la Figura 2.4.

Page 34: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

21 Capítulo 2. Antecedentes

El diseño de experimentos se ha aplicado en diversas disciplinas, puede considerarse

como parte del conocimiento científico y es uno de los medios más utilizados para

conocer el funcionamiento de procesos y sistemas. En general, un proceso puede ser

visto como una combinación de máquinas, métodos, personas u otros recursos que

transforman ciertas entradas (con frecuencia un material) en una salida que tiene una o

más respuestas observables. Algunas variables son controlables, mientras que otras no lo

son.

mm zzzz ... 121 −

nn xxxx ... 121 −

Factores Controlables

Salidas, y Entradas PROCESO

Factores no Controlables

Figura 2.4: Modelo general de un proceso o sistema.

Cuando se planea o ejecuta un experimento es siempre recomendable usar el

conocimiento no-estadístico del sistema para complementar el proceso de

experimentación, así como para mantener el tamaño y la concentración del experimento

dentro de límites adecuados. En muchos experimentos interviene el estudio de los

efectos de dos o más factores, en general los diseños factoriales son muy recomendables

para este tipo de análisis.

Page 35: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

22 Capítulo 2. Antecedentes

El diseño factorial es una estrategia de experimentación en la que en cada réplica del

experimento se estudian todas las combinaciones posibles de un número determinado de

valores de cada factor. Al número determinado de valores que toma cada factor se les

llama niveles. Por ejemplo, si tenemos el factor A y el factor B, cada uno con dos

niveles, cada réplica experimental contiene 22 combinaciones, a cada nivel le

corresponde un valor específico del factor.

El efecto de un factor se define como el cambio en la respuesta o medida de

desempeño producido por un cambio en el nivel del factor. En algunos experimentos

puede encontrarse que la diferencia en la respuesta entre los niveles de un factor no es la

misma para todos los niveles de otro factor, a esto se le llama interacción entre factores.

Cuando los factores del diseño de experimentos son cuantitativos, una representación

del experimento se puede realizar mediante un modelo de regresión en el que las

variables independientes representan los factores del experimento, la variable

dependiente corresponde a la medida de desempeño o respuesta y la estimación de los

parámetros del modelo de regresión están relacionados con la estimación de los efectos

de los factores en la medida de desempeño. Para la estimación de parámetros

generalmente se utiliza el método de mínimos cuadrados. Información más completa

acerca del análisis y diseño de experimentos se puede encontrar en Montgomery (2004).

Se puede utilizar el análisis y diseño de experimentos para caracterizar la variación de

un sistema y para obtener modelos empíricos como la regresión descrita anteriormente.

Estos modelos pueden después utilizarse para llevar a cabo la optimización. En la

siguiente sección se abordan aspectos básicos del área de optimización.

2.4. Optimización

En la gran mayoría de aplicaciones prácticas en la ciencia y la ingeniería se emplean

modelos matemáticos para representar un sistema o proceso de interés con el fin de

estudiar y entender el funcionamiento del mismo. Podemos decir que un modelo es un

Page 36: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

23 Capítulo 2. Antecedentes

conjunto de relaciones matemáticas que representan una abstracción del sistema real en

consideración.

De acuerdo con Floudas (1995), un modelo matemático consta de tres elementos

clave: variables, parámetros y restricciones o relaciones matemáticas. Las variables

pueden tomar diferentes valores y sus especificaciones determinan diferentes estados del

sistema. Representan las decisiones que se pueden tomar para afectar el rendimiento del

sistema, por ejemplo, la cantidad de producto a fabricar o vender, la cantidad de materia

prima, etc. Estas pueden ser continuas, enteras o mixtas (combinación de continuas y

enteras). Los parámetros se fijan a valores específicos y cada especificación determina un

modelo diferente. Las relaciones matemáticas pueden ser clasificadas en igualdades,

desigualdades y condiciones lógicas. Usualmente las igualdades son utilizadas para

representar los balances de masa y energía; relaciones de equilibrio, cálculos de

propiedades físicas y relaciones de diseño que describen el sistema físico. Las

desigualdades generalmente representan la asignación de recursos, los límites de

capacidad disponible y demanda. Mientras que las condiciones lógicas proveen las

conexiones de este tipo entre las variables continuas y las variables enteras. Las

relaciones matemáticas pueden ser algebraicas, transcendentes, o una mezcla de

algebraicas y trascendentes; pueden ser lineales o no lineales. Una relación es

trascendente cuando contiene expresiones trigonométricas, exponenciales o logarítmicas.

Un problema de optimización, además de tener las características de un modelo

matemático, cuenta con uno o múltiples criterios que representan el desempeño del

sistema o proceso. El criterio de desempeño denota la función objetivo del problema de

optimización. La función objetivo representa una medida de desempeño cuantificable

que se quiere ya sea maximizar o minimizar. Por ejemplo, en general los costos

representan una medida de desempeño que se desea minimizar y las ganancias una

medida que se quiere maximizar.

La formulación (2.1) es la representación general de un problema de minimización.

Page 37: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

24 Capítulo 2. Antecedentes

(2.1)

n X x g(x)

h(x)

f(x)

ℜ⊆∈

≤=

00

s.a min

Si cualquiera de las funciones es no lineal, entonces la formulación

(2.1) es llamada problema de optimización no lineal. Las funciones

pueden tomar cualquier forma de no linealidad. Este tipo de problemas abundan en un

gran número de aplicaciones en diversas áreas tales como diseño y control de procesos

químicos, localización de facilidades, diseño de redes, diseño de circuitos electrónicos

entre otras.

g(x)xhxf ),( ),(

g(x)xhxf ),( ),(

Una vez que se tiene el problema de optimización se procede a resolverlo con el fin de

encontrar la mejor solución que cumpla con el conjunto de restricciones. Al conjunto de

soluciones que cumplen con el conjunto de restricciones se les conoce como soluciones

factibles y la mejor de ellas es conocida como solución óptima. Lo deseable es encontrar

la solución óptima, sin embargo muchas veces esto no es posible dadas las características

de los problemas. Estas características en general tienen que ver con convexidad.

Se dice que un conjunto es un conjunto convexo si para cualesquiera dos

puntos se satisface que para cada

nES ∈

Sxx ∈21 , Sxx ∈−+ 21 )1( λλ ]1,0[∈λ .

Ahora bien, sea un conjunto convexo, se dice que es convexa si y sólo si

se satisface (2.2) para cualquier y

S )( xf

Sxx ∈21 , 10 ≤≤ λ .

)()()1(])1[( 2121 xfxfxxf λλλλ +−≤+− (2.2)

Page 38: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

25 Capítulo 2. Antecedentes

En la Figura 2.5, podemos observar gráficamente lo que sería a) una función convexa;

b) una función estrictamente convexa y en la Figura 2.6 se representa una función no

convexa.

a) b)

Figura 2.5: a) Función convexa y b) Función estrictamente convexa.

Figura 2.6: Función no convexa.

Page 39: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

26 Capítulo 2. Antecedentes

Más aún, decimos que es estrictamente convexa si y sólo si se cumple

estrictamente el sentido de la desigualdad (2.2) para todo tal

que y

)( xf

Sxx ∈21 ,

21 xx ≠ 10 << λ .

Si y satisface (2.3) Sx ∈* Sx ∈∀ , decimos que es un mínimo

global.

*x

(2.3) )()( * xfxf ≤

Si y existe un entorno tal que se satisface (2.3)

, se dice que es un mínimo local.

Sx ∈* )( *xV

)( *xVSx ∩∈∀ *x

La función estrictamente convexa tiene a lo más una solución óptima, lo cual

garantiza optimalidad global (Borwein, et al., 2000; Floudas, 1995).

)( xf

Nótese que, si es convexa podemos encontrar rápidamente una solución

óptima global, pero si no lo es, es posible tener varias soluciones óptimas locales. Estas

provocan que los métodos utilizados para resolver el problema se queden atrapados en

ellas reduciendo la posibilidad de encontrar una solución óptima global.

)( xf

Existen varias referencias de consulta para el área de optimización, dentro de las que

se encuentran Borwein et al., (2000), Floudas (1995) y Luenberger (1973).

Cuando se tienen múltiples criterios en un problema de optimización, el problema se

clasifica como de optimización multicriterio. En la práctica es muy común la existencia

de este tipo de problemas. Por ejemplo, en muchas empresas se pretende maximizar la

calidad de un producto y minimizar su costo de producción simultáneamente. Ésto

implica un conflicto. Existen diversas técnicas que se han desarrollado con el fin de

resolver este tipo de problemas.

Page 40: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

27 Capítulo 2. Antecedentes

Las técnicas de optimización multicriterio tienen como objetivo encontrar aquellas

soluciones que representen los mejores compromisos entre todas las medidas de

desempeño, las cuales se denominan soluciones eficientes. Una representación gráfica

conveniente se puede encontrar en la Figura 2.7.

Objetivo 1. Minimizar

Obj

etiv

o 2.

Max

imiz

ar

Figura 2.7: Representación Gráfica de un Problema de Optimización Multicriterio. La

línea mostrada une soluciones eficientes y delimita la frontera eficiente del problema.

Dado que no es el objetivo en este trabajo discutir a fondo técnicas multicriterio, se

refiere al lector interesado a Deb (2004) y a Hillermeier (2001) para ahondar en el tema.

Una de las técnicas que se ha propuesto recientemente para resolver este tipo de

problemas es el análisis envolvente de datos. Algunas aplicaciones en el terreno de la

manufactura se pueden encontrar en Cabrera-Ríos et al. (2002,2004), Castro J. M. et al.

(2004) y en Castro C. E et al. (2003).

Page 41: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

CAPÍTULO 3

METODOLOGÍA PROPUESTA

Introducción

Desarrollar un modelo de RNAs para una aplicación particular de pronóstico no es

una tarea trivial. Aunque en la actualidad existen herramientas computacionales que

ofrecen a los usuarios la construcción de modelos de RNAs de una manera fácil y

rápida, continúa siendo un reto la comprensión de muchos factores que determinan la

efectividad de un modelo de RNAs. Zhang (2004) llega a afirmar que la construcción de

una RNA efectiva es una combinación de arte y ciencia.

En este capítulo, se propone una metodología basada en el análisis estadístico y

optimización de las medidas de desempeño de la RNA, que son esencialmente definidas

para nuestros propósitos como medidas del error de predicción. El método consiste en

diseñar y analizar un experimento estadístico en el que cada factor o variable controlable

corresponde a uno de los parámetros que se desea ajustar en la RNA. Se caracterizan los

resultados mediante un análisis de varianza basado en un modelo de regresión apropiado

para cada medida de desempeño. Posteriormente, se considera cada uno de los modelos

de regresión como la función objetivo de un problema de optimización en el que se

28

Page 42: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

29 Capítulo 3. Metodología Propuesta

busca el valor de los parámetros que minimizan el valor objetivo de la medida de

desempeño. La solución final determina el valor que deben tomar los parámetros para

que el modelo de RNAs encuentre pronósticos confiables.

3.1 Descripción de la Metodología

La Figura 3.1 representa esquemáticamente la metodología que se propone con el

objetivo de seleccionar los parámetros del modelo de RNAs de una manera sistemática y

consistente. La metodología aquí se presenta de una manera general para RNAs. En los

capítulos posteriores se discutirán los detalles de su aplicación en pronósticos de series

de tiempo. Dentro de las características atractivas de la metodología se encuentra que:

(1) utiliza técnicas establecidas y confiables, (2) puede instaurarse sin necesidad de una

codificación especializada y (3) hace entendible la interrelación entre los varios

parámetros de la RNA.

Esta metodología surgió con la idea básica de ver la RNA como un sistema en el cual

existen variables controlables que influyen en una de sus medidas de desempeño. De

esta forma, al considerar los parámetros de la RNA como variables controlables que

influyen en el desempeño de la misma, podemos variar estos parámetros para formar la

superficie de respuesta del error de predicción de la RNA y así construir un modelo de

regresión que relacione parámetros y error de predicción. Con este conocimiento es

posible, en caso que sea necesario, eliminar variables que no sean estadísticamente

significativas, caracterizar interacciones, así como determinar si las medidas de

desempeño seleccionadas acerca de la RNA dependen de conjuntos de variables

distintos entre sí. En este último caso, es factible crear problemas independientes de

optimización para distintas medidas de desempeño.

Page 43: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

30 Capítulo 3. Metodología Propuesta

Tipo de RNA

Parámetros

Respuestas1) Descripción de la RNA

como Sistema.

2) Análisis y Diseño de Experimentos.

Caracterización

3) Metamodelación

5) Solución

4) Problemas de Optimización.

Múltiples Inicializaciones

Figura 3.1: Metodología Propuesta para la Selección de Parámetros en RNAs.

Dado que nuestro objetivo final es determinar qué valores deben tomar los

parámetros para obtener un valor deseable en las medidas de desempeño de la RNA, el

problema se convierte en uno de optimización.

Page 44: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

31 Capítulo 3. Metodología Propuesta

Los pasos de la metodología propuesta en la Figura 3.1 se pueden describir de la manera

siguiente:

1) Descripción de la RNA como Sistema.

Determinación del tipo de RNA que se utilizará para el análisis.

El tipo de RNA está determinado por la manera en que se interconectan las neuronas

en la red, suele conocerse con el nombre de topología o arquitectura de la RNA. Existe

una diversidad impresionante de arquitecturas de RNAs, que han sido desarrolladas,

estudiadas y utilizadas en diversas aplicaciones. Las RNAs más comunes son las redes

por capas, las redes recurrentes y las redes de conexión lateral (Ghaziri, 1996). En el

caso de RNAs para pronósticos de series de tiempo, la más utilizada es la RNA

multicapa, representada en la Figura 2.3.

Identificación de los parámetros controlables.

Una vez que se ha seleccionado el tipo de RNA que se utilizará para la aplicación, es

necesario identificar aquellos parámetros que afectan el desempeño de la RNA con el fin

de asignarles un valor que permita la obtención de una RNA confiable.

Definición de las respuestas de interés (medidas de desempeño de la RNA).

Las respuestas de interés o medidas de desempeño de la RNA suelen ser medidas que

cuantifican el error de aproximación. Las más comunes son el Error Absoluto Medio o

MAE y el Error Cuadrado Medio o MSE. La aplicación y los intereses del usuario

determinan la selección de la medida de desempeño.

Page 45: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

32 Capítulo 3. Metodología Propuesta

2) Análisis y Diseño de Experimentos.

Para llegar a la definición de la metodología propuesta de la Figura 3.1, se partió del

hecho de que un experimento puede ser visto como una prueba planeada donde se

introducen cambios controlados en un proceso o un sistema con el objetivo de analizar la

variación inducida por estos cambios en una medida de desempeño.

En varios casos y dada la rapidez relativa con la que se pueden entrenar las redes

neuronales, será factible escoger un diseño factorial. Este diseño contiene tantas corridas

experimentales como combinaciones de niveles resulten para los factores, esto es, si

existen cuatro factores variados a tres, cuatro, tres y cinco niveles cada uno, el diseño

factorial tendrá 3x4x3x5 = 180 corridas experimentales. De esta manera, los factores

controlables que intervienen en el experimento corresponden a los parámetros del

modelo de RNA que se desean determinar. Cada corrida experimental indica los valores

asignados a los parámetros para construir la RNA correspondiente y bajo los cuales se

llevará a cabo el entrenamiento y validación de la misma. Una vez realizado el

entrenamiento, se cuantifica la calidad de predicción de la RNA a través de las medidas

de desempeño seleccionadas para el estudio y se registra como parte del experimento.

En los parámetros donde sea posible considerar tres o más valores diferentes, es

recomendable utilizar al menos tres de esos valores, con el fin de estimar curvatura.

Con el objetivo de caracterizar la variación producida por los parámetros en las

medidas de desempeño del modelo de RNA, requerimos hacer un análisis de varianza

basado en un modelo de regresión lineal múltiple de segundo orden con interacción,

similar al de la Ecuación (3.1), bajo el supuesto de que los residuosε , son

independientes e idéntica y normalmente distribuidos con una varianza desconocida pero

constante.

Page 46: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

33 Capítulo 3. Metodología Propuesta

3) Metamodelación.

En esta fase se describe la superficie de cada respuesta (medida de desempeño)

mediante un modelo de regresión apropiado, sin dejar a un lado la comprobación de los

supuestos descritos anteriormente. La formulación del modelo de regresión utilizado es

la siguiente:

(3.1) ∑ ∑∑∑−

= +===

++++=1

1 11

2

1

k

i

k

ijjiij

k

iiii

k

iii0 xxxxy εββββ

La variable dependiente representa el valor de la medida de desempeño de la

RNA, corresponde al valor que toma el parámetro i en cada combinación factorial,

y

ix

0β representa la ordenada al origen del plano de regresión, iβ corresponde al

coeficiente de regresión de , ix iiβ es el coeficiente de regresión de y es el

coeficiente de regresión de la interacción de entre y

2ix ijβ

ix jx , )( ji <∀ ; es el número de

parámetros controlables.

k

Los coeficientes de regresión son típicamente calculados mediante un procedimiento

de reducción de errores cuadrados, disponible en la mayoría de paquetes

computacionales de estadística comerciales. A este procedimiento suele llamársele

“ajuste del modelo”. Una vez calculados los coeficientes de regresión se realiza la

comprobación de supuestos para verificar la adecuación del modelo.

A través del análisis de residuos se comprueba la independencia estadística, la

normalidad y la varianza constante en los residuos. Entiéndase como residuo, la

diferencia que existe entre el valor de la medida de desempeño obtenida en la

experimentación y el valor que se obtiene mediante el modelo de regresión en cada una

de las combinaciones factoriales. El análisis de residuos se puede llevar a cabo

Page 47: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

34 Capítulo 3. Metodología Propuesta

inicialmente a través de una serie de gráficas. Si se detecta algún problema en esta fase,

entonces se utilizan pruebas formales estadísticas de hipótesis para comprobar las

conclusiones.

4) Problemas de Optimización.

Para llevar a cabo la optimización, los metamodelos (modelos de regresión)

obtenidos en la fase anterior se usan aquí como funciones objetivo de un problema de

optimización. Se construye un problema de optimización para cada medida de

desempeño.

Como se muestra en la formulación (3.2), la función objetivo estará definida por el

metamodelo que se encontró para la correspondiente medida de desempeño y el objetivo

final será encontrar los valores de los parámetros que minimizan el valor de la función

objetivo. En general, los problemas de optimización resultantes tienen la formulación

3.2.

z

},...,2,1{

1

1 11

2

1

kIIiZx

Iixxx

xxxxz

Iix

i

uiili

k

i

k

ijjiij

k

iiii

k

iii0

i

=∈∀∈

∈∀≤≤

+++=

∈∀

+

= +===∑ ∑∑∑

a Sujeto

Minimizar

paraEncontrar

ββββ

(3.2)

Las variables de decisión son las variables , representan el i-ésimo parámetro que

se busca para minimizar la función objetivo . Como ya se mencionó anteriormente, la

función objetivo corresponde al modelo de regresión que describe la medida de

desempeño en cuestión; es el número de parámetros controlables, dichos parámetros

están acotados por un valor mínimo y un valor máximo que deben ser

ix

z

k

lix uix

Page 48: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

35 Capítulo 3. Metodología Propuesta

especificados con anterioridad en la fase de Análisis y Diseño de Experimentos. La

última restricción indica que las variables pueden tomar solamente valores enteros y

positivos.

ix

5) Solución

Esta fase consiste en resolver los problemas de optimización definidos en el paso

anterior mediante el uso de algún optimizador. El problema de optimización (ver

formulación 3.2), para cada medida de desempeño es no lineal la gran mayoría de las

veces y las variables de optimización son enteras. Estas características hacen que el

problema de optimización sea difícil de resolver. Más aún, estos problemas suelen ser no

convexos, en cuyo caso no se puede garantizar que la solución final sea una solución

óptima global.

ix

Un problema no convexo, nos lleva a la presencia de múltiples soluciones que son

óptimas localmente, así que se corre el riesgo de estancarse en la peor de ellas y tomarla

como solución final debido a que un optimizador local no pudo encontrar una mejor

solución que ésta. Con el propósito de evitar lo anterior, se parte de múltiples soluciones

iniciales para resolver el problema, se registran cada una de las soluciones encontradas y

al final se selecciona la mejor de ellas para entregarla como solución final.

Una vez que se han resuelto los problemas de optimización de manera independiente,

se analizan las soluciones encontradas por el optimizador. Si la solución final es la

misma para todos los problemas, significa que las medidas de desempeño están

correlacionadas pues lo que minimiza a una también minimiza a las otras.

En caso que las soluciones finales encontradas para cada uno de los problemas de

optimización sean diferentes, se implementa una técnica de optimización multicriterio

para dar un abanico de soluciones que represente el mejor compromiso en las medidas

de desempeño de la RNA. A estas soluciones se les llama “eficientes”. De este conjunto

de soluciones, el usuario elige una.

Page 49: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

36 Capítulo 3. Metodología Propuesta

Cuando se sigue esta metodología, la solución final a la que se llega indica en qué

valores deben colocarse los parámetros de la RNA para que ésta garantice la obtención

de pronósticos confiables con bases estadísticas sólidas.

Se probó inicialmente la metodología aquí descrita en el estudio de un caso práctico

de pronóstico de demanda de un solo período en la industria de telecomunicaciones, este

caso se describe en el Capítulo 4. En el Capítulo 5 se explica a detalle el diseño de una

RNA de múltiples períodos siguiendo esta misma metodología.

Page 50: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

CAPÍTULO 4

PRONÓSTICO DE SERIES DE

TIEMPO DE UN SOLO PERÍODO

Introducción

Los pronósticos de series de tiempo constituyen un área activa para la aplicación de

Redes Neuronales Artificiales (RNAs). Aunque la selección de una RNA para tal

aplicación se ha simplificado grandemente, la falta de un método establecido para

asignar los parámetros de las RNAs de una manera adecuada sigue siendo un reto.

En el Capítulo 3 se propuso una metodología basada en técnicas estadísticas y

optimización para la selección de parámetros de una RNA. La comprobación de esa

metodología se realizó al aplicarla en el desarrollo de un modelo de RNA para

pronóstico de demanda en telecomunicaciones. Este modelo se construyó tomando como

base la RNA presentada en la Figura 2.3 por su bien conocida capacidad de

aproximación universal (White, 1990; Hornik, 1989), su amplia utilización y el buen

desempeño que ha mostrado en el análisis de series de tiempo (Zhang, et al., 1998;

Zhang, 2004; Liao et al., 2005; Hansen, et al., 2004).

37

Page 51: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

38 Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período

En el presente Capítulo se describe la aplicación de la metodología descrita en el

Capítulo 3. En la Sección 4.1 se da una descripción detallada del problema en la

industria de telecomunicaciones, la Sección 4.2 contiene la ejecución de la metodología

para la selección de los parámetros del modelo de RNA explicada paso a paso así como

los resultados obtenidos. Finalmente, se muestran las conclusiones del Capítulo.

4.1. Pronóstico de Demanda en telecomunicaciones

En la empresa de este caso, se tiene la necesidad de estimar el comportamiento de la

demanda para el siguiente período con el fin de prever la capacidad necesaria en la red

de transmisión que permita la satisfacción total de la demanda. La capacidad requerida

en la red de transmisión está directamente relacionada con la utilización de ésta a lo

largo del tiempo. Podemos decir entonces que en nuestro caso, la variable de interés es

la demanda de un servicio, que implica la utilización de la red de transmisión.

La empresa cuenta con equipo especializado que lleva un registro de la cantidad de

tráfico que pasa a través de cada nodo de la red de transmisión. Los registros de la

utilización de la red se realizan mensualmente, por tanto contamos con información

histórica o serie de tiempo del comportamiento de la demanda. Tal comportamiento se

muestra en la serie de tiempo de la Figura 4.1.

Una vez que se tiene la serie de tiempo, se procede al análisis de la misma con el fin

de construir un modelo que aproxime el comportamiento de la demanda con exactitud y

de esa manera nos permita pronosticar de manera confiable el valor de la demanda en

períodos posteriores.

Page 52: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

39 Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período

0

100

200

300

400

500

600

700

800

1 7 13 19 25 31 37 43 49 55 61 67

Tiempo (meses)

Uni

dade

s de

Dem

anda

Figura 4.1: Serie de tiempo del comportamiento de la demanda.

Como se mencionó anteriormente, existen diversas metodologías que nos permiten

llevar a cabo el análisis de series de tiempo, sin embargo, la gran mayoría son métodos

lineales. Como se verá en el Capítulo 6, tales métodos no son los más adecuados para

nuestro caso debido a la presencia de no linealidad.

Las relaciones no lineales en los datos se encuentran en varias aplicaciones prácticas

y es por tanto necesario utilizar técnicas capaces de reflejar tal comportamiento. Las

RNAs proveen una herramienta alternativa para la realización del análisis y pronóstico

debido a su capacidad de modelar esta no linealidad. Por otro lado, incluso cuando el

caso es uno de linealidad, las RNAs han mostrado ser exitosas y competitivas como

herramientas de modelación (Hwarng, 2001; Medeiros et al., 2001; Zhang, 2001). Por

esta razón, optamos por desarrollar un modelo de RNA para pronósticos de series de

tiempo. A continuación se describe la construcción del modelo.

Page 53: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

40 Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período

4.2. Construcción del Modelo de RNA para Pronóstico de

Series de Tiempo de un solo período

Teniendo como principal objetivo comprobar la metodología descrita en el Capítulo

3, consideramos la serie de tiempo de la Figura 4.1 con el fin de desarrollar un modelo

de RNA como el de la Figura 4.2 para predecir el valor de la demanda del siguiente

período.

4.2.1. Descripción de la RNA como Sistema

Determinación del tipo de RNA que se utilizó para el análisis.

Para la construcción del modelo se utilizó la RNA representada en la Figura 4.2. Ésta

es una red neuronal similar a la mostrada en la Figura 2.3, con la excepción de que en

este caso es para un modelo de pronósticos. Cuenta con tres capas de neuronas: una capa

de entrada en la que se recogen datos conocidos, una capa oculta que determina la

flexibilidad de la RNA para adaptarse a los datos conocidos y una capa de salida, por

medio de la que se obtiene la salida de la red, es decir el valor del pronóstico. En esta

RNA específica, se considera solamente una neurona en la capa de salida, la variable

neuronas determina la cantidad de neuronas en la capa oculta y la cantidad de datos

históricos (lags) determina la cantidad de neuronas en la capa de entrada.

En la Figura 4.2, las entradas tmtmtiYi ,...1, para +−−= presentadas a la RNA,

corresponden a los valores de la demanda registrada en m períodos anteriores (lags) al

período . Estas son propagadas hacia delante a través de las capas y el vector de

salida de cada neurona es calculado mediante la función de transferencia, este función

debe ser continua, diferenciable y acotada. En nuestro caso, las funciones de

transferencia utilizadas fueron la tangente hiperbólica (Ecuación 4.2) en las neuronas

de la capa oculta y la función identidad (Ecuación 4.3) en la neurona de la capa de

salida (que en este caso es una neurona). De esta manera, el patrón de entrenamiento o

1+t

Page 54: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

41 Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período

bien de validación está formado por un conjunto de datos históricos (lags) que llevan

asociado un valor futuro deseado (target).

Figura 4.2: Red Neuronal Artificial de propagación hacia adelante, entrenada por

retropropagación del error de pronóstico, con tres capas.

En la RNA mostrada en la Figura 4.2,

mjneuronasiWji ,...,2,1 para,,...,2,1 para == corresponde al peso de la

conexión que llega a la neurona j procedente de la neurona i ,

es el peso de la conexión que llega a la neurona neuronasiV it ,...,2,1 para,1 =+ 1+t

(neurona de salida) desde la neurona j (neurona de la capa oculta). Tanto

son conocidos como umbrales (del inglés ‘biases’), y representan el

umbral de la neurona

1como +tj bb

j (en la capa oculta) y el umbral de la neurona en la capa de

salida respectivamente.

1+t

…...

……… Capa Oculta

Capa deSalida

Yt Yt-1 Yt-m+1 Yt-m

1+∧

tY

Capa de Entrada

Vt+1,ibt+1

bj

Wji

Page 55: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

42 Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período

La neurona en la capa de salida calcula el pronóstico de la demanda en el período

y está representado por . La representación matemática de la RNA es la descrita

en la Ecuación (4.1).

1+t 1+∧

tY

(4.1) ⎥⎥⎦

⎢⎢⎣

⎡+⎟⎟

⎞⎜⎜⎝

⎛⎟⎠

⎞⎜⎝

⎛+×= ∑ ∑

=+

=

+

∧ m

jtj

neuronas

iijitjt bbYWfVgY

11

11

Donde:

xx

xx

eeeexf−

−+

=)( (4.2)

y (4.3) xxg =)(

Identificación de los parámetros controlables.

Determinar la cantidad de datos históricos lags que se utilizarán para el desarrollo de

un modelo de RNA para pronóstico es muy importante puesto que nos indica hasta qué

período en el pasado es significativa la correlación entre los datos.

El número de neuronas en la capa oculta brinda a la RNA la capacidad de aproximar

las relaciones no lineales existentes entre los datos. Por esta razón, debe ser seleccionado

con cuidado pues un número excesivo de neuronas provoca demasiada flexibilidad al

modelo que puede traducirse en el fenómeno de pérdida de la capacidad de predicción

de la red conocida como sobreentrenamiento.

Para llevar a cabo el entrenamiento por retropropagación del error, es decir la

actualización de pesos de las conexiones entre las neuronas, así como la actualización

Page 56: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

43 Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período

de los umbrales en las neuronas de la capa oculta y en la neurona de la capa de salida,

existe una diversidad de algoritmos. En este caso utilizamos el algoritmo de Levenberg-

Marquard (lm) y el de Regularización Bayesiana (br). Ambos son conocidos como

procedimientos de segundo orden que han demostrado efectividad en el entrenamiento

de RNAs (Bishop, 1995; Hagan et al., 1996; Sözen et al., 2005; Daliakopoulos et al.,

2005).

En cuanto al manejo de los datos se consideraron los parámetros transfomación y

escala; transformación incluyó dos opciones: manejar los datos como demanda puntual

en cada período o como diferencias entre la demanda de períodos adyacentes; por otro

lado, escala se refiere a normalizar los datos para que caigan en una escala de [-1, 1] o

bien manejarlos en su escala original. Son varias las aplicaciones en las cuales los

autores aconsejan el manejo de datos en diferencias y normalizados (Hansen et al., 2003;

Cigizoglu 2003; Gutiérrez-Estrada et al., 2004; González et al., 2005), pues han visto

que la RNA tiene mejor desempeño. Entonces, para determinar si en nuestro caso es

importante el preprocesamiento de datos, consideramos los parámetros transformación y

escala.

En resumen, los parámetros considerados fueros: neuronas, lags, escala,

transformación y algoritmo

Definición de las respuestas de interés (medidas de desempeño de la RNA).

Para medir la calidad del pronóstico (medidas de desempeño) de la RNA se utilizaron

el Error Cuadrado Medio o MSE (Ecuación 4.4); el Error Absoluto Medio o MAE

(Ecuación 4.5); la mayor de las diferencias en las que el valor del pronóstico de la RNA

está debajo del valor deseado (target) lo denominamos como B_Pred (Ecuación 4.6); y

S_Pred (Ecuación 4.7) es la mayor de las diferencias en las que el valor del pronóstico

de la RNA está arriba del valor deseado.

Page 57: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

44 Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período

Tanto MSE como MAE son medidas de desempeño que han sido muy utilizadas en la

literatura, mientras que B_Pred y S_Pred son medidas que en nuestro caso de estudio

resultaron importantes para determinar por una parte, el peor caso de demanda

insatisfecha y por otra parte, el peor caso de capacidad ociosa en la red.

Llamémosle a la cantidad de patrones de entrenamiento, sea el valor deseado

(target) asociado al patrón

l jy

ljj ,...2,1 para = y sea la salida (pronóstico) de la

RNA. A continuación se muestran las ecuaciones correspondientes a las medidas de

desempeño utilizadas.

jy

∑=

−=l

jjj yy

lMSE

1

2)(1 (4.4)

∑=

−=l

jjj yy

lMAE

1|)(|1 (4.5)

ljyyyyedB jjjj ,...,2,1,)(maxPr_ =≤∀−=∧∧

(4.6)

ljyyyyedS jjjj ,...,2,1)(maxPr_ =≥∀−=∧∧

(4.7)

Una vez que se ha descrito a la RNA como sistema, es decir, ya que se ha

especificado el tipo de RNA, los parámetros a ajustar así como las medidas de

desempeño que medirán las respuestas en nuestro experimento, se procede con el

siguiente paso de la metodología que incluye la planeación, ejecución e interpretación de

un diseño experimental.

Page 58: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

45 Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período

4.2.2. Análisis y Diseño de Experimentos

Dadas las especificaciones anteriores, los parámetros o factores controlables que se

consideraron en el desarrollo de la metodología fueron: neuronas, lags, escala,

transformación y algoritmo, es decir 5=k .

La experimentación fue planeada para variar lags en el rango [2,6], neuronas en el

rango [2,7], transformación en {ninguna, diferencias}, escala en {observada, [-1,1]} y

algoritmo en {lm,br}. Consideramos 3 niveles para lags y neuronas, mientras que para

transformación, escala y algoritmo se consideraron sólo 2 niveles como se pudo

observar.

Al llevar a cabo el experimento de acuerdo a las especificaciones de la Sección 4.2.1,

se consideró adecuado utilizar un diseño factorial de 32x23 que resultó en un total de 72

combinaciones factoriales para correr el modelo de RNAs.

Los valores específicos que se consideraron para cada factor en su nivel

correspondiente fueron: lags = {2,3,6}, neuronas = {2,5,7}, transformación = {ninguna,

diferencias}, escala = {observada, [-1,1]} y algoritmo = {lm , br}.

Para manejar los valores de los parámetros en forma numérica se utilizó la

codificación siguiente: en el parámetro transformación ‘ninguna’ = 1 y ‘diferencias’ = 2;

en escala, ‘observada’ =1 y ‘[-1, 1]’ =2; mientras que para algoritmo, ‘lm’ = 1 y ‘br’ =

2.

Los resultados del experimento se muestran en la Tabla 4.1. Como puede observarse,

las primeras cinco columnas contienen el valor que tomó cada uno de los factores

(parámetros) en la realización de la corrida del modelo de RNAs. Las columnas

siguientes contienen el valor que tomaron las medidas de desempeño de la RNA para la

combinación de factores dada.

Page 59: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

46 Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período

Tabla 4.1: Resultados del experimento (Primera parte).

Neuronas Lags Escala Transformación Algoritmo MAE MSE B_Pred S_Pred

2 2 1 1 1 15.38 717.49 69.89 125.52

2 2 1 2 1 14.83 822.03 73.26 130.74

2 2 2 1 1 14.99 609.14 66.36 105.76

2 2 2 2 1 14.41 808.62 71.63 132.36

2 3 1 1 1 15.39 725.56 70.07 125.99

2 3 1 2 1 15.25 724.62 68.28 135.72

2 3 2 1 1 14.89 613.74 66.36 105.42

2 3 2 2 1 12.53 523.33 69.62 135.46

2 6 1 1 1 15.31 566.63 69.56 116.49

2 6 1 2 1 15.02 578.48 69.35 98.61

2 6 2 1 1 13.43 501.43 69.18 112.18

2 6 2 2 1 10.60 248.54 65.77 41.95

5 2 1 1 1 15.09 698.58 70.89 125.17

5 2 1 2 1 11.80 448.97 65.35 128.56

5 2 2 1 1 12.47 407.59 43.30 114.36

5 2 2 2 1 9.93 440.55 69.97 134.07

5 3 1 1 1 15.01 715.72 69.37 126.64

5 3 1 2 1 14.69 759.51 69.42 142.16

5 3 2 1 1 10.21 355.73 65.85 108.67

5 3 2 2 1 9.78 251.53 70.43 55.35

5 6 1 1 1 15.46 553.00 59.24 101.95

5 6 1 2 1 12.71 545.57 68.51 120.65

5 6 2 1 1 7.04 169.25 30.79 74.33

5 6 2 2 1 3.29 32.99 21.04 13.86

7 2 1 1 1 14.81 700.10 70.41 125.41

7 2 1 2 1 9.09 178.11 65.23 26.45

7 2 2 1 1 8.89 218.43 63.52 57.49

7 2 2 2 1 7.30 147.09 65.69 32.18

7 3 1 1 1 15.28 722.19 69.49 126.43

7 3 1 2 1 11.85 443.52 68.94 114.13

7 3 2 1 1 9.20 310.22 48.55 108.67

7 3 2 2 1 5.49 68.57 17.46 29.64

7 6 1 1 1 14.45 607.09 64.92 121.57

7 6 1 2 1 13.90 461.54 58.44 90.33

7 6 2 1 1 3.59 19.41 13.88 10.82

Page 60: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

47 Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período

Continuación de la Tabla 4.1 Resultados del Experimento (Segunda parte).

Neuronas Lags Escala Transformación Algoritmo MAE MSE B_Pred S_Pred

7 6 2 2 1 0.80 1.68 5.04 4.68

2 2 1 1 2 14.71 594.07 62.21 108.03

2 2 1 2 2 17.08 860.04 77.67 126.22

2 2 2 1 2 16.34 752.57 74.73 125.00

2 2 2 2 2 15.58 835.90 73.23 130.77

2 3 1 1 2 14.89 599.43 62.26 107.29

2 3 1 2 2 17.20 869.86 77.72 126.34

2 3 2 1 2 16.44 762.38 74.79 125.03

2 3 2 2 2 15.63 733.86 73.77 135.76

2 6 1 1 2 14.25 487.30 61.59 110.67

2 6 1 2 2 17.52 902.81 77.79 125.84

2 6 2 1 2 15.91 671.52 72.30 112.24

2 6 2 2 2 13.80 453.44 67.84 92.78

5 2 1 1 2 15.08 595.96 58.55 111.78

5 2 1 2 2 16.72 851.16 76.67 126.80

5 2 2 1 2 16.08 744.92 73.82 123.70

5 2 2 2 2 15.58 835.90 73.23 130.77

5 3 1 1 2 13.79 612.04 59.96 118.52

5 3 1 2 2 16.99 860.63 77.22 126.93

5 3 2 1 2 16.15 753.67 73.94 123.64

5 3 2 2 2 15.63 734.32 73.86 135.75

5 6 1 1 2 12.82 489.91 61.46 117.20

5 6 1 2 2 17.41 894.46 77.55 125.49

5 6 2 1 2 15.81 668.94 71.73 113.97

5 6 2 2 2 16.02 768.42 74.90 131.98

7 2 1 1 2 15.05 697.36 69.75 125.30

7 2 1 2 2 16.64 849.40 76.42 126.89

7 2 2 1 2 16.06 743.19 73.85 123.39

7 2 2 2 2 15.58 835.90 73.23 130.77

7 3 1 1 2 15.08 691.16 68.29 126.37

7 3 1 2 2 15.84 809.28 73.67 130.38

7 3 2 1 2 16.11 751.95 73.94 123.30

7 3 2 2 2 15.64 734.34 73.87 135.74

7 6 1 1 2 16.11 654.56 70.27 111.83

7 6 1 2 2 17.32 888.40 77.36 125.23

7 6 2 1 2 16.79 668.00 71.67 114.15

7 6 2 2 2 16.03 769.16 75.02 131.87

Page 61: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

48 Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período

Los resultados detallados de cada uno de los modelos de RNAs resultantes

correspondientes a las combinaciones de los parámetros controlables están contenidos en

el Apéndice A1, en dicho apéndice, se puede encontrar las aproximaciones puntuales que

realizó cada uno de los modelos, así como el valor del pronóstico para el siguiente

período.

4.2.3. Metamodelación

Una vez realizado el experimento, se procedió a caracterizar los resultados mediante

el análisis de varianza con el fin de conocer la contribución que tenía cada uno de los

factores en las medidas de desempeño de la RNA. De esta manera se obtuvo un modelo

de regresión como el de la Ecuación 3.1 para cada una de las medidas de desempeño

especificadas en la Sección 4.2.1. Recordemos que cada para ix .,...,2,1 ki =

corresponde a uno de los parámetros que se decidieron variar en el diseño experimental.

De esta manera, corresponde al factor neuronas; representa al factor lags;

corresponde al factor escala; representa al factor transformación y por último

corresponde al factor algoritmo.

1x 2x 3x

4x 5x

Los coeficientes resultantes a partir del análisis de varianza para las variables de

regresión en cada medida de desempeño se muestran en la Tabla 4.2. En las dos últimas

filas de esta Tabla se muestran dos cantidades adicionales que el software presenta

además de los resultados del análisis de varianza básico.

La cantidad se interpreta como el porcentaje de variabilidad total en los datos

explicada a través del modelo de regresión utilizado en el análisis de varianza. Por tanto,

es deseable que esta cantidad sea cercana al 100%. La otra cantidad es una

variante de la anterior, difiere de ésta puesto que refleja el número de parámetros

significativos en el modelo. Es decir, la cantidad decrece a medida que se

utilizan términos no significativos en el modelo. El estadístico es útil en

2R

ajustadaR 2

ajustadaR 2

ajustadaR 2

Page 62: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

49 Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período

experimentos muy complejos en los que intervienen varios factores en el diseño y se

quiere evaluar el impacto de aumentar o disminuir el número de términos presentes en el

modelo.

Tabla 4.2: Resultados del análisis de varianza para cada medida de desempeño.

Variable de Regresión MAE MSE B_Pred S_Pred Constante 29.82 1726.89 102.61 219.74

1x -1.08 -84.40 0.13 4.36

2x 0.55 -4.72 1.58 20.73

3x -1.92 -178.61 0.88 -23.03

4x -1.67 -100.62 9.10 -9.47

5x -14.15 -935.46 -61.57 -145.98

21x 0.02 -0.15 0.07 -1.41

22x -0.08 -6.00 -0.13 -2.83

23x 0 0 0 0

24x 0 0 0 0

25x 0 0 0 0

21xx 0.01 7.41 -0.61 0.61

31xx -0.52 -25.08 -2.99 -4.35

41xx -0.21 -21.05 -1.08 -3.57

51xx 1.00 68.57 3.94 9.57

32xx -0.74 -37.02 -3.41 -7.30

42xx 0.06 4.64 -0.61 -2.19

52xx 0.52 25.07 4.13 6.03

43xx -1.71 -101.01 -6.87 -7.87

53xx 4.84 291.74 19.42 42.71

54xx 2.91 237.47 7.45 27.82

2R 88.20% 86.30% 73% 73.00%

ajustadaR 2 84.50% 81.90% 64.70% 64.5%

En general, se busca que la diferencia entre estas dos cantidades y sea

pequeña, para poder asumir que el modelo de regresión aproxima bien la superficie de

2R ajustadaR 2

Page 63: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

50 Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período

respuesta. Una diferencia mayor de 20% indica un posible problema entre el modelo y

los datos (Montgomery, 2004).

Nótese que al aproximar los datos mediante modelos de regresión se parte del

supuesto de que los residuos son independientes, siguen una distribución normal y tienen

varianza constante. Para asegurar que nuestras conclusiones tengan bases estadísticas

sólidas es importante la comprobación de dichos supuestos. La técnica que utilizamos

para ello fue el análisis de residuos.

Por ejemplo, la Figura 4.3 y la Figura 4.4 nos muestran las gráficas utilizadas en el

análisis de residuos para probar los supuestos del modelo de regresión correspondiente a

la medida de desempeño de B_Pred. En la Figura 4.3 las gráficas de la izquierda nos

permiten comprobar el supuesto de normalidad de los residuos: en la gráfica superior lo

que se busca es que los residuos se aproximen lo más posible a una línea recta; el

histograma de frecuencias deberá comportarse como una muestra de distribución normal

con centro en cero. Las gráficas de la derecha son utilizadas para la comprobación del

supuesto de independencia estadística: en éstas se debe visualizar que los valores de los

residuos no sigan alguna estructura reconocida. El comportamiento en la gráfica de

Residuos vs. Valor ajustado muestra una agrupación de los valores en una región, este

comportamiento nos acusó a que el supuesto de independencia podría ser violado. Así

que recurrimos a una prueba de correlación de residuos contra valor ajustado para

comprobar la independencia y obtuvimos un coeficiente de correlación de 0.001 con un

valor P=0.995. Por tanto, concluimos que los residuos cumplieron con el supuesto de

independencia estadística.

Información detallada acerca de este análisis gráfico de los residuos se puede

encontrar en Montgomery (2004).

Page 64: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

51 Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período

Residuo

Per

cent

il

20100-10-20

99.9

99

90

50

10

1

0.1

Valor Ajustado

Res

iduo

80604020

20

10

0

-10

-20

Residuo

Frec

uenc

ia

20100-10-20

24

18

12

6

0

Orden de ObservaciónR

esid

uo

604530150

20

10

0

-10

-20

Probabilidad Normal Residuos vs Valor Ajustado

Histograma de los Residuos Residuos vs Orden de los Datos

Figura 4.3: Gráficas para comprobación de normalidad e independencia estadística de

los residuos en el modelo de regresión de la B_Pred.

Para comprobar el supuesto de varianza constante, se graficaron los residuos

asociados a cada una de las medidas de desempeño contra cada una de las variables o

factores, que en nuestro caso fueron: neuronas, lags, escala, transformación y

algoritmo. Por ejemplo, la Figura 4.4 contiene las gráficas resultantes para residuos

contra variables para el caso de la medida de desempeño B_Pred. Si los residuos tienen

desviaciones aproximadamente constantes a lo largo de los diferentes valores (niveles)

de cada uno de los factores o variables, se dice que se cumple el supuesto de igualdad de

varianza.

Page 65: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

52 Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período

Neuronas

Re

sid

uo

752

20

0

-20

Lags

Re

sid

uo

632

20

0

-20

Escala

Re

sid

uo

21

20

0

-20

Transformación

Re

sid

uo

21

20

0

-20

Algoritmo

Re

sid

uo

21

20

0

-20

Residuos vs. Neuronas Residuos vs. Lags

Residuals Versus Escala Residuos vs. Transformación

Residuos vs. Algoritmo

Figura 4.4: Gráficas de Residuos vs. Variables para la comprobación de igualdad de

varianza en los residuos del modelo de regresión de la B_Pred.

Como puede observarse, tanto en la Figura 4.3 como en la Figura 4.4, el modelo de

regresión para B_Pred cumplió suficientemente con los supuestos establecidos.

Entonces concluimos que el modelo fue apropiado y proseguimos con la interpretación

de los resultados tomando como base este modelo. Algunas veces no será fácil

determinar si estos supuestos se cumplen y deberá recurrirse a pruebas estadísticas

formales que se pueden encontrar en fuentes como Devore (1995). Los resultados

completos acerca del análisis de residuos para cada una de las medidas de desempeño, se

encuentran en el Apéndice A2.

Page 66: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

53 Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período

De acuerdo a la metodología propuesta, se consideró aplicar optimización a los

modelos encontrados para determinar qué valores debían tomar cada uno de los factores

para mejorar el desempeño de la RNA, este paso se describe a continuación.

4.2.4. Problemas de Optimización y Solución

Considerando la formulación 3.2 y los resultados mostrados en la Tabla 4.2, se

construyeron los problemas de optimización correspondientes a cada medida de

desempeño. La modelación de éstos se realizó en Excel, el Apéndice A3 muestra de

manera detallada los resultados de la optimización. Una vez que se tuvo la modelación,

se procedió a resolver de forma independiente cada uno de los modelos utilizando

múltiples soluciones iniciales. La Tabla 4.3 muestra la evaluación de las mejores

soluciones a las cuales se tuvo convergencia partiendo de múltiples soluciones iniciales

en las diferentes medidas de desempeño.

La primera columna de la Tabla 4.3 contiene las mejores soluciones. Cada solución

que representa una combinación de los parámetros de la RNA a los cuales les

corresponde un determinado valor objetivo en cada medida de desempeño, determinado

por el metamodelo encontrado. Así por ejemplo, la solución (2, 2, 1, 1, 2) indica la

asignación siguiente: neuronas = 2 ; lags =2; escala = 1 u ‘observada’; transformación =

1 o ‘ninguna’ y algoritmo = 2 o ‘br’; tal asignación dio el siguiente resultado en el valor

objetivo de las medidas de desempeño: MAE =13.73; MSE = 578.49; B_Pred = 53.17

y S_Pred = 91.74. Las funciones objetivo son metamodelos que aproximan nuestras

medidas de desempeño, por ello es posible que en la optimización alcancen valores

negativos, sin embargo al correr el modelo real de RNA las medidas de desempeño

toman siempre valores positivos.

Page 67: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

54 Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período

Tabla 4.3: Mejores soluciones encontradas.

Solución MAE MSE B_Pred S_Pred 2,2,1,1,2 13.73 578.49 53.17 91.74 2,6,1,1,2 15.02 497.93 67.48 99.36 7,2,1,1,2 15.70 678.89 70.06 112.11 7,2,1,2,2 16.79 814.13 78.44 121.08 7,6,2,1,1 6.60 136.81 26.61 41.65 7,6,2,2,1 3.30 -47.87 18.24 6.18

Como puede observarse en la Tabla 4.3, la mejor solución encontrada fue (7, 6, 2, 2,

1) , ésta indicó que se debían manejar los datos en diferencias y en escala [-1,1],

utilizando como entrada las diferencias de la demanda registrada en los últimos 6

períodos con 7 neuronas en la capa oculta y el algoritmo de entrenamiento lm. La RNA

correspondiente a esta solución se comporta como se muestra en la Figura 4.5, las

medidas de desempeño en el modelo de RNA adquirieron los siguientes valores: MSE =

0.80, MAE = 1.68, B_Pred = 5.04 y S_Pred = 4.68 .Puede observarse que este modelo

hace una muy buena aproximación de los datos reales. Esta fue la mejor solución que

encontró el paquete computacional de optimización al minimizar cada una de las

medidas de desempeño.

La solución obtenida resultó ser la mejor para todas las medidas de desempeño

utilizadas, así que pudimos concluir que en este caso particular las medidas de

desempeño estaban altamente correlacionadas. Si por el contrario, los objetivos o

medidas de desempeño hubiesen llevado a soluciones distintas entre sí, tomar una

decisión acerca de cuáles eran los mejores valores de los parámetros de la RNA sería

una tarea más complicada. En tal caso sería necesaria la utilización de técnicas de

optimización multicriterio.

Es necesario comentar que, aunque describimos previamente el fenómeno de

sobreentrenamiento, en este caso específico no se consideró explícitamente. El objetivo

de este caso fue inicialmente probar la metodología, sin embargo, la técnica de

Page 68: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

55 Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período

validación cruzada se utiliza para evitar el sobreentrenamiento de la RNA en el Capítulo

5.

0

100

200

300

400

500

600

700

800

1 7 13 19 25 31 37 43 49 55 61 67

Tiempo (meses)

Uni

dade

s de

Dem

anda

Real RNAs

Figura 4.5: Modelo de RNAs vs Modelo Real.

Una vez que se aplicó la optimización con los modelos de regresión, concluimos que

la solución final especificó los valores que debían tomar los parámetros para que la RNA

resultante tuviera un desempeño adecuado.

Las herramientas computacionales utilizadas para la ejecución del procedimiento

propuesto fueron Matlab, Minitab y Excel. El primero fue utilizado para construir los

modelos de RNAs, el segundo para el análisis estadístico y el tercero para realizar la

optimización a través de su herramienta XL Solver.

Page 69: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

56 Capítulo 4. Pronóstico de Series de Tiempo de un Solo Período

4.3. Conclusiones

En este capítulo se probó la metodología propuesta en el Capítulo 3, para seleccionar

los parámetros que intervienen en la construcción y utilización de RNAs. Se pudo

demostrar que la metodología trabaja bien por medio de un caso práctico de predicción

de demanda en la industria de las telecomunicaciones.

La metodología propuesta puede aplicarse a RNAs con arquitecturas más

complicadas, tales como las utilizadas para predecir varios períodos de demanda en el

futuro. La consecución del trabajo aquí presentado consideró precisamente este caso de

predicción multiperíodo en el cual se pronosticaron doce períodos. Este caso se describe

en el siguiente capítulo.

Page 70: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

CAPÍTULO 5

PRONÓSTICO DE SERIES DE

TIEMPO DE MÚLTIPLES PERÍODOS

Introducción

Un problema común en el pronóstico de series de tiempo es la baja exactitud de los

pronósticos a largo plazo. El valor estimado de una variable a corto plazo puede

realizarse con exactitud aceptable, sin embargo, para estimarlo a largo plazo es

comúnmente menos exacto (Hanh et al., 2004). El pronóstico a largo plazo ha sido

utilizado en la planeación de expansión de capacidad, inversión de capital, análisis de

ingresos y estimación del presupuesto de una empresa, aunque en cada aplicación es

evidente la gran incertidumbre causada por el horizonte de tiempo z pronosticar (Al-

Saba et al., 1999).

Para tratar este problema, han sido desarrolladas diferentes técnicas mediante el uso

de RNAs. Entre las más utilizadas destacan las técnicas iterativas que utilizan un modelo

de RNA multicapa con una sola salida (representado en la Figura 4.2) de manera

recursiva para predecir múltiples períodos. Otra técnica es el uso de multiples RNAs

57

Page 71: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

58 Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos

desarrolladas cada una de manera independiente para un horizonte de planeación

distinto. Por último, el uso de un modelo de RNA más complejo, en el cual la RNA tiene

múltiples salidas dependiendo del número de períodos a predecir. Esta técnica, se espera

que conduzca a mejores resultados (Zhang, 2004) que las dos descritas anteriormente,

sin embargo, aún no está teóricamente demostrado.

En este capítulo se hace uso de una RNA con múltiples salidas para predecir el

comportamiento de la demanda de la empresa de telecomunicaciones, teniendo como

objetivo pronosticar 12 períodos futuros. Se analizaron dos series de tiempo

proporcionadas por la empresa, utilizamos períodos de tiempo mensuales y la

construcción del modelo de RNA se realizó mediante la aplicación de la metodología

propuesta en el Capítulo 3.

En la Sección 5.1 se describe el problema de la empresa de telecomunicaciones, en la

Sección 5.2 se explica la construcción de los modelos de RNAs para cada una de las

series analizadas y por último, en la Sección 5.3 se presentan las conclusiones.

5.1. Pronóstico de Demanda en telecomunicaciones: múltiples

períodos

Como se dijo en el Capítulo 1, se dispone de una red de transmisión con capacidad

finita y una demanda con comportamiento estocástico. Año con año el comité de

planeación de la empresa realiza una reunión antes de concluir el año para analizar el

comportamiento de la demanda hasta el momento presente con el propósito de estimar el

comportamiento de la misma para el año siguiente. A partir de la estimación realizada

deben planear el uso adecuado del capital con el que cuenta la empresa.

Para un buen uso del capital, el comité de planeación debe estimar el presupuesto que

se necesitará para satisfacer la demanda estimada, así mismo como determinar qué

momento es el más apropiado para hacer uso del mismo. Los equipos la empresa maneja

son muy costosos y cuando se requiere realizar una expansión de capacidad, el proceso

User
Usarlo para RNA múltiple.
Page 72: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

59 Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos

de compra e instalación de equipo toma un período de aproximadamente 4 meses. Es

necesario entonces tener una visión hacia el futuro que permita prever el crecimiento de

la demanda y de esta manera generar la solicitud de compra e instalación de nuevos

equipos en la red de transmisión. De lo contrario, se presentará el problema de clientes

insatisfechos y no se cumplirá con el objetivo de alto nivel de servicio.

En este caso, nuestro objetivo es brindarle al tomador de decisiones un modelo que

aproxime el comportamiento de la demanda y que permita pronosticar el

comportamiento mensual de ésta con un horizonte de pronóstico a 12 meses. De esta

manera, el tomador de decisiones estará en condiciones de realizar al fin del año, una

estimación del presupuesto que será necesario para satisfacer la demanda del año

venidero, y al analizar la demanda mes con mes, tendrá la capacidad de determinar si es

necesaria una expansión y en qué momento debe hacerla. Así se incurrirá en la

minimización de costos y maximización de clientes satisfechos.

Para nuestro estudio contamos con dos series de tiempo que representan el

comportamiento de la demanda registrada a lo largo del tiempo, cada una de éstas

corresponde a la demanda de un tipo de servicio de los que brinda la empresa. Tales

series de tiempo se presentan en las Figuras 5.1 y 5.2 respectivamente.

0100200300400500600700800

1 7 13 19 25 31 37 43 49 55 61 67

Tiempo (meses)

Uni

dade

s de

Dem

anda

Figura 5.1: Comportamiento de la demanda, Serie 1.

Page 73: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

60 Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos

Pudo observarse que la demanda se comporta de manera diferente dependiendo del

tipo de servicio del que se trate. La práctica común de aproximar las series de tiempo por

medio de una tendencia lineal es claramente inadecuada en estos casos, en el Capítulo 6

se presenta mayor evidencia acerca de esto.

0

50

100

150

200

250

1 7 13 19 25 31 37 43 49 55 61 67

Tiempo (meses)

Uni

dade

s de

Dem

anda

Figura 5.2: Comportamiento de la demanda, Serie 2.

Fue claro que las decisiones estratégicas y tácticas de la empresa se basan en la

realización de pronósticos y por tanto requerimos construir un buen modelo que les

permita obtener pronósticos confiables. Con esto en mente, se construyó un modelo para

cada una de las series aquí mostradas basado en RNAs. La arquitectura de la RNA

utilizada es similar a de la Figura 5.3, en la cual se obtiene como salida el valor del

pronóstico para los siguientes doce meses. Las especificaciones del modelo y la

selección de parámetros se presentan de manera detallada a continuación.

Page 74: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

61 Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos

5.2. Construcción de un Modelo de RNA para Pronóstico de

Series de Tiempo de múltiples períodos

Teniendo como principal objetivo construir un modelo de RNA con características

que permitan encontrar pronósticos acertados para un horizonte de planeación de doce

meses, aplicamos la metodología descrita en el Capítulo 3 considerando las series de

tiempo mostradas en la Figura 5.1 y Figura 5.2.

5.2.1. Descripción de la RNA como Sistema

Determinación del tipo de RNA que se utilizó para el análisis.

Para el análisis de las series utilizamos un modelo de RNA como el representado en

la Figura 5.3. Es una RNA de tres capas hacia delante entrenada por retropropagación

del error.

Puesto que en esta aplicación nuestro objetivo era pronosticar el comportamiento de

la demanda para los siguientes doce períodos, cada patrón de entrenamiento o validación

tenía asociado un vector de doce valores (target) formado por la demanda registrada en

los doce meses siguientes a partir del último registro considerado en el patrón de

entrada. Cabe señalar que la cantidad de valores en el patrón de entrada determina la

cantidad de neuronas en la capa de entrada.

Page 75: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

62 Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos

jb

tY

1−tY

1+−mtY

YnY

1+tY

2+tY

.

.

.

jiWsjV

.

.

.

.

.

.

Capa de Entrada Capa Oculta Capa de Salida

sbmt−

Figura 5.3: Red neuronal artificial de propagación hacia adelante, entrenada

por retropropagación del error de pronóstico con tres capas y múltiples

salidas.

Figura 5.3: Red neuronal artificial de propagación hacia adelante, entrenada

por retropropagación del error de pronóstico con tres capas y múltiples

salidas.

En esta RNA se tienen neuronas en la capa de salida cada una de las cuales calcula

el valor del pronóstico para cada período futuro. Si actualmente estuviéramos en el

período , las neuronas de salida nos darían el pronóstico para los períodos

En esta RNA se tienen neuronas en la capa de salida cada una de las cuales calcula

el valor del pronóstico para cada período futuro. Si actualmente estuviéramos en el

período , las neuronas de salida nos darían el pronóstico para los períodos

n

t 1

n

t 1+t hasta

el período , donde en nuestro caso nt + 12=n . La representación matemática de la

RNA es la descrita en la Ecuación (4.1), sólo que en este caso la salida fue un vector con

12 componentes.

Page 76: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

63 Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos

Los resultados obtenidos en el capítulo anterior para una RNA con una salida que

pronostica un solo período mostraron que es importante el preprocesamiento de la

información con la cual se alimenta a la RNA y además, el algoritmo de entrenamiento

lm resultó con un mejor desempeño en el modelo. En este caso, incorporamos tales

consideraciones para llevar a cabo la construcción del modelo de RNA para múltiples

períodos. Es decir, utilizamos la información normalizada en la escala [-1, 1] y para

llevar a cabo el entrenamiento de la RNA utilizamos el algoritmo de Levenberg-

Marquard (lm).

Identificación de los parámetros controlables.

El número de neuronas en la capa oculta debe ser ajustado y por tanto fue incluido

como parámetro controlable de manera similar que en el caso anterior, nuevamente lo

denominamos como neuronas.

Otro parámetro más que se incluyó en el desarrollo del modelo, fue la cantidad de

datos históricos o lags que se utilizarían como entradas de la RNA para el cálculo de los

pronósticos. Como ya se mencionó, éste es muy importante puesto nos indica hasta qué

período en el pasado se correlacionan los datos.

Definición de las respuestas de interés (medidas de desempeño de la RNA).

Para medir la calidad de aproximación de la RNA es común el uso de validación

cruzada. Como se describió en el Capítulo 2, la manera de seleccionar los subconjuntos

de entrenamiento y validación no está estandarizada. En varios trabajos se seleccionan

éstos ya sea de manera conveniente o bien no se menciona cómo lo hacen.

Especialmente en pronósticos, es posible realizar la selección de forma tal que se sesgue

el desempeño de cada método o modelo.

Page 77: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

64 Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos

El conjunto de entrenamiento estuvo formado por aproximadamente el 70% de los

patrones disponibles y el de validación se definió utilizando aproximadamente el 30% de

éstos. Los elementos del conjunto de validación fueron seleccionados mediante una

distribución uniforme sin reemplazo con el propósito de otorgar el mayor conocimiento

a la RNA y evitar el sesgar la información disponible. Utilizamos esta proporción en los

subconjuntos, pues ha sido sugerida en la literatura (Zhang et al., 1998; Granger 1993).

El desempeño de la RNA fue cuantificado mediante el Error Cuadrado Medio o MSE,

considerando a éste tanto para la fase de entrenamiento (MSE_T) como para la fase de

validación (MSE_V) del modelo.

Generalmente, la inicialización de los pesos de las conexiones de la RNA se realiza

de manera aleatoria, en nuestra aplicación, utilizamos diferentes puntos de inicio para

los pesos de las conexiones.

Consideramos inicios múltiples ya que al hacer la actualización de pesos mediante la

retropropagación del error realmente se está minimizando una función de error, que es

no lineal y no convexa, por tal razón, el punto de inicio de la optimización es

determinante para los pesos finales que adquieren las conexiones una vez que el

entrenamiento termina. Los diferentes puntos de inicio de los pesos de las conexiones

entre las neuronas y umbrales con neuronas fueron:

• Inicialización de los pesos en 0.

• Inicialización aleatoria en el intervalo [-1, 1].

• Inicialización de pesos en -0.5.

• Inicialización de pesos en 0.5.

• Inicialización de pesos en -1.

• Inicialización de pesos en 1.

Esta manera de inicialización del modelo de RNA permite tener un mejor control del

comportamiento del modelo, es decir, permite la reproducción de los resultados puesto

que se sabe con certeza los puntos de inicio del modelo bajo los cuales la RNA obtiene

cierto valor en la medida de desempeño. Si sólo se utilizara la inicialización aleatoria,

Page 78: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

65 Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos

sería difícil la reproducción de los resultados pues se desconocerían las condiciones

iniciales bajo las cuales se construyó el modelo.

Las especificaciones aquí descritas, fueron las mismas para la modelación de las dos

series mostradas anteriormente, sin embargo, el Análisis y Diseño de Experimentos fue

distinto dependiendo de la serie. A continuación se describe esta etapa de la

metodología, aplicada a cada una de las series.

5.2.2 Análisis y Diseño de Experimentos para la Serie 1

Dadas las especificaciones anteriores, los parámetros o factores controlables que se

consideran en el desarrollo de la metodología fueron: lags y neuronas, es decir 2=k .

La experimentación fue planeada para variar lags en el rango [3,15] y neuronas en el

rango [2,10]. Consideramos 5 niveles de cada uno de éstos parámetros. Los valores

específicos que se consideraron para cada factor en su nivel correspondiente fueron:

lags = {3, 6, 9, 12, 15} y neuronas = {2, 4, 6, 8, 10}. En el experimento se utilizó un

diseño factorial que resultó en un total de 25 combinaciones factoriales para correr el

modelo de RNAs.

Cada combinación factorial determina el valor al cual deben fijarse los parámetros

controlables del modelo. Para cada una de éstas construimos un modelo de RNA

utilizando las múltiples inicializaciones y finalmente seleccionamos como resultado de

la combinación de factores aquélla RNA con menor MSE_V. Es decir, para cada

combinación de factores creamos seis RNAs diferentes, cuantificamos el valor de las

medidas de desempeño utilizadas en cada una de las seis RNAs y al final seleccionamos

la RNA con el MSE_V más pequeño. Por supuesto que se registró el valor con el cual

fue inicializada la mejor RNA para facilitar la reproducción de los resultados. Los

resultados del experimento se muestran en la Tabla 5.1.

Page 79: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

66 Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos

Tabla 5.1: Resultados del experimento de la Serie 1.

Lags Neuronas MSE_T MSE_V Inicio 3 2 2104.8 1767 0

3 4 340.7 653.2 -1

3 6 268.6 734.1 Aleatorio

3 8 169.7 1757.3 0.5

3 10 2066.8 1739.8 0

6 2 625.8 1221.9 Aleatorio

6 4 243.1 612.9 0

6 6 154.2 611.4 Aleatorio

6 8 102.8 3454.3 Aleatorio

6 10 21338.1 25253.7 0

9 2 775.4 1665.2 Aleatorio

9 4 252.9 1401 Aleatorio

9 6 151.8 1252.4 -0.5

9 8 20364.7 15741.9 0

9 10 44.4 6668.9 0.5

12 2 403.8 1203.4 Aleatorio

12 4 218.3 5754.3 Aleatorio

12 6 15357.7 14775 0

12 8 15357.7 14775 0

12 10 15357.7 14775 0 15 2 574.5 1828.6 -1 15 4 10864.5 13646.8 0

15 6 10864.5 13646.8 0

15 8 10864.5 13646.8 0

15 10 10864.5 13646.8 0

Como puede observarse en la Tabla 5.1 las primeras dos columnas contienen el valor

que tomó cada uno de los factores (parámetros) para realizar la corrida del modelo de

RNAs. La tercer y cuarta columna contiene el valor que alcanzaron las medidas de

desempeño de la RNA en el entrenamiento y validación respectivamente, mientras que

en la última columna se muestra el valor al cual fueron inicializados los pesos de las

conexiones de la RNA.

Los resultados detallados de cada uno de los modelos de RNAs resultantes

correspondientes a las combinaciones de los parámetros controlables están contenidos en

el Apéndice B1, donde se muestra el pronóstico que se obtuvo con cada uno de los

modelos de RNAs experimentales.

Page 80: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

67 Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos

5.2.2.1. Metamodelación

Una vez realizado el experimento, se procedió a caracterizar los resultados mediante

el análisis de varianza con el fin de conocer la contribución de cada uno de los factores

en las medidas de desempeño de la RNA. El modelo de regresión propuesto fue el

descrito en la Ecuación 3.1. De esta manera, se obtuvo un modelo de regresión para cada

una de las medidas de desempeño especificadas en el paso anterior. Siguiendo la

notación del Capítulo anterior, corresponde al factor lags y representa al factor

neuronas.

1x 2x

La Tabla 5.2 contiene los coeficientes del modelo de regresión resultantes para las

medidas de desempeño, contiene también los valores P asociados a cada término de

regresión y los valores del coeficiente de determinación ajustado y no ajustado. El valor

P es utilizado para determinar si un término de regresión (fuente de variación) afecta

significativamente a la medida de desempeño, mediante una prueba de hipótesis.

Considerando como hipótesis nula que la fuente de variación no afecta

significativamente la medida de desempeño, el valor P indica el nivel de significancia

mínimo para el cual la hipótesis nula es rechazada. Es decir, P puede considerarse como

el menor nivel α en el que la fuente de variación es significativa. Por tanto, para

concluir si una fuente de variación es significativa, basta con saber si el valor P es menor

que α , dado que se hayan cumplido los supuestos de los residuos.

En la Tabla 5.2 la tercera columna contiene los valores P asociados a las fuentes de

variación en el modelo correspondiente al MSE_T y la quinta contiene los P

correspondientes al MSE_V.

Page 81: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

68 Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos

Tabla 5.2: Resultados del análisis de varianza en las medidas de desempeño, Serie 1.

Variable de Regresión MSE_T P MSE_V P Constante -5828.99 0.568 -6087.75 0.490

1x 1917.23 0.700 2316.88 0.590

2x 1491.84 0.764 1289.84 0.764 2

1x -205.31 0.785 -139.45 0.830

22x -58.01 0.938 86.54 0.894

21xx 454.17 0.473 304.32 0.576 2R 42.80% 55.10%

ajustadaR 2 27.70% 43.30%

Como se observa en la Tabla 5.2, para el MSE de entrenamiento sólo un 27.7% de la

variación total es explicada con el modelo de regresión y para el MSE de validación sólo

un 43.3% de su variación se explica con el modelo utilizado. Es decir, los coeficientes

de determinación para ambas medidas de desempeño son muy bajos. Además los valores

de P asociados a los coeficientes de ambos modelos no acusan algún efecto importante.

Lo anterior nos llevaría a concluir que si tratamos de explicar la variabilidad que

produce cada factor en la medida de desempeño, tomando como base el modelo de

regresión encontrado, no se tendrían bases estadísticas fuertes que apoyaran nuestras

conclusiones.

Para tener una visión más clara acerca de los resultados obtenidos en el experimento,

realizamos un análisis de la superficie de cada respuesta o medida de desempeño

mediante gráficas de contorno y de superficie. En la Figura 5.4 se muestran las gráficas

resultantes.

En base al comportamiento que mostraron las medidas de desempeño en la Figura

5.4, fue posible identificar que tanto para el MSE de entrenamiento como para el MSE de

validación existía una región de los factores lags y neuronas que proporcionaba un buen

desempeño al modelo de RNAs.

Page 82: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

69 Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos

Empíricamente fue posible ubicar tanto en las gráficas de contorno como en las de

superficie una región en la cual las medidas de desempeño eran pequeñas. Esta región

está delimitada por los 3 primeros niveles de cada factor (lags y neuronas) como se

puede apreciar en la Figura 5.4.

Guiándonos por los resultados gráficos, se observó claramente que al utilizar más de

12 datos históricos y más de 6 neuronas en la capa oculta el desempeño del modelo de

RNAs no sólo empeoró sino que se volvió altamente no lineal impidiendo así una

regresión adecuada.

Neuronas

Lag

s

20000

16000

16000

12000

8000

8000

4000

108642

15.0

12.5

10.0

7.5

5.0

Neuronas

Lag

s

15000

15000

15000

10000

5000

108642

15.0

12.5

10.0

7.5

5.0

15

MSE_T

0

10000

20000

103 Lags

6 59Neuronas

15

10

MSE_V

0

10000

20000

Lags3 5

69

Neuronas

MSE_T MSE_V

Figura 5.4: Gráficas de contorno y de superficie correspondientes al MSE_T y MSE_V

experimental en la Serie 1.

Page 83: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

70 Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos

Al considerar el análisis anterior decidimos enfocar (reducir) el área experimental

con el fin de encontrar metamodelos confiables. Se consideraron únicamente aquéllos

modelos de RNAs con parámetros dentro del rango identificado gráficamente con buen

desempeño, es decir, modelos en los cuales los parámetros lags y neuronas estaban

dentro de sus tres primeros niveles. Se tomaron entonces las corridas experimentales

resultantes de la combinación de lags = {3, 6, 9} y neuronas = {2, 4, 6}.

Una vez que enfocó el experimento, se realizó nuevamente el análisis de varianza

para estos resultados, logrando así coeficientes de determinación mayores a los

obtenidos inicialmente como se puede observar en la Tabla 5.3 La interpretación de esta

tabla es similar a la de la Tabla 5.2.

Tabla 5.3: Resultados del análisis de varianza en las medidas de desempeño, Serie 1

(Experimento enfocado).

Variable de Regresión MSE_T P MSE_V P Constante 5611.64 0.032 4518.51 0.009

1x -698.07 0.151 -612.13 0.046

2x -1349.81 0.090 -965.59 0.040 2

1x 34.23 0.314 47.79 0.045

22x 100.29 0.214 79.90 0.091

21xx 50.53 0.192 25.83 0.190 2R 87.40% 94.00%

ajustadaR 2 66.30% 84.10%

En la Tabla 5.3 se observa que los coeficientes de determinación para ambas medidas

de desempeño son mayores del 80%, por tanto, podemos decir que los modelos de

regresión son apropiados para describir buena parte de la variabilidad de las medidas de

desempeño utilizadas. Cabe señalar, que en este caso, existe mayor diferencia entre 2R

Page 84: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

71 Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos

y debido a que penaliza la incorporación de términos no significativos

en el modelo.

ajustadaR 2ajustadaR 2

Con estos nuevos resultados del análisis de varianza, cabe hacer notar los resultados

benéficos de enfocar el experimento, esto es, de reducir el área experimental. Enfocar el

experimento será de gran utilidad cuando se presenten resultados como los que

encontramos durante el análisis de este caso.

En la Figura 5.5 se muestra gráficamente las gráficas de contorno y superficie

descritas por las medidas de desempeño en el área experimental reducida. Observamos

que las gráficas de superficie están definidas por curvas más suaves que en la Figura 5.4

haciendo más sencilla la aproximación de las mismas mediante los modelos de

regresión.

Page 85: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

72 Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos

Neuronas

Lag

s

500

65432

9.0

7.5

6.0

4.5

3.0

Neuronas

Lag

s

1200

1000

800

65432

9.0

7.5

6.0

4.5

3.0

2

500

1000

1500

2000

MSE_T

8

4

6

Neuronas

Lags4

6

5002

1000

1500

MSE_V

4Neuronas

866

4Lags

MSE_T MSE_V

Figura 5.5: Gráficas de contorno y de superficie correspondientes al MSE_T y MSE_V

en el experimento enfocado.

Ahora bien, comparando los modelos de aproximación (metamodelos) antes y

después de enfocar el experimento, la Figura 5.6 muestra claramente el cambio

producido por la reducción del área experimental. Los modelos de regresión para las

medidas de desempeño pasaron de ser superficies no convexas a superficies convexas.

Estos resultados son muy convenientes en términos de optimización. Con este

comportamiento corroborado gráficamente y el hecho de que los metamodelos son

Page 86: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

73 Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos

regresiones de segundo orden, es posible asegurar empíricamente la existencia de un

óptimo global en el área experimental de cada una de las medidas de desempeño.

1 3 5 7 9 C1

C5

C9

C13

0

5000

10000

15000

20000

25000

Neuronas

Lags

MSE_V

1 3 5 7 9

C1

C5

C9C13

0

5000

10000

15000

20000

25000

Neuronas

Lags

MSE_T

1 2 3 4 5 6 7 8 9 10C1

C5

C9

C13

-6000

-5000

-4000

-3000

-2000

-1000

0

1000

2000

Neuronas

Lags

MSE_T (Enfocado)

1 3 5 7 9

C1

C5

C9

C13

-5000

-4000

-3000

-2000

-1000

0

1000

2000

3000

4000

Neuronas

Lags

MSE_V(Enfocado)

Figura 5.6: Superficie de los metamodelos para el MSE_T y MSE_V antes y después del

enfoque del Experimento.

El enfoque del experimento nos permitió mejorar la calidad de la aproximación de los

metamodelos obtenidos mediante el análisis de varianza en áreas experimentales de

interés. Esta mejora nos sirvió para sustentar nuestras conclusiones acerca de la

variación producida por los parámetros en las medidas de desempeño y nos brindó la

certeza de que la optimización tendrá como base un metamodelo confiable con

fundamento estadístico.

Regresando a la Figura 5.4 y suponiendo que colocamos las gráficas de contorno una

encima de la otra, la intersección de éstas nos da las combinaciones de parámetros que

Page 87: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

74 Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos

mejoran simultáneamente ambas medidas de desempeño. Basados en estas gráficas se

puede decir que el modelo de RNA con mejor desempeño de acuerdo a las medidas

utilizadas, sería aquél en el cual el factor neuronas estuviera dentro del rango [4,6] y el

factor lags en el rango de variación de [3, 6]. Sin embargo, para determinar los valores

puntuales que debían tomar los parámetros de la RNA fue necesario recurrir a la

optimización. Por supuesto, tampoco se pasó por alto la comprobación de los supuestos

bajo los cuales fueron construidos los metamodelos. La comprobación se realizó de la

misma forma como se presentó en el Capítulo 4, es decir, mediante el análisis gráfico de

los residuos. Las gráficas utilizadas en el análisis de residuos para este caso están

disponibles en el Apéndice B2.

5.2.2.2. Problemas de Optimización y Solución, Serie 1

e optimización como se

muestra en la formulación (3.2) a partir de los metamodelos y realizamos la

ieron cada uno

de los modelos de optimización. La primera componente de la solución corresponde al

Comprobados los supuestos, construimos los problemas d

optimización. Se utilizaron nuevamente múltiples soluciones iniciales para probar si

efectivamente se convergía a una misma solución, pues tal comportamiento apoya la

hipótesis de convexidad, establecida empíricamente en el paso anterior.

Las Tablas 5.4a y 5.4b muestran las soluciones a las cuales converg

valor que tomó el parámetro lags y la segunda componente corresponde al valor del

parámetro neuronas. La segunda y tercera columna muestra el valor de la función

objetivo para el MSE_T y el MSE_V respectivamente. Recuérdese que las funciones

objetivo son metamodelos que aproximan la superficie de respuesta de la RNA, por

tanto es posible que en la optimización alcancen valores negativos, sin embargo en el

modelo real de RNA las medidas de desempeño toman siempre valores positivos.

Page 88: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

75 Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos

Tabla 5.4a: Soluciones finales al minimizar el MSE_T, Serie 1.

Solución Inicial Solución Final MSE_T MSE_V

(3,2) (7,5) -71.07 648.91

(6,4) (7,5) -71.07 648.91

(9,6) (7,5) -71.07 648.91

(4,3) (7,5) -71.07 648.91

(5,3) (7,5) -71.07 648.91

(7,5) (7,5) -71.07 648.91

(8,5) (7,5) -71.07 648.91

abla 5.4a contiene los resultados obtenidos al resolver el problema de minimización

del MSE_T , mientras que la Tabla 5.4b los resultados obtenidos al minimizar el MSE_V.

Tabla 5.4b: Soluciones finales al minimizar el MSE_V, Serie 1.

La T

Solución Inicial Solución Final MSE_T MSE_V

(3,2) (5,5) -1.75 467.91 (6,4) (5,5) -1.75 467.91 (9,6) (5,5) -1.75 467.91 (4,3) (5,5) -1.75 467.91 (5,3) (5,5) -1.75 467.91 (7,5) (5,5) -1.75 467.91 (8,5) (5,5) -1.75 467.91

Observamos que al resolver de manera independiente cada uno de los problemas de

optimización partiendo de múltiples soluciones iniciales en ambos casos (Tabla 5.4a y

Tabla 5.4b) las diferentes soluciones convergían a una misma solución final. Con esto se

comprobaron las hipótesis de convexidad en los modelos y la existencia de optimalidad

global en cada una de las medidas de desempeño. Sin embargo, la solución óptima para

el MSE_T fue distinta a la que se obtuvo al minimizar el MSE_V. Para el primero, la

Page 89: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

76 Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos

optimización nos llevó a un modelo de RNA con 7 datos históricos (lags) y 5 neuronas

en la capa oculta; para el segundo, el modelo de RNA con mejor desempeño fue aquél

en el que se consideraron 5 datos históricos y 5 neuronas en la capa oculta. Los

resultados obtenidos indican objetivos en conflicto.

Dada la importancia de obtener modelos de RNA con buena calidad de aproximación

Ya que se tuvo la solución final, es decir los valores a los cuales debían ser ajustados

y generalización, decidimos darle mayor importancia al MSE_V. Así que la solución

final fue la (5,5).

los parámetros, se construyó el modelo de RNA correspondiente para la realización del

pronóstico. Consideramos las seis diferentes inicializaciones de pesos en las conexiones

y seleccionamos la RNA con menor valor de MSE_V. En la Figura 5.7 se muestra el

pronóstico que se obtuvo con éste modelo de RNA, las medidas de desempeño tomaron

los valores siguientes: MSE_T = 211.5056 y MSE_V = 1431.77. Los pesos se

inicializaron en 0.5.

0

100

200

300

400

500

600

700

800

1 7 13 19 25 31 37 43 49 55 61 67 73 79

Tiempo (meses)

Uni

dade

s de

Dem

anda

Real RNA

Figura 5.7: Pronóstico del modelo de RNA definitivo, Serie 1.

Page 90: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

77 Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos

En la Figura 5.7 los primeros cuatro períodos del pronóstico pudieron ser comparados

contra datos de validación, esta comparación está contenida dentro del rectángulo en la

figura y los siguientes ocho períodos pronosticados indican la tendencia de la demanda

de acuerdo al modelo de RNA.

5.2.3. Análisis y Diseño de Experimentos para la Serie 2

Los parámetros o factores controlables que se consideraron en este caso fueron los

mismos que en la serie anterior: neuronas y lags, es decir 2=k . La experimentación fue

planeada para variar lags en el rango [3,6] y neuronas en el rango [2,6]. Consideramos 3

niveles de cada uno de estos factores. Los valores específicos que se consideraron para

cada factor en su nivel correspondiente fueron: lags = {3, 4, 6} y neuronas = {2, 4, 6}.

Al llevar a cabo el experimento se consideró adecuado utilizar un diseño factorial de 32

con un total de 9 combinaciones factoriales para correr el modelo de RNAs.

Nuevamente, para cada combinación experimental de los niveles de los parámetros

construimos modelos de RNAs utilizando las seis inicializaciones descritas

anteriormente. De estas seis inicializaciones diferentes se seleccionó la RNA con mejor

valor en la medida de desempeño MSE_V y ésta fue la que se registró como resultado de

la combinación de los parámetros, así como el valor en el que fueron inicializados los

pesos de las conexiones de la misma. Los resultados del experimento se muestran en la

Tabla 5.5.

En la Tabla 5.5 las primeras dos columnas contienen el valor que tomó cada uno de

los factores (parámetros) para realizar la corrida del modelo de RNAs. La tercer y cuarta

columna contiene el valor que alcanzaron las medidas de desempeño de la RNA en el

Page 91: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

78 Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos

entrenamiento y validación respectivamente, mientras que en la última columna se tiene

el valor en el cual fueron inicializados los pesos de las conexiones de la RNA.

Tabla 5.5: Resultados del experimento, Serie 2.

Lags Neuronas MSE_T MSE_V Inicio 3 2 82.57 339.73 - 0.5 3 4 61.02 304.30 - 1 3 6 2016.10 1674.58 0 4 2 1769.86 2245.94 0 4 4 64.60 650.88 Aleatorio 4 6 1769.86 2245.94 0 6 2 105.31 259.71 Aleatorio 6 4 2003.33 1548.41 0 6 6 2003.33 1548.41 0

Los resultados detallados de cada uno de los modelos de RNAs resultantes

correspondientes a las combinaciones de los parámetros controlables están contenidos en

el Apéndice B3 el cual muestra el pronóstico que se obtuvo con cada uno de los

modelos de RNAs experimentales. Siguiendo la metodología del Capítulo 3, realizamos

la fase de metamodelación que se describe a continuación.

5.2.3.1. Metamodelación

Una vez realizado el experimento, se procedió a caracterizar los resultados mediante

el análisis de varianza con el fin de conocer la contribución que tenía cada uno de los

factores en las medidas de desempeño de la RNA. El modelo de regresión propuesto fue

el descrito en la Ecuación (3.1).

Page 92: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

79 Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos

En la Tabla 5.6 se presentan los resultados que se obtuvieron del análisis de varianza

de los metamodelos correspondientes a las medidas de desempeño MSE_T y MSE_V.

Tabla 5.6: Resultados del análisis de varianza en las medidas de desempeño, Serie 2.

Variable de Regresión MSE_T P MSE_V P Constante -1107.73 0.909 -5703.14 0.471

1x 1282.29 0.754 3753.74 0.289

2x -979.62 0.619 -969.18 0.534 2

1x -132.31 0.763 -413.03 0.278

22x 145.38 0.513 137.80 0.435

21xx 31.36 0.874 19.72 0.898 2R 50.90% 58.10%

ajustadaR 2 0.00% 0.00%

Como se observa en la Tabla 5.6, para el MSE de entrenamiento sólo un 50.9% de la

variación total es explicada con el modelo de regresión utilizado y para el MSE de

validación sólo un 58.1% de su variación se explica con el modelo. Es decir, los

coeficientes de determinación para ambas medidas de desempeño son muy bajos y los

valores de P asociados a los coeficientes del modelo no muestran significancia

estadística

Lo anterior nos llevó a concluir que si tratáramos de explicar la variabilidad

producida por cada factor en la medida de desempeño tomando como base estos

modelos de regresión, no se tendrían bases estadísticas fuertes que apoyaran nuestras

conclusiones. Así que de manera similar a la serie anterior, analizamos la superficie

experimental de las medidas de desempeño a través de gráficas de contorno y de

superficie, estas gráficas se muestran en la Figura 5.8.

Page 93: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

80 Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos

Neuronas

Lag

s

1500

1000

500

65432

6

5

4

3

Neuronas

Lag

s

1500

1250

1000

750

500

1500

1250

1000

750

500

65432

6

5

4

3

6

5

MSE_T

0

1000

Lags

2000

424 3

6Neuronas

0 2

1000

2000

MSE_V

4Neuronas6

56 43 Lags

MSE_T MSE_V

Figura 5.8: Gráficas de contorno y de superficie correspondientes al MSE_T y MSE_V

experimental en la Serie 2.

Empíricamente, fue posible ubicar una región en la cual las medidas de desempeño

resultaban pequeñas. De acuerdo a la Figura 5.8, para encontrar un MSE_T con valor

bajo el parámetro lags debía estar en el rango [3, 4] y el parámetro neuronas en el rango

[2, 4]. Sin embargo, para el MSE_V no fue tan fácil identificar el área con mejor

desempeño. Lo que observamos fue que cuando neuronas estaba en su nivel máximo la

medida de desempeño MSE_V alcanzaba valores muy altos para cualquier valor del

parámetro lags. Más aún, en las gráficas de superficie se observó que la curva descrita

por ambas medidas de desempeño era altamente no lineal en el área experimental y

tratar de aproximarla con una función cuadrática nos llevaría a tener poca confiabilidad

en la caracterización de los resultados. Por tal motivo, se identificó un área atractiva para

las medidas de desempeño que pudiera ser aproximada de manera adecuada mediante

una función cuadrática.

Page 94: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

81 Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos

De acuerdo con los resultados gráficos y el análisis de varianza, se observó

claramente que al utilizar 6 neuronas en la capa oculta los modelos de RNAs resultantes

tenían capacidad de aproximación y predicción baja.

Se redujo el área experimental como en el análisis de la serie anterior y esta vez se

realizó un nuevo experimento en el cual consideramos sólo aquéllas combinaciones

resultantes de lags = {3, 4, 5, 6} y neuronas = {3, 4}. Resultó un total de 8

combinaciones factoriales, los resultados correspondientes están contenidos en la Tabla

5.7.

Tabla 5.7: Resultados del experimento enfocado, Serie 2.

Lags Neuronas MSE_T MSE_V Inicio 3 3 94.41 245.40 0.5

3 4 81.95 258.45 Aleatorio

4 3 87.02 249.19 -0.5

4 4 66.68 279.45 - 1

5 3 106.29 131.62 -0.5

5 4 68.58 265.08 Aleatorio

6 3 91.31 255.49 [-1, 1]

6 4 66.83 536.79 1

Para resultados detallados acerca de los pronósticos que se obtuvieron con cada

modelo de RNA se sugiere ver el Apéndice B4 en el que se muestra el pronóstico que se

obtuvo con cada uno de los modelos de RNAs experimentales.

Una vez realizado el experimento en el área reducida, se procedió a caracterizar los

resultados mediante el análisis de varianza. Se partió del modelo de regresión descrito en

la Ecuación (3.1). La Tabla 5.8 contiene los resultados del análisis de varianza.

Page 95: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

82 Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos

Tabla 5.8: Resultados del análisis de varianza en las medidas de desempeño, Serie 2

(Experimento enfocado)

Variable de Regresión MSE_T P MSE_V P Constante 103.467 0.437 2022.52 0.095

1x 10.355 0.795 -698.25 0.078

2x 0.296 0.992 -294.06 0.237 2

1x 0.741 0.837 46.35 0.150

22x

21xx -5.343 0.433 90.80 0.125 2R 82.40% 84.80%

ajustadaR 2 59.00% 64.50%

En la Tabla 5.8 los coeficientes de determinación son mayores del 80%, es decir que

los modelos de regresión fueron apropiados para describir buena parte de la variabilidad

existente en las medidas de desempeño registradas.

Las gráficas del análisis de las superficies de respuesta se muestran en la Figura 5.9.

En estas gráficas se observó que el MSE_T disminuyó conforme se incrementaba la

cantidad de neuronas en la capa oculta, mientras que el modelo de RNA perdía poder de

generalización pues el MSE_V iba en incremento.

Lo que destaca el punto anterior es de esperarse en el comportamiento de RNAs, pues

conforme la RNA se especializa en determinado patrón, el error de entrenamiento

disminuye considerablemente, mientras que el error de validación incrementa debido a

que es más difícil para la RNA descubrir nuevas relaciones en los patrones que jamás le

fueron mostrados durante el entrenamiento.

Page 96: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

83 Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos

Neuronas

Lag

s

80.0 70.0

43

6

5

4

3

Neuronas

Lag

s

43

6

5

4

3

6

5

MSE_T

70

80

90

Lags

100

433

4Neuronas

6

5

MSE_V

200

300

400

Lags

500

433

4Neuronas

MSE_T MSE_V

200

400

300

Figura 5.9: Gráficas de contorno y de superficie correspondientes al MSE_T y MSE_V

en la Serie 2 (experimento enfocado).

Con la Figura 5.9 se observó gráficamente que para ambas medidas de desempeño

era favorable utilizar aproximadamente 5 lags y se detectó la relación costo-beneficio

existente en las medidas de desempeño.

Los metamodelos obtenidos con la redefinición del área experimental fueron mucho

más confiables. Después se verificaron los supuestos de los modelos de regresión

mediante el análisis de residuos. Los resultados pueden consultarse en el Apéndice B5.

Una vez comprobados los supuestos, se prosiguió con la metodología, realizando la

optimización de las medidas de desempeño.

Page 97: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

84 Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos

5.2.3.2. Problemas de Optimización y Solución, Serie 2

Con la optimización, como ya se explicó anteriormente, se determina a qué valores

deben fijarse los parámetros experimentales con el fin de obtener un modelo de RNA

confiable. Puesto que el factorial resultante de la redefinición del área experimental

abarcó todas las combinaciones posibles en la nueva área y dado que sólo se

consideraron dos medidas de desempeño, la solución a estos problemas la realizamos de

manera gráfica. En la Figura 5.10, se muestra el comportamiento de las medidas de

desempeño registradas, el eje de las ‘x’ corresponde al MSE_V y el eje ‘y’ al MSE_T.

MSE_V

MSE

_T

500400300200100

110

100

90

80

70

Figura 5.10: Gráfica del MSE_T vs MSE_V en la Serie 2.

Con los resultados mostrados en la Figura 5.10, lo que buscamos en un principio fue

minimizar el MSE_T y encontramos que la combinación de lags y neuronas que daba el

valor mínimo en ésta medida de desempeño era la combinación (4,4). Lo cual indicaba

que se debían utilizar 4 datos históricos o lags y 4 neuronas en la capa oculta.

Sin embargo, cuando resolvimos para minimizar el MSE_V encontramos que la mejor

solución era utilizar 5 lags y 3 neuronas en la capa oculta. Fue entonces cuando notamos

Page 98: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

85 Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos

que existía conflicto en las medidas de desempeño, pues éstas convergieron a soluciones

diferentes.

Al existir conflicto en las medidas de desempeño, en la Figura 5.10 ubicamos la

frontera eficiente que representara el mejor compromiso en nuestras medidas de

desempeño. Esta frontera eficiente está determinada por la línea que aparece en la

gráfica. En esa frontera eficiente encontramos tres de nuestras combinaciones que

presentaron el mejor compromiso en nuestras medidas de desempeño, en la Tabla 5.9 se

presentan estas soluciones con sus valores correspondientes en las medidas de

desempeño utilizadas.

Tabla 5.9: Soluciones eficientes para el análisis de la Serie 2.

Lags Neuronas MSE_T MSE_V 4 4 66.68 279.45

5 3 106.29 131.62

5 4 68.58 265.08

Observando los valores que tomaron las medidas de desempeño en cada una de las

soluciones mostradas en la Tabla 5.9, decidimos darle más importancia a la medida de

desempeño MSE_V. Así que en nuestro caso fue claro que la solución más atractiva era

aquélla en la que se utilizaban 5 lags y 3 neuronas en la capa oculta del modelo de RNA.

Por tanto, elegimos como solución final a esta última pues nos garantiza la obtención de

un modelo de RNA confiable con buena calidad de aproximación y poder de

generalización.

Ya que obtuvimos la solución final, se conoció el valor al cual debían ser ajustados

los parámetros y entonces se procedió con la construcción de la RNA correspondiente a

esta solución final para realizar el pronóstico. En la Figura 5.11 se muestra el pronóstico

que obtuvo el modelo de RNA definitivo cuyos parámetros fueron fijados de acuerdo al

resultado de la optimización.

Page 99: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

86 Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos

0

50

100

150

200

250

1 7 13 19 25 31 37 43 49 55 61 67 73 79

Tiempo (meses)

Uni

dade

s de

Dem

anda

Real RNA

Figura 5.11: Pronóstico del modelo de RNA definitivo para la Serie 2.

En la Figura 5.11 los primeros cuatro períodos del pronóstico pudieron ser

comparados contra datos de validación, el rectángulo muestra tal comparación y los

siguientes ocho períodos pronosticados indican la tendencia de la demanda de acuerdo al

modelo de RNA.

Para este caso se utilizaron las mismas herramientas computacionales que en el caso

del Capítulo 4.

Page 100: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

87 Capítulo 5. Pronóstico de Series de Tiempo de Múltiples Períodos

5.3. Conclusiones

En este trabajo, se analizaron dos series de tiempo reales, que corresponden al

comportamiento de la demanda en una industria de telecomunicaciones. El análisis y

pronóstico de las mismas fue realizado mediante una RNA de múltiples salidas

construida mediante la aplicación de la metodología propuesta en el Capítulo 3. Se

obtuvieron modelos de RNA confiables, con pronósticos de calidad que en el Capítulo 6

serán comparados con pronósticos realizados mediante algunos modelos lineales

tradicionales.

Los resultados de este caso pueden ser reproducidos fácilmente aplicando la

metodología propuesta, inicializando los pesos de las conexiones de RNA

sistemáticamente y seleccionando de manera aleatoria de acuerdo a una distribución

uniforme sin reemplazo el conjunto de patrones de validación.

Tanto la inicialización como la selección del conjunto de validación son parte de la

contribución de esta tesis.

Page 101: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

CAPÍTULO 6

COMPARACIÓN DE RESULTADOS

DE RNAs CONTRA MÉTODOS

LINEALES TRADICIONALES

Introducción

En este capítulo, se reportan los resultados del análisis de las series de tiempo

correspondientes a la demanda en la empresa de telecomunicaciones mediante la

utilización de algunos métodos lineales tradicionales tales como: método ingenuo,

método del promedio, promedios móviles, regresión lineal simple, suavizado

exponencial simple y suavizado exponencial doble. Este análisis fue llevado a cabo por

María Guadalupe Villarreal Marroquín durante un proyecto del Verano Científico

apoyado por el Provericyt -UANL (Proyecto PAICYT CA1069-05) con el fin de

sustentar los resultados obtenidos a través de la aplicación de RNAs para pronóstico de

series de tiempo.

88

Page 102: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

89 Capítulo 6. Comparación de Resultados de RNAs contra Métodos Lineales Tradicionales

Cabe destacar que la manera en que se analizaron las series de tiempo en los métodos

lineales utilizados estuvo acorde con los requerimientos propios de estos métodos. Por

tanto, el manejo de las series mediante RNAs fue hecho bajo consideraciones distintas.

Sin embargo, esta comparación resulta objetiva, pues el trabajo realizado mediante los

métodos lineales fue desarrollado de manera independiente al que se realizó con las

RNAs.

En la Sección 6.1, se presentan los resultados obtenidos al pronosticar mediante

modelos lineales el comportamiento de la demanda para un solo período, tomando como

base la serie presentada en la Figura 4.1. Dichos resultados fueron comparados con los

obtenidos a través del modelo de RNA desarrollado en el Capítulo 4. La Sección 6.2,

contiene los resultados de los modelos lineales utilizados en el pronóstico de la demanda

de doce períodos tomando como base las series mostradas en la Figura 5.1 y Figura 5.2

(analizadas en el Capítulo 5). Además, se incluye la comparación de los resultados de

los modelos de RNAs obtenidos en el Capítulo 5 contra el mejor resultado obtenido a

partir de los métodos lineales utilizados. Se observó que los modelos de RNAs

obtuvieron mejores resultados que los métodos lineales utilizados.

6.1. Pronóstico de demanda de un período en

telecomunicaciones mediante métodos lineales tradicionales

Con el fin de aproximar la serie mostrada en la Figura 4.1 (Serie 1) y generar un

pronóstico para el siguiente período se utilizaron diferentes métodos lineales buscando

obtener un pronóstico de buena calidad para compararlo posteriormente con los

resultados obtenidos en el Capítulo 4. En dicho capítulo se desarrolló un modelo de

RNA mediante el ajuste de parámetros a través de técnicas estadísticas y de

optimización.

Page 103: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

90 Capítulo 6. Comparación de Resultados de RNAs contra Métodos Lineales Tradicionales

La Tabla 6.1 contiene los resultados obtenidos mediante métodos lineales. La

segunda columna contiene el valor del pronóstico, la tercera muestra el valor del MSE, la

cuarta el MAE, la quinta y sexta contienen el valor de S_Pred y B_Pred respectivamente.

Todas estas medidas se definieron previamente en el Capítulo 4.

Tabla 6.1: Resultados del análisis de la Serie 1 par el pronóstico de un solo período.

Método Pronóstico MSE MAE S_Pred B_Pred

Método Ingenuo 424.000 850.894 16.864 126.000 78.000

Método Promedio 431.866 36814.707 168.041 7.985 327.943

Promedios Móviles n=5 546.000 2214.707 37.226 171.400 98.800

Promedios Móviles n=8 588.750 3657.836 50.506 192.500 113.500

Promedios Móviles n=10 598.300 4957.120 60.130 199.900 125.200

Suavizado Exponencial Simple 423.531 850.881 16.865 126.000 77.973

Regresion Lineal 740.353 4579.486 51.206 307.280 95.671

Suavizado Exponencial Doble 423.257 700.782 15.667 128.948 66.586

Analizando la Tabla 6.1, fue posible determinar cuál de los métodos utilizados tenía

mejor desempeño en la aproximación y pronóstico de la Serie 1. Sin lugar a duda, el

suavizado exponencial doble adquirió mejor valor en las medidas de desempeño

utilizadas. De esta manera, seleccionamos este método como el mejor de los métodos

lineales utilizados en el análisis de la Serie en cuestión. A continuación se describe la

comparación del modelo de RNA contra el Suavizado Exponencial Doble.

6.1.1. Comparación de Resultados

Los resultados obtenidos al utilizar el suavizado exponencial fueron comparados

contra los que se obtuvieron mediante el modelo de RNA que se construyó en el

Capítulo 4 para la Serie 1 (Figura 4.1), la Tabla 6.2 muestra tal comparación. El modelo

de RNA fue un modelo de tres capas entrenado por retropropagación del error, las

Page 104: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

91 Capítulo 6. Comparación de Resultados de RNAs contra Métodos Lineales Tradicionales

función de transferencia en la capa oculta fue la tangente hiperbólica (Ecuación 4.2) y

en la capa de salida fue la función identidad (Ecuación 4.3); los datos se manejaron en

escala [-1, 1] y se utilizaron como entrada las diferencias de la demanda registrada en los

últimos 6 períodos con 7 neuronas en la capa oculta y el algoritmo de entrenamiento fue

el lm.

Tabla 6.2: Modelo de RNA vs. Suavizado Exponencial Doble en el pronóstico de un

solo período, Serie 1.

Modelo Pronóstico Real MSE MAE S_Pred B_Pred

Suavizado Exponencial Doble

423.257 424 700.78 15.66 128.94 66.58

RNA 424 424 0.80 1.68 4.68 5.04

Se pudo observar que existe una diferencia muy grande en cuanto a la calidad de

aproximación de la RNA y el método lineal. Por esta razón, la comparación favorece a la

RNA construida mediante la metodología propuesta para la selección de parámetros en

la serie de tiempo analizada.

La Figura 6.1 muestra de manera gráfica la comparación de los resultados de la Tabla

6.2. Se aprecia que en este caso de pronóstico de un solo período, la diferencia existente

entre el pronóstico de la RNA y el método de suavizado exponencial doble es pequeña,

sin embargo en los resultados para pronóstico de doce períodos este método resultó con

pobre desempeño como se verá en los resultados de la siguiente sección.

Page 105: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

92 Capítulo 6. Comparación de Resultados de RNAs contra Métodos Lineales Tradicionales

0

100

200

300

400

500

600

700

800

1 7 13 19 25 31 37 43 49 55 61 67

Tiempo (meses)

Uni

dade

s de

Dem

anda

Real RNA Suavizado Exp. Doble

Figura 6.1: Comparación del pronóstico de RNAs vs. Suavizado Exponencial Doble en

el Análisis de la Serie 1, un solo período.

6.2. Pronóstico de Demanda de n períodos en

telecomunicaciones mediante métodos lineales tradicionales

Cuando se desea pronosticar no sólo el siguiente período sino varios períodos

siguientes, existen también diversos métodos que permiten llevar a cabo la estimación

del comportamiento de la serie con un horizonte de pronóstico a largo plazo. En nuestro

caso, utilizamos el método de regresión lineal y el método de suavizado exponencial

doble. Ambos brindan la capacidad de calcular de manera directa el número de períodos

deseados en el horizonte de planeación. Los modelos fueron desarrollados para

pronosticar 12 períodos y la medida de desempeño utilizada para cuantificar la calidad

de aproximación de los modelos utilizados fue el MSE. Los resultados obtenidos durante

el análisis de la Serie 1 (Figura 5.1) se muestran en la Tabla 6.3. En la primer columna

se indica la técnica utilizada, la segunda columna contiene el valor de la medida de

desempeño MSE y las siguientes doce columnas contienen el pronóstico de la demanda

para los siguientes doce períodos de tiempo.

Page 106: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

93 Capítulo 6. Comparación de Resultados de RNAs contra Métodos Lineales Tradicionales

Tabla 6.3: Resultados del análisis de la Serie 1 para el pronóstico de 12 períodos.

Método MSE Mes 1 Mes 2 Mes 3 Mes 4 Mes 5 Mes 6 Mes 7 Mes 8 Mes 9 Mes 10

Mes 11

Mes 12

Método de Regresión 4579.4 740.3 749.4 758.4 767.5 776.6 785.7 794.7 803.8 812.9 822.0 831.0 840.1

Suavizado Exponencial Doble 700.7 413.2 370.5 327.8 285.1 242.4 199.6 156.9 114.2 71.5 28.8 -13.8 -56.5

Observando los resultados de la Tabla 6.3, en el análisis de la Serie 1 se concluyó que

el método con mejor desempeño fue el de suavizado exponencial doble, sin embargo,

viendo con mayor detenimiento los pronósticos que fueron estimados mediante esta

técnica, nos encontramos que para los meses 11 y 12 da como pronóstico valores

negativos. Estos resultados no tienen sentido en nuestro análisis, pues la serie analizada

representa el comportamiento de la demanda de un servicio. Lo que nos llevó a concluir

que el Suavizado Exponencial nos llevaría a resultados no deseados en el pronóstico de

la Serie 1 a largo plazo. Así que aunque el MSE del método de regresión era muy

grande, lo consideramos para propósitos de comparación.

Para analizar estadísticamente la Serie 2 correspondiente a la Figura 5.2, utilizamos

nuevamente las técnicas de regresión lineal y suavizado exponencial doble, en la Tabla

6.4 se muestran de manera detallada los resultados obtenidos.

Tabla 6.4: Resultados del análisis de la Serie 2, para el pronóstico de 12 períodos.

Método MSE Mes 1 Mes 2 Mes 3 Mes 4 Mes 5 Mes 6 Mes 7 Mes 8 Mes 9 Mes 10

Mes 11

Mes 12

Método de Regresión 541.70 164.8 167.1 169.3 171.6 173.8 176.0 178.3 180.5 182.8 185.0 187.3 189.5

Suavizado Exponencial Doble 221.5 96.2 97.8 99.3 100.9 102.4 104.0 105.6 107.1 108.7 110.2 111.8 113.3

Page 107: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

94 Capítulo 6. Comparación de Resultados de RNAs contra Métodos Lineales Tradicionales

Analizando los resultados de la Tabla 6.4, se optó por elegir el método de suavizado

exponencial doble, pues resultó con un MSE menor que el método de regresión y los

valores de pronóstico fueron razonables para el análisis de la Serie 2.

6.2.1. Comparación de Resultados

Considerando un horizonte de planeación de 12 periodos, en el Capítulo 5 fueron

construidos modelos de RNAs con múltiples salidas para pronosticar doce valores de

demanda mediante el análisis de las Series 1 y 2 (Figura 5.1 y Figura 5.2

respectivamente).

En la Tabla 6.5 se muestra la comparación de los resultados obtenidos. La segunda

fila contiene los resultados obtenidos mediante el método lineal, la tercera contiene los

que se obtuvieron a partir del modelo de RNA y en la última fila están valores reales de

la demanda que se registró en los cuatro períodos posteriores al último dato contenido en

la Serie 1 (ver Figura 5.1). Estos últimos fueron brindados por la empresa, con el fin de

validar los resultados de ambas técnicas: RNAs y métodos lineales tradicionales. En la

Figura 6.2 se presentan los resultados de esta comparación de manera gráfica.

Tabla 6.5: Modelo de RNA vs Método Tradicional vs Modelo Real en el análisis de la

Serie 1.

Método MSE Mes 1 Mes 2 Mes 3 Mes 4 Mes 5 Mes 6 Mes 7 Mes 8 Mes 9 Mes 10

Mes 11

Mes 12

Método de Regresión 4579.4 740.3 749.4 758.4 767.5 776.6 785.7 794.7 803.8 812.9 822.0 831.0 840.1

RNA 211.5 528.4 540.6 555.7 566.4 584.4 599.7 609.2 614.2 627.5 638.4 653.8 675.2

Real 455.0 458.0 465.0 472.0

Page 108: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

95 Capítulo 6. Comparación de Resultados de RNAs contra Métodos Lineales Tradicionales

Se puede observar que los resultados obtenidos mediante el modelo de RNA para el

análisis y pronóstico de 12 períodos de la Serie 1 construido a partir de la metodología

propuesta nos condujo a mejores resultados que el mejor de los métodos lineales

utilizados.

0

100

200

300

400

500

600

700

800

900

1 7 13 19 25 31 37 43 49 55 61 67 73 79

Tiempo (meses)

Uni

dade

s de

Dem

anda

Real RNA Método de Regresión

Figura 6.2: Comparación del pronóstico de RNAs vs. Método de Regresión en el

Análisis de la Serie 1, doce períodos.

A continuación en la Tabla 6.6 se muestra de manera semejante a la anterior los

resultados obtenidos a través de los diferentes métodos durante el análisis de la Serie 2 y

en la Figura 6.3 se presentan en forma gráfica.

Page 109: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

96 Capítulo 6. Comparación de Resultados de RNAs contra Métodos Lineales Tradicionales

Tabla 6.6: Comparación de Resultados, Modelo de RNA vs Método Tradicional vs

Modelo Real, Serie 2.

Método MSE Mes 1 Mes 2 Mes 3 Mes 4 Mes 5 Mes 6 Mes 7 Mes 8 Mes 9 Mes 10

Mes 11

Mes 12

Suavizado Exponencial Doble 221.5 96.2 97.8 99.3 100.9 102.4 104.0 105.6 107.1 108.7 110.2 111.8 113.3

RNA 106.2 157.6 163.3 162.2 164.3 165.1 166 173.0 176.3 185.9 191.0 106.2 157.6

Real 150.0 149.0 151.0 155.0

0

100

200

300

400

500

600

700

800

1 7 13 19 25 31 37 43 49 55 61 67 73 79

Tiempo (meses)

Uni

dade

s de

Dem

anda

Real RNA Suavizado Exp. Doble

Figura 6.3: Comparación del pronóstico de RNAs vs. Suavizado Exponencial Doble en

el Análisis de la Serie 2, doce períodos.

Nuevamente, los resultados obtenidos mediante el modelo de RNA para el análisis y

pronóstico de 12 períodos de la Serie 2, son mejores que los de los métodos lineales

utilizados.

Page 110: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

97 Capítulo 6. Comparación de Resultados de RNAs contra Métodos Lineales Tradicionales

6.3. Conclusiones

Al realizar la comparación de los modelos de RNAs construidos a través de la metodología

propuesta en el Capítulo 3 comprobamos que para nuestro caso de estudio de pronóstico de

demanda de telecomunicaciones para uno y doce periodos futuros, los modelos de RNA

permitieron obtener pronósticos mucho más confiables que los obtenidos mediante métodos

lineales tradicionales. Lo anterior, sustenta la validez del método propuesto.

Page 111: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

CAPÍTULO 7

INSTAURACIÓN DE LA

HERRAMIENTA DE SOPORTE A LA

TOMA DE DECISIONES

Introducción

En este capítulo se explica de manera general la implementación computacional que

se llevó a cabo en el desarrollo de la metodología descrita en el Capítulo 3. La

herramienta que se presenta en la Figura 7.1, fue creada y utilizada para generar y

ejecutar el diseño de experimentos de RNAs para el pronóstico de múltiples períodos.

Al implementar dicha herramienta se obtuvieron grandes beneficios, pues no es

necesaria la interacción del usuario durante la ejecución del experimento y su

intervención se limita a proporcionar la delimitación del área experimental, así como los

valores de la serie de tiempo.

98

Page 112: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

99 Capítulo 7. Instauración de la Herramienta de Soporte a la Toma de Decisiones

La codificación fue realizada en Matlab 7.0.4. A continuación se presenta la

descripción general de la herramienta y el código fuente está disponible en el Apéndice

C. La fase de análisis de varianza y optimización se realizó en Minitab y Excel Solver

respectivamente.

7.1. Descripción de la herramienta de soporte a la toma de

decisiones

El objetivo de la codificación de la herramienta de soporte de decisiones fue brindarle

al tomador de decisiones una herramienta que sustente y oriente las decisiones de

planeación de capacidad de una red de transmisión, sin necesidad de conocer a detalle la

modelación mediante RNAs para pronóstico de series de tiempo. Se llevó a cabo la

construcción de un prototipo que se encarga de generar y ejecutar un diseño de

experimentos de tipo factorial (Figura 7.1) que constituye la parte fundamental de la

metodología propuesta en el Capítulo 3.

Para ejecutar el proceso de la Figura 7.1 el usuario requiere especificar las siguientes

entradas:

• Datos: Corresponde a los valores de la demanda registrados a lo largo del tiempo

(serie de tiempo). Se especifica en forma de vector columna o bien, se da el

nombre del archivo .xls o .m que contiene tal vector. Este archivo debe estar en

el espacio de trabajo actual.

• Especificaciones de los factores: En nuestro caso, los factores que formarán parte

del diseño de experimentos son lags y neuronas. Así que es necesario introducir

los valores específicos que toman estos factores en cada uno de los niveles

definidos dentro del rango experimental.

• Resultados: Corresponde al nombre de un archivo .xls en el cual se almacenará

en forma de tabla los resultados del experimento.

Page 113: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

100 Capítulo 7. Instauración de la Herramienta de Soporte a la Toma de Decisiones

Generar Combinación Factorial

Selección del Conjunto de Validación

Inicialización de la RNA

Entrenamiento de la RNA

Validación de la RNA y Pronóstico

Selección del mejor modelo de RNA

Guardar en Resultados

Guardar RNA y medidas de desempeño

Datos Especificaciones de los factores

¿Otro punto de inicio?

Terminar

Mostrar Resultados

¿Factorial Completo?

Resultados

Si

No

No

Figura 7.1: Generador y ejecutor de un Experimento Factorial.

Page 114: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

101 Capítulo 7. Instauración de la Herramienta de Soporte a la Toma de Decisiones

Por ejemplo, si la serie de datos está contenida en un archivo llamado ‘Serie.m’ y el

experimento se desarrollará con tres niveles de cada factor con valores específicos de

lags = {2, 5, 7} y neuronas= {3, 5, 8} y se quiere almacenar los resultados en el archivo

‘salida.xls’. Se introduce en la línea de comandos: Hacer_Experimento(Serie, [2 5 7],[3

5 8], ‘salida.xls’)

De esta forma, el programa Hacer_Experimento realiza lo siguiente:

• Generar combinación factorial: Fija el factor lags en un nivel y recorre cada uno

de los niveles de neuronas. Cuando se han recorrido todos los niveles de

neuronas, entonces se recorre el factor lags al siguiente nivel y vuelve a recorrer

neuronas. Se realiza sucesivamente hasta terminar las posibles combinaciones de

los factores. Cuando se tiene una combinación factorial, se procede a pre-

procesar los datos de manera que estén contenidos en la región [-1, 1]. Se lleva a

cabo la construcción de patrones cuya cantidad dependerá de la cantidad de datos

contenidos en ‘Serie’, el número de lags y la cantidad de salidas de la RNA (que

en nuestro caso son 12). Ya que se tienen todos los patrones disponibles para el

análisis, se separan en dos conjuntos: conjunto de entrenamiento y conjunto de

validación, para llevar a cabo la técnica de validación cruzada.

• Selección del conjunto de validación: Puesto que ya se conoce la cantidad de

patrones disponibles, se selecciona de manera aleatoria de acuerdo a una

distribución uniforme sin reemplazo aquéllos patrones que formarán parte del

conjunto de validación. En nuestro caso usamos aproximadamente el 30% de los

patrones disponibles. Los patrones no seleccionados conformarán el conjunto de

entrenamiento.

El programa Selección, es el que se encarga de construir las matrices de

entrenamiento y de validación del modelo de RNA. En este momento ya se tiene

información suficiente que permite comenzar el proceso de construcción del modelo de

RNA. Se utiliza una RNA de tres capas con retropropagación con función de

transferencia tangente hiperbólica en la capa oculta y función identidad en la capa de

salida. La RNA se construye como sigue:

Page 115: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

102 Capítulo 7. Instauración de la Herramienta de Soporte a la Toma de Decisiones

• Inicialización de la RNA: Fija los valores iniciales de las conexiones de la RNA.

Como se explicó en el Capítulo 5, en nuestro caso tenemos 7 puntos de inicio

para la RNA, así que se inicializa en cada uno de ellos para llevar a cabo su

entrenamiento y validación. Posteriormente se seleccionará la RNA con mejor

desempeño.

• Entrenamiento: La actualización de las conexiones se realizará mediante el

algoritmo de Levenberg - Marquardt (lm), para minimizar el error de

aproximación conocido como MSE. Se consideran sólo los patrones del conjunto

de entrenamiento con el objetivo de minimizar la función de error, para obtener

una buena aproximación del modelo que está detrás del comportamiento de los

datos. Terminada la actualización de pesos, se realiza el post- procesamiento de

la información para calcular la medida de desempeño MSE_T, correspondiente a

la RNA.

• Validación y Pronóstico: Considerando los patrones del conjunto de validación,

se alimenta a la RNA resultante del entrenamiento anterior. Obtenemos las

salidas de la RNA, post-procesamos las salidas y calculamos el MSE_V. Para

realizar el pronóstico consideramos los últimos datos históricos (pre -

procesados) registrados en la Serie de acuerdo al valor del factor lags, los

alimentamos a la RNA y calculamos las salidas de la RNA. Llevamos a cabo el

post- procesamiento para obtener así el pronóstico de los siguientes 12 períodos.

• Guardar RNA y medidas de Desempeño: Se almacenan en archivos temporales

los resultados del entrenamiento, validación y pronóstico. Posteriormente se

recurrirá a ellos para obtener sólo el que contenga la RNA con mejor desempeño,

el resto de los archivos será depurado.

• ¿Otra inicialización?: Puesto que tenemos 7 puntos de inicio para los modelos de

RNA, si aún no se han construido los 7 modelos diferentes de RNA para la actual

combinación de factores, se procede a la inicialización de la RNA en otro punto

distinto. De lo contrario, se procede al siguiente paso:

• Selección del mejor modelo de RNA: De los modelos correspondientes a la

combinación actual de factores, se selecciona el modelo de RNA con menor

MSE_V, así obtenemos el modelo de RNA con mayor poder de generalización

Page 116: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

103 Capítulo 7. Instauración de la Herramienta de Soporte a la Toma de Decisiones

para esa combinación de factores. Se eliminan los archivos temporales y se

conserva sólo el que contiene el modelo de RNA seleccionado.

• Mostrar Resultados: Despliega en pantalla un gráfico que contiene los datos

históricos de la demanda, así como el pronóstico obtenido por el modelo

seleccionado.

• Guardar en Resultados: Actualiza el archivo ‘salida.xls’, coloca la combinación

de factores, el valor de las medidas de desempeño correspondientes a esa

combinación así como el valor del pronóstico para los siguientes 12 períodos del

modelo seleccionado.

• ¿Factorial Completo?: Si aún no se han elaborado modelo de RNA con todas las

combinaciones posibles de lags y neuronas, se procede a Generar Combinación

Factorial, de lo contrario el procedimiento termina.

• Terminar: Concluye la ejecución del experimento.

Al finalizar, el tomador de decisiones tendrá disponible el archivo ‘salida.xls’ que

contiene los resultados del experimento. De acuerdo a la metodología, se procede a la

caracterización de resultados mediante el análisis de varianza. Se obtienen los

metamodelos para llevar a cabo la optimización de las medidas de desempeño de la

RNA, así se determina el valor al cual deben fijarse los parámetros para que la RNA

brinde pronósticos confiables.

El análisis de varianza se puede ejecutar en cualquier paquete estadístico, en nuestro

caso se utilizó Minitab. La optimización de los modelos de RNA resultantes se puede

realizar en cualquier herramienta de optimización no lineal entera, el solver de Excel

fue suficiente para el propósito de este trabajo.

Page 117: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

104 Capítulo 7. Instauración de la Herramienta de Soporte a la Toma de Decisiones

7.2 Conclusiones

Con la automatización del generador y ejecutor de experimentos, el usuario lo único

que tiene que hacer es brindar la información histórica de la serie y especificar los

valores de los parámetros, el resto de las decisiones las toma el programa. Por tanto, es

una herramienta muy sencilla de manejar que no exige conocimiento previo acerca de la

modelación de series de tiempo mediante RNAs. Queda al usuario crear los

metamodelos y llevar a cabo la optimización. Estos procedimientos pueden

automatizarse en un futuro considerando la salida de la codificación aquí descrita.

Page 118: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

CAPÍTULO 8

CONCLUSIONES, CONTRIBUCIÓN Y

TRABAJO FUTURO

En este trabajo, se propuso una metodología para seleccionar los parámetros que

intervienen en la construcción y utilización de RNAs para pronóstico de series de

tiempo. La metodología propuesta utiliza conceptos de diseño de experimentos, análisis

de varianza, y optimización no lineal. Se pudo demostrar que la metodología trabaja

bien por medio de un caso práctico de predicción de demanda en la industria de las

telecomunicaciones. Dentro de las características atractivas de la metodología se

encuentra que: (1) utiliza técnicas establecidas y confiables, (2) puede instaurarse sin

necesidad de una codificación especializada y (3) hace entendible la interrelación entre

los varios parámetros de la RNA.

Se analizaron dos series de tiempo reales que corresponden al comportamiento de la

demanda en una industria de telecomunicaciones. El análisis y pronóstico de las mismas

fue realizado mediante una RNA de múltiples salidas construida mediante la aplicación

de la metodología propuesta. Se obtuvieron modelos de RNA confiables, con

105

Page 119: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

106 Capítulo 8. Conclusiones, Contribución y Trabajo Futuro

pronósticos de calidad que fueron comparados con pronósticos realizados mediante

procedimientos lineales tradicionales y valores reales.

Al realizar la comparación de los modelos de RNAs construidos a través de la metodología

propuesta, comprobamos que para nuestro caso de estudio de pronóstico de demanda de

telecomunicaciones para uno y doce periodos futuros, los modelos de RNA permitieron obtener

pronósticos mucho más confiables que los obtenidos mediante métodos lineales tradicionales.

Estos resultados sustentan la validez del método propuesto.

La metodología propuesta tiene la ventaja de permitir reproducir los resultados

fácilmente aplicándola de manera sistemática, inicializando los pesos de las conexiones

de RNA en los valores propuestos y seleccionando de manera aleatoria de acuerdo a una

distribución uniforme sin reemplazo el conjunto de patrones de validación.

Se automatizó el generador y ejecutor de experimentos haciendo aún más sencilla la

construcción del modelo de RNA. El usuario lo único que tiene que hacer es brindar la

información histórica de la serie y especificar los valores de los parámetros, el resto de

las decisiones las toma el programa. Por tanto, es una herramienta muy sencilla de

manejar que no exige conocimiento previo acerca de la modelación de series de tiempo

mediante RNAs.

La principal contribución de esta tesis fue la metodología propuesta, pues hasta

donde tenemos conocimiento nunca ha sido aplicada para la selección de parámetros de

una RNA. Además, se resolvió un problema real de una empresa de telecomunicaciones.

Otra característica atractiva es la inicialización sistemática de los pesos de las

conexiones pues brinda la posibilidad de reproducir los resultados. Por otra parte, la

forma en que fue seleccionado el conjunto de validación es provechosa y objetiva, ya

que al ser de manera aleatoria, el diseñador del modelo no influye en la selección de los

patrones que se utilizarán para probar la capacidad de generalización de la RNA.

En el desarrollo del modelo de RNAs para pronóstico de múltiples períodos

obtuvimos resultados empíricos que mostraron un pobre desempeño de la técnica

iterativa que utiliza RNAs con una salida para pronosticar más de un período. También

Page 120: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

107 Capítulo 8. Conclusiones, Contribución y Trabajo Futuro

se obtuvo pobre desempeño en la técnica que usa modelos de RNA independientes para

cada horizonte de pronóstico con el fin de pronosticar múltiples períodos. De acuerdo a

lo anterior, concluimos que para el pronóstico de múltiples períodos es mejor utilizar

modelos de RNAs con múltiples salidas. Por supuesto, queda abierta esta línea de

demostrar teóricamente estas conclusiones.

Como trabajo futuro se pueden encontrar intervalos de confianza para los pronósticos

que se obtienen mediante el modelo de RNA construido a través de la metodología

propuesta.

Sería además interesante utilizar la metodología propuesta con diferentes tipos de

RNAs.

Otra extensión potencial de este trabajo es la automatización de los procesos de

análisis de varianza y optimización.

Page 121: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

BIBLIOGRAFÍA

Al-Saba Tawfiq and El-Amin Ibrahim, “Artificial neural networks as applied to

long-term demand forecasting”, Artificial Intelligent in engineering, Vol. 13, 1999,

pp. 189-197.

Ashu Jain, Ashish Kumar, and Umesh Chandra Joshi, “Short-Term Water

Demand Forecast Modelling at IIT Kanpur Using Artificial Neural Networks”,

Water Resources Management Vol. 15, Num.5 , 2001, pp. 299-321.

Bishop C. M., Neural networks for pattern recognition. Oxford University Press,

Oxford, UK, 1995.

Borwein J. M., and Lewis A. S., Convex Analysis and Nonlinear Optimization,

Springer, Verlag-New York, Inc, 2000.

Box G. E. P., and Jenkins G. M., Time series Analysis: Forecasting and control,

San Francisco, CA: Holden-Day, EUA, 1976.

Cabrera-Ríos M., Castro J. M., and Mount-Campbell C. A., “Multiple quality

criteria optimization in in-mold coating (IMC) with a data envelopment analysis

approach”, Journal of Polymer Engineering, Vol. 22, No. 5, 2002, pp. 305- 340.

Cabrera-Ríos M., Castro J. M., and Mount-Campbell C. A., “Multiple quality

criteria optimization in reactive in-mold coating with a data envelopment analysis

approach II: a case with more than three performance measures”, Journal of Polymer

Engineering, Vol. 24, No. 4, 2004, pp. 435-450.

108

Page 122: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

109 Bibliografía

Castro C. E., Cabrera-Ríos M., Lilly B., Castro J. M., and Mount-Campbell C.

A., “Identifying the best compromise between multiple performance measures in

injection holding (IM) using data envelopment analysis (DEA)”, Journal of

Integrated Design and Process Science, Vol. 7, No. 1, 2003, pp. 77-87.

Castro J. M., Cabrera-Ríos M., and Mount-Campbell C. A., “Modelling and

Simulation in reactive polymer processing”, Modelling and Simulation in Materials

Science and Engineering, Vol. 12, No. 3, 2004, pp. S121-S149.

Cigizoglu H. Z., “Incorporation of ARMA models into flow forecasting by artificial

neural networks”, Environmetrics, Vol. 14, Num. 4, 2003, pp. 417-427.

Cybenko G., “Approximation by superpositions of sigmoidal function”,

Mathematical Control Signals Systems, Num. 2, 1989, pp.303-314.

Daliakopoulos Ioannis N., Coulibaly Paulin, and Tsanis Ioannis K.,

“Groundwater level forecasting using artificial neural networks”, Journal of

Hydrology, Vol. 309, Num. 1-4, 2005, pp. 229-240.

Deb K., Multi-Objective Optimization using evolutionary algorithms, Editorial

Wiley, N.Y., EUA, 2004.

Devore J. L., Probability and Statistics for Engineering the Sciences 4ta Edición,

Duxbury Press, California Polytechnic State University, EUA, 1995.

Duhoux M, Suykens JAK, De Moor B, and Vandewalle J, “Improved long-term

temperature prediction by chaining of neural networks”, Int J Neur Sys, Vol. 11, No.

1, 2001, pp. 1-10.

Floudas C. A., Nonlinear and Mixed- Integer Optimization, Oxford, N.Y., 1995.

Gardner M. W., and Dorling S. R., “Artificial neural networks (the multi-layer

perceptron)- a review of applications in the atmospheric sciences”, Atmospheric

Environment, Vol. 33, 1999, pp. 709-719.

Page 123: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

110 Bibliografía

Ghaziri Hassan M., Optimización Heurística y Redes Neuronales, Editado por Díaz

Fernández Adenso, Madrid, España, 1996.

Ghiassi M., and Saidane H., “A dynamic architecture for artificial neural

networks”, Neurocomputing, Vol. 63, 2005, pp. 397-413.

González Pedro, and Zamarreño Jesús, “Prediction of hourly energy consumption

in buildings based on a feedback artificial neural network”, Energy and Building,

Vol. 37, 2005, pp. 595-601.

Granger C. W. J., “Strategies for modelling nonlinear time-series relationships”,

The Economic Record, Vol. 69, Num. 206, 1993, pp. 233-238.

Gutiérrez-Estrada Juan C., De Pedro-Sanz Emiliano, López-Luque Rafael and

Pulido-Calvo Inmaculada, “Comparation between tradicional methods and

artificial neural networks for ammonia concentration forecasting in an eel (Anguilla

anguilla L.) intensive rearing system”, Aquacultural Engineering, Vol. 31, 2004, pp.

183-203.

Hagan M. T., Demuth H. B., and Beale M., Neural network design, PWS Publising

Company, EUA, 1996.

Hanh H. Nuguyen and Christine W. Chan, “Multiple neural networks for a long

time series forecast”, Neural Comput &Applic, Vol. 13, 2004, pp. 90-98.

Hansen J. V., and Nelson R. D., “Forecasting and recombining time-series

components by using neural networks”, Journal of the Operations Research Society,

No. 54, 2003, pp. 307-317.

Hill, T., W. Remus, and M. OπConnor, "Neural Network Models for Time Series

Forecasts", Management Science, Vol. 42, Num. 7, 1996, pp. 1082-1092.

Hillermeier C., Nonlinear Multiobjective Optimization: a generalized homotopy

approach, Basel: Birkhauser Verlag, 2001.

Page 124: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

111 Bibliografía

Hornik K., Stinchcombe M., and White H.,“Multilayer feedforward networks are

universal approximators”, Neural Networks, Vol. 2, No. 5, 1989, pp. 359-366.

Hu M. J. C., “Application in the Adaline system to weather forecasting”, Master

Thesis, Technical Report 6775-1, Stanford electronic Laboratories, Stanford, CA,

Junio de 1964.

Huang W., Xu B., and Chan-Hilton A., “Forecasting flows in Apalachicola River

using neural networks”, Hydrological Processes, Vol. 18, 2004, pp. 2545-2564.

Hwarng H. B., “Insights into neural-network forecasting of time series

corresponding to ARMA (p,q) structures”, Omega: The International Journal of

Management Science, Vol. 29, No. 3, 2001, pp. 273-289.

Irie B., and Miyake S., “Capabilities of three-layered perceptrons”, Proccedings of

the IEEE International Conference on Neural Networks I, 1988, pp. 641-648.

Kolehmainen M., Martikainen H., Russkanen J., “Neural networks and periodic

components used in air quality forecasting“, Atmospheric Environment, Vol. 35,

2001, pp. 815-825.

Liao K-P, and Fildes R., “The accuracy of a procedural approach to specifying

feedforward neural networks for forecasting”, Computers & Operations Research,

Vol. 32, No. 2, 2005, pp. 151-2169.

Luenberger D. G., Introduction to linear and nonlinear optimization programming,

Addison- Wesley Publishing Company, 1973.

Maier H. R., and Dandy G. C., “Neural networks for the prediction and forecasting

of water resources variables: a review of modelling issues and applications”,

Environment Modelling & Software, Vol. 15, 2000, pp. 101-124.

Makridakis S., and Wheelwright S. C., The handbook of forecasting a manager’s

guide, Segunda edición, Editorial Wiley, N.Y., EUA 1987.

Page 125: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

112 Bibliografía

Makridakis S., Anderson A., Carbone R., Fildes R., Hibbon M., Lewandowski

R., Newton J., Parsen E., and Winkley R., “The accuracy of extrapolation (time

series) methods: Results of a forecasting competition”, Journal of Forecasting, Vol.

1, 1982, pp. 111-153.

Martínez Martínez Garza Ángel, Diseños Experimentales: métodos y elementos de

teoría, Editorial Trillas, México, 1988.

McCulloch W. S., and Pitts W., “A logical calculus of the ideas imminents in

nervous activity ”, Bulletin and Mathematical Biophysics, Vol. 5, 1943, pp. 115-

133.

Medeiros M. C., and Pedreira C. E., “What are the effects of forecasting linear

time series with neural networks”, Logistic and Transportation Review, Vol. 31, No.

3, 2001, pp. 239-251.

Montgomery Douglas C., Diseño y Análisis de Experimentos, Segunda Edición,

Editorial Limusa Wiley, México D. F., 2004.

Nelson, M., T. Hill, W. Remus and M. O'Connor, "Time Series Forecasting Using

Neural Networks: Should the Data Be Deseasonalized First?", Journal of

Forecasting, 1999, Vol.18, Num.5, pp. 359-370.

Niska Harri, Hiltunen Teri, Karppinen Ari, Russkanen J. and Kolehmainen M.,

“Evolving the neural network model for forecasting air pollution time series”,

Engineering Applications of Artificial Intelligence, Vol. 17, 2004, pp. 159-167.

Piramuthu S., H. Ragavan, and M. Shaw, “Using feature construction to improve

the performance of neural networks”, Management Science, Vol. 44, No. 3, 1998,

pp. 416-430.

Qi Min and Zhang G. P., “An investigation of model selection criteria for neural

network time series forecasting”, European Journal of Operation Research, Vol.

132, 2001, pp. 666-680.

Page 126: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

113 Bibliografía

Qing Cao, Karyl B. Leggio and Marc J. Schniederjans, “A comparation between

Fama and Frech’s model and artificial neural networks in predicting the Chinese

stock market”, Computers & Operation Research, Vol. 32, 2005, pp. 2499-2512.

R. J. Kuo and k. C. Xue, “Fuzzy neural networks with application to sales

forecasting”, Fuzzy sets and y systems, Vol. 108, Num. 2, 1999, pp. 123-143.

Rumelhart D-E., Hinton G. E., and Willians R. J., “Learning representartions by

backpropagating errors”, Nature, 323 (6188), 1986, pp. 533-536.

Sexton R. S., McMurtrey S., Michalopoulos J. O., and Smith A. M.,“Employee

turnover : a neural network solution”, Computers & Operations Research, Vol. 32,

No. 10, 2005, pp. 2635-2651.

Smith K. A. and Gupta JND, “Neural networks in business: techniques and

applications for the operations researcher”, Computers and Operations Research,

Vol. 27, Num. 11-12, 2000, pp.1023-1044.

Sözen Adnan, Arcaklioglu Erol, Özalp Mehmet, and Çaglar Naci, “Forecasting

based neural network approach of solar potential in Turkey”, Renewable Energy,

Vol. 30, Num.7, 2005, pp. 1075-1090.

Werbos P. J., “Generalization of backpropagation with applications to a recurrent

gas market model”, Neural Networks, Vol. 1, 1988, pp. 339-356.

West D., Dellana S., and Qian J., “Neural networks strategies for financial decision

applications”, Computers & Operations Research, Vol. 32, 2005, pp.2543-2559.

White H., “Connectionist nonparametric regression: Multilayer feedforward

networks can learn arbitrary mappings”, Neural Networks, Vol. 3, No. 5, 1990, pp.

535-549.

Page 127: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

114 Bibliografía

Widrow B., Rumelhart D., and Lehr M. A., “Neural networks: Applications in

industry, bussines and science”, Communications of the ACM, Vol. 37, No. 3, 1994,

pp. 93-105.

Zhang G. P., and Hu M. Y., “A simulation study of artificial neural networks for

nonlinear time series forecasting”, Computers & Operations Research, Vol. 28,

2001, pp. 381-396.

Zhang G. P., Neural Networks in Business Forecasting, Idea Group Publishing,

Georgia State University, EUA, 2004.

Zhang G., Patuwo E., and Hu Y. M., “Forecasting with artificial neural networks

the state of the art”, International Journal of Forecasting, Vol.14, No. 1, 1998, pp.

35-62.

Page 128: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

 

LISTA DE FIGURAS

1.1. Descripción del problema de Telecomunicaciones. ………...………………….. 2

1.2: Ejemplo de una Serie de Tiempo. ………....………………………………….…. 3

2.1: Neurona Biológica. ………………………………………...………………….. 10

2.2: Neurona Artificial. ………...………………………………………………….... 11

2.3: RNA multicapa de propagación hacia adelante. ………...……………...…….. 12

2.4: Modelo general de un proceso o sistema. ………...……………………...…….. 21

2.5: a) Función convexa y b) Función estrictamente convexa. ...………………….. 25

2.6: Función no convexa. ………...……………………………………………..….. 25

2.7: Representación Gráfica de un Problema de Optimización Multicriterio. ……... 27

3.1: Metodología Propuesta para la Selección de Parámetros en RNAs. ………….. 30

4.1: Serie de tiempo del comportamiento de la demanda. ………………….……… 39

4.2: Red Neuronal Artificial de propagación hacia adelante, entrenada por

retropropagación del error de pronóstico, con tres capas. ………...…………..…… 41

4.3: Gráficas para comprobación de normalidad e independencia estadística de los

residuos en el modelo de regresión de la B_Pred. ………...………………………... 51

115

Page 129: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

116 Lista De Figuras

4.4: Gráficas de Residuos vs. Variables para la comprobación de igualdad de varianza en

los residuos del modelo de regresión de la B_Pred. ………...………………….….. 52

4.5: Modelo de RNAs vs Modelo Real. ………...………………………………….. 55

5.1: Comportamiento de la demanda, Serie 1. …..……...………………………….. 59

5.2: Comportamiento de la demanda, Serie 2. ………...…………………….……... 60

5.3: Red neuronal artificial de propagación hacia adelante, entrenada por

retropropagación del error de pronóstico con tres capas y múltiples salidas. ……... 62

5.4: Gráficas de contorno y de superficie correspondientes al MSE_T y MSE_V

experimental en la Serie 1. ………...……………………………………...……….. 69

5.5: Gráficas de contorno y de superficie correspondientes al MSE_T y MSE_V en el

experimento enfocado. ………...…………………………..……………...……….. 72

5.6: Superficie de los metamodelos para el MSE_T y MSE_V antes y después del

enfoque del Experimento. ………...……………………………………...……….... 73

5.7: Pronóstico del modelo de RNA definitivo, Serie 1. ………...……………….... 76

5.8: Gráficas de contorno y de superficie correspondientes al MSE_T y MSE_V

experimental en la Serie 2. ………...……………………………………...……….. 80

5.9: Gráficas de contorno y de superficie correspondientes al MSE_T y MSE_V en la

Serie 2 (experimento enfocado). …...……………………………………...……….. 83

5.10: Gráfica del MSE_T vs MSE_V en la Serie 2. ………………………..……….. 84

5.11: Pronóstico del modelo de RNA definitivo para la Serie 2. …….……………. 86

6.1: Comparación del pronóstico de RNAs vs. Suavizado Exponencial Doble en el

Análisis de la Serie 1, un solo período. …………………………………...……….. 92

Page 130: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

117 Lista De Figuras

6.2: Comparación del pronóstico de RNAs vs. Método de Regresión en el Análisis de la

Serie 1, doce períodos. ……………..……………………………………...……….. 95

6.3: Comparación del pronóstico de RNAs vs. Suavizado Exponencial Doble en el

Análisis de la Serie 2, doce períodos. ……………………...……………...……….. 96

7.1: Generador y ejecutor de un Experimento Factorial ……………………...…. 100

APÉNDICES

A21: Gráficas para comprobación de normalidad e independencia estadística de los

residuos en el modelo de regresión de S_Pred. …………………………………... 139

A22: Gráficas para comprobación de normalidad e independencia estadística de los

residuos en el modelo de regresión del MAE. ……………..……………………... 139

A23: Gráficas para comprobación de normalidad e independencia estadística de los

residuos en el modelo de regresión del MSE. …………………………………..... 140

A24: Gráficas de Residuos vs. Variables para la comprobación de igualdad de varianza

en los residuos del modelo de regresión de la S_Pred. …………………………... 141

A25: Gráficas de Residuos vs. Variables para la comprobación de igualdad de varianza

en los residuos del modelo de regresión del MAE. ……………………………...... 142

A26: Gráficas de Residuos vs. Variables para la comprobación de igualdad de varianza

en los residuos del modelo de regresión del MSE. ….…………………...……….. 143

B21: Gráficas de Residuos para el MSE_T, Serie 1. ………..…………...……….. 151

B22: Gráficas de Residuos para el MSE_V, Serie 1. ………..…………...……….. 151

Page 131: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

118 Lista De Figuras

B23: Gráficas de residuos contra variables, Serie 1. ...……..…………...………... 152

B24: Resultados del análisis formal de normalidad en los residuos, Serie 1. ….… 153

B51: Gráficas de Residuos para el MSE_T, Serie 2. ……..……………..………... 157

B52: Gráficas de Residuos para el MSE_V, Serie 2. ……..……………..………... 157

B53: Gráficas de residuos contra variables, Serie 2. ……..……………..………... 158

B54: Resultados del análisis formal de normalidad en los residuos, Serie 2. ….. 159

Page 132: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

 

LISTA DE TABLAS

4.1: Resultados del experimento. …………………………………………………... 46

4.2: Resultados del análisis de varianza para cada medida de desempeño. …..…… 49

4.3: Mejores soluciones encontradas. …………………………………………….... 54

5.1: Resultados del experimento de la Serie 1. ………………………………....….. 66

5.2: Resultados del análisis de varianza en las medidas de desempeño, Serie 1. ….. 68

5.3: Resultados del análisis de varianza en las medidas de desempeño, Serie 1

(Experimento enfocado). .…………………………………………..…………….... 70

5.4a: Soluciones finales al minimizar el MSE_T, Serie 1. .………………………... 75

5.4b: Soluciones finales al minimizar el MSE_V, Serie 1. .………………………... 75

5.5: Resultados del experimento, Serie 2. .………………………….……………... 78

5.6: Resultados del análisis de varianza en las medidas de desempeño, Serie 2. ….. 79

5.7: Resultados del experimento enfocado, Serie 2. ……………………………….. 81

5.8: Resultados del análisis de varianza en las medidas de desempeño, Serie 2

(Experimento enfocado) ……………………………………………………....….. 82

5.9: Soluciones eficientes para el análisis de la Serie 2. ……………………....…... 85

119

Page 133: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

120 Lista De Tablas

6.1: Resultados del análisis de la Serie 1 par el pronóstico de un solo período. ……....….. 90

6.2: Modelo de RNA vs. Suavizado Exponencial Doble en el pronóstico de un solo

período, Serie 1. ……………………………………...………………………....….. 91

6.3: Resultados del análisis de la Serie 1 para el pronóstico de 12 períodos. .....….. 93

6.4: Resultados del análisis de la Serie 2, para el pronóstico de 12 períodos. ....….. 93

6.5: Modelo de RNA vs Método Tradicional vs Modelo Real en el análisis de la Serie 1.

...............................................................................................................................….. 94

6.6: Comparación de Resultados, Modelo de RNA vs Método Tradicional vs Modelo

Real, Serie 2. ....…………………………………………………………………….. 96

APÉNDICES

A11 a A18: Pronóstico de la demanda mensual bajo diferentes combinaciones de

parámetros en el modelo de RNAs. ....……………………...………………... 122-137

A31: Resultados de la optimización del MAE. ....………………………………... 146

A32: Resultados de la optimización del MSE. .....………………………………... 146

A33: Resultados de la optimización de la B_Pred. ………………………..……... 146

A34: Resultados de la optimización de la S_Pred. …………………….....………. 147

B11: Pronóstico de los modelos de RNAs experimentales, Serie 1. ……....……... 148

B31: Pronóstico de los modelos de RNAs experimentales, Serie 2. ……....……... 154

B41: Pronóstico de los modelos de RNAs experimentales, experimento enfocado Serie

2. …………………………………………………………………………………... 155

Page 134: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

APÉNDICE A1

Este apartado contiene las aproximaciones puntuales de la demanda obtenidas

mediante los diferentes modelos de RNAs resultantes de las combinaciones factoriales

del experimento.

Desde la Tabla A11 hasta la Tabla A18, la primer columna contiene el número de

período o mes; la segunda contiene el valor de la demanda registrada en el período

correspondiente; las siguientes columnas contienen el valor de la aproximación realizada

por el modelo de RNA, la cabecera de estas columnas contiene la combinación factorial

de los parámetros del modelo que dan como resultado tales aproximaciones.

Por ejemplo, en la Tabla A1, la columna 3 contiene [2,2,1,1,1], esta notación indica

que el parámetro neuronas =2; lags = 2; escala = 1; transformación = 1 y algoritmo= 1.

Es decir, el modelo de RNA correspondiente a estos valores de parámetros contiene 2

neuronas en la capa oculta, utiliza 2 datos históricos para realizar el pronóstico, maneja

los datos en escala observada y no aplica ninguna transformación; el algoritmo de

entrenamiento es el ‘lm’ (Levenberg- Marquart).

Entonces, las combinaciones de los parámetros son las cabeceras que se encuentran a

partir de la tercera columna de cada tabla y representan los valores de los parámetros en

el orden: [neuronas, lags, escala, transformación, algoritmo].

121

Page 135: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

122Apéndice A1

Tabla A11: Pronóstico de la demanda mensual del Mes 1 al 53. Mes Demanda [2,2,1,1,1] [5,2,1,1,1] [7,2,1,1,1] [2,3,1,1,1] [5,3,1,1,1] [7,3,1,1,1] [2,6,1,1,1] [5,6,1,1,1] [7,6,1,1,1]

1 112 2 99 3 117 108.74 117.70 118.74 4 127 124.12 131.56 118.09 123.42 120.62 120.60 5 132 135.79 141.50 132.09 136.50 133.90 134.54 6 140 141.74 146.55 142.37 141.77 138.88 140.66 7 161 149.85 153.65 150.64 149.47 146.82 148.48 155.53 148.28 150.50 8 167 170.43 171.81 164.73 170.05 168.43 168.52 168.95 161.56 178.54 9 172 178.59 178.65 179.43 178.64 176.40 178.59 182.24 177.62 173.83

10 181 183.96 183.33 184.78 183.04 180.60 183.48 188.17 183.71 184.06 11 181 192.90 191.24 193.88 191.87 189.69 192.19 190.18 189.00 184.12 12 185 194.00 192.03 195.49 193.07 198.98 194.19 193.38 194.79 199.37 13 186 197.69 195.34 198.51 196.25 202.30 197.23 198.17 200.04 189.96 14 208 199.10 196.53 199.84 197.84 203.77 199.07 197.99 202.28 204.13 15 224 219.41 214.82 213.88 218.12 216.66 217.89 215.94 216.89 225.71 16 229 236.66 229.98 237.99 236.44 234.83 236.73 235.89 237.16 244.67 17 249 243.14 235.51 244.08 242.39 248.62 243.88 247.14 247.24 242.43 18 257 261.82 252.43 256.88 260.64 258.88 261.14 257.62 257.88 256.77 19 253 271.41 260.77 272.47 270.94 268.58 272.37 266.43 270.44 274.69 20 283 268.77 258.18 278.28 267.44 272.87 270.13 269.71 275.33 262.13 21 282 295.13 282.49 289.90 293.68 291.96 293.63 286.54 290.09 284.07 22 298 297.79 298.00 298.53 297.87 303.34 300.06 295.21 303.91 297.51 23 305 311.87 305.00 313.17 310.50 307.79 311.67 314.32 316.48 311.74 24 383 319.93 333.60 320.91 319.46 324.87 321.15 315.02 323.76 323.71 25 388 388.64 388.00 384.77 389.28 388.40 384.56 380.44 371.29 381.99 26 390 401.80 408.69 402.50 405.52 401.26 405.84 412.51 409.90 418.01 27 434 404.08 410.75 404.67 403.76 407.11 405.47 419.83 411.88 426.23 28 421 441.56 446.59 436.33 442.04 438.16 439.83 426.89 426.90 429.09 29 441 435.55 439.86 445.78 437.50 439.79 439.50 435.54 443.40 429.08 30 466 450.89 454.92 451.88 450.34 444.89 450.28 459.34 459.57 457.65 31 478 473.92 476.83 474.97 475.42 470.08 474.18 468.48 475.16 473.50 32 500 486.58 488.64 487.15 488.27 490.64 487.89 494.51 495.94 496.20 33 493 505.93 507.37 506.73 507.19 501.05 506.00 514.55 514.24 509.63 34 509 502.60 503.62 502.49 503.99 505.11 505.05 508.13 515.00 510.24 35 499 514.90 515.88 515.45 515.12 516.91 514.63 517.82 522.38 507.68 36 495 508.48 509.22 508.26 509.55 510.37 510.88 511.55 524.87 507.82 37 496 504.13 505.15 504.11 503.88 504.81 505.17 511.18 497.88 510.74 38 491 504.51 505.61 504.65 504.65 505.88 505.43 506.58 497.33 504.39 39 520 500.53 501.67 500.50 500.83 501.87 502.06 506.31 496.61 500.06 40 526 523.61 524.54 524.53 524.14 517.91 522.49 528.41 511.21 531.59 41 530 531.58 531.83 531.74 533.60 535.02 533.25 540.46 548.50 538.23 42 535 535.45 535.54 535.53 536.26 537.31 536.38 548.60 552.65 537.33 43 547 539.90 539.89 539.99 540.63 541.66 540.67 543.69 552.35 547.80 44 553 550.06 549.92 550.32 550.93 552.21 550.34 552.12 535.22 552.04 45 560 556.13 555.74 556.17 557.28 558.28 557.03 562.97 571.07 563.29 46 583 562.34 561.84 562.38 563.18 564.12 562.92 569.63 576.85 572.29 47 602 581.29 580.79 581.73 582.30 575.37 580.73 584.10 589.33 588.71 48 622 598.60 597.87 598.83 600.21 601.78 598.77 603.03 606.95 606.52 49 613 616.13 615.37 616.30 617.34 618.96 615.96 622.07 623.57 613.81 50 638 611.21 609.91 610.54 612.19 612.42 613.01 617.57 624.63 622.33 51 643 629.61 628.99 629.87 629.31 630.97 628.04 626.92 631.90 635.99 52 646 636.00 635.06 635.64 636.99 638.12 636.87 633.76 644.25 633.34 53 646 638.81 637.86 638.37 638.76 639.62 639.09 643.78 626.74 648.76

Page 136: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

123Apéndice A1

Continuación Tabla A11: Pronóstico de Demanda del Mes 54 al 71. Mes Demanda [2,2,1,1,1] [5,2,1,1,1] [7,2,1,1,1] [2,3,1,1,1] [5,3,1,1,1] [7,3,1,1,1] [2,6,1,1,1] [5,6,1,1,1] [7,6,1,1,1]

54 709 639.11 638.11 638.59 638.93 639.63 639.51 639.44 651.40 644.08

55 678 686.74 687.85 680.81 685.88 681.82 682.70 673.51 677.63 685.21

56 689 669.77 668.71 678.47 671.32 671.74 673.94 675.38 688.54 673.66

57 680 674.95 674.78 674.60 672.44 673.89 673.20 677.13 682.97 679.07 58 627 669.28 668.60 668.37 668.66 669.52 670.28 656.10 651.12 655.26

59 646 628.00 625.92 636.19 626.81 624.76 631.48 634.26 632.19 621.71

60 645 637.18 636.51 637.23 634.56 635.54 634.41 632.10 627.10 635.44

61 664 638.35 637.32 637.80 638.94 639.75 639.37 633.48 631.56 618.12

62 671 652.74 652.27 652.72 652.30 654.03 651.68 661.69 646.64 665.48

63 671 659.97 659.40 659.57 660.16 661.67 660.31 663.10 674.92 670.37

64 545 660.67 659.99 660.06 660.20 661.26 661.04 661.49 646.95 666.57

65 545 562.89 559.89 553.30 561.79 556.18 555.71 581.68 534.65 562.99

66 545 549.52 549.17 549.41 543.54 542.92 545.81 537.74 544.94 535.20

67 424 549.52 549.17 549.41 549.99 550.63 550.43 459.39 492.07 493.06

68 454.6 450.46 451.85 441.35 448.75 444.79 443.89 419.45 452.45 451.63

69 457.8 462.57 466.17 463.86 456.47 458.81 457.07 465.48 469.68 460.61

70 465.2 468.62 471.38 468.99 470.36 472.68 470.82 452.57 409.67 416.62

71 471.5 475.11 477.62 475.58 475.49 477.63 475.95 506.54 489.21 482.24

Pronóstico 481.13 483.34 481.54 481.77 483.78 482.19 498.69 509.03 493.12

Page 137: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

124Apéndice A1

Tabla A12: Pronóstico de la demanda mensual del Mes 1 al 53. Mes Demanda [2,2,1,1,2] [5,2,1,1,2] [7,2,1,1,2] [2,3,1,1,2] [5,3,1,1,2] [7,3,1,1,2] [2,6,1,1,2] [5,6,1,1,2] [7,6,1,1,2]

1 112 2 99 3 117 117.22 112.11 116.83 4 127 125.60 123.81 127.39 125.99 128.97 130.20 5 132 136.37 138.11 137.03 135.97 129.18 138.02 6 140 142.15 145.23 142.71 142.03 141.00 144.32 7 161 148.87 152.79 148.36 148.79 152.52 149.53 161.99 161.28 157.83 8 167 165.81 169.31 161.09 165.30 170.61 158.66 167.34 166.50 165.38 9 172 175.77 178.90 174.27 175.20 168.29 169.08 170.60 172.24 167.47

10 181 181.12 183.51 179.93 181.05 183.15 179.14 180.27 180.46 186.77 11 181 189.30 189.85 186.94 189.19 191.22 185.90 180.08 180.68 178.53 12 185 191.78 192.71 192.66 191.77 191.56 191.25 187.51 185.76 198.94 13 186 194.86 194.76 194.45 195.05 196.39 196.00 200.00 186.36 211.41 14 208 196.74 196.61 197.54 196.89 197.95 197.98 200.95 207.06 210.27 15 224 214.28 207.45 208.23 214.12 211.30 207.72 204.61 224.77 225.47 16 229 233.50 224.03 231.17 232.92 229.99 223.61 229.81 239.75 241.40 17 249 242.26 235.28 244.90 242.24 240.82 242.30 238.47 242.43 250.34 18 257 260.17 248.94 258.55 260.31 255.81 259.94 259.75 253.01 259.93 19 253 272.74 269.25 275.79 272.79 273.40 274.03 260.82 255.06 255.84 20 283 271.82 273.88 278.24 272.58 276.87 283.20 262.47 273.79 268.55 21 282 295.45 288.65 292.85 295.98 287.83 298.37 292.18 283.37 288.22 22 298 303.54 317.25 307.64 303.76 309.16 307.26 312.11 301.06 288.97 23 305 316.38 326.04 317.01 317.34 321.09 323.20 317.67 310.92 312.54 24 383 326.77 344.63 327.80 327.45 340.68 331.10 366.90 381.44 312.73 25 388 389.24 383.27 384.05 388.75 380.47 383.07 377.50 386.61 385.17 26 390 412.77 411.87 405.36 411.73 389.07 403.62 390.13 389.92 391.76 27 434 415.37 413.71 407.53 416.43 438.34 407.40 434.94 434.14 428.97 28 421 444.33 432.09 442.58 444.21 450.24 440.58 420.45 420.98 422.33 29 441 446.08 442.02 436.79 445.93 456.23 436.16 432.38 440.80 426.77 30 466 455.20 449.12 451.78 455.63 461.59 448.89 463.79 475.12 465.87 31 478 473.14 474.34 474.32 472.23 474.64 473.11 462.52 479.95 475.03 32 500 483.94 489.47 486.52 482.76 482.87 485.87 487.10 483.69 496.46 33 493 496.47 501.55 506.04 494.90 494.82 505.75 517.75 495.30 527.05 34 509 496.88 502.28 501.87 495.50 493.03 501.46 506.56 494.39 514.20 35 499 502.87 507.28 514.85 501.42 501.85 513.74 519.45 501.34 524.29 36 495 501.01 505.34 507.64 499.57 497.09 507.09 502.64 505.80 511.98 37 496 497.62 502.81 503.48 496.73 493.54 501.17 505.15 501.89 508.99 38 491 497.42 502.61 504.02 496.37 493.86 502.22 495.02 506.84 504.83 39 520 495.31 501.03 499.87 494.35 491.48 498.08 491.73 503.49 499.68 40 526 511.19 512.31 524.00 511.68 510.69 523.84 520.01 522.66 530.61 41 530 513.98 518.02 531.34 511.43 519.48 533.39 532.55 535.30 542.86 42 535 516.43 521.04 535.18 514.15 523.70 535.90 554.93 534.52 554.76 43 547 519.32 525.13 539.72 516.95 529.47 540.60 547.26 540.42 551.14 44 553 549.78 537.61 550.24 550.83 544.65 551.97 552.53 551.02 555.24 45 560 553.55 546.08 556.19 550.47 553.57 558.60 565.25 569.39 566.57 46 583 591.43 556.95 562.53 593.66 563.50 564.88 576.28 577.84 574.44 47 602 623.78 597.18 582.27 625.58 595.70 585.82 592.80 600.08 590.61 48 622 631.44 625.36 599.61 632.51 619.01 604.33 612.75 620.42 608.44 49 613 638.16 642.06 617.20 638.69 636.26 621.33 635.53 634.30 628.37 50 638 637.72 636.67 611.33 638.47 629.99 615.13 632.52 634.11 623.01 51 643 642.67 648.46 630.73 642.99 645.18 632.62 640.95 641.29 631.83 52 646 645.61 649.82 636.37 645.49 647.93 639.38 639.53 648.01 633.83 53 646 646.57 650.43 639.05 646.52 649.02 640.69 651.20 649.20 642.23

Page 138: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

125Apéndice A1

Continuación Tabla A12: Pronóstico de Demanda del Mes 54 al 71. Mes Demanda [2,2,1,1,2] [5,2,1,1,2] [7,2,1,1,2] [2,3,1,1,2] [5,3,1,1,2] [7,3,1,1,2] [2,6,1,1,2] [5,6,1,1,2] [7,6,1,1,2]54 709 646.79 650.45 639.25 646.74 649.04 640.71 647.54 650.55 640.04 55 678 657.64 654.07 686.51 656.14 659.74 681.32 667.35 656.04 669.46 56 689 656.39 653.50 667.82 655.07 655.69 667.99 666.86 656.37 666.76 57 680 656.36 653.79 673.99 655.40 658.21 669.25 675.03 655.61 673.55 58 627 655.57 653.55 668.03 654.55 657.33 666.03 656.35 627.03 652.90 59 646 639.17 645.47 626.57 638.35 640.47 627.20 638.32 650.39 620.99 60 645 645.41 650.35 637.98 645.83 648.29 636.74 637.27 652.81 627.81 61 664 646.59 650.27 638.47 646.45 648.77 640.86 623.89 653.60 621.45 62 671 650.15 652.64 653.11 649.68 654.19 653.20 657.75 654.89 652.47 63 671 652.60 653.13 659.67 651.79 655.81 659.67 661.24 655.71 660.29 64 545 653.03 653.14 660.13 652.29 655.82 659.34 662.20 654.41 656.83 65 545 538.98 540.93 558.48 536.28 541.81 557.25 545.03 544.99 570.43 66 545 526.11 535.78 549.30 544.79 537.94 541.70 534.68 545.00 524.79 67 424 526.11 535.78 549.30 523.66 542.52 550.37 478.16 424.01 500.97 68 454.6 470.73 454.60 447.76 472.65 455.10 443.72 454.66 454.57 442.71 69 457.8 463.59 459.58 463.25 466.02 456.14 454.82 456.57 457.80 454.73 70 465.2 471.38 474.61 468.71 470.64 474.43 467.66 421.51 465.17 419.76 71 471.5 475.91 480.18 475.13 475.54 476.85 472.86 478.54 470.25 488.25 Pronóstico 480.53 486.03 481.01 479.92 480.09 479.10 492.31 497.60 507.85

Page 139: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

126Apéndice A1

Tabla A13: Pronóstico de Demanda del Mes 1 al 50. Demanda [2,2,1,2,1] [5,2,1,2,1] [7,2,1,2,1] [2,3,1,2,1] [5,3,1,2,1] [7,3,1,2,1] [2,6,1,2,1] [5,6,1,2,1] [7,6,1,2,1]Mes

112.00 1 99.00 2 117.00 3 127.00 121.74 116.15 130.84 4 132.00 131.74 139.65 139.77 136.72 129.42 136.06 5 140.00 136.74 144.65 144.77 141.72 146.78 140.03 6 161.00 144.74 152.65 152.68 149.72 149.98 154.66 7 167.00 165.74 173.65 167.28 170.72 168.72 170.06 167.00 167.00 166.04 8 172.00 171.74 179.65 179.77 176.72 173.65 171.79 175.65 176.49 187.22 9 181.00 176.74 184.65 184.77 181.72 181.98 160.13 180.65 176.81 180.18 10 181.00 185.74 193.65 193.50 190.72 190.98 195.68 189.65 190.49 195.82 11 185.00 185.74 183.56 193.58 190.72 187.68 183.92 189.65 188.55 195.82 12 186.00 189.74 186.28 186.01 194.72 194.97 186.00 193.65 194.49 192.52 13 208.00 190.74 198.71 217.17 195.72 194.60 195.06 194.65 195.49 205.56 14 224.00 212.74 207.15 203.45 15 189.91 214.99 223.53 216.65 215.55 222.81

16 229.00 228.74 236.65 236.77 233.72 226.29 233.06 232.65 233.49 244.22 17 249.00 233.74 241.65 241.77 238.72 245.16 243.65 249.00 233.81 237.18 18 257.00 253.74 257.00 256.94 258.72 258.98 256.97 257.65 258.49 263.82 19 253.00 261.74 269.65 269.77 266.72 263.66 266.06 265.65 271.83 271.82 20 283.00 257.74 282.98 284.10 262.72 269.16 283.00 261.65 267.83 265.91 21 282.00 287.74 282.15 278.45 264.95 271.51 282.01 291.65 292.49 282.00 22 298.00 286.74 284.56 294.77 291.72 290.60 291.06 290.65 296.83 297.77 23 305.00 302.74 297.15 293.45 310.28 307.92 286.13 306.65 295.53 306.18 24 383.00 309.74 317.65 317.77 314.72 313.58 314.06 313.65 314.49 324.56 25 388.00 387.74 382.15 378.45 382.68 387.66 388.85 391.65 390.55 388.00 26 390.00 392.74 390.56 400.77 397.72 394.65 397.06 396.65 397.49 408.22 27 434.00 394.74 402.65 422.03 419.81 406.16 466.88 422.30 434.00 398.18 28 421.00 438.74 433.15 429.45 415.92 424.15 412.03 442.65 443.49 406.91 29 441.00 425.74 423.56 433.77 430.72 431.24 430.06 429.65 428.56 439.42 30 466.00 445.74 440.15 454.84 470.81 431.52 466.00 449.65 450.49 448.52 31 478.00 470.74 478.65 478.77 475.72 468.42 474.98 474.65 475.49 480.83 32 500.00 482.74 490.65 490.77 487.72 492.98 492.66 486.65 500.00 486.10 33 493.00 504.74 512.65 512.77 509.72 509.98 493.05 508.65 509.49 507.52 34 509.00 497.74 495.56 505.77 502.72 499.65 507.66 501.65 507.85 513.22 35 499.00 513.74 508.15 524.86 497.61 499.52 497.13 517.65 516.55 511.79 36 495.00 503.74 501.60 491.85 508.72 507.60 508.06 507.65 508.49 518.56 37 496.00 499.74 496.00 495.90 504.74 486.81 506.56 503.65 496.00 497.79 38 491.00 500.74 491.00 491.01 477.91 478.99 497.45 504.65 505.49 491.00 39 520.00 495.74 501.68 509.19 500.72 499.60 521.40 520.00 495.68 509.64 40 526.00 524.74 519.15 515.45 501.92 512.20 522.93 526.00 526.00 526.00 41 530.00 530.74 528.56 538.77 535.72 534.60 535.06 498.61 535.49 508.84 42 535.00 534.74 542.65 542.71 539.72 540.07 518.13 562.30 535.00 538.18 43 547.00 539.74 547.65 549.23 544.72 544.98 549.66 543.65 544.49 547.00 44 553.00 551.74 559.65 552.30 556.72 555.02 558.85 555.65 553.00 556.08 45 560.00 557.74 565.65 565.77 562.72 556.49 561.69 561.65 562.49 572.56 46 583.00 564.74 572.65 572.77 569.72 569.98 574.63 568.65 574.83 568.18 47 602.00 587.74 595.65 602.00 592.72 590.96 601.39 591.65 592.49 597.82 48 622.00 606.74 614.65 614.77 611.72 602.46 611.06 610.65 616.83 622.22 49 613.00 626.74 634.65 634.77 631.72 631.98 636.66 630.65 636.83 630.18

50 638.00 617.74 615.56 625.77 622.72 629.16 627.66 621.65 617.81 633.22

Page 140: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

127Apéndice A1

Continuación Tabla A13: Pronóstico de Demanda del Mes 51 al 71. Mes Demanda [2,2,1,2,1] [5,2,1,2,1] [7,2,1,2,1] [2,3,1,2,1] [5,3,1,2,1] [7,3,1,2,1] [2,6,1,2,1] [5,6,1,2,1] [7,6,1,2,1]51 643.00 642.74 637.15 646.56 638.78 628.52 626.10 646.65 645.55 643.00 52 646.00 647.74 645.56 655.77 652.72 651.60 652.06 651.65 652.49 662.56 53 646.00 650.74 658.65 638.13 655.72 658.07 634.13 654.65 643.53 654.18 54 709.00 650.74 709.01 677.15 655.72 662.17 709.00 654.65 655.49 665.56 55 678.00 713.74 708.15 704.45 691.97 697.62 687.02 678.00 678.03 676.55 56 689.00 682.74 680.56 690.77 687.72 688.61 687.06 686.65 687.49 702.95 57 680.00 693.74 696.27 689.90 691.01 679.52 685.80 721.30 683.65 698.36 58 627.00 684.74 627.00 627.00 661.91 688.60 672.78 628.96 689.49 638.88 59 646.00 646.00 637.68 645.22 636.72 642.98 638.56 659.30 621.65 645.64 60 645.00 650.74 653.27 646.90 648.01 638.48 644.93 654.65 655.49 652.71 61 664.00 649.74 647.56 657.77 626.91 653.60 637.78 617.61 644.34 609.60 62 671.00 668.74 663.15 659.45 673.74 671.60 652.13 671.00 670.99 682.64 63 671.00 675.74 683.65 683.77 680.72 679.60 680.06 643.61 670.47 635.27 64 545.00 675.74 673.56 558.30 680.72 687.16 659.13 643.61 665.65 581.12 65 545.00 545.00 555.68 563.22 554.72 551.66 556.56 553.65 545.00 557.91 66 545.00 545.00 552.27 545.90 547.01 537.45 525.52 545.00 539.65 539.45 67 424.00 549.74 424.00 424.02 526.91 527.98 457.69 493.96 424.00 514.33 68 454.60 454.60 434.68 442.22 433.72 434.62 435.56 456.30 418.65 447.37 69 457.80 459.34 461.87 455.50 456.61 446.98 435.12 427.21 451.19 449.27 70 465.20 462.54 460.36 470.57 439.71 466.40 450.58 430.41 457.14 422.40 71 Pronóstico 469.94 477.85 458.78 474.93 475.18 453.33 437.81 459.85 483.84

Page 141: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

128Apéndice A1

Tabla A14: Pronóstico de Demanda del Mes 1 al 50. Mes Demanda [2,2,1,2,2] [5,2,1,2,2] [7,2,1,2,2] [2,3,1,2,2] [5,3,1,2,2] [7,3,1,2,2] [2,6,1,2,2] [5,6,1,2,2] [7,6,1,2,2]

1 112.00 2 99.00 3 117.00 4 127.00 117.32 118.05 118.19 5 132.00 127.36 128.36 128.62 127.17 127.40 130.74 6 140.00 132.29 133.21 133.42 132.35 132.94 136.38 7 161.00 140.30 141.19 141.39 140.27 140.73 144.23 8 167.00 161.38 162.37 162.63 161.22 161.57 164.93 161.02 160.96 160.91 9 172.00 167.34 168.35 168.60 167.35 167.95 171.38 167.29 167.66 167.94

10 181.00 172.27 173.09 173.26 172.34 172.93 176.37 172.27 172.60 172.85 11 181.00 181.31 182.22 182.43 181.23 181.59 184.94 181.17 181.35 181.49 12 185.00 181.23 181.91 182.04 181.28 181.77 185.30 181.25 181.55 181.78 13 186.00 185.23 185.69 185.76 185.21 185.53 188.57 185.26 185.59 185.84 14 208.00 186.21 186.68 186.75 186.16 186.36 188.87 186.15 186.32 186.44 15 224.00 208.38 209.35 209.61 208.09 208.11 208.28 208.14 208.27 208.37 16 229.00 224.39 225.37 225.64 224.32 224.89 228.37 224.26 224.59 224.84 17 249.00 229.32 230.31 230.54 229.36 229.97 233.38 229.27 229.61 229.86 18 257.00 249.38 250.36 250.62 249.29 249.80 253.31 249.19 249.41 249.57 19 253.00 257.35 258.35 258.61 257.34 257.92 261.38 257.25 257.56 257.79 20 283.00 253.17 253.46 253.49 253.35 253.95 257.38 253.29 253.67 253.94 21 282.00 283.39 284.37 284.63 283.04 282.91 280.92 283.18 283.38 283.52 22 298.00 282.32 283.35 283.60 282.35 282.95 286.38 282.27 282.63 282.89 23 305.00 298.34 299.28 299.51 298.34 298.91 302.37 298.29 298.65 298.92 24 383.00 305.33 306.33 306.58 305.28 305.78 309.33 305.21 305.45 305.64 25 388.00 383.41 384.37 384.64 383.16 383.39 385.80 383.15 383.29 383.40 26 390.00 388.40 389.37 389.64 388.37 388.98 392.38 388.30 388.68 388.96 27 434.00 390.23 390.84 390.95 390.37 390.98 394.38 390.30 390.68 390.96 28 421.00 434.40 435.37 435.64 434.05 433.94 432.53 434.12 434.22 434.27 29 441.00 421.27 422.33 422.58 421.37 421.98 425.38 421.30 421.68 421.96 30 466.00 441.33 442.15 442.32 441.33 441.91 445.35 441.30 441.68 441.96 31 478.00 466.40 467.37 467.64 466.15 466.34 469.52 466.11 466.21 466.29 32 500.00 478.38 479.37 479.64 478.37 478.98 482.38 478.29 478.67 478.94 33 493.00 500.39 501.37 501.64 500.36 500.96 504.38 500.30 500.68 500.96 34 509.00 493.22 494.07 494.25 493.36 493.97 497.38 493.21 493.45 493.64 35 499.00 509.32 510.16 510.34 509.23 509.61 512.63 509.27 509.61 509.86 36 495.00 499.14 499.44 499.48 499.27 499.73 503.31 499.28 499.64 499.91 37 496.00 495.07 494.34 494.11 495.18 495.41 497.20 495.23 495.52 495.72 38 491.00 496.17 496.03 495.97 495.92 495.48 492.28 496.15 496.29 496.40 39 520.00 491.12 490.79 490.68 491.08 491.03 490.80 491.01 490.95 490.91 40 526.00 520.39 521.36 521.63 519.94 519.57 516.40 520.13 520.26 520.35 41 530.00 526.36 527.37 527.63 526.34 526.93 530.38 526.16 526.35 526.51 42 535.00 530.26 531.04 531.19 530.36 530.96 534.38 530.24 530.53 530.74 43 547.00 535.26 536.01 536.15 535.22 535.58 538.91 535.09 535.14 535.17 44 553.00 547.33 548.29 548.52 547.19 547.48 550.52 547.12 547.21 547.29 45 560.00 553.31 554.27 554.50 553.30 553.81 557.34 553.29 553.66 553.94 46 583.00 560.30 561.18 561.37 560.30 560.81 564.32 560.22 560.50 560.70 47 602.00 583.39 584.37 584.63 583.21 583.55 586.82 583.16 583.34 583.48 48 622.00 602.39 603.37 603.64 602.35 602.94 606.38 602.27 602.61 602.86 49 613.00 622.39 623.37 623.64 622.37 622.97 626.38 622.29 622.66 622.93 50 638.00 613.18 613.83 613.95 613.37 613.98 617.38 613.28 613.64 613.91

Page 142: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

129Apéndice A1

Continuación Tabla A14: Pronóstico de Demanda del Mes 51 al 71. Mes Demanda [2,2,1,2,2] [5,2,1,2,2] [7,2,1,2,2] [2,3,1,2,2] [5,3,1,2,2] [7,3,1,2,2] [2,6,1,2,2] [5,6,1,2,2] [7,6,1,2,2]

51 643.00 638.37 639.33 639.57 638.15 638.32 639.12 638.17 638.35 638.47

52 646.00 643.35 644.36 644.62 643.30 643.84 647.37 643.29 643.66 643.93

53 646.00 646.25 646.92 647.05 646.35 646.95 650.38 646.29 646.67 646.94

54 709.00 646.20 646.50 646.54 646.21 646.55 649.77 646.24 646.53 646.75

55 678.00 709.41 710.37 710.64 708.94 708.55 705.39 708.94 708.75 708.60

56 689.00 678.15 679.28 679.52 678.37 678.98 682.38 678.30 678.68 678.96

57 680.00 689.13 688.33 688.09 689.34 689.91 693.31 689.23 689.48 689.66

58 627.00 680.12 680.14 680.11 679.91 679.45 676.39 679.91 679.67 679.49

59 646.00 626.95 626.15 625.84 627.27 627.72 631.13 627.25 627.56 627.79

60 645.00 646.11 645.18 644.89 645.82 645.24 642.14 646.07 646.06 646.01

61 664.00 645.27 646.23 646.44 644.84 644.28 641.15 644.82 644.44 644.17

62 671.00 664.36 665.33 665.57 664.26 664.71 668.13 664.26 664.58 664.83

63 671.00 671.34 672.35 672.60 671.31 671.85 675.36 670.97 670.85 670.77

64 545.00 671.22 671.79 671.89 671.34 671.93 675.38 670.84 670.49 670.23

65 545.00 544.94 544.15 543.84 545.36 545.97 549.38 545.28 545.65 545.92

66 545.00 544.95 544.15 543.84 544.82 544.24 541.14 544.81 544.42 544.15

67 424.00 545.18 545.25 545.24 544.82 544.24 541.14 544.81 544.43 544.15

68 454.60 423.94 423.15 422.84 424.35 424.94 428.38 424.29 424.66 424.93

69 457.80 454.57 453.75 453.44 454.42 453.84 450.74 454.41 454.02 453.75

70 465.20 458.15 459.16 459.43 457.62 457.04 453.94 457.61 457.22 456.95

71 Pronóstico 465.49 466.31 466.48 465.56 466.16 469.58 465.48 465.85 466.13

Page 143: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

130Apéndice A1

Tabla A15: Pronóstico de Demanda del Mes 1 al 50. Mes Demanda [2,2,2,1,1] [5,2,2,1,1] [7,2,2,1,1] [2,3,2,1,1] [5,3,2,1,1] [7,3,2,1,1] [2,6,2,1,1] [5,6,2,1,1] [7,6,2,1,1]

1 112.00 2 99.00 3 117.00 113.21 119.09 112.88 4 127.00 123.00 123.00 123.39 122.12 126.70 128.42 5 132.00 134.36 134.55 135.18 133.36 138.00 138.70 6 140.00 140.39 141.03 141.36 139.61 143.82 141.21 7 161.00 147.58 147.36 148.67 146.91 149.70 146.48 150.45 161.48 155.94 8 167.00 165.55 162.64 166.70 164.94 164.03 165.45 162.82 174.00 168.12 9 172.00 175.42 175.27 176.39 174.94 175.18 173.15 176.12 172.21 171.91

10 181.00 180.88 180.94 181.70 180.67 180.03 176.76 183.09 180.52 176.24 11 181.00 189.27 188.67 189.88 189.15 187.15 186.82 189.24 175.48 183.85 12 185.00 191.58 192.67 192.06 191.48 190.61 187.36 190.36 180.12 186.12 13 186.00 194.79 195.15 195.15 194.82 192.82 191.09 196.33 196.42 196.82 14 208.00 196.61 197.55 196.91 196.64 195.00 192.85 197.85 198.15 204.12 15 224.00 214.70 211.73 214.00 214.73 208.70 221.00 214.33 225.42 210.12 16 229.00 233.58 231.18 231.48 233.55 227.70 230.82 234.76 220.48 231.97 17 249.00 241.94 240.85 239.27 242.15 237.21 241.33 244.03 236.06 242.91 18 257.00 259.82 254.79 254.61 260.18 251.94 265.27 259.33 249.73 256.12 19 253.00 271.76 266.82 265.24 272.06 265.73 247.36 267.33 254.88 252.12 20 283.00 270.55 267.36 264.82 271.15 266.21 278.30 269.30 285.39 278.52 21 282.00 294.27 282.73 280.18 294.82 284.12 280.09 290.39 279.79 281.61 22 298.00 301.33 296.15 296.06 301.70 296.06 298.12 296.52 307.36 293.82 23 305.00 314.12 299.36 303.03 314.79 306.39 302.85 312.15 302.79 304.55 24 383.00 323.91 367.09 380.12 324.42 380.52 379.85 321.15 377.06 381.45 25 388.00 386.06 385.48 382.76 385.85 385.48 385.48 374.85 385.55 386.09 26 390.00 407.55 420.55 410.18 406.94 398.64 388.52 406.79 385.79 388.33 27 434.00 410.03 422.03 412.30 410.36 431.21 431.18 410.03 432.70 431.64 28 421.00 439.85 445.09 433.15 439.52 428.09 418.24 435.03 420.03 416.39 29 441.00 440.52 441.48 437.55 440.15 437.52 438.33 430.21 436.00 438.70 30 466.00 450.42 451.52 445.42 450.30 463.00 459.67 454.33 459.18 462.70 31 478.00 469.03 468.18 466.85 468.21 464.91 473.91 472.70 474.82 475.70 32 500.00 480.15 477.70 480.91 479.18 479.76 484.33 484.82 496.45 494.12 33 493.00 493.67 494.55 498.85 492.48 494.55 498.18 510.64 499.09 489.18 34 509.00 493.67 490.27 498.91 492.58 498.06 495.45 505.94 505.91 506.61 35 499.00 500.52 502.55 508.39 499.36 503.45 502.33 514.18 496.52 500.03 36 495.00 498.12 495.30 505.00 496.97 503.61 499.00 512.67 491.79 489.00 37 496.00 494.52 491.73 500.06 493.67 498.30 494.27 507.79 489.39 491.55 38 491.00 494.39 492.30 499.85 493.45 497.64 494.88 509.88 490.76 488.12 39 520.00 492.03 488.58 496.64 491.12 495.58 492.12 504.61 524.55 515.70 40 526.00 508.33 511.85 515.76 509.03 510.45 509.48 525.97 521.88 522.97 41 530.00 512.55 518.67 527.00 510.85 527.91 523.00 536.52 525.00 524.30 42 535.00 515.21 522.67 532.91 513.67 535.24 520.45 541.52 536.24 530.00 43 547.00 518.15 527.64 543.42 516.58 541.76 524.24 544.06 531.06 545.82 44 553.00 547.09 539.97 549.42 548.88 549.85 535.61 548.27 548.94 549.30 45 560.00 550.70 546.94 555.12 548.27 555.76 545.06 559.00 557.88 564.70 46 583.00 588.42 555.00 582.42 590.42 579.39 550.76 565.42 572.88 576.27 47 602.00 614.64 583.39 604.45 615.48 605.58 580.45 580.42 602.33 594.09 48 622.00 623.73 611.12 620.88 624.21 617.73 617.09 596.97 611.88 619.94 49 613.00 631.94 609.03 607.79 632.18 628.12 641.03 614.97 613.18 609.58 50 638.00 631.15 630.36 635.33 631.48 629.30 633.00 613.79 635.00 633.24

Page 144: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

131Apéndice A1

Continuación Tabla A15 Pronóstico de Demanda del Mes 51 al 71. Mes Demanda [2,2,2,1,1] [5,2,2,1,1] [7,2,2,1,1] [2,3,2,1,1] [5,3,2,1,1] [7,3,2,1,1] [2,6,2,1,1] [5,6,2,1,1] [7,6,2,1,1]51 643.00 637.61 618.73 640.45 637.76 634.88 646.91 623.45 618.88 638.70 52 646.00 641.15 641.82 649.91 641.09 641.09 641.88 631.94 619.67 641.67 53 646.00 642.39 641.82 653.58 642.36 642.67 660.85 637.09 643.61 640.27 54 709.00 642.64 690.64 658.03 642.64 643.15 660.45 639.82 678.21 704.45 55 678.00 657.33 688.91 681.64 656.61 658.82 673.64 670.15 679.79 673.58 56 689.00 655.03 665.94 688.64 654.39 661.21 684.55 671.33 679.06 684.55 57 680.00 655.27 636.70 676.21 654.88 658.70 678.36 672.27 673.67 675.73 58 627.00 654.09 614.88 622.64 653.61 658.52 622.94 664.48 616.94 622.91 59 646.00 635.94 657.48 654.52 635.30 643.76 640.64 629.06 617.94 642.09 60 645.00 641.03 635.03 640.03 641.27 639.39 637.73 637.67 655.42 640.88 61 664.00 642.36 688.67 658.18 642.30 643.00 659.42 635.15 648.12 659.67 62 671.00 647.12 673.97 657.15 646.91 647.73 666.18 652.97 677.94 666.64 63 671.00 650.24 666.67 666.73 649.85 652.67 666.67 664.15 674.15 666.67 64 545.00 650.76 591.76 541.58 650.42 653.67 541.48 657.18 619.33 542.06 65 545.00 539.79 544.00 541.45 538.18 541.39 540.27 541.48 541.42 541.48 66 545.00 525.09 538.36 481.48 541.36 541.55 541.42 541.48 538.67 541.45 67 424.00 525.09 538.36 481.48 523.48 421.36 532.67 421.27 422.42 421.27 68 454.60 463.94 449.48 451.67 464.45 451.67 453.48 451.67 451.52 451.67 69 457.80 459.24 459.85 455.06 460.00 460.36 455.03 454.85 454.18 454.79 70 465.20 466.82 463.79 464.55 466.09 465.30 469.73 462.18 461.91 462.18 71 471.50 471.61 468.67 470.27 471.06 469.97 475.79 486.45 468.03 469.12 Pronóstico 476.45 473.2158 476.27 475.7539 513.59 479.5061 504.98 351.7888 695.82

Page 145: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

132Apéndice A1

Tabla A16: Pronóstico de Demanda del Mes 1 al 50. Mes Demanda [2,2,2,1,2] [5,2,2,1,2] [7,2,2,1,2] [2,3,2,1,2] [5,3,2,1,2] [7,3,2,1,2] [2,6,2,1,2] [5,6,2,1,2] [7,6,2,1,2]

1 112.00 2 99.00 3 117.00 119.79 117.30 116.58 4 127.00 132.24 130.15 129.27 132.45 129.58 128.79 5 132.00 141.70 140.27 139.67 143.24 141.03 140.30 6 140.00 146.58 145.52 145.03 147.70 145.91 145.36 7 161.00 153.39 152.61 152.18 154.09 152.73 152.27 160.52 157.39 156.94 8 167.00 171.03 170.82 170.45 171.39 170.82 170.48 172.06 170.03 169.73 9 172.00 178.03 178.33 178.24 179.12 179.00 178.82 182.18 180.94 180.73

10 181.00 182.73 183.21 183.21 183.03 183.21 183.21 189.55 188.88 188.73 11 181.00 190.70 191.33 191.36 190.76 191.21 191.27 192.12 191.55 191.42 12 185.00 191.61 192.45 192.58 192.00 192.58 192.70 192.64 191.85 191.79 13 186.00 194.94 195.79 195.94 194.76 195.48 195.67 197.42 196.79 196.76 14 208.00 196.18 197.12 197.30 196.24 197.00 197.21 196.76 195.94 195.91 15 224.00 214.82 215.85 215.91 214.27 215.33 215.48 213.42 213.58 213.61 16 229.00 230.85 232.18 232.45 231.36 232.67 232.85 230.88 231.97 232.06 17 249.00 236.88 238.45 238.91 237.15 238.76 239.15 242.94 244.64 244.79 18 257.00 254.82 256.30 256.64 254.24 255.94 256.33 256.73 258.82 259.03 19 253.00 264.03 265.73 266.24 264.39 266.18 266.61 262.36 264.61 264.85 20 283.00 261.39 263.27 263.94 261.18 263.27 263.94 265.06 267.21 267.48 21 282.00 287.52 288.79 289.09 286.21 287.94 288.36 284.52 286.73 287.03 22 298.00 289.94 291.70 292.39 290.91 292.73 293.24 287.00 289.30 289.61 23 305.00 304.12 305.52 306.00 303.15 304.97 305.55 309.48 311.67 311.94 24 383.00 312.18 313.64 314.24 312.30 314.00 314.52 310.70 313.06 313.39 25 388.00 383.36 382.55 382.27 382.73 382.21 381.88 379.12 379.82 379.82 26 390.00 396.58 396.73 397.15 400.85 400.33 400.21 405.55 406.03 406.00 27 434.00 398.91 399.09 399.55 398.70 399.15 399.55 423.15 423.30 423.24 28 421.00 438.42 437.21 437.09 438.06 437.03 436.88 435.91 435.97 435.97 29 441.00 431.73 431.58 431.94 434.15 433.67 433.79 428.58 429.00 429.15 30 466.00 448.00 447.03 447.06 446.85 446.24 446.30 459.61 458.67 458.61 31 478.00 472.03 470.64 470.52 473.06 471.52 471.27 468.00 467.18 467.15 32 500.00 485.06 483.73 483.64 486.48 484.91 484.67 489.70 488.12 487.97 33 493.00 505.06 503.42 503.15 505.76 503.94 503.64 515.79 513.70 513.42 34 509.00 501.45 500.27 500.18 502.73 501.33 501.12 506.88 505.36 505.24 35 499.00 514.18 512.58 512.33 513.76 512.18 511.94 518.18 516.30 516.15 36 495.00 507.45 506.30 506.18 508.39 507.06 506.85 506.39 505.15 505.12 37 496.00 503.06 501.82 501.70 502.36 501.27 501.15 505.30 503.91 503.88 38 491.00 503.48 502.15 502.03 503.15 501.91 501.76 500.03 498.97 498.94 39 520.00 499.33 498.15 498.06 499.33 498.15 498.03 496.30 495.21 495.21 40 526.00 523.15 521.30 520.97 522.88 521.03 520.67 522.85 520.94 520.79 41 530.00 531.06 529.58 529.30 532.85 530.97 530.61 533.39 531.48 531.27 42 535.00 534.94 533.52 533.21 535.33 533.76 533.42 545.82 543.64 543.39 43 547.00 539.42 538.00 537.70 539.70 538.12 537.79 543.00 541.15 541.00 44 553.00 549.64 548.12 547.79 550.00 548.33 547.97 549.00 547.03 546.88 45 560.00 555.61 554.27 553.91 556.36 554.79 554.42 558.55 556.64 556.42 46 583.00 561.76 560.45 560.09 562.15 560.67 560.30 566.52 564.58 564.36 47 602.00 580.36 579.09 578.73 580.88 579.39 579.03 582.73 580.85 580.61 48 622.00 596.91 596.12 595.82 598.30 597.15 596.88 600.88 599.27 599.03 49 613.00 613.36 613.09 612.88 614.45 613.91 613.76 622.06 621.06 620.82 50 638.00 608.61 608.58 608.33 609.61 609.30 609.09 617.21 616.36 616.18

Page 146: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

133Apéndice A1

Continuación Tabla A16 pronóstico de Demanda del Mes 51 al 71 Mes Demanda [2,2,2,1,2] [5,2,2,1,2] [7,2,2,1,2] [2,3,2,1,2] [5,3,2,1,2] [7,3,2,1,2] [2,6,2,1,2] [5,6,2,1,2] [7,6,2,1,2]

51 643.00 625.82 625.97 625.88 625.30 625.42 625.36 628.76 628.27 628.15

52 646.00 631.52 632.21 632.12 632.70 633.15 633.18 630.09 630.09 630.03

53 646.00 634.03 634.88 634.82 634.09 634.85 634.88 640.03 640.39 640.39

54 709.00 634.27 635.18 635.15 634.21 635.06 635.06 636.73 637.27 637.33

55 678.00 675.97 678.76 679.70 675.79 678.82 679.85 672.39 675.03 675.27

56 689.00 661.12 664.00 664.24 663.64 666.30 666.88 666.88 669.61 669.88

57 680.00 665.76 668.42 668.91 663.70 666.67 667.09 678.00 681.30 681.67

58 627.00 660.82 663.36 663.70 660.82 663.42 663.88 652.52 654.73 655.00

59 646.00 623.88 625.06 624.79 622.79 624.00 623.76 620.24 621.00 621.09

60 645.00 632.64 633.21 633.18 629.61 630.52 630.39 623.79 624.94 625.09

61 664.00 633.58 634.48 634.42 634.39 635.09 635.12 616.30 617.33 617.42

62 671.00 646.55 647.85 648.00 646.27 647.61 647.82 650.27 651.82 652.06

63 671.00 652.82 654.67 654.88 653.48 655.27 655.61 657.52 659.64 659.91

64 545.00 653.39 655.36 655.58 653.36 655.33 655.67 657.24 658.97 659.15

65 545.00 561.45 562.15 561.94 560.79 561.58 561.27 566.03 566.55 566.52

66 545.00 549.00 547.70 547.39 541.33 541.33 541.15 528.61 528.97 528.94

67 424.00 549.00 547.70 547.39 549.03 547.64 547.30 500.36 501.94 501.88

68 454.60 446.58 447.91 448.94 446.48 448.12 449.06 448.21 449.36 449.45

69 457.80 460.27 458.94 458.85 452.39 452.79 453.24 454.85 454.97 455.03

70 465.20 466.36 465.39 465.45 468.06 466.85 466.73 425.15 426.03 426.27

71 471.50 473.15 472.03 472.00 473.15 472.09 472.06 482.67 480.94 480.79

Pronóstico 479.3897 478.20 478.1676 479.69 478.5033 478.40 493.3815 491.96 491.8227

Page 147: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

134Apéndice A1

Tabla A17: Pronóstico de demanda del Mes 1 al 50. Mes Demanda [2,2,2,2,1] [5,2,2,2,1] [7,2,2,2,1] [2,3,2,2,1] [5,3,2,2,1] [7,3,2,2,1] [2,6,2,2,1] [5,6,2,2,1] [7,6,2,2,1]

1 112.00 2 99.00 3 117.00 4 127.00 123.30 124.74 127.82 5 132.00 133.38 135.00 139.31 127.10 129.82 131.42 6 140.00 138.38 140.01 137.91 141.45 139.12 139.54 7 161.00 146.40 147.93 151.78 149.28 152.98 147.53 8 167.00 167.37 168.81 167.28 169.38 166.95 168.54 173.60 168.82 167.18 9 172.00 173.37 175.10 179.31 176.26 178.78 174.65 179.53 174.35 174.44

10 181.00 178.38 179.98 184.38 181.46 185.07 178.80 184.62 181.49 179.80 11 181.00 187.40 188.91 190.81 190.05 191.53 188.54 193.58 184.79 182.89 12 185.00 187.36 189.09 183.92 190.21 194.49 187.44 193.59 188.67 183.67 13 186.00 191.39 193.01 186.59 194.29 199.53 191.70 197.56 195.77 186.96 14 208.00 192.37 194.04 199.93 194.79 196.79 196.11 198.60 209.34 207.52 15 224.00 214.28 215.77 209.09 216.01 213.60 224.05 220.62 215.54 225.56 16 229.00 230.40 231.94 236.31 232.10 229.38 231.54 236.60 231.53 229.94 17 249.00 235.37 237.07 241.31 238.47 237.21 239.47 241.63 236.85 251.19 18 257.00 255.38 256.80 250.79 258.32 260.10 256.54 261.62 258.18 258.97 19 253.00 263.37 265.05 269.31 266.05 266.60 264.55 269.59 251.83 257.68 20 283.00 259.35 281.92 278.39 262.47 266.79 282.95 265.57 261.96 284.46 21 282.00 287.36 282.00 284.04 291.14 288.00 289.58 295.56 286.30 281.11 22 298.00 288.34 290.42 294.31 290.52 290.30 287.78 294.49 294.84 296.19 23 305.00 304.41 305.81 299.05 307.48 306.95 305.54 310.62 302.55 304.00 24 383.00 311.37 313.03 317.31 313.38 312.57 383.05 317.23 380.58 380.98 25 388.00 388.00 371.36 384.10 384.70 381.74 390.54 382.51 391.20 387.88 26 390.00 394.34 397.42 400.31 397.33 396.51 398.96 391.71 393.20 390.19 27 434.00 396.37 398.01 418.73 399.49 433.06 432.67 400.13 434.10 434.16 28 421.00 420.44 422.40 435.10 438.24 435.17 420.08 423.48 421.00 421.05 29 441.00 427.33 430.42 433.31 430.35 436.36 441.00 432.64 441.00 440.93 30 466.00 447.15 448.73 465.46 450.49 458.60 448.54 450.10 463.69 465.98 31 478.00 472.34 473.83 478.31 450.89 466.31 470.42 476.16 478.00 479.01 32 500.00 484.38 486.03 490.31 487.45 500.00 485.57 490.59 497.98 500.40 33 493.00 506.37 507.82 494.87 509.45 501.86 507.54 511.55 506.49 492.92 34 509.00 499.34 501.48 505.31 502.44 513.22 509.05 505.62 509.07 508.77 35 499.00 515.40 516.79 508.73 518.44 499.00 516.54 521.59 498.79 499.07 36 495.00 505.34 508.18 514.24 507.52 509.98 494.95 502.38 495.00 493.84 37 496.00 501.37 511.87 495.44 504.45 518.83 495.94 507.62 509.45 495.84 38 491.00 502.38 491.04 491.13 501.70 502.86 520.64 507.64 490.37 490.67 39 520.00 497.36 507.99 520.43 499.56 502.36 519.96 503.62 517.42 519.76 40 526.00 524.67 525.99 521.01 525.51 523.20 524.42 532.62 524.98 526.18 41 530.00 532.36 534.19 538.31 533.68 531.79 534.08 538.63 541.34 529.90 42 535.00 536.38 537.99 532.00 539.48 544.42 535.83 542.54 537.63 534.92 43 547.00 541.38 542.96 541.39 544.14 547.19 542.36 547.59 546.08 546.70 44 553.00 553.41 554.88 552.64 555.74 555.52 563.00 559.62 552.36 552.49 45 560.00 559.38 561.01 565.04 562.08 563.81 560.52 565.20 560.47 561.96 46 583.00 566.39 567.95 581.99 569.35 574.46 567.51 572.62 571.26 583.35 47 602.00 589.30 590.79 590.22 591.40 588.78 590.54 595.62 591.85 596.96 48 622.00 608.40 609.91 614.31 610.86 608.61 609.54 614.62 608.74 620.78 49 613.00 628.40 629.87 634.31 631.44 624.01 629.54 634.62 626.86 611.51 50 638.00 619.34 621.52 625.31 622.48 626.82 637.98 625.58 637.31 636.16

Page 148: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

135Apéndice A1

Continuación Tabla A17pronóstico de Demanda del Mes 51 al 71. Mes Demanda [2,2,2,2,1] [5,2,2,2,1] [7,2,2,2,1] [2,3,2,2,1] [5,3,2,2,1] [7,3,2,2,1] [2,6,2,2,1] [5,6,2,2,1] [7,6,2,2,1]51 643.00 643.56 645.72 639.44 647.35 649.90 645.54 650.62 642.89 642.97

52 646.00 649.36 651.17 655.31 649.14 647.88 648.65 648.51 646.00 645.33

53 646.00 652.38 654.00 671.89 655.48 658.22 635.21 658.62 651.47 644.61

54 709.00 652.37 709.21 710.36 655.19 659.88 696.68 658.07 712.08 710.68

55 678.00 678.08 697.36 710.18 693.00 707.73 678.02 719.95 677.71 677.94

56 689.00 684.33 690.60 690.31 687.44 699.85 686.93 685.66 688.21 688.52

57 680.00 695.40 686.34 686.85 698.49 680.00 682.44 690.91 680.06 679.89

58 627.00 686.34 627.00 627.00 636.23 682.35 626.90 624.64 627.01 627.08

59 646.00 633.33 646.35 645.96 636.49 645.83 648.19 639.61 646.00 646.01

60 645.00 647.96 643.28 643.67 640.31 650.24 650.42 646.20 645.03 644.90

61 664.00 651.35 653.24 657.31 663.99 643.12 649.71 657.62 664.06 664.07

62 671.00 670.37 671.79 665.06 673.39 677.35 671.54 671.26 667.44 671.01

63 671.00 677.37 679.06 683.31 679.40 678.43 679.29 683.63 671.14 670.93

64 545.00 677.36 679.07 545.65 680.46 545.07 549.70 545.06 545.02 545.05

65 545.00 551.33 545.00 545.06 554.49 545.00 545.00 546.89 545.00 545.00

66 545.00 544.15 542.24 545.00 552.71 545.00 544.89 543.40 545.00 545.01

67 424.00 551.37 424.00 424.00 424.26 424.00 424.03 424.48 423.99 424.00

68 454.60 430.33 454.46 454.58 454.59 454.80 454.48 436.46 454.50 454.64

69 457.80 457.78 451.83 452.27 451.46 457.80 459.02 456.53 457.76 457.79

70 465.20 464.15 466.10 470.11 464.79 454.16 462.22 465.14 465.14 465.23

71 Pronóstico 471.59 473.12 467.16 474.68 479.05 474.01 548.59 468.32 648.85

Page 149: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

136Apéndice A1

Tabla A18: Pronóstico de demanda del Mes 1 al 50. Mes Demanda [2,2,2,2,2] [5,2,2,2,2] [7,2,2,2,2] [2,3,2,2,2] [5,3,2,2,2] [7,3,2,2,2] [2,6,2,2,2] [5,6,2,2,2] [7,6,2,2,2]

1 112.00 2 99.00 3 117.00 4 127.00 121.77 121.77 121.77 5 132.00 131.77 131.77 131.77 127.67 127.58 127.56 6 140.00 136.77 136.77 136.77 141.30 141.28 141.28 7 161.00 144.77 144.77 144.77 146.40 146.33 146.31 8 167.00 165.77 165.77 165.77 165.09 165.01 165.00 164.44 163.54 163.44 9 172.00 171.77 171.77 171.77 174.28 174.22 174.21 182.63 173.90 173.72

10 181.00 176.77 176.77 176.77 181.82 181.81 181.81 187.48 180.47 180.29 11 181.00 185.77 185.77 185.77 186.17 186.08 186.07 193.36 184.66 184.53 12 185.00 185.77 185.77 185.77 186.98 186.90 186.89 194.87 185.73 185.58 13 186.00 189.77 189.77 189.77 191.05 190.97 190.96 200.36 190.79 190.62 14 208.00 190.77 190.77 190.77 190.06 189.96 189.95 199.86 189.44 189.31 15 224.00 212.77 212.77 212.77 211.15 211.06 211.05 218.41 211.22 211.10 16 229.00 228.77 228.77 228.77 228.51 228.44 228.43 238.61 228.86 228.71 17 249.00 233.77 233.77 233.77 239.88 239.90 239.91 240.88 238.55 238.37 18 257.00 253.77 253.77 253.77 256.07 256.02 256.01 260.64 254.53 254.39 19 253.00 261.77 261.77 261.77 263.18 263.11 263.10 269.06 261.33 261.19 20 283.00 257.77 257.77 257.77 263.45 263.45 263.45 270.91 262.12 261.93 21 282.00 287.77 287.77 287.77 286.20 286.12 286.10 293.47 285.77 285.64 22 298.00 286.77 286.77 286.77 287.19 287.11 287.10 294.81 286.22 286.08 23 305.00 302.77 302.77 302.77 308.85 308.87 308.87 311.95 308.27 308.06 24 383.00 309.77 309.77 309.77 309.23 309.14 309.13 315.16 308.10 307.98 25 388.00 387.77 387.77 387.77 385.24 385.20 385.19 366.98 385.26 385.15 26 390.00 392.77 392.77 392.77 399.57 399.65 399.66 395.23 399.61 399.40 27 434.00 394.77 394.77 394.77 414.84 415.83 416.01 372.74 410.76 410.55 28 421.00 438.77 438.77 438.77 435.61 435.54 435.53 427.09 432.49 432.43 29 441.00 425.77 425.77 425.77 430.02 430.00 430.00 430.99 426.58 426.43 30 466.00 445.77 445.77 445.77 454.42 454.53 454.55 455.63 455.22 454.96 31 478.00 470.77 470.77 470.77 465.52 465.45 465.44 465.84 464.48 464.42 32 500.00 482.77 482.77 482.77 488.45 488.47 488.47 484.98 486.81 486.62 33 493.00 504.77 504.77 504.77 509.98 509.99 509.99 514.29 510.19 509.98 34 509.00 497.77 497.77 497.77 502.57 502.56 502.55 504.91 499.04 498.90 35 499.00 513.77 513.77 513.77 517.14 517.10 517.09 521.66 515.45 515.28 36 495.00 503.77 503.77 503.77 502.98 502.88 502.86 497.08 502.17 502.03 37 496.00 499.77 499.77 499.77 502.91 502.85 502.84 509.24 501.79 501.61 38 491.00 500.77 500.77 500.77 496.52 496.42 496.40 500.59 497.10 496.99 39 520.00 495.77 495.77 495.77 494.19 494.08 494.06 502.39 493.74 493.63 40 526.00 524.77 524.77 524.77 521.18 521.10 521.08 533.22 522.96 522.83 41 530.00 530.77 530.77 530.77 530.22 530.14 530.13 539.86 530.20 530.07 42 535.00 534.77 534.77 534.77 542.10 542.16 542.17 534.61 540.69 540.51 43 547.00 539.77 539.77 539.77 540.44 540.35 540.34 548.12 538.69 538.57 44 553.00 551.77 551.77 551.77 551.35 551.26 551.23 554.62 549.69 549.58 45 560.00 557.77 557.77 557.77 558.70 558.63 558.61 565.55 559.08 558.91 46 583.00 564.77 564.77 564.77 567.12 567.06 567.05 574.39 566.32 566.15 47 602.00 587.77 587.77 587.77 587.13 587.05 587.03 594.06 586.58 586.46 48 622.00 606.77 606.77 606.77 608.05 607.99 607.98 614.93 607.47 607.33 49 613.00 626.77 626.77 626.77 632.14 632.15 632.15 636.34 631.23 631.04 50 638.00 617.77 617.77 617.77 624.52 624.56 624.56 630.48 621.91 621.72

Page 150: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

137Apéndice A1

Continuación Tabla A18 Pronóstico de demanda del Mes 51 al 71 Mes Demanda [2,2,2,2,2] [5,2,2,2,2] [7,2,2,2,2] [2,3,2,2,2] [5,3,2,2,2] [7,3,2,2,2] [2,6,2,2,2] [5,6,2,2,2] [7,6,2,2,2]51 643.00 642.77 642.77 642.77 644.66 644.59 644.58 645.17 642.50 642.36

52 646.00 647.77 647.77 647.77 645.84 645.74 645.73 641.91 645.36 645.23

53 646.00 650.77 650.77 650.77 657.01 657.03 657.04 662.28 656.13 655.93

54 709.00 650.77 650.77 650.77 651.50 651.41 651.39 657.14 650.76 650.60

55 678.00 713.77 713.77 713.77 708.20 708.15 708.14 700.32 708.15 708.09

56 689.00 682.77 682.77 682.77 689.46 689.50 689.51 686.10 689.12 688.91

57 680.00 693.77 693.77 693.77 706.84 707.16 707.23 674.26 704.09 703.88

58 627.00 684.77 684.77 684.77 676.49 676.42 676.41 653.81 674.41 674.41

59 646.00 631.77 631.77 631.77 637.70 637.66 637.66 642.29 634.86 634.68

60 645.00 650.77 650.77 650.77 641.16 641.09 641.08 630.99 644.97 644.85

61 664.00 649.77 649.77 649.77 634.94 634.98 634.98 650.64 636.68 636.72

62 671.00 668.77 668.77 668.77 671.52 671.47 671.46 667.04 674.48 674.28

63 671.00 675.77 675.77 675.77 675.48 675.39 675.38 688.76 676.10 675.97

64 545.00 675.77 675.77 675.77 680.76 680.74 680.73 637.78 676.98 676.87

65 545.00 549.77 549.77 549.77 561.26 561.41 561.44 548.96 557.13 556.91

66 545.00 549.77 549.77 549.77 538.42 538.32 538.30 540.46 537.07 537.08

67 424.00 549.77 549.77 549.77 512.05 512.28 512.29 441.70 519.60 519.78

68 454.60 428.77 428.77 428.77 437.98 438.02 438.03 456.09 441.48 441.22

69 457.80 459.37 459.37 459.37 445.71 445.67 445.66 455.74 451.09 451.05

70 465.20 462.57 462.57 462.57 428.41 428.70 428.72 438.08 430.71 431.00

71 Pronóstico 469.97 469.97 469.97 477.25 477.30 477.32 429.46 482.20 481.97

En el Capítulo 4 se encuentra a detalle el análisis de los resultados mostrados en este

apéndice.

Page 151: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

APÉNDICE A2

En esta sección, se muestra el análisis de residuos de manera gráfica para cada una de

las medidas de desempeño utilizadas en la construcción del modelo de RNA. Este

análisis es utilizado para la comprobación de los supuestos de los modelos de regresión.

En las Figuras A21, A22 y A23, las gráficas de la izquierda nos permitieron

comprobar el supuesto de una distribución normal en los residuos. Las de la derecha nos

llevaron a concluir que los residuos cumplen con el supuesto de independencia

estadística, pues no siguieron un patrón reconocido.

La Figura A21, corresponde al análisis de residuos del modelo de regresión de la

medida de desempeño S_Pred. La Figura A22 contiene el análisis de residuos

correspondiente al modelo de regresión para el MAE y la Figura A23 representa el

análisis de residuos para el del MSE.

138

Page 152: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

139 Apéndice A2

Residuo

Per

cent

il

50250-25-50

99.9

99

90

50

10

1

0.1

Valor Ajustado

Res

iduo

16012080400

50

25

0

-25

-50

Residuo

Frec

uenc

ia

40200-20-40-60

16

12

8

4

0

Orden de Observación

Res

iduo

604530150

50

25

0

-25

-50

Probabilidad Normal de los Residuos Residuos vs. Valores Ajustados

Histograma de los Residuos Residuos vs. Orden de los Datos

S_Pred

Figura A21: Gráficas para comprobación de normalidad e independencia estadística de

los residuos en el modelo de regresión de S_Pred.

.

Residuo

Per

cent

il

420-2-4

99.9

99

90

50

10

1

0.1

Valor Ajustado

Res

iduo

2015105

3.0

1.5

0.0

-1.5

-3.0

Residuo

Frec

uenc

ia

2.41.20.0-1.2-2.4

16

12

8

4

0

Orden de Observación

Res

iduo

604530150

3.0

1.5

0.0

-1.5

-3.0

Probabilidad Normal en los Residuos Residuos vs. Valores Ajustados

Histograma de los Residuos Residuos vs. Orden de los Datos

MAE

Figura A22: Gráficas para comprobación de normalidad e independencia estadística de

los residuos en el modelo de regresión del MAE.

Page 153: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

140 Apéndice A2

Residuo

Per

cent

il

3001500-150-300

99.9

99

90

50

10

1

0.1

Valor Ajustado

Res

iduo

8006004002000

200

0

-200

Residuo

Frec

uenc

ia

2001000-100-200

20

15

10

5

0

Orden de Observación

Res

iduo

604530150

200

0

-200

Probabilidad Normal de los Residuos Residuos vs. Valores Ajustados

Histograma de los Residuos Residuos vs. Orden de los Datos

MSE

Figura A23: Gráficas para comprobación de normalidad e independencia estadística de

los residuos en el modelo de regresión del MSE.

Observamos que los supuestos de normalidad e independencia estaban satisfechos,

sin embargo aún nos faltaba comprobar el supuesto de varianza constante, para ello

graficamos los residuos de cada uno de los metamodelos contra cada una de las variables

o factores de nuestro experimento. En nuestro caso las variables fueron: neuronas, lags,

escala, transformación y algoritmo.

En las Figuras A24, A25 y A26 se muestran las gráficas de residuos contra variables

para nuestras medidas de desempeño de S_Pred, MAE y MSE, respectivamente. A partir

del comportamiento de los residuos en estas gráficas, concluimos que nuestros modelos

de regresión cumplen con el supuesto de varianza constante en los residuos.

Page 154: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

141 Apéndice A2

Neuronas

Re

sid

uo

752

50

0

-50

Lags

Re

sid

uo

632

50

0

-50

Escala

Re

sid

uo

21

50

0

-50

Transformación

Re

sid

uo

21

50

0

-50

Algoritmo

Re

sid

uo

21

50

0

-50

Residuos vs. Neuronas Residuos vs. Lags

Residuos vs. Escala Residuos vs. Transformación

Residuos vs. Algoritmo

Figura A24: Gráficas de Residuos vs. Variables para la comprobación de igualdad de

varianza en los residuos del modelo de regresión de la S_Pred.

Page 155: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

142 Apéndice A2

Neuronas

Re

sid

uo

642

2

0

-2

LagsR

esi

du

o

65432

2

0

-2

Escala

Re

sid

uo

21

2

0

-2

Transformación

Re

sid

uo

21

2

0

-2

Algoritmo

Re

sid

uo

21

2

0

-2

Residuos vs. Neuronas Residuos vs. Lags

Residuos vs. Escala Residuos vs. Transformación

Residuos vs. Algoritmo

Figura A25: Gráficas de Residuos vs. Variables para la comprobación de igualdad de

varianza en los residuos del modelo de regresión del MAE.

Page 156: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

143 Apéndice A2

Neuronas

Re

sid

uo

752

200

0

-200

Lags

Re

sid

uo

632

200

0

-200

Escala

Re

sid

uo

21

200

0

-200

Transformación

Re

sid

uo

21

200

0

-200

Algoritmo

Re

sid

uo

21

200

0

-200

Residuos vs. Neuronas Residuals Versus Lags

Residuos vs. Escala Residuos vs. Transformación

Residuos vs. s Algoritmo

Figura A26: Gráficas de Residuos vs. Variables para la comprobación de igualdad de

varianza en los residuos del modelo de regresión del MSE.

Page 157: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

144 Apéndice A2

Una vez realizado el análisis de los residuos y habiendo comprobado los supuestos

bajo los cuales se desarrollaron los modelos, concluimos que los metamodelos eran

apropiados para describir el comportamiento de nuestras medidas de desempeño, así que

procedimos con la fase de optimización tomando como base los modelos encontrados

(metamodelos).

Como puede observarse, en este caso es fácil comprobar los supuestos, sin embargo

no siempre sucede de esta manera, así que es necesario recurrir a técnicas estadísticas

para llevar a cabo tal comprobación.

Page 158: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

APÉNDICE A3

En este apartado, podemos observar los resultados obtenidos al optimizar los modelos

de optimización resultantes en cada una de las medidas de desempeño.

Las soluciones indican el valor que toma cada uno de los parámetros en el modelo de

RNA. Recordemos que estamos utilizando los parámetros: neuronas, lags, escala,

transformación y algoritmo. De esta manera, el primer elemento de la solución indica la

cantidad de neuronas en la capa oculta, el segundo corresponde al número de lags, el

tercero al tipo de escala, el cuarto a la transformación y por último el algoritmo de

entrenamiento. Para una explicación más amplia de la codificación de las soluciones, se

puede recurrir al Capítulo 4.

Al tratarse de problemas de optimización no convexos, se utilizaron múltiples

soluciones iniciales para optimizar cada uno de los modelo. La primera columna de las

siguientes tablas, contiene las soluciones que fueron utilizadas como punto de inicio para

la realización de la optimización, en la segunda columna se muestra la solución final que

encontró el optimizador a partir de la solución inicial y por último, la tercera columna

contiene la evaluación de la solución final en la función objetivo. A continuación, se

muestran los resultados obtenidos en cada una de las medidas de desempeño.

145

Page 159: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

146 Apéndice A3

Tabla A31: Resultados de la optimización del MAE.

MAE

Solución Inicial

Solución Final

Valor Objetivo

2,2,1,1,1 2,2,1,1,2 13.730 5,3,1,1,1 7,6,2,2,1 3.295 7,6,1,1,1 7,6,2,2,1 3.295 2,2,2,2,2 7,6,2,2,1 3.295 5,3,2,2,2 7,6,2,2,1 3.295 7,6,2,2,2 7,6,2,2,2 3.295

Tabla A32: Resultados de la optimización del MSE.

Tabla A33: Resultados de la optimización de la B_Pred.

B_Pred Solución Inicial

Solución Final

Valor Objetivo

2,2,1,1,1 2,2,1,1,2 53.172 5,3,1,1,1 7,6,2,2,1 18.235 7,6,1,1,1 7,6,2,2,2 18.235 2,2,2,2,2 2,2,1,1,2 53.172 5,3,2,2,2 7,6,2,2,1 18.235 7,6,2,2,2 7,6,2,2,2 18.235

MSE Solución Inicial

Solución Final

Valor Objetivo

2,2,1,1,1 2,2,1,1,2 578.49 5,3,1,1,1 7,6,2,2,1 -47.87 7,6,1,1,1 7,6,2,2,1 -47.87 2,2,2,2,2 7,6,2,2,1 -47.87 5,3,2,2,2 7,6,2,2,1 -47.87 7,6,2,2,2 7,6,2,2,1 -47.87

Page 160: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

147 Apéndice A3

Tabla A34: Resultados de la optimización de la S_Pred.

S_Pred Solución Inicial

Solución Final

Valor Objetivo

2,2,1,1,1 2,2,1,1,2 91.737 5,3,1,1,1 7,2,2,2,1 48.535 7,6,1,1,1 7,6,2,2,1 6.183 2,2,2,2,2 2,2,1,1,2 91.737 5,3,2,2,2 7,2,2,2,1 48.535 7,6,2,2,2 7,6,2,2,1 6.183

Como puede observarse, existe una solución a la cual convergieron todas las medidas

de desempeño, tal solución es la (7,6,2,2,1). Esta solución nos indicó el mejor valor que

debían tomar los parámetros, para obtener un modelo de RNA con buen desempeño que

diera como resultados pronósticos confiables. Una descripción detallada se encuentra en

el Capítulo 4.

Page 161: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

APÉNDICE B1

A continuación se muestran los pronósticos que se obtuvieron para los siguientes

doce períodos en los modelos de RNAs construidos a partir de las combinaciones de los

parámetros lags y neuronas en el diseño de experimentos. En la Tabla B11 la primera y

segunda columna contienen el valor al cual fueron fijados los parámetros lags y

neuronas respectivamente, mientras que las columnas siguientes contienen el valor del

pronóstico para doce períodos adelante.

Tabla B11: Pronóstico de los modelos de RNAs experimentales, Serie 1.

Parámetros PRONÓSTICO

Lags Neuronas Mes 1 Mes 2 Mes 3 Mes 4 Mes 5 Mes 6 Mes 7 Mes 8 Mes 9 Mes 10 Mes 11 Mes 12

3 2 459 469 477 486 499 508 515 525 529 530 540 544

3 4 469 473 479 491 495 501 510 524 565 590 612 644

3 6 421 427 431 441 456 476 507 540 572 596 612 626

3 8 428 433 363 399 414 397 441 428 298 543 331 234

3 10 461 471 480 488 501 510 517 527 531 532 542 546

6 2 515 525 539 544 556 564 574 583 587 589 591 593

6 4 497 512 527 555 572 577 605 612 641 703 750 744

6 6 369 401 820 783 1,036 826 376 391 313 928 1,432 1,497

6 8 632 853 1,524 1,859 2,234 2,305 1,984 2,048 1,858 1,939 2,277 1,952

6 10 427 436 449 456 468 477 489 499 506 512 517 522

9 2 524 533 551 555 569 577 583 589 602 606 612 625

9 4 843 807 784 753 740 747 736 729 650 584 512 462

9 6 661 657 599 607 610 632 661 659 550 515 517 428

148

Page 162: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

149 Apéndice B1

Continuación Tabla B11: Pronóstico de los modelos de RNAs experimentales, Serie 1.

Parámetros PRONÓSTICO

Lags Neuronas Mes 1 Mes 2 Mes 3 Mes 4 Mes 5 Mes 6 Mes 7 Mes 8 Mes 9 Mes 10 Mes 11 Mes 12

9 8 452 460 472 477 491 500 508 518 523 525 530 536

9 10 522 386 332 260 757 383 828 704 640 905 323 1,549

12 2 526 539 561 568 582 589 598 610 635 640 650 654

12 4 617 675 741 793 871 897 944 961 982 950 947 873

12 6 464 478 487 493 505 512 521 533 540 543 551 549

12 8 464 478 487 493 505 512 521 533 540 543 551 549

12 10 464 478 487 493 505 512 521 533 540 543 551 549

15 2 586 595 604 617 625 633 638 634 647 652 672 683

15 4 471 482 490 504 512 519 535 543 548 557 562 559

15 6 471 482 490 504 512 519 535 543 548 572 562 559

15 8 471 482 490 504 512 519 535 543 548 557 562 559

15 10 471 482 490 504 512 519 535 543 548 557 562 559

Page 163: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

APÉNDICE B2

En esta sección, se muestra el análisis de residuos de manera gráfica para cada una de

las medidas de desempeño utilizadas en la construcción del modelo de RNA para el

análisis de la Serie 1. Este análisis es utilizado para la comprobación de los supuestos de

los modelos de regresión.

En la Figura B21 se muestran los resultados del análisis de residuos del modelo de

regresión de la medida de desempeño MSE_T, que corresponde al MSE de

entrenamiento. La Figura B22 contiene los resultados del análisis de residuos para el

modelo de aproximación del MSE_V o MSE de validación.

En la Figura B21 y en la Figura B22, las gráficas de la izquierda nos permiten

comprobar el supuesto de una distribución normal en los residuos. Las gráficas de la

derecha son utilizadas para comprobar la independencia estadística en los residuos. Se

dice que se cumple el supuesto de independencia siempre y cuando el comportamiento

de los residuos no siga algún patrón reconocido.

Para comprobar el supuesto de varianza constante, se utilizan las gráficas de residuos

contra variables. La Figura B23 muestra las gráficas correspondientes a los residuos de

las medidas de desempeño MSE_T y MSE_V contra los factores utilizados en el

experimento.

150

Page 164: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

151 Apéndice B2

Residuo

Per

cent

il

5002500-250-500

99

90

50

10

1

Valor ajustado

Res

iduo

2000150010005000

200

0

-200

-400

Residuo

Frec

uenc

ia

4002000-200-400

2.0

1.5

1.0

0.5

0.0

Orden de Observación

Res

iduo

987654321

200

0

-200

-400

Probabilidad Normal Residuos vs. Valor Ajustado

Histograma de los Residuos Residuos vs. Orden de los Datos

MSE_T

Figura B21: Gráficas de Residuos para el MSE_T, Serie 1.

Residuo

Per

cent

il

2001000-100-200

99

90

50

10

1

Valor Ajustado

Res

iduo

180015001200900600

200

100

0

-100

-200

Residuo

Frec

uenc

ia

2001000-100-200

2.0

1.5

1.0

0.5

0.0

Orden de Observación

Res

iduo

987654321

200

100

0

-100

-200

Probabilidad Normal Residuos vs. Valores Ajustados

Histograma de los Residuos Residuos vs. Orden de los Datos

MSE_V

Figura B22: Gráficas de Residuos para el MSE_V, Serie 1.

Page 165: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

152 Apéndice B2

Lags

Re

sid

uo

9.07.56.04.53.0

200

0

-200

-400

Neuronas

Re

sid

uo

65432

200

0

-200

-400

Lags

Re

sid

uo

9.07.56.04.53.0

200

100

0

-100

-200

Neuronas

Re

sid

uo

65432

200

100

0

-100

-200

Residuos vs. Lags( MSE_T)

Residuos vs. Neuronas(MSE_T)

Residuos vs. Lags(MSE_V)

Residuos vs. Neuronas(MSE_V)

Figura B23: Gráficas de residuos contra variables, Serie 1.

En las gráficas de las Figuras B21, B22 y B23 fue posible comprobar los supuestos

de independencia y varianza constante en los residuos, sin embargo el supuesto de

normalidad no se visualizó directamente de las gráficas de histogramas. Por esta razón

decidimos hacer una prueba formal de normalidad en los residuos. Los resultados de esta

prueba se muestran en la Figura B24.

En la Figura B24 se muestran los resultados de la prueba formal de normalidad en los

residuos para las dos medidas de desempeño utilizadas. A través de la prueba obtuvimos

el valor P que nos sirve para realizar la prueba de hipótesis en la cual se toma como

hipótesis nula que los residuos son normales y como hipótesis alternativa que no lo son.

Por esta razón, en esta prueba son deseables valores de P grandes que nos permitan

Page 166: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

153 Apéndice B2

concluir con cierto grado de significancia que se acepta la hipótesis nula. Se observó que

para ambos casos: MSE_T y MSE_V los valores de P están por encima de 0.15, así que

con un grado de significancia menor o igual a este valor P se concluye que los residuos

cumplen con el supuesto de normalidad.

Residuo

Pe

rce

nti

l

5002500-250-500

99

90

50

10

1

Residuo

Pe

rce

nti

l

3002001000-100-200-300

99

90

50

10

1

Media 7.7054E-13Desviación Estandard 221.0N 9KS 0.206 Valor P >0.150

Media -8.5265E-14Desviación Estandard 112.6N 9KS 0.093Valor P >0.150

MSE_T

MSE_V

Figura B24: Resultados del análisis formal de normalidad en los residuos, Serie 1.

El análisis de los residuos resultó satisfactorio, por lo tanto concluimos que los

metamodelos (modelos de regresión) para cada medida de desempeño eran adecuados y

de acuerdo a la metodología procedimos con la fase de optimización. Ésta fase se

describe en el Capítulo 4.

Page 167: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

APÉNDICE B3

Este apéndice contiene los pronósticos que se obtuvieron para los siguientes doce

períodos en los modelos de RNAs construidos a partir de las combinaciones de los

parámetros lags y neuronas en el diseño de experimentos, en el análisis de la serie 2. En

la Tabla B31, la primera y segunda columna contienen el valor al cual fueron fijados los

parámetros lags y neuronas respectivamente, mientras que las columnas siguientes

contienen el valor del pronóstico para doce períodos adelante.

Tabla B31: Pronóstico de los modelos de RNAs experimentales, Serie 2.

Puesto que se observó que el área experimental podía redefinirse para obtener

metamodelos más confiables, se desarrolló el nuevo experimento, los resultados están

contenidos en el Apéndice B4.

Parámetros PRONÓSTICO

Lags Neuronas Mes 1 Mes 2 Mes 3 Mes 4 Mes 5 Mes 6 Mes 7 Mes 8 Mes 9 Mes 10 Mes 11 Mes 12

3 2 104.66 108.00 115.00 122.00 129.00 134.81 140.58 146.85 154.29 157.00 164.00 170.00

3 4 104.65 108.00 117.00 123.00 131.00 135.00 141.13 145.36 154.40 157.00 168.00 175.00

3 6 76.97 79.40 83.00 86.00 90.00 93.06 96.74 100.53 100.96 100.00 104.00 107.00

4 2 76.12 80.20 82.00 84.20 86.30 89.89 93.82 96.63 97.21 101.00 101.00 99.30

4 4 101.59 106.00 110.00 114.00 120.00 130.01 140.85 150.66 162.12 173.00 190.00 193.00

4 6 76.12 80.20 82.00 84.20 86.30 89.89 93.82 96.63 97.21 101.00 101.00 99.30

6 2 48.40 51.00 53.40 57.10 62.50 66.89 67.83 70.10 84.95 99.40 108.00 111.00

6 4 79.42 81.50 83.30 86.60 90.40 94.28 96.75 99.82 99.83 99.90 99.90 102.00

6 6 79.42 81.50 83.30 86.60 90.40 94.28 96.75 99.82 99.83 99.90 99.90 102.00

154

Page 168: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

APÉNDICE B4

En este apartado se muestran los pronósticos que se obtuvieron para los siguientes

doce períodos en los modelos de RNAs construidos a partir de las combinaciones de los

parámetros lags y neuronas en el diseño de experimentos para la Serie 2, considerando

el experimento enfocado.

En la Tabla B41 la primera y segunda columna contienen el valor al cual fueron

fijados los parámetros lags y neuronas respectivamente, mientras que las columnas

siguientes contienen el valor del pronóstico para doce períodos adelante.

Tabla B41: Pronóstico de los modelos de RNAs experimentales, experimento enfocado

Serie 2.

Parámetros PRONÓSTICO

Lags Neuronas Mes 1 Mes 2 Mes 3 Mes 4 Mes 5 Mes 6 Mes 7 Mes 8 Mes 9 Mes 10 Mes 11 Mes 12

3 3 106.28 109.71 118.95 120.54 128.85 136.65 145.4 148.25 155.69 159.68 166.86 171.143 4 102.04 105.55 116.29 117.84 127.17 135.43 144.6 146.95 157.99 167.88 175.81 181.014 3 101.91 107.01 111.63 116.05 126.02 137.16 147.53 154.57 163.54 185.51 192.26 195.464 4 115.81 108.39 111.76 116.68 127.49 135.91 145.75 160.64 170.83 159.11 164.17 195.755 3 157.66 163.35 162.21 164.39 165.14 166.00 173.06 176.37 185.98 191.06 205.49 211.705 4 105.01 111.30 114.72 116.7 119.56 124.21 129.30 132.27 140.11 146.20 138.92 130.826 3 137.81 143.69 155.9 164.2 181.03 196.35 203.54 220.6 318.36 339.13 291.13 303.646 4 131.26 133.78 155.8 171.82 182.96 189.35 190.26 188.89 194.03 196.83 195.02 199.63

155

Page 169: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

APÉNDICE B5

En esta sección, se muestra el análisis de residuos de manera gráfica para cada una de

las medidas de desempeño utilizadas en la construcción del modelo de RNA. Este

análisis es utilizado para la comprobación de los supuestos de los modelos de regresión.

La Figura B51, B52 y B53 contienen las gráficas de residuos correspondientes a los

modelos de regresión que aproximan las medidas de desempeño MSE_T y MSE_V .En

la Figura B51 y en la Figura B52, las gráficas de la izquierda permiten la comprobación

del supuesto de normalidad, las de la derecha se utilizan para la comprobación del

supuesto de independencia estadística.

156

Page 170: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

157 Apéndice B5

Residuo

Per

cent

il

100-10

99

90

50

10

1

Valor Ajustado

Res

iduo

100908070

10

5

0

-5

Residuo

Frec

uenc

ia

12840-4-8-12

3

2

1

0

Orden de Observación

Res

iduo

87654321

10

5

0

-5

Probabilidad Normal Residuos vs. Valores Ajustados

Histograma de los residuos Residuos vs. Orden de los Datos

MSE_T

Figura B51: Gráficas de Residuos para el MSE_T, Serie 2.

Residuo

Per

cent

il

100500-50-100

99

90

50

10

1

Valor Ajustado

Res

iduo

500400300200

80

40

0

-40

-80

Residuo

Frec

uenc

ia

80400-40-80

2.0

1.5

1.0

0.5

0.0

Orden de Observación

Res

iduo

87654321

80

40

0

-40

-80

Probabilidad Normal Residuos vs. Valores Ajustados

Histograma de los Residuos Residuos vs. Orden de los Datos

MSE_V

Figura B52: Gráficas de Residuos para el MSE_V, Serie 2.

Page 171: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

158 Apéndice B5

Lags

Re

sid

uo

6543

10

5

0

-5

Neuronas

Re

sid

uo

43

10

5

0

-5

Lags

Re

sid

uo

6543

80

40

0

-40

-80

Neuronas

Re

sid

uo

43

80

40

0

-40

-80

Residuos vs. Lags( MSE_T)

Residuos vs. Neuronas( MSE_T)

Residuos vs. Lags(MSE_V)

Residuos vs. Neuronas(MSE_V)

Figura B53: Gráficas de residuos contra variables, Serie 2.

Para comprobar el supuesto de varianza constante, nos auxiliamos de las gráficas de

residuos contra factores. Estas gráficas se muestran en la Figura B53.

Analizando las gráficas de las Figuras B51, B52 y B53, concluimos que los supuestos

de independencia estadística y varianza constante en los residuos de los modelos de cada

medida de desempeño utilizada fueron cumplidos, sin embargo, a prueba de normalidad

no era muy clara en los histogramas. Hicimos una prueba formal de normalidad en los

residuos para asegurarnos que los metamodelos eran adecuados para describir nuestras

medidas de desempeño y de esta manera continuar con la metodología. En la Figura B54

se muestran los resultados obtenidos, la interpretación de los mismos es similar a la de la

Figura B23 del Apéndice B2. Pudo observarse que para un nivel de significancia menor

a 0.15 se concluye que los residuos cumplen con el supuesto de normalidad, para ambas

medidas de desempeño. Concluimos que los metamodelos son adecuados y proseguimos

con la metodología, se sugiere consultar el Capítulo 5.

Page 172: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

159 Apéndice B5

Residuo

Pe

rce

nti

l

151050-5-10-15

99

90

50

10

1

Residuo

Pe

rce

nti

l

100500-50-100

99

90

50

10

1

MSE_T

Media -2.1205E-14Desviación Estandard 6.128N 8KS 0.198Valor P >0.150

MSE_V

Media -6.2438E-13Desviación Estandard 44.53N 8KS 0.156Valor P >0.150

Figura B54: Resultados del análisis formal de normalidad en los residuos, Serie 2.

Page 173: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

APÉNDICE C

A continuación se presenta el Código fuente en lenguaje Matlab, que fue construido

para la instauración de la herramienta de toma de decisiones.

Los siguientes cuatro programas constituyen la columna vertebral del generador y

ejecutor del Diseño de Experimentos Factorial, posteriormente se muestra el código

utilizado para las inicializaciones múltiples.

Programa: Hacer_Experimento.m

Función:

Se encarga de generar y ejecutar un Diseño de Experimentos de tipo factorial,

considerando como factores el parámetro Lags y Neuronas.

Entradas:

1.-Conjunto de datos históricos (serie de tiempo)

2.-Posibles valores del parámetro lags

3.-Posibles valores del parámetro neuronas

4.-Nombre del archivo.xls donde se imprimiran los resultados del experimento

160

Page 174: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

161 Apéndice C

Código Fuente:

function Hacer_Experimento(info,lags,neuronas,archivo)

%Indica la cantidad de periodos que se desean pronosticar % Corresponde al número de neuronas en la capa de salida

periodos=12;

%Algoritmo de entrenamiento,(retropropagación del error)

alg='trainlm';

%Cardinalidad del conjunto de patrones que se utilizarán para validación

dim_v=15;

%Cantidad de actualizaciones de los pesos en la RNA

epocas=1200;

% Será utilizado como identificador de los archivos en los que se % almacenarán los modelo de RNA para cada combinación factorial

total=1;

%Obtención de la cantidad de niveles en cada factor

[nivel_l,y]=size(lags);

[nivel_n,r]=size(neuronas);

%Para asegurarse que la variable nivel_x tiene el número correcto de %niveles de la variable x

if nivel_l<y

nivel_l=y;

end

if nivel_n<r

nivel_n=r;

end

Page 175: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

162 Apéndice C

%Los resultados del experimento se van a almacenar en un archivo, éste %contendrá los valores que obtienen las medidas de desempeño así como los nombres de los archivos que contienen la información completa del %modelo de red correspondiente a la prueba. % Abre el archivo.xls para imprimir en el el resultado del experimento %Se imprimirá los valores específicos de cada Factor experimental

resultado=fopen(archivo,'a+')

if resultado==-1

printf('Error, no se pudo crear el archivo\n');

exit(1);

else

fprintf(resultado,'Experimento realizado con lags a %d niveles y neuronas a %d niveles\n',nivel_l,nivel_n);

fprintf(resultado,'\nLags\n')

fprintf(resultado,'%d\n',lags);

fprintf(resultado,'\nNeuronas\n')

fprintf(resultado,'%d\n',neuronas);

fprintf(resultado,'\nArchivo\t\tInicio\t\tLags\t\tNeuronas\t\tMSE_Training\t\tMSE_Validation\t\tMSE_RandomWalk\n');

fprintf(resultado,'\n');

fclose(resultado);

end

%Ciclo que se encarga de generar una a una las combinaciones factoriales %Fija el factor Lags y recorre el Factor neuronas

for i=1:nivel_l

%Llama la función que se encarga de generar las matrices que contendrán

Page 176: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

163 Apéndice C

%los patrones de entrenamiento y validación

[P,T,P_V,T_V,indices_v,indices_t,t]=seleccion(info,lags(i),periodos,dim_v);

%Ciclo para cambiar el valor del factor neuronas

for j=1:nivel_n

%Llama a la Función prediccion_m que se encarga de entrenar y validar un conjunto de RNAs utilizando diferentes inicializaciones en los pesos de las conexiones.

%Esta Función regresa la mejor de las RNAs creadas. %Selecciona como mejor RNA aquella con menor error de validación %Devuelve además, el valor del pronóstico, las medidas de desempeño %asociadas y un identificador para determinar el tipo de inicialización %utilizada.

[pos,forecast,MSE_RandomWalk,MSE_Training,MSE_Validation,mejor] = prediccion_m(info,P,T,P_V,T_V,lags(i),neuronas(j),epocas,alg,periodos);

%Selecciona la funcion de inicializacion

switch(pos)

case 1

inicio='initzero';

case 2

inicio='midpoint';

case 3

inicio='rands';

case 4

inicio='inicio_med1';

case 5

Page 177: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

164 Apéndice C

inicio='inicio_med2';

case 6

inicio='inicio_min';

case 7

inicio='inicio_max',

end

%Renombrar el archivo que contiene la información completa de la red que %generó estos resultados en las medidas de desempeño

nuevo_nombre=strcat(int2str(total),'.mat');

movefile(mejor,nuevo_nombre);

total=total+1;

%Imprime en el archivo.xls los resultados correspondientes

resultado=fopen(archivo,'a+');

if resultado==-1

printf('Error al accesar al archivo');

exit(1);

else

fprintf(resultado,'%s\t\t%s\t\t%d\t\t%d\t\t%.4f\t\t%.4f\t\t%.4f\t\t%.4f\t\t',nuevo_nombre,inicio,lags(i),neuronas(j),MSE_Training,MSE_Validation,MSE_RandomWalk,forecast);

fprintf(resultado,'\n');

end

fclose(resultado);

Page 178: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

165 Apéndice C

clear nuevo_nombre;

end

end

Programa: seleccion.m

Función:

Es utilizada para crear los patrones disponibles dependiendo de las observaciones

disponibles.

Los patrones son separados en dos conjuntos, uno de validación y otro de entrenamiento

para el diseño de una RNA.

El primero es seleccionado de manera aleatoria, de acuerdo a una distribución uniforme

sin reemplazo.

Entradas:

1.-observaciones: vector columna que contiene la serie de tiempo

2.-lags: cantidad de datos históricos

3.-periodos:cantidad de neuronas de salida (pronósticos)

4.-cantidad: cardinalidad de patrones de validación

Código Fuente:

function [P,T,P_V,T_V,posiciones_v,posiciones_t,t] = seleccion (observaciones,lags,periodos,cantidad)

%obtiene la cantidad de datos en la serie de tiempo

Page 179: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

166 Apéndice C

[n,m]=size(observaciones);

if m>n

n=m;

observaciones=observaciones';

end

%Para crear matrices temporales devuelve matriz de lagsXQ y 12XQ

temp_P=crear(observaciones(1:n-periodos,1),lags);

temp_T=crear(observaciones(lags+1:n,1),periodos);

[r,t]=size(temp_P);

%Crea un vector con las posiciones de los patrones que se utilizarán para %el conjunto de validación, de acuerdo a una distribución uniforme sin %reemplazo

validacion=randsample(t,cantidad);

validacion=sort(validacion);

posiciones_v=validacion';

c=1;

ban=0;

d=1;

%Se crean las matrices de los patrones de validación %P_V serán las entradas y T_V las salidas, juntos forman los patrones de %validación

P_V=temp_P(:,validacion);

T_V=temp_T(:,validacion);

Page 180: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

167 Apéndice C

%En el siguiente ciclo, se seleccionan de los patrones disponibles, %aquéllos que no forman parte del conjunto de validación

for i=1:t

if (c<=cantidad & i== validacion(c))

c=c+1;

ban=1;

end

if ban==0

P(:,d)=temp_P(:,i);

T(:,d)=temp_T(:,i);

posiciones_t(d)=i;

d=d+1;

else

ban=0;

end

end

t=n;

Programa: prediccion.m

Función:

Utiliza las matrices P y T definidas con anterioridad, esto es cuando ya se han elaborado

los valores estimados de las ultimas observaciones P es matriz de lagsx(n-lags) y T es

matriz de Periodosx(n-lags) Inicializa de 7 formas distintas los pesos de la red con cada

una de estas formas se entrena y valida la red. Luego se comparan todos los MSE_V para

regresar la red que tiene el menor de todos.

Page 181: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

168 Apéndice C

Considera caminata aleatoria para comparar los resultados

Entradas:

1.- info: incluye toda la informacion que incluye P, T, P_V y T_V

2.- lags: cuantos datos historicos se desean considerar para el pronostico

3.- neuronas: cuantas neuronas contendra la capa oculta de la red

4.- epocas: parametro de finalizacion del entrenamiento

5.- alg: algoritmo de entrenamiento

6.- periodos: horizontes de prediccion

Código Fuente:

function [pos,next,MSE_RandomWalk,MSE_T,MSE_V,mejor] = prediccion_m(info,P,T,P_V,T_V,lags,neuronas,epocas,alg,periodos)

%Estos arreglos de cadenas se utilizaran para almacenar cada uno de los %resultados de las redes creadas en archivos con diferentes nombres, aux2 %representa el tipo de inicializacion de pesos de la red, aux se utiliza %cuando se quieren realizar hasta 10 replicas con la misma inicializacion

aux={'11';'12';'13';'14';'15';'16';'17';'18';'19';'20'};

aux2={'cero';'midp';'rand';'med1';'med2';'_min';'_max'};

aux2=char(aux2);

aux=char(aux);

%Cálculo de MSE de Random Walk

MSE_RandomWalk=ErrorRandWalk(info)

Page 182: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

169 Apéndice C

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

% PREPROCESAMIENTO DE DATOS

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

%Obtencion del valor minimo y maximo de las observaciones

[x,y]=size(info)

minimo=min(info);

maximo=max(info);

%Aquí periodos indica cuantos se van a predecir en la red %Para obtener la informacion que realmente se utilizo al crear P y T

datas=info(:,1);

ultimos=zeros(periodos,1);

t=x;

%Los datos de la serie son escalados a [-1, 1], para futuras referencias

conjunto=2.*(datas-minimo)./(maximo-minimo)-1;

%El valor de t es para registrar en total cuantos datos considere para formar P y T.

clear info;

%Los elementos de las matrices de patrones de entrenamiento y validación %se escalan a [-1, 1]

P=2.*(P-minimo)./(maximo-minimo)-1;

T=2.*(T-minimo)./(maximo-minimo)-1;

P_V=2.*(P_V-minimo)./(maximo-minimo)-1;

Page 183: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

170 Apéndice C

T_V=2.*(T_V-minimo)./(maximo-minimo)-1;

for i=1:7

%El peor de los casos el MSE_V tendrá este valor

MSE_Val(1)=10000000000;

contador=1;

corrida=1;

switch(i)

case 1

inicio='initzero';

case 2

inicio='midpoint';

case 3

inicio='rands';

corrida=3;

case 4

inicio='inicio_med1';

case 5

inicio='inicio_med2';

case 6

inicio='inicio_min';

case 7

inicio='inicio_max',

Page 184: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

171 Apéndice C

end

actual=contador;

nombres(contador,:)=strcat(aux2(i,:),aux(contador,:));

nombres=char(nombres);

%Llama a la funcion que crea, entrena y valida una red de múltiples %salidas, indicando la inicialización de pesos, los patrones de %entrenamiento y validación así como el algoritmo de entrenamiento

[next_ind(contador,:),MSE_Val(contador),MSE_Train(contador)]=red_multiple(inicio,alg,nombres(contador,:),P,T,P_V,T_V,neuronas,periodos,t,epocas,minimo,maximo,conjunto,ultimos,datas,i);

min_next=min(next_ind(contador,:));

%Si los pronósticos obtenidos por la RNA no tienen sentido, es decir son %negativos, entonces se le pone al modelo de RNA correspondiente un valor %de MSE_V muy grande con el propósito de que no sea atractivo para la %selección del mejor modelo.

if min_next<0

MSE_Val(contador)=1000000000000;

end

contador=contador+1;

actual=contador-1;

cont=contador

%Para guardar en archivos con nombres que se utilicen para referenciar %posteriormente los archivos de las RNAs creadas, de acuerdo a la %inicialización utilizada. Así como las medidas de desempeño obtenidas %en cada RNA para posteriormente obtener la mejor de ellas.

[chico,pos]=min(MSE_Val);

Page 185: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

172 Apéndice C

for e=1:contador-1

nombre=strcat(nombres(e,:),'.mat');

if e~= pos

delete (nombre);

else

mejores(i,:)=nombre;

MSE_Training(i)=MSE_Train(e);

MSE_Validation(i)=MSE_Val(e);

forecast(i,:)=next_ind(e,:);

end

clear nombre;

end

clear nombres MSE_Val MSE_Train next_ind;

end %Cierra for

%Para obtener la red que tuvo el MSE_Validation mas pequeño de todas %las inicializaciones, esa es la informacion que regresa esta función %Una RNA con mejor desempeño,los valores del MSE_T y MSE_V, el %pronóstico y el tipo de inicialización utilizada en esa RNA

[menor,pos]=min(MSE_Validation);

for e=1:i

nombre=mejores(e,:);

nombre=char(nombre);

if e~= pos

delete (nombre);

Page 186: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

173 Apéndice C

else

mejor=nombre;

MSE_T=MSE_Training(e);

MSE_V=MSE_Validation(e);

next=forecast(e,:);

end

clear nombre;

end

clear mejores MSE_Training MSE_Validation forecast e menor;

Programa: red_multiple.m

Función:

Crea una red neuronal para prediccion de multiples periodos, inicializa los pesos de

manera sistemática, entrena, valida y predice.

Almacena los resusltados del modelo de RNA en un archivo.m

Regresa el pronóstico y el valor de las medidas de desempeño MSE_V y MSE_T.

Entradas:

1.- Inicio: indica que función de inicialización de pesos va a utilizar para crear el modelo de RNA.

2.- alg: Corresponde al algoritmo de entrenamiento

3.- nombre del archivo donde almacenará los resultados.

4.-Matrices P, T, P_V y T_V que contienen patrones de entrenamiento y

Page 187: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

174 Apéndice C

patrones de validación del modelo.

5.- Otros que ayudan al funcionamiento de la función.

Esta función es utilizada por la función prediccion_m

Código Fuente:

function [next,MSE_Validation,MSE_Training] = red_multiple(inicio,alg,nombre,P,T,P_V,T_V,neuronas,periodos,t,epocas,minimo,maximo,conjunto,ultimos,datas,ind)

%calcular las dimensiones de P

[m,n]=size(P);

%Creacion de indices para identificar las observaciones

lags=m;

i=1:lags;

total=1:t;

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

%DEFINICION DE LA RED

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

%Define una RNA feedforward con retropropagación

red=newff(minmax(P),[neuronas,periodos],{'tansig','purelin'},alg);

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

Page 188: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

175 Apéndice C

%INICIALIZACION DE LOS PESOS DE LAS CONEXIONES

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

red.initFcn='initlay';

%%%%%%%%%%%

%Para que llame a la función inicio que se encargará de colocar los %valores iniciales en las conexiones de la RNA

red.layers{1}.initFcn='initwb';

red.layers{2}.initFcn='initwb';

%Inicializa los pesos, de acuerdo a la función que se indica por ‘inicio’

red.inputWeights{1,1}.initFcn=inicio;

red.layerWeights{2,1}.initFcn=inicio;

red.biases{1}.initFcn=inicio;

red.biases{2}.initFcn=inicio;

red=init(red);

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

% ENTRENAMIENTO

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%====================================

% Definición de Criterios de parada

%====================================

%Por número de épocas o actualizaciones de los pesos

Page 189: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

176 Apéndice C

red.trainParam.epochs =epocas;

%Por alcanzar la aproximación deseada

red.trainParam.goal =1e-5;

%Llama a la función train para entrenar la red, recibe la matriz de entrada %y la matriz de valores target.

red=train(red,P,T);

%Simulacion utilizando el conjunto de entrenamiento

a=sim(red,P);

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

%POSTPROCESAMIENTO DEL CONJUNTO DE ENTRENAMIENTO Y DEL %RESULTADO DE LA SIMULACION

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

%Transformación inversa para regresar los datos a su escala natural

P=minimo+.5.*(P+1).*(maximo-minimo);

A=minimo+.5.*(a+1).*(maximo-minimo);

T=minimo+.5.*(T+1).*(maximo-minimo);

%======================================

% OBTENCION DE ERROR DE ENTRENAMIENTO

%======================================

Page 190: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

177 Apéndice C

%Cálculo de la matriz de errores

Errors=T-A;

%Obtencion del MSE del conjunto de entrenamiento

MSE_Training=MSE(Errors)

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

% VALIDACIÓN

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

validacion=sim(red,P_V);

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

% POSTPROCESAMIENTO DEL CONJUNTO DE VALIDACION

% Y DEL RESULTADO DE LA SIMULACION

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

%Transformacion inversa para regresar los datos a su escala natural

P_V=minimo+.5.*(P_V+1).*(maximo-minimo);

V=minimo+.5.*(validacion+1).*(maximo-minimo);

T_V=minimo+.5.*(T_V+1).*(maximo-minimo);

%======================================

% OBTENCION DE ERROR DE VALIDACION

Page 191: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

178 Apéndice C

%======================================

%Cállculo de la matriz de errores

Errors_V=T_V-V;

%Obtencion del MSE del conjunto de entrenamiento

MSE_Validation=MSE(Errors_V)

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

% OBTENCION DE MATRICES DE PESOS FINALES

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

%Pesos que unen las entradas con las neuronas de la capa oculta

W1_red=red.IW{1,1};

%Bias de la capa oculta

B1_red=red.b{1,1} ;

%Pesos que van de la capa oculta (1) a la capa de salida (2)

W2_red=red.LW{2,1} ;

%Bias de la capa de salida

B2_red=red.b{2,1};

%Considera las ultimas lags observaciones para predecir los siguientes %periodos;

nuevos=conjunto(t-lags+1:t,1)

%Predice los siguientes y los guarda en next

next=sim(red,nuevos);

Page 192: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

179 Apéndice C

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

%POST-PROCESAMIENTO DEL PRONÓSTICO

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

next=minimo+.5.*(next+1).*(maximo-minimo);

err_p=ultimos-next;

MSE_Pred1=MSE(err_p);

clear ind d ;

save (nombre);

A continuación se presenta la información correspondiente a las funciones de

inicialización que fueron creadas para inicializar los pesos de las conexiones de la RNA

de manera sistemática.

Funciones De Inicialización De Pesos

Los siguientes programas son el código de las funciones de inicialización de pesos que fueron utilizadas en la construcción de las RNAs

Inicialización de los pesos en 0.

Se utilizó la función initzero que viene incluida en Matlab

Inicialización en un punto medio en el intervalo [-1,1].

Se utilizó la función midpoint que viene en Matlab

Page 193: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

180 Apéndice C

Inicialización aleatoria en el intervalo [-1, 1].

Se utilizó la función rands que viene en Matlab

Inicialización de pesos en -0.5.

function w= inicio_med1(s,pr)

%Funcion de inicializacion de los pesos de las conexiones de la red %Inicializa en - 0.05

if nargin < 1, error('No hay argumentos de entrada'), end

if nargin == 1

w =rand(s,1).*0-0.5; % <-- colocamos nuestros propios valores iniciales, vector de pesos

else

r = size(pr,1); % <-- propios valores en caso de ser una matriz de pesos

w = rand(s,r).*0-0..5;

end

Inicialización de pesos en 0.5.

function w= inicio_med2(s,pr)

%Funcion de inicializacion de los pesos de las conexiones de la red %Inicializa en 0.5

if nargin < 1, error('No hay argumentos de entrada'), end

if nargin == 1

w =rand(s,1).*0+0.5; % <-- colocamos nuestros propios valores iniciales, vector de pesos

else

r = size(pr,1); % <-- propios valores en caso de ser una matriz de pesos

Page 194: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

181 Apéndice C

w = rand(s,r).*0+0..5;

end

Inicialización de pesos en -1.

function w= inicio_min(s,pr)

%Funcion de inicializacion de los pesos de las conexiones de la red %Inicializa en -1

if nargin < 1, error('No hay argumentos de entrada'), end

if nargin == 1

w =rand(s,1).*0 -1; % <-- colocamos nuestros propios valores iniciales, vector de pesos

else

r = size(pr,1); % <-- propios valores en caso de ser una matriz de pesos

w = rand(s,r).*0 -1;

end

Inicialización de pesos en 1.

function w= inicio_max(s,pr)

%Funcion de inicializacion de los pesos de las conexiones de la red %Inicializa en 1

if nargin < 1, error('No hay argumentos de entrada'), end

if nargin == 1

w =rand(s,1).*0+1; % <-- colocamos nuestros propios valores iniciales, vector de pesos

else

r = size(pr,1); % <-- propios valores en caso de ser una matriz de pesos

Page 195: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

182 Apéndice C

w = rand(s,r).*0+1;

end

Los programas que se presentan en este Apéndice son los que utilizamos en el

desarrollo de la metodología del Capítulo 3 para crear una RNAs con múltiples salidas.

Se sugiere ver resultados en el Capítulo 5.

Page 196: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN - PISISpisis.fime.uanl.mx/ftp/pubs/thesis/msc/2005-angelica_salazar/tesis... · Maestro en Ciencias en Ingeniería de Sistemas. ... 1.5. Hipótesis

AUTOBIOGRAFÍA

 

MARÍA ANGÉLICA SALAZAR AGUILAR 

Candidata para el grado de maestro en Ciencias en Ingeniería de Sistemas

Universidad Autónoma de Nuevo León

Facultad de Ingeniería Mecánica y Eléctrica

Tesis

“PRONÓSTICO DE DEMANDA POR MEDIO DE REDES NEURONALES  

ARTIFICIALES (RNAs) EN LA INDUSTRIA DE TELECOMUNICACIONES”

Nacida en Querétaro, Querétaro. Hija primogénita del Sr. J. Guadalupe Salazar

Galindo y la Sra. Consuelo Aguilar Cárdenas. Graduada en el Instituto Tecnológico de

Querétaro como Ingeniero en Sistemas Computacionales (1999-2003). Participó en el

XIII Verano de Investigación Científica organizado por la Academia Mexicana de

Ciencias, durante este período trabajó en la FIME de la UANL en el PISIS bajo la tutela

del Dr. Roger Z. Ríos Mercado. Inició sus estudios de Maestría en Ciencias en

Ingeniería de Sistemas en Enero de 2004 con el apoyo del PISIS y una beca de

manutención otorgada por el CONACYT. En Septiembre de 2005 realizó una estancia

de intercambio académico en la Ohio State University en colaboración con el Dr.

Mauricio Cabrera Ríos y el Dr. José M. Castro.

183