modelizaciÓn estadÍstica: de las series de tiempo a la

30
Metodología de Investigación de Futuros Modelización Estadística 517 MODELIZACIÓN ESTADÍSTICA: DE LAS SERIES DE TIEMPO A LA SIMULACIÓN por: The Futures Group TRADUCCIÓN AL ESPAÑOL: ESCENARIOS Y ESTRATEGIA - EyE TRADUCTOR: EDUARDO RAÚL BALBI, Director de EyE LENGUAJE TÉCNICO (versión en español): EDUARDO RAÚL BALBI, Director de EyE BUENOS AIRES - ARGENTINA – 2004 –ISBN: 987-98351-1-5 Esta traducción corresponde a la Sección Nº 13 de la publicación “Futures Research Methodology, Version 1.0”, de Jerome C. Glenn, Editor, publicada por el Millennium Project del American Council for the United Nations University, Washington, USA, 1999. ISBN: 0-9657362-2-9, en formato electrónico (CD). Hechos los registros y depósitos que marca la Ley. Todos los derechos reservados. Prohibida su reproducción, copiado, fotocopiado o duplicación total o parcial sin la autorización expresa del editor. Las impresiones totales o parciales efectuadas por los propietarios de este CD quedan comprendidas en las restricciones de duplicación y circulación mencionadas. El contenido de este CD puede ser utilizado como referencia, citas o apoyatura bibliográfica, siempre que se explicite en todos los casos la fuente. Buenos Aires, Argentina, 2004

Upload: others

Post on 04-Jul-2022

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: MODELIZACIÓN ESTADÍSTICA: DE LAS SERIES DE TIEMPO A LA

Metodología de Investigación de Futuros Modelización Estadística

517

MODELIZACIÓN ESTADÍSTICA:

DE LAS SERIES DE TIEMPO A LA SIMULACIÓNpor:

The Futures Group

TRADUCCIÓN AL ESPAÑOL:ESCENARIOS Y ESTRATEGIA - EyE

TRADUCTOR:EDUARDO RAÚL BALBI, Director de EyE

LENGUAJE TÉCNICO (versión en español):EDUARDO RAÚL BALBI, Director de EyEBUENOS AIRES - ARGENTINA – 2004 –ISBN: 987-98351-1-5

Esta traducción corresponde a la Sección Nº 13 de la publicación “Futures Research Methodology,Version 1.0”, de Jerome C. Glenn, Editor, publicada por el Millennium Project del American Councilfor the United Nations University, Washington, USA, 1999. ISBN: 0-9657362-2-9, en formatoelectrónico (CD).

Hechos los registros y depósitos que marca la Ley. Todos los derechos reservados.Prohibida su reproducción, copiado, fotocopiado o duplicación total o parcial sin laautorización expresa del editor.

Las impresiones totales o parciales efectuadas por los propietarios de este CD quedancomprendidas en las restricciones de duplicación y circulación mencionadas.

El contenido de este CD puede ser utilizado como referencia, citas o apoyatura bibliográfica,siempre que se explicite en todos los casos la fuente.

Buenos Aires, Argentina, 2004

Page 2: MODELIZACIÓN ESTADÍSTICA: DE LAS SERIES DE TIEMPO A LA

Metodología de Investigación de Futuros Modelización Estadística

518

PÁGINA EN BLANCO

Page 3: MODELIZACIÓN ESTADÍSTICA: DE LAS SERIES DE TIEMPO A LA

Metodología de Investigación de Futuros Modelización Estadística

519

ÍNDICE

AGRADECIMIENTOS

I. HISTORIA

II. EXPLICACIÓN Y CÓMO HACERLOAnálisis de la Serie de Tiempo

Montaje de la curvaMétodos de ponderaciónSuavizamiento exponencial

Análisis explicativo o casualAnálisis de regresión múltiple-

Análisis de regresión anticipadaAnálisis de regresión polinómicaAnálisis de autocorrelaciónEcuaciones simultáneasInput - outputModelización de la simulación

III. FORTALEZAS Y DEBILIDADESMayores fortalezas de la RegresiónMayores limitaciones de la Regresión

IV. FRONTERAS

BIBLIOGRAFÍA

APÉNDICE: QUIÉN ESTÁ HACIÉNDOLO

Page 4: MODELIZACIÓN ESTADÍSTICA: DE LAS SERIES DE TIEMPO A LA

Metodología de Investigación de Futuros Modelización Estadística

520

PÁGINA EN BLANCO

Page 5: MODELIZACIÓN ESTADÍSTICA: DE LAS SERIES DE TIEMPO A LA

Metodología de Investigación de Futuros Modelización Estadística

521

AGRADECIMIENTOS

El editor gerente desea agradecer a los críticos de este papel quehicieron muchas sugerencias y contribuciones importantes: Peter Bishop de laUniversidad de Houston, Graham Molitor presidente de Pubilc Policy ForecastingInc. y vice-presidente de la Sociedad Mundial del Futuro, Stephen Sapirie de laOrganización Mundial de la Salud. Y finalmente, especial agradecimiento a NedaZawahri para apoyo al proyecto, Barry Bluestein por la investigación y operacióninformática, y Sheila Harty por la corrección final de este documento. Gracias atodos por sus contribuciones.

Page 6: MODELIZACIÓN ESTADÍSTICA: DE LAS SERIES DE TIEMPO A LA

Metodología de Investigación de Futuros Modelización Estadística

522

PÁGINA EN BLANCO

Page 7: MODELIZACIÓN ESTADÍSTICA: DE LAS SERIES DE TIEMPO A LA

Metodología de Investigación de Futuros Modelización Estadística

523

I. HISTORIA

La modelización estadística asume que la información contenida endatos históricos puede extraerse, puede analizarse, y puede reducirse a una omás ecuaciones que pueden usarse para reproducir modelos históricos. Lastécnicas usan la matemática de estadísticas para profundizar el conocimiento de lacausalidad en sistemas complejos.

Una ecuación o conjunto de ecuaciones pueden reproducir la línea detiempo histórica de una variable, por ejemplo, la población. De esta manera,cuando una fecha anterior se usa en una ecuación que describe población, larespuesta generada estará muy cerca de la población real que existe en estemomento. Para prever "la población futura," simplemente sustituimos una fechafutura en la misma ecuación. Este método, sin embargo, tiene algunas seriasimplicaciones:

• Toda la información necesaria para pronosticar aspectos del futurodeseados, está contenida en datos históricos selectivos;

• La estructura del modelo reproduce válidamente la estructura de la vida realdel sistema que dio lugar a los datos históricos;

• La estructura continua del sistema que dio lugar a los datos históricos seráinmutable; y

• Son utilizados pronósticos determinísticos (es decir, una sola posibilidad).

Estas implicaciones son claramente causa de preocupación. Se hanintroducido nuevos métodos intentando prevenir algunos de estos problemas (verAnálisis de Impactos de Tendencia). Los métodos de pronósticos estadísticos sonsumamente útiles e importantes para la investigación futuros. Ellos puedenprofundizar en la comprensión de las fuerzas que formaron la historia. Tambiénpueden proporcionar una previsión básica libre-de-sorpresas (por ejemplo,"suponga las cosas siguen desarrollándose como lo hicieron en el pasado. . ".)para pensar sobre lo que podría cambiar en el futuro.

Los métodos de modelización estadística incluyen1

• análisis de series de tiempo; 1 Theodore J. Gordon, "Los Métodos de Investigación del Entregas a plazo," Los Anales de laAcademia americana, julio de 1992

Page 8: MODELIZACIÓN ESTADÍSTICA: DE LAS SERIES DE TIEMPO A LA

Metodología de Investigación de Futuros Modelización Estadística

524

• análisis de regresión;

• los modelos de multi-ecuación (por ejemplo, en econometría); y

• la modelización de simulación

El análisis de las series de tiempo se refieren a los métodosmatemáticos utilizados para capturar datos de tendencia. Estos métodos puedenser simples o complejos. Los más simples intentan trazar una curva a través delos datos históricos, lo que en cierto modo minimiza el error entre la curva y losdatos. La curva puede ser una línea recta o una línea curvada. Los procesosestadísticos se usan para trazar la línea a través de los puntos de los datos. Si eltrabajo es bueno, la curva puede extenderse en el futuro para producir unpronóstico.

El valor de algunas variables puede depender de otros factores ademásdel tiempo. Por ejemplo, el tamaño de una población puede ser dependiente denumerosas variables, como el número de mujeres jóvenes en la población hace unaño, su educación, o el ingreso personal. Pueden construirse modelos querelacionan un factor, como población, a otras variables de ingreso, comoeducación o el ingreso personal, usando un método conocido como análisis deregresión. En el análisis de regresión, el asunto bajo estudio—la población—es "lavariable dependiente," y los factores vinculados dentro de las ecuaciones son las"variables independientes." Las ecuaciones de regresión pueden ser lineales ypueden involucrar algunas variables independientes, o puede ser no lineal opolinómica y puede involucrar muchas variables. Pueden escribirse ecuaciones deregresión para las series de tiempo, o ellas pueden ser "transversales (o decorte)." Es decir, escrito para representar la relación entre las variablesindependientes y los momentos en el tiempo.

A veces la variable dependiente de una ecuación se usa como unavariable independiente en otra ecuación. De esta manera, se construyenecuaciones "simultáneas" para describir el funcionamiento de sistemas complejos(como economías nacionales) en econometría. Jay Forrester es pionero en estecampo. Un ejemplo de su trabajo se describe en World Dynamics.

En el análisis de las series de tiempo, análisis de regresión, y lamodelización de ecuaciones simultáneas, las ecuaciones son determinadas porrelaciones estadísticas que existieron en tiempos del pasado. Por contraste, en lamodelización de la simulación, las ecuaciones se construyen para reproducir, enun mayor o menor grado, el funcionamiento real del sistema bajo el estudio. Por

Page 9: MODELIZACIÓN ESTADÍSTICA: DE LAS SERIES DE TIEMPO A LA

Metodología de Investigación de Futuros Modelización Estadística

525

ejemplo, un modelo de simulación que intenta reproducir el tamaño histórico de lapoblación, podría basarse en la lógica siguiente: la población hoy simplemente esel número de las personas que existieron el año pasado, más el número de laspersonas nacidas y menos el número de las personas que murieron durante elaño. Semejante ecuación puede usarse como un modelo de pronóstico.

La modelización estadística (es decir, análisis de regresión)normalmente es una visión transversal de la relación entre las variables en un solopunto del tiempo. El número de casos incluidos en una muestra proporciona lavariación para construir las estimaciones de los parámetros. En contraste, lamodelización de simulación es un análisis longitudinal de las variables y surelación con el tiempo. Así, tiempo es una variable primaria, que como tal tieneefecto sobre las otras variables. La diferencia es muy grande entre un análisistransversal y uno longitudinal. Los métodos se superponen cuando el tiempo seusa como una variable en la ecuación de regresión que gobierna al análisis de laserie de tiempo. El propósito de los dos métodos, sin embargo, sigue siendodiferente,. El énfasis en el análisis estadístico es estimar los coeficientes deregresión como indicadores de la estructura de un sistema; el énfasis en el análisisde simulación es usar esos coeficientes en la extrapolación el valor de lasvariables en el tiempo. Las técnicas estadísticas pueden usarse para arribar a loscoeficientes, pero ellas son sólo un medio más que el final del proceso.

De una perspectiva histórica, estos métodos de modelización fluyen dela evolución de las estadísticas. Matemáticas y estadísticas encontraronaplicaciones crecientes en los 1800s. Durante ese tiempo, varias ideasestadísticas y métodos de análisis fue desarrollados por Francis YsidroEdgeworth, Francis Galton, Karl Pearson, George Udny Yule, y otros científicos ymatemáticos británicos. Sir Francis Galton inventó el coeficiente de correlaciónaproximadamente en 1875. Galton sostuvo que las plantas y los animales varíansegún ciertos patrones, y desarrolló varios métodos estadísticos para estudiarestos patrones. Galton fue más allá al aplicar estas técnicas al estudio de laherencia, y fue él el primero en llamarlo eugenesias.

La importancia de los ciclos en los datos de tendencias fue observadapor W. M. Persons en 1916. Un desarrollo mayor alrededor de 1925 involucrótécnicas para identificar las longitudes del ciclo, en lugar de asumirlos meramente.Las estadísticas permanecieron poco refinadas principalmente hasta los añosveinte, cuando se consolidó como una rama de la ciencia por el trabajo de ungrupo pequeño de estadísticos ingleses. Un uso temprano de la regresión linealmúltiple se produjo en psicología, donde fue usado para evaluar resultados depruebas. Durante la Segunda Guerra Mundial, este campo de análisis sedesarrolló mucho más como parte del esfuerzo de guerra en Gran Bretaña y losEstados Unidos.

Page 10: MODELIZACIÓN ESTADÍSTICA: DE LAS SERIES DE TIEMPO A LA

Metodología de Investigación de Futuros Modelización Estadística

526

Ya en los 1600s, Sir William Petty, un economista inglés, reconoció elvalor de aplicar matemáticas y estadísticas a la economía. Pero no fue sino hastalos posteriores 1800s cuando Leon Petty genera la fundación de la econometría,escribiendo una descripción matemática de una economía de mercado. Loseconometristas Ragnar Frisch de Noruega y Ene Tinbergen de los Países Bajosfueron los primeros a quienes se les otorgó un Premio Nobel por sus trabajos eneconomía.

Los conceptos básicos de ingreso - egreso fueron desarrollados hacecasi 200 años por Francois Quesnay. Leon Walras refinó la matemáticainvolucrada en esta técnica en los tempranos 1900s. Sin embargo, WassilyLeontief publicó la primera tabla de ingreso - egreso nacional en 1936 e inauguróel uso moderno de análisis de ingreso – egreso. Él recibió un Premio Nobel en1973 por su trabajo en este campo.

Simulaciones de gran alcance no podían desarrollarse hasta que latecnología de las computadoras progresara para que pudieran manejarse grandesconjuntos de datos fácilmente. Algunas de las primeras aplicaciones demodelización de simulación se realizaron en la Rand Corporation en los 1960s.En julio de 1970, los miembros del Club de Roma asistieron a un seminario en elInstituto Tecnológico de Massachusetts (MIT). Durante este seminario, losmiembros del Grupo de Dinámica de Sistemas expresaron que creían que lastécnicas de análisis de sistema desarrolladas por Jay W. Forrester del MIT y susasociados podría proporcionar una nueva perspectiva de resultados en elcomplejo interjuego de costos y beneficios del crecimiento de la población en unplaneta finito. La investigación comenzó bajo la dirección de Dennis L. Meadows yfue presentada en su libro, Los Límites del Crecimiento, seguido por Hacia unEquilibrio Global: Collected Papers y La Dinámica de Crecimiento en un MundoFinito. Los más recientes tratamientos incluyen los de Donella Meadows Más alláde los Límites: confrontando el colapso global, Previendo un Futuro Sustentable, lacontinuación a los Límites del Crecimiento, y Tantenado en la Oscuridad: LaPrimera Década de la Modelización Global proporciona una excelente apreciaciónglobal de la modelización global. Algunas de las primeras aplicaciones desimulación tuvieronlugar en la Rand a mediados de los 1970. La Modelización desimulación se usa ampliamente hoy en campos que van de las astrofísica a lainteracción social.

Page 11: MODELIZACIÓN ESTADÍSTICA: DE LAS SERIES DE TIEMPO A LA

Metodología de Investigación de Futuros Modelización Estadística

527

II. EXPLICACIÓN Y CÓMO HACERLO

Análisis de la Serie de Tiempo

Ajuste de la curva

En la construcción de la curva, un programa de software paracomputadora examina datos históricos de la serie de tiempo para determinar quéserie de ecuaciones puede construirla o puede reproducir bien esos datos. Lasecuaciones pueden ser lineales o no lineales. El resultado final es representadopor una curva de Gompertz o una función logística y a menudo es llamada unacurva en forma de "S". Las variaciones sinusoidales de los parámetros tambiénentran en la categoría del no lineales.

Cuando es empleada una curva de este tipo, la ecuación escogidapermite hacer un pronóstico, o proyectar los datos históricos, en los cualesgeneralmente las graficaciones más apropiadas se basan en el coeficiente de lacorrelación más alto (normalmente usando un "cuadrado-menor", criterio que serefiere a cualquier metodología que evalúa la relación entre un juego de valores ylos estimadores de alternativas de esos valores, escogiendo ese estimador paraque la suma de las diferencias cuadradas entre los valores reales y los valoresestimados sea el más bajo) con las posiciones de los datos del pasado. En ciertoscasos, el practicante puede saber de antemano que el sistema o parámetro que élestá utilizando no puede exceder el 100 por ciento del mercado. En tales casos,se seleccionan a priori para el uso sólo ciertas ecuaciones.

ALGORITMOS COMUNES PARA LA CONSTRUCCIÓN DE CURVAS

V = el e-(A+BX) (exponencial)V = M Y + B (lineal)

log V = M Y + B (log - log)log V = M log Y + B

V = M log Y + B1/V = M Y + B

1/V = M / Y + B V = M /Y + B

log log V = M Y + Blog log V = M log Y + B

log V = M / Y + B1/log V = M / Y + B

1/V = M log Y + B1/log V = M log Y + B

Page 12: MODELIZACIÓN ESTADÍSTICA: DE LAS SERIES DE TIEMPO A LA

Metodología de Investigación de Futuros Modelización Estadística

528

Notas: M = Pendiente o inclinaciónB = Constante AditivaY = Año 1900V = Valor Calculado

La mayoría los programas de software para trazar curvas le permitenal usuario seleccionar una curva, pero la selección de la forma apropiada de lacurva general puede ser difícil. Dos formas de la curva diferentes pueden, porejemplo, ambas reproducir los datos históricos muy bien, pero producirextrapolaciones notablemente diferentes. En efecto, seleccionando la forma de lacurva se puede predeterminar el pronóstico. Los análisis también pueden incluir laidentificación de componentes cíclicos en los datos históricos (por ejemplo,"recesiones económicas") y, como se muestra en la Figura 1, se pueden ubicar alos componentes cíclicos superpuestos al pronóstico elaborado.

Figura 1Historia y Proyección lineal

1960 - 2000

Métodos de promedio

Pueden suavizarse datos en tendencias históricas usando variosmétodos. El significado aritmético puede ser calculado y puede ser usado como un

PRONÓSTICO LINEAL PRONÓSTICO CÍCLICO

14

12

10

08

06

04

02• 1970 1980 1990 2000

AÑO

HISTORIA

Toneladas de Clorina

Page 13: MODELIZACIÓN ESTADÍSTICA: DE LAS SERIES DE TIEMPO A LA

Metodología de Investigación de Futuros Modelización Estadística

529

pronóstico. Sin embargo, esto asume que la serie de tiempo está basada en unproceso subyacente bastante constante. Simples movimientos de promedios, quese computan dejando caer la observación más vieja e incluyendo la más reciente,proporciona un método para minimizar la influencia de los conjuntos de datosanteriores. Los movimientos lineales de los promedios proporcionan un método depromedios más sofisticado, especialmente dirigido al análisis de tendenciasinvolucradas situaciones de cambios volátiles. En efecto, los movimientos depromedios lineales son un movimiento de promedio doble, es decir, un movimientode promedio de un movimiento de promedio.

Suavizamiento exponencial

El suavizamiento exponencial se refiere a una clase de métodos en losque el valor de una serie de tiempo en algún punto de ese tiempo es determinadopor valores del pasado de la serie de tiempo. La importancia de los valores delpasado declinan exponencialmente cuando ellos envejecen. Este método essimilar a los de movimientos de promedios sólo que, con el suavizamientoexponencial, los valores del pasado tienen diferente peso y todos los valores delpasado contribuyen de alguna manera al pronóstico.

Los métodos de suavizamiento exponencial son útiles para pronósticosa corto plazo. Ellos pueden producir a menudo buenos pronósticos para uno odos periodos en el futuro. La ventaja del suavizamiento exponencial está en suaplicación relativamente simple para obtener pronósticos rápidamente, cuando seopera con un gran número de variables. Por esta razón, este método haencontrado gran aplicación en el inventario de pronósticos. El suavizamientoexponencial no debe usarse para pronósticos a mediano o largo plazos. Talespronósticos dependen fundamentalmente de los datos más recientes, y por lotanto, éste tiende a responder bien en el corto plazo y muy pobremente en ellargo.

Análisis explicativo o Causal

Análisis de regresión múltiple

El análisis de regresión múltiple se usa para determinar la relaciónentre las variables dependientes y varias variables independientes.Frecuentemente, este análisis se usa para crear una ecuación que explica laconducta de la variable dependiente. Si el valor de una variable –por ejemplo,ventas- es pensada como determinada a través de otras tres variables –precio,publicidad y calidad- un análisis de regresión múltiple podría usarse para

Page 14: MODELIZACIÓN ESTADÍSTICA: DE LAS SERIES DE TIEMPO A LA

Metodología de Investigación de Futuros Modelización Estadística

530

determinar la naturaleza de la relación. Se elaboraría una ecuación como lasiguiente:

Ventas = 100–0.2 x precio + 0.1 x publicidad + 0.6 x calidad

Un pronóstico elaborado con análisis de regresión múltiple requiere:

• Los juegos de valores históricos para cada uno de las variablespredictoras, y la variable dependiente para el mismo periodo detiempo.

• Derivados Independientemente -extrapolados o pronosticados-los valores de las variables predictoras para cada momento uocasión en que se desea el valor de la variable dependiente.

Muchos paquetes de softwares estadísticos de alta calidad facilitan elproceso de regresión. Ellos no sólo producen gráficos de alta calidad de datosactuales y calculados, sino que también producen una gran riqueza de informaciónque considera cuán bien el pronóstico de regresión acierta con datos reales.

La figura 2 ilustra una aplicación de análisis de regresión. Aquí elproblema estaba en encontrar una ecuación para trabajar con el número depersonas empleadas en los Estados Unidos (la variable dependiente). Lasvariables independientes eran:

• año (yr);

• producto nacional bruto (PNB);

• número de personas desempleadas (UNEMP);

• población (POP); y

• Deflactor del PNB (PNBDEF)

La ecuación que resultó del análisis fue:

EMPLEADOS = 0.6202(yr) + 0.0403(PNB) – 0.0056(UNEMP) – O.2609(POP) – 0.1288(PNBDEF)– 1116.9

Page 15: MODELIZACIÓN ESTADÍSTICA: DE LAS SERIES DE TIEMPO A LA

Metodología de Investigación de Futuros Modelización Estadística

531

La figura 2 grafica y da un ejemplo de una regresión múltiple. En esteejemplo, la variable dependiente es "empleados", y las variables independientesincluyen el año, el PNB, los desempleados, y la población. Observando las doslíneas de la figura, nosotros podemos ver que la relación definida como pronósticoha tenido resultados muy cercanos a los de los datos reales. Otra indicación esque R2 es 0,9838, lo que significa que esta ecuación explica el 98% de lasvarianzas.

A menudo, en regresiones múltiples, es muy útil examinar lascorrelaciones entre las variables. El coeficiente de correlación describe el gradocon que la variación en una variable se relaciona con otra. El coeficiente decorrelación varía desde +1 para una correlación positiva a -1 para una correlaciónnegativa. Un valor de 0 significa que no existe ninguna correlación. Este métodoes a menudo útil para probar hipótesis sobre relaciones entre las variables. Porejemplo, si usted pensara que las ventas de un producto eran afectadas por lacantidad de publicidad, usted podría calcular el coeficiente de correlación. Elresultado le diría el grado al que un cambio en la publicidad es –o puede ser-asociado con un cambio en ventas.

Figura 2.Comparación entre una Ecuación de Regresión y los Datos Reales

EMPLEADOSValores actuales y calculados

74.543

70.172

65.901

61.431

57.060

1947 1951 1955 1959AÑOS

Actual R2 = 9838 Calculada

Page 16: MODELIZACIÓN ESTADÍSTICA: DE LAS SERIES DE TIEMPO A LA

Metodología de Investigación de Futuros Modelización Estadística

532

La figura 3 ilustra una copia impresa de un coeficiente de correlación típico.

Variable PNBDEF PNB ARFC POBLACIÓNPNBDEF 0.992 0.465 0.979 0.971

Probabilidad = 1.000 0.930 1.000 1.000Número = 16 16 16 16

PNBProbabilidad =

Número =ARFC

Probabilidad =Número =

POBLACIÓNProbabilidad =

Número =

0.4460.917

16

0.9911.000

160.3640.835

16

0.9841.000

160.4570.925

160.9601.000

16

Figura 3. Coeficiente de la correlación

Análisis de Regresión Anticipatoria

El análisis de regresión anticipatoria utiliza todos los mismos cálculoscomo en una regresión múltiple, sólo que sus "pasos" a través del procedimientode la regresión incorpora sólo las variables independientes que hacen unacontribución estadísticamente significante a la magnitud de variación explicada.En el primer paso, cada variable independiente es examinada en una regresiónseparada para escoger el punto en que se ubica la mayor varianza. En cada pasoadicional, se examinan las variables restantes. La variable que más contribuye aexplicar la varianza restante se ingresa a la ecuación. El método de análisis deregresión anticipatoria sólo selecciona variables que se encuentran en el valor F oel criterio de probabilidad ingresado por el usuario. El método de regresiónanticipatoria continúa hasta que todas las variables seleccionadas se ingresan ohasta que ninguna de las variables restantes cumpla con el criterio de ingreso.

Análisis de regresión polinómica

El análisis de regresión polinómica es similar a la regresión múltiple,sólo que existe una sola variable independiente. La variable independiente, sinembargo, se usa en la ecuación varias veces. Si se usa dos veces, el segundotérmino será al cuadrado. Si se usa tres veces, el tercer término se elevará al

Page 17: MODELIZACIÓN ESTADÍSTICA: DE LAS SERIES DE TIEMPO A LA

Metodología de Investigación de Futuros Modelización Estadística

533

cubo. Este tipo de análisis es muy útil cuando una complicada relación no linealentre dos variables es sospechosa.

Análisis de Autocorrelación

La autocorrelación ordena búsquedas que detectan la existencia deciclos repetitivos. Si los datos son sospechosos de contener un ciclo repetitivo, elanálisis de autocorrelación puede ayudar a determinar si el ciclo que se suponeexiste, realmente está allí. Por ejemplo, suponga que los datos de ventasmensuales de algún producto están disponibles, y una influencia estacional essospechosa. El análisis de autocorrelación puede ayudar a determinar sirealmente esto es cierto.

El análisis de autocorrelación consiste en poner en correlación losdatos en un momento particular con los datos en un momento anterior. La fase 1de autocorrelación vincula cada dato de un determinado momento con los datosde un periodo de tiempo anterior. Así, el segundo punto se pone en correlacióncon el primer punto, el tercero con el segundo, el cuarto con el tercero, y asísucesivamente. Una autocorrelación de fase 2 pondrá en correlación una seriecon sí misma, pero con un retraso de dos periodos. Así, el tercer punto se poneen correlación con el primero, el cuarto con el segundo, etc. Una autocorrelaciónde fase 12 pondrá en correlación una serie con sí misma, pero retrasada 12periodos. Así, al analizar datos mensuales, una autocorrelación de fase 12pondría en correlación todos los meses del enero entre sí, todos los meses defebrero entre sí, etc. Si los datos de las ventas realmente reflejan una influenciaestacional en los datos de ventas, entonces las ventas tenderán a ser altas en losmismos meses de cada año y bajar también en los mismos meses. Este patrónmostrará un autocorrelación alta con una fase de 12. Una presentación deautocorrelación típica se muestra en la figura 4.

Page 18: MODELIZACIÓN ESTADÍSTICA: DE LAS SERIES DE TIEMPO A LA

Metodología de Investigación de Futuros Modelización Estadística

534

Figura 4. Coeficientes de autocorrelación

Ecuaciones simultáneas

Se usan a menudo ecuaciones simultáneas cuando existe un gradoalto de interdependencia entre una serie de tiempo pronosticada y otras variables.La economía y otros campos reconocieron que variables que parecían quepodrían usarse en análisis de regresión, no eran independientes. Estainterdependencia impide el uso del análisis de regresión.

La econometría a veces confía en ecuaciones simultáneas parapronosticar variables económicas claves, como el PNB o el producto internodoméstico (PIB) y los gastos de los consumidores. Un modelo econométricopuede componerse de varias ecuaciones simultáneas de diferentes tipos y formasfuncionales. Factores que son fuertemente influenciados por algún otro sonclasificados en un modelo econométric0 como endógenos, mientras aquellos quepueden determinarse como externos al sistema de ecuaciones simultáneas, sellaman exógenos. Debe especificarse una ecuación para cada variable endógena.

Input - Output

Una tabla de Input - Output es una técnica por determinartransacciones dentro de y entre sectores diferentes. Podría construirse como una

EMPLEADOGráfico de Coefcientes de Autocorrelación

O.841

0,471

000.0

-0.471

-0.841

1 4 8 12FASE

Page 19: MODELIZACIÓN ESTADÍSTICA: DE LAS SERIES DE TIEMPO A LA

Metodología de Investigación de Futuros Modelización Estadística

535

tabla de estas características, por ejemplo, el resumen de las substracciones eingresos dentro de una industria y entre ella y el consumidor. Si una tabla para elsistema a ser estudiado no está disponible, normalmente una cantidadconsiderable de tiempo y dinero son necesarios para reunir los datos necesarios yconstruir la tabla. Una vez disponible, la tabla puede usarse para rastrear cambiosque ocurren en todos los sectores como resultado de cambios en un sector. Seutiliza normalmente una computadora para lograr visualizar cómo un cambio en eloutput de un sector afecta los inputs requeridos por otros sectores y afecta losoutputs de otros muchos sectores, y cuánto los hace.

Modelización de Simulación

En la Modelización de Simulación, se hace un esfuerzo para reproducirel sistema que será modelizado, en forma de ecuaciones, no solamente utilizandorelaciones estadísticas entre las variables, sino también por lógica e inferenciasobre cómo funciona el sistema. Por ejemplo, usando regresión para pronosticar elnúmero de personas que viven en Acra, uno podría encontrar una muy precisa,pero espuria, correlación con el número de manzanas vendidas en Nueva York.Las estadísticas podrían parecer excelentes, pero la lógica se mostraría impropia.Además, los coeficientes producidos en un análisis de regresión no tienen ningúnsignificado actual. La perspectiva cambia en la modelización de una simulación.Este método empieza con una idea sobre cómo funciona el sistema, y dasignificado a los coeficientes. La validez del modelo es probada comparando suproducto con los datos históricos reales.

Por ejemplo, suponga que queremos construir un modelo para realizarun pronóstico sobre el empleo. Un análisis de serie de tiempo podría tomar datoshistóricos del empleo, podría construir una curva, y podría proyectar los datoshacia el futuro. Un análisis de regresión relacionaría el empleo a factoresconsiderados importantes, como población global, el desempleo, sueldos, lasexportaciones, importaciones, etc. La diferencia entre estos métodos se valora yconsidera por sus propósitos diferentes. El propósito de análisis de regresión es laestructura de las variables basada en su covariación. Pueden estimarse valoresfuturos, pero raramente pueden darse (exceptuando quizás una observación decandidatos para una escuela o un empleo). En simulación, la misma estructura esun input a un propósito real, que es la estimación de valores futuros y la conductade esos valores con el tiempo. Por consiguiente, la diferenciación debe orientarseal propósito y no al nivel matemático.

La modelización de simulación es complicada, pero tiene la ventaja deponer la atención en cómo las cosas realmente trabajan. No hay disponibleningún programa preconfigurado de modelización de simulación para el análisisestadístico; cada modelo vincula una forma o enfoque de trabajo. Sin embargo,

Page 20: MODELIZACIÓN ESTADÍSTICA: DE LAS SERIES DE TIEMPO A LA

Metodología de Investigación de Futuros Modelización Estadística

536

algunos lenguajes especializados en modelización, como Dínamo, han sidodesarrollados para estas aplicaciones.

III. FORTALEZAS Y DEBILIDADES

Aunque el análisis de serie de tiempo es rápido y fácil, proporciona unpequeño conocimiento sobre las conductas futuras. Puesto que el futuro essolamente preconfigurado desde el pasado sin una percepción subyacente sobrelos factores causales, la serie de tiempo es un método ingenuo de pronóstico.

Mientras varias formas de pronósticos explicativo o causal seesfuerzan por explicar la relación causal fundamental, también están apoyados enlas conductas del pasado, y por consiguiente también proveen un pronósticoingenuo.

Mayores fortalezas de la Regresión

La fuerza de la regresión como método de pronóstico es que capitalizasu análisis apoyándose en las relaciones históricas entre las variablesdependientes e independientes. Usa toda la información en los pares de datoshistóricos para determinar los valores futuros de las variables.

La "la bondad de calce" de Yc a los valores históricos de Y puedeusarse para computar una medida de la fuerza de la relación lineal entre el Xhistórico, entonces los pares de Y pueden usarse para calcular "el límite deconfianza " o probables límites superiores y más bajos para los valores de Y. Engeneral, el más cercano Yc al valor histórico de Y, es el más cercano límite deconfianza; es decir, los valores actuales de Y probablemente serán menosposibles que se aparten de los valores pronosticados. El coeficiente decorrelación es un índice que puede usarse para calcular una figura de mérito de laexactitud con que los valores calculados de Y, Yc coinciden con los datos realesdel pasado histórico. El cuadrado de los rangos del coeficiente de correlación vande 0 a 1. Un valor de 0 significa el fracaso total del valor de Yc paracorrelacionarse con los correspondientes valores de Y. Un valor de 1 para elcuadrado del coeficiente de correlación significa que los valores de Y y de Yccorresponden exactamente. Valores entre 0 y 1 pueden ser interpretados comoexpresión de la proporción de variabilidad en los valores históricos de Y quepodrían contabilizarse a través de la relación lineal calculada entre X e Y.

Page 21: MODELIZACIÓN ESTADÍSTICA: DE LAS SERIES DE TIEMPO A LA

Metodología de Investigación de Futuros Modelización Estadística

537

Mayores debilidades de la Regresión

El método de cuadrados menores, tal como normalmente se lo usa,implica que los valores de la variable independiente (X) estén desprovistos deerror o incertidumbre; es decir, el único posible error o incertidumbre está en losvalores de la variable dependiente (Y). A menudo esta asunción es cuestionable.Por ejemplo, la variable predictora puede ser pronosticada incorrectamente.Tomemos un ejemplo específico: suponga que nosotros queremos prever la tasade interés primario (prime rate, PR) y desarrollar una buena ecuación estadísticaque relacione el Índice de Precios al Consumidor (IPC) y la PR. Puede usarse unpronóstico de la tendencia futura del IPC, para generar un pronóstico de la PR,utilizando una regresión lineal bivariante. La exactitud de este pronóstico dependede cuán fuertemente están relacionados los valores pasados de IPC y la PR, y conqué precisión se pronostica la tendencia futura del IPC. La última fuente deinexactitud normalmente no se tiene en cuenta calculando límites superiores einferiores para los valores previstos de la variable dependiente o, másgeneralmente, evaluando la exactitud de este método de pronóstco.

Cuando los datos del pasado histórico están sujetos a error, el efectodel error hace que los valores de Y varíen menos de lo que ellos muestran.Valores de Y por debajo del estimado o real puede producir un pronósticorealmente malo, tanto como cuando se generan valores de Y por encima delestimado. A mayor "ruido" en la historia pasada, mayor es este efecto; y no existeninguna manera de usar este método para distinguir una relación débil entre X y Yde una relación fuerte entre las mismas variables, que es disimulada por ruido oerror de medida.

Los métodos, como normalmente se los aplicó, asumen que todos lospares de datos del pasado son igualmente importantes. Mientras que pares dedatos “detonadores” pueden usarse para generalizar, el método no es común.

El método fundamentalmente genera un "pronóstico de regresión". Elpronóstico de Y depende de un pronóstico anterior de X. De la misma manera, elpronóstico de X podría depender de un pronóstico anterior de W. Pero en algunaparte en esta serie debe existir un pronóstico que no dependa de otro pronóstico.Una manera de romper la cadena es tener un propio tiempo como predictor ovariable independiente. Esta opción, sin embargo, necesariamente resulta en lavariable dependiente, que depende solo del tiempo, tanto creciendo odisminuyendo sin límite con el tiempo.

Page 22: MODELIZACIÓN ESTADÍSTICA: DE LAS SERIES DE TIEMPO A LA

Metodología de Investigación de Futuros Modelización Estadística

538

IV. FRONTERAS

Los métodos estadísticos descriptos aquí confían en la asunción quelas fuerzas con gran peso en la formación de la historia, continuarán haciéndolo.Las fronteras de los métodos estadísticos deben ciertamente incluir técnicas paraprobar esa asunción y, cuando fueran encontradas, permitir la introducción depercepciones sobre el cambio. Análisis de Impacto de tendencias, DinámicaProbabilística de los Sistemas, Análisis de Impactos Cruzados, Interax; todosestos métodos intentan combinar juicios con estadísticas.

Focalizándonos estrictamente en los límites de las estadísticas,algunas orientaciones en las investigaciones que podrían beneficiar este campoincluyen:

• Desarrollo de métodos que testeen series de tiempo para caos (ver acápiteFronteras de la sección de Investigación del Futuro). A menos que un casoparticular esté siendo considerado, la posibilidad de aplicar una serie detiempo caótica que usa cualquiera de las técnicas sugeridas aquí,probablemente será improductivo.

• Exploración de nuevas formas de ecuaciones de regresión que combinenlas series de tiempo bajo estudio. Por ejemplo, usando una función enforma de S al regresionar variables que relacionan la maduración osubstitución tecnológica.

• Simulación de Políticas con modelos de regresión. Por ejemplo, ciertas"variables mudas" para las que el valor es –o se ubica en- cero, han sidousadas en estudios de regresión para indicar la presencia o ausencia deuna política. Este método no es muy refinado.

• Uso de técnicas escalares de multidimensión o agrupamiento, para mejorarla eficacia en la búsqueda de las variables que pueden encajar en un grupoo pueden relacionarse con otras.

• Inclusión de relaciones no lineales en modelos de simulación que a vecespueden producir aparentes conductas caóticas.

Algunos periódicos importantes rastrean desarrollos en este campo:

Applied EconomicsFuturesInternational Economic ReviewInternational Journal of Forecasting

Page 23: MODELIZACIÓN ESTADÍSTICA: DE LAS SERIES DE TIEMPO A LA

Metodología de Investigación de Futuros Modelización Estadística

539

Journal of Applied Business ResearchJournal of Business and Economic StatisticsJournal of Developing ArtsJournal of EconometricsJournal of ForecastingJournal of MacroeconomicsJournal of Policy ModelingOxford Bulletin of Economics and StatisticsQuarterly Journal of Business and EconomicsTechnological Forecasting and Social Change

Page 24: MODELIZACIÓN ESTADÍSTICA: DE LAS SERIES DE TIEMPO A LA

Metodología de Investigación de Futuros Modelización Estadística

540

PÁGINA EN BLANCO

Page 25: MODELIZACIÓN ESTADÍSTICA: DE LAS SERIES DE TIEMPO A LA

Metodología de Investigación de Futuros Modelización Estadística

541

BIBLIOGRAFÍA

Ayres, Robert U. "Envelope Curve Forecasting." In Technological Forecasting forIndustry and Government. Edited by James R. Bright. New Jersey: Prentice-Hall, Inc., 1968, pp. 77-94.

Ayres, Robert U. "Extrapolation of Trends." Technological Forecasting and Long-Range Planning. New York: McGraw-Hill, 1969, pp. 94-117.

Benton, William K. "Time Series Forecasting." Forecasting for Management.Massachusetts: Addison-Wesley, 1972, pp. 67-139.

Bright, James R. "Trend Extrapolation." A Brief Introduction to TechnologyForecasting: Concepts and Exercises. Austin, Texas: Pemaquid Press,1972, pp. 6-1 to 6-70.

Congressional Research Service. "Trend Extrapolation." Long-Range Planning.Prepared for the Subcommittee on the Environment and the Atmosphere.Washington, D.C.: U.S. Government Printing Office, May 1976, pp. 434-443.

De Gooijer, Jan G., and Kuldeep, Jumar. "Some Recent Developments in Non-Linear Time Series Modeling, Testing, and Forecasting." International Journalof Forecasting 8, October 1992, pp. 135-156.

Engle, Robert F., and Hendry, David F. "Testing Superexogeneity and Invariancein Regression Models." Journal of Econometrics 56, March 1993, pp. 119-139.

Fiebig, Denzil G.; McAleer, Michael; and Bartels, Robert. "Properties of OrdinaryLeast Squares Estimators in Regression Models with NonsphericalDisturbances." Journal of Econometrics 54, October-December 1992, pp. 321-334.

Forrester, Jay W. World Dynamics. Cambridge, Massachusetts: Wright-AllenPress, 1971.

Lanford, H. W. "Analytical Techniques." Technological ForecastingMethodologies: A Synthesis. New York: American Management Association,1972, pp. 32-113.

Lenz, Ralph C., Jr. "Forecasts of Exploding Technologies by Trend Extrapolation."In Technological Forecasting for Industry and Government. Edited by JamesR. Bright. New Jersey: Prentice-Hall, Inc., 1968, pp. 57-76.

Page 26: MODELIZACIÓN ESTADÍSTICA: DE LAS SERIES DE TIEMPO A LA

Metodología de Investigación de Futuros Modelización Estadística

542

Leone, Robert P.; Oberhelman, H. Dennis; and Mulhern, Francis J. "EstimatingIndividual Cross-Section Coefficients from the Random Coefficient RegressionModel." Journal of the Academy of Marketing Science 21, Winter 1993, pp.45-51.

Leybourne, S. J. "Estimation and Testing of Time-Varying Coefficient RegressionModels in the Presence of Linear Restrictions." Journal of Forecasting 12,January 1993, pp. 49-62.

Makridakis, Spyros; Wheelright, Steven C.; McGee, Victor. Forecasting: Methodsand Applications. John Wiley & Sons, 1983.

Martino, Joseph P. "Trend Extrapolation." In A Guide to Practical TechnologicalForecasting. Edited by James R. Bright and Milton E. F. Schoeman. NewJersey: Prentice-Hall, Inc., 1973, pp. 106-125.

Meadows, Dennis. The Limits to Growth. New York: Universe Books, 1972.

Meadows, Dennis L., and Meadows, Donella, eds. Toward Global Equilibrium:Collected Papers, Cambridge, Massachusetts: Wright-Allen Press, 1973.

Meadows, Donella, H.; Meadows, Dennis L.; Randers, Jorgen. Beyond the Limits:Confronting Global Collapse, Envisioning a Sustainable Future, Post Mills,Vermont: Chelsea Green Publishing Co., 1992.

Meadows, Donella, et al. Groping in the Dark: The First Decade of GlobalModeling. New York: John Wiley & Sons, 1982.

Meadows, Dennis L., et al. Dynamics of Growth in a Finite World. Cambridge,Massachusetts: Wright-Allen Press, Inc., 1974.

Nazmi, Nader. "Forecasting Cyclical Turning Points with an Index of LeadingIndicators: A Probabilistic Approach." Journal of Forecasting 12, April 1993,pp. 215-225.

Otter, Pieter W. "Canonical Correlation in Multivariate Time Series Analysis withan Application to One-Year-Ahead and Multiyear-Ahead MacroeconomicForecasting." Journal of Business & Economic Statistics 8, October 1990, pp.453-457.

Page 27: MODELIZACIÓN ESTADÍSTICA: DE LAS SERIES DE TIEMPO A LA

Metodología de Investigación de Futuros Modelización Estadística

543

Stanford Research Institute. "Forecasting Techniques Using Time Series andProjections." Handbook of Forecasting Techniques. Springfield, Virginia:National Technical Information Service, 1975, pp. 39-100.

Wooldridge, Jeffrey M. "Some Alternatives to the Box-Cox Regression Model."International Economic Review 33, November 1992, pp. 935-955.

Page 28: MODELIZACIÓN ESTADÍSTICA: DE LAS SERIES DE TIEMPO A LA

Metodología de Investigación de Futuros Modelización Estadística

544

PÁGINA EN BLANCO

Page 29: MODELIZACIÓN ESTADÍSTICA: DE LAS SERIES DE TIEMPO A LA

Metodología de Investigación de Futuros Modelización Estadística

545

APÉNDICE:

QUIÉN ESTÁ HACIÉNDOLO

Afortunadamente el análisis cuantitativo es facilitado por un gran número deprogramas de software que están creciendo en sofisticación. Estos programashan hecho que el análisis cuantitativo más sofisticado se encuentre ampliamentedisponible y relativamente barato para los pronosticadores y planificadores. Losmétodos más sofisticados tienden a ser usados en servicios universitarios porconsultores, matemáticos, y econometristas que han consagrado tiempoconsiderable al estudio del asunto.

Los paquetes de software están disponibles en numerosas fuentes, que incluyen:

SYSTAT Inc.1800 Sherman AvenueEvanston, IL 60201(708) 864-5670, Fax (708) 492-3567

Abacus Concepts, Inc.1984 Bonita Ave.Berkeley, CA 94704(510) 540-1949

Manuguistics2115 East Jefferson StreetRockville, MD 20852(301) 984-5000, Fax (301) 984-5094

Smart Software, Inc.(Charles Smart, President)4 Hill RoadBelmont, MA 02178(617) 489-2743 Fax (617) 489-2748

SPSS, Inc.444 North Michigan Ave., Suite 3000Chicago, IL 60611(312) 329-2400, Fax (312) 329-3668

Page 30: MODELIZACIÓN ESTADÍSTICA: DE LAS SERIES DE TIEMPO A LA

Metodología de Investigación de Futuros Modelización Estadística

546

SAS Institute Inc.SAS Campus DriveCary, NC 27513(919)677-8000, Fax (919)677-8123

TSP InternationalP.O. Box 61015Palo Alto, CA 94306(415) 326-1927

The Futures Group, Inc.80 Glastonbury BoulevardGlastonbury, CT 06033-4409(203) 633-3501, Fax (203) 657-9701