regresión lineal simple- estadistica aplicada a la administración
TRANSCRIPT
UNIVERSIDAD AUTONOMA DE CHIAPAS
ESTADISTICA APLICADA A LA ADMINISTRACION
REGRESION LINEAL SIMPLE
Septiembre de 2011
Regresión lineal y aplicaciones El objeto de un análisis de regresión es investigar
la relación estadística que existe entre una variable dependiente (Y) y una o más variables independientes. Cuando solo existe una variable independiente, esto se reduce a una línea recta:
Y = a + bX donde los coeficientes a y b son parámetros que
definen la posición e inclinación de la recta. El parámetro b, conocido como la “ordenada en el origen,” nos indica cuánto es Y cuando X = 0. El parámetro b, conocido como la “pendiente,” nos indica cuánto aumenta Y por cada aumento de una unidad en X.
DIAGRAMA DE DISPERSIÓN
180
200
220
240
260
280
2500 3000 3500 4000 4500
MILLAS
CO
ST
OS
Relación lineal
directa
Relación lineal
inversa
No existe relación
Método de mínimos cuadrados
Y = a + bX
a = Ȳ - bẌ
b = ∑XY - nẌȲ
∑ X2 - NẌ2
Aplicaciones
Mortalidad con el fumar tabaco
Ingresos con consumo de cierto articulo
Nivel de empleo con PIB
Nivel de deuda con Ingresos
Suponga que un analista extrae una muestra aleatoria de 10 embarques recientes en camión que ha realizado una empresa y registra la distancia en millas así como el tiempo de entrega con una aproximación de medio día desde el momento en que el embarque estuvo disponible para recogerlo.
Flete muestreado Distancia (X) millas Tiempo de entrega (Y) días
1 825 3
2 215 1
3 107 4
4 550 2
5 480 1
6 920 3
7 135 5
8 325 5
9 670 3
10 215 5
Coeficiente de Determinación (r2)
Mide el porcentaje de la variación total en Y que se debe a la variación en X.
Es la proporción de la variación total en Y que puede ser “explicada” por la variación en X?
mide el porcentaje de la variación total en Y que es explicado por la variación conjunta de las variables independientes.
r2xy = variación explicada = ∑(Yc - Ȳ)2
variación total ∑(Y - Ȳ)2
correlación lineal.
Predicción y causalidad
Toda institución, ya sea la familia, la empresa o el gobierno, tiene que hacer planes para el futuro si ha de sobrevivir y progresar. Hoy en día diversas instituciones requieren conocer el comportamiento futuro de ciertos fenómenos con el fin de planificar, prever o prevenir.
La planificación racional exige prever los sucesos del futuro que probablemente vayan a ocurrir. La previsión, a su vez, se suele basar en lo que ha ocurrido en el pasado. Se tiene pues un nuevo tipo de inferencia estadística que se hace acerca del futuro de alguna variable o compuesto de variables basándose en sucesos pasados. La técnica más importante para hacer inferencias sobre el futuro con base en lo ocurrido en el pasado, es el análisis de series de tiempo.
Series de Tiempo
1. Series económicas: - Precios de un
artículo - Tasas de desempleo - Tasa de
inflación - Índice de precios, etc.
2. Series Físicas: - Meteorología - Cantidad
de agua caída - Temperatura máxima diaria
- Velocidad del viento (energía eólica) -
Energía solar, etc.
3. Geofísica: - Series sismologías
4. Series demográficas: - Tasas de crecimiento
de la población - Tasa de natalidad,
mortalidad - Resultados de censos
poblacionales
5. Series de marketing: - Series de demanda,
gastos, ofertas, etc.
6. Series de telecomunicación: - Análisis de
señales
7. Series de transporte: - Series de tráfico
Componentes de una Serie Temporal
Tendencia (T)
Variación Estacional (S)
Fluctuaciones Cíclicas (C)
Movimientos Irregulares (I)
Definición de Series de Tiempo
Se llama Series de Tiempo a un
conjunto de observaciones sobre
valores que toma una variable
(cuantitativa) en diferentes
momentos del tiempo.
¿Para que se utilizan las series de
Tiempo?
Hoy en día diversas organizaciones requieren conocer el comportamiento futuro de ciertos fenómenos con el fin de planificar, prevenir,es decir, se utilizan para predecir lo que ocurrirá con una variable en el futuro a partir del comportamiento de esa variable en el pasado.
Aplicaciones
En las organizaciones es de mucha utilidad
en predicciones a corto y mediano plazo, por
ejemplo ver que ocurriría con la demanda de
un cierto producto, las ventas a futuro,
decisiones sobre inventario, insumos, etc....
No así para el diseño de un proceso
productivo ya que no se disponen de datos
históricos y se trata de un proyecto a largo
plazo
Selección de un modelo
1. El horizonte de tiempo para realizar la
proyección.
2. La disponibilidad de los datos.
3. La exactitud requerida.
4. El tamaño del presupuesto de
proyección.
5. La disponibilidad de personal
calificado.
Comportamiento de los Datos
Los datos se pueden comportar de
diferentes formas a través del tiempo,
puede que se presente una tendencia,
un ciclo; no tener una forma definida o
aleatoria, variaciones estacionales
(anual, semestral, etc.).
Grafico de una Serie de Tiempo
Mientras mas largo sea el periodo en que se hace el promedio,
mas lenta es la respuesta ante los cambios a la demanda
MODELO CLASICO DE SERIES DE TIEMPO
a) TENDENCIA (T).- Movimiento a lo largo de los valores de la serie de tiempo (Y) durante un número prolongado de años.
b) FLUCTUACIONES CICLICAS (C).- Movimientos recurrentes hacia arriba y hacia abajo con respecto a la tendencia y que tienen duración de varios años.
c) VARIACIONES ESTACIONALES (S).- Movimientos hacia arriba y abajo con respecto a la tendencia y que no duran más de un año.
d) MOVIMIENTOS IRREGULARES (I).- Variaciones erráticas con respecto a la tendencia, que no pueden adjudicarse a efectos estacionales o cíclicos.
MODELO CLASICO DE SERIES DE TIEMPO
Una serie de tiempo es un conjunto de valores observados, para series ordenadas secuencialmente de periodos de tiempo.
El análisis de series de tiempo es el procedimiento mediante el cual se identifican y separan los factores relacionados con el tiempo que influyen sobre los valores observados de la serie. Una vez que se identifican esos valores, se les puede utilizar para mejorar la interpretación de los valores históricos de la serie de tiempo y para pronosticar valores futuros.
ANALISIS DE LA TENDENCIA El análisis de tendencia se ocupa de la dirección del
movimiento de la serie de tiempo a largo plazo, es común que esos análisis se lleven acabo analizando datos anuales.
El método de mínimos cuadrados es la base común que se utiliza para identificar el componente de tendencia de la serie de tiempo, determinando la ecuación que mejor se ajuste a la línea de tendencia.
La línea de tendencia no es una línea de regresión, porque la variable dependiente Y no es una variable aleatoria, sino un valor histórico acumulado.
Cuando existe un aumento o disminución a largo plazo se sigue una tendencia lineal, siendo la ecuación de la línea de tendencia utilizando X para representar el año es:
YT= a + bX
donde:
a: representa el punto de intersección de
la línea de tendencia con el eje Y
b representa la pendiente de la línea de
tendencia .
Utilizando X para representar el año, Y
para el valor observado de la serie de
tiempo, las fórmulas para determinar los
valores de b0 y b1 en la ecuación de la
línea de tendencia son:
CUANDO LA SUMA DE X = 0
b = ∑XY a = ∑Y
∑X² n
VARIACION CICLICA Los valores anuales de una serie de tiempo
representan únicamente efectos de los
componentes de tendencia y cíclicos, porque
ya están definidos los componentes estacional
e irregular a corto plazo.
El componente cíclico puede determinarse
dividiendo los valores observados entre el
valor correspondiente de la tendencia de la
siguiente manera:
Y = T x C = C
YT T
VARIACION ESTACIONAL
La influencia del componente estacional sobre los valores de series de tiempo se identifica determinando el número índice estacional asociado con cada mes (o trimestre) del año.
La media aritmética de los 12 números índice mensuales (o de los cuatro números índice trimestrales) es 100.
La identificación de influencias estacionales positivas y negativas, es importante para la planeación de producción e inventario.
PROCEDIMENTO PARA DETERMINAR NUMEROS INDICES ESTACIONALES: METODO DEL COCIENTE DEL PROMEDIO MOVIL
1. Determinar el cociente de cada valor mensual, en relación con el
promedio móvil centrado en ese mes. Se representa
simbólicamente:
Promedio Móvil T X C
Y = T S CI = SI
PROMEDIO MOVIL TC
2. Promediar el componente irregular:
Enlistando los diversos cocientes aplicables al mismo mes (o trimestre)
de varios años, calculando la Media Modificada
3. Ajustar los cocientes medios modificados con un factor de corrección
tal que la suma de los doce cocientes mensuales sea de 1200.
PROCEDIMIENTO PARA DESARROLLAR UNA SERIE DE TIEMPO
1. asignar los valores de X de tal forma
que la suma de X = 0
2. calcular los valores de a y b en la
ecuación YT = a + bX
3. Determinar los totales móviles para
cada periodo.
4. Suma de dos totales móviles si la serie
es par.
5.- determinar los promedios móviles 6.- calcular SI por medio de Y/TC (promedio móvil) 7.- determinar los valores estacionales S por factor de ajuste 8.- obtener TCI a través de Y/S 9.- determinar CI por medio de TCI/T 10.- obtener el total móvil para series impares = CI 11.- calcular el promedio móvil = C 12.- obtener el valor de I = CI/C 13.- comprobar resultados a través de Y = TSCI 14.- Elaborar dos graficas: una para la tendencia T y los datos originales Y, y una para los valores de S, de C y de I.
EJEMPLO: LA SIGUIENTE TABLA PRESENTA LAS VENTAS TRIMESTRALES DE LA EMPRESA DE SOFTWARE GRAFICO. DETERMINE LOS VALORES DE LA SERIE DE TIEMPO Y GRAFIQUE LOS RESULTADOS.
AÑO/TRIMESTRE
2005 2006 2007 2008 2009 2010
I II III IV I II III IV I II III IV I II III IV I II III IV I II III IV
5
0
0
3
2
0
2
0
0
4
0
0
4
5
0
3
5
0
2
0
0
3
0
0
3
5
0
2
0
0
2
5
0
4
0
0
5
5
0
3
5
0
2
5
0
5
5
0
5
5
0
4
0
0
3
0
0
6
0
0
7
5
0
5
0
0
4
0
0
5
5
0
Sean felices mientras puedan