regresion lineal
DESCRIPTION
Regresion linealTRANSCRIPT
0
50
100
150
200
250
300
350
0 5 10 15 20 25
REGRESIÓN
f(x)=ax+b
R2=0.99
X Y
REGRESIÓN
“Es una forma de estudiar la asociación o relación, entre
una variable dependiente (Y) y la variable que es la base de
la predicción a la que se le denomina variable
independiente (X) ”
El propósito del análisis de regresión es usar los datos
o valores observados de las variables, para realizar
estimaciones, en base a una relación funcional.
X
Y
X
y=f(x)y=f(X1,X2)
X1
X2
Regresión Simple, cuando en el
análisis de regresión, se utiliza sólo
una variable independiente.
Regresión Múltiple. cuando se considera
dos o más variables independientes .
Donde:
y ………………………... es la variable dependiente,
x, x1, x2, . . . , xk, ………….son variables independientes.
También se clasifica en lineal y no lineal, según el comportamiento de las
variables.
Qué vamos a estudiar
En esta unidad estudiaremos la Regresión Lineal simple, es decir, vamos a tratar diferentes formas de describir la relación entre dos variables cuando estas son numéricas.Ejemplo:
Estudiar si hay relaciónentre la altura (X ) y el peso (Y ).
El tiempo de estudio dedicado a un curso (X) , esta relacionadocon la calificación obtenida (Y)
X
y=f(x)
X
Y
MODELO DE REGRESIÓN LINEAL SIMPLE
Se busca encontrar una función de X muy simple (lineal) que nos permita aproximar Y mediante la siguiente formula:
Y = b0 + b1 X
b0 (ordenada en el origen, constante)b1 (pendiente de la recta)
Y e Y rara vez coincidiránpor muy bueno que sea elmodelo de regresión. A lacantidad e=Y-Y se ledenomina residuo o errorresidual.
Esta
determinado
por 2
variables:
Qué hacer para realizar una regresión
El paso inicial que generalmente se realiza, es la construcción del Diagrama De Dispersión.
El 2º paso es, a través delMétodo de los MínimosCuadrados, estimar losCoeficientes de Regresión ( b0y b1) para establecer la recta deregresión.
Finalmente, cuando se realiza una predicción estadística, siempreserá útil calcular una medida que indique que tan preciso es elpronóstico de Y sobre X. A esta medida se le llama ErrorEstándar de Estimación.
Y = b0 + b1 X
b0 (ordenada en el origen, constante)b1 (pendiente de la recta)
X
Y
DIAGRAMA DE DISPERSION
Es la representación de los puntos o datos de cada una de las variables en el plano cartesiano.
Es recomendable en todo estudio de regresión pues permite tener una idea, sobre la existencia o no de la regresión.
30
40
50
60
70
80
90
100
140 150 160 170 180 190 200
Modelos de Diagrama de Dispersión
Ejemplo: Estudio del conjunto de dos variables
• A la derecha tenemos una posible manera de recoger los datos obtenidos, observando dos variables en varios individuos de una muestra.
– En cada fila tenemos los datos de un individuo
– Cada columna representa los valores que toma una variable sobre los mismos.
– Las individuos no se muestran en ningún ordenparticular.
• Dichas observaciones pueden ser representadas en un diagrama de dispersión o nube de puntos. En ellos, cada individuos es un punto cuyas coordenadas son los valores de las variables.
• Nuestro objetivo será intentar reconocer a partir del mismo si hay relación entre las variables, de qué tipo, y si es posible predecir el valor de una de ellas en función de la otra.
...
163
176
166
169
171
179
197
187
161
Altura
en cm.
...
68
84
54
60
66
65
85
76
50
Peso
en Kg.
Diagramas de dispersión o nube de puntos
30
40
50
60
70
80
90
100
140 150 160 170 180 190 200
Mid
e 1
87 c
m.
Mide
161 cm.
Pesa 76 kg.
Pesa 50 kg.
Tenemos las alturas y los pesos de 30 individuos representados en un
diagrama de dispersión. Observar datos del cuadro anterior
Mid
e 1
97cm
Pesa 85 kg.
Veamos la ubicación de los 3 registros sombreados en el cuadro anterior
30
40
50
60
70
80
90
100
140 150 160 170 180 190 200
Altura (cm)
Peso (Kg.)
Relación entre las variables altura (X) y peso (Y) de los 30
individuos vistos en el ejemplo anterior.
METODO DE LOS MINIMOS CUADRADOS
• Este método consiste en hallar los valores de b0 Y b1, haciendo mínima la suma de los cuadrados de los errores. Siendo la tarea principal en el análisis de regresión lineal simple.
• Una vez obtenidos estos valores nos permitirá establecer la recta de regresión que mejor se ajuste a los datos o la recta de mínimos cuadrados. Veamos las formulas a aplicar
• Hallaremos la Suma Cruzada de X, Y con la siguiente formula:
• Luego, la Suma de Cuadrados de X de la siguiente manera:
n
YiXiYXSC iixy
))((
n
XiXSC ix
2
2)(
Con las formulas anteriores, obtenemos la pendiente de la recta:
b1, haciendo la siguiente división:
El siguiente paso es hallar la ordenada en el origen:b0, con la
siguiente formula:
donde:
Y obtenemos la ecuación de regresión:
Y = b0+b1(X)
,__
n
Yiy
n
Xix
x
xy
SC
SCB 1
_
1
_
0 xByB
EJEMPLO:
En un estudio de la relación entre la publicidad de una nueva
Clínica de Salud por radio y el número de consultas realizadas
durante 10 semanas, se han recopilado los tiempos de
duración en minutos de la publicidad por semana (X), y el
número de consultas realizadas(Y).
Semana 1 2 3 4 5 6 7 8 9 10
Publicidad X 20 30 30 40 50 60 60 60 70 80
Consultas
Realizadas Y
50 73 69 87 108 128 135 132 148 170
Solución
También se utilizara los
promedios de las variables:nYYnXX ii /,/
Reemplazando en las formula de los coeficientes de regresión, se tiene lo
siguiente:
Por lo tanto la recta de regresión Y = b0+b1(X), estará determinada de la
siguiente manera Y = 10+ 2x.
Interpretación
B0: El Número real de consultas realizadas es de 10.
B1: Por cada minuto de publicidad que se realice en la semana, el número de
consultas realizadas aumenta en 2.
…Solución
Error Estándar y Error de Estimación
Cuando se realiza una predicción, es importante determinarel error estándar, el cual se representa por Sy.x y mide ladispersión de los datos observados con respecto a la líneade regresión.
El error de estimación,
que esta representado: e = y – y
Error de
predicción
GRACIAS