regresion lineal

0

50

100

150

200

250

300

350

0 5 10 15 20 25

REGRESIÓN

f(x)=ax+b

R2=0.99

X Y

REGRESIÓN

“Es una forma de estudiar la asociación o relación, entre

una variable dependiente (Y) y la variable que es la base de

la predicción a la que se le denomina variable

independiente (X) ”

El propósito del análisis de regresión es usar los datos

o valores observados de las variables, para realizar

estimaciones, en base a una relación funcional.

X

Y

X

y=f(x)y=f(X1,X2)

X1

X2

Regresión Simple, cuando en el

análisis de regresión, se utiliza sólo

una variable independiente.

Regresión Múltiple. cuando se considera

dos o más variables independientes .

Donde:

y ………………………... es la variable dependiente,

x, x1, x2, . . . , xk, ………….son variables independientes.

También se clasifica en lineal y no lineal, según el comportamiento de las

variables.

Qué vamos a estudiar

En esta unidad estudiaremos la Regresión Lineal simple, es decir, vamos a tratar diferentes formas de describir la relación entre dos variables cuando estas son numéricas.Ejemplo:

Estudiar si hay relaciónentre la altura (X ) y el peso (Y ).

El tiempo de estudio dedicado a un curso (X) , esta relacionadocon la calificación obtenida (Y)

X

y=f(x)

X

Y

MODELO DE REGRESIÓN LINEAL SIMPLE

Se busca encontrar una función de X muy simple (lineal) que nos permita aproximar Y mediante la siguiente formula:

Y = b0 + b1 X

b0 (ordenada en el origen, constante)b1 (pendiente de la recta)

Y e Y rara vez coincidiránpor muy bueno que sea elmodelo de regresión. A lacantidad e=Y-Y se ledenomina residuo o errorresidual.

Esta

determinado

por 2

variables:

Qué hacer para realizar una regresión

El paso inicial que generalmente se realiza, es la construcción del Diagrama De Dispersión.

El 2º paso es, a través delMétodo de los MínimosCuadrados, estimar losCoeficientes de Regresión ( b0y b1) para establecer la recta deregresión.

Finalmente, cuando se realiza una predicción estadística, siempreserá útil calcular una medida que indique que tan preciso es elpronóstico de Y sobre X. A esta medida se le llama ErrorEstándar de Estimación.

Y = b0 + b1 X

b0 (ordenada en el origen, constante)b1 (pendiente de la recta)

X

Y

DIAGRAMA DE DISPERSION

Es la representación de los puntos o datos de cada una de las variables en el plano cartesiano.

Es recomendable en todo estudio de regresión pues permite tener una idea, sobre la existencia o no de la regresión.

30

40

50

60

70

80

90

100

140 150 160 170 180 190 200

Modelos de Diagrama de Dispersión

Ejemplo: Estudio del conjunto de dos variables

• A la derecha tenemos una posible manera de recoger los datos obtenidos, observando dos variables en varios individuos de una muestra.

– En cada fila tenemos los datos de un individuo

– Cada columna representa los valores que toma una variable sobre los mismos.

– Las individuos no se muestran en ningún ordenparticular.

• Dichas observaciones pueden ser representadas en un diagrama de dispersión o nube de puntos. En ellos, cada individuos es un punto cuyas coordenadas son los valores de las variables.

• Nuestro objetivo será intentar reconocer a partir del mismo si hay relación entre las variables, de qué tipo, y si es posible predecir el valor de una de ellas en función de la otra.

...

163

176

166

169

171

179

197

187

161

Altura

en cm.

...

68

84

54

60

66

65

85

76

50

Peso

en Kg.

Diagramas de dispersión o nube de puntos

30

40

50

60

70

80

90

100

140 150 160 170 180 190 200

Mid

e 1

87 c

m.

Mide

161 cm.

Pesa 76 kg.

Pesa 50 kg.

Tenemos las alturas y los pesos de 30 individuos representados en un

diagrama de dispersión. Observar datos del cuadro anterior

Mid

e 1

97cm

Pesa 85 kg.

Veamos la ubicación de los 3 registros sombreados en el cuadro anterior

30

40

50

60

70

80

90

100

140 150 160 170 180 190 200

Altura (cm)

Peso (Kg.)

Relación entre las variables altura (X) y peso (Y) de los 30

individuos vistos en el ejemplo anterior.

METODO DE LOS MINIMOS CUADRADOS

• Este método consiste en hallar los valores de b0 Y b1, haciendo mínima la suma de los cuadrados de los errores. Siendo la tarea principal en el análisis de regresión lineal simple.

• Una vez obtenidos estos valores nos permitirá establecer la recta de regresión que mejor se ajuste a los datos o la recta de mínimos cuadrados. Veamos las formulas a aplicar

• Hallaremos la Suma Cruzada de X, Y con la siguiente formula:

• Luego, la Suma de Cuadrados de X de la siguiente manera:

n

YiXiYXSC iixy

))((

n

XiXSC ix

2

2)(

Con las formulas anteriores, obtenemos la pendiente de la recta:

b1, haciendo la siguiente división:

El siguiente paso es hallar la ordenada en el origen:b0, con la

siguiente formula:

donde:

Y obtenemos la ecuación de regresión:

Y = b0+b1(X)

,__

n

Yiy

n

Xix

x

xy

SC

SCB 1

_

1

_

0 xByB

EJEMPLO:

En un estudio de la relación entre la publicidad de una nueva

Clínica de Salud por radio y el número de consultas realizadas

durante 10 semanas, se han recopilado los tiempos de

duración en minutos de la publicidad por semana (X), y el

número de consultas realizadas(Y).

Semana 1 2 3 4 5 6 7 8 9 10

Publicidad X 20 30 30 40 50 60 60 60 70 80

Consultas

Realizadas Y

50 73 69 87 108 128 135 132 148 170

Solución

También se utilizara los

promedios de las variables:nYYnXX ii /,/

Reemplazando en las formula de los coeficientes de regresión, se tiene lo

siguiente:

Por lo tanto la recta de regresión Y = b0+b1(X), estará determinada de la

siguiente manera Y = 10+ 2x.

Interpretación

B0: El Número real de consultas realizadas es de 10.

B1: Por cada minuto de publicidad que se realice en la semana, el número de

consultas realizadas aumenta en 2.

…Solución

Error Estándar y Error de Estimación

Cuando se realiza una predicción, es importante determinarel error estándar, el cual se representa por Sy.x y mide ladispersión de los datos observados con respecto a la líneade regresión.

El error de estimación,

que esta representado: e = y – y

Error de

predicción

GRACIAS

regresion lineal

Documents