unitec analisisderegresión

4

Click here to load reader

Upload: jose-de-jesus

Post on 14-Apr-2017

179 views

Category:

Data & Analytics


0 download

TRANSCRIPT

Page 1: Unitec analisisderegresión

1.      Una distribuidora de refrescos ha realizado un análisis para una nueva campaña publicitaria;

para ello cuenta con los registros de 8 campañas anteriores de gastos en publicidad

y las ventas en cajas.

a)      Construya un diagrama de dispersión e interprételo

b)      Estime el coeficiente de correlación e interprételo

c)      Estime el coeficiente de determinación e interprételo

d)      Investigue si el coeficiente de correlación poblacional es positivo con un

nivel de significancia de 0.10. Utilice una prueba de hipótesis

e)      Encuentre la ecuación de regresión y exprese la ecuación con los resultados obtenidos.

f)       Encuentre el valor de los residuales (errores)

g)      Encuentre el error de estimación (error típico)

h)      Realice una prueba de hipótesis para saber si los coeficientes son

estadísticamente significativos. Utilice un nivel de significancia del 10%

No. de

observaciónGASTOS (X)

VENTAS DE

CAJAS DE

REFRESCOS

(Y)

1 135 102 4692.25

2 92 105 650.25

3 60 107 42.25

4 56 108 110.25

5 40 110 702.25

6 29 110 1406.25

7 100 104 1122.25

8 20 110 n= 8 2162.25

Promedio 66.5 107 Sxx= 10888

a)      Construya un diagrama de dispersión e interprételo

101

102

103

104

105

106

107

108

109

110

111

0 20 40 60 80 100 120 140 160

Ve

nta

de

Caj

as d

e R

efr

esc

os

Gastos

Page 2: Unitec analisisderegresión

Podemos notar gráficamente que hay una relación lineal entre las variables "venta" y "Gastos",

lo cual indica que podemos aplicar una recta de regresión con pendiente negativa.

b)      Estime el coeficiente de correlación e interprételo

Coeficiente de correlación: -0.99

Nuestro coeficiente de correlación es cercano a -1, eso quiere decir

que, las varibles estan relacionadas a una recta de pendiente negativa.

c)      Estime el coeficiente de determinación e interprételo

Coeficiente de Determinación: 97.26% <- El 97% de la variación de Y esta explicada por

el modelo de regresión

d)      Investigue si el coeficiente de correlación poblacional es positivo con un nivel de significancia

de 0.10. Utilice una prueba de hipótesis

El estadístico de prueba tiene distribución T-Student con n-2 grados de libertad.

= -10.38485

Si a = 0.1 a/2= 0.05

La región de rechazo es: | t0 |>ta/2 -2.446912

Como T= -10.38 es menor a -2.44 se rechaza la H0, es decir, se rechaza la hipótesis

de que el valor de coeficiente de correlación es "0".

e)  Encuentre la estimación de la ecuación de regresión y exprese la ecuación con los

resultados obtenidos.

Y = -0.0768x + 112.11

Coeficientes Error típico

Intercepción 112.105988 0.40033872

Variable X 1 -0.07678178 0.00526431

0 :

0 :

1

0

H

H

21

2

r

nrT

Page 3: Unitec analisisderegresión

Análisis de los residuales

ObservaciónPronóstico

para Y

1 101.740448

2 105.042065

3 107.499082

4 107.806209

5 109.034717

6 109.879317

7 104.42781

8 110.570353

f)       Encuentre el valor de los residuales (errores)

Residuos

0.2595518

-0.042064658

-0.499081558

0.19379133

0.96528288

0.120683321

-0.427810434

-0.570352682

g)      Encuentre el error de estimación (error típico)

Coeficientes Error típico

Intercepción 112.105988 0.40033872

Variable X 1 -0.07678178 0.00526431

Estadísticas

de la

regresión

Coeficiente de correlación múltiple 0.98618923

Coeficiente de determinación R^2 0.97256919

R^2 ajustado 0.96799739

Error típico 0.54930767

Observaciones 8

0

2

0 50 100 150

Re

sid

uo

s

Variable X 1

Variable X 1 Gráfico de los residuales

Page 4: Unitec analisisderegresión

h)Realice una prueba de hipótesis para saber si los coeficientes son estadísticamente significativos.

Utilice un nivel de significancia del 1%

El estadístico de prueba tiene distribución T-Student con n-2 grados de libertad.

= -14.58534 Sxx= 10888

Si a = 0.1 a/2= 0.05

La región de rechazo es: | t0 |>ta/2 -2.446912

Como T= -14.58 es mayor a -2.44 sechaza la H0, es decir, se rechaza la hipótesis

de que el valor de B1 es "0".

ANÁLISIS DE VARIANZA

Grados de

libertad

Suma de

cuadrados

Promedio de

los

cuadrados

FValor crítico

de F

Regresión 1 64.1895665 64.1895665 212.732143 6.5176E-06

Residuos 6 1.8104335 0.30173892

Total 7 66

0 :

0 :

11

10

βH

βH

xx

E

S

MST 11

ˆ