ejercicio de regresión lineal

9
Regresión lineal. Regresión lineal simple – MINITAB Problema 2: Asistente => regresión => para un factor => líneal Colocar él Y y X => seleccionar lineal => aceptar i i de datos Cantidad ms!" #ariar muc$o" Para obtener una estimación ms precisa% se deben utili&ar muestras ms grandes 'normal fuer&a de la relación" *as mediciones de la fuer&a de la relación% como el +,cuadrado y el +,cuadrado .l tama/o de su muestra 'n = 01! no es lo suficientemente grande como para pro#eer una estimación muy poco comunes atos resultados" 3o $ay puntos de datos poco comunes" *os puntos de datos poco comunes pueden tener una fuerte influen 3ormalidad e4iste una relación significati#a entre X y Y pudiera no ser e4acto" puntos de datos es pe5ue/o y los residuos no estn normalmente distribuidos% el #alor p utili&ado par ebido a 5ue usted tiene por lo menos 01 puntos de datos% la normalidad no representa un problema" 6i del modelo A-uste 8 *a línea se a-usta adecuadamente en reas de interés especial" 8 .l modelo a-usta apropiadamente cual5uier cur#atura en los datos 'e#ite un a-uste e4cesi#o!" 8 *a muestra cubre adecuadamente el rango de #alores de X" para asegurarse de 5ue: 9sted debe e#aluar el a-uste de los datos y del modelo de acuerdo con sus metas" bser#e la grfica d Verificar EstadoDescripción Regresión para dureza !" #s. temp $" Tar%eta de informe 0" Cantidad de datos: 2" atos poco comunes: no $ay datos atípicos% estos datos muestran un buen ni#el de residuo residuos at&picos' I residuos est(ndar I ) *.+ ;" 3ormalidad: (" A-uste del modelo: nos indica si el modelo es bueno% a-usta los da pronosticados 'deltas de Y! y el modelo" <ue los deltas de Y no estén le-os

Upload: emybenavente

Post on 05-Nov-2015

216 views

Category:

Documents


0 download

DESCRIPTION

Regresion lineal

TRANSCRIPT

Regresin lineal.Regresin lineal simple MINITABProblema 2:Asistente => regresin => para un factor => lnealColocar l Y y X => seleccionar lineal => aceptar

1. Cantidad de datos:2. Datos poco comunes: no hay datos atpicos, estos datos muestran un buen nivel de residuoresiduos atpicos: I residuos estndar I > 2.53. Normalidad: 4. Ajuste del modelo: nos indica si el modelo es bueno, ajusta los datos pronosticados (deltas de Y) y el modelo.Que los deltas de Y no estn lejos

Ecuacin para intervalos de prediccin y confianza.Revisar intervalos de confianza y prediccin. Intervalos de prediccin: lnea roja, valores no observados pero dentro del rango Intervalos de Confianza: lneas azules discontinuas, valores observados Para un 90% de confianza, acepto ms error, el intervalo de prediccin las lneas azules se cierra. Para un 99% de confianza, el intervalo de prediccin las lneas azules se abren.

Interpretacin: Prueba para varianza constante.Los residuos no presenta patrones como los cuadros amarillos, eso quiere decir que estn los datos bien tomados de manera aleatoria.

Interpretacin:P value del modelo < 0.005, muy bueno.

El R2 del cuadrtico es ms alto, significa que existe un mejor modelo (ecuacin) para hacer predicciones.S usamos el modelo alternativo cuadrtico: los residuos (errores) se hacen ms pequeos.

INTERPRETACION:

EXISTE CORRELACIN, porque mi p value < 0.05 p value < 0.001Su correlacin es de 0.92 con pendiente negativa.Lo que indica que hay significancia.

Para un x = 0 y = 75.27, significancia estadstica, pero de manera prctica depende del conocimiento de mi proceso. (S tiene o no sentido)Esto ayuda a escoger que modelo escoger de la alternativa que te puede dar el minitab.En caso no tenga sentido, La constante tiene sentido usarla para las predicciones.

Pendiente: Por cada unidad que aumenta de temperatura, la dureza reduce en 0.2684 COEFICIENTE DE CORRELACION R R>85%Cuando no hay correlacin R 0.62 es correlacin moderada o dbilS tienen signos de + y indican la direccin de la pendiente, toman valores desde -1 hasta +1

COEFICIENTE DE DETERMINACIN R2 R>70%

Cuando no hay determinacin R2 0.62 es correlacin moderada o dbil

ESTADISTICA => REGRESIN => AJUSTAR1. Modelo: queda igual2. Opciones. Ponderaciones: nada Nivel de confianza: 95 Tipo de intervalo: bilateral (para ambos lados) suma de cuadrados. Ajustado tipo III Box cox: usar cuando los datos no son normales

3. Codificacin: porque son datos continuos (numricos o letras) no aparece opciones, por eso se deja as.

4. Paso a paso: mtodo: ninguno.NOTA:USAR el Modelo de regresin paso a paso:Ecuacin lineal por cada segmento, para simplificar el comportamiento no linealALFA ENTRAR, ALFA RETIRARPara incluir el trmino para cada modelo o segmento.

5. Graficas:Residuos para graficas: EstandarizadosGraficas residuos: 4 en 1

6. Resultados: hacer check tambin a Durbin Watson.

7. Almacenamiento:

Ajustes, residuos estandarizados, DFITS, coeficientes.

8. Aceptar

Anlisis de Varianza - ANNOVA

Fuente GL SC Ajust. MC Ajust. Valor F Valor pRegresin 1 168.37 168.370 76.63 0.000 temp (x) 1 168.37 168.370 76.63 0.000Error 13 28.56 2.197 Falta de ajuste 9 15.90 1.766 0.56 0.786 Error puro 4 12.67 3.167Total 14 196.93

LA TEMPERATURA TIENEN SIGNIFICANCIA RESPECTO A LOS VALORES OBTENIDOS DE DUREZA

Resumen del modelo

R-cuad. R-cuad. S R-cuad. (ajustado) (pred)1.48229 85.50% 84.38% 81.25%

LA TEMPERATURA TIENEN SIGNIFICANCIA RESPECTO A LOS VALORES OBTENIDOS DE DUREZA

Coeficientes

EE delTrmino Coef coef. Valor T Valor p VIFConstante 75.27 3.74 20.14 0.000temp (x) -0.2684 0.0307 -8.75 0.000 1.00

Ecuacin de regresin

dureza (y) = 75.27 -0.2684temp(x)

Ajustes y diagnsticos para todas las observaciones

ResidObs dureza (y) Ajuste Resid est. 1 49.000 48.156 0.844 0.65 2 44.000 44.398 -0.398 -0.28 3 46.000 44.398 1.602 1.13 4 38.000 37.687 0.313 0.24 5 43.000 42.250 0.750 0.52 6 47.000 46.545 0.455 0.33 7 41.000 39.029 1.971 1.44 8 38.000 39.029 -1.029 -0.75 9 47.000 47.082 -0.082 -0.06 10 45.000 45.740 -0.740 -0.53 11 43.000 45.740 -2.740 -1.97 12 37.000 39.029 -2.029 -1.48 13 44.000 41.713 2.287 1.60 14 40.000 39.834 0.166 0.12 15 39.000 40.371 -1.371 -0.97

Residuos atpicos: I residuos estndar I > 2.5NO HAY RESIDUOS Atpicos

Estadstico de Durbin-Watson

Estadstico de Durbin-Watson = 1.75396

PRUEBA EL SUPUESTO DE VARIANZA CONSTANTE DE RESIDUOS, SE BUSCA EN TABLAS, QUE ESTAN EN VALORES MINIMOS Y MAXIMOS A LA CANTIDAD DE DATOS.

SE DESEA UN ESTASDITICO > 1 cumple el supuesto de varianza constate de de residuos.

Grafica, regresin, grafica de lnea ajustadaGRAFICA DE LINEA AJUSTADA BINARIA

Seleccionar y, xGraficas: Residuos para las graficas: estandarizados. Graficas de residuos: check a residuos vs. Orden o 4 en 1

Opciones: check a mostrar IC y IP aun 95%

Almacenamiento: no se hace check a nada porque ya anteriormente se realizo el check.

Queremos que nuestros datos azules estn dentro de la lnea verde. INTERVALOS DE CONFIANZA S la mayora estn dentro del rango, nuestro modelo sera muy bueno.

Si algunos puntos estn fuera de la lnea verde queremos que estn dentro de la LINEA MORADA, ya que indica el intervalo de prediccin.

S estn fuera de la lnea morada, el modelo es pobre, no es consistentes desde un inicio, eso lo indicara el annova.

S: error estndar o error tpico

Prediccin para dureza (y)

Ecuacin de regresin

dureza (y) = 75.27 -0.2684temp (x)

Valor deVariable configuracintemp (x) 124

Ajuste EE de ajuste IC de 95% IP de 95%41.9817 0.392239 (41.1343, 42.8291) (38.6692, 45.2942)

Segn la ecuacin: Y = 75.27 0.2684 XLa ecuacin es vlida solo para datos no observados dentro del rango de los observados.

Para un temp=124 dureza=41.9817 es la estimacin media o valor ajustado, porque est dentro del rango del IP (dentro de las especificaciones) al 95%