regresion lineal

20
REGRESIÓN POR MÍNIMOS CUADRADOS

Upload: johannen-alcocer

Post on 16-Aug-2015

239 views

Category:

Documents


7 download

TRANSCRIPT

REGRESIN POR MNIMOS CUADRADOS Anlisis de regresin Generaunaecuacinparadescribirlarelacinestadsticaentreunooms predictoresylavariablederespuestayparapredecirnuevasobservaciones.La regresin generalmente utiliza el mtodo de mnimos cuadrados ordinarios, del cual se obtiene la ecuacin al minimizar la suma de los residuos cuadrados. Losresultadosderegresinindicanladireccin,eltamaoylasignificancia estadstica de la relacin entre un predictor y una respuesta. El signo de cada coeficiente indica la direccin de la relacin. Los coeficientes representan el cambio de la media en la respuesta para una unidad decambioenelpredictormientrasmantieneconstantesotrospredictoresenel modelo. Elvalorpdecadacoeficientepruebalahiptesisnuladequeelcoeficientees igualacero(notieneefecto).Porlotanto,losvalorespbajossugierenqueel predictor es una adicin significativa a su modelo. Laecuacinpredicenuevasobservacionesdadosvalorespredictores especficos. Porejemplo,ustedtrabajaparaunacompaadechipsdepatatasqueanalizalos factoresqueafectanelporcentajedechipsdesmenuzadosporcontenedorantesdel envo (la variable de respuesta). Usted lleva a cabo el anlisis de regresin e incluye el porcentaje de patatas con respecto a otros ingredientes y la temperatura de coccin (centgrados) como su dos predictores. A continuacin, se muestra una tabla simplificada de resultados. Los resultados de regresin indican que ambos predictores son significativos debido a sus valores p bajos. Juntos, los dos predictores conforman el 67.2% de la varianza de chips de patatas rotos. Especficamente: Se espera que, por cada aumento del 1% en la cantidad de patatas, el porcentaje de chips rotos baje en 0.044%. Por cada aumento de 1 grado centgrado en la temperatura de coccin, se espera que el porcentaje de chips rotos aumente en 0.023%. Para predecir el porcentaje de chips rotos para valores de configuracin de 50% de patatasyunatemperaturadecoccinde175C,ustedcalculaunvaloresperadode 4.831% de chips de patatas rotos. Me entendiste???? O quieres uncaso prcticoen MINITAB? De ser asrealizar antes: a) ejercicio de regresin lineal b)Ejercicio de regresin mltiple REGRESINLINEAL Ustedesunfabricantequedeseaobtenerunamedidadecalidaddeunproducto,peroel procedimiento para obtener la medida es costoso. Existe un mtodo indirecto, el cual utiliza una puntuacindelproductodiferente(Puntuacin1)enlugardelamedidadecalidadreal (Puntuacin2).Estemtodoesmenoscostosoperotambinmenospreciso.Ustedpuede utilizar la regresin para ver si la Puntuacin 1 explica una cantidad significativa de varianza en laPuntuacin2yparadeterminarsilaPuntuacin1esunsustitutoaceptableparala Puntuacin 2. 1Abra la hoja de trabajo EJA_REGR.MTW. 2Elija Estadsticas > Regresin > Regresin. 3En Respuesta, ingrese Puntuacin2. 4En Predictores, ingrese Puntuacin1. 5 Haga clic en Aceptar.6 Observe el resultado Interpretacin de los resultados Por opcin predeterminada, Minitab muestra los resultados en la ventana Sesin. El valor p en la tabla Anlisis de varianza (0.000), indica que la relacin entre la Puntuacin 1 y la Puntuacin 2esestadsticamentesignificativaenunnivelade.05.Estotambinlomuestraelvalorpdelcoeficiente estimado de la Puntuacin 1, el cual es 0.000. El valor de R2 muestra que la Puntuacin 1 explica el 95.7% de la varianza en la Puntuacin 2, lo que indica que el modelo seajusta a los datos extremadamente bien. La Observacin 9 se identifica como una observacin inusual porque su residuo estandarizado es menor que -2. Esto podra indicar que esta observacin es un valor atpico. Vase Identificacin de valores atpicos en el software MINITAB DebidoaqueelmodeloessignificativoyexplicaunagranpartedelavarianzaenlaPuntuacin2,el fabricantedecideutilizarlaPuntuacin1enlugardelaPuntuacin2comounamedidadecalidadparael producto. REGRESIN MLTIPLE Comopartedeunapruebadeenergatrmicasolar,ustedmideelflujodecalortotalenun conjuntodeviviendas.Usteddeseadeterminarsielflujodecalortotal(FlujoCalor)puede predecirse tomando en cuenta la posicin de los puntos focales en las direcciones de este, sur y norte. Usteddetermin,utilizandolaregresindelosmejoressubconjuntos,queelmodelodelos mejoresdospredictoresinclualasvariablesNorteySur,yqueelmodelodelosmejorestres predictores agregaba la variable Este. Usted evala el modelo de los mejores tres predictores utilizando la regresin mltiple. 1Abra la hoja de trabajo EJA_REGR.MTW. 2Elija Estadsticas > Regresin > Regresin. 3En Respuesta, ingreseFlujoCalor.4En Predictores, ingrese Este Sur Norte. 5Haga clic en Grficas.6En Residuos para grficas, elija Estandarizados.7En Grficas de residuos, elija Grficas individuales. Marque Histograma de residuos, Grfica normal de residuos, y Residuos vs. ajustes. Haga clic en Aceptar. 8 Haga clic en Opciones.9 En Mostrar, marque PRESS y R-cuadrada pronosticada. Haga clic en Aceptar en cada cuadro de dilogo. Interpretacin de los resultados Salida de la ventana Sesin ElvalorpenlatablaAnlisisdevarianza(0.000)muestraqueelmodeloestimado mediante el procedimiento de regresin es significativo en un nivel a de 0.05. Esto indica que al menos un coeficiente es diferente de cero. Los valores p para los coeficientes estimados de Norte y Sur son ambos de 0.000, lo cual indicaqueestnsignificativamenterelacionadosconFlujoCalor.ElvalorpparaEsteesde 0.092,loqueindicaquenoestrelacionadoconFlujoCalorenunnivelade0.05. Adicionalmente, la suma secuencialde los cuadrados indicaqueelpredictor Estenoexplica unacantidadsustancialdelavarianzanica.Estosugierequeunmodeloquesolamente tome en cuenta Norte y Sur podra ser ms apropiado. El valor R2 indica que los predictores explican el 87.4% de la varianza en FlujoCalor. El valor de R2 ajustada es de 85.9%, lo cual explica el nmero de predictores en el modelo. Ambos valores indican que el modelo se ajusta bien a los datos. El valor de R2 pronosticada es de 78.96%. En virtud de que el valor de R2 pronosticada est cercadelosvaloresdeR2yR2ajustada,elmodelonopareceestarsobreajustadoytiene una capacidad predictiva adecuada. Las observaciones 4 y 22 estn identificadas como inusuales porque el valor absoluto de los residuos estandarizados es mayor que 2. Esto podra indicar que se trata de valores atpicos. Vase Verificacinde su modelo,Identificacinde valoresatpicos yEleccindeuntipode residuo.Salida de la ventana Grfica Elhistogramaindicaquelosdatospodrantenervaloresatpicos,locualsemuestramediante dos barras, en el extremo derecho de la grfica. La grfica de probabilidad normal muestra un patrn aproximadamente lineal que concuerda con una distribucin normal. Los dos puntos de la esquina superior derecha de la grfica pueden ser valoresatpicos.ElDestacadodelagrficaidentificaestospuntoscomo4y22,losmismos puntos que fueron etiquetados como observaciones inusuales en la salida. Vase Verificacin de su modelo e Identificacin de valores atpicos. Lagrficaderesiduosversusvaloresajustadosmuestraquelosresiduossehacenms pequeos (se acercan a la lnea de la referencia) a medida que aumentan los valores ajustados, lo cual podra indicar que los residuos tienen una varianza no constante. AHORA PODEMOS HACER LOS TRES EJERCICIOSPARA COMPRENDER EL TEMA