taller 1-regresión _diseño e

8
2015-1 DISEÑO EXPERIMENTAL CRISTIAN SERNA Cod. 1711323062 KENNETH FLOREZ Cod. 1711416427 TALLER N°1 - REGRESIÓN LINEAL (Simple y Múltiple) Profesor: OMAR ALBERTO TAPASCO ALZATE

Upload: cristian-serna

Post on 16-Nov-2015

7 views

Category:

Documents


1 download

DESCRIPTION

Documento con respuestas al taller de regresión lineal propuesto por el docente Omar Tapasco, U Caldas

TRANSCRIPT

  • 2015-1

    DISEO EXPERIMENTAL

    CRISTIAN SERNA Cod. 1711323062 KENNETH FLOREZ Cod. 1711416427

    TALLER N1 - REGRESIN LINEAL (Simple y Mltiple)

    Profesor: OMAR ALBERTO TAPASCO ALZATE

  • DESARROLLO

    Ejercicio No.1 Relacin entre el periodo de incubacin y la media del tiempo de incubacin

    a) Diagrama de dispersin:

    b) Modelo de mnimos cuadrados

    t incubacin (estimado)= 21.54 + 0.88 periodo incubacin

    Interpretacin:

    0: Si transcurren cero (0) das desde que se pusieron los huevos (periodo de incubacin), se

    esperara que el nmero de minutos dedicados a la incubacin ininterrumpida del nido

    (media del tiempo de incubacin) fuese de 21.54 minutos.

    1: Por cada minuto dedicado a la incubacin (media del tiempo de incubacin)

    incrementado, se espera un incremento del 0.87 % en el periodo de incubacin.

    13182328333843

    0 5 10 15 20

    Tiempo medio de incubacin Vs Periodo de incubacin

    y = 0.8781x + 21.535 R = 0.7418

    0

    20

    40

    60

    0 5 10 15 20 25

    Tiempo medio de incubacin Vs Periodo de incubacin

    Tiempo medio de incubacin- Y

    Lineal (Tiempo medio deincubacin - Y )

  • c) Intervalos de confianza

    El coeficiente para o (21.53) cae dentro del intervalo de confianza. Margen de

    error para o {19.13, 23.9}

    El coeficiente para 1 (0.878) cae dentro del intervalo de confianza. Margen de

    error para 1 {0.66, 1.09}

    Intervalos Inferior 95%

    Superior 95%

    Bo 19.1293144 23.9407358

    B1 0.65986891 1.09636993

    d) Tabla ANOVA:

    ANLISIS DE VARIANZA

    Grados de libertad

    Suma de cuadrados

    Promedio de los cuadrados Fo Valor P

    Regresin 1 880.6186851 880.6186851 68.9562024 1.6207E-08

    Residuos 24 306.4966996 12.77069581 Total 25 1187.115385

    e) Conclusin de las pruebas de Hiptesis

    H0 1=0 {El tiempo medio de incubacin no se relaciona con el perodo de incubacin}

    Hi 10 {Existe relacin lineal entre el tiempo medio de incubacin y el perodo de

    incubacin del ave marina estudiada.}

    Con un nivel de confianza del 95% se rechaza la H0 (p = 1.6207*10-08 < 0.05 = ); es decir,

    existe una relacin lineal entre el periodo de incubacin y la media del tiempo de

    incubacin.

    f) Coeficiente de determinacin:

    El 74% de la variabilidad total en los datos del tiempo medio de incubacin, es explicado

    por el modelo lineal que contempla el perodo de incubacin como variable

    independiente. Hay correlacin aceptable (> 0.70) en el modelo.

    Estadsticas de la regresin

    Coeficiente de correlacin mltiple 0.861286185

    Coeficiente de determinacin R^2 0.741813893

    R^2 ajustado 0.731056139

    Error tpico 3.573611033

  • g) Grfico de residuales:

    Se cumple el supuesto de homocedasticidad. El grfico de residuales sigue una

    distribucin normal (no sigue ningn patrn).

    h) Grfico de probabilidad normal:

    El comportamiento de la grfica muestra una tendencia de relacin lineal entre las

    variables periodo de incubacin (nmero de das desde que se pusieron los huevos) y la

    media del tiempo de incubacin (nmero de minutos dedicados ininterrumpidamente al a

    incubacin del nido); indicando que una variable influye fuertemente en la otra.

    i) Conclusiones generales del anlisis:

    El modelo lineal explica la correlacin entre las variables: periodo de incubacin y

    la media del tiempo de incubacin de manera satisfactoria.

    El tiempo de incubacin estimado, arrojado por el modelo, se relaciona con el

    tiempo de incubacin observado; lo que nos dice que el pronstico del modelo se

    acerca a la realidad.

    El modelo que mejor explica la relacin es el polinmico (R = 0.755)

    -20

    0

    20

    0 5 10 15 20 25Re

    sid

    uo

    s

    Periodo de Incubacin - X

    Periodo de Incubacin - X Grfico de los residuales

    0

    20

    40

    60

    0 20 40 60 80 100

    Tie

    mp

    o m

    ed

    io d

    e

    incu

    bac

    in

    Muestra percentil

    Grfico de probabilidad normal

  • j) Otros modelos:

    y = 21.891e0.0299x R = 0.7189

    15

    25

    35

    45

    0 5 10 15 20 25

    Tiempo medio incubacin

    Tiempo medioincubacin

    Exponencial (Tiempomedio incubacin )

    y = 4.9182ln(x) + 20.749 R = 0.6547

    15

    25

    35

    45

    0 5 10 15 20 25

    Tiempo medio incubacin

    Tiempo medioincubacin

    Logartmica (Tiempomedio incubacin )

    y = 21.055x0.1746 R = 0.6887

    15

    25

    35

    45

    0 5 10 15 20 25

    Tiempo medio incubacin

    Tiempo medioincubacin

    Potencial (Tiempomedio incubacin )

    y = -0.02x2 + 1.3024x + 20.232 R = 0.755

    15

    25

    35

    45

    0 5 10 15 20 25

    Tiempo medio incubacin

    Tiempo medioincubacin

    Polinmica (Tiempomedio incubacin )

  • Ejercicio No.2 Saponificacin del acetato de etilo por el HCL.

    Ecuacin de la reaccin:

    = 0

    Modelo de linealizacin:

    Modelo exponencial: = 0

    = 3.40380 0.0051

    Dnde:

    0: 3.4038 => ( + )

    : -0.0051 => 0

    a) La constante de velocidad de esta reaccin (k) es -0.0051

    Los intervalos de confianza estn determinados as:

    Variables Inferior 95% Superior 95%

    0 = 3.40375289 3.31756416 3.48994162

    1 = -0.00512214 -0.00606676 -0.00417752

    Lo que nos dice que los coeficientes de relacin caen dentro del rango de confianza

    estipulado

    b) Conclusin:

    Coeficiente de determinacin: R^2 (0.96704103).

    El 96.70% de la variabilidad total de los datos de concentracin es explicado por el modelo

    lineal, que contempla la cantidad de tiempo como variable explicativa.

    Coeficiente de relacin: R (0.98338245)

    Tiene un alto nivel de correlacin inversa, ya que se observa en la grfica un patrn

    inverso (r-1); patrn inversamente proporcional.

    y = -0.0051x + 3.4038 R = 0.967

    2

    2.5

    3

    3.5

    0 50 100 150 200

    CONCENTRACIN

    CONCENTRACIN

    Lineal (CONCENTRACIN)

  • c) La pendiente obtenida 1, puede interpretarse como el cambio en la medida de Y para un

    cambio unitario en X. En trminos del ejercicio, para un 1= -0.00512214 sera el valor del

    incremento unitario para cada valor de X, que se vera reflejado en Y

    En el planteamiento de las hiptesis encontramos lo siguiente:

    H0: 1=0 {Se rechaza la hiptesis nula}

    Hi: 10 {Se acepta la hiptesis alterna}

    Interpretacin: Con un nivel de confianza del 95% se rechaza la H0 (1.133*10-05 < =0.05) y

    se acepta la (Hi); quiere decir que hay una relacin lineal inversamente proporcional entre

    la concentracin C(mmol)/Lt y el tiempo t(min) como variable independiente

    Ejercicio No.3 Seguimiento a pacientes de hipertensin.

    El anlisis del ejercicio para verificar la incidencia de las variables X1,, X4 en Y, est basado

    en las pruebas de hiptesis y en la determinada probabilidad de cada variable X en la

    tabla ANOVA.

    Prueba de hiptesis

    H0: 1 = 2 = 3 = 4 = 0 {Ninguna de las variables (Xj) influye en Y}

    Hi: j 0 {Al menos una de las variables incide en Y}

    Tabla ANOVA

    ANLISIS DE VARIANZA

    Grados de

    libertad Suma de

    cuadrados Promedio de los

    cuadrados Fo Valor P

    Regresin 4 518.5478499 129.6369625 46.910822 2.632E-08

    Residuos 15 41.45215013 2.763476676 Total 19 560

    Conclusin: Con un nivel de confianza del 95% se rechaza la H0 (p = 2.632*10-08< 0.05 = );

    es decir, existe una relacin de al menos una variable Xj frente a Y.

    Procedemos a exponer cual variable Xj influye en Y:

    Coeficientes Error tpico Estadstico t Probabilidad

    Intercepcin 0.789919593 8.716042145 0.090628244 0.92898713

    X1 1.121665734 0.133237796 8.418525113 4.5698E-07

    X2 0.155779644 0.196072333 0.794500891 0.43929401

    X3 0.103253275 0.178960896 0.576959983 0.57252443

    X4 0.011361315 0.013522209 0.840196706 0.41399037

  • La variable con mayor coeficiente de probabilidad (Valor P) en primera instancia es la

    variable X3, puesto que esta es mayor a Alpha (0.57252443 > = 0.05); por lo tanto se

    elimina de las variables a tener en cuenta y se hace un nuevo anlisis.

    Coeficientes Error tpico Estadstico t Probabilidad

    Intercepcin 2.31887041 8.12847475 0.28527743 0.77909147

    X1 1.177987 0.08877113 13.2699342 4.7284E-10

    X2 0.18146988 0.18692632 0.97080968 0.34609133

    X4 0.01603502 0.01059919 1.51285325 0.1498176

    Nuevamente encontramos que la variable X2 es mayor a Alpha (0.34609133 > = 0.05);

    por lo tanto se elimina de las variables a tener en cuenta y se hace un nuevo anlisis.

    Coeficientes Error tpico Estadstico t Probabilidad

    Intercepcin 1.71022723 8.09053664 0.21138613 0.83509934

    X1 1.19522437 0.08683 13.7651086 1.2005E-10

    X4 0.01923779 0.01005563 1.91313628 0.07272597

    Nuevamente encontramos que la variable X2 es mayor a Alpha (0.07272597 > = 0.05);

    por lo tanto se elimina de las variables a tener en cuenta y se hace un nuevo anlisis.

    NOTA: Si se trabajara a un nivel de confianza menor, como un 90% ( = 0.1) podran

    aceptarse estas dos variables como incidencia directa en Y

    Coeficientes Error tpico Estadstico t Probabilidad

    Intercepcin 2.20530533 8.66333119 0.25455628 0.80195129

    X1 1.2009313 0.09297008 12.9173953 1.5279E-10

    CONCLUSIN:

    En vista de que el valor P de solo una variable es menor a alhpa, podemos considerarla

    como la nica influyente en Y, lo cual quiere decir que con un nivel de confianza (N.C) del

    95% la hiptesis alterna (Hi) se acepta.

    El valor observado y el estimado tienen una relacin estrecha, lo que nos dice que el

    modelo se acerca a la realidad.

    y = 0.7516x + 7.4068 R = 0.9026

    80

    90

    100

    110

    104 109 114 119 124 129

    X1

    X1

    Lineal (X1)