correlación simple- estadística
Post on 04-Mar-2016
231 Views
Preview:
DESCRIPTION
TRANSCRIPT
-
Tema 8REGRESIN LINEAL SIMPLE
Dr Carlos Tapia Snchez
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
1 El diagrama de dispersinEs un grfico que permite detectar la existencia de una relacin entre dos variables.Visualmente se puede buscar patrones que indiquen el tipo de relacin que se da entre las variables.
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
2 Las ecuaciones lineales simplesSi dos variables, como X e Y, estn relacionadas, se puede expresar como una relacin, por ejemplo:Y = 3 + 1,5XAl conocer la ecuacin se puede: a) Calcular el valor de Y para cualquier valor dado de X b) Conocer el cambio en Y, cuando X vara en 1
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
Por ejemplo: Y = 3 + 1,5X
Hoja1
ValorValorCambio
dado de Xcalculado de Yde Y
14,5-
26,01,5
37,51,5
49,01,5
510,51,5
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
El aumento en Y, cuando X vara en una unidad, est dado por el coeficiente de X.
Ejemplo:
En Y = 10 + 2Xcuando X aumenta en 1, Y aumenta en 2
En Y = 5 - 0,8Xcuando X aumenta en 1, Y disminuye en 0,8
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
A) Tipos de VariablesEn una ecuacin como Y = 30 + 3X, el valor de Y depende del valor que toma X, por eso a Y se le llama variable dependiente, y a X se le llama variable independiente. Y = b0 + b1 XVariableDependienteVariableIndependiente
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
B) Tipo de RelacionesCuando cambios en X provoca cambios en Y en igual sentido (aumentos o disminuciones), las variables estn directamente relacionadas. Se observa el signo +Ejemplo:Y = 30 + 5X
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
Cuando cambios en X, provoca variaciones en Y en sentido inverso (X aumenta, Y disminuye o viceversa), las variables estn inversamente relacionadas. Se observa en la ecuacin el signo -.XYEjemplo:Y = 20 - 3X
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
La ecuacin es de primer grado si la variable independiente est elevada al exponente 1. Su grfica genera una lnea recta (por lo que tambin se le llama ecuacin lineal)
Ejemplo: Y = 30 + 4 XC) Grado de la ecuacin:
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
Si la variable independiente est elevada a un exponente diferente a 1, la ecuacin toma el valor del exponente. Su grfica no es una lnea recta.Ejemplo:
Y = 10 + 3 X + 4 X2 : ecuacin de segundo gradoY = 3 + 7X + 5 X3 : ecuacin de tercer grado
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
D) Ecuaciones simples y mltiples: Simples: Muestra la relacin entre dos variablesY = 30 + 2XY = 10 - 3X2 Mltiple: Muestra la relacin entre tres o ms variablesY = 3X + 8 ZY = 5 + 2X2 + 4W
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
D) Grfica de una ecuacin de primer grado:Ejemplo: Y = 3 + 1,5X
Los cinco pares de valores se diagraman de la forma siguiente.
X
1
2
3
4
5
Y
4,5
6,0
7,5
9,0
10,5
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
E) Forma general:La ecuacin simple de primer grado tiene la siguiente forma generalY = b0 + b1 XDonde:b1: pendiente, o sea, el cambio en Y cuando X = 1.b0: el valor autnomo, es decir, Y = b0 cuando X = 0. En la grfica es la interseccin con el eje YEjemplo: Y = 3 + 1.5X
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
17.3 Regresin lineal simpleEs una tcnica estadstica que permite determinar la mejor ecuacin que represente la relacin entre dos variables relacionadas.
Para poder establecer la relacin cuantitativa entre X e Y es necesario disponer de pares de observaciones. Cada par ha sido registrado a la misma unidad elemental.
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
A) Suposiciones de regresin y correlacina) Normalidad: los valores de Y estarn distribuidos normalmente a cada valor de X.b) Homoscedasticidad: la variacin alrededor de la lnea de regresin sea constante para todos los valores de X. c) Independencia de error: el error (diferenciaresidual entre un valor observado y uno estimado de Y) sea independientemente de cada valor de X.d) Linealidad: la relacin entre las variables es lineal.
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
La ecuacin general = b0 + b1X se llama ecuacin de regresin y permite estimar o predecir los valores de Y.Es el procedimiento matemtico utilizado para determinar los valores numricos de los coeficientes de regresin: b0 y b1B) El mtodo de Mnimos Cuadrados
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
El mtodo consiste en determinar una ecuacin que la suma de los errores al cuadrado sea mnima.
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
El mtodo utiliza un sistema de ecuacin llamado ecuaciones normales, que tienen la siguiente forma:Para aplicar las frmulas, tenemos que confeccionar un cuadro como el siguiente:
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
AplicacinLos datos siguientes muestran las cantidades consumidas de complemento nutricional (en Kg.) y el aumento de peso de nios con signos de desnutricin.Presente la informacin en un diagrama de dispersin
PACIENTE12345678910COMPLEMENTO1.01.52.02.53.03.54.04.55.05.5EN Kg: XAUMENTO DE810912141315171414PESO : Y
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
XYX2XY1.08.01.08.01.510.02.315.02.09.04.018.02.512.06.330.03.014.09.042.03.513.012.345.54.015.016.060.04.517.020.376.55.014.025.070.05.514.030.377.032.5126.0126.3442.0
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
Sustituyendo los valores , n = 5, y ,en las ecuaciones normales, obtenemos el siguiente sistema de ecuaciones. 126 = 10b0 + 32,5b1442 = 32,5b0 + 126,3b1Resolviendo el sistema tenemos: b0 = 7,479 b1= 1,576 ,por lo tanto,
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
c) Interpretacin
b0 = 7,478 : Es probable que un paciente desnutrido que no sea considerado dentro del Programa de Alimentacin Complementaria tenga un peso de 7,478 Kg.
b1 = 1,576:Por cada Kg. del alimento complementario, se espera que probablemente el nio aumento su peso en 1,576 Kg.
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
17.4 Error estndar de estimacin (Syx)Mide la disparidad promedio entre los valores observados y estimados de la variable Y. Se calcula por la siguiente relacin 14
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
XY1.08.09.055-1.11.1121811.510.09.8430.20.0248062.09.010.630-1.62.6582042.512.011.4180.60.3383753.014.012.2061.83.2177183.513.012.9940.03.48E-054.015.013.7821.21.4835244.517.014.5702.45.9053865.014.015.358-1.41.8436215.514.046-2.14.60402832.5126.0126.00.021.2
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
El Syx es un indicador del grado de precisin con que la ecuacin de regresin describe la relacin entre las dos variables: cuanto ms pequeo, los valores observado y estimado de Y son razonablemente cercanos y, la ecuacin de regresin es una buena descripcin esa la relacin.Reemplazando en la formula
-
Tema 9 CORRELACIN SIMPLE
Dr Carlos Tapia Snchez
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
17.5 El anlisis de correlacinEl anlisis de correlacin es la tcnica estadstica que permite describir el grado hasta el cual una variable est linealmente relacionada con otra.Hay dos medidas que se usan para describir la correlacin El coeficiente de determinacin El coeficiente de correlacin
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
A) El coeficiente de determinacinAl construir un modelo de regresin, se define que el valor Y depende de X.Y = f (X)Si la relacin es lineal: Y = b0 + b1XPero en la prctica Y depende tambin de otros factores diferentes a X:Y = b0 + b1X + Parte de los cambios en Y pueden explicarse por X, a otro se llama variacin explicada.Pero hay cambios en Y que no pueden explicarse por X, a lo que se llama variacin no explicada.
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
VARIACIONVARIACIONVARIACION TOTAL =EXPLICADA +NO EXPLICADAVariacinTotalVariacinno explicadaVariacinExplicadaYX
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
El coeficiente de determinacin se puede calcular del modo siguiente:Se elevan al cuadrado, para evitar queobtenindose un nmero positivo.
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
1er Paso: Clculo de la venta media por vendedor son ( )
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
Y8.012.6-4.621.1610.012.6-2.66.769.012.6-3.612.9612.012.6-0.60.3614.012.61.41.9613.012.60.40.1615.012.62.45.7617.012.64.419.3614.012.61.41.9614.012.61.41.96126.0126.00.072.4
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
9.05512.6-3.54512.56999.84312.6-2.7587.603810.63012.6-1.9703.879311.41812.6-1.1821.396412.20612.6-0.3940.155112.99412.60.3940.155313.78212.61.1821.397114.57012.61.9703.880515.35812.62.7587.605516.14612.63.54612.5720126.0126.00.051.2
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
4to Paso: Se compara la variacin explicada y la variacin total.5to Paso: Interpretacin: 70,7% de las variaciones en el incremento de peso, pueden explicarse por el consumo del complemento nutricional.
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
Valores posibles de r2Si r2 = 1 : Correlacin perfecta, es decir, toda variacin de Y puede explicarse por XSi r2 = 0 : no existe correlacin entre X e Y. La variacin explicada es 0. La variable X no explica nada de los cambios en YResumenCuanto ms cerca a uno, las variables tendrn mayor correlacin.
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
B) El coeficiente de correlacinEs la raz cuadrada del coeficiente de determinacin.
Sus valores oscilan entre -1 y 1 Cuando r es positivo, indica que X e Y estn directamente relacionados.
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
Cuando r es negativo, indica que X e Y estn inversamente relacionados. El coeficiente r tiene el mismo signo que el coeficiente b1 en la ecuacin de regresin
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
Interpretacin del coeficiente de correlacin de Pearson-100,50,91-0,9-0,5PerfectaNegativaPerfectaPositivaFuerteNegativaDbilNegativaDbilPositivaModeradaPositivaFuertePositivaModeradaNegativaNo existe correlacin
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
r2= 0,707Ejemplo:r = 0,84el signo es positivo ya que X e Y estn relacionados directamente como lo indica el signo del coeficiente b1 en la ecuacin de regresin
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
Interpretacin: El incremento de peso (Y) y el consumo del complemento nutricional (X) se encuentran directamente asociados.
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
17.6 Diagnstico de la regresin: anlisis residualEl anlisis residual permite evaluar lo adecuado del modelo de regresin que ha sido ajustado a los datos. Tambin sirve para detectar si los supuestos se cumplen.A. Evaluacin de lo adecuado de modelo ajustado Los valores del error residual o estimado (i) se define como la diferencia entre los valores observados (Yi) y los estimados ( ) de la variable dependiente para los valores dados de Xi
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
Podemos evaluar lo adecuado del modelo de regresin ajustado mediante el grfico de los residuos (eje vertical) con respecto a los correspondientes valores de Xi de la variable independiente (eje horizontal).Ejemplo: El grfico muestra un adecuado ajuste entre el incremento de peso y el consumo del com- plemento nutricional. No se observa una tendencia.
Grfico2
-1.0545454545
0.1575757576
-1.6303030303
0.5818181818
1.7939393939
0.0060606061
1.2181818182
2.4303030303
-1.3575757576
-2.1454545455
Variable X 1
Residuos
Variable X 1 Grfico de los residuales
Hoja1
XYXY
39927
1515
27414
5142570
4101640
154555156
Hoja4
Resumen
Estadsticas de la regresin
Coeficiente de correlacin mltiple0.8410408673
Coeficiente de determinacin R^20.7073497405
R^2 ajustado0.6707684581
Error tpico1.627416618
Observaciones10
ANLISIS DE VARIANZA
GLSCCMeF calp-valor
Regresin151.212121212151.212121212119.33638443940.0022949773
Residuos821.18787878792.6484848485
Total972.4
CoeficientesError tpicot calculadop-valorInferior 95%Superior 95%Inferior 95.0%Superior 95.0%
Intercepcin7.47878787881.27326107135.87372695770.00037263394.542640684410.41493507324.542640684410.4149350732
Variable X 11.57575757580.35834534544.39731559470.00229497730.7494111932.40210395850.7494111932.4021039585
Anlisis de los residualesResultados de datos de probabilidad
ObservacinPronstico para YResiduosResiduos estndaresPercentilY
19.0545454545-1.0545454545-0.687294421558
29.84242424240.15757575760.1026991664159
310.6303030303-1.6303030303-1.06254137572510
411.41818181820.58181818180.37919692223512
512.20606060611.79393939391.16919051014513
612.99393939390.00606060610.00394996795514
713.78181818181.21818181820.79394355596514
814.56969696972.43030303031.58393714387514
915.3575757576-1.3575757576-0.88479281858515
1016.1454545455-2.1454545455-1.39828865069517
Hoja4
1
1.5
2
2.5
3
3.5
4
4.5
5
5.5
Variable X 1
Residuos
Variable X 1 Grfico de los residuales
Hoja2
PACIENTE12345678910
ALIMENTO1.01.52.02.53.03.54.04.55.05.5
EN Kg: X
AUMENTO DE810912141315171414
PESO : Y
18
1.510
29
2.512
314
3.513
415
4.517
514
5.514
Hoja3
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
El anlisis del grfico nos brinda el criterio para adoptar el modelo lineal o dejarlo de lado. Si fuese as, podramos probar con modelos no lineales como el cuadrtico, logaritmo o exponencial. El anlisis de residuos se complementa con el clculo de los residuos estandarizados (SRi), que resultan de la divisin del residuo dividido por su error estndar.En donde
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
Los valores estandarizados nos permiten tomar en cuenta la magnitud de los residuos en unidades que reflejen la variacin estandarizada alrededor de la lnea de regresin.
Anlisis de los residualesObservacinPronstico para YResiduosResiduos estndares19.138461538-0.138461538-0.10110764123.2769230771.7230769231.25822842336.2076923080.7923076920.578560391415-1-0.730221853512.06923077-2.069230769-1.510997526644.307692310.6923076920.505538206
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
En el grfico siguiente, los residuos estandarizados fueron graficados en funcin de la variable independiente (cantidad del complemento nutricional). Se puede observar de que existe una dispersin amplia en la grfica de residuos, no existe un patrn evidente o una relacin entre los residuos estandarizados y Xi . Los residuos parecen estar equitativamente distribuidos por arriba y por debajo de 0, para diferentes valores de X. Podemos concluir que el modelo ajustado parece ser adecuado.
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
Grfico3
-0.1011076411
1.258228423
0.5785603909
-0.7302218526
-1.5109975258
0.5055382057
Residuos estndares
Hoja5
Resumen
Estadsticas de la regresin
Coeficiente de correlacin mltiple0.9958274748
Coeficiente de determinacin R^20.9916723596
R^2 ajustado0.9895904495
Error tpico1.5310880998
Observaciones6
ANLISIS DE VARIANZA
Grados de libertadSuma de cuadradosPromedio de los cuadradosFValor crtico de F
Regresin11116.62307692311116.6230769231476.32813781790.0000260786
Residuos49.37692307692.3442307692
Total51126
CoeficientesError tpicoEstadstico tProbabilidadInferior 95%Superior 95%Inferior 95.0%Superior 95.0%
Intercepcin0.34615384620.91734330420.37734384130.7250850754-2.20080475582.8931124481-2.20080475582.8931124481
Variable X 12.93076923080.134285309621.82494301980.00002607862.5579326683.30360579362.5579326683.3036057936
Anlisis de los residuales
ObservacinPronstico para YResiduosResiduos estndares
19.1384615385-0.1384615385-0.1011076411
23.27692307691.72307692311.258228423
36.20769230770.79230769230.5785603909
415-1-0.7302218526
512.0692307692-2.0692307692-1.5109975258
644.30769230770.69230769230.5055382057
Hoja5
-0.1384615385
1.7230769231
0.7923076923
-1
-2.0692307692
0.6923076923
Variable X 1
Residuos
Variable X 1 Grfico de los residuales
Hoja1
XYXYXResiduos estndares
399273-0.1011076411
151511.258228423
2741420.5785603909
51425705-0.7302218526
41016404-1.5109975258
154555156150.5055382057
Hoja1
Residuos estndares
Hoja4
Resumen
Estadsticas de la regresin
Coeficiente de correlacin mltiple0.8410408673
Coeficiente de determinacin R^20.7073497405
R^2 ajustado0.6707684581
Error tpico1.627416618
Observaciones10
ANLISIS DE VARIANZA
GLSCCMeF calp-valor
Regresin151.212121212151.212121212119.33638443940.0022949773
Residuos821.18787878792.6484848485
Total972.4
CoeficientesError tpicot calculadop-valorInferior 95%Superior 95%Inferior 95.0%Superior 95.0%
Intercepcin7.47878787881.27326107135.87372695770.00037263394.542640684410.41493507324.542640684410.4149350732
Variable X 11.57575757580.35834534544.39731559470.00229497730.7494111932.40210395850.7494111932.4021039585
Anlisis de los residualesResultados de datos de probabilidad
ObservacinPronstico para YResiduosResiduos estndaresPercentilY
19.0545454545-1.0545454545-0.687294421558
29.84242424240.15757575760.1026991664159
310.6303030303-1.6303030303-1.06254137572510
411.41818181820.58181818180.37919692223512
512.20606060611.79393939391.16919051014513
612.99393939390.00606060610.00394996795514
713.78181818181.21818181820.79394355596514
814.56969696972.43030303031.58393714387514
915.3575757576-1.3575757576-0.88479281858515
1016.1454545455-2.1454545455-1.39828865069517
Hoja4
1
1.5
2
2.5
3
3.5
4
4.5
5
5.5
Variable X 1
Residuos
Variable X 1 Grfico de los residuales
Hoja2
PACIENTE12345678910
ALIMENTO1.01.52.02.53.03.54.04.55.05.5
EN Kg: X
AUMENTO DE810912141315171414
PESO : Y
18
1.510
29
2.512
314
3.513
415
4.517
514
5.514
Hoja3
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
B. Evaluacin de las suposiciones a. Homoscedasticidad
b. Normalidad
c. Independencia: Los datos recolectados
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
17.7 Medicin de la autocorrelacin: Durbin-Watson Una de las suposiciones del modelo de regresin bsico es la independencia de los residuos. Esta suposicin es violada con frecuencia cuando los datos son recopilados en periodos secuenciales, debido a que un residuo en cualquier punto del tiempo puede tender a ser parecido a los residuos que se encuentran en puntos de tiempo adyacentes. El estadstico D de Durbin-Watson mide la correlacin de cada residuo y el residuo del periodo inmediato anterior al periodo de inters.
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
El estadstico D (Durbin-Watson)
En la que representa el residuo en el periodo i.
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
Interpretacin de D:Cuando residuos sucesivos estn correlacionados positivamente, el valor de D se aproximar a cero.Si los resultados no estn correlacionados, el valor D estar cercano a 2. Si se presentase una autocorrelacin negativa, lo cual rara vez sucede, de valor D tomar un valor mayor a 2 e, incluso podra aproximarse a su valor mximo que es 4.
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
Los resultados de SPSS nos proporciona el valor de D de Durbin-Watson
Segn este resultado permite afirmar que los residuos no estn correlacionados.
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
17.8 Estimacin por intervalosIntervalo de confianza para 1b1 N
Lo que se va hacer es estimar
se estima mediante la siguiente formula:
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
B. Intervalo de confianza para 0donde:
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
t0 con (n-2) grados de libertad y
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
Y/XC. Intervalo de confianza para
0Para un nivel dado de confianza, una variacin aumentada alrededor de la lnea de regresin, medida a travs del error estndar de la estimacin, tiene como resultado un intervalo ms amplio.
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
donde:Sin embargo, como se esperara, un tamao de muestra aumentado reduce el ancho del intervalo.
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
D. Intervalo de confianza para un valor individualAdems de obtener una estimacin de intervalo de confianza para el valor promedio, a menudo es importante tener la capacidad de predecir la respuesta que se obtendra para un valor individual.
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
donde:El intervalo de prediccin est estimando un valor individual, no un parmetro.
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
SCtotal = SCerror + SCregresin (SCresidual)17.9 Anlisis de varianza de la regresin simpleEl anlisis de varianza es una tcnica que permite localizar las fuentes de variabilidad que ayuden a explicar el comportamiento de la variable dependiente.
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
El cuadro de Anlisis de Varianza
Fuentes de variabilidadSuma de CuadradosGLCuadrado MedioF calculadoE(CMe)Debido a la RegresinError ExperimentalTotal
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
La ecuacin de regresin e interprete los coeficientes de regresin.El intervalo de confianza para 1y para un valor individual si X=3,8.El cuadro de ANOVA para la regresin linealEl valor de cuando X = 5,1La prueba de hiptesis respectiva a partir del ANOVA e interprete el resultado.Estime el aumento de peso que puede darse se consumen 6 Kg. del complemento nutricional mediante un intervalo e interprete el resultado.Asumiendo que existe una regresin lineal, determine:
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
SolucinPrimero se realizan los clculos necesarios:
Clculo de los coeficientes de regresin:
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
La ecuacin de regresin ser:
Interpretacin:b0= Se espera que el peso que un nio que no consume este complemento nutricional sea 7,49 Kg. b1= Por cada Kg. de complemento nutricional, el peso del nio se incrementar en 1,57 Kg.
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
Intervalo de confianza para 1
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
Interpretacin: Hay 0,90 de confianza que el intervalo que se ha construido, pertenezca al grupo de intervalos que contienen al verdadero parmetro 1.Intervalo de confianza para un valor individual Si X = 3,8 entonces
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
Interpretacin
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
Anlisis de VarianzaInterpretacin: Se rechaza la hiptesis planteada. El complemento nutricional si explica significativamente los cambios en el peso de los nios.
Fuentes de variabilidadSuma de CuadradosGLCuadrado MedioF calculadoE(CMe)Debido a la Regresin50,82150,8218,84Error Experimental21,5882,697Total72,409
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
Si X = 5,1 Prueba de Hiptesis acerca de 1 1. Hp: 1= 0Ha: 1 0 2. = 0,10 3.
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
SupuestosLa muestra seleccionada al azarLa poblacin se distribuye al azarLos valores de X fijas y de Y variables (o aleatorias)Asunciones de la regresin lineal simple 4. Criterios de decisin0,00415,32Si se rechaza la hiptesis planteada
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
5. Clculos
6. Conclusiones La variable complemento nutricional es apropiada para explicar el comportamiento del aumento de peso en nios desnutridos. Adems, la ecuacin de regresin puede ser usada con fines de prediccin hasta cierto lmite.
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
Para X = 6, que promedio de Y vamos a obtener?
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
17.10 Resultados con Excel
Estadsticas de la regresinCoeficiente de correlacin mltiple0.99582747Coeficiente de determinacin R^20.99167236R^2 ajustado0.98959045Error tpico1.5310881Observaciones6
ANLISIS DE VARIANZAGLSCCMeF calP-valorRegresin11116.623081116.62308476.3281382.60786E-05Residuos49.376923082.34423077Total51126
CoeficientesError tpicoEstadstico tP-valorInferior 95%Superior 95%Inferior 95.0%Superior 95.0%Intercepcin0.3461540.91734330.377343840.72508508-2.2008047562.893112448-2.2008047562.893112448Variable X 12.9307690.1342853121.8249432.6079E-052.5579326683.3036057942.5579326683.303605794
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
Ejemplo: En la Farmacia Santa Rita, se desea determinar la relacin lineal simple entre la experiencia del vendedor y las ventas durante un mes. Se seleccionan 5 vendedores, los datos registrados se presentan a continuacin:
Hoja1
VENDEDORCARLOSPEDROJOSEJUANMANUEL
EXPERIENCIA (aos):X31254
VENTAS (unidades) : Y9571410
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
Un equipo de profesionales en salud mental de un hospital psiquitrico donde el tiempo de permanencia es largo, quiere medir el nivel de respuesta de pacientes retrados mediante un programa de terapia de remotivacin. Para este propsito se contaba con una prueba estandarizada, que era costosa y su aplicacin tomaba mucho tiempo. Para salvar este obstculo, el equipo cre una prueba ms fcil de aplicar. Caso 1
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
Para probar la utilidad de este nuevo instrumento para medir el nivel de respuesta del paciente, el equipo decidi examinar la relacin entre las calificaciones obtenidas con la nueva prueba y las calificaciones obtenidas con la prueba estandarizada.
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
Caso 2Se llevo a cabo un experimento para estudiar el efecto de cierto medicamento para disminuir la frecuencia cardiaca en adultos. Se reunieron los siguientes datos: dosis en miligramos del medicamento y la diferencia entre la frecuencia cardiaca mas baja despus de la administracin del medicamento y un control antes de administrarlo.
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
Determine la ecuacin de regresin lineal y explique el valor de los coeficientes de regresin. Calcule e interprete el coeficiente de correlacin y el coeficiente de determinacin.
Hoja1
Dosis (mg)0.50.7511.251.51.7522.252.52.7533.253.5
Reduccion ritmo cardiaco1081212141216181720182021
Hoja2
Hoja3
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
Hoja de Comprobacin1. El anlisis de regresin se usa para describir que tan bien una ecuacin de estimacin describe la relacin que est estudiando2. Dado que la ecuacin para una lnea es Y = 26 - 24X, podemos decir que la relacin Y con X es directa y lineal3. Un valor r2 cercano a cero indica una fuerte correlacin entre X y Y
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
4. Los anlisis de regresin y correlacin se usan para determinar relaciones de causa y efecto5. El coeficiente de correlacin de muestra, r, no es nada ms quey no podemos interpretar su significado directamente como un porcentaje del mismo tipo6. El error estndar de la estimacin mide la variabilidad de los valores observados alrededor de la ecuacin de regresin.7. La lnea de regresin se deriva de una muestra y no de toda la poblacin
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
8. Podemos interpretar el coeficiente de determinacin de muestra como la cantidad de la variacin en Y que es explicada por la lnea de regresin9. Las lneas trazadas a cada lado de la lnea de regresin a 1, 2 y 3 veces el valor del error estndar de la estimacin se denominan lneas de confianza10.La ecuacin de estimacin es vlida slo sobre el mismo intervalo que el dado por los datos originales de muestra sobre los cuales se desarroll11.En al ecuacin Y = a + bX para la variable dependiente Y y la variable independiente X, la interseccin Y es b.
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
12.Si una lnea se ajusta a un conjunto de puntos mediante el mtodo de mnimos cuadrados, los errores individuales positivos y negativos desde la lnea suman cero.13. Si Se = 0 para una ecuacin de estimacin, debe estimar perfectamente la variable dependiente en los puntos observados14.Supongamos que la pendiente de una ecuacin de estimacin es positiva. Entonces el valor de r debe ser la raiz cuadrada positiva de r2
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
15.Si r = 0.8, entonces la ecuacin de regresin explica 80% de la variacin total en la variable dependiente16.El coeficiente de correlacin es el porcentaje de la variacin total de la variable dependiente que es explicada por la regresin17.El error estndar de la estimacin es medido perpendicularmente desde la lnea de regresin ms que sobre el eje X18.Al cuadrar los errores individuales, el mtodo de mnimos cuadrados magnidica todas las desviaciones desde la lnea de regresin estimada
Material de Clases Jorge Crdova Egocheaga. Febrero 2003
19. Una ecuacin de regresin no puede ser vlida al ampliarse fuera del intervalo de muestra de la variable independiente20. Un valor r2 implica que no existe una relacin de causa-efecto significativa entre X y Y21. Una valor pequeo de r2 implica que no existe una relacin de causa-efecto significativa entre X y Y
****
top related