Download - Asignacion_Regresion_Correlacion
ASIGNACIN REGRESIN Y CORRELACIN
ASIGNACIN REGRESIN Y CORRELACIN
1. Calcule las medidas de Tendencia Central de los siguientes datos:
3, 5, 6, 8, 8, 8, 9, 9, 10, 11
Sol.-
Media (Ma): Llamado tambin Promedio Aritmtico Media Aritmtica
Ma = 7.70 Mediana (Me): El valor mediano o mediana de un conjunto de valores es aquel que tiene la propiedad de dividir al conjunto en 2 partes igualmente numerosas. Si el nmero de elementos fuese impar se tomar el valor central como la mediana; pero si el nmero de elementos fuese par hay dos elementos en el centro y como mediana se tomar el promedio de ellos.
En nuestro caso para el problema el Nmero de elementos (n) es 10, entonces se toma los dos nmeros centrales y se promedia.
Me = 8.00 Moda (Mo): Es el valor que se presenta con mayor frecuencia en un grupo de datos, a una distribucin que tiene una sola moda se le denomina unimodal. Si hubiese ms de dos valores no adyacentes con frecuencias mximas similares la distribucin es multimodal; bimodal, trimodal, etc. En el caso que no exista ningn valor que se repita se dice que no existe moda, el sistema ser amodal.
En nuestro caso para el problema el valor que ms se repite es:
Mo = 8.00
2. Calcule las medidas de Dispersin de los datos anteriores:
3, 5, 6, 8, 8, 8, 9, 9, 10, 11
Sol.-
Rango: Es la diferencia entre el mayor y el menor valor de un conjunto de datos.
Rango = 8.00
Desviacin Media: Se conoce tambin como promedio de desviacin, para una serie de N valores: ...., puede calcularse a travs de la siguiente expresin:
Desviacin media =
Donde:
:
media aritmtica
:valor absoluto de las desviaciones de los Xj valores,
respecto de la media.
Sabemos: = Ma = 7.70
1.82
D.M. = 1.82
Varianza: Dado un conjunto de nmeros se define como varianza al cuadro de la desviacin tpica.
Sabemos: = Ma = 7.70
EMBED Equation.3 S2 = 5.21
Desviacin Estndar: La desviacin estndar se representa con S y se define como.
Como tenemos el valor de S2 solo procederemos a sacar raz cuadrada a la varianza.
2.283
S = 2.28
Coeficiente de Variacin: A la dispersin relativa se le conoce con el nombre de coeficiente de variacin que se expresa como un porcentaje.
Sabemos: = Ma = 7.70
S = 2.28
V = 29.61
3. Los valores reducidos de lpidos en las heces se relacionan con valores reducidos de energa. Calcule el coeficiente de correlacin del siguiente grupo de datos e interprete su valor.
SujetoLpidos fecales
(gramos/da)Energa fecal
(MJ/da)
110.02.1
211.01.1
39.91.1
49.80.9
515.50.7
65.00.4
710.71.0
813.01.5
913.81.2
1016.71.4
113.21.0
124.00.5
136.00.9
148.90.8
159.10.6
164.10.5
1717.01.2
1822.21.1
192.90.9
205.01.0
Sol.-
Definicin:
En el contexto del anlisis de la regresin lineal simple el coeficiente de correlacin establece una medida del grado de asociacin lineal entre la variable respuesta y la variable predictora, concretamente entre la variable respuesta y la recta de regresin estimada. Se define, a partir de los n pares de observaciones, mediante:
A continuacin podremos observar un cuadro del cual obtendremos las sumatorias pedidas para desarrollar el clculo del coeficiente de relacin.
LpidosEnerga
XiYiXi - xYi - y(Xi - x)(Yi - y)(Xi - x)(Yi - y)
10.02.10.11.10.1220.0121.221
11.01.11.10.10.1171.2320.011
9.91.10.00.10.0010.0000.011
9.80.9-0.1-0.10.0090.0080.009
15.50.75.6-0.3-1.65531.4720.087
5.00.4-4.9-0.62.91023.9120.354
10.71.00.80.00.0040.6560.000
13.01.53.10.51.5719.6720.255
13.81.23.90.20.80215.2880.042
16.71.46.80.42.75846.3760.164
3.21.0-6.70.0-0.03344.7560.000
4.00.5-5.9-0.52.91634.6920.245
6.00.9-3.9-0.10.37015.1320.009
8.90.8-1.0-0.20.1930.9800.038
9.10.6-0.8-0.40.3120.6240.156
4.10.5-5.8-0.52.86633.5240.245
17.01.27.10.21.45850.5520.042
22.21.112.30.11.293151.5360.011
2.90.9-7.0-0.10.66448.8600.009
5.01.0-4.90.0-0.02423.9120.000
9.91.016.649533.1982.910
Total
Luego ingresamos estos valores en la formula de correlacin:
Coeficiente Correlacin = 0.423
Interpretacin del r:
Valor de r de 0 a 0.25 implica que no existe correlacin entre ambas variables.
Valor de r de 0.25 a 0.50 implica una correlacin baja a moderada.
Valor de r de 0.50 a 0.75 implica correlacin moderada a buena.
Valor de r de 0.75 o mayor, implica una muy buena a excelente correlacin.
Estos rangos de valores se pueden extrapolar a correlaciones negativas tambin.
Por lo tanto podemos decir que para nuestro caso el Coeficiente de Correlacin, r = 0.42, implica una correlacin baja (a moderada).
4. Se desea predecir si el puntaje logrado con el examen preliminar (A) puede predecir el puntaje logrado con un examen final (B). Represente el grfico de Dispersin respectivo.
SujetoExamen Preliminar (A)Examen Final (B)
1288
2257
3247
4289
52510
6258
7249
8215
9259
10299
112710
12186
132410
142910
15278
16216
17276
18173
19288
20206
Sol.-
Si utilizamos un sistema de coordenadas cartesianas para representar la distribucin bidimensional, obtendremos un conjunto de puntos conocido con el diagrama de dispersin, cuyo anlisis permite estudiar cualitativamente, la relacin entre ambas variables tal como se ve en el Grfico 1. El siguiente paso, es la determinacin de la dependencia funcional entre las dos variables x e y que mejor ajusta a la distribucin bidimensional.
El grfico de Dispersin lo hallaremos mediante el ingreso de los datos a una hoja de Excel, de donde exportaremos para poder visualizar los datos en el Grfico Examen A vs. Examen B.
Grfico 1.
5. Determine el modelo de regresin lineal simple.
Sol.-
Se denomina regresin lineal cuando la funcin es lineal, es decir, requiere la determinacin de dos parmetros: la pendiente y la ordenada en el origen de la recta de regresin, y=ax+b. La regresin nos permite adems, determinar el grado de dependencia de las series de valores X e Y, prediciendo el valor y estimado que se obtendra para un valor x que no est en la distribucin.
Vamos a determinar la ecuacin de la recta que mejor ajusta a los datos representados en el Grfico 1. En concreto queremos expresar mediante una relacin cmo depende una de ellas (variable dependiente) de la otra (variable independiente). Normalmente se elige como y la variable dependiente y como x la independiente
Luego procesando los datos podemos obtener las sumatorias respectivas para el clculo de a y b, con n = 20.
Exam. AExam. B
XiYiXi * YiXi
288224784
257175625
247168576
289252784
2510250625
258200625
249216576
215105441
259225625
299261841
2710270729
186108324
2410240576
2910290841
278216729
216126441
276162729
17351289
288224784
206120400
492154388312344
Por lo tanto el modelo de Regresin Lineal es:
6. Como interpreta el coeficiente alfa (a)
Sol.-
El Coeficiente Alfa (a) indica la pendiente de la Recta de Regresin Lineal, la cual se define como la divisin entre el Examen Final (B) y el Examen Preliminar (A); esta pendiente es baja y positiva.
7. Como interpreta el coeficiente beta (b)
Sol.-
El Coeficiente Beta (b) indica el valor de la ordenada en el origen, es decir cuando x (Examen Preliminar A) es cero (0).
8. Cual sera el puntaje probable de un alumno en el examen final (B) si en el examen de tipo (A) obtuvo 25.
Sol.-
Como la frmula de regresin lineal es: y sabiendo que y (Examen A) es la variable dependiente de x (Examen B) procedemos a reemplazar el valor de 25 en x para hallar el Examen Final (B):
7.8582
_1179895542.unknown
_1179898003.unknown
_1179920897.unknown
_1179921014.unknown
_1179921212.unknown
_1179921464.unknown
_1179922785.unknown
_1179922871.unknown
_1179921338.unknown
_1179921067.unknown
_1179920928.unknown
_1179920975.unknown
_1179920907.unknown
_1179909846.unknown
_1179912028.unknown
_1179920855.unknown
_1179911447.unknown
_1179898124.unknown
_1179896955.unknown
_1179897723.unknown
_1179897843.unknown
_1179897639.unknown
_1179896558.unknown
_1179896779.unknown
_1179896042.unknown
_1179895073.unknown
_1179895450.unknown
_1179894936.unknown
_1179894992.unknown
_1179895003.unknown
_1179894979.unknown
_1179893976.unknown
_1179894800.unknown
_1179893634.unknown