parcial 2 estadistica descriptiva

3
PREGUNTA 1 Analizando primeramente la covarianza observamos que las variables de x y y son las que presentan mayor covarianza, basicamente sabemos que la covarianza mide la covariacion conjunta de dos variables, en caso de que de positiva nos da información de que a valores altos de una de las variables hay una mayor tendencia a encontrar valores altos de la otra variable y a valores bajos de una de las variables tendremos valores bajos de la otra; entonces las variables X-Y son las que presentan mayor variacion respecto una de otra y el orden siguiente son las variables XZ y Y-Z, es decir que estas ultimas Y-Z presentaran menor variacion una de otra cuando una aumente o disminuya respectivamente Analizando los resultados del coefiente de correlacion como todos nos dieron positivos se sabe que las dos variables se correlacionan en sentido directo, ademas se sabe que el valor ideal o correlacion positiva perfecta es cuando R da 1, en este caso las variables que mejor se correlacionan una con otra son X-Z pero no es tan perfecta dicha correlacion ya que no esta tan cerca de 1, las variables X-Z tienen buena dependencia, lo mismo sucede con el coeficiente de correlacion de X-Y ya que se obtienen valores muy parecidos, viendolo en perspectiva es como una grafica lineal de y= ½ x o X= ½ Z en un plano,mas sin embargo en comparacion con el otro valor de correlacion obtenido de Y-Z que es mucho mas bajo podemos decir que de las tres posibles parejas son las variables mas incorrelacionadas y es difícil establecer un sentido de covariacion y pues mientras mas cerca de 0 este sera peor, es decir las variables son independientes. PUNTO 3 DIFERENCIA DE LOS REZAGOS 1 Y 3 Si comenzamos a graficar el variograma desde h= 0 observaremos que el incremento de la varianza para h= 0 es 0, luego entonces cuando h= 1 el incremento de la varianza tiene que aumentar como vemos obtenmos un valor de incremento de varianza de 89,12 para h=1 y asi sucesivamente debe seguir aumentando para el caso de h= 3 obtuvimos un valor d eincremento de varianza de 331,8 y aunque no lo pideron para un h= 2 se obtuvo un valor d eincremento de

Upload: david-bustos-usta

Post on 27-Sep-2015

8 views

Category:

Documents


3 download

DESCRIPTION

Estadistica descriptiva Unal

TRANSCRIPT

PREGUNTA 1Analizando primeramente la covarianza observamos que las variables de x y y son las que presentan mayor covarianza, basicamente sabemos que la covarianza mide la covariacion conjunta de dos variables, en caso de que de positiva nos da informacin de que a valores altos de una de las variables hay una mayor tendencia a encontrar valores altos de la otra variable y a valores bajos de una de las variables tendremos valores bajos de la otra; entonces las variables X-Y son las que presentan mayor variacion respecto una de otra y el orden siguiente son las variables XZ y Y-Z, es decir que estas ultimas Y-Z presentaran menor variacion una de otra cuando una aumente o disminuya respectivamenteAnalizando los resultados del coefiente de correlacion como todos nos dieron positivos se sabe que las dos variables se correlacionan en sentido directo, ademas se sabe que el valor ideal o correlacion positiva perfecta es cuando R da 1, en este caso las variables que mejor se correlacionan una con otra son X-Z pero no es tan perfecta dicha correlacion ya que no esta tan cerca de 1, las variables X-Z tienen buena dependencia, lo mismo sucede con el coeficiente de correlacion de X-Y ya que se obtienen valores muy parecidos, viendolo en perspectiva es como una grafica lineal de y= x o X= Z en un plano,mas sin embargo en comparacion con el otro valor de correlacion obtenido de Y-Z que es mucho mas bajo podemos decir que de las tres posibles parejas son las variables mas incorrelacionadas y es difcil establecer un sentido de covariacion y pues mientras mas cerca de 0 este sera peor, es decir las variables son independientes.PUNTO 3 DIFERENCIA DE LOS REZAGOS 1 Y 3Si comenzamos a graficar el variograma desde h= 0 observaremos que el incremento de la varianza para h= 0 es 0, luego entonces cuando h= 1 el incremento de la varianza tiene que aumentar como vemos obtenmos un valor de incremento de varianza de 89,12 para h=1 y asi sucesivamente debe seguir aumentando para el caso de h= 3 obtuvimos un valor d eincremento de varianza de 331,8 y aunque no lo pideron para un h= 2 se obtuvo un valor d eincremento de varianza de 123,737, esta claro que este deberia ser el comportamiento tipico de el variograma hasta que llegue a un rezago en el cual el valor del incremento de la varianza se mantenga constante, aunque no podemos garantizar que esto siempre ocurria, sin embargo enfocandonos solo en el rezago 1 y 3 vemos que los valores difieren bastante desde el rezago uno con incremento de varianza de 89,12 este valor aumenta un 272,307% hasta llegar a 331,8 en el rezago 3, esta claro que es esperado esto por lo expuesto anteriormente.PUNTO DE DISTANCIAS El verdadero valor de calcular estas distancias se basa en calcular el vector de medias y con base a este encontrar la distancia de cada uno de los sujetos o en este caso paises a dicho vector d emedias, con esto podemos identificar datos atipicos cuando las distancias que calculemos nos den muy altas, en este caso el vector de medias x = (X1,X2,X3) siendo X1= Esperanza de vida femeninaX2= Esperanza de vida masculinaX3= FertilidadEntonces el vector de medias calculado para las 3 variables con los paises Afganistan, Alemania y Argentina es:X prom= (67,667 ; 65; 3,333)Asi calculo la distancia de cada pais a el vector de media asi:Argentina: d= [(74-67,667)^2 +(71-65)^2 +(2-3,333)^2]^1/2 = 8,825Alemania: d = [(79-67,667)^2 +(76-65)^2 +(1-3,333)^2]^1/2 = 15,9649Afganistan: d = [(50-67,667)^2 +(48-65)^2 +(7-3,333)^2]^1/2 = 24,79Como podemos observar el pais que se encuentra mas alejado de el vector de medias segn las distancias calculadas es Afganistan, es decir el pais donde se encuentran los valores o datos mas atipicos de las tres variables analizadas, Alemania le sigue con algunos datos un pozo atipicos y el pais mas cercano al promedio es Argentina, en realidad esta e sla verdadera utilidad del calculo de las distancias en base a los valores de las variables.