apunte regresiÓn

6
ÁREA ELECTRICIDAD ANÁLISIS ESTADÍSTICO DE DATOS Docente sede Temuco: Irlanda Fuica Benítez Magíster Planificación Territorial y Ambiental 1 COVARIANZA, CORRELACIÓN, RECTAS DE REGRESIÓN Distribuciones bidimensionales Covarianza y coeficiente de correlación

Upload: martinez-julio

Post on 16-Sep-2015

10 views

Category:

Documents


1 download

DESCRIPTION

estadistica

TRANSCRIPT

  • REA ELECTRICIDAD ANLISIS ESTADSTICO DE DATOS

    Docente sede Temuco: Irlanda Fuica Bentez

    Magster Planificacin Territorial y Ambiental 1

    COVARIANZA, CORRELACIN, RECTAS DE REGRESIN

    Distribuciones bidimensionales

    Covarianza y coeficiente de correlacin

  • REA ELECTRICIDAD ANLISIS ESTADSTICO DE DATOS

    Docente sede Temuco: Irlanda Fuica Bentez

    Magster Planificacin Territorial y Ambiental 2

    Rectas de regresin

    La correlacin estadstica determina la relacin o dependencia que existe entre las dos variables

    que intervienen en una distribucin bidimensional.

    Es decir, determinar si los cambios en una de las variables influyen en los cambios de la otra. En

    caso de que suceda, diremos que las variables estn correlacionadas o que hay correlacin entre

    ellas.

    Coeficiente de correlacin: El coeficiente de correlacin lineal se expresa mediante la letra r.

  • REA ELECTRICIDAD ANLISIS ESTADSTICO DE DATOS

    Docente sede Temuco: Irlanda Fuica Bentez

    Magster Planificacin Territorial y Ambiental 3

    CRITERIOS DE PEARSON

    1. El coeficiente de correlacin no vara al hacerlo la escala de medicin. Es decir, si

    expresamos la altura en metros o en centmetros el coeficiente de correlacin no vara.

    2. El signo del coeficiente de correlacin es el mismo que el de la covarianza. Si la covarianza es positiva, la correlacin es directa. Si la covarianza es negativa, la correlacin es inversa. Si la covarianza es nula, no existe correlacin.

    3. El coeficiente de correlacin lineal es un nmero real comprendido entre menos 1 y 1.

    (1 r 1)

    4. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin es

    fuerte e inversa, y ser tanto ms fuerte cuanto ms se aproxime r a 1.

    5. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin es fuerte

    y directa, y ser tanto ms fuerte cuanto ms se aproxime r a 1.

    6. Si el coeficiente de correlacin lineal toma valores cercanos a 0, la correlacin es dbil.

    7. Si r = 1 1, los puntos de la nube estn sobre la recta creciente o decreciente. Entre

    ambas variables hay dependencia funcional.

  • REA ELECTRICIDAD ANLISIS ESTADSTICO DE DATOS

    Docente sede Temuco: Irlanda Fuica Bentez

    Magster Planificacin Territorial y Ambiental 4

    Ejemplo Metodolgico N1: Las estaturas y pesos de 10 pacientes son:

    Estatura (X) centmetros 186 189 190 192 193 193 198 201 203 205

    Pesos (Y) Libras 85 85 86 90 87 91 93 103 100 101

    Calcular el coeficiente de correlacin. APLICANDO MTODO MNIMOS CUADRADOS ORDINARIOS (M.C.O)

    xi yi xi2 yi

    2 xi yi 186 85 34 596 7 225 15 810 189 85 35 721 7 225 16 065

    190 86 36 100 7 396 16 340

    192 90 36 864 8 100 17 280

    193 87 37 249 7 569 16 791 193 91 37 249 8 281 17563

    198 93 39 204 8 649 18 414 201 103 40 401 10 609 20 703

    203 100 41 209 10 000 20 300

    205 101 42 025 10 201 20 705

    1 950 921 380 618 85 255 179 971

  • REA ELECTRICIDAD ANLISIS ESTADSTICO DE DATOS

    Docente sede Temuco: Irlanda Fuica Bentez

    Magster Planificacin Territorial y Ambiental 5

    EJEMPLO METODOLGICO N2

    Una compaa de seguros considera que el nmero de vehculos (y) que circulan por una determinada autopista a ms de 120 km/h, puede ponerse en funcin del nmero de accidentes (x) que ocurren en ella. Durante 5 das obtuvo los siguientes resultados:

    Accidentes xi 5 7 2 1 9

    Vehculos yi 15 18 10 8 20

    a) Calcula el coeficiente de correlacin lineal.

    b) Si ayer se produjeron 6 accidentes, cuntos vehculos podemos suponer que circulaban por la autopista a ms de 120 km / h?

    c) Es buena la prediccin?

  • REA ELECTRICIDAD ANLISIS ESTADSTICO DE DATOS

    Docente sede Temuco: Irlanda Fuica Bentez

    Magster Planificacin Territorial y Ambiental 6

    EJERCICIOS PROPUESTOS

    1. Una asociacin dedicada a la proteccin de la infancia decide estudiar la relacin entre la mortalidad infantil en cada pas y el nmero de camas de hospitales por cada mil habitantes, obteniendo la siguiente informacin:

    x 50 100 70 60 120 180 200 250 30 90

    y 5 2 2,5 3,75 4 1 1,25 0,75 7 3

    Donde x es el n de camas por mil habitantes e y el tanto por ciento de mortalidad.

    Se pide: a) Confeccionar Diagrama de Dispersin (Nube de Puntos) y ubique el centro de

    gravedad (promedio de x e y) b) Desviacin Estndar de x e y c) Coeficiente de variacin para y d) Determinar las 2 ecuaciones de regresin e) Covarianza f) Coeficiente de Correlacin g) Seleccionar la ecuacin que presenta el mejor nivel de ajuste. h) Determinar el % de mortalidad para los valores en x = 79, 225 y 300 camas.

    2. El nmero de licencias de conducir, en miles, y el nmero de votantes a un

    determinado partido en 6 comunidades autnomas, en decenas de miles, est

    expresado en la siguiente tabla:

    N de licencias (X) 103 26 3 7 26 5

    N de votantes (Y) 206 26 27 14 24 12

    Determinar:

    a) Confeccionar Diagrama de Dispersin (Nube de Puntos) y ubique el centro de

    gravedad (promedio de x e y) b) Desviacin Estndar de x e y c) Coeficiente de variacin para y d) Determinar las 2 ecuaciones de regresin e) Covarianza f) Coeficiente de Correlacin g) Seleccionar la ecuacin que presenta el mejor nivel de ajuste. h) Determinar el nmero de votantes para los valores en x = 20 y 100 licencias.

    Considerar en ambos ejercicios: