estadistica aplicada 8a semana correlación y regresión.ppt

21
En ocasiones nos puede interesar estudiar si existe o no algún tipo de relación entre dos variables aleatorias. Así, por ejemplo, podemos preguntarnos si hay alguna relación entre las notas de la asignatura Estadística I y las de Matemáticas I. CONCEPTO: Existe correlación entre dos variables si una de ellas está relacionada con la otra de alguna manera. SUPUESTOS: LOS PARES DE DATOS (X, Y) TIENEN UNA DISTRIBUCION NORMAL BIVARIABLE. PARA CUALQUIER VALOR FIJO DE “X”, LOS VALORES CORRESPONDIENTES A “Y”, DEBEN TENER UNA DISTRIBUCION EN FORMA DE CAMPANA Y VICEVERSA.

Upload: rcuc5882

Post on 18-Feb-2016

319 views

Category:

Documents


21 download

TRANSCRIPT

Page 1: Estadistica Aplicada 8a Semana correlación y regresión.ppt

En ocasiones nos puede interesar estudiar si existe o no algún tipo de relación entre dos variables aleatorias. Así, por ejemplo, podemos preguntarnos si hay alguna relación entre las notas de la asignatura Estadística I y las de Matemáticas I.

CONCEPTO: Existe correlación entre dos variables si una de ellas está relacionada con la otra de alguna manera.

SUPUESTOS: LOS PARES DE DATOS (X, Y) TIENEN UNA DISTRIBUCION NORMAL BIVARIABLE. PARA CUALQUIER VALOR FIJO DE “X”, LOS VALORES CORRESPONDIENTES A “Y”, DEBEN TENER UNA DISTRIBUCION EN FORMA DE CAMPANA Y VICEVERSA.

Page 2: Estadistica Aplicada 8a Semana correlación y regresión.ppt

COEFICIENTE DE CORRELACION LINEAL (r) : mide la fuerza de la relación lineal entre los valores X y Y apareados en una muestra. En algunos textos se le puede decir Coeficiente de Correlación de momento producto de Pearson.

REDONDEO DEL COEFICIENTE DE CORRELACION LINEAL: Se redondea a tres posiciones decimales. Se redondea hasta llegar la respuesta final y no en operaciones intermedias.

En particular, nos interesa cuantificar la intensidad de la relación lineal entre dos variables. El parámetro que nos da tal cuantificación es el coeficiente de correlación lineal de Pearson “r”, cuyo valor oscila entre –1 y + 1 :

Page 3: Estadistica Aplicada 8a Semana correlación y regresión.ppt

CUANDO HAY CORRELACIÓN LINEAL POSITIVA (CERCANO A + 1)SI AUMENTA “X” TAMBIEN AUMENTA “Y”,

CUANDO HAY CORRELACIÓN LINEAL NEGATIVA (CERCANO A - 1)SI AUMENTA “X” DISMINUYE “Y”,SI DISMINUYE “X” AUMENTA “Y”

Page 4: Estadistica Aplicada 8a Semana correlación y regresión.ppt

xLONGITUD

(pulg) 53 67.5 72 72 73.5 68.5 73 37

y PESO (lb) 80 344 416 348 262 360 332 34

LONGITUDES Y PESOS DE OSOS MACHO

ES POSIBLE PESAR UN OSO CON CINTA METRICA?

Algunos investigadores han estudiado osos anestesiados para poder realizar algunas mediciones como la longitud y el peso. En general es problemático pesar un oso anestesiado en su ambiente natural ya que son muy pesados.

Con los datos de la siguiente tabla, calcule el valor del coeficiente de correlación lineal, para determinar si existe o no una relación entre la longitud y los pesos de los osos, utilice un nivel de significancia del 0.05.

Page 5: Estadistica Aplicada 8a Semana correlación y regresión.ppt

NOTACION PARA EL COEFICIENTE DE CORRELACION LINEAL

n = representa el número de pares de datos presentes.

x = Suma de todos los puntajes x

x = Cada puntaje x se debe elevar al cuadrado y luego todos deben sumarse

x = Indica que los puntajes x deben sumarse y el total debe elevarse al cuadrado.

xy = Indica que cada puntaje x primero se debe multiplicar con y, luego se suman todos los productos.

2

( )2

Page 6: Estadistica Aplicada 8a Semana correlación y regresión.ppt

r = representa el coeficiente de correlación lineal para una muestra.

p = representa el coeficiente de correlacion lineal para una población.

EJEMPLO: Con los datos de la tabla de las longitudes y pesos de los Osos macho, calcule el valor del coeficiente de correlación lineal r.

Longitud (pulg) x

Peso (lb) y

53 80 4,240 2809 6400

67.5 344 23220 4556.25 118336

72 416 29952 5184 173056

72 348 25056 5184 121104

73.5 262 19257 5402.25 68644

68.5 360 24660 4692.25 129600

73 332 24236 5329 110224

37 34 1258 1369 1156

516.5 2176 151879 34525.75 728520

Page 7: Estadistica Aplicada 8a Semana correlación y regresión.ppt

APLICAMOS LA FORMULA DE r

= _______8(151,879) – (516.5)(2176)_____________

V8(34,525.75) – (516.5) V 8(728,520) – (2176)__________________ ________________

2 2

= ______91,128_________

V 9433.75 V 1,093,184________ _________ = 0.897

Page 8: Estadistica Aplicada 8a Semana correlación y regresión.ppt

HAY DOS TIPOS DE INTERPRETACIONES:

1.- TRADICIONAL o VAGA: Si “r” encontrado es cercano a cero, no existe una correlación lineal significativa entre X y Y. Si “r” es cercana a -1 ó +1, se concluye que si existe una correlación lineal significativa entre X y Y.

2.- ESPECIFICA A TRAVES DE TABLA PREDETERMINADA: Si el valor absoluto de “r” excede el valor de la tabla 10, concluimos que existe una correlación lineal significativa, en caso contrario no hay suficientes indicios para apoyar de que existe una correlación lineal significativa.

Page 9: Estadistica Aplicada 8a Semana correlación y regresión.ppt
Page 10: Estadistica Aplicada 8a Semana correlación y regresión.ppt

PRUEBA FORMAL DE HIPOTESIS PARA CORRELACIONES.

SE PARTE DE QUE : Ho : p = 0 (No existe correlación lineal)

Ha : p = 0 (Existe una correlación lineal)

EL ESTADISTICO DE PRUEBA ES t:

t = r_____

V 1 - r_n - 2

VALORES CRITICOS: Utilice la tabla A-3, CON n – 2 GRADOS DE LIBERTAD. SI t > VALOR CRITICO DE LA TABLA A-3 RECHACE LA Ho, SI t < VALOR CRITICO DE LA TABLA A-3 ACEPTAR LA Ho.

2

Page 11: Estadistica Aplicada 8a Semana correlación y regresión.ppt

1. t = r_____ = V 1 - r_

n - 2

___0.897____

V 1 - 0.8046098 - 2

= ___0.897____

___0.897____=

V 0.195391

6

0.18045821= 4.971

EL VALOR CRITICO DE LA TABLA A-3 ES t = 2.447, QUE CORRESPONDE A UN NIVEL DE SIGNIFICANCIA DE 0.05, DIVIDIDA ENTRE DOS COLAS Y EL NUMERO DE GRADOS DE LIBERTAD ES n – 2. POR LO TANTO t > VALOR CRITICO, DEBEMOS RECHAZAR LA “Ho”. Y ACEPTAR LA “Ha”, QUE INDICA QUE SI EXISTE CORRELACION LINEAL SIGNIFICATIVA.

UTILIZANDO EL VALOR DE “r” DEL PROBLEMA DE LOS OSOS MACHO, REALICE LA PRUEBA DE HIPOTESIS PARA VERIFICAR SI EXISTE O NO CORRELACION LINEAL SIGNIFICATIVA.

2

Page 12: Estadistica Aplicada 8a Semana correlación y regresión.ppt

EJEMPLO 2: EMBARCACIONES DE PLACER QUE SE REGISTRARON EN FLORIDA (EN DECENAS DE MILES) Y MUERTES DE MANATIES QUE SE RELACIONAN CON BARCOS, UTILICE UN NIVEL DE SIGNIFICANCIA DE 0.01; CUAL ES LA PROYECCION DE MANATIES MUERTOS, CUANDO SE AUTORICEN 1,250,000 EMBARCACIONES.

AÑO 91 92 93 94 95 96 97 98 99 00X BARCOS 68 68 67 70 71 73 76 81 83 84Y MUERTES 53 38 35 49 42 60 54 67 82 78

n n = 10 x = 55,289= 10 x = 55,289

x = 741 y = 558x = 741 y = 558

y = 33,456 xy = 42,214y = 33,456 xy = 42,214

22

22

Page 13: Estadistica Aplicada 8a Semana correlación y regresión.ppt

= _______10(42,214) – (741)(558)_____________

V10(55,289) – (741) V 10(33,456) – (558) __________________ ________________

2 2

r = 0.921 LA TABLA A-6 AL 0.01 ES 0.716

r > 0.716, por lo tanto si existe correlacion lineal entre X y Y.

Page 14: Estadistica Aplicada 8a Semana correlación y regresión.ppt

ESTATURAS Y PESOS DE SUPERMODELOS: ABAJO SE PRESENTAN LAS ESTATURAS (EN PULGADAS) Y LOS PESOS (EN LIBRAS) DE LAS SUPERMODELOS. EXISTE CORRELACION?. PRUEBELO AL 0.01 DE NIVEL SIGNIFICANCIA.

X ESTATURA (PULG) 70 70.5 68 65 70 70 70 70 71Y PESO (LBS) 117 119 105 115 119 127 113 123 115

SI HAY CORRELACION, ENCUENTRE EL PESO PROBABLE DE UNA MODELO QUE MIDA 75 PULG.

Page 15: Estadistica Aplicada 8a Semana correlación y regresión.ppt

EN LAS CORRELACIONES ANALIZAMOS DATOS APAREADOS CON EL PROPOSITO DE DETERMINAR SI EXISTIA UNA CORRELACION LINEAL SIGNIFICATIVA ENTRE DOS VARIABLES. AHORA QUEREMOS DESCRIBIR LA RELACION ENCONTRANDO LA GRAFICA Y LA ECUACION DE LA RECTA QUE LA REPRESENTA.

ESTA LINEA RECTA SE DENOMINARA LINEA DE REGRESION Y SU ECUACION SE DENOMINA ECUACION DE REGRESION.

Page 16: Estadistica Aplicada 8a Semana correlación y regresión.ppt

DADA UNA COLECCION DE DATOS DE MUESTRA APAREADOS, LA ECUACION DE LA REGRESION ES IGUAL:

y = b + b x 0 1^

ESTA DEFINICION EXPRESA UNA RELACION ENTRE X (llamada variable independiente) y Y (llamada variable dependiente). b0 es la ordenada al origen y b1 es la pendiente.

^

Page 17: Estadistica Aplicada 8a Semana correlación y regresión.ppt

b0 = ( y) ( x ) - ( x) ( xy) 2

n( x ) - ( x) 2 2

Ordenada al origen

b1 = n ( xy) - ( x) ( y) n( x ) - ( x) 2 2 pendiente

EJEMPLO: Utilizando la tabla de las longitudes y pesos de los Osos, en el cual el coeficiente de correlación lineal es igual a 0.897. Obtenga ahora la ecuacion de regresion de la linea recta que relaciona x con y.

Page 18: Estadistica Aplicada 8a Semana correlación y regresión.ppt

COMO RECORDARAN LOS DATOS QUE OBTUVIMOS FUERON COMO RECORDARAN LOS DATOS QUE OBTUVIMOS FUERON LOS SIGUIENTES:LOS SIGUIENTES:

n n = 8 x = 34,525.75= 8 x = 34,525.75

x = 516.5 y = 728,520x = 516.5 y = 728,520

y = 2176 xy = 151,879y = 2176 xy = 151,879

22

22

AHORA UTILIZAMOS LAS FORMULAS, DE LA PENDIENTE Y AHORA UTILIZAMOS LAS FORMULAS, DE LA PENDIENTE Y DE LA ORDENADA DE ORIGEN.DE LA ORDENADA DE ORIGEN.

b1 = 9.65979 = 9.66

b0 = - 352LA ECUACION ENTONCES ES :LA ECUACION ENTONCES ES :

y = - 352 + 9.66xy = - 352 + 9.66x^

Page 19: Estadistica Aplicada 8a Semana correlación y regresión.ppt

SI LA LONGITUD Y EL PESO DE LOS OSOS TIENEN UNA SI LA LONGITUD Y EL PESO DE LOS OSOS TIENEN UNA CORRELACION LINEAL SIGNIFICATIVA, Y SABIENDO SU CORRELACION LINEAL SIGNIFICATIVA, Y SABIENDO SU ECUACION DE REGRESION. SI SE MIDE UN OSO Y SE ECUACION DE REGRESION. SI SE MIDE UN OSO Y SE DETERMINA QUE TIENE UNA LONGITUD DE 71 Pulg, DETERMINA QUE TIENE UNA LONGITUD DE 71 Pulg, PREDIGA SU PESO.PREDIGA SU PESO.

y = - 352 + 9.66xy = - 352 + 9.66x

y = - 352 + 9.66 (71) y = - 352 + 9.66 (71) = 334 lbs

UN OSO DE 71 pulg, DE LONGITUD ES PROBABLE QUE UN OSO DE 71 pulg, DE LONGITUD ES PROBABLE QUE PESE ALREDEDOR DE 334 LIBRAS.PESE ALREDEDOR DE 334 LIBRAS.

^

^

Page 20: Estadistica Aplicada 8a Semana correlación y regresión.ppt

PUNTOS PARA USAR LA ECUACION DE REGRESION:

1.- SI NO HAY UNA CORRELACION LINEAL SIGNIFICATIVA, 1.- SI NO HAY UNA CORRELACION LINEAL SIGNIFICATIVA, NO USE LA ECUACION DE REGRESION.NO USE LA ECUACION DE REGRESION.

2.- SI USA LA ECUACION DE REGRESION PARA HACER 2.- SI USA LA ECUACION DE REGRESION PARA HACER PREDICCIONES, NO SE SALGA DEL AMBITO DE LOS DATOS PREDICCIONES, NO SE SALGA DEL AMBITO DE LOS DATOS DE MUESTRA DISPONIBLES.DE MUESTRA DISPONIBLES.

3.- UNA ECUACION DE REGRESION BASADA EN DATOS 3.- UNA ECUACION DE REGRESION BASADA EN DATOS VIEJOS NO NECESARIAMENTE SIGUE SIENDO VALIDA EN VIEJOS NO NECESARIAMENTE SIGUE SIENDO VALIDA EN EL PRESENTE.EL PRESENTE.

4.- NO HAGA PREDICCIONES ACERCA DE UNA POBLACION 4.- NO HAGA PREDICCIONES ACERCA DE UNA POBLACION DISTINTA DE LA POBLACION DE LA CUAL SE EXTRAJO LA DISTINTA DE LA POBLACION DE LA CUAL SE EXTRAJO LA MUESTRA DE DATOS.MUESTRA DE DATOS.

Page 21: Estadistica Aplicada 8a Semana correlación y regresión.ppt

Año Barcos (x)Muertes de Manaties (y)

1991 68 531992 68 381993 67 351994 70 491995 71 421996 73 601997 76 541998 81 671999 83 822000 84 78

Embarcaciones de placer (en decenas de miles)y muertes de Manaties.