estadistica aplicada 8a semana correlación y regresión.ppt

Post on 18-Feb-2016

320 Views

Category:

Documents

21 Downloads

Preview:

Click to see full reader

TRANSCRIPT

En ocasiones nos puede interesar estudiar si existe o no algún tipo de relación entre dos variables aleatorias. Así, por ejemplo, podemos preguntarnos si hay alguna relación entre las notas de la asignatura Estadística I y las de Matemáticas I.

CONCEPTO: Existe correlación entre dos variables si una de ellas está relacionada con la otra de alguna manera.

SUPUESTOS: LOS PARES DE DATOS (X, Y) TIENEN UNA DISTRIBUCION NORMAL BIVARIABLE. PARA CUALQUIER VALOR FIJO DE “X”, LOS VALORES CORRESPONDIENTES A “Y”, DEBEN TENER UNA DISTRIBUCION EN FORMA DE CAMPANA Y VICEVERSA.

COEFICIENTE DE CORRELACION LINEAL (r) : mide la fuerza de la relación lineal entre los valores X y Y apareados en una muestra. En algunos textos se le puede decir Coeficiente de Correlación de momento producto de Pearson.

REDONDEO DEL COEFICIENTE DE CORRELACION LINEAL: Se redondea a tres posiciones decimales. Se redondea hasta llegar la respuesta final y no en operaciones intermedias.

En particular, nos interesa cuantificar la intensidad de la relación lineal entre dos variables. El parámetro que nos da tal cuantificación es el coeficiente de correlación lineal de Pearson “r”, cuyo valor oscila entre –1 y + 1 :

CUANDO HAY CORRELACIÓN LINEAL POSITIVA (CERCANO A + 1)SI AUMENTA “X” TAMBIEN AUMENTA “Y”,

CUANDO HAY CORRELACIÓN LINEAL NEGATIVA (CERCANO A - 1)SI AUMENTA “X” DISMINUYE “Y”,SI DISMINUYE “X” AUMENTA “Y”

xLONGITUD

(pulg) 53 67.5 72 72 73.5 68.5 73 37

y PESO (lb) 80 344 416 348 262 360 332 34

LONGITUDES Y PESOS DE OSOS MACHO

ES POSIBLE PESAR UN OSO CON CINTA METRICA?

Algunos investigadores han estudiado osos anestesiados para poder realizar algunas mediciones como la longitud y el peso. En general es problemático pesar un oso anestesiado en su ambiente natural ya que son muy pesados.

Con los datos de la siguiente tabla, calcule el valor del coeficiente de correlación lineal, para determinar si existe o no una relación entre la longitud y los pesos de los osos, utilice un nivel de significancia del 0.05.

NOTACION PARA EL COEFICIENTE DE CORRELACION LINEAL

n = representa el número de pares de datos presentes.

x = Suma de todos los puntajes x

x = Cada puntaje x se debe elevar al cuadrado y luego todos deben sumarse

x = Indica que los puntajes x deben sumarse y el total debe elevarse al cuadrado.

xy = Indica que cada puntaje x primero se debe multiplicar con y, luego se suman todos los productos.

2

( )2

r = representa el coeficiente de correlación lineal para una muestra.

p = representa el coeficiente de correlacion lineal para una población.

EJEMPLO: Con los datos de la tabla de las longitudes y pesos de los Osos macho, calcule el valor del coeficiente de correlación lineal r.

Longitud (pulg) x

Peso (lb) y

53 80 4,240 2809 6400

67.5 344 23220 4556.25 118336

72 416 29952 5184 173056

72 348 25056 5184 121104

73.5 262 19257 5402.25 68644

68.5 360 24660 4692.25 129600

73 332 24236 5329 110224

37 34 1258 1369 1156

516.5 2176 151879 34525.75 728520

APLICAMOS LA FORMULA DE r

= _______8(151,879) – (516.5)(2176)_____________

V8(34,525.75) – (516.5) V 8(728,520) – (2176)__________________ ________________

2 2

= ______91,128_________

V 9433.75 V 1,093,184________ _________ = 0.897

HAY DOS TIPOS DE INTERPRETACIONES:

1.- TRADICIONAL o VAGA: Si “r” encontrado es cercano a cero, no existe una correlación lineal significativa entre X y Y. Si “r” es cercana a -1 ó +1, se concluye que si existe una correlación lineal significativa entre X y Y.

2.- ESPECIFICA A TRAVES DE TABLA PREDETERMINADA: Si el valor absoluto de “r” excede el valor de la tabla 10, concluimos que existe una correlación lineal significativa, en caso contrario no hay suficientes indicios para apoyar de que existe una correlación lineal significativa.

PRUEBA FORMAL DE HIPOTESIS PARA CORRELACIONES.

SE PARTE DE QUE : Ho : p = 0 (No existe correlación lineal)

Ha : p = 0 (Existe una correlación lineal)

EL ESTADISTICO DE PRUEBA ES t:

t = r_____

V 1 - r_n - 2

VALORES CRITICOS: Utilice la tabla A-3, CON n – 2 GRADOS DE LIBERTAD. SI t > VALOR CRITICO DE LA TABLA A-3 RECHACE LA Ho, SI t < VALOR CRITICO DE LA TABLA A-3 ACEPTAR LA Ho.

2

1. t = r_____ = V 1 - r_

n - 2

___0.897____

V 1 - 0.8046098 - 2

= ___0.897____

___0.897____=

V 0.195391

6

0.18045821= 4.971

EL VALOR CRITICO DE LA TABLA A-3 ES t = 2.447, QUE CORRESPONDE A UN NIVEL DE SIGNIFICANCIA DE 0.05, DIVIDIDA ENTRE DOS COLAS Y EL NUMERO DE GRADOS DE LIBERTAD ES n – 2. POR LO TANTO t > VALOR CRITICO, DEBEMOS RECHAZAR LA “Ho”. Y ACEPTAR LA “Ha”, QUE INDICA QUE SI EXISTE CORRELACION LINEAL SIGNIFICATIVA.

UTILIZANDO EL VALOR DE “r” DEL PROBLEMA DE LOS OSOS MACHO, REALICE LA PRUEBA DE HIPOTESIS PARA VERIFICAR SI EXISTE O NO CORRELACION LINEAL SIGNIFICATIVA.

2

EJEMPLO 2: EMBARCACIONES DE PLACER QUE SE REGISTRARON EN FLORIDA (EN DECENAS DE MILES) Y MUERTES DE MANATIES QUE SE RELACIONAN CON BARCOS, UTILICE UN NIVEL DE SIGNIFICANCIA DE 0.01; CUAL ES LA PROYECCION DE MANATIES MUERTOS, CUANDO SE AUTORICEN 1,250,000 EMBARCACIONES.

AÑO 91 92 93 94 95 96 97 98 99 00X BARCOS 68 68 67 70 71 73 76 81 83 84Y MUERTES 53 38 35 49 42 60 54 67 82 78

n n = 10 x = 55,289= 10 x = 55,289

x = 741 y = 558x = 741 y = 558

y = 33,456 xy = 42,214y = 33,456 xy = 42,214

22

22

= _______10(42,214) – (741)(558)_____________

V10(55,289) – (741) V 10(33,456) – (558) __________________ ________________

2 2

r = 0.921 LA TABLA A-6 AL 0.01 ES 0.716

r > 0.716, por lo tanto si existe correlacion lineal entre X y Y.

ESTATURAS Y PESOS DE SUPERMODELOS: ABAJO SE PRESENTAN LAS ESTATURAS (EN PULGADAS) Y LOS PESOS (EN LIBRAS) DE LAS SUPERMODELOS. EXISTE CORRELACION?. PRUEBELO AL 0.01 DE NIVEL SIGNIFICANCIA.

X ESTATURA (PULG) 70 70.5 68 65 70 70 70 70 71Y PESO (LBS) 117 119 105 115 119 127 113 123 115

SI HAY CORRELACION, ENCUENTRE EL PESO PROBABLE DE UNA MODELO QUE MIDA 75 PULG.

EN LAS CORRELACIONES ANALIZAMOS DATOS APAREADOS CON EL PROPOSITO DE DETERMINAR SI EXISTIA UNA CORRELACION LINEAL SIGNIFICATIVA ENTRE DOS VARIABLES. AHORA QUEREMOS DESCRIBIR LA RELACION ENCONTRANDO LA GRAFICA Y LA ECUACION DE LA RECTA QUE LA REPRESENTA.

ESTA LINEA RECTA SE DENOMINARA LINEA DE REGRESION Y SU ECUACION SE DENOMINA ECUACION DE REGRESION.

DADA UNA COLECCION DE DATOS DE MUESTRA APAREADOS, LA ECUACION DE LA REGRESION ES IGUAL:

y = b + b x 0 1^

ESTA DEFINICION EXPRESA UNA RELACION ENTRE X (llamada variable independiente) y Y (llamada variable dependiente). b0 es la ordenada al origen y b1 es la pendiente.

^

b0 = ( y) ( x ) - ( x) ( xy) 2

n( x ) - ( x) 2 2

Ordenada al origen

b1 = n ( xy) - ( x) ( y) n( x ) - ( x) 2 2 pendiente

EJEMPLO: Utilizando la tabla de las longitudes y pesos de los Osos, en el cual el coeficiente de correlación lineal es igual a 0.897. Obtenga ahora la ecuacion de regresion de la linea recta que relaciona x con y.

COMO RECORDARAN LOS DATOS QUE OBTUVIMOS FUERON COMO RECORDARAN LOS DATOS QUE OBTUVIMOS FUERON LOS SIGUIENTES:LOS SIGUIENTES:

n n = 8 x = 34,525.75= 8 x = 34,525.75

x = 516.5 y = 728,520x = 516.5 y = 728,520

y = 2176 xy = 151,879y = 2176 xy = 151,879

22

22

AHORA UTILIZAMOS LAS FORMULAS, DE LA PENDIENTE Y AHORA UTILIZAMOS LAS FORMULAS, DE LA PENDIENTE Y DE LA ORDENADA DE ORIGEN.DE LA ORDENADA DE ORIGEN.

b1 = 9.65979 = 9.66

b0 = - 352LA ECUACION ENTONCES ES :LA ECUACION ENTONCES ES :

y = - 352 + 9.66xy = - 352 + 9.66x^

SI LA LONGITUD Y EL PESO DE LOS OSOS TIENEN UNA SI LA LONGITUD Y EL PESO DE LOS OSOS TIENEN UNA CORRELACION LINEAL SIGNIFICATIVA, Y SABIENDO SU CORRELACION LINEAL SIGNIFICATIVA, Y SABIENDO SU ECUACION DE REGRESION. SI SE MIDE UN OSO Y SE ECUACION DE REGRESION. SI SE MIDE UN OSO Y SE DETERMINA QUE TIENE UNA LONGITUD DE 71 Pulg, DETERMINA QUE TIENE UNA LONGITUD DE 71 Pulg, PREDIGA SU PESO.PREDIGA SU PESO.

y = - 352 + 9.66xy = - 352 + 9.66x

y = - 352 + 9.66 (71) y = - 352 + 9.66 (71) = 334 lbs

UN OSO DE 71 pulg, DE LONGITUD ES PROBABLE QUE UN OSO DE 71 pulg, DE LONGITUD ES PROBABLE QUE PESE ALREDEDOR DE 334 LIBRAS.PESE ALREDEDOR DE 334 LIBRAS.

^

^

PUNTOS PARA USAR LA ECUACION DE REGRESION:

1.- SI NO HAY UNA CORRELACION LINEAL SIGNIFICATIVA, 1.- SI NO HAY UNA CORRELACION LINEAL SIGNIFICATIVA, NO USE LA ECUACION DE REGRESION.NO USE LA ECUACION DE REGRESION.

2.- SI USA LA ECUACION DE REGRESION PARA HACER 2.- SI USA LA ECUACION DE REGRESION PARA HACER PREDICCIONES, NO SE SALGA DEL AMBITO DE LOS DATOS PREDICCIONES, NO SE SALGA DEL AMBITO DE LOS DATOS DE MUESTRA DISPONIBLES.DE MUESTRA DISPONIBLES.

3.- UNA ECUACION DE REGRESION BASADA EN DATOS 3.- UNA ECUACION DE REGRESION BASADA EN DATOS VIEJOS NO NECESARIAMENTE SIGUE SIENDO VALIDA EN VIEJOS NO NECESARIAMENTE SIGUE SIENDO VALIDA EN EL PRESENTE.EL PRESENTE.

4.- NO HAGA PREDICCIONES ACERCA DE UNA POBLACION 4.- NO HAGA PREDICCIONES ACERCA DE UNA POBLACION DISTINTA DE LA POBLACION DE LA CUAL SE EXTRAJO LA DISTINTA DE LA POBLACION DE LA CUAL SE EXTRAJO LA MUESTRA DE DATOS.MUESTRA DE DATOS.

Año Barcos (x)Muertes de Manaties (y)

1991 68 531992 68 381993 67 351994 70 491995 71 421996 73 601997 76 541998 81 671999 83 822000 84 78

Embarcaciones de placer (en decenas de miles)y muertes de Manaties.

top related