capitulo 34 - crodzmate3026.files.wordpress.com

28
Capitulo Describir la relación entre dos variables © 2010 Pearson Prentice Hall. All rights reserved 3 4

Upload: others

Post on 08-Jul-2022

5 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Capitulo 34 - crodzmate3026.files.wordpress.com

Capitulo

Describir la

relación entre dos

variables

© 2010 Pearson Prentice Hall. All rights reserved

34

Page 2: Capitulo 34 - crodzmate3026.files.wordpress.com

Relación entre dos variables

4-2© 2010 Pearson Prentice Hall. All rights

reserved

Al estudiar conjuntos de variables con más de una

variable, una pregunta fundamental debe ser si

podemos utilizar el valor de una variable para predecir

el valor de alguna otra variable.

Ejemplos:

• ¿Existe una relación entre la estatura y el peso?

• ¿Existe una relación entre la dosis de un

medicamento y el tiempo de recuperación?

• ¿Existe una relación entre la tasa de criminalidad y

los cambios en la población?

Page 3: Capitulo 34 - crodzmate3026.files.wordpress.com

4-3© 2010 Pearson Prentice Hall. All rights

reserved

Tipos de variables en un experimento

• Variable de respuesta

• variable bajo estudio;

• aquella variable cuyos cambios se desean

estudiar

• variable dependiente en el estudio

• Variable explicativa

• variable cuyos valores explican los valores de

la variable respuesta

• se estudian los efectos que tiene la variable

explicativa sobre la variable respuesta

• variable que el investigador manipula

• variable independiente en el experimento

Page 4: Capitulo 34 - crodzmate3026.files.wordpress.com

4-44© 2010 Pearson Prentice Hall. All rights

reserved

Diagrama de dispersión

• Diagrama de dispersión es una gráfica que nos

permite observar la relación entre dos cantidades

cuantitativas que se miden en un mismo individuo.

• Se localizan en el plano-xy puntos en los cuales las

coordenadas se forman como sigue:

x → variable explicativa (variable de entrada)

y → variable de respuesta (variable de salida)

• El eje horizontal representa la variable explicativa, y el

eje vertical representa la variable respuesta.

Page 5: Capitulo 34 - crodzmate3026.files.wordpress.com

EJEMPLO Construir e interpretar un diagrama de dispersión

Source: Penner, R., and Watts, D.G. “Mining Information.” The American Statistician, Vol. 45, No. 1, Feb. 1991, p. 6.

4-5© 2010 Pearson Prentice Hall. All rights

reserved

Los investigadores deseaban

determinar si el tiempo que se

necesita para perforar en seco una

distancia de 5 pies de roca

incrementa con la profundidad a la

que se comienza la perforación.

• La profundidad a la que comienza

la perforación es la variable

explicativa, x

• el tiempo (en minutos) para

perforar 5 pies a cierta

profundidad es la variable

respuesta, y.

Dibuje un diagrama de dispersión de

los datos.

Page 6: Capitulo 34 - crodzmate3026.files.wordpress.com

Tipos de Relaciones en un

Diagrama de Dispersión

4-6

Page 7: Capitulo 34 - crodzmate3026.files.wordpress.com

4-7© 2010 Pearson Prentice Hall. All rights

reserved

Correlación lineal

• Si a medida que los valores de una variable aumentan

los valores de la otra variable también aumentan,

entonces existe correlación positiva.

• Si a medida que los valores de una variable aumentan

los valores de la otra variable disminuyen, entonces

existe correlación negativa.

• Coeficiente de correlación lineal de una muestra (r)

es una medida de la fuerza y dirección de la relación

lineal entre dos variable cuantitativas (coeficiente de

correlación Pearson)

Page 8: Capitulo 34 - crodzmate3026.files.wordpress.com

4-8© 2010 Pearson Prentice Hall. All rights

reserved

Coeficiente de correlación lineal de una muestra

Page 9: Capitulo 34 - crodzmate3026.files.wordpress.com

4-9© 2010 Pearson Prentice Hall. All rights

reserved

Coeficiente de correlación lineal de una muestra

𝑟 =σ𝑧𝑥 ∙ 𝑧𝑦

𝑛 − 1

𝑧𝑥 𝑧𝑦

𝑟 =1

𝑛 − 1𝑧𝑥 ∙ 𝑧𝑦

ó

Page 10: Capitulo 34 - crodzmate3026.files.wordpress.com

4-10© 2010 Pearson Prentice Hall. All rights

reserved

Propiedades del Coeficiente de correlación lineal

Page 11: Capitulo 34 - crodzmate3026.files.wordpress.com

4-11© 2010 Pearson Prentice Hall. All rights

reserved

Tipos de correlación

Page 12: Capitulo 34 - crodzmate3026.files.wordpress.com

Niveles de correlación entre dos variables

124-12© 2010 Pearson Prentice Hall. All rights

reserved

Page 13: Capitulo 34 - crodzmate3026.files.wordpress.com

Determine e interprete el coeficiente de

correlación lineal para la siguiente data.

4-13© 2010 Pearson Prentice Hall. All rights

reserved

EJEMPLO Coeficiente de correlación lineal

x y

1 1

2 2

2 3

3 6

Page 14: Capitulo 34 - crodzmate3026.files.wordpress.com

(a) Encuentre una ecuación lineal que relaciona x (la variable explicativa) con y, (la variable de respuesta) seleccionando dos puntos y luego, encontrar la ecuación de la recta que contiene los puntos.

(b) Traza la gráfica de la ecuación sobre el diagrama de dispersion.

(c) Use la ecuación para predecir y si x = 3.

Use la siguente muestra:

144-14© 2010 Pearson Prentice Hall. All rights

reserved

Page 15: Capitulo 34 - crodzmate3026.files.wordpress.com

Determine el coeficiente de

correlación lineal de la data

sobre perforación en rocas.

4-15© 2010 Pearson Prentice Hall. All rights

reserved

EJEMPLO Coeficiente de correlación lineal -tecnología

Page 16: Capitulo 34 - crodzmate3026.files.wordpress.com

EJEMPLO ¿Existe una relación lineal?

Determine si existe una relación lineal en la data sobre

perforación en rocas. Si existe, comente sobre el tipo de relación

que existe entre la profundidad a la cual se comienza a perforar y

el tiempo que toma perforar 5 pies..

164-16© 2010 Pearson Prentice Hall. All rights

reserved

Page 17: Capitulo 34 - crodzmate3026.files.wordpress.com

17

Ejemplo: • Según datos recopilados por El Resumen Estadístico de

Los Estados Unidos, la correlación entre el porcentaje de la población femenina con grados de bachillerato y el porcentaje de nacimientos a madres solteras desde 1990 es 0.940.

Cierto o Falso: Un porcentaje mayor de féminas con bacillerato causa un porcentaje mayor de madres solteras.

4-17© 2010 Pearson Prentice Hall. All rights

reserved

Diferencia entre correlación y

relación causal

Page 18: Capitulo 34 - crodzmate3026.files.wordpress.com

18

• Entre dos variables puede existir otro factor que provoca una correlación alta sin que haya una relación causal.

Ejemplo: Se ha encontrado que la relación entre la venta de helado y la taza de criminalidad tiene una correlación positiva alta.

Justificación

4-18© 2010 Pearson Prentice Hall. All rights

reserved

Variables ocultas (“lurking variables”)

Page 19: Capitulo 34 - crodzmate3026.files.wordpress.com

4-19© 2010 Pearson Prentice Hall. All rights reserved

Línea de regresión por mínimos

cuadrados

• La línea de regresión por mínimos cuadrados es la línea que minimiza los residuales.

• Es la línea que minimiza la suma de los cuadrados de las distancias verticales entre los valores observados y los valores que predice el modelo.

Page 20: Capitulo 34 - crodzmate3026.files.wordpress.com

4-20© 2010 Pearson Prentice Hall. All rights reserved

Línea de regresión por mínimos

cuadrados

La ecuación de la línea de regresión por mínimos cuadrados está dada por

ො𝑦 = 𝑏1𝑥 + 𝑏0donde 𝑏1 = 𝑟 ∙

𝑠𝑦

𝑠𝑥es la pendiente

y 𝑏0 = ത𝑦 − 𝑏1 ҧ𝑥 es el intercepto en y

Page 21: Capitulo 34 - crodzmate3026.files.wordpress.com

EJEMPLO Determinar el modelo de regresión lineal

Usar los datos sobre perforación

de rocas

(a)Encuentre la línea de

regresión por mínimos

cuadrados.

(b)Predecir el tiempo de

perforación en caso de que la

perforación se inicia en 130

pies.

(c)Dibuje la línea de regresión

por mínimos cuadrados sobre

el diagrama de dispersión de

los datos.

4-21© 2010 Pearson Prentice Hall. All rights reserved

Page 22: Capitulo 34 - crodzmate3026.files.wordpress.com

EJEMPLO Predecir peso del oso negro americano

Los datos muestran la longitud y el

peso de 10 osos blancos

americanos. Se quiere poder usar

el largo para predecir el peso.

(a) Construir un diagrama de

dispersión

(b) Encuentre la línea de regresión

por mínimos cuadrados usando

la fórmula.

(c)Compare la respuesta de b, con

la línea de regresión por

mínimos cuadrados que da la

calculadora.

4-22© 2010 Pearson Prentice Hall. All rights reserved

Page 23: Capitulo 34 - crodzmate3026.files.wordpress.com

Si la línea de regresión por mínimos cuadrados se utiliza para hacer predicciones basadas en los valores de la variable explicativa que son mucho más grande o mucho más pequeño que los valores observados, decimos que el investigador está trabajando fuera del alcance del modelo.

Nunca usamos una línea de regresión por mínimos cuadrados para hacer predicciones fuera del alcance del modelo, porque no podemos estar seguros de que la relación lineal sigue existiendo.

4-23© 2010 Pearson Prentice Hall. All rights reserved

Page 24: Capitulo 34 - crodzmate3026.files.wordpress.com

Si una gráfica de los residuos contra la variable explicativa muestra un patrón discernible, tal como una curva definida, entonces, es posible que las variables no estén relacionadas linealmente.

4-24© 2010 Pearson Prentice Hall. All rights

reserved

Comentarios sobre los residuos

Page 25: Capitulo 34 - crodzmate3026.files.wordpress.com

4-25© 2010 Pearson Prentice Hall. All rights

reserved

Page 26: Capitulo 34 - crodzmate3026.files.wordpress.com

Un químico tiene una muestra de 1,000 gramos de un material radiactivo. Se registra la cantidad de material radiactivo restante en la muestra todos los días durante una semana y obtiene los siguientes datos.

Día Peso (en gramos)

0 1000.0

1 897.1

2 802.5

3 719.8

4 651.1

5 583.4

6 521.7

7 468.3

4-26© 2010 Pearson Prentice Hall. All rights

reserved

EJEMPLO Investigar residuos

Page 27: Capitulo 34 - crodzmate3026.files.wordpress.com

El coeficiente de determinación

• El coeficiente de determinación, 𝑅2, mide la proporción de variación total en la variable de respuesta que se explica por la línea de regresión de mínimos cuadrados.

• 0 ≤ 𝑅2 ≤1.

• Si 𝑅2 = 0, la línea no tiene valor explicativo.

• Si 𝑅2 = 1, la línea explica el 100% de la variación en la variable de respuesta.

© 2010 Pearson Prentice Hall. All rights reserved

27

Page 28: Capitulo 34 - crodzmate3026.files.wordpress.com

EJEMPLO Determinar el Coeficiente de Determinación

Encuentre e interprete el coeficiente de

determinación para los datos anteriores de

perforación de rocas.

4-28© 2010 Pearson Prentice Hall. All rights

reserved