ad2 tema3-12
TRANSCRIPT
![Page 1: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/1.jpg)
TEMA 3Modelo de regresion simple
Jose R. BerrenderoDepartamento de Matematicas
Universidad Autonoma de Madrid
Analisis de Datos - Grado en Biologıa
![Page 2: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/2.jpg)
Estructura de este tema
Planteamiento del problema. Ejemplos.
El modelo de regresion lineal simple.
Recta de regresion de mınimos cuadrados.
Estimacion, IC y contrastes para los parametros del modelo.
Analisis de la varianza en el modelo de regresion lineal simple.
Prediccion.
Algunos modelos linealizables.
Diagnostico del modelo.
![Page 3: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/3.jpg)
Ejemplo: temperatura y vibracion de las alas
Los grillos son ectotermos, por lo que susprocesos fisiologicos y su metabolismoestan influidos por la temperatura. Conel fin de estudiar estas cuestiones se hamedido el numero de vibraciones por se-gundo de las alas de un grupo de grillosa varias temperaturas.
Vibraciones/seg. Temp.
20.0 88.616.0 71.619.8 93.318.4 84.317.1 80.615.5 75.214.7 69.717.1 82.015.4 69.416.2 83.315.0 78.617.2 82.616.0 80.617.0 83.514.1 76.3
![Page 4: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/4.jpg)
Ejemplo: Temperatura y vibracion de las alas
Consideramos dos variables (fichero grillos.sav):
X : Temperatura
Y : Numero de vibraciones de las alas por segundo
¿Que podemos decir sobre la relacion entre las dos variables?
¿Podemos afirmar (con un nivel de significacion dado) que al aumentar latemperatura, aumenta la frecuencia de vibracion?
¿Podemos predecir aproximadamente el valor de la variable Y si sabemosel valor de X? ¿Que grado de fiabilidad tiene la prediccion?
![Page 5: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/5.jpg)
Ejemplo: renta y fracaso escolar en la CAM
Ana JustelAna Justel
EjemploEjemplo
![Page 6: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/6.jpg)
●●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
10 12 14 16 18 20 22
1015
2025
3035
Renta (en miles de euros)
% fr
acas
o es
cola
r
Arganda
Torrelodones
![Page 7: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/7.jpg)
Covarianza
Se dispone de un conjunto de n pares de observaciones
(x1, y1), . . . , (xn, yn).
La covarianza entre x e y sirve para cuantificar el grado de relacion linealque hay entre x e y :
covxy =1
n
n∑i=1
(xi − x)(yi − y) =1
n
(n∑
i=1
xiyi − nx y
)
Propiedades:
covxy = covyx .
covxy depende de las unidades en que se miden x e y .
covxx = vx , es decir, la covarianza de x con x es la varianza de x .
![Page 8: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/8.jpg)
Interpretacion de la covarianza
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●●
●
●
● ●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●●
●
●
●
●
●
●●
●●
●●
●
●
●
●
●
●
●
●
●
●
● ●●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
● ●
●
●
●●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
● ●
●
●
●
●
●
●
●
●
●
●
●●
● ●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
● ●
●
●
●
●
●
●●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
● ●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●●
●
●
●
●
●
●
●
●
●●
●●
●
●●
●
●
●
●
●
●●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●●
●
●
● ●
●
●●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●
●
●●
●
●●
●●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
−2 −1 0 1 2
−4−2
02
4
Covarianza positiva
y ●●
●
●●
●
●
●
●
●●
●
●
●
●
●
●●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●●
●
●
●●
●
●●
●
●●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
● ●
●
●
●
●●
●
●
●
● ●
●
●
●●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●●
●
●
●●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
● ●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●● ●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
● ●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●●
●●
●
−2 −1 0 1 2
−4−2
02
4
Covarianza negativa
y
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
● ●
●
●● ●
●
●
●
●●●
●
●
●
●
●
●
●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●●
●
●
● ●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●●●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
● ●
●
●
●
●●
●
●
●
●
● ●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
● ●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●●
●
●
●
● ●
●
●●
●
●
● ●
●
●
●
●●
●
●
●
●
●
●
●
● ●
●
●●
−2 −1 0 1 2
−2−1
01
2
Covarianza aprox. cero
y ●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●●
●
●●
●●●
●
●
●
●
●
●
●
●
●●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●●●
●
●
●
●
●
●
●●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
● ●
●
●
●
● ●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●●
●
●
●
●
●●
●
●
●
●
●
●
●●
●
●
●
●
●●
●
●
●●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●●
● ●
●
●
●
● ●●
●●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●●
●
●
●
● ●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●●
●
●
●
●●
●
●
●
●●
●
●
●
●
●
●●
●●
●
●
●●
●
●
●●
●●
●
●
● ●●
●●
●
● ●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●●
●
●
●
●
●
●
●
●●
●
●
●
−2 −1 0 1 2
−20
24
6
Covarianza aprox. cero
y
●
![Page 9: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/9.jpg)
Coeficiente de correlacion
Resulta conveniente disponer de una medida de relacion lineal que nodependa de las unidades. Para ello, se normaliza covxy dividiendo por elproducto de desviaciones tıpicas, lo que lleva al coeficiente decorrelacion:
rxy =covxy√vx√vy.
Propiedades:
No depende de las unidades
Siempre toma valores entre -1 y 1.
Su signo se interpreta igual que el de la covarianza
Solo vale 1 o -1 cuando los puntos estan perfectamente alineados.
Aunque rxy ≈ 0, las variables x e y no son necesariamenteindependientes.
![Page 10: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/10.jpg)
NDesviación
típicaMedia
Vibraciones
Temperatura 156,717079,973
151,731916,633
Estadísticos descriptivos
TemperaturaVibraciones
Correlación de Pearson
Sig. (bilateral)
N
Correlación de Pearson
Sig. (bilateral)
N
Vibraciones
Temperatura
1515
,000
1,836
1515
,000
,8361
Correlaciones
Temperatura
95,090,085,080,075,070,065,0
Vib
ra
cio
ne
s
20,0
19,0
18,0
17,0
16,0
15,0
14,0
Página 1
NDesviación
típicaMedia
Vibraciones
Temperatura 156,717079,973
151,731916,633
Estadísticos descriptivos
TemperaturaVibraciones
Correlación de Pearson
Sig. (bilateral)
N
Correlación de Pearson
Sig. (bilateral)
N
Vibraciones
Temperatura
1515
,000
1,836
1515
,000
,8361
Correlaciones
Temperatura
95,090,085,080,075,070,065,0
Vib
ra
cio
ne
s
20,0
19,0
18,0
17,0
16,0
15,0
14,0
Página 1
NDesviación
típicaMedia
Vibraciones
Temperatura 156,717079,973
151,731916,633
Estadísticos descriptivos
TemperaturaVibraciones
Correlación de Pearson
Sig. (bilateral)
N
Correlación de Pearson
Sig. (bilateral)
N
Vibraciones
Temperatura
1515
,000
1,836
1515
,000
,8361
Correlaciones
Temperatura
95,090,085,080,075,070,065,0
Vib
ra
cio
ne
s20,0
19,0
18,0
17,0
16,0
15,0
14,0
Página 1
![Page 11: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/11.jpg)
Problema de regresion
Observamos dos variables, X e Y , el objetivo es analizar la relacionexistente entre ambas de forma que podamos predecir o aproximar el valorde la variable Y a partir del valor de la variable X .
La variable Y se llama variable respuesta
La variable X se llama variable regresora o explicativa
En un problema de regresion (a diferencia de cuando calculamos elcoeficiente de correlacion) el papel de las dos variables no es simetrico.
![Page 12: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/12.jpg)
Recta de regresion
Frecuentemente, existe entre las variables una relacion aproximadamentelineal:
Yi ≈ β0 + β1xi .
La recta y = β0 + β1x es una recta de regresion.
El parametro β1 es la pendiente de la recta. Indica la variacionmedia de la variable respuesta cuando X aumenta una unidad.
El parametro β0 es el termino independiente de la recta. Indica elvalor medio de Y cuando X = 0.
Objetivo: estimar los parametros β0 y β1 a partir de los datos (xi ,Yi ),i = 1, . . . , n.
![Page 13: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/13.jpg)
Datos con β0 ≈ 3, β1 ≈ 0.5 y r ≈ 0.8
●
●
●
●
●
●
●
●
●
●
●
4 6 8 10 12 14
45
67
89
1011
x1
y1
●
●
●●
●
●
●
●
●
●
●
4 6 8 10 12 14
34
56
78
9
x2
y2
●
●
●
●
●
●
●
●
●
●
●
4 6 8 10 12 14
68
1012
x3
y3
●
●
●
●●
●
●
●
●
●
●
8 10 12 14 16 18
68
1012
x4
y4
![Page 14: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/14.jpg)
El modelo de regresion lineal simple
Para poder hacer inferencia (IC y contrastes) sobre los parametros,suponemos que se verifica el siguiente modelo:Para todas las observaciones i = 1, . . . , n
Yi = β0 + β1xi + ui ,
donde:
El valor medio de los errores ui es cero.
Todos los errores ui tienen la misma varianza σ2 (homocedasticidad).
Las variables ui tienen distribucion normal.
Las variables ui son independientes.
![Page 15: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/15.jpg)
where f x; mð Þ is the normal density function of N m; 1ð Þ. Figure 3.4 shows symboli-
cally the joint densities given by (3.9) for several choices of m. Note that the peaks areat the line x1 ¼ x2. Again, our goal is to find the value of m such that the joint density
(3.9) is the most likely distribution that could generate our pair of observations
x1; x2ð Þ.Note that the two-dimensional bell-shaped joint densities shown inFigure 3.4
have contour lines in the form of circles with centers at the line x1 ¼ x2. Smaller
circles correspond to higher density.
The smallest circle including point x1; x2ð Þ is the one with the center at the point
ð x1 þ x2ð Þ=2; x1 þ x2ð Þ=2Þ. Consequently, the joint density with the largest value atpoint x1; x2ð Þ is the one with parameter m ¼ x1 þ x2ð Þ=2. This fact can also be
demonstrated algebraically by writing (3.9) as
1ffiffiffiffiffiffi2p
p exp � x1 � mð Þ22
" #� 1ffiffiffiffiffiffi
2pp exp � x2 � mð Þ2
2
" #¼ 1
2pexp � x1 � mð Þ2 þ x2 � mð Þ2
2
" #
ð3:10Þ
and showing that the minimum of x1 � mð Þ2 þ x2 � mð Þ2 with respect to m is
realized when m¼ x1 þ x2ð Þ=2. The estimate bm¼ x1 þ x2ð Þ=2 is then called the
MLE. For samples with n> 2, we will rely on the algebraic approach only.
Here, we write the joint density of all n elements of the sample as the product of
the normal densities
Yni¼1
f xi;mð Þ: ð3:11Þ
Figure 3.4 Joint density functions (shown symbolically) of the bivariate normal distributions of the form
(3.9) with varying m.
58 STATISTICAL INFERENCE
![Page 16: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/16.jpg)
¿En que situaciones se verifica el modelo?
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●●
●●
●
●
● ●
●
●
●●
●
●●
●
●
●
1 2 3 4 5 6
12
34
56
7
x
y1
●
●
●
●
●
●●
●
●
●●
●
●● ●
●●●
● ●●●●
●
●
●
●
●●
●
●
●
●●
●
●
●
●●
●
● ●
●
●
●
●
●
●
●
●
−4 −2 0 2 4
05
1015
2025
x2
y2
●
●
● ●
●
●
●
●
●
●
●
●
●
●●
● ●●
●●● ●●● ●
●
●
●
●●
●
●
●●
●●
●
●
●
● ●●
●
●
●
●●
●
●
●
1 2 3 4 5 6
−10
010
2030
x
y3
●
●
●
●
●
●
●
●●
●
●●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●●
●
●●
●●
●
●
●
●
●
●
●
●
●●
●●
1 2 3 4 5 6
23
45
67
x
y4
![Page 17: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/17.jpg)
La recta de mınimos cuadrados
Si estimamos β0 y β1 mediante β0 y β1, la prediccion de la variablerespuesta Yi en funcion de la regresora xi es:
Yi = β0 + β1xi
Unos buenos estimadores deben ser tales que los errores de prediccion
ei = Yi − Yi = Yi − (β0 + β1xi )
sean pequenos.
La recta de regresion de mınimos cuadrados viene dada por los valoresβ0 y β1 para los que se minimiza:
n∑i=1
[Yi − (β0 + β1xi )]2
![Page 18: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/18.jpg)
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
−2 −1 0 1 2
−1
01
23
x
y
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
−2 −1 0 1 2
−1
01
23
x
y
![Page 19: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/19.jpg)
Estimadores de mınimos cuadrados
Pendiente:
β1 =covxy
vx= r
√vy√vx
= rSySx.
Termino independiente:
β0 = Y − β1x
Al igual que en los modelos de los temas anteriores:
A las predicciones Yi = β0 + β1xi se les llama valores ajustados opronosticados.
A los errores ei = Yi − Yi se les llama residuos.
![Page 20: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/20.jpg)
Ejemplo: temperatura y vibracion de las alas
Estimadores de los parametros:
β1 = rxySySx
= 0.841.73
6.72= 0.2155
β0 = Y − β1x = 16.633− 0.2155× 79.973 = −0.615
Recta de regresion:y = −0.615 + 0.2155x
Prediccion de Y0 para x0 = 80:
Y0 = −0.615 + 0.2155× 80 = 16.625
![Page 21: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/21.jpg)
Diagrama de dispersion y recta estimada
Temperatura
95,090,085,080,075,070,065,0
Vib
rac
ion
es
20,0
19,0
18,0
17,0
16,0
15,0
14,0
R2 Lineal = 0,7
Página 1
![Page 22: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/22.jpg)
Observaciones
La recta de mınimos cuadrados pasa por el punto cuyas coordenadasson las medias: (x , Y ).
Si la variable regresora se incrementa en una desviacion tıpica∆x = Sx , entonces la prediccion de la variable respuesta seincrementa en r desviaciones tıpicas: ∆Y = rSy
Puede demostrarse que la suma de los residuos siempre vale cero.
La recta para predecir Y en funcion de X no es la misma que la rectapara predecir X en funcion de Y .
![Page 23: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/23.jpg)
La varianza residual
La varianza residual es un estimador insesgado de σ2:
S2R =
∑ni=1 e
2i
n − 2=
∑ni=1(Yi − Yi )
2
n − 2=
∑ni=1(Yi − β0 − β1xi )
2
n − 2.
Se pierden dos grados de libertad puesto que los residuos verifican dosrestricciones:
La media de los residuos es igual a cero.
La covarianza entre los residuos y la variable regresora es tambienigual a cero.
![Page 24: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/24.jpg)
Una simulacion
Supongamos que σ = 1, β0 = 0 y β1 = 1.
Entonces el modelo esYi = xi + ui ,
donde los errores ui tienen distribucion normal estandar y sonindependientes.
Fijamos xi = 1, 2, . . . , 10 (n = 10) y generamos las respuestascorrespondientes de acuerdo con este modelo.
Posteriormente calculamos la recta de mınimos cuadrados y larepresentamos junto con la verdadera recta y = x .
![Page 25: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/25.jpg)
Repetimos 6 veces el experimento
●
●
●
●
●
●
●
●
●
●
0 2 4 6 8 10
24
68
10
x
●
●
●●
●
●
●
●
●
●
0 2 4 6 8 10
24
68
10
x
●
● ●
●
●
●
●
●
●
●
0 2 4 6 8 10
02
46
810
x
●
●
●
●●
●
●
●
●
●
0 2 4 6 8 10
−20
24
68
10
x
●
●
●
●
●
●
●
●
●
●
0 2 4 6 8 10
02
46
8
x
●
●
●
●
●
●
●
●
●
●
0 2 4 6 8 10
24
68
10
x
![Page 26: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/26.jpg)
Repetimos 6 veces el experimento
●
●
●
●
●
●
●
●
●
●
0 2 4 6 8 10
24
68
10
beta1=0.9
●
●
●●
●
●
●
●
●
●
0 2 4 6 8 10
24
68
10
beta1=0.95
●
● ●
●
●
●
●
●
●
●
0 2 4 6 8 10
02
46
810
beta1=1.11
●
●
●
●●
●
●
●
●
●
0 2 4 6 8 10
−20
24
68
10
beta1=1.01
●
●
●
●
●
●
●
●
●
●
0 2 4 6 8 10
02
46
8
beta1=0.84
●
●
●
●
●
●
●
●
●
●
0 2 4 6 8 10
24
68
10
beta1=0.99
![Page 27: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/27.jpg)
Repetimos 1000 veces el experimento
ββ0
−2 −1 0 1 2
01
00
25
0
ββ1
0.6 0.8 1.0 1.2 1.4
05
01
50
Los estimadores soncentrados y tienendistribucion normal.
Existen formulas delerror tıpico de β0 yβ1 que miden suvariabilidad.
Estas formulas sonlas que se utilizanpara calcular IC yllevar a cabocontrastes en lo quesigue.
![Page 28: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/28.jpg)
Error tıpico del estimador de la pendiente
error tıpico de β1 =SR√∑n
i=1(xi − x)2= SR
√1
nvx
Al aumentar nvx , el error tıpico de la pendiente disminuye (es decir, laestimacion de la pendiente es mas precisa).
Conviene disenar el experimento de forma que los valores xi tengan lamayor dispersion posible.
![Page 29: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/29.jpg)
Error tıpico del estimador del termino independiente
error tıpico de β0 = SR
√1
n+
x2
nvx
Si x2 es grande, se estima con menos precision el terminoindependiente.
![Page 30: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/30.jpg)
Intervalos de confianza
Los intervalos de confianza de nivel 1− α para los parametros βi (i = 0, 1)tienen la estructura habitual:
IC1−α(βi ) ≡[βi ∓ tn−2,α/2 × error tıpico de βi
]En comparacion con los intervalos de confianza para la media:
Los grados de libertad son n − 2 en lugar de n − 1.
La formula del error tıpico es mas complicada.
El intervalo de confianza para σ2 tambien tiene la estructura que ya hemosvisto en los modelos de los temas anteriores:
IC1−α(σ2) ≡
[(n − 2)S2
R
χ2n−2;α/2
,(n − 2)S2
R
χ2n−2;1−α/2
]
![Page 31: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/31.jpg)
Ejemplo: temperatura y vibracion de las alas
Para los datos del ejemplo se ha calculado S2R = 0.97.
Calcula los errores tıpicos de los estimadores de la pendiente y deltermino independiente.
Calcula un intervalo de confianza de nivel 95% para β1.
Calcula un intervalo de confianza de nivel 95% para β0.
![Page 32: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/32.jpg)
Contrastes para los parametros
Contraste bilateral:
Hipotesis: H0 : βi = 0 frente a H1 : βi 6= 0Region crıtica:
R =
{|βi |
error tıpico de βi> tn−2,α/2
}.
Contrastes unilaterales:
Hipotesis: H0 : βi ≤ 0 frente a H1 : βi > 0Region crıtica:
R =
{βi
error tıpico de βi> tn−2,α
}.
Hipotesis: H0 : βi ≥ 0 frente a H1 : βi < 0Region crıtica:
R =
{βi
error tıpico de βi< −tn−2,α
}.
![Page 33: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/33.jpg)
Ejemplo: temperatura y vibracion de las alas
¿Aportan los datos evidencia para afirmar (α = 0.01) que latemperatura tiene una influencia significativa sobre la frecuencia devibracion de las alas?
¿Podemos afirmar a nivel α = 0.01 que al aumentar la temperaturaaumenta la frecuencia media de vibracion de las alas?
Escribe la region crıtica para contrastar H0 : β1 = 1 frente aH1 : β1 6= 1.
![Page 34: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/34.jpg)
Con SPSS: temperatura y vibraciones
Error típ. de la estimación
R cuadrado corregidaR cuadradoR
1 ,9849,677,700,836aModeloModelo
Resumen del modelo
a. Variables predictoras: (Constante), Temperatura
Sig.FMedia
cuadráticaglSuma de
cuadrados
Regresión
Residual
Total
1
1441,993
,9701312,611
,000a30,29029,383129,383
ModeloModelo
ANOVAb
a. Variables predictoras: (Constante), Temperatura
b. Variable dependiente: Vibraciones
Error típ.B Beta Sig.t
Coeficientes tipificadosCoeficientes no estandarizados
(Constante)
Temperatura
1
,0005,504,836,039,216
,848-,1963,144-,615
ModeloModelo
Coeficientesa
a. Variable dependiente: Vibraciones
Límite superiorLímite inferior
Intervalo de confianza de 95,0% para B
(Constante)
Temperatura
1
,300,131
6,178-7,408
ModeloModelo
Coeficientesa
a. Variable dependiente: Vibraciones
Página 1
![Page 35: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/35.jpg)
Con SPSS: renta y fracaso escolar
Resumen del modelob
,742a ,550 ,528 4,7566Modelo1
R R cuadradoR cuadradocorregida
Error típ. de laestimación
Variables predictoras: (Constante), Rentaa. Variable dependiente: Fracasob.
ANOVAb
580,516 1 580,516 25,658 ,000a
475,133 21 22,6251055,649 22
RegresiónResidualTotal
Modelo1
Suma decuadrados gl
Mediacuadrática F Sig.
Variables predictoras: (Constante), Rentaa. Variable dependiente: Fracasob.
Coeficientesa
38,494 3,645 10,562 ,000-1,347 ,266 -,742 -5,065 ,000
(Constante)Renta
Modelo1
B Error típ.
Coeficientes noestandarizados
Beta
Coeficientesestandarizad
ost Sig.
Variable dependiente: Fracasoa.
&[PageTitle]
Página 1
![Page 36: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/36.jpg)
Cuestiones
Escribe la ecuacion de la recta de mınimos cuadrados que describe elnivel de fracaso escolar como funcion de la renta.
Calcula intervalos de confianza de nivel 95% para la pendiente y eltermino independiente de la recta de regresion.
¿Podemos afirmar, a nivel α = 0.05 que niveles mas altos de rentaestan asociados a niveles mas bajos de fracaso escolar?
¿Cuanto vale el coeficiente de correlacion entre el nivel de renta y elporcentaje de fracaso escolar?
¿Que porcentaje de fracaso escolar se predice en una poblacion cuyarenta es x0 = 13000 euros?
¿Cual es el residuo correspondiente a Colmenar Viejo?
![Page 37: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/37.jpg)
Analisis de la varianza en regresion simple
Yi = Yi + ei
Yi − Y = (Yi − Y ) + ein∑
i=1
(Yi − Y )2 =n∑
i=1
(Yi − Y )2 +n∑
i=1
e2i
SCT = SCE + SCR
SCT mide la variabilidad total (tiene n − 1 gl)
SCE mide la variabilidad explicada por el modelo (tiene 1 gl)
SCR mide la variabilidad no explicada o residual (tiene n − 2 gl)
![Page 38: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/38.jpg)
Tabla ANOVA y contraste F
Fuente de variacion Suma de cuadrados gl cuadrados medios estadıstico
Explicada (SCE)∑n
i=1(Yi − Y )2 1∑n
i=1(Yi − Y )2 F
Residual (SCR)∑n
i=1 e2i n − 2 S2
R =∑n
i=1 e2i
n−2
Total (SCT)∑n
i=1(Yi − Y )2 n − 1
El estadıstico F es igual a SCE/S2R .
Si F es suficientemente grande (la variabilidad explicada es muy granderespecto a la no explicada), se debe rechazar H0 : β1 = 0.
Bajo H0 : β1 = 0, el estadıstico F tiene distribucion F1,n−2. La regioncrıtica de nivel α del contraste es:
R = {F > F1,n−2;α}
![Page 39: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/39.jpg)
Tabla ANOVA y contraste F
Para contrastar H0 : β1 = 0 a nivel α hemos considerado tresprocedimientos:
Calcular un IC de nivel de confianza 1− α para β1 y rechazar H0 si 0no pertenece al intervalo.
Dividir |β1| por su error tıpico y rechazar H0 si el valor obtenido essuperior a tn−2;α/2.
Calcular F = SCE/S2R y rechazar H0 si el valor obtenido es superior a
F1,n−2;α.
Los tres metodos son equivalentes en este modelo.
![Page 40: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/40.jpg)
Evaluacion del ajuste
Para valorar el grado con el que la recta se ajusta a los datos se empleanvarias medidas:
El coeficiente de correlacion r .
El coeficiente de determinacion:
R2 =Variabilidad explicada
Variabilidad total=
SCE
SCT
En el modelo de regresion simple R2 = r2, el coeficiente dedeterminacion coincide con el coeficiente de correlacion al cuadrado.
El error cuadratico medio:
ECM =
∑ni=1(Yi − Yi )
2
n=
∑ni=1 e
2i
n.
Puede comprobarse que ECM = Vy (1− r2).
![Page 41: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/41.jpg)
Cuestiones
Si SCT = 8100, SCE = 6900 y β1 = −6.7. Calcula el coeficiente decorrelacion entre la variable regresora y la variable respuesta.
Para un conjunto de 20 datos se sabe que SCT = 7200, SCE = 2900y β1 = 3.1. Calcula el coeficiente de correlacion, el coeficiente dedeterminacion y el error cuadratico medio.
![Page 42: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/42.jpg)
Inferencia sobre la variable respuesta
Una de las razones para ajustar un modelo de regresion simple es obtenerinformacion sobre Y cuando x toma un valor x0 conocido. Hay dosproblemas relacionados con este objetivo:
Estimar el valor medio de Y para los individuos de la poblacionpara los que X = x0. Si µ0 es este valor medio,
µ0 = β0 + β1x0.
Predecir el valor individual que tomara la variable Y para unanueva observacion para la que se sabe que X = x0. Si Y0 es estevalor,
Y0 = β0 + β1x0 + u0.
¿Que problema es mas difıcil de los dos?¿Que estimador y que prediccion resultan razonables para µ0 y Y0?
![Page 43: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/43.jpg)
Estimacion y prediccion puntual
En ambos casos, el estimador (o prediccion) puntual es:
Y0 = β0 + β1x0 = Y + β1(x0 − x).
Sin embargo, el intervalo de confianza para µ0 es diferente del intervalo deprediccion para Y0.
Intervalo de confianza para µ0 de nivel 1− α:Y0 ∓ tn−2;α/2SR
√1
n+
(x0 − x)2
nVx
Intervalo de prediccion para Y0 de nivel 1− α:Y0 ∓ tn−2;α/2SR
√1 +
1
n+
(x0 − x)2
nVx
![Page 44: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/44.jpg)
Ejemplo: temperatura y vibracion de las alas
Calcula un intervalo de confianza de nivel 95% para el numero mediode vibraciones de las alas de los grillos cuando la temperatura es de80 grados Farenheit.
Calcula un intervalo de prediccion de nivel 95% para el numero devibraciones de las alas de un grillo cuando la temperatura es de 80grados Farenheit.
En una poblacion de la Comunidad de Madrid se sabe que la rentaper capita es 1000 euros inferior a la media de los datos disponibles.Calcula un intervalo de prediccion de nivel 95% del porcentaje defracaso escolar en esa poblacion. Repite el ejercicio para unapoblacion cuya renta sea 1000 euros superior a la media.
Medias Cuasidesviaciones tıpicas
% Fracaso 20.73 6.92Renta 13.19 3.81
![Page 45: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/45.jpg)
Intervalos de confianza y prediccion
mediamedia
Bandas de predicción
Bandas de confianza
![Page 46: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/46.jpg)
Intervalos de confianza para la media
22,50020,00017,50015,00012,50010,0007,500
Renta
40,0
30,0
20,0
10,0
Frac
aso
Sq r lineal = 0,55
Intervalos de confianza
22,50020,00017,50015,00012,50010,0007,500
Renta
40,0
30,0
20,0
10,0
Frac
aso
Sq r lineal = 0,55
Intervalos de predicción
&[PageTitle]
Página 1
![Page 47: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/47.jpg)
Intervalos de prediccion para valores individuales
22,50020,00017,50015,00012,50010,0007,500
Renta
40,0
30,0
20,0
10,0
Frac
aso
Sq r lineal = 0,55
Intervalos de confianza
22,50020,00017,50015,00012,50010,0007,500
Renta
40,0
30,0
20,0
10,0
Frac
aso
Sq r lineal = 0,55
Intervalos de predicción
&[PageTitle]
Página 1
![Page 48: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/48.jpg)
Estimacion de algunas relaciones no lineales
A veces, aunque la relacion entre x e Y no sea lineal, el modelo deregresion simple puede aplicarse despues de transformar adecuadamentelas variables.
Modelos:
Modelo de regresion exponencial
Modelo de regresion logarıtmica
Modelo de regresion potencial
![Page 49: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/49.jpg)
Modelo de regresion exponencial
La variable respuesta es aproximadamente una funcion exponencial de lavariable regresora:
Y ≈ aebx
Se linealiza tomando logaritmos:
logY ≈ log a + bx
Si ajustamos un modelo lineal a
(x1, logY1), . . . , (xn, logYn)
obtenemos los estimadores log a y b.
Invirtiendo los cambios obtenemos los estimadores a y b.
![Page 50: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/50.jpg)
Modelo de regresion logarıtmica
La variable respuesta es aproximadamente una funcion lineal del logaritmode la variable regresora:
Y ≈ β0 + β1 log x
Si ajustamos un modelo lineal a
(log x1,Y1), . . . , (log xn,Yn)
obtenemos los estimadores β0 y β1.
![Page 51: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/51.jpg)
Modelo de regresion potencial
La variable respuesta es proporcional a una potencia de la variableregresora:
Y ≈ axb
Se linealiza tomando logaritmos:
logY ≈ log a + b log x
Si ajustamos un modelo lineal a
(log x1, logY1), . . . , (log xn, logYn)
obtenemos los estimadores log a y b.
Invirtiendo los cambios obtenemos los estimadores a y b.
![Page 52: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/52.jpg)
Ejemplo: renta y fracaso escolar
●●
●●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
10 12 14 16 18 20 22
10
15
20
25
30
35
Renta
Fra
caso
●●
●●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
2.2 2.4 2.6 2.8 3.0
10
15
20
25
30
35
log−Renta
Fra
caso
● ●
●●
●
●
●
●
●●●
●
●
●
●
●
●
●
●
●
●
●
●
10 12 14 16 18 20 22
2.5
3.0
3.5
Renta
log
−F
raca
so● ●
●●
●
●
●
●
●●●
●
●
●
●
●
●
●
●
●
●
●
●
2.2 2.4 2.6 2.8 3.0
2.5
3.0
3.5
log−Renta
log
−F
raca
so
![Page 53: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/53.jpg)
Ejemplo: renta y fracaso escolarResumen del modelo y estimaciones de los parámetros
Ecuación Resumen del modelo Estimaciones de los parámetros
R cuadrado F gl1 gl2 Sig. Constante b1
Lineal ,550 25,658 1 21 ,000 38,494 -1,347
Logarítmica ,572 28,032 1 21 ,000 70,584 -19,600
Potencia ,610 32,809 1 21 ,000 293,923 -1,066
Exponencial ,594 30,691 1 21 ,000 51,642 -,074
![Page 54: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/54.jpg)
Diagnostico del modelo: linealidad y homocedasticidad
El grafico mas util para el diagnostico del modelo es el de residuos frente avalores ajustados:
(Y1, e1), . . . , (Yn, en)
Se suelen utilizar los residuos estandarizados, que bajo las hipotesis delmodelo tienen aproximadamente la distribucion normal estandar.
La hipotesis de normalidad se valora a partir de un grafico de probabilidadde los residuos.
La homocedasticidad se puede confirmar si
No hay patrones sistematicos en el grafico.
La variabilidad es aproximadamente constante a lo largo de todo elrango de valores ajustados.
Los residuos estandarizados que no estan comprendidos entre los valores -3y 3 pueden corresponder a datos atıpicos potencialmente influyentes.
![Page 55: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/55.jpg)
Residuos frente a valores ajustados
![Page 56: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/56.jpg)
Residuos frente a valores ajustados
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●●
●
1 2 3 4 5
23
45
6
x
y1
●●●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●●
●
●●
●
●
●
●
●●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
1 2 3 4 5
510
1520
25
x
y2
●●●
●
●
●
●
●●
●
●
●
●
●●
●
●
●
●
●
●●
●
●●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●●
●
1 2 3 4 5
23
45
6
x
y3
●●●
●
●
●
●●
●
●
●
●
●
●
●●
●
●
●
●
●●
●
●●
●
●
●
●
●●
●●
●●
●
●
●●
●
●
●
●
●
●●
●
●●●
1 2 3 4 5
23
45
6
x
y4
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
● ●
●
●
●
●
●
●
●
●
●●
●
●
●
●
2 3 4 5 6
−2
−1
01
23
Ajustados
Res
iduo
s
●
●
●●
●
●
● ●
●●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●●
●
0 5 10 15 20 25
−1
01
23
Ajustados
Res
iduo
s
●
●
●
●
●
●●
●
●
●
●●
●
●
●
●
● ●
●
● ●
● ●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●
●●
●
2 3 4 5 6
−3
−2
−1
01
23
Ajustados
Res
iduo
s
●●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
2 3 4 5 6
−2
−1
01
2
Ajustados
Res
iduo
s
![Page 57: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/57.jpg)
Diagnostico del modelo: normalidad
![Page 58: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/58.jpg)
Precauciones al aplicar el modelo de regresion simple
Existencia de datos atıpicos
Extrapolacion
Mezcla de poblaciones diferentes
Datos temporales
![Page 59: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/59.jpg)
Datos atıpicos
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
−1 0 1 2 3 4
01
23
45
●
●
●
![Page 60: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/60.jpg)
Datos atıpicos
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
−1 0 1 2 3 4
01
23
45
●
●
●
![Page 61: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/61.jpg)
Datos atıpicos
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
−1 0 1 2 3 4
01
23
45
●
●
●
![Page 62: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/62.jpg)
Datos atıpicos
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
−1 0 1 2 3 4
01
23
45
●
●
●
![Page 63: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/63.jpg)
Ejemplo: Temperatura e intensidad de luz en estrellas
Para 47 estrellas se han registrado el log de la temperatura efectiva en lasuperficie (Temp) y el log de la intensidad de su luz (Intens).
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●●
●
●
●
3.6 3.8 4.0 4.2 4.4 4.6
4.0
4.5
5.0
5.5
6.0
log(Temperatura)
log(
Inte
nsid
ad)
![Page 64: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/64.jpg)
Ejemplo: Temperatura e intensidad de luz en estrellas
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●●
●
●
●
3.6 3.8 4.0 4.2 4.4 4.6
4.0
4.5
5.0
5.5
6.0
log(Temperatura)
log(
Inte
nsid
ad)
![Page 65: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/65.jpg)
Extrapolacion
Recta de regresión estimada
Verdadera relación
xpredicción
Ybuena
Ypredicción
![Page 66: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/66.jpg)
Mezcla de poblaciones
Regresión con todos los datos
![Page 67: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/67.jpg)
Ejemplo: numero de pie y estatura
![Page 68: Ad2 tema3-12](https://reader033.vdocuments.co/reader033/viewer/2022050818/558fee671a28ab4d5d8b4659/html5/thumbnails/68.jpg)
Datos temporales (correlacion espurea
PNB en EE.UU e incidencia del melanoma en la poblacion masculina enConnecticut (1936-1972)