correlación lineal simple
TRANSCRIPT
Curso: Estadística
Fecha: 28/05/2018
Correlación Lineal Simple
LOGRO DE LA SESIÓN
Al finalizar la sesión, elestudiante explica laexistencia de relaciónentre dos variablescuantitativas ydetermina el grado deasociación que hay entrelas variables.
Sesión 11: Correlación Lineal Simple
CONTENIDO SABERES PREVIOS
1. Gráfico de dispersión.2. Correlación de Pearson.
Variable independiente y variable dependiente.
Conceptos directamente proporcional e inversamente proporcional.
Al observar el video ¿Qué variables se
encuentran relacionadas?
Ver el siguiente video
https://www.youtube.com/watch?v=UJAqylc9_tQ
¿Qué es correlación?
A veces nuestro interés está en conocer si dosvariables cuantitativas están asociadas y enqué medida los cambios de una variablepueden explicar por los cambios que ocurrenen la otra. En este caso estamos en un estudiode Correlación
Correlación
Positiva
(Directa)
Correlación
Negativa
(Inversa)
No hay
Correlación
0
5
10
15
20
0 5 10 15
Var.
Dep
en
die
nte
(Y
)
Var. Independiente (X)
0
1
2
3
4
5
6
0 10 20
Var.
Dep
en
die
nte
(Y
)
Var. Independiente (X)
0
5
10
15
20
25
0 10 20 30V
ar.
Dep
en
die
nte
(Y
)
Var. Independiente (X)
GRÁFICO DE DISPERSIÓN
Consiste en graficar los datos en el plano cartesiano (X,Y) yobservar la relación de los datos si directa o inversa.
EJEMPLOS
1
22
1
22
1 1
)(
j
j
k
i
i
k
i j
ji
yynxxn
yyxxn
R
1 1
1
2 2 2 2
i i
i
n n
i i
n
i i
x nx y ny
x y nxyr
𝑅 =𝐶𝑜𝑣 𝑋,𝑌
𝑆𝑥𝑆𝑦; 𝐷𝑜𝑛𝑑𝑒:−1 ≤ 𝑅 ≤ +1
Si r < 0 Existe correlación inversa o negativa entre las variables
Si r > 0 Existe correlación directa o positiva entre las variables
r = 0 No existe relación lineal entre las variables Variables no correlacionadas
COEFICIENTE DE CORRELACIÓN LINEAL
La correlación lineal se mide con el estadístico denominadocoeficiente de correlación de Pearson y su fórmula es:
Interpretación del coeficiente de correlación R de Pearson
El Coeficiente de Correlación R de Pearson mide la fuerza y dirección de relación entre dos
variables cuantitativas en una escala que varía entre -1 a +1. Cuanto mas se aleja del 0 el
valor del coeficiente muestra una relación mas fuerte. El signo nos indica si la relación es
directa o inversa.
Correlación
inversa muy
fuerte
Correlación
inversa
fuerte
Correlación
inversa
Correlación
inversa
Correlación
inversa
Correlación
directa
Correlación
directa
Correlación
directa
Correlación
directa
fuerte
Correlación
directa muy
fuerte
Muy alta Alta Moderada Baja Muy baja Muy baja Baja Moderada Alta Muy alta
-1 -0.8 -0.6 -0.4 -0.2 0 +0.2 +0.4 +0.6 +0.8 +1
Para una mejor interpretación de r, podemos agregar que :
• Valores de r cercanos a 1, se traduce en una alta relación directa.
• Valores de r cercanos a -1, se traduce en una alta relación inversa.
• Valores de r cercanos a 0, se traduce en una baja relación lineal entre las variables, la
cual será directa si r > 0, y será inversa si r < 0 .
Correlación positiva perfecta (R = 1)
10
9
8
7
6
5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
Y
Correlación negativa perfecta (R = -1)
10
9
8
7
6
5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
Y
No hay correlación (R = 0)
10
9
8
7
6
5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
Y
X
Correlación positiva fuerte
Y
X
10
9
8
7
6
5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
EJEMPLO 1
Se ha recolectado datos a un grupo de personas, los años
de experiencia laboral y sus ingresos mensuales. ¿Existe
correlación entre las variables?
N° Años de Experiencia (X) Ingreso (Y)
1 5 40
2 15 40
3 24 90
4 16 70
5 19 60
6 3 20
7 6 30
8 12 30
9 27 70
10 13 50
Variable independiente (X): Años de experiencia
Variable dependiente (Y): Ingresos mensuales
En el gráfico de dispersión se observa una fuerte relación directa entrelos años de experiencia y el ingreso.
0
10
20
30
40
50
60
70
80
90
100
0 5 10 15 20 25 30
Ingr
eso
s
Años de experiencia
GRÁFICO DE DISPERSIÓN
En Excel hacemos los cálculos
10
4.4
64.5
n
x
y
N°Años de
Experiencia(X) Ingreso(Y)XY X2 Y2
1 5 40 200 25 1600
2 15 40 600 225 1600
3 24 90 2160 576 8100
4 16 70 1120 256 4900
5 19 60 1140 361 3600
6 3 20 60 9 400
7 6 30 180 36 900
8 12 30 360 144 900
9 27 70 1890 729 4900
10 13 50 650 169 2500
Total 44 645 8360 2530 29400
∑X ∑Y ∑XY ∑ X2 ∑ Y2
Promedios:
COEFICIENTE DE CORRELACIÓN DE PEARSON
2 2
1 1
1
2 2 2 2
8360 10 4.4 64.50.859
2530 10 4.4 29400 10 64.5
i i
i
n n
i i
n
i i
x nx y ny
x y nxyr
Interpretación: Como r =0.859, existe una fuerte correlacióndirecta entre los años de experiencia y el ingreso.
Véliz Capuñay, Carlos, 2011, México. Estadística para la
administración y los negocios, Primera Edición, 2011,
Prentice Hall. Pearson
http://www.fisterra.com/mbe/investiga/var_cuantitativas/var_
cuantitativas2.pdf Correlation en Wikipedia (inglés).
http://personal.us.es/vararey/adatos2/correlacion.pdf.
BIBLIOGRAFÍA