Coeficiente de Correlación entre dos Variables
CovarianzaLa covarianza es un valor que indica el grado de variación conjunta de dos variables aleatorias. Es el dato básico para determinar si existe una dependencia entre ambas variables
Cuando a valores de una de las variables suelen corresponderles los de la otra se corrobora que tienden a mostrar similar comportamiento lo que se refleja en un valor positivo de la covarianza1
Por el contrario, cuando a los mayores valores de una variable suelen corresponder en general los menores de la otra, expresando un opuesto comportamiento, la covarianza es negativa.
El coeficiente de correlación lineal es el cociente entre la covarianza y el producto de las desviaciones típicas de ambas variables
Propiedades del coeficiente de correlación 1. El coeficiente de correlación no varía al
hacerlo la escala de medición. 2. El signo del coeficiente de correlación es el
mismo que el de la covarianza. Si la covarianza es positiva, la correlación es directa. Si la covarianza es negativa, la correlación es
inversa. Si la covarianza es nula, no existe correlación.
3. El coeficiente de correlación lineal es un número real comprendido entre −1 y 1.
−1 ≤ r ≤ 1 4. Si el coeficiente de correlación
lineal toma valores cercanos a −1 la correlación es fuerte e inversa, y será tanto más fuerte cuanto más se aproxime r a −1.
5. Si el coeficiente de correlación lineal toma valores cercanos a 1 la correlación es fuerte y directa, y será tanto más fuerte cuanto más se aproxime r a 1.
6. Si el coeficiente de correlación lineal toma valores cercanos a 0, la correlación es débil.
Coeficiente de Determinación La efectividad de la predicción depende
de la relación entre las variables. Si dos variables no covarían, no podremos hacer predicciones válidas, y si la intensidad de la covariación es moderada, las predicciones no serán demasiado buenas. En consecuencia, hay que disponer de alguna medida de la capacidad de la ecuación de Regresión para obtener predicciones buenas (en el sentido de que sean lo menos erróneas posible).
Esta medida es el Coeficiente de Determinación, que es el cuadrado del coeficiente de correlación de Pearson, y da la proporción de variación de la variable Y que es explicada por la variable X (variable predictora o explicativa). Si la proporción es igual a 0, significa que la variable predictora no tiene NULA capacidad predictiva de la variable a predecir (Y). Cuanto mayor sea la proporción, mejor será la predicción. Si llegara a ser igual a 1 la variable predictora explicaría TODA la variación de Y, y las predicciones NO tendrían error