clase 7 analisiscorrelacional
TRANSCRIPT
Hoy veremos:Hoy veremos:– Correlación vs. CausaciónCorrelación vs. Causación– Técnicas de Correlación:Técnicas de Correlación:
a. Coeficiente Fia. Coeficiente Fib. Coeficiente Rho de Spearmanb. Coeficiente Rho de Spearmanc. Coeficiente r de Pearsonc. Coeficiente r de Pearson
Dr. Carlos J. VilaltaDr. Carlos J. Vilalta
Clase 7. Pruebas de hipótesis sobre asociaciones entre variables
CorrelacionesCorrelaciones ¿Para qué sirven?¿Para qué sirven?
– Son utilizadas para establecer, sumarizar y Son utilizadas para establecer, sumarizar y describir relaciones (asociaciones) entre 2 describir relaciones (asociaciones) entre 2 variablesvariables
Asume que la relación puede ser:Asume que la relación puede ser: Positiva: Cuando aumenta X aumenta YPositiva: Cuando aumenta X aumenta Y Negativa: Cuando aumenta X disminuye YNegativa: Cuando aumenta X disminuye Y No hay correlación (correlación = 0)No hay correlación (correlación = 0)
Los valores pueden variar entre +1 y -1 Los valores pueden variar entre +1 y -1 (salvo en V de Cramer)(salvo en V de Cramer)
Regla de interpretación Si el resultado del coeficiente varía
entre:-1.0 a -0.7 Asociación fuerte negativa-0.7 a -0.3 Asociación débil negativa-0.3 a +0.3 Asociación nula o muy débil+0.3 a +0.7 Asociación débil positiva+0.7 a +1.0 Asociación fuerte positiva
Práctica: Por lo menos contar con una muestra de 80 observaciones
Guía de Técnicas Guía de Técnicas CorrelacionalesCorrelacionales
2 / Variables2 / Variables NominalNominal OrdinalOrdinal ProporcionesProporciones
NominalNominal FiFi FiFi FiFi
OrdinalOrdinal FiFi Rho de Rho de SpearmanSpearman
Rho de Rho de SpearmanSpearman
ProporcionesProporciones FiFi Rho de Rho de SpearmanSpearman
r de Pearsonr de Pearson
(a) Coeficiente Fi ((a) Coeficiente Fi ()) ¿Qué es? Una medida del grado de ¿Qué es? Una medida del grado de
asociación entre 2 variables asociación entre 2 variables dicotómicas (nominales con sólo 2 dicotómicas (nominales con sólo 2 categorías)categorías)– Tiene un diseño muy similar al de la prueba Tiene un diseño muy similar al de la prueba
Ji CuadradaJi Cuadrada– En tablas de 2x2, el valor de Fi va de -1 a En tablas de 2x2, el valor de Fi va de -1 a
+1+1– En caso de variables nominales con 3 o más En caso de variables nominales con 3 o más
categorías, utilizar el coeficiente “V de categorías, utilizar el coeficiente “V de Cramer” y reportar la Significancia Cramer” y reportar la Significancia Estadística más que el valor del coeficienteEstadística más que el valor del coeficiente
2 Formulas de Fi (2 Formulas de Fi ())
SiSi NoNo TotalTotalSiSi aa bb eeNoNo cc dd ffTotalTotal gg hh nn
O bien esta otra fórmula
Ejemplo Coeficiente FiEjemplo Coeficiente Fi Pregunta: ¿Los que votaron por el PRI en la Pregunta: ¿Los que votaron por el PRI en la
elección anterior tienden a votar igualmente por el elección anterior tienden a votar igualmente por el PRI en la elección posterior?PRI en la elección posterior?
Hipótesis:Hipótesis:– Ho: No hay una correlación entre voto anterior y posteriorHo: No hay una correlación entre voto anterior y posterior– Ha: Sí hay una correlación entre voto anterior y posteriorHa: Sí hay una correlación entre voto anterior y posterior
Variables:Variables:– Voto anterior (PRI 1997)Voto anterior (PRI 1997)– Voto actual (PRI 2000)Voto actual (PRI 2000)
Ejemplo Coeficiente Fi (SPSS)Ejemplo Coeficiente Fi (SPSS)
Symmetric Measures
-.733 .000.733 .000200
PhiCramer's V
Nominal byNominal
N of Valid Cases
Value Approx. Sig.
Not assuming the null hypothesis.a.
Using the asymptotic standard error assuming the nullhypothesis.
b.
Tabla de Frecuencias
Resultados del Análisis... Tomar Ha“Hay una
Correlación Negativa
Significativa”
PRIANT * PRIPOST Crosstabulation
Count
10 140 15040 10 5050 150 200
NoSi
Voto PRI1997
Total
No SiVoto PRI 2000
Total
(b) Coeficiente Rho ((b) Coeficiente Rho () de ) de SpearmanSpearman
¿Qué es? Una medida del grado de ¿Qué es? Una medida del grado de asociación entre 2 variables asociación entre 2 variables ordinales (ranking)ordinales (ranking)
Fórmula:Fórmula:
Ejemplo Rho de SpearmanEjemplo Rho de SpearmanPregunta: ¿Son los países que tienen un mejor Pregunta: ¿Son los países que tienen un mejor ranking en Educación también los que tienen ranking en Educación también los que tienen un mejor ranking en Ingreso?un mejor ranking en Ingreso?
• Hipótesis:Hipótesis:•Ho: No hay una correlación entre educación Ho: No hay una correlación entre educación e ingresoe ingreso•Ha: Sí hay una correlación entre educación Ha: Sí hay una correlación entre educación e ingresoe ingreso
• Variables:Variables:•Ranking en EducaciónRanking en Educación•Ranking en IngresoRanking en Ingreso
Ejemplo Rho de SpearmanEjemplo Rho de SpearmanRanking Educación Ranking Ingreso D D2 Pasos:
1 2 -1 1 Sigma D2 = 382 4 -2 4 6 * Sigma D2 = 2283 1 2 4 n = 204 3 1 1 n * (n2 - 1) = 79805 5 0 0 (6 * Sigma D2) / n * (n2 - 1) = 0.0296 8 -2 4 1 - (6 * Sigma D2) / n * (n2 - 1) = 0.9717 6 1 18 7 1 19 9 0 010 12 -2 411 11 0 012 10 2 413 13 0 014 14 0 015 18 -3 916 15 1 117 16 1 118 17 1 119 20 -1 120 19 1 1
Suma 38
Ejemplo Rho de Spearman (SPSS)Ejemplo Rho de Spearman (SPSS)Correlations
1.000 .971**. .000
20 20.971** 1.000.000 .
20 20
Correlation CoefficientSig. (2-tailed)NCorrelation CoefficientSig. (2-tailed)N
Ranking Educación
Ranking Ingreso
Spearman's rho
RankingEducación
RankingIngreso
Correlation is significant at the .01 level (2-tailed).**.
(r = .971, p=.000)
Aceptar Ha
Significado: Hay una correlación positiva significativa entre niveles de educación e
ingreso
(c) Coeficiente “r” de Pearson(c) Coeficiente “r” de Pearson ¿Qué es? Una medida del grado de ¿Qué es? Una medida del grado de
asociación entre 2 variables de asociación entre 2 variables de proporcionesproporciones
Fórmula:Fórmula:
Correlaciones que no se pueden Correlaciones que no se pueden detectardetectar
Ojo: Relaciones Ojo: Relaciones curvílineales no son curvílineales no son detectadas por detectadas por estas técnicasestas técnicas
Correlación no es Correlación no es igual a causa…igual a causa…
Pero un requisito de Pero un requisito de causación es causación es correlación…correlación…
X
121086420Y
1200
1000
800
600
400
200
0
-200
Indispensable: Revisar las gráficas Indispensable: Revisar las gráficas
X
20171411852
Y1
14
12
10
8
6
4
2Rsq = 0.666
X
20171411852
Y2
14
12
10
8
6
4
2Rsq = 0.666
X
20171411852
Y3
14
12
10
8
6
4
2Rsq = 0.666
X4
20171411852
Y4
14
12
10
8
6
4
2Rsq = 0.667
Ejemplo r de PearsonEjemplo r de Pearson Pregunta: ¿Son los estados que producen más Pregunta: ¿Son los estados que producen más
patentes aquellos que reciben más becas del patentes aquellos que reciben más becas del Conacyt?Conacyt?
Hipótesis:Hipótesis:– Ho: No hay una correlación entre Patentes y BecasHo: No hay una correlación entre Patentes y Becas– Ha: Sí hay una correlación entre Patentes y BecasHa: Sí hay una correlación entre Patentes y Becas
Variables:Variables:– Número de Becas del Conacyt por estado administradorNúmero de Becas del Conacyt por estado administrador– Número de Patentes registradas por estado de Número de Patentes registradas por estado de
residencia del inventorresidencia del inventor
Ejemplo r de Pearson (SPSS)Ejemplo r de Pearson (SPSS)Correlations
1.000 .961**. .000
32 32.961** 1.000.000 .
32 32
Pearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)N
Becas administradas
Patentes
Becasadministradas Patentes
Correlation is significant at the 0.01 level (2-tailed).**.
r = .961 (p=.000)
Aceptar Ha
Significado: Hay una correlación positiva significativa entre asignación de becas y
producción de patentes
Terminaste…Terminaste…Muchas Gracias y Muchas Gracias y
Mucha SuerteMucha Suerte