Taller 1Reflexiones sobre Metodología
Cuantitativa:De la asociación a la causalidad entre
variables
Germán Fromm R.
1
Objetivo Entender los diseños metodológicos correlacionales
2
3
El diseño metodológico…¿Qué pretende responder?
¿Qué variables considera? ¿Qué sabemos de estas variables?
¿Cómo procede para responder?
4
Esquema de decisiones¿Qué pretende responder?
Descripción Explicación
5
Esquema de decisiones¿Qué variables considera?
Desconocidas Estudiadas
¿Qué sabemos de estas variables?
Poco o nada TeoríaComplejas Factor únicoAsociadas Aislables
6
Esquema de decisiones¿Cómo procede para responder?
Transversal Experimental
LongitudinalCualitativoConfirmatorio
7
Esquema de decisiones
8
Asociación con
proyección
Causalidad posible
Asociación simple
Causalidad rigurosa
De la asociación…
9
X Y
Una correlación
Paréntesis: Correlaciones
10
R2r
4%.2
1%.1Son muy frecuentes en CCSS, pero con r < .2, hay poco poder explicativo
R2 < 4%
25%.5
16%.4
9%.3Corresponde a la mayoría de las correlaciones “estadísticamente
significativas”, pero incluso r = .5, explica sólo el 25% de la varianza
36%.6
49%.7
Raro en CCSS, pero aun si r= .7, menos de ½ de la varianza es
explicada
64%.8
81%.9
90%.95
Extremadamente raro en CCSS y más probabale de contener errores como
fenómendo agregado
Débil: r=.10
Moderado: r=.30
Fuerte: r=.50
Intervalos de Cohen Intervalos enPsicometría
Débil: r<.5
Moderado: r>.5
Fuerte: r>.8
Alerta: r>.95
Paréntesis: Significación o α
11
α
>.05Estas correlaciones no son confiables. Independiente de la magnitud de r
>.01
α
<.05No debemos considerarlas a menos que las muestras sean grandes:
N>100
<.01
Estas correlaciones se consideran fiables. Si N<30 nunca son fiables, pero por otras
razones.
Esta correlación NO es estadísticamente singificativa.
Esta correlación es estadísticamente significativa (o no lo es para N<100)Se reporta: α=.034 o bien p=.034
Esta correlación es estadísticamente significativa con p<.01 o p<0.001 si da.
Interpretación
Ejercicio: ¿Qué puedo “publicar” si obtengo una correlación entre dos variables con los siguientes datos: r=.53 y p=.048?
Pasar de la asociaciónA las 5 posibilidades implícitas
A) Causalidad
IndefinibleB) Causalidad
C) Codeterminación
E) Error de definción12
X YX YX YX Y
Pasar de la asociaciónLa 5 y más frecuente posibilidad y sus
variantes
Correlación espúriaE)
Mediación
Paradoja de Simpson
Falacia Ecológica13
X Y
Z
A la causalidad
14
“I interpreted…Galton…to mean that there was a category broader than causation,
namely correlation…and that this new conception of correlation brought
psychology, anthropology, medicine, and sociology in large parts into the field of
mathematical treatment. It was Galton who first freed me from the prejudice that sound
mathematics could only be applied to natural phenomenon under the category of
causation. Here for the first time was a possibility, I will not say a certainty, of
reaching knowledge—as valid as physical knowledge was then thought to be—in the
field of living forms and above all in the field of human conduct.”
Karl Pearson, 1889
It is easy to prove that the wearing of tall hats and the carrying of umbrellas enlarges the chest, prolongs life, and confers comparative immunity from disease… A university degree, a daily bath, the owning of thirty pairs of trousers, a knowledge of Wagner’s music, a pew in church, anything, in short, that implies more means and better nurture…can be statistically palmed off as a magic spell conferring all sorts of privileges…The mathematician whose correlations would fill a Newton with admiration, may, in collecting and accepting data and drawing conclusions from them, fall into quite crude errors by just such popular oversights
George Bernard Shaw, 1906
4 criterios para la cusalidadMecanismo identificado: Contamos con una “buena”
explicación sobre “como” un cambio produce otro.
Consistencia:Encontramos lo mismo en otras
muestras de poblaciones con otras características a lo largo del tiempo.
Respuesta (Responsividad):Demostramos que cambiar una
vriable altera la otra.
Sin alternativas plausibles:No hay otra lógica que pueda
explicar el cambio, considerando también variables intervinientes.
15
+ Chequeos contrafacticos:¿Qué pasaría si tuveran diferente
tratamiento?
…causalidad entre variables¿Podemos usar correlaciones? Si No
16
¿Cómo establecer responsividad?
¿Cómo asignar los valores de VI?• No asingar: son características inmutbles de las personas• Los participantes las eligen (medición)• Los investigadores las asignan (observación)• Fuerzas externas las alteran involuntariamente• Externos usa un criterio de asingación (ranking, intervalos,
puntajes de corte, etc.)
¿Cómo descarto explicaciones alternativas?
¿Hay antecedentes que expliquen los efectos causales?• Establecer grupos con equivalencia inicial• Aislar la proporción de la varaición de X que sea exógena
(y tampoco sea un error de medición como un sesgo)• Hay antecedentes o reflexiones que sostengan la
explicación
Conclusiones sujetas a sesgos
Experimentos Naturales
Diseños de Regresión
Criterio Pareado (matching)
Variables Instrumentales
Discutible si son “causas”
Acá hacemos “Ciencia”
Causalidad rigurosa¿Podemos usar correlaciones? Si No
17
Intervención activa: La investigación efectivamente altera X y
observa Y
Equivalencia inicial:Los grupos tienen promedios equiparables
en sus características
Contrafácticos o grupo control:Un grupo proporciona el contrafáctico ideal
Sin explicaciones alternativas (aislamiento):
El cambio de Y tiene que ser consecuencia del cambio en X
Conclusiones¿Podemos usar correlaciones? Si.Las correlaciones son una herramienta útil si
la “apoyamos” correctamente. Con ella podemos recorrer una gradiente de causalidad hipotéctica o implicada, hasta sostener un argumento. Esa intuición requiere de entrenamiento.
Al analizar nuestros datos, diseños y proyectos consideremoslos pasos de la asociación a la causalidad y las interferencias que tenga.
La correlación no implica causalidad, pero tampoco la descarta.
18