lecciÓn pÚblica tema 4 - blog activo desde 2008 · «si el hecho de que aparezca o se presente...
TRANSCRIPT
Relación entre variables cuantitativas
Modelo de regresión lineal. Requisitos
Modelo de regresión lineal. Coeficientes
Variables nominales. Tablas de contingencia
Relación entre variables dicotómicas
Relación entre variables politómicas
TEMARIO
Lección Pública 2
Relación entre variables cuantitativas
Modelo de regresión lineal. Requisitos
Modelo de regresión lineal. Coeficientes
Variables nominales. Tablas de contingencia
Relación entre variables dicotómicas
Relación entre variables politómicas
TEMARIO
Lección Pública 3
Variables nominales. Tablas de contingencia Lección Pública 4
Tema 4: Descripción bivariante de datos
Vivo Fallecido TOTAL
Presente 10 5 15
Ausente 3 12 15
TOTAL 13 17 30
Estatus de tratamiento
Condición
1 1 1
2 2 1
3 2 2
4 1 1
… … …
N 1 2
Estatus de tratamiento 1 Presente 2 Ausente
Condición 1 Vivo 2 Fallecido
Construcción de Tablas de Doble Entrada (2x2)
Variables nominales. Tablas de contingencia Lección Pública 5
Tema 4: Descripción bivariante de datos
Casado Soltero Otro
Se queda en casa 10 5 5
Salidas con actividades ligeras
5 7 12
Salidas con actividades pesadas
5 15 6
Estatus marital
Actividad más frecuente día
viernes
1 1 3
2 3 1
3 2 2
… … …
N 1 3
Estatus marital 1 Casado 2 Soltero 3 Otro
Actividad más frecuente día viernes 1 Se queda en casa 2 Salida con actividades ligeras 3 Salidas con actividades pesadas
Construcción de Tablas de Doble Entrada (Ordenes Superiores)
6 Lección Pública
Tema 4: Descripción bivariante de datos
Casado Soltero Otro TOTAL
Se queda en casa 10 5 5 20
Salidas con actividades ligeras 5 7 12 24
Salidas con actividades pesadas 5 15 6 26
TOTAL 20 27 23 70
Casado Soltero Otro
Se queda en casa 0,5 0,185 0,22
Salidas act. ligeras 0,25 0,255 0,52
Salidas act. pesadas 0,25 0,555 0,26
TOTAL 20 27 23
Casado Soltero Otro TOTAL
Se queda en casa 0,5 0,25 0,25 20
Salidas act. Ligeras 0,21 0,29 0,5 24
Salidas con act.pesadas 0,19 0,58 0,23 26
PERFILES COLUMNA PERFILES FILA
«Si el hecho de que aparezca o se presente una categoría junto con otra no es ni más ni menos probable de que se presenten las dos categorías por separado, se dice que las variables son independientes y, en general, se dice que la tabla es homogénea»
Variables nominales. Tablas de contingencia
Perfiles Fila y Columna
Relación entre variables cuantitativas
Modelo de regresión lineal. Requisitos
Modelo de regresión lineal. Coeficientes
Variables nominales. Tablas de contingencia
Relación entre variables dicotómicas
Relación entre variables politómicas
TEMARIO
Lección Pública 7
Relación entre variables dicotómicas 8 Lección Pública
Tema 4: Descripción bivariante de datos
En el ejemplo presentado a continuación, sobre el desarrollo de hipotiroidismo en hombres o mujeres, el riesgo relativo es= (10/15) / (3/15) = 3,35. Es decir, el «riesgo» de desarrollar hipotiroidismo siendo mujer es más de tres veces superior al de desarrollarlo siendo hombre.
Mujer Hombre TOTAL
Hipotiroidismo 10 (a) 5 (b) 15
No Hipotiroidismo 3 (c) 12 (d) 15
TOTAL 13 17 30
RR=𝑎/(𝑎+𝑏)
𝑐/(𝑐+𝑑)
En experimentos con grupo control, donde el investigador define el tamaño de los grupos y los tratamiento experimentales, es inadecuado utilizar el RR, y debe usarse el Odds Ratio.
Riesgo Relativo
El Riesgo Relativo (RR) y el Odds Ratio son medidas de asociación para variables nominales dicotómicas.
El riesgo relativo es el cociente entre el riesgo en el grupo con el factor de exposición o de riesgo, y el riesgo en el grupo de referencia. Se calcula de la siguiente manera
Relación entre variables dicotómicas 10 Lección Pública
Tema 4: Descripción bivariante de datos
• Un «Odds» es la razón entre la probabilidad de que un evento ocurra sobre la probabilidad de que no ocurra. El resultado varía entre 0 e infinito.
• Un «Odds Ratio» es la razón entre dos de estas probabilidades. Aplicado a un ejemplo que utilizamos anteriormente:
Probabilidades Vivo Fallecido Vivo / Fallecido
Odds Ratio
Presente 10 5 2 8
Ausente 3 12 0,25
Odds Ratio
Esto implica decir que en el grupo tratado se presentan ocho casos de sobrevivencia por cada fallecido, en comparación con el grupo no tratado, donde se presentaría un sujeto vivo por cada fallecido. O, en otras palabras, que el tratamiento mejora en ocho veces la supervivencia, comparado con el azar.
Relación entre variables dicotómicas 11 Lección Pública
Tema 4: Descripción bivariante de datos
Coeficiente phi φ
Evalúa la relación entre dos variables dicotómicas, presentando los resultados en un coeficiente de interpretación similar a la del r de Pearson.
Mujer Hombre TOTAL
Hipotiroidismo 10 (a) 5 (b) 15
No Hipotiroidismo 3 (c) 12 (d) 15
TOTAL 13 17 30
φ = 𝑏𝑐−𝑎𝑑
(𝑎+𝑐)(𝑏+𝑑)(𝑎+𝑏)(𝑐+𝑑)
φ = 15−120
(13)(17)(15)(15)= -0,47
Relación entre variables cuantitativas
Modelo de regresión lineal. Requisitos
Modelo de regresión lineal. Coeficientes
Variables nominales. Tablas de contingencia
Relación entre variables dicotómicas
Relación entre variables politómicas
TEMARIO
Lección Pública 14
Prueba Chi Cuadrado 15 15 Lección Pública
Tema 5: Pruebas de Hipótesis
Chi Cuadrado (χ2)
Usado como mínimo para tablas 3x2, con variables nominales u ordinales.
♀ ♂ TOTAL
Caracas 10 5 15
Maracaibo 5 10 15
Valencia 8 12 20
TOTAL 23 27 50
♀ ♂ TOTAL
Caracas 6,9 8,1 15
Maracaibo 6,9 8,1 15
Valencia 9,2 10,8 20
TOTAL 23 27 50
♀ ♂ TOTAL
Caracas 1,39 1,19 2,58
Maracaibo 0,52 0,45 0,97
Valencia 0,16 0,13 0,29
TOTAL 2,07 1,77 3,84
fo fe (fo-fe)2 / fe
χ2 = (fo−fe)2
𝑓𝑒
χ2crítico = 5,99 < χ2
calculado = 3,84 Las variables son independientes
tcrítica tcalculada
Relación entre variables cuantitativas
Modelo de regresión lineal. Requisitos
Modelo de regresión lineal. Coeficientes
Variables nominales. Tablas de contingencia
Relación entre variables dicotómicas
Relación entre variables politómicas
TEMARIO
Lección Pública 16
Relación entre variables cuantitativas 17 17 Lección Pública
Tema 4: Descripción bivariante de datos
Relación entre variables de razón
Edad
Visitas mensuales
al cine
18 7
19 6
23 6
28 5
32 5
35 6
42 4
45 3
54 2
60 1
Dispersograma no centrado
0
1
2
3
4
5
6
7
8
15 25 35 45 55 65
Vis
itas
men
sual
es a
l cin
e
Edad
Visitasmensualesal cine
-2
-1
0
1
2
-2 -1 0 1 2z V
isit
as m
en
sual
es
al
cin
e
z Edad
z visitas
Dispersograma centrado
Relación entre variables cuantitativas 18 18 Lección Pública
Tema 4: Descripción bivariante de datos
Relación entre variables de razón
Cálculo del coeficiente de correlación de Pearson
Edad
Visitas mensuales
al cine Desvío edad
Desvío visitas
(Desvío edad*Desvío
visitas)
18 7 -17,6 2,5 -44
19 6 -16,6 1,5 -24,9
23 6 -12,6 1,5 -18,9
28 5 -7,6 0,5 -3,8
32 5 -3,6 0,5 -1,8
35 6 -0,6 1,5 -0,9
42 4 6,4 -0,5 -3,2
45 3 9,4 -1,5 -14,1
54 2 18,4 -2,5 -46
60 1 24,4 -3,5 -85,4
Sumatoria 0 0 -243
Media 35,6 4,5
s 14,45 1,95789
Covarianza -24,30
Correlación -0,86
Simulador
r =
(𝑋−𝑋¯)(𝑌−𝑌¯)
𝑛−1
Ʃ 𝑋−𝑋¯ 2
𝑛−1
Ʃ 𝑌−𝑌¯ 2
𝑛−1
Relación entre variables cuantitativas 19 19 Lección Pública
Tema 4: Descripción bivariante de datos
No es adecuado para evaluar relaciones no lineales
Interpretación del coeficiente
Relación entre variables cuantitativas 20 20 Lección Pública
Tema 4: Descripción bivariante de datos
Otros Coeficientes de Correlación
Nominal Genuina
Variable de razón dicotomizada
Ordinal Intervalo o razón
Nominal genuina Phi φ Correlación punto biserial
Variable de razón dicotomizada
Coeficiente de correlación
tetracórica τ
Correlación biserial
Ordinal Tau de Kendall
Coeficiente de correlación de
Spearman
Intervalo o razón r de Pearson
Relación entre variables cuantitativas
Modelo de regresión lineal. Requisitos
Modelo de regresión lineal. Coeficientes
Variables nominales. Tablas de contingencia
Relación entre variables dicotómicas
Relación entre variables politómicas
TEMARIO
Lección Pública 21
Modelo de regresión lineal. Requisitos 22 22 Lección Pública
Tema 4: Descripción bivariante de datos
Relación lineal entre las variables Normalidad bivariada Homoscedasticidad
Requisitos para la Aplicación de una Regresión Lineal
Relación entre variables cuantitativas
Modelo de regresión lineal. Requisitos
Modelo de regresión lineal. Coeficientes
Variables nominales. Tablas de contingencia
Relación entre variables dicotómicas
Relación entre variables politómicas
TEMARIO
Lección Pública 23
24 24 Lección Pública
Tema 4: Descripción bivariante de datos
Modelo de regresión lineal. Coeficientes
Coeficientes de Regresión
Ecuación de regresión lineal simple
Ŷ = a + bX + se
a = Y – bX
b = 𝑛 𝑋𝑌− 𝑋 𝑌
𝑛 𝑋2− 𝑋 2
se = Ʃ (Ŷ – Y)2
n
Ecuación de regresión lineal múltiple
Ŷ = a + b1 X1 + b2 X2 + … + bn Xn + se
Correlación vs Causalidad
25 25 Lección Pública
Tema 4: Descripción bivariante de datos
Modelo de regresión lineal. Coeficientes
Regresión no estandarizada
y = -0,1294x + 9,1054 R² = 0,9112
0
1
2
3
4
5
6
7
8
15 25 35 45 55 65
Vis
itas
me
nsu
ale
s al
cin
e
Edad
Visitas mensuales al cine
Visitas mensuales al cine
Lineal (Visitas mensuales alcine)
y = -0,9546x R² = 0,9112
-2
-1,5
-1
-0,5
0
0,5
1
1,5
-2 -1 0 1 2z V
isit
as m
en
sual
es
al c
ine
z Edad
z visitas
z visitas
Lineal (z visitas)Regresión estandarizada
Interpretación
Tutorial
26 26 Lección Pública
Tema 4: Descripción bivariante de datos
Modelo de regresión lineal. Coeficientes
Evaluación de la calidad de una regresión
R2 se k Distribución de los Residuos
No se detectan problemas La regresión lineal no es adecuada
Heteroscedasticidad
27 27 Lección Pública
Tema 4: Descripción bivariante de datos
Modelo de regresión lineal. Coeficientes
•Multicolinealidad (Detección: alto R2 con alto se, cambio de signo de los coeficientes, alta correlación entre variables independientes)
•No linealidad
•Heteroscedasticidad (Pruebas de Levene, Bartlett, Cochran, F del cociente máximo)
•Micronumerosidad
•Autocorrelación serial positiva
Problemas que afectan la calidad de una regresión