lecciÓn pÚblica tema 4...tema 4: descripción bivariante de datos en el ejemplo presentado a...

25
LECCIÓN PÚBLICA Tema 4 Descripción bivariante de datos Profa. María Fátima Dos Santos 1

Upload: others

Post on 01-Sep-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: LECCIÓN PÚBLICA Tema 4...Tema 4: Descripción bivariante de datos En el ejemplo presentado a continuación, sobre el desarrollo de hipotiroidismo en hombres o mujeres, el riesgo

LECCIÓN PÚBLICA

Tema 4 Descripción bivariante de datos

Profa. María Fátima Dos Santos

1

Page 2: LECCIÓN PÚBLICA Tema 4...Tema 4: Descripción bivariante de datos En el ejemplo presentado a continuación, sobre el desarrollo de hipotiroidismo en hombres o mujeres, el riesgo

Relación entre variables cuantitativas

Modelo de regresión lineal. Requisitos

Modelo de regresión lineal. Coeficientes

Variables nominales. Tablas de contingencia

Relación entre variables dicotómicas

Relación entre variables politómicas

TEMARIO

Lección Pública 2

Page 3: LECCIÓN PÚBLICA Tema 4...Tema 4: Descripción bivariante de datos En el ejemplo presentado a continuación, sobre el desarrollo de hipotiroidismo en hombres o mujeres, el riesgo

Relación entre variables cuantitativas

Modelo de regresión lineal. Requisitos

Modelo de regresión lineal. Coeficientes

Variables nominales. Tablas de contingencia

Relación entre variables dicotómicas

Relación entre variables politómicas

TEMARIO

Lección Pública 3

Page 4: LECCIÓN PÚBLICA Tema 4...Tema 4: Descripción bivariante de datos En el ejemplo presentado a continuación, sobre el desarrollo de hipotiroidismo en hombres o mujeres, el riesgo

Variables nominales. Tablas de contingencia Lección Pública 4

Tema 4: Descripción bivariante de datos

Vivo Fallecido TOTAL

Presente 10 5 15

Ausente 3 12 15

TOTAL 13 17 30

Estatus de tratamiento

Condición

1 1 1

2 2 1

3 2 2

4 1 1

… … …

N 1 2

Estatus de tratamiento 1 Presente 2 Ausente

Condición 1 Vivo 2 Fallecido

Construcción de Tablas de Doble Entrada (2x2)

Page 5: LECCIÓN PÚBLICA Tema 4...Tema 4: Descripción bivariante de datos En el ejemplo presentado a continuación, sobre el desarrollo de hipotiroidismo en hombres o mujeres, el riesgo

Variables nominales. Tablas de contingencia Lección Pública 5

Tema 4: Descripción bivariante de datos

Casado Soltero Otro

Se queda en casa 10 5 5

Salidas con actividades ligeras

5 7 12

Salidas con actividades pesadas

5 15 6

Estatus marital

Actividad más frecuente día

viernes

1 1 3

2 3 1

3 2 2

… … …

N 1 3

Estatus marital 1 Casado 2 Soltero 3 Otro

Actividad más frecuente día viernes 1 Se queda en casa 2 Salida con actividades ligeras 3 Salidas con actividades pesadas

Construcción de Tablas de Doble Entrada (Ordenes Superiores)

Page 6: LECCIÓN PÚBLICA Tema 4...Tema 4: Descripción bivariante de datos En el ejemplo presentado a continuación, sobre el desarrollo de hipotiroidismo en hombres o mujeres, el riesgo

6 Lección Pública

Tema 4: Descripción bivariante de datos

Casado Soltero Otro TOTAL

Se queda en casa 10 5 5 20

Salidas con actividades ligeras 5 7 12 24

Salidas con actividades pesadas 5 15 6 26

TOTAL 20 27 23 70

Casado Soltero Otro

Se queda en casa 0,5 0,185 0,22

Salidas act. ligeras 0,25 0,255 0,52

Salidas act. pesadas 0,25 0,555 0,26

TOTAL 20 27 23

Casado Soltero Otro TOTAL

Se queda en casa 0,5 0,25 0,25 20

Salidas act. Ligeras 0,21 0,29 0,5 24

Salidas con act.pesadas 0,19 0,58 0,23 26

PERFILES COLUMNA PERFILES FILA

«Si el hecho de que aparezca o se presente una categoría junto con otra no es ni más ni menos probable de que se presenten las dos categorías por separado, se dice que las variables son independientes y, en general, se dice que la tabla es homogénea»

Variables nominales. Tablas de contingencia

Perfiles Fila y Columna

Page 7: LECCIÓN PÚBLICA Tema 4...Tema 4: Descripción bivariante de datos En el ejemplo presentado a continuación, sobre el desarrollo de hipotiroidismo en hombres o mujeres, el riesgo

Relación entre variables cuantitativas

Modelo de regresión lineal. Requisitos

Modelo de regresión lineal. Coeficientes

Variables nominales. Tablas de contingencia

Relación entre variables dicotómicas

Relación entre variables politómicas

TEMARIO

Lección Pública 7

Page 8: LECCIÓN PÚBLICA Tema 4...Tema 4: Descripción bivariante de datos En el ejemplo presentado a continuación, sobre el desarrollo de hipotiroidismo en hombres o mujeres, el riesgo

Relación entre variables dicotómicas 8 Lección Pública

Tema 4: Descripción bivariante de datos

En el ejemplo presentado a continuación, sobre el desarrollo de hipotiroidismo en hombres o mujeres, el riesgo relativo es= (10/15) / (3/15) = 3,35. Es decir, el «riesgo» de desarrollar hipotiroidismo siendo mujer es más de tres veces superior al de desarrollarlo siendo hombre.

Mujer Hombre TOTAL

Hipotiroidismo 10 (a) 5 (b) 15

No Hipotiroidismo 3 (c) 12 (d) 15

TOTAL 13 17 30

RR=𝑎/(𝑎+𝑏)

𝑐/(𝑐+𝑑)

En experimentos con grupo control, donde el investigador define el tamaño de los grupos y los tratamiento experimentales, es inadecuado utilizar el RR, y debe usarse el Odds Ratio.

Riesgo Relativo

El Riesgo Relativo (RR) y el Odds Ratio son medidas de asociación para variables nominales dicotómicas.

El riesgo relativo es el cociente entre el riesgo en el grupo con el factor de exposición o de riesgo, y el riesgo en el grupo de referencia. Se calcula de la siguiente manera

Page 9: LECCIÓN PÚBLICA Tema 4...Tema 4: Descripción bivariante de datos En el ejemplo presentado a continuación, sobre el desarrollo de hipotiroidismo en hombres o mujeres, el riesgo

Relación entre variables dicotómicas 10 Lección Pública

Tema 4: Descripción bivariante de datos

• Un «Odds» es la razón entre la probabilidad de que un evento ocurra sobre la probabilidad de que no ocurra. El resultado varía entre 0 e infinito.

• Un «Odds Ratio» es la razón entre dos de estas probabilidades. Aplicado a un ejemplo que utilizamos anteriormente:

Probabilidades Vivo Fallecido Vivo / Fallecido

Odds Ratio

Presente 10 5 2 8

Ausente 3 12 0,25

Odds Ratio

Esto implica decir que en el grupo tratado se presentan ocho casos de sobrevivencia por cada fallecido, en comparación con el grupo no tratado, donde se presentaría un sujeto vivo por cada fallecido. O, en otras palabras, que el tratamiento mejora en ocho veces la supervivencia, comparado con el azar.

Page 10: LECCIÓN PÚBLICA Tema 4...Tema 4: Descripción bivariante de datos En el ejemplo presentado a continuación, sobre el desarrollo de hipotiroidismo en hombres o mujeres, el riesgo

Relación entre variables dicotómicas 11 Lección Pública

Tema 4: Descripción bivariante de datos

Coeficiente phi φ

Evalúa la relación entre dos variables dicotómicas, presentando los resultados en un coeficiente de interpretación similar a la del r de Pearson.

Mujer Hombre TOTAL

Hipotiroidismo 10 (a) 5 (b) 15

No Hipotiroidismo 3 (c) 12 (d) 15

TOTAL 13 17 30

φ = 𝑏𝑐−𝑎𝑑

(𝑎+𝑐)(𝑏+𝑑)(𝑎+𝑏)(𝑐+𝑑)

φ = 15−120

(13)(17)(15)(15)= -0,47

Page 11: LECCIÓN PÚBLICA Tema 4...Tema 4: Descripción bivariante de datos En el ejemplo presentado a continuación, sobre el desarrollo de hipotiroidismo en hombres o mujeres, el riesgo

Relación entre variables cuantitativas

Modelo de regresión lineal. Requisitos

Modelo de regresión lineal. Coeficientes

Variables nominales. Tablas de contingencia

Relación entre variables dicotómicas

Relación entre variables politómicas

TEMARIO

Lección Pública 14

Page 12: LECCIÓN PÚBLICA Tema 4...Tema 4: Descripción bivariante de datos En el ejemplo presentado a continuación, sobre el desarrollo de hipotiroidismo en hombres o mujeres, el riesgo

Prueba Chi Cuadrado 15 15 Lección Pública

Tema 5: Pruebas de Hipótesis

Chi Cuadrado (χ2)

Usado como mínimo para tablas 3x2, con variables nominales u ordinales.

♀ ♂ TOTAL

Caracas 10 5 15

Maracaibo 5 10 15

Valencia 8 12 20

TOTAL 23 27 50

♀ ♂ TOTAL

Caracas 6,9 8,1 15

Maracaibo 6,9 8,1 15

Valencia 9,2 10,8 20

TOTAL 23 27 50

♀ ♂ TOTAL

Caracas 1,39 1,19 2,58

Maracaibo 0,52 0,45 0,97

Valencia 0,16 0,13 0,29

TOTAL 2,07 1,77 3,84

fo fe (fo-fe)2 / fe

χ2 = (fo−fe)2

𝑓𝑒

χ2crítico = 5,99 < χ2

calculado = 3,84 Las variables son independientes

tcrítica tcalculada

Page 13: LECCIÓN PÚBLICA Tema 4...Tema 4: Descripción bivariante de datos En el ejemplo presentado a continuación, sobre el desarrollo de hipotiroidismo en hombres o mujeres, el riesgo

Relación entre variables cuantitativas

Modelo de regresión lineal. Requisitos

Modelo de regresión lineal. Coeficientes

Variables nominales. Tablas de contingencia

Relación entre variables dicotómicas

Relación entre variables politómicas

TEMARIO

Lección Pública 16

Page 14: LECCIÓN PÚBLICA Tema 4...Tema 4: Descripción bivariante de datos En el ejemplo presentado a continuación, sobre el desarrollo de hipotiroidismo en hombres o mujeres, el riesgo

Relación entre variables cuantitativas 17 17 Lección Pública

Tema 4: Descripción bivariante de datos

Relación entre variables de razón

Edad

Visitas mensuales

al cine

18 7

19 6

23 6

28 5

32 5

35 6

42 4

45 3

54 2

60 1

Dispersograma no centrado

0

1

2

3

4

5

6

7

8

15 25 35 45 55 65

Vis

itas

men

sual

es a

l cin

e

Edad

Visitasmensualesal cine

-2

-1

0

1

2

-2 -1 0 1 2z V

isit

as m

en

sual

es

al

cin

e

z Edad

z visitas

Dispersograma centrado

Page 15: LECCIÓN PÚBLICA Tema 4...Tema 4: Descripción bivariante de datos En el ejemplo presentado a continuación, sobre el desarrollo de hipotiroidismo en hombres o mujeres, el riesgo

Relación entre variables cuantitativas 18 18 Lección Pública

Tema 4: Descripción bivariante de datos

Relación entre variables de razón

Cálculo del coeficiente de correlación de Pearson

Edad

Visitas mensuales

al cine Desvío edad

Desvío visitas

(Desvío edad*Desvío

visitas)

18 7 -17,6 2,5 -44

19 6 -16,6 1,5 -24,9

23 6 -12,6 1,5 -18,9

28 5 -7,6 0,5 -3,8

32 5 -3,6 0,5 -1,8

35 6 -0,6 1,5 -0,9

42 4 6,4 -0,5 -3,2

45 3 9,4 -1,5 -14,1

54 2 18,4 -2,5 -46

60 1 24,4 -3,5 -85,4

Sumatoria 0 0 -243

Media 35,6 4,5

s 14,45 1,95789

Covarianza -24,30

Correlación -0,86

Simulador

r =

(𝑋−𝑋¯)(𝑌−𝑌¯)

𝑛−1

Ʃ 𝑋−𝑋¯ 2

𝑛−1

Ʃ 𝑌−𝑌¯ 2

𝑛−1

Page 16: LECCIÓN PÚBLICA Tema 4...Tema 4: Descripción bivariante de datos En el ejemplo presentado a continuación, sobre el desarrollo de hipotiroidismo en hombres o mujeres, el riesgo

Relación entre variables cuantitativas 19 19 Lección Pública

Tema 4: Descripción bivariante de datos

No es adecuado para evaluar relaciones no lineales

Interpretación del coeficiente

Page 17: LECCIÓN PÚBLICA Tema 4...Tema 4: Descripción bivariante de datos En el ejemplo presentado a continuación, sobre el desarrollo de hipotiroidismo en hombres o mujeres, el riesgo

Relación entre variables cuantitativas 20 20 Lección Pública

Tema 4: Descripción bivariante de datos

Otros Coeficientes de Correlación

Nominal Genuina

Variable de razón dicotomizada

Ordinal Intervalo o razón

Nominal genuina Phi φ Correlación punto biserial

Variable de razón dicotomizada

Coeficiente de correlación

tetracórica τ

Correlación biserial

Ordinal Tau de Kendall

Coeficiente de correlación de

Spearman

Intervalo o razón r de Pearson

Page 18: LECCIÓN PÚBLICA Tema 4...Tema 4: Descripción bivariante de datos En el ejemplo presentado a continuación, sobre el desarrollo de hipotiroidismo en hombres o mujeres, el riesgo

Relación entre variables cuantitativas

Modelo de regresión lineal. Requisitos

Modelo de regresión lineal. Coeficientes

Variables nominales. Tablas de contingencia

Relación entre variables dicotómicas

Relación entre variables politómicas

TEMARIO

Lección Pública 21

Page 19: LECCIÓN PÚBLICA Tema 4...Tema 4: Descripción bivariante de datos En el ejemplo presentado a continuación, sobre el desarrollo de hipotiroidismo en hombres o mujeres, el riesgo

Modelo de regresión lineal. Requisitos 22 22 Lección Pública

Tema 4: Descripción bivariante de datos

Relación lineal entre las variables Normalidad bivariada Homoscedasticidad

Requisitos para la Aplicación de una Regresión Lineal

Page 20: LECCIÓN PÚBLICA Tema 4...Tema 4: Descripción bivariante de datos En el ejemplo presentado a continuación, sobre el desarrollo de hipotiroidismo en hombres o mujeres, el riesgo

Relación entre variables cuantitativas

Modelo de regresión lineal. Requisitos

Modelo de regresión lineal. Coeficientes

Variables nominales. Tablas de contingencia

Relación entre variables dicotómicas

Relación entre variables politómicas

TEMARIO

Lección Pública 23

Page 21: LECCIÓN PÚBLICA Tema 4...Tema 4: Descripción bivariante de datos En el ejemplo presentado a continuación, sobre el desarrollo de hipotiroidismo en hombres o mujeres, el riesgo

24 24 Lección Pública

Tema 4: Descripción bivariante de datos

Modelo de regresión lineal. Coeficientes

Coeficientes de Regresión

Ecuación de regresión lineal simple

Ŷ = a + bX + se

a = Y – bX

b = 𝑛 𝑋𝑌− 𝑋 𝑌

𝑛 𝑋2− 𝑋 2

se = Ʃ (Ŷ – Y)2

n

Ecuación de regresión lineal múltiple

Ŷ = a + b1 X1 + b2 X2 + … + bn Xn + se

Correlación vs Causalidad

Page 22: LECCIÓN PÚBLICA Tema 4...Tema 4: Descripción bivariante de datos En el ejemplo presentado a continuación, sobre el desarrollo de hipotiroidismo en hombres o mujeres, el riesgo

25 25 Lección Pública

Tema 4: Descripción bivariante de datos

Modelo de regresión lineal. Coeficientes

Regresión no estandarizada

y = -0,1294x + 9,1054 R² = 0,9112

0

1

2

3

4

5

6

7

8

15 25 35 45 55 65

Vis

itas

me

nsu

ale

s al

cin

e

Edad

Visitas mensuales al cine

Visitas mensuales al cine

Lineal (Visitas mensuales alcine)

y = -0,9546x R² = 0,9112

-2

-1,5

-1

-0,5

0

0,5

1

1,5

-2 -1 0 1 2z V

isit

as m

en

sual

es

al c

ine

z Edad

z visitas

z visitas

Lineal (z visitas)Regresión estandarizada

Interpretación

Tutorial

Page 23: LECCIÓN PÚBLICA Tema 4...Tema 4: Descripción bivariante de datos En el ejemplo presentado a continuación, sobre el desarrollo de hipotiroidismo en hombres o mujeres, el riesgo

26 26 Lección Pública

Tema 4: Descripción bivariante de datos

Modelo de regresión lineal. Coeficientes

Evaluación de la calidad de una regresión

R2 se k Distribución de los Residuos

No se detectan problemas La regresión lineal no es adecuada

Heteroscedasticidad

Page 24: LECCIÓN PÚBLICA Tema 4...Tema 4: Descripción bivariante de datos En el ejemplo presentado a continuación, sobre el desarrollo de hipotiroidismo en hombres o mujeres, el riesgo

27 27 Lección Pública

Tema 4: Descripción bivariante de datos

Modelo de regresión lineal. Coeficientes

•Multicolinealidad (Detección: alto R2 con alto se, cambio de signo de los coeficientes, alta correlación entre variables independientes)

•No linealidad

•Heteroscedasticidad (Pruebas de Levene, Bartlett, Cochran, F del cociente máximo)

•Micronumerosidad

•Autocorrelación serial positiva

Problemas que afectan la calidad de una regresión

Page 25: LECCIÓN PÚBLICA Tema 4...Tema 4: Descripción bivariante de datos En el ejemplo presentado a continuación, sobre el desarrollo de hipotiroidismo en hombres o mujeres, el riesgo

¡Gracias!

28 28 28 Lección Pública

Tema 1: Estadística y Método Científico