modelos estadísticos en investigación epidemiológica€¦ · –la variable de control puede ser...

37
Modelos Estadísticos en Investigación Epidemiológica Lima, 25 de Noviembre de 2015 Sergio R. Muñoz, Ph.D. Universidad de La Frontera. Chile [email protected]

Upload: truongkhue

Post on 08-Oct-2018

232 views

Category:

Documents


0 download

TRANSCRIPT

Modelos Estadísticos en Investigación

Epidemiológica

Lima, 25 de Noviembre de 2015

Sergio R. Muñoz, Ph.D.

Universidad de La Frontera. Chile

[email protected]

Evaluación Basal • Se pide desarrollar el siguiente problema:

– Boris, Paulo, Renzo y Cesar son cuatro artistas de talento:

uno es bailarín, otro es pintor, otro es cantante y el otro es

escritor (aunque no necesariamente en ese mismo orden).

– Boris y Renzo estaban entre el publico la noche que el

cantante debuto en el escenario.

– Tanto Paulo como el escritor han posado para el pintor.

– El escritor escribió una biografía de Cesar que fue todo un

éxito y ahora planea escribir una biografía de Boris.

– Boris nunca ha oído hablar de Renzo.

• Cual es el campo artístico de cada persona?

• La formulación de una pregunta de

investigación es un paso, el más importante, en

el proceso de diseño y desarrollo de una

investigación”.

Rothman K.J.

“Philosophy of Scientific Inference” 1986.

Índice de la Presentación

• Definición • Datos

• Investigación Epidemiológica

• Modelos Estadísticos

• Recolección y generación de datos

• Modelos estadísticos • Estudios predictivos

• Estudios de Asociación

• Aplicaciones

Definición de Dato

Dato

Es el valor resultante de la medición de una característica o atributo perteneciente a una unidad de observación.

Los datos recolectados de una investigación son en consecuencia, los

valores resultantes de la medición de todas las características o atributos que intentan dar respuesta a la pregunta de investigación.

Dato Variable

Variables

• Principal(es): • Motivo de la investigación

• Generalmente un evento de salud y factores de exposición o predictores (según sea la pregunta)

• Caracterización o de control • Demográficas (edad, sexo, lugar de residencia, etc.)

• Socio-económicas (educación, ingreso económico, etc.)

• Del sujeto

• De la familia

• Del medio ambiente

Investigación Epidemiológica

• Determinar la magnitud y existencia de la asociación entre un evento de Salud con uno o mas factores de exposición ajustando por múltiples variables de control

• Estudiar la variabilidad observada de un evento de salud en función de un conjunto de variables asociadas

Construcción de Modelos Estadísticos

• Según la pregunta de investigación • Modelos de asociación • Modelos de predicción

• La estrategia de modelamiento depende de la pregunta de investigación

• Ambos son modelos multivariables (no multivariados)

Modelos Estadísticos

• Modelos de asociación (explicación/causalidad) • Da respuesta a la mayoría de las preguntas de

investigación epidemiológica • El objetivo es determinar la existencia, magnitud y

dirección de la asociación entre un evento de salud (respuesta) con uno o más factores de exposición, “controlando” por múltiples covariables

• Lo que se busca es estimar la asociación de la forma mas “exacta” posible lo que se logra mediante la determinación de modificaciones de efecto y de sesgo de confusión.

Modelos Estadísticos

•Modelos de predicción • El objetivo es el de predecir un evento de salud

en función de un conjunto de variables eventualmente predictoras del evento de salud

• Esta relacionado con una mayor capacidad en explicar la variabilidad del evento de salud estudiado.

• La estrategia consiste en construir el modelo mas sencillo posible mediante la combinación de los mejores predictores del evento de salud

• En un modelo de Asociación: – Se define

• Var respuesta

• Var exposición

– Se justifica la inclusión de variables de control

– El proceso consiste en determinar si el efecto de la exposición sobre el evento de salud depende de algún otro factor.

• En un modelo de predicción: – Se define

• Var respuesta

• Conjunto de variables (predictores) que potencialmente predicen el evento de salud definido como variable de respuesta

– El proceso consiste en seleccionar los “mejores predictores” del evento de salud

Evento de Salud Factores de Exposición

Variables de Control

C1

C2

C3

C2

……

Grafica del Modelo de Asociación

• Importante: – La asociación entre las variables de control con el evento de

salud y los factores de exposición NO es relevante ya que no responde a la pregunta de investigación

– La variable de control puede ser pensada como una variable de estratificación

– El papel que puede jugar una variable de control en el estudio de la asociación entre el evento de salud y los factores de exposición es jerárquico. La asociación de interés puede depender del nivel de la variable de control (modificación de efecto: distintos efectos en distintos estratos)

• Si una variable de control se demuestra NO estar asociada ni con el evento de salud ni con los factores de exposición, entonces no se justifica su inclusión en la definición del modelo estadístico.

Modelo de Asociación

Ejemplo 1

• Datos de una Unidad de Cuidados intensivos (UCI), para responder a las siguientes preguntas de investigación:

• ¿Cuanto mayor es la mortalidad al egreso de los pacientes ingresados a la UCI se produce en aquellos que provienen del servicio de medicina comparada con los que provienen del servicio de cirugía?

• ¿Esta relación entre mortalidad y servicio de procedencia depende de la edad del paciente, su sexo y de la presencia de infección?

Ejemplo 2

•Estudio de capacidad respiratoria en estudiantes de 6 a 18 años de edad.

• ¿Cual es la relación entre volumen expiratorio

forzado (vef1) y la estatura de los estudiantes? • Esta relación, ¿depende de la edad y sexo de los

estudiantes?

Ejemplo 3

• Estudio de la asociación entre Cáncer de piel en mujeres de dos ciudades de los EEUU

Minneapolis-St. Paul Dallas-Fort Worth

Edad Casos Población Casos Población RR

15-24 1 172,675 4 181,343 3.81

25-34 16 123,065 38 146,207 2.00

35-44 30 96,216 119 121,374 3.14

45-54 71 92,051 221 111,353 2.57

55-64 102 72,159 259 83,004 2.21

65-74 130 54,159 310 55,932 2.33

75-84 133 32,185 226 29,007 1.89

85+ 40 8,328 65 7,538 1.80

En ejemplo UCI: • Variable de Respuesta:

• D: Estado Vital • Codificación 1=Muerto; 0=Vivo

• Variable de Exposición: • E: Servicio de procedencia • Codificación: 1=Medicina; 0=Cirugía

• Variables de Control: • C1: Edad Codificación: Edad en años • C2: Sexo Codificación: 1=Mujer 0=Hombre • C3: Presencia de Infección Codificación: 1=Si 0=No

Modelo conceptual para el estudio de Asociación

• Variable de respuesta

• Variables de Exposición

• Incorporación de potenciales modificadores de efecto

• No olvidar el eventual sesgo de confusión

• Estado Vital

[1=Muerto; 0=Vivo]

• Servicio [1=Medicina; 0=Cirugía]

• Edad, sexo, infección

– Servicio*Edad

– Servicio*Sexo

– Servicio*Infeccion

Estado Vital 1=Fallecido 0= Vivo

Servicio 1=Medicina 0=Cirugía

Edad Sexo

Infección

𝑂𝑑𝑑𝑠 𝑀𝑜𝑟𝑖𝑟 | 𝑀𝑒𝑑𝑖𝑐𝑖𝑛𝑎

𝑂𝑑𝑑𝑠 𝑀𝑜𝑟𝑖𝑟 | 𝐶𝑖𝑟𝑢𝑔𝑖𝑎= 𝑂𝑅𝑐𝑟𝑢𝑑𝑜

𝑂𝑑𝑑𝑠 𝑀𝑜𝑟𝑖𝑟 | 𝑀𝑒𝑑𝑖𝑐𝑖𝑛𝑎,𝐸𝑑𝑎𝑑,𝑆𝑒𝑥𝑜,𝐼𝑛𝑓𝑒𝑐𝑐𝑖ó𝑛

𝑂𝑑𝑑𝑠 𝑀𝑜𝑟𝑖𝑟 | 𝐶𝑖𝑟𝑢𝑔𝑖𝑎,𝐸𝑑𝑎𝑑,𝑆𝑒𝑥𝑜,𝐼𝑛𝑓𝑒𝑐𝑐𝑖𝑜𝑛= 𝑂𝑅𝐴𝑗𝑢𝑠𝑡𝑎𝑑𝑜

Modelo Estadístico

• Variable de respuesta dicotómica => regresión logística

• Ln[odds{sta=1| ser; edad, sx, inf}]= + ser + 1edad +

2sexo + 3inf +

1(ser*edad) + 2(ser*sexo) + 3(ser*inf)

• Los coeficientes asociados a los términos de interacción representan la potencialidad que tienen las variables de control de ser modificadoras de efecto

Independencia del efecto de la exposición de las variables de control

• H0: [1=0; 2=0; 3=0]

• Bajo el supuesto que H0 es verdadera, el modelo se reduce a:

Ln[odds{sta=1| ser; edad, sx, inf}]= + ser + 1edad + 2sexo +

3inf

• Prueba de Razón de verosimilitud: compara las verosimilitudes de los dos modelos y reporta un valor p asociado a un Chi2(3)

Y ahora que sigue?

•Descartada (o no) la dependencia de la asociación entre el evento estudiado y el factor de exposición, se puede (o no) evaluar sesgo de confusión para la determinación del modelo final que da respuesta a la pregunta de investigación

•Evaluación de la “calidad” del modelo • Bondad de Ajuste • Evaluación de supuestos

En ejemplo Capacidad respiratoria:

• Variable de Respuesta: – VEF1

– Nivel de medición: Continua

• Variable de Exposición: – Estatura en cms.

• Variables de Control: – Sexo Codificación: 1=Mujer 0=Hombre

– Edad Codificación: Edad en años (continua)

VEF1 Estatura

Edad Sexo

𝜇𝑣𝑒𝑓1 | 𝑒𝑠𝑡𝑎𝑡𝑢𝑟𝑎 = 𝛼 + 𝛽 ∗ 𝑒𝑠𝑡𝑎𝑡𝑢𝑟𝑎

𝜇𝑣𝑒𝑓1 | 𝑒𝑠𝑡𝑎𝑡𝑢𝑟𝑎 = 𝛼 + 𝛽 ∗ 𝑒𝑠𝑡𝑎𝑡𝑢𝑟𝑎 + 𝛾1 ∗ 𝐸𝑑𝑎𝑑 + 𝛾2 ∗ 𝑠𝑒𝑥𝑜 + 𝛿1 𝑒𝑠𝑡𝑒𝑑 + 𝛿2(𝑒𝑠𝑡𝑠𝑒𝑥)

En ejemplo Cáncer de piel:

• Variable de Respuesta: – Casos cáncer de piel

– Codificación: numero de casos

• Variable de Exposición: – Lugar de residencia

– Codificación: 1=Miniápolis; 0=Dallas

• Variables de Control: – Edad Codificación: grupos quinquenales (15+)

Ca Piel Ciudad

Edad

𝑇𝐼𝑐𝑖𝑢𝑑𝑎𝑑1

𝑇𝐼𝑐𝑖𝑢𝑑𝑎𝑑2= 𝑅𝑇𝐼𝑐𝑟𝑢𝑑𝑎

𝑇𝐼𝑐𝑖𝑢𝑑𝑎𝑑1 | 𝑒𝑑𝑎𝑑

𝑇𝐼𝑐𝑖𝑢𝑑𝑎𝑑2 | 𝑒𝑑𝑎𝑑= 𝑅𝑇𝐼𝐴𝑗𝑢𝑠𝑡𝑎𝑑𝑎 𝑝𝑜𝑟 𝑒𝑑𝑎𝑑

Análisis de asociación cruda

Variable de

Respuesta

Variable de

exposición

Análisis:

1.- Existencia

2.- Magnitud y dirección

Continua Continua 1. Coef de correlación

2. Coef de regresión lineal

simple

Dicotómica Continua 1. t-test, Wilcoxon

2. Diferencia de promedios

Dicotómica Dicotómica 1 Chi-2, Fisher exact

2 OR, RR, IR (según

diseño)

• Incorporando una variable de control

Variable de

Respuesta

Variable de

exposición

Variable de

Control

Análisis:

Continua Cualquier tipo Cualquier tipo Regresión lineal multiple

Dicotómica Dicotómica Categórica Análisis Estratificado de

Mantel-Haenszel

Dicotómica Cualquier tipo Cualquier tipo Regresión logística múltiple

Múltiples exposiciones y múltiples variables de control?

Variable

de

Respuesta

Múltiples

Variable de

exposición

Múltiples

Variable de

Control

Análisis:

Continua Cualquier tipo Cualquier tipo Regresión lineal multiple

Dicotómica Cualquier tipo Cualquier tipo Regresión logística múltiple

Nominal Cualquier tipo Cualquier tipo Regresión logística

politómica

Ordinal Cualquier tipo Cualquier tipo Regresión logística ordinal

Discreta

(Poisson)

Cualquier tipo Cualquier tipo Regresión de Poisson

Importante

•Evaluación de los supuestos del modelo

•Ajuste por diseño muestral complejo

•Tamaño de muestra

Deseo

•Es deseable tener un modelo que tenga el menor número de variables con el máximo tamaño de muestra

•Pero no sea exagerado pensando en un modelo con una muestra de 50.000 sujetos y ninguna variable

Etapas del Modelamiento

1. Póngase cómodo

2. Prepárese un traguito

3. Asegúrese que los datos están limpios y que ha generado las variables que necesitará a continuación

4. Haga un afiche de su pregunta de investigación

5. Tome el primer sorbo de su traguito

6. Haga una descripción de la muestra

7. Justifique la incorporación de las variables de control

8. Explore la asociación de interés y el posible efecto que puedan tener las variables de control

9. Escriba el modelo que conceptualiza su pregunta de investigación

10. Escriba el modelo estadístico que refleja el modelo conceptual

11. Detalle la estrategia de modelamiento

12. Ejecute su plan de análisis

Recomendación