medidas de los resultados en los ensayos clÍnicos catalina barceló 8 de mayo 2012 hospital...

Post on 02-Mar-2015

11 Views

Category:

Documents

1 Downloads

Preview:

Click to see full reader

TRANSCRIPT

MEDIDAS DE LOS RESULTADOS EN LOS ENSAYOS CLÍNICOS

Catalina Barceló8 de Mayo 2012

Hospital Universitari Son Espases

MEDIDAS DE LOS RESULTADOS EN LOS ENSAYOS CLÍNICOS

• Qué resultados medimos?

• Como expresamos estos resultados?

• To “p” or not to “p”

• Intervalos de confianza

MEDIDAS DE LOS RESULTADOS EN LOS ENSAYOS CLÍNICOS

• Qué resultados medimos?

• Como expresamos estos resultados?

• To “p” or not to “p”

• Intervalos de confianza

¿Qué resultados medimos? Medicamentos

Variables intermedias, subclínicas, subrogadas, u orientadas a la

enfermedad

Variables clínicas finales, u orientadas al paciente

Antihipertensivos Reducción de tensión arterial Disminución de la incidencia de infarto de miocardio, mortalidad

cardiovascular, etc.Hipocolesterolemiantes Reducción de colesterol-LDL, reducción de placa de ateroma

Antidiabéticos Reducción de hemoglobina glicosilada

Reducción de complicaciones vasculares de la diabetes

Anticoagulantes en prevención tromboembólica

Disminución de la incidencia de tromboembolismo subclínico,

detectado por venografía

Disminución de la incidencia de tromboembolismo sintomático

Tocolíticos en el parto pretérmino Retraso del parto Disminución de la morbimortalidad

perinatal y neonatal

Antineoplásicos Aumento de la respuesta Aumento de la supervivencia

Antibióticos Mayor espectro antibacteriano Aumento del índice de curación

Protectores gástricos en tratamientos con AINE

Disminución de ulceraciones subclínicas, detectadas por

endoscopia

Disminución de la incidencia de úlcera gastroduodenal y hemorragia

digestiva

Anestésicos locales Mayor potencia sobre receptores Eficacia analgésica en escala visual analógica

• Cuantitativas (datos métricos):• Discretas: recuentos (nº de caídas al año)• Continuas: medidas (edad, peso, TA)*

• Cualitativas (datos no métricos):• Categóricas nominales:

- Binarias (2 categorías): sexo- >2 categorías: histología tumoral

• Categóricas ordinales: clasificadas según su magnitud* - Clasificación funcional NYHA para ICC

• Time-to-an-Event:- Tiempo hasta restauración del ritmo sinusal

Variable: caracteres o aspectos que se registran en los sujetos del estudio y que pueden tomar distintos valores

Tipos de variables

• Cuantitativas (datos métricos):• Discretas: recuentos (nº de caídas al año)• Continuas: medidas (edad, peso, TA)*

• Cualitativas (datos no métricos):• Categóricas nominales:

- Binarias (2 categorías): sexo- >2 categorías: histología tumoral

• Categóricas ordinales: clasificadas según su magnitud* - Clasificación funcional NYHA para ICC

• Time-to-an-Event:- Tiempo hasta restauración del ritmo sinusal

Variable: caracteres o aspectos que se registran en los sujetos del estudio y que pueden tomar distintos valores

Tipos de variables

Efficacy was assessed at 0–48 h (at 0, 2, 6, 24, and 48 h) after surgery. Patients were monitored continuously in the postanesthesia care unit, and emetic episodes and/or use of rescue therapy were recorded throughout the hospital stay. An emetic episode was defined as one or more continuous episodes of vomiting (oral expulsion of stomach contents) or retching (an attempt to vomit that is not productive of stomach contents); distinct episodes were those occurring at least 1 min apart.

Tipos de variables

Cuantitativa discreta Categórica nominal: binaria

Tipos de variables

Categórica nominal: binaria

There was no significant difference in the percentage of patients with no vomiting and no rescue (complete response) over 0–24 h between aprepitant 40 mg (45%) or 125 mg (43%) and ondansetron (42%; P 0.5 for both odds ratios of aprepitant:ondansetron).

Nausea was assessed at 2, 6, 24, and 48 h postoperatively, at any time the patient complained of nausea, and immediately before administration of rescue medication. Patients rated nausea on an 11-point Verbal Rating Scale (VRS), with 0 equal to “no nausea” and 10 equal to “nausea as bad as it could be.”

Tipos de variables

Categórica ordinal

Tipos de variables

Time-to-an event: tiempo transcurrido

Additional safety assessments included awakening time (interval between end of surgery and patient’s ability to obey commands) and duration of recovery from anesthesia (postanesthesia recovery score of 8 on a 0–10 scale) (19).

• Cuantitativas (datos métricos):• Discretas o continuas

• Cualitativas (datos no métricos):• Categóricas nominales o ordinales

• Time-to-an-Event:

Expresión de los resultados

RR, OR, RRR, RAR

Medias y medianasIncidencia, incidencia acumulada, tasa de incidencia

Hazard ratio (HR)

PrevalenciaProporción de individuos que presenta una determinada característica o evento en una población y en un momento de tiempo determinado.Estudios transversales y caso-control

Incidencia Número de casos nuevos de una determinada característica o evento que se desarrollan en una población durante un período de tiempo determinado.Estudios de cohorte y experimentales

Expresión de los resultados

Expresión de los resultados

Incidencia acumulada (IA)Número de sujetos que presentan la condición estudiada en un determinado tiempo de observaciónEs una proporción, no una tasa.Para poder interpretarla es preciso que se acompañe del período de observación.

Sin embargo:Los pacientes entran en el estudio en diferentes momentosEl seguimiento de los pacientes no es uniforme: de algunos no se obtiene toda la informaciónAlgunos pacientes abandonan el estudio

riesgoenpoblació

nuevoscasosn

__

Expresión de los resultados

Densidad (Tasa) de incidencia (DI)

Preferida para la evaluación del impacto poblacional de un determinado evento

Corresponde al riesgo promedio por persona y unidad de tiempo

No es una proporción sino una tasa, ya que el denominador incorpora la dimensión tiempo

osicióndeesindividualt

nuevoscasosn

exp__

Medidas del efecto: variables binarias

• Medidas relativas:

• Riesgo Relativo (RR)

• Odds ratio (OR)

• Reducción relativa de riesgo (RRR)

• Medidas absolutas:

• Reducción absoluta de riesgo (RAR)

• NNT

Medidas del efecto: variables binarias

• Medidas relativas:

• Riesgo Relativo (RR)

• Odds ratio (OR)

• Reducción relativa de riesgo (RRR)

Estiman la magnitud de asociación entre la exposición y el efecto observado e indican cuánto es más probable que el efecto o evento ocurra en el grupo de sujetos expuestos al factor de exposición en relación al grupo no expuesto.

Medidas relativas del efecto

• Riesgo relativo: RR= B/A (A = control B = intervención)

• Razón de incidencias (proporciones)

Valores entre 0 e infinitoValor 1 = neutro. No diferencias entre gruposValor >1 = grupo intervención con mayor proporción del efecto que midamosValor <1 = grupo intervención con menor proporción del efecto que midamos

Medidas relativas del efecto

• Odds Ratio: OR

• Razón de odds. Odds: p/1-p

p = probabilidad de que ocurra el evento

1-p = probabilidad de que no ocurra

Valores entre 0 e infinitoValor 1 = neutro. No diferencias entre gruposValor >1 = grupo intervención con mayor proporción del efecto que midamosValor <1 = grupo intervención con menor proporción del efecto que midamos

Medidas relativas del efecto

• Odds Ratio: OR

• Razón de odds. Odds: p/1-p OR: p1/1-p1: p2/1-p2

p = probabilidad de que ocurra el evento

1-p = probabilidad de que no ocurra

ÉXITO FRACASOINTERV a b a+bCONTROL c d c+d

Total éxitos

Total fracasos

Total pacientes

Medidas relativas del efecto

Odds = 1/4=0,25 Odds = 4/1 =45 BALAS

44/1

1/4OR

45/1

5/4RR

Relación entre RR y OR

• RR= razón de proporciones (valores 0-1)

• OR= razón de odds (valores 0-infinito)

• Expresan lo mismo pero con dos escalas numéricas

diferentes

Relación entre RR y OR

RR= 0,3 OR= 28,01,89

91,10:7,96

3,3

OR=90 x 25/75 x 10= 3 3 a 1, exp es mejor que control?

¿Hasta qué punto el tratamiento A es 3 veces mejor que el B?

Nuestro modo habitual de razonar es que el tratamiento A cura un 90% y el B un 75%, luego RR=0,9/0,75=1,2 Luego A es 1,2 veces mejor que B

Curaciones No Curaciones

Total

Tto experimental

90 10 100

Tto control 75 25 100

Total 165 35 200

Relación entre RR y OR

Relación entre RR y OR

• Resultados con OR: más magnificados (valores más extremos)

• Sobretodo cuando la incidencia de un suceso en un grupo es > 10% y/o hay diferencias entre ellos

• La OR sólo se aproxima al RR cuando el suceso es raro. Su interpretación debe matizarse en función de lo frecuente que sea el suceso en estudio

• IC 95% de OR son más amplios

Cuando utilizaremos OR?

Riesgo relativo: razón de incidencias

• No puede utilizarse en los estudios transversales ni en los estudios de casos y controles

• Porque las características de estos estudios no nos

permiten conocer las tasas de incidencia del resultado.

Relación entre RR y OR

Odds Ratio

Medidas relativas del efecto

• Reducción relativa de riesgo: RRR

RRR = [(B-A) / A]*100 RRR = 1-RR

Medidas del efecto: variables binarias

• Medidas absolutas:

• Reducción absoluta de riesgo (RAR)

• NNT

Medidas del efecto: variables binarias

• Medidas absolutas:

• Reducción absoluta de riesgo o diferencia de riesgo

RAR= diferencia de proporciones entre grupos (B-A)

RAR= 3,3%-10,9%= -7,6%

Medidas del efecto: variables binarias

• NNT (nº necesario a tratar para conseguir una unidad más de eficacia). Si se evalúa un efecto adverso (NNH)

1/ RAR o 100/RAR (riesgo en %)

Dimensiona la eficacia de la intervención mediante el esfuerzo necesario para conseguir una unidad de eficacia.

Cuanto mayor sea el efecto del tratamiento menor será el NNT

Cálculos farmacoeconómicos y toma de decisiones

También hay fórmulas para calcular el NNT a partir del OR

Medidas del efecto: variables binarias

• NNT = 1/ RAR o 100/RAR

RAR= 3,3%-10,9%= -7,6%

NNT= 100/7,6= 13,1

Medidas del efecto: variables binarias

• Limitaciones del NNT:- Resultado NNT, aplicable a nuestro medio si el

riesgo basal del ensayo es similar

- Índices relativos (OR, RR) tienden a ser más parecidos entre diferentes ensayos del mismo tratamiento que los índices absolutos (RAR, NNT)

- Metanálisis: NNT global poco informativo si heterogeneidad en los riesgos basales

- No es un índice aplicable directamente de forma individual a un paciente con unas características concretas. Se trata como un dato poblacional

A) Se calcula a partir de la RAR

B) Es independiente de la incidencia del evento en el grupo control

C) Cuanto mayor es el efecto del tratamiento menor es la NNT

D) Como cualquier parámetro estadístico debe expresarse con su intervalo de confianza

•Pregunta:

¿Cuál de la siguientes afirmaciones sobre el NNT es FALSA?

¿Cuál de la siguientes afirmaciones sobre el NNT es FALSA?

A) Se calcula a partir de la RAR

B) Es independiente de la incidencia del evento en el grupo control

C) Cuanto mayor es el efecto del tratamiento menor es la NNT

D) Como cualquier parámetro estadístico debe expresarse con su intervalo de confianza

•Pregunta:

Relación entre medidas absolutas-relativas:

Riesgo basal grupo control

40% 20% 10% 5%

Incidencia grupo interv 30% 15% 7,5% 3,75%

RRR 25% 25% 25% 25%

RAR 10% 5% 2,5% 1,25%

NNT 10 20 40 80

Las medidas relativas no tienen en cuenta el riesgo basal de los pacientes, y por ello no permiten diferenciar entre un beneficio grande o pequeño.

Las medidas relativas son características del tratamiento, mientras que las absolutas dependen del tratamiento y también del riesgo basal.

•Pregunta: Un fármaco ↓mortalidad de un 6% a un 2%.

Podemos decir realmente que….?

Ha disminuido la mortalidad un 4% en términos absolutos (RAR)

Ha disminuído la mortalidad un 66,6% en términos relativos (RRR)

Ha aumentado la supervivencia del 94% al 98%, es decir un 4,2% en términos relativos (RRR)

Riesgo relativo: 2%/6%= 0,33 (RR)

Odds ratio: 0,02/ 0,98 : 0,06/0,94 = 0,31 (OR)

Por cada 25 pacientes, 1 más sobrevive. NNT = 100/4= 25

Resumen:

• Relación entre medidas absolutas-relativas:

RR y OR son más difíciles de interpretar, si no se traducen en diferencias absolutas de riesgo

RAR y NNT se pueden calcular a partir de RR si tenemos la incidencia del grupo control

Cómo presentamos los resultados?

Cómo presentamos los resultados?

•Ejercicio práctico: estudio ARISTOTLE

Variable principal: eventos de ictus o embolismo sistémico

Granger CB et al N Eng J Med 2011; 365(11): 981-92)

Evento No evento Total

Warfarina (A)Según INR 265 8816 9081

Apixaban (B)5mg/12h 212 8908 9120

•Ejercicio práctico

Cálculo ResultadoRiesgo A

(Warfarina) 265/9081 0,02918 (2,92 %)

Riesgo B (Apixaban) 212/9120 0,02324

(2,32%)

RAR

NNT

B-A0,02324 – 0,02918 = -0,00594En %: 2,3 % - 2,9 %= -0,6 %

-0,006 (-0,6%)

1/(B-A)1/RAR: 1 / 0,006 = 166,7si en %: 100 / 0,6 = 166,7

166,7(167)

Cálculo Resultado

Riesgo A (Warfarina) 265/9081 0,02918

(2,92 %)Riesgo B

(Apixaban) 212/9120 0,02324 (2,32%)

RR

OR

RRR

B/A = 2,32/ 2,92 = 0,796 0,796

B´/A´ (Odds)A´=265/8816 = 0,030B´= 212/8908 = 0,024B´/A´: 0,024/0,030 = 0,80

0,80

[(B-A)/A] x 100= (-0,006/0,02918) x 100 = 20,56 %; 1-RR: 1- 0,796 = 0,204

20,56% (20,4 %)

MEDIDAS DE LOS RESULTADOS EN LOS ENSAYOS CLÍNICOS

• Qué resultados medimos?

• Como expresamos estos resultados?

• To “p” or not to “p”

• Intervalos de confianza

To “p” or not to “p”

• Comprobación de hipótesis: - enfoque frecuencista vs enfoque bayesiano- pruebas de significación de la hipótesis nula (Fisher 1922,

1925) y pruebas de hipótesis (Neyman y Pearson 1928, 1933)

Realidad en la población

Decisión del investigador(muestra)

H0 H0

H0Error tipo IIProbabilidad ß

H0Error tipo IProbabilidad α Potencia (1-ß)

To “p” or not to “p”

• Comprobación de hipótesis: Mi nuevo tratamiento es más efectivo que el antiguo?H0= no hay diferencias entre los 2 tratamientosH1= hipótesis contraria. Son diferentes

Realidad en la población

Decisión del investigador(EC: muestra)

H0 H0

H0

Error tipo IIProbabilidad ß =0,20

H0

Error tipo IProbabilidad α=0,05

Potencia (1-ß) 80%

To “p” or not to “p”

• Comprobación de hipótesis: Mi nuevo tratamiento es más efectivo que el antiguo?

Realidad en la población

Decisión del investigador(EC: muestra)

H0 H0

H0

Error tipo IIProbabilidad ß =0,20

H0

Error tipo IProbabilidad α=0,05

Potencia (1-ß) 80%

p = 0,05 = probabilidad empírica de cometer error tipo I= probabilidad de que las diferencias observadas entre los dos grupos puedan ser debidas al azar

To “p” or not to “p”

• Comprobación de hipótesis: Mi nuevo tratamiento es más efectivo que el antiguo?

Valor p= grado de compatibilidad de los datos con la H0

To “p” or not to “p”

• Comprobación de hipótesis: Mi nuevo tratamiento es más efectivo que el antiguo?

Valor p= grado de compatibilidad de los datos con la H0

To “p” or not to “p”

• Comprobación de hipótesis: Mi nuevo tratamiento es más efectivo que el antiguo?

Si p < α (0,05) podemos rechazar H0

Si p > α (0,05) NO podemos rechazar H0

OJO! No podemos aceptarla tampoco!No concluyente

La ausencia de diferencia no es evidencia de

equivalenciaAltman DG. BMJ 1995; 311; 485.

p > 0,05: -muestra pequeña (poder insuficiente)-diferencias menores de lo esperado-dispersión datos-subgrupos de pacientes

To “p” or not to “p”

• Críticas al valor p:

Su valor se ha universalizado demasiado y se interpreta malsignificantitis, ley del todo o nada

No confundir significación estadística con relevancia clínica

Pequeñas diferencias SIN interés clínico pueden ser estadísticamente significativas con muestras muy grandes

Importantes diferencias pueden NO ser estadísticamente significativas a causa de un pequeño tamaño muestral

Intervalos de confianza

• Intervalo de probabilidad: α =0,05

± z α/2 x SE

p (1-α) α/2α/2

1,96 x SE-1,96 x SE

Intervalos de confianza

• Intervalo de probabilidad: α =0,1

± z α/2 x SE 1,64 x SE-1,64 x SE

Intervalos de confianza

• Comprobación de hipótesis: Mi nuevo tratamiento es más efectivo que el antiguo?Intervalo de confianza de la diferencia entre A y B (RAR)

± 1,96 x SE0

Intervalos de confianza

• Comprobación de hipótesis: Mi nuevo tratamiento es más efectivo que el antiguo?Intervalo de confianza del RR entre tto A y B

± 1,96 x SE1

Intervalos de confianza

• Permite conocer los límites entre los cuales tenemos nuestro valor verdadero con un determinado nivel de confianza (IC 95%)

• Permite también conocer la significación estadística (p)• Permiten valorar la relevancia práctica o clínica (la

magnitud del efecto)• Permite ver si incluye o excluye el mínimo valor

considerado de relevancia clínica (δ)

Intervalos de confianza

Diferencias entre los tratamientos (RAR)

Intervalos de confianza

Intervalos de confianza que se solapan:

Obese Non Obese

Hay diferencias

IC próximo a 1 pero no lo incluye

Intervalos de confianza

Intervalos de confianza que se solapan:

Hay diferencias

IC próximo a 1 pero no lo incluye

Ojo: Al comparar 2 medias, pueden solapar hasta un 29% y ser diferentes con significación estadística

p values for testing equality of two means when two confidence intervals overlap

% of overlap of two confidence intervals

0% 5% 10% 15% 20% 25%

0.0056 0.0085 0.0126 0.0185 0.0266 0.0376

Intervalos de confianza

Intervalos de confianza que se solapan:

Conclusiones

• Medidas de resultados: RR vs OR

absolutas vs relativas

• p de significación estadística e intervalos de confianza

Ley del todo nada

Significación estadística vs relevancia clínica

Gracias por vuestra atención

top related