lectura crítica de estudios de tratamiento. revisiones...

24
CAPÍTULO © 2015. Elsevier España, S.L.U. Reservados todos los derechos 5 Lectura crítica de estudios de tratamiento. Revisiones sistemáticas de ensayos clínicos aleatorios Vicente Ruiz García, Rafael Carbonell Sanchís e Iratxe Urreta Barallobre INTRODUCCIÓN Cuando buscamos una respuesta a una pregunta clínica, poner toda nuestra confianza en un solo estudio puede ser arriesgado. Si tenemos que tomar una decisión clínica, lo mejor sería hacerlo apoyándonos en todos los estudios disponibles sobre el problema en cuestión. La mejor OBJETIVOS DEL CAPÍTULO Definir revisión sistemática (RS) y otros tipos de revisiones. Enumerar los elementos clave que definen la validez de una revisión sistemática. Conocer las síntesis cualitativa y cuantitativa (metaanálisis). Entender la importancia de las revisiones sistemáticas para fundamentar nuestra toma de decisiones ante nuestros pacientes. Reflexionar sobre los problemas de aplicación de la evidencia sobre tratamiento. Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 02, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.

Upload: others

Post on 13-Jan-2020

67 views

Category:

Documents


5 download

TRANSCRIPT

Page 1: Lectura crítica de estudios de tratamiento. Revisiones ...dsp.facmed.unam.mx/wp-content/uploads/2013/12/Anexo-2A.-Ruiz-V... · LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA La búsqueda

C A P Í T U L O

© 2015. Elsevier España, S.L.U. Reservados todos los derechos

5Lectura crítica de estudios

de tratamiento. Revisiones sistemáticas

de ensayos clínicos aleatoriosVicente Ruiz García, Rafael Carbonell Sanchís

e Iratxe Urreta Barallobre

INTRODUCCIÓN

Cuando buscamos una respuesta a una pregunta clínica, poner toda nuestra confianza en un solo estudio puede ser arriesgado. Si tenemos que tomar una decisión clínica, lo mejor sería hacerlo apoyándonos en todos los estudios disponibles sobre el problema en cuestión. La mejor

OBJETIVOS DEL CAPÍTULO

• Definir revisión sistemática (RS) y otros tipos de revisiones.

• Enumerar los elementos clave que definen la validez de una revisión sistemática.

• Conocer las síntesis cualitativa y cuantitativa (metaanálisis).

• Entender la importancia de las revisiones sistemáticas para fundamentar nuestra toma de decisiones ante nuestros pacientes.

• Reflexionar sobre los problemas de aplicación de la evidencia sobre tratamiento.

Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 02, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.

Page 2: Lectura crítica de estudios de tratamiento. Revisiones ...dsp.facmed.unam.mx/wp-content/uploads/2013/12/Anexo-2A.-Ruiz-V... · LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA La búsqueda

64 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA

solución es una visión de conjunto, pues valorar todos los estudios re-quiere mucho tiempo y podríamos encontrar que los estudios muestren resultados diferentes, bien porque se han realizado en diferentes lugares, con diferentes grupos de personas, con diferentes estados evolutivos de enfermedad y/o con tratamientos no exactamente iguales. Por otra parte, la velocidad con que se publican nuevos estudios impide estar seguros de que conocemos toda la información sobre un aspecto determinado de un problema.

Las revisiones de la literatura médica son una buena solución a este problema, pues presentan una visión de un determinado problema médico, bien sobre tratamiento, diagnóstico o pronóstico.

Las RS pueden ser de estudios observacionales, de pruebas diagnós-ticas o pronósticos, pero su uso más generalizado es sobre estudios de tratamiento, es decir, con ensayos clínicos (EC). Frecuentemente pueden ir acompañadas de un metaanálisis, que es la combinación estadística de los resultados de diferentes estudios independientes sobre un mismo tema. Como continuación del capítulo 4, en este capítulo abordaremos las RS de estudios sobre efectividad de un tratamiento.

ESCENARIO

Un enfermo que acude a tu consulta te pregunta si merece la pena incluir a su padre en un nuevo programa de telemedicina para el control de su diabetes.

Su padre tiene 84 años y desde hace más de 15 años tiene diabetes tipo II tratada con metformina. Se maneja bien con los medidores de glucemia y mantiene unas cifras habituales alrededor de 230 mg/l (hemoglobina glucosilada: 8,3%), salvo los fines de semana, que salen más elevados. Por lo demás, su padre es hipertenso, con cifras habituales de 150/95 mmHg, tiene un colesterol total de 240 mg/dl y una cifra de lipoproteínas de alta densidad de 53 mg/dl. No ha padecido ningún evento cardiovascular.

El enfermo se siente atraído por la posibilidad de que esté mejor con-trolado pero, por otra parte, no sabe si introducir llamadas diarias va a producir más estrés para su padre, que usa audífono y se pone nervioso cuando no entiende bien al teléfono. En realidad, el enfermo quiere una contestación inmediata, pero le contestas que tienes que revisar el tema. Buscas y encuentras un artículo (1) que aparentemente contesta a la cues-tión y te preguntas:

• ¿Es útil el control por telemedicina para mejorar las glucemias en la diabetes?

• ¿Le recomendarías este programa al padre del enfermo?

Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 02, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.

Page 3: Lectura crítica de estudios de tratamiento. Revisiones ...dsp.facmed.unam.mx/wp-content/uploads/2013/12/Anexo-2A.-Ruiz-V... · LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA La búsqueda

5. LECTURA CRÍTICA DE ESTUDIOS DE TRATAMIENTO. REVISIONES SISTEMÁTICAS... 65©

Els

evie

r. Fo

toco

piar

sin

aut

oriz

ació

n es

un

del

ito.

PUNTOS CLAVE DE LA LECTURA CRÍTICA DE UNA REVISIÓN SISTEMÁTICA

¿QUÉ DIFERENCIA A UNA REVISIÓN SISTEMÁTICA FRENTE A UNA REVISIÓN TRADICIONAL?

Las revisiones tradicionales o narrativas son útiles para obtener una visión general sobre un problema clínico, expresan el punto de vista del autor de la revisión, a menudo un experto en el tema, quien utiliza su peculiar forma de buscar y resumir las pruebas científicas y las opiniones en que se sustentan. Suelen ser atractivas, pues concentran la visión de la autoridad en la materia en un breve resumen, pero no proporcionan una res-puesta fiable y no sesgada al problema clínico, pues suelen ser incompletas y representan un punto de vista personal del autor, siendo, en general, no reproducibles. En la medida en que no son reproducibles, no se pueden considerar como material científico, sino como artículos de opinión.

Las RS intentan reunir toda la evidencia empírica que se ajuste a los crite-rios de elegibilidad especificados previamente con el fin de responder a una pregunta de investigación concreta. Usan métodos explícitos y sistemáticos con el fin de minimizar sesgos, por lo tanto, proporcionan resultados más fiables a partir de los cuales se pueden extraer conclusiones y decisiones. Las características clave de una RS son (2):

• Un claro conjunto de objetivos con los criterios de elegibilidad predefinidos para los estudios.

• Una metodología explícita y reproducible.• Una búsqueda sistemática que trata de identificar todos los estudios

que satisfagan los criterios de elegibilidad.• Una evaluación de la validez de las conclusiones de los estudios

incluidos, por ejemplo, a través de la evaluación del riesgo de sesgo.• Una presentación sistemática y una síntesis, que incluya

las características y los hallazgos de los estudios incluidos.

Existen diversos lugares donde poder encontrar RS, como son: en las bases de datos Medline y Embase a través del filtro metodológico de RS, en la Database of Abstracts of Reviews of Effects (DARE), en la Biblioteca Co-chrane, bien en inglés (Cochrane Library), bien en castellano (la biblioteca Cochrane Plus).

PICO

La RS debe responder a una pregunta claramente formulada. La mejor forma de hacerlo es mediante el acrónimo PICO, ya comentado al abordar el EC en el capítulo 3.

P (participantes). Los participantes en las RS son los estudios originales, en este caso los EC realizados sobre pacientes que

Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 02, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.

Page 4: Lectura crítica de estudios de tratamiento. Revisiones ...dsp.facmed.unam.mx/wp-content/uploads/2013/12/Anexo-2A.-Ruiz-V... · LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA La búsqueda

66 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA

presentan una determinada condición objeto de nuestro interés. A diferencia del PICO de los ensayos, la incorporación de poblaciones diferentes a través de los estudios (edades, diferentes estadios evolutivos, etc.) introduce una fuente de heterogeneidad que no aparece en los ensayos. Habitualmente, en los textos se referencia que la unidad de análisis son los estudios. Solo en los metaanálisis de pacientes individuales la unidad de análisis son los enfermos. Estos se confeccionan con los datos crudos de los ensayos a los que acceden los investigadores, lo que permite explorar más información relevante.I (intervención). La intervención objeto de la revisión es el tratamiento, sea un fármaco concreto, un grupo de ellos o cualquier otra actuación terapéutica, que ha sido sometida a prueba en los ensayos originales.C (comparación). La comparación es la acción con la que se somete a prueba la nueva intervención objeto del estudio. La comparación puede ser un tratamiento ficticio, un placebo, el tratamiento habitual de la enfermedad o incluso el mismo tratamiento en dosis diferentes o con vías de administración diferente.O (outcomes-resultados). Los resultados son los eventos producidos objeto de la investigación. No todas las preguntas se contestan en una revisión y, en ocasiones, se necesita más de una revisión para contestar todas las preguntas relevantes. Los resultados deben ser lo más definidos posibles a través de la descripción de los métodos diagnósticos que se usaron, las escalas de medida, los umbrales a los que se ajustaron, el tiempo al que se midieron los resultados y las unidades de medida usadas. En el caso de usar escalas, hay que detallar los valores superiores e inferiores, y la explicación de qué se debe considerar favorable, si los valores más altos o los más bajos.

Un asunto de importancia es lo ambigua o precisa que sea una pregunta clínica, pues las respuestas serán igualmente ambiguas o precisas. Esta cuestión varía con los criterios de inclusión de los participantes en los es-tudios, en este caso los EC.

Ejemplo de pregunta: en los enfermos con enfermedad pulmonar obs-tructiva crónica moderada en situación de estabilidad clínica, ¿cuál de estos dos fármacos, b2 adrenérgicos o los corticoides inhalados, disminuye el número de reingresos urgentes? (cuadro 5-1).

EXHAUSTIVIDAD EN LA BÚSQUEDA DE LA INFORMACIÓN PUBLICADA Y NO PUBLICADA

Este es un punto cardinal de las RS. Se trata de buscar toda la información existente pertinente, publicada o no, para responder la pregunta clínica. En el caso de las RS sobre tratamiento, se trata de buscar todos los EC exis-tentes. La amplitud o la precisión de la pregunta clínica determinarán la amplitud de la búsqueda de la información.

Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 02, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.

Page 5: Lectura crítica de estudios de tratamiento. Revisiones ...dsp.facmed.unam.mx/wp-content/uploads/2013/12/Anexo-2A.-Ruiz-V... · LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA La búsqueda

5. LECTURA CRÍTICA DE ESTUDIOS DE TRATAMIENTO. REVISIONES SISTEMÁTICAS... 67©

Els

evie

r. Fo

toco

piar

sin

aut

oriz

ació

n es

un

del

ito.

La búsqueda se inicia en las bases de datos que cubren la mayoría de los EC: Medline, Embase y el Cochrane Central Register of Trials (CCRT). Exis-ten numerosas bases de datos, muchas de ellas específicas de determinadas áreas de la salud. A modo de ejemplo, CancerLit es una base de datos sobre oncología; CiNAHL es una base de datos centrada en temas de enfermería; Web of Science (WOS) es una base de datos que incluye material del ámbito universitario y de congresos científicos, etc. En cualquier caso, la elección de las bases de datos dependerá de los problemas clínicos que se aborden.

Los registros de EC, como http://controlled-trials.com, http:// clinicaltrials.gov y el World Health Organization Trial Portal, son bases de datos internacionales que constituyen una de las mayores fuentes de información sobre EC controlados del mundo. Su función principal es aportar información sobre EC en proceso, pero contienen información sobre los ya finalizados. No es infrecuente encontrar ensayos con información de resultados ya disponible pero aún sin publicar y, por tanto, no accesible en las bases de datos que hemos citado previamente. Son, por tanto, bases de datos de consulta obligatoria en las RS sobre tratamiento.

CUADRO 5-1

E J E M P L O D E P R E G U N TA B I E N F O R M U L A D A A T R AV É S

D E L A C R Ó N I M O P I C O . PA C I E N T E S , I N T E RV E N C I Ó N , C O M PA R A C I Ó N

Y O U T C O M E ( R E S U LTA D O )

Participantes• Adultos con EPOC moderada, estables

Intervención• b2 adrenérgicos inhalados

Comparación• Corticoides inhalados

Outcome• Ingresos hospitalarios por reagudización• Sensación de disnea• Pruebas funcionales respiratorias• Efectos adversos

EPOC, enfermedad pulmonar obstructiva crónica.

Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 02, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.

Page 6: Lectura crítica de estudios de tratamiento. Revisiones ...dsp.facmed.unam.mx/wp-content/uploads/2013/12/Anexo-2A.-Ruiz-V... · LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA La búsqueda

68 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA

La búsqueda exhaustiva debe incluir el seguimiento de las referencias de los estudios más importantes, así como los libros de resúmenes de congresos sobre el tema en cuestión, las tesis doctorales, y el contacto con los expertos y con la industria fabricante del tratamiento objeto de la revisión.

El otro punto fundamental de la búsqueda de la información es que las estrategias de las búsquedas sean reproducibles. La RS debe incluir estas estrategias que describan la forma en la que se interrogaron las diferentes bases de datos.

SESGO DE PUBLICACIÓN

Resulta imposible asegurar que una RS incluye todos los estudios exis-tentes sobre un tema. Puede ocurrir que algunos ensayos no estén publica-dos, bien porque no han finalizado o porque los autores o los patrocinadores no lo han considerado oportuno. Se sabe que los estudios financiados por la industria farmacéutica tienen más posibilidades de ser publicados. También se publican antes si incluyen resultados clínicos en vez de resultados su-brogados, o si incluyen tamaños muestrales de más de 1.000 pacientes y muestran resultados positivos (3).

Cuando se revisaron todos los ensayos producidos sobre 12 antidepresi-vos registrados en la FDA, se comprobó que, de los 38 que dieron resultados a favor del fármaco, 37 se publicaron. Sin embargo, de los 36 ensayos que dieron un resultado en contra del fármaco, solo tres se publicaron (4). Esta clara asimetría deja claro que, además de las tradicionales fuentes de información, que son las publicaciones científicas, necesitamos buscar más información al respecto.

Hoy en día, la información sobre un fármaco como Tamiflu® para la gripe sigue siendo privada por parte de la industria (5,6).

Esta diferencia entre lo que se produce científicamente y lo que se publica es un grave problema de características éticas, porque induce a la pres-cripción de productos que no son eficaces, con la consiguiente repercusión sobre la salud de las personas y el coste adicional que supone para finan-ciadores y pacientes. En realidad, es un problema en el que estamos todos concernidos como científicos, pero también como ciudadanos, y en el que todos los responsables (reguladores como la Food and Drug Administration y la European Medicines Agency, promotores de la industria farmacéutica, comités de EC, asociaciones de pacientes y ciudadanos en general, enfermos o potencialmente enfermos en cualquier caso) deberíamos apoyar la trans-parencia al respecto. Iniciativas como Alltrials.org se han desarrollado para presionar a que toda la investigación producida sea pública en el menor tiempo posible.

Cuando los autores o patrocinadores deciden no publicar cierto material del ensayo por la magnitud del resultado, la dirección del mismo o la significa-ción estadística, se produce un sesgo conocido como reporting bias (7). Cuando

Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 02, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.

Page 7: Lectura crítica de estudios de tratamiento. Revisiones ...dsp.facmed.unam.mx/wp-content/uploads/2013/12/Anexo-2A.-Ruiz-V... · LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA La búsqueda

5. LECTURA CRÍTICA DE ESTUDIOS DE TRATAMIENTO. REVISIONES SISTEMÁTICAS... 69©

Els

evie

r. Fo

toco

piar

sin

aut

oriz

ació

n es

un

del

ito.

es todo el ensayo lo que no se publica, se produce un sesgo denominado sesgo de publicación o publication bias.

Existen diferentes formas de sugerir la presencia de sesgo de publicación a partir de gráficos y de pruebas estadísticas.

El funnel plot, o gráfico de embudo invertido, es un método gráfico que explora la posibilidad de sesgo de publicación relacionando la magnitud del efecto combinado del tratamiento de cada estudio con la precisión. Cuando el diagrama de puntos de los diferentes estudios tiene una dis-tribución simétrica alrededor del efecto, se sugiere la ausencia de sesgo de publicación. Y, en su defecto, indica presencia de sesgo (figs. 5-1 y 5-2). Desgraciadamente, con pocos estudios, menos de 10, la posibilidad de sugerir sesgo de publicación a partir del funnel plot es baja y, en realidad, no se presenta en las publicaciones (8).

El análisis del sesgo de publicación por los métodos estadísticos suele requerir muchos ensayos. El índice de tolerancia de Rosenthal es un método estadístico que calcula el número de estudios no publicados que modificarían de forma significativa el resultado encontrado en el metaanálisis.

FIGURA 5-1 Funnel plot de una revisión sistemática. La distribución de los estudios a ambas partes del verdadero efecto sugiere que no existe sesgo de publicación, pues los es-tudios de menor tamaño muestral por azar se supone que se distribuirían a ambos lados del gráfico de forma parecida.

Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 02, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.

Page 8: Lectura crítica de estudios de tratamiento. Revisiones ...dsp.facmed.unam.mx/wp-content/uploads/2013/12/Anexo-2A.-Ruiz-V... · LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA La búsqueda

70 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA

SELECCIÓN DE ESTUDIOS Y EXTRACCIÓN DE DATOS

Tras la búsqueda exhaustiva de la información en las diferentes fuentes y bases de datos, los ensayos incluidos en una RS deben haber sido selec-cionados siguiendo un protocolo previo que debe ajustarse a los criterios establecidos en la pregunta PICO. De nuevo, la precisión o ambigüedad de la pregunta puede hacer que los criterios de inclusión sean más o menos restrictivos. Para minimizar la subjetividad en la selección de estudios, esta debe realizarse por dos o más revisores de forma independiente. En caso de discrepancias, estas deben resolverse por discusión y consenso, o recurriendo a un tercer revisor.

La extracción de datos de los estudios seleccionados e incluidos en la RS debe realizarse también por dos o más revisores para disminuir la subjetividad y el riesgo de error.

EVALUACIÓN DE LA CALIDAD DE LOS ESTUDIOS ORIGINALES

Las conclusiones que se puedan extraer de una RS dependen, entre otros factores, de la validez de los artículos originales incluidos.

En las RS sobre efectividad hay que evaluar la validez de los EC obte-nidos en la búsqueda. Recordemos que los puntos fundamentales sobre la validez de un EC son el reparto aleatorio de los participantes entre los grupos experimental y control, con una secuencia de aleatorización no

FIGURA 5-2 Funnel plot de una revisión sistemática. La falta de estudios a la derecha de la línea media sugiere un posible sesgo de publicación.

Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 02, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.

Page 9: Lectura crítica de estudios de tratamiento. Revisiones ...dsp.facmed.unam.mx/wp-content/uploads/2013/12/Anexo-2A.-Ruiz-V... · LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA La búsqueda

5. LECTURA CRÍTICA DE ESTUDIOS DE TRATAMIENTO. REVISIONES SISTEMÁTICAS... 71©

Els

evie

r. Fo

toco

piar

sin

aut

oriz

ació

n es

un

del

ito.

predecible ni conocida por el investigador, el cegamiento en la valoración de los resultados por parte de los pacientes, clínicos e investigadores, el seguimiento completo de los pacientes y el análisis de los resultados en el grupo al que fueron asignados, experimental o control, lo que se denomina análisis por intención de tratar.

El que no cumplan todos o una parte de ellos puede explicar la diferencia en los resultados. Los estudios menos rigurosos suelen sobrestimar los efectos de las intervenciones terapéuticas. Existen multitud de escalas para evaluar el riesgo de sesgo en los EC; una es la escala de Jadad (no recomendada por no estar incluida en ella la ocultación de la secuencia de aleatorización), y otra cada vez más utilizada es la herramienta pa-ra la detección de riesgo de sesgo de la colaboración Cochrane, que es una evaluación basada en dominios (generación de la secuencia, ocultamiento de la secuencia, cegamiento de los participantes y del personal, cegamien-to de los evaluadores de los resultados, datos de resultado incompletos, notificación selectiva de resultados, otras fuentes de sesgo). Cada dominio se valorará como «bajo riesgo» de sesgo, «alto riesgo» de sesgo, o «riesgo poco claro» de sesgo (8).

También sabemos que los estudios que se interrumpen de forma pre-matura tienen más posibilidad de sesgo que los que se terminan sin inte-rrupciones prematuras. Interrumpir por seguridad, porque existen más muertes o efectos dañinos en uno de los grupos, es ético, pero interrumpir prematuramente por beneficio inesperado puede introducir sesgos impor-tantes y debería tenerse en consideración (9).

Idealmente se debe evaluar el riesgo de sesgos para cada uno de los resultados importantes en cada estudio original. Imaginemos un es-tudio no cegado donde los resultados principales son la mortalidad y la sensación subjetiva de apetito para un nuevo fármaco. Si la revisión incluyera unos estudios cegados y otros no, el resultado podría verse afectado por el mismo, aunque la mortalidad no se afectara. Una forma de medirlo es presentar, en forma de tablas, el riesgo de sesgo de cada resultado importante en cada estudio para cada dominio (tabla 5-1 y v. tabla 4-1).

HETEROGENEIDAD

Parece lógico que los estudios incluidos en una RS y en un metaanálisis presenten resultados diferentes entre ellos. El lector de la RS debe juzgar si esa diferencia en los resultados se debe a motivos identificables. Diferentes dosis, diferentes estados evolutivos de enfermedad, diferentes compara-dores, diferente extracción de los enfermos pueden producir resultados similares, pero no exactamente iguales.

Existen diferentes formas de evaluar la heterogeneidad. Una de ellas es explorando visualmente el gráfico forest plot, gráfico del que hablaremos más adelante. De momento, podemos avanzar que, cuando las estimaciones

Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 02, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.

Page 10: Lectura crítica de estudios de tratamiento. Revisiones ...dsp.facmed.unam.mx/wp-content/uploads/2013/12/Anexo-2A.-Ruiz-V... · LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA La búsqueda

72 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA

puntuales de cada estudio son muy diferentes entre sí y sus intervalos de confianza (IC) no se solapan, se debe sospechar que existe heterogeneidad entre los estudios.

Una de las formas estadísticas de evaluar la heterogeneidad es el es-tadístico I2.

El estadístico I2 mide la heterogeneidad relativa y no depende del número de estudios. Un valor cercano al 0% sugiere que no hay he-terogeneidad, y con valores más altos se incrementa la sospecha de heterogeneidad, siendo su valor máximo el 100%. En la medida que mide heterogeneidad relativa, cuando los estudios individuales son muy imprecisos, la heterogeneidad debida al tamaño muestral enmascara la verdadera heterogeneidad y puede haber una I2 del 0% con importante

CUADRO 5-2

G U Í A A P R O X I M A D A PA R A I N T E R P R E TA R H E T E R O G E N E I D A D

• Del 0 al 40%: puede no ser importante• Del 30 al 60%: puede representar heterogeneidad moderada• Del 50 al 90%: puede representar heterogeneidad significativa• Del 75 al 100%: heterogeneidad considerable

Tomado de Cochrane Handbook for Systematic Reviews of Interventions. 2nd edition. Chichester: Wiley; 2011. 672 p.

TABLA 5-1 Riesgo de sesgo del resultado «incremento del apetito» a través de los diferentes ensayos de una revisión

Apetito

Generación de secuencia adecuada

Ocultación de la secuencia Cegamiento

Datos de resultadosincompletos

Libre de comunicación selectiva de resultados

Libre de otros sesgos

Estudio A

Bajo riesgo de sesgo

No claro/incierto

Bajo riesgo de sesgo

Bajo riesgo de sesgo

No claro/incierto

No claro/incierto

Estudio B

No claro/incierto

No claro/incierto

Bajo riesgo de sesgo

Bajo riesgo de sesgo

Bajo riesgo de sesgo

No claro/incierto

Estudio C

No claro/incierto

No claro/incierto

Alto riesgo de sesgo

Bajo riesgo de sesgo

Bajo riesgo de sesgo

No claro/incierto

Estudio D

No claro/incierto

No claro/incierto

Alto riesgo de sesgo

Bajo riesgo de sesgo

Bajo riesgo de sesgo

No claro/incierto

Estudio E

No claro/incierto

No claro/incierto

Alto riesgo de sesgo

Bajo riesgo de sesgo

Bajo riesgo de sesgo

No claro/incierto

Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 02, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.

Page 11: Lectura crítica de estudios de tratamiento. Revisiones ...dsp.facmed.unam.mx/wp-content/uploads/2013/12/Anexo-2A.-Ruiz-V... · LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA La búsqueda

5. LECTURA CRÍTICA DE ESTUDIOS DE TRATAMIENTO. REVISIONES SISTEMÁTICAS... 73©

Els

evie

r. Fo

toco

piar

sin

aut

oriz

ació

n es

un

del

ito.

heterogeneidad real. De ahí que algunos recomienden que se use la I2 junto con su IC 95% (cuadro 5-2).

Otra manera de valorar si hay heterogeneidad es comprobando si los diferentes métodos de combinación de resultados, efectos fijos o efectos aleatorios producen resultados consistentes.

Cuando existe heterogeneidad, deben explorarse las posibles causas, observando las posibles diferencias entre los estudios incluidos en la RS y en el metaanálisis. Para ello, pueden realizarse análisis de subgrupos, una metarregresión, o puede comprobarse el efecto de cada estudio en el resultado global. Más adelante se comentarán estos aspectos con más detalle. En cualquier caso, la heterogeneidad es una cuestión del clínico más que del estadístico. Hay que recordar que estamos asumiendo que el resultado es un resultado global para una población que puede ser bien distinta (niños/ancianos, gravemente enfermos/sanos o poco enfermos), dosis (elevadas/bajas), etc., que podría hacer que el valor promedio, que es el resultado matemático, no tuviera sentido. Si la heterogeneidad es extrema, el metaanálisis no debería producirse y se tendrían que presentar los resultados de forma descriptiva.

METAANÁLISIS. FOREST PLOT

Como se ha comentado anteriormente, el metaanálisis es un conjunto de procedimientos estadísticos que permiten la combinación de los resultados de los estudios independientes sobre un mismo problema. Su ventaja principal es que incrementa el tamaño muestral y, por tanto, la precisión estadística. Un metaanálisis no es una RS, aunque a veces se utilicen ambos términos de forma indistinta.

El metaanálisis proporciona una estimación de una media ponderada del efecto del tratamiento en los diferentes estudios. El tipo de efecto depende de la naturaleza del resultado, bien se trate de variables dicotó-micas o continuas, y puede expresarse de forma absoluta o relativa. En el caso de variables dicotómicas, como, por ejemplo, muertos o vivos, la forma absoluta es la DR, también llamada RAR, y el NNT; la forma relativa el RR y la OR. Cuando las variables son continuas, los resultados se presentan como diferencia ponderada de medias (DPM) si las variables tienen la misma forma de medirse, o como diferencia estandarizada de medias (DEM) si se usan diferentes formas de medir una misma variable, como, por ejemplo, diferentes escalas de medir la depresión. Sea cual sea el estimador del efecto, este se presenta en un gráfico que se denomina forest plot (fig. 5-3).

En el gráfico forest plot se muestran los resultados de cada estudio in-dividual y el resultado combinado de los estudios. La estimación puntual de cada estudio individual se presenta como un cuadrado o círculo, cuyo tamaño es proporcional al peso de dicho estudio en el resultado combinado y la precisión de dicha estimación, es decir, los IC, se representa mediante

Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 02, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.

Page 12: Lectura crítica de estudios de tratamiento. Revisiones ...dsp.facmed.unam.mx/wp-content/uploads/2013/12/Anexo-2A.-Ruiz-V... · LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA La búsqueda

74 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA

una línea horizontal. En general, los estudios de menor tamaño tienen menos precisión y su contribución a la estimación global del efecto recibe una menor ponderación.

El resultado combinado de todos los estudios se muestra como un rombo o diamante, cuya amplitud horizontal representa los intervalos de confianza de la estimación global, es decir, el rango de valores entre los que el verdadero valor del efecto es probable que se sitúe. Cuando los resultados se presentan en forma de OR o RR, el forest plot utiliza una escala logarítmica.

La precisión del resultado combinado de los diferentes estudios se ex-presa mediante los intervalos de confianza de la estimación puntual. La significación estadística de la estimación del resultado combinado se valora observando si la amplitud del rombo o diamante incluye la línea de no significación (1 si se trata de OR o RR, y 0 si se trata de DR o diferencia de medias).

FIGURA 5-4 Forest plot que compara la mortalidad de un nuevo tratamiento para la cefalea. Los IC 95% de todos los estudios no se solapan y la I2 es del 63%, sugiriendo heterogeneidad importante.

FIGURA 5-3 Forest plot que mide el riesgo de mejorar en la cefalea con el nuevo tratamiento en relación con el tratamiento control. El valor de I2 es de cero, no sugiriendo heterogeneidad estadística.

Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 02, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.

Page 13: Lectura crítica de estudios de tratamiento. Revisiones ...dsp.facmed.unam.mx/wp-content/uploads/2013/12/Anexo-2A.-Ruiz-V... · LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA La búsqueda

5. LECTURA CRÍTICA DE ESTUDIOS DE TRATAMIENTO. REVISIONES SISTEMÁTICAS... 75©

Els

evie

r. Fo

toco

piar

sin

aut

oriz

ació

n es

un

del

ito.

El forest plot permite explorar visualmente la existencia de heteroge-neidad, viendo si las estimaciones puntuales de cada estudio son muy diferentes entre sí y en qué grado se solapan los IC. Grandes diferencias en las estimaciones puntuales de cada estudio e IC que no se solapan sugieren heterogeneidad (fig. 5-4). Esta variabilidad puede ser debida a diferentes estadios evolutivos de la enfermedad, diferentes tipos de enfermos, intervenciones no exactamente iguales o resultados no medidos de la misma forma.

MODELO DE EFECTOS FIJOS Y MODELO DE EFECTOS ALEATORIOS

Disponemos de dos métodos o modelos para obtener el estimador resu-men del efecto en un conjunto de estudios. Son el modelo de efectos fijos y el modelo de efectos aleatorios.

El modelo de efectos fijos supone que existe un «efecto único» para todos los estudios y que las diferencias observadas se deben al azar (error intraestudio). Por tanto, solo existe una fuente de variación, que es la debida a la imprecisión en la estimación de cada estudio (variación intraestudio).

En los estudios reales, suele haber cierta heterogeneidad entre estudios (diferentes pacientes, diferentes dosis o forma de aplicar el tratamiento, diferentes períodos de seguimiento, etc.), por lo que es difícil asumir que existe un solo efecto, y parece más verosímil pensar en una diversidad de efectos. En consecuencia, este modelo considera que, además de la variación debida al azar (error intraestudio), existen verdaderas diferencias de efecto entre estudios (variación entre estudios).

Cuando los estudios son relativamente homogéneos, el error entre es-tudios tiende a cero, por lo que los dos modelos ofrecen resultados prác-ticamente idénticos.

El modelo de efectos aleatorios supone que los estudios son una mues-tra de todos los estudios que hay, por lo que incluye dos componentes de variación: la imprecisión en la estimación de cada estudio y la variación de estudio a estudio.

Por lo tanto, dado que la variación que se incluye en el modelo de efectos aleatorios es mayor que la que se incluye en el modelo de efectos fijos, el IC alrededor del estimador resumen del metaanálisis obtenido mediante el modelo de efectos aleatorios es mayor, más amplio, que el obtenido mediante un modelo de efectos fijos.

Hay que hacer una asunción a priori sobre el modelo que se va a usar, en función de las asunciones que resulten más razonables. Esto debe figurar en los protocolos de las revisiones. Sin embargo, hay que considerar que puede no ser adecuado realizar un metaanálisis sin explicar las causas de heterogeneidad. Una de las formas de valorar la heterogeneidad es comprobar la consistencia en la estimación del resultado combinado de

Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 02, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.

Page 14: Lectura crítica de estudios de tratamiento. Revisiones ...dsp.facmed.unam.mx/wp-content/uploads/2013/12/Anexo-2A.-Ruiz-V... · LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA La búsqueda

76 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA

los estudios, utilizando tanto el modelo de efectos fijos como el de efectos aleatorios.

Dentro de los modelos más utilizados están el de Peto, el de Mantel-Haenszel, el inverso de la varianza y el de DerSimonian-Laird.

METARREGRESIÓN Y ANÁLISIS DE SUBGRUPOS

Hemos comentado algunas formas de evaluar si hay heterogeneidad entre los estudios, observando el gráfico funnel plot, el estadístico I2 y comprobando la consistencia de resultados utilizando el modelo de efectos fijos y aleatorios.

Otra forma es eliminando secuencialmente del metaanálisis un estudio diferente cada vez (análisis de sensibilidad), observando qué estudios in-fluyen de forma más significativa en el resultado combinado, y analizando las características de estos estudios.

Una vez conocida la existencia de heterogeneidad, disponemos de dos formas de explorar las causas de dicha heterogeneidad, que son el análisis por subgrupos y la metarregresión.

El análisis de subgrupos o estratificado consiste en realizar metaa-nálisis para diferentes características o categorías de los estudios y va-lorar si el resultado combinado es diferente entre los análisis (si hay diferencias del efecto en hombres y en mujeres o entre lugares geográfi-cos diferentes). Para comprobar esto y descartar que esta variación se deba al azar, es necesario realizar la prueba de interacción, cuya significación inferior < 0,1 sugiere un diferente efecto de la intervención en los sub-grupos. La metarregresión es una extensión del análisis por subgrupos que permite investigar simultáneamente el efecto de características categóricas (vía de administración, sexo, calidad de los estudios, etc.) y continuas (edad, dosis, tamaño muestral, etc.). Mediante metarregresión podemos investigar simultáneamente los efectos de múltiples factores sobre el resultado. Conviene saber que tanto en la metarregresión como en el análisis de subgrupos, el número de covariables como de categorías debe ser pequeño y estar en relación con el número de estudios incluidos en la RS.

ANÁLISIS DE SENSIBILIDAD

El análisis de sensibilidad pretende estudiar la influencia de cada uno de los estudios en la estimación global del efecto y, por lo tanto, la robustez o estabilidad de la medida final obtenida. Este análisis consiste en la repetición del metaanálisis tantas veces como estudios seleccionados, de forma que cada vez se omite un estudio, combinándose todos los res-tantes. Si los resultados de los distintos metaanálisis son similares, esto es, el efecto tiene una misma dirección, magnitud y significación estadís-tica, se puede concluir que los resultados son robustos. En caso contrario, no se tendría un estimador robusto, lo cual exigiría cierta precaución

Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 02, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.

Page 15: Lectura crítica de estudios de tratamiento. Revisiones ...dsp.facmed.unam.mx/wp-content/uploads/2013/12/Anexo-2A.-Ruiz-V... · LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA La búsqueda

5. LECTURA CRÍTICA DE ESTUDIOS DE TRATAMIENTO. REVISIONES SISTEMÁTICAS... 77©

Els

evie

r. Fo

toco

piar

sin

aut

oriz

ació

n es

un

del

ito.

en la interpretación de los resultados o podría ser motivo para generar nuevas hipótesis.

El análisis de sensibilidad también puede utilizarse para estudiar la in-fluencia en los resultados del metaanálisis de ciertos aspectos relacionados con la validez de los estudios, como, por ejemplo, la exclusión de estudios que no superan un determinado umbral de calidad, trabajos no publicados, o bien estudios en los que hay incertidumbre sobre el cumplimiento de los criterios de selección.

En ocasiones, este análisis se confunde con el análisis de subgrupos. Los dos métodos difieren en dos aspectos: primero, los análisis de sensibilidad no intentan calcular el efecto de la intervención en el grupo de estudios eliminados del análisis, mientras que en los análisis por subgrupos se producen estimaciones para cada subgrupo; segundo, en el análisis de sen-sibilidad se hacen comparaciones informales entre diferentes formas de calcular lo mismo, mientras que en el de subgrupos se hacen comparaciones estadísticas formales entre los subgrupos.

DESCRIPCIÓN DE UNA REVISIÓN SISTEMÁTICA

Al igual que en otros tipos de estudios, existe una recomendación sobre cómo describir una RS: recibe el nombre de PRISMA (Preferred Reporting Items for systematic Reviews and Meta-analysis). PRISMA consta de una guía de 27 puntos y un diagrama de flujo que permite evaluar todos los aspectos pertinentes de una RS. Esta recomendación se puede encontrar en http://www.equator-network.org/.

REFLEXIONES SOBRE LA APLICABILIDAD DE LOS TRATAMIENTOS

Uno de los aspectos más importantes de una RS es decidir hasta qué punto puede aplicarse a pacientes concretos (10). Es, probablemente, una de las partes menos desarrolladas de la lectura crítica, pero es la más importante a la hora de decidir si nuestro enfermo podría haber es-tado representado en esa RS. Exige conocer no solo los resultados, sino la información primaria de la que se ha extraído. Veamos qué aspectos son importantes a la hora de valorar la aplicabilidad a nuestros pacientes concretos.

• Existencia de diferencias demográficas importantes entre los pacientes del estudio y los comunitarios. Aproximadamente un 60% de los enfermos con insuficiencia cardíaca tienen insuficiencia renal con filtrado glomerular inferior al 15%, y estos enfermos tienen un peor pronóstico (11). Sin embargo, una parte importante de ensayos con inhibidores de la enzima convertidora de angiotensina (IECA), b-bloqueantes y espironolactona excluyen a estos enfermos de los ensayos (12). Esta cuestión es importante, porque estudios poblacionales han cuestionado los resultados de EC como el RALES,

Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 02, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.

Page 16: Lectura crítica de estudios de tratamiento. Revisiones ...dsp.facmed.unam.mx/wp-content/uploads/2013/12/Anexo-2A.-Ruiz-V... · LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA La búsqueda

78 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA

en los que no aparecen efectos indeseables como la hiperpotasemia, que sí aparece en la población general tratada con estos fármacos (13,14). Otros factores que pueden hacer que los enfermos no sean elegibles incluyen la edad, el sexo, la raza, el nivel educativo, el estatus social o su lugar de residencia (15-18). Todos estos factores pueden hacer que menos del 10% de los enfermos incluidos en los EC que incluyen las RS sean parecidos a los enfermos que nos encontramos en la vida real.

• Escasa representación de gravedad, estadio de enfermedad o comorbilidad. Es muy frecuente que la comorbilidad sea excluida de forma sistemática. En un artículo donde se consideraron los 284 ensayos publicados durante 1 año en las principales revistas por factor de impacto, solo en 200 se declaró la existencia de patología múltiple crónica. De ellos, en 179 se excluyó de forma explícita a estos enfermos y solo en seis ensayos se incluyeron de forma predefinida (19). La fibrilación auricular puede llegar a estar presente desde un punto de vista poblacional hasta en el 50% de los enfermos con insuficiencia cardíaca; sin embargo, apenas representa un 12% en la comorbilidad que aparece en los ensayos de insuficiencia cardíaca (20).

• Diferencias en la cumplimentación o adherencia al tratamiento. También sabemos que la estricta adherencia de la medicación en las enfermedades crónicas no es la misma cuando se está sometido a un experimento que en condiciones reales. En los países desarrollados se ha estimado que la cumplimentación del tratamiento es de un 50% para la hipertensión, en la depresión entre un 40 y un 70%, y en un 43% para el asma durante todo el tiempo (21). Las visitas, los recordatorios, el dinero que se ofrece o los pagos en especie que se dan a los enfermos tienen que tenerse en cuenta como un factor que facilita la adherencia al tratamiento en los ensayos y que no aparecerá en condiciones de vida real.

• La polimediación. Fuera de los ensayos, los fármacos para la insuficiencia cardíaca no son tan efectivos. Muchos enfermos no pueden evitar tomar antiinflamatorios que usan de forma habitual, lo que afecta a los resultados en la práctica real. De hecho, una de las causas más frecuente de descompensación de la insuficiencia cardíaca es la administración de antiinflamatorios no esteroideos, antagonistas del calcio u otros fármacos (22).

• Intervenciones que necesitan elevada preparación y formación. Los resultados del gran ensayo «Asymptomatic Carotid Artery Surgery» (ACAS) (23) mostraron que esta cirugía era segura, mientras que el resto de estudios previos demostraba que no. En el ensayo ACAS solo cirujanos expertos en la técnica pudieron entrar en el estudio, y solo un 40% de los que solicitaron entrar en el ensayo ACAS

Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 02, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.

Page 17: Lectura crítica de estudios de tratamiento. Revisiones ...dsp.facmed.unam.mx/wp-content/uploads/2013/12/Anexo-2A.-Ruiz-V... · LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA La búsqueda

5. LECTURA CRÍTICA DE ESTUDIOS DE TRATAMIENTO. REVISIONES SISTEMÁTICAS... 79©

Els

evie

r. Fo

toco

piar

sin

aut

oriz

ació

n es

un

del

ito.

fueron admitidos. Esto explica que la mortalidad de este ensayo fuera ocho veces menor que en el resto (24).

• Tiempo de seguimiento: el tiempo de seguimiento de los estudios suele ser corto como para hacerse una idea de los efectos a medio o largo plazo, por lo que los resultados podrían no mantenerse en el tiempo o aparecer efectos secundarios que no se aprecian en estudios con un seguimiento más corto. Así, la RS de certolizumab pegol para la artritis reumatoide solo encontró un ensayo de los 11 en que se siguiera a los enfermos 1 año (25).

• Incorporación de los efectos secundarios y resultados centrados en los intereses de los pacientes a la hora de tomar una decisión. No es infrecuente que se realicen RS sobre resultados que se obtienen de estudios primarios que no midan calidad de vida, o resultados relevantes para la salud, centrándose en resultados intermedios en salud como resultados de análisis (glucemias, colesterol, marcadores) o de imagen (densitometrías, radiográficos). Decidir si un resultado intermedio es suficiente para cambiar a una nueva tecnología o un nuevo tratamiento es una cuestión que solo los clínicos pueden valorar a la hora de decidir si esta se incorpora.

Un comentario final: la lectura crítica de una RS es una habilidad que requiere pericia a la hora de decidir si esta está suficientemente bien cons-truida y, por tanto, merece ser tomada en consideración. Sin embargo, solo los clínicos podremos decidir si sus resultados pueden ser aplicados a pacientes concretos, que pueden provenir de distintos ámbitos, con dife-rente complejidad y polimedicación y con diferente motivación a la hora de cumplimentar los diferentes tratamientos.

ARTÍCULO

Marcolino MS, Maia JX, Alkmim MB, Boersma E, Ribeiro AL. Teleme-dicine application in the care of diabetes patients: systematic review and meta-analysis. PLoS One. 2013;8(11):e79246. Disponible en: http://www.plosone.org/article/info%3Adoi%2F10.1371%2Fjournal.pone.0079246#po-ne-0079246-g004.

PLANTILLA CASPE CONTESTADA PARA ESTE ARTÍCULO CONCRETO

En el cuadro 5-3 se muestra la plantilla CASPe contestada para este artículo concreto.

Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 02, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.

Page 18: Lectura crítica de estudios de tratamiento. Revisiones ...dsp.facmed.unam.mx/wp-content/uploads/2013/12/Anexo-2A.-Ruiz-V... · LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA La búsqueda

80 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA

CUADRO 5-3

E VA L U A C I Ó N C R Í T I C A D E L A RT Í C U L O P R O P U E S T O ( P L A N T I L L A C A S P E )

A) ¿Los resultados de la revisión son válidos?Preguntas de eliminación

1. ¿Se hizo la revisión sobre un tema claramente definido?

PISTA: un tema debe ser definido en términos de:– La población de

estudio– La intervención

realizada– Los resultados

(outcomes) considerados

Sí ✓ No sé NoPoblación: adultos con DM tipo 1 y 2. Cita los criterios de exclusión: diabetes gestacional, imposibilidad de establecer feedback o seguimiento inferior a 6 meses, etc.

Intervención: estrategia de aplicación de telemedicina en el cuidado de los pacientes. Por telemedicina se pueden entender cosas muy distintas, desde teleconsultas hasta programas a través de internet o dispositivos desde los que envías los niveles de glucemia a distancia, etc.Comparación: grupo con el cuidado habitual (no está definido).

Resultados: primario (cambio en términos absolutos en la HbA1c), secundarios (cambio en términos absolutos en el LDL-c, presión arterial sistólica, presión arterial diastólica e IMC). La HbA1c es un resultado intermedio (subrogate outcome), pero no es un resultado clínico relevante y, en cualquier caso, no es un outcome «centrado en el paciente»

2. ¿Buscaron los autores el tipo de artículos adecuado?

PISTA: el mejor «tipo de estudio» es el que:– Se dirige a la

pregunta objeto de la revisión

– Tiene un diseño apropiado para la pregunta

Sí ✓ No sé NoBuscaron artículos cuya pregunta era el objeto de la revisión.

Buscaron ensayos clínicos, que es el diseño apropiado para responder esta pregunta

Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 02, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.

Page 19: Lectura crítica de estudios de tratamiento. Revisiones ...dsp.facmed.unam.mx/wp-content/uploads/2013/12/Anexo-2A.-Ruiz-V... · LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA La búsqueda

5. LECTURA CRÍTICA DE ESTUDIOS DE TRATAMIENTO. REVISIONES SISTEMÁTICAS... 81©

Els

evie

r. Fo

toco

piar

sin

aut

oriz

ació

n es

un

del

ito.

Preguntas detalladas

3. ¿Crees que estaban incluidos los estudios importantes y relevantes?

PISTA: busca:– Qué bases de datos

bibliográficas se han usado– Seguimiento de las

referencias– Contacto personal con

expertos– Búsqueda de estudios no

publicados– Búsqueda de estudios

en idiomas distintos del inglés

Sí ✓ No sé NoHan consultado Medline (a través de PubMed), el registro de ensayos clínicos de la Cochrane y LILACS hasta abril de 2012.

Faltarían Embase y otros registros de ensayos clínicos, como el de la Organización Mundial de la Salud, clinicaltrials.gov, controlledtrials.com y clinicaltrialsregister.eu.

Hacen seguimiento de referencias.No contactan con expertos.No dicen que hagan búsqueda de estudios no

publicados.No hacen restricción de idiomas.No hay referencia al perfil de búsqueda en

cada base de datos.

4. ¿Crees que los autores de la revisión han hecho suficiente esfuerzo para valorar la calidad de los estudios incluidos?

PISTA: los autores necesitan considerar el rigor de los estudios que han identificado. La falta de rigor puede afectar al resultado de los estudios («No es oro todo lo que reluce», El Mercader de Venecia, Acto II)

Sí ✓ No sé NoLa evaluación de la calidad de los estudios se basó en (v. tabla 3 del artículo original):– Generación de secuencia de aleatorización

adecuada (100%)– Asignación cegada (62%)– Valoración de resultados cegada (38%)– Análisis por intención de tratar (92%)– Descripción de pérdidas y exclusiones (92%)La importancia de estos ítems ya habrá sido tratada en el capítulo 4. Habría que analizar también la calidad a través de los outcomes, pero no se hizo mediante GRADE.

Los estudios con pérdidas > 20% o > 5% que no hacían análisis por intención de tratar fueron excluidos. Quizás este problema podría haber sido resuelto haciendo análisis de sensibilidad con estos estudios y verificando si los resultados son consistentes.

Evalúan el sesgo de publicación de manera gráfica (funnel plot) y a través del test de Egger, y dicen que puede existir un sesgo de publicación. Tras aplicar el método de trim-and-fill, comentan que este sesgo no interfiere en la interpretación de los resultados

CUADRO 5-3 (cont.)

(Continúa) Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 02, 2016. Para uso personal exclusivamente. No

se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.

Page 20: Lectura crítica de estudios de tratamiento. Revisiones ...dsp.facmed.unam.mx/wp-content/uploads/2013/12/Anexo-2A.-Ruiz-V... · LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA La búsqueda

82 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA

5. Si los resultados de los diferentes estudios han sido mezclados para obtener un resultado «combinado», ¿era razonable hacer eso?

PISTA: considera si:– Los resultados de los

estudios eran similares entre sí

– Los resultados de todos los estudios incluidos están claramente presentados

– Están discutidos los motivos de cualquier variación de los resultados

Sí No sé No ✓No hay una referencia explícita a la existencia de heterogeneidad clínica entre estudios, pero puede deducirse del texto y de la tabla 1 (características basales) del artículo original; hay que destacar:– Diferentes sitios: atención primaria, ocho;

especializada, cuatro, y mixta, uno– Duración de la intervención de los estudios: 6,

12 y 18 meses– Diabetes tipo 1 y 2– Duración diferente de la diabetes– Diferentes tratamientos entre estudios: con

antidiabéticos orales, insulina y ambos, dieta y ejercicio

– Diferente «aplicador» de la intervención, médicos y enfermería

– Diferente frecuencia de contactos de la intervención (solo ocho estudios informan de la frecuencia del contacto)

Para ver si los resultados eran similares, realizan la Q de Cochrane y la I2.

Para el outcome primario (HbA1c), ven que tiene una elevada heterogeneidad (I2 = 73%); por lo tanto, estos estudios no son similares entre sí; hay una heterogeneidad clínica además de la estadística, fruto de lo anteriormente expuesto y de la visión amplia de la pregunta de la revisión sistemática.

Para los outcomes secundarios: LDL-c tiene un valor de I2 = 24%, de ahí que puedan combinarse. PAS y PAD tienen una elevada heterogeneidad, con una I2 del 94 y el 84%, respectivamente, que debe hacer reflexionar si el valor del promedio puede representar algo que valga para todosLos resultados están claramente presentados tanto en el texto como en los gráficos (forest plot)

CUADRO 5-3 (cont.)

Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 02, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.

Page 21: Lectura crítica de estudios de tratamiento. Revisiones ...dsp.facmed.unam.mx/wp-content/uploads/2013/12/Anexo-2A.-Ruiz-V... · LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA La búsqueda

5. LECTURA CRÍTICA DE ESTUDIOS DE TRATAMIENTO. REVISIONES SISTEMÁTICAS... 83©

Els

evie

r. Fo

toco

piar

sin

aut

oriz

ació

n es

un

del

ito.

B) ¿Cuáles son los resultados?

6. ¿Cuál es el resultado global de la revisión?

PISTA: considera:– Si tienes claros los

resultados últimos de la revisión

– ¿Cuáles son? (numéricamente, si es apropiado)

– ¿Cómo están expresados los resultados? (NNT, OR, etc.)

Los resultados aparecen en la página 3 y en las figuras 2 y 3 del artículo original.

Outcome primario: la estrategia de telemedicina presenta una reducción absoluta del –0,44% en la HbA1c, con un IC 95% entre –0,61 y –0,26 comparada con el cuidado habitual. Esto representa una mejora de la glucemia media de –8 mg/dl (–2, –13), aunque presenta una heterogeneidad muy alta.

Outcome secundario: en el LDL-c, la telemedicina tiene una reducción de –6,6 mg/dl, con un IC 95% entre –8,27 y –4,9, comparada con el cuidado habitual.

La PAS presenta una reducción de –1,58, con un IC 95% entre –7,26 y 4,1, y una PAD de –0,65 con un IC 95% entre –2,55 y 1,25. Como el IC pasa el 0, indica que no hay diferencias estadísticamente significativas. Los resultados están expresados en diferencia de medias. Hacen análisis de sensibilidad y se ve cómo los resultados apenas cambian. Hacen análisis por subgrupos (v. página 3 en análisis secundario) y se ve que la reducción en la HbA1c es mayor en los individuos con DM tipo 1 que en los de DM tipo 2. También la reducción de la HbA1c es mayor en los individuos cuyo nivel basal de HbA1c es > 8% que aquellos en los que es < 8%.

Hubiera sido conveniente realizar más análisis de sensibilidad: pacientes procedentes de atención primaria/especializada (con más comorbilidad y complicaciones); edad del paciente; número de años que el paciente es diabético e intensidad de la intervención (no es lo mismo una llamada al día que una al mes)

CUADRO 5-3 (cont.)

(Continúa)

Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 02, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.

Page 22: Lectura crítica de estudios de tratamiento. Revisiones ...dsp.facmed.unam.mx/wp-content/uploads/2013/12/Anexo-2A.-Ruiz-V... · LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA La búsqueda

84 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA

7. ¿Cuál es la precisión del resultado/s?

PISTA: busca los intervalos de confianza de los estimadores

(v. apartado 6 de este cuadro)

C) ¿Son los resultados aplicables en tu medio?

8. ¿Se pueden aplicar los resultados en tu medio?

PISTA: considera si:– Los pacientes

cubiertos por la revisión pueden ser suficientemente diferentes de los de tu área

– Tu medio parece ser muy diferente al del estudio

Sí ✓ No sé NoSí, el enfermo podría ser un enfermo similar a los que entran en los ensayos objeto de la revisión. En nuestro medio comienzan a aparecer centrales de llamadas que pueden dar asistencia en el manejo de las glucemias y de las posibles descompensaciones similar a las que aparecen en la revisión sistemática

9. ¿Se han considerado todos los resultados importantes para tomar la decisión?

Sí No sé No ✓No se evalúan resultados clínicamente importantes, como mortalidad, eventos cardiovasculares, ingresos hospitalarios por descompensación, molestias para los enfermos, coste del programa, etc. No se ha medido la sensación de enfermedad o su refuerzo sobre los pacientes que produce la telemedicina. No sabemos si en la intervención se produjeron errores, como hipoglucemias o ingresos por hiperglucemias. No sabemos la satisfacción global de la misma. Son resultados a corto plazo y de resultados intermedios en salud, que no deberían servir para extrapolar y llegar a algún tipo de convencimiento sobre si realmente reducirán las complicaciones agudas (cetoacidosis, ingresos, hipoglucemias) y las que aparecerán a largo plazo: mortalidad, cardiovasculares, neurológicas, amputaciones, ceguera, etc.

CUADRO 5-3 (cont.)

Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 02, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.

Page 23: Lectura crítica de estudios de tratamiento. Revisiones ...dsp.facmed.unam.mx/wp-content/uploads/2013/12/Anexo-2A.-Ruiz-V... · LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA La búsqueda

5. LECTURA CRÍTICA DE ESTUDIOS DE TRATAMIENTO. REVISIONES SISTEMÁTICAS... 85©

Els

evie

r. Fo

toco

piar

sin

aut

oriz

ació

n es

un

del

ito.

10. ¿Los beneficios merecen la pena frente a los perjuicios y costes?

Aunque no esté planteado explícitamente en la revisión, ¿qué opinas?

Sí No sé No ✓No existe un beneficio clínico relevante. Aunque hubieran mejorado de forma significativa las tensiones arteriales, probablemente el beneficio cardiovascular en forma de riesgo no se habría alterado. No hay calculadoras de riesgo cardiovascular para edades tan avanzadas, donde la edad es el factor principal de riesgo cardiovascular por sí misma. Solo se analizan variables intermedias con ausencia de más análisis de efectos secundarios por la intervención o de satisfacción por parte de los usuarios o de sus familiares

DM, diabetes mellitus; HbA1c, hemoglobina glucosilada; IC 95%, intervalo de confianza al 95%; IMC, índice de masa corporal; LDL-c, colesterol de las lipoproteínas de baja densidad; NNT, número necesario de pacientes que hay que tratar; OR, odds ratio; PAD, presión arterial diastólica; PAS, presión arterial sistólica.

Bibliografía 1. Marcolino MS, Maia JX, Alkmim MBM, Boersma E, Ribeiro AL. Telemedicine applica-

tion in the care of diabetes patients: systematic review and meta-analysis. PloS One. 2013;8(11):e79246.

2. Oxman AD, Guyatt GH. The science of reviewing research. Ann N Y Acad Sci. 1993;703:125-133. discussion 133-4.

3. Gordon D, Taddei-Peters W, Mascette A, Antman M, Kaufmann PG, Lauer MS. Pu-blication of trials funded by the National Heart, Lung, and Blood Institute. N Engl J Med. 2013;369(20):1926-1934.

4. Turner EH, Matthews AM, Linardatos E, Tell RA, Rosenthal R. Selective publication of antidepressant trials and its influence on apparent efficacy. N Engl J Med. 2008;358(3): 252-260.

5. Doshi P, Jefferson T, Del Mar C. The Imperative to Share Clinical Study Reports: Recom-mendations from the Tamiflu Experience. PLoS Med. 2012;9(4):e1001201.

6. Jefferson T, Jones MA, Doshi P, Del Mar CB, Hama R, Thompson MJ, et al. Risk of bias in industry-funded oseltamivir trials: comparison of core reports versus full clinical study reports. BMJ Open. 2014;4(9):e005253.

7. Dwan K, Altman DG, Arnaiz JA, Bloom J, Chan A-W, Cronin E, et al. Systematic Review of the Empirical Evidence of Study Publication Bias and Outcome Reporting Bias. Siegfried N, editor. PLoS ONE. 2008;3(8):e3081.

8. Higgins JPT, Green S. Cochrane Handbook for Systematic Reviews of Interventions. 2nd edition Chinchester: Wiley; 2011. p. 672.

9. Latour-Pérez J, Cabello-López JB. Early interruption of clinical trials: too good to be true? Med Intensiva. 2007;31(9):518-520.

10. Murad MH, Montori VM, Ioannidis JPA, Jaeschke R, Devereaux PJ, Prasad K, et al. How to Read a Systematic Review and Meta-analysis and Apply the Results to Patient Care: Users’ Guides to the Medical Literature. JAMA. 2014;312(2):171.

CUADRO 5-3 (cont.)

Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 02, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.

Page 24: Lectura crítica de estudios de tratamiento. Revisiones ...dsp.facmed.unam.mx/wp-content/uploads/2013/12/Anexo-2A.-Ruiz-V... · LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA La búsqueda

86 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA

11. McAlister FA, Ezekowitz J, Tonelli M, Armstrong PW. Renal insufficiency and heart failure: prognostic and therapeutic implications from a prospective cohort study. Circulation. 2004;109(8):1004-1009.

12. Shlipak MG. Pharmacotherapy for heart failure in patients with renal insufficiency. Ann Intern Med. 2003;138(11):917-924.

13. Pitt B, Zannad F, Remme WJ, Cody R, Castaigne A, Perez A, et al. The effect of spirono-lactone on morbidity and mortality in patients with severe heart failure. Randomized Aldactone Evaluation Study Investigators. N Engl J Med. 1999;341(10):709-717.

14. Juurlink DN, Mamdani MM, Lee DS, Kopp A, Austin PC, Laupacis A, et al. Rates of hyperkalemia after publication of the Randomized Aldactone Evaluation Study. N Engl J Med. 2004;351(6):543-551.

15. Bjørn M, Brendstrup C, Karlsen S, Carlsen JE. Consecutive screening and enrollment in clinical trials: the way to representative patient samples? J Card Fail. 1998;4(3):225-230. discussion 231.

16. Gurwitz JH, Col NF, Avorn J. The exclusion of the elderly and women from clinical trials in acute myocardial infarction. JAMA. 1992;268(11):1417-1422.

17. Bayer A, Tadd W. Unjustified exclusion of elderly people from studies submitted to research ethics committee for approval: descriptive study. BMJ. 2000;321(7267):992-993.

18. Bartlett C, Doyal L, Ebrahim S, Davey P, Bachmann M, Egger M, et al. The causes and effects of socio-demographic exclusions from clinical trials. Health Technol Assess Winch Engl. 2005;9(38):iii-iii10. ix-x, 1-152.

19. Jadad AR, To MJ, Emara M, Jones J. Consideration of multiple chronic diseases in rando-mized controlled trials. JAMA. 2011;306(24):2670-2672.

20. Conde Martel A. Extrapolation of results from clinical trials to heart failure patients hos-pitalized in Internal Medicine. Med Clin (Barc). 2014;142(10):463-467.

21. OMS. Informe sobre la situación mundial de las enfermedades no transmisibles 2010 [visitado el 28/10/2014]. Disponible en: http://www.who.int/nmh/publications/ncd_report2010/es/.

22. Merlo J, Broms K, Lindblad U, Björck-Linné A, Liedholm H, Ostergren PO, et al. Association of outpatient utilisation of non-steroidal anti-inflammatory drugs and hospitalised heart failure in the entire Swedish population. Eur J Clin Pharmacol. 2001;57(1):71-75.

23. Clinical advisory. carotid endarterectomy for patients with asymptomatic internal carotid artery stenosis. Stroke J Cereb Circ. 1994;25(12):2523-2524.

24. Wennberg DE, Lucas FL, Birkmeyer JD, Bredenberg CE, Fisher ES. Variation in carotid endarterectomy mortality in the Medicare population: trial hospitals, volume, and patient characteristics. JAMA. 1998;279(16):1278-1281.

25. Ruiz Garcia V, Jobanputra P, Burls A, Cabello JB, Vela Casasempere P, Bort-Marti S, et al. Certolizumab pegol (CDP870) for rheumatoid arthritis in adults. Cochrane Database Syst Rev. 2014;9:CD007649.

Cómo citar este capítulo:Ruiz V, Carbonell R, Urreta I. Lectura crítica de estudios de tratamiento. Revisiones sistemá-ticas de ensayos clínicos aleatorios. En: Cabello Juan B, editor. Lectura crítica de la evidencia clínica. Barcelona: Elsevier; 2015. p. 63-86.

Descargado de ClinicalKey.es desde Universidad Nacional Autonoma de Mexico junio 02, 2016. Para uso personal exclusivamente. No se permiten otros usos sin autorización. Copyright ©2016. Elsevier Inc. Todos los derechos reservados.