¿cómo realizar, evaluar y utilizar revisiones...

21
ARTÍCULO ESPECIAL 29 Gastroenterol Hepatol 2004;27(3):129-49 129 INTRODUCCIÓN Una de las definiciones más populares de la tan nombrada medicina basada en la evidencia es la de «la utilización consciente, explícita y juiciosa de la mejor evidencia clí- nica disponible para tomar decisiones sobre el cuidado de los pacientes». La práctica de la medicina basada en la evidencia significa, por tanto, la integración de la maes- tría clínica individual con las mejores evidencias científi- cas externas disponibles a partir de una investigación clí- nica. Aunque este último componente parece, en teoría, relativamente fácil de adquirir, en la práctica los profesio- nales sanitarios se ven desbordados por una cantidad de información imposible de manejar. Así, hoy más que nunca existen diversos motivos que ha- cen necesario gestionar correctamente el conocimiento 1 . En primer lugar, sufrimos actualmente un exceso de in- formación; se ha pasado en tan sólo unos pocos años de no disponer de fuentes de información a nadar en una so- breabundancia que nos satura y puede ser ciertamente contraproducente. Se calcula que se habrán realizado cientos de miles de ensayos clínicos aleatorizados sobre diferentes aspectos de la asistencia sanitaria desde 1948, año en el que se publicó el primero de estos estudios 2 . Y el futuro se promete imparable en cuanto a la expansión continua de la información obtenida mediante la investi- gación. A modo de ejemplo del exceso de información al que nos vemos sometidos, si introducimos el término «enfermedad de Crohn» o «Crohn’s disease» en cual- quiera de los buscadores de Internet actualmente disponi- bles (Altavista, Yahoo, Google, etc.), encontraremos más de 300.000 direcciones con información relacionada, lo que evidentemente supone una cifra desorbitada. En segundo lugar, disponemos en la actualidad de un nú- mero inagotable de fuentes 1 ; así, se publican anualmente más de 25.000 revistas y más de 10 millones de referen- cias en MEDLINE. Por ejemplo, si introducimos de nue- vo el término «Crohn’s disease» en la casilla de PubMed (el motor de búsqueda más conocido de MEDLINE), identificaremos casi 20.000 referencias bibliográficas re- lacionadas con esa enfermedad, lo que de nuevo supone una cifra realmente difícil de digerir. En este sentido, un médico que intente mantenerse al día sólo en su especiali- dad debería leer, teóricamente, más de 100 artículos com- pletos cada semana, o más de 500 el día de vuelta de sus vacaciones de verano 3 . Por otro lado, el tiempo disponible para la búsqueda de información y el estudio es cada vez más limitado. Como consecuencia de lo anterior, los co- nocimientos del médico se deterioran rápidamente tras fi- nalizar la carrera de medicina (o el programa de forma- ción continuada que posteriormente se haya llevado a cabo). Este hecho está magníficamente expresado en una figura ya clásica, donde el eje de ordenadas representa los conocimientos actualizados sobre el mejor tratamiento y el eje de abscisas, los años desde la graduación; y en di- cho gráfico se observa cómo existe lo que se ha denomi- nado una peligrosa «pendiente resbaladiza». En tercer lugar, la calidad de las diversas fuentes de infor- mación es desigual, por lo que el problema al que nos en- frentamos no es sólo el exceso de información, sino el que la calidad de la mayoría de las fuentes es deficiente 1 . Por último, los contenidos de las fuentes de información se quedan obsoletos rápidamente, lo que supone una limi- tación adicional de los sistemas actuales. Por tanto, nece- sitamos disponer de herramientas que nos permitan acce- der a la información adecuada en términos de cantidad, calidad y actualidad. Esta revisión ha sido realizada en parte gracias a la concesión de las becas del Instituto de Salud Carlos III (C03/02 y G03/090) y de la Red Temática de «Medicina basada en l’evidència: la Col·laboració Cochrane Iberoamericana» (exp. 2003/XT/00087), Departament d’Universitats, Recerca i Societat de la Informació, Generalitat de Catalunya. Correspondencia: Dr. J.P. Gisbert. Playa de Mojácar, 29. Urb. Bonanza. 28669 Boadilla del Monte. Madrid. España. Correo electrónico: [email protected] Recibido el 14-10-2003; aceptado para su publicación el 15-10-2003. ¿Cómo realizar, evaluar y utilizar revisiones sistemáticas y metaanálisis? J.P. Gisbert a,b y X. Bonfill c a Servicio de Aparato Digestivo. Hospital Universitario de La Princesa. Universidad Autónoma de Madrid. Madrid. España. b Editor del Cochrane Upper Gastrointestinal and Pancreatic Diseases Group. c Centro Cochrane Iberoamericano. Servicio de Epidemiología Clínica y Salud Pública. Hospital de la Santa Creu i Sant Pau. Universidad Autónoma de Barcelona. Barcelona. España. 62.458

Upload: others

Post on 04-Mar-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ¿Cómo realizar, evaluar y utilizar revisiones ...dsp.facmed.unam.mx/.../Gisbert-J....Rev-Sist-Gatroenterol-Hepatol-2004.pdf · tos relacionados con un tema, más que uno en profundi-dad

ARTÍCULO ESPECIAL

29 Gastroenterol Hepatol 2004;27(3):129-49 129

INTRODUCCIÓN

Una de las definiciones más populares de la tan nombradamedicina basada en la evidencia es la de «la utilizaciónconsciente, explícita y juiciosa de la mejor evidencia clí-nica disponible para tomar decisiones sobre el cuidado delos pacientes». La práctica de la medicina basada en laevidencia significa, por tanto, la integración de la maes-tría clínica individual con las mejores evidencias científi-cas externas disponibles a partir de una investigación clí-nica. Aunque este último componente parece, en teoría,relativamente fácil de adquirir, en la práctica los profesio-nales sanitarios se ven desbordados por una cantidad deinformación imposible de manejar.Así, hoy más que nunca existen diversos motivos que ha-cen necesario gestionar correctamente el conocimiento1.En primer lugar, sufrimos actualmente un exceso de in-formación; se ha pasado en tan sólo unos pocos años deno disponer de fuentes de información a nadar en una so-breabundancia que nos satura y puede ser ciertamentecontraproducente. Se calcula que se habrán realizadocientos de miles de ensayos clínicos aleatorizados sobrediferentes aspectos de la asistencia sanitaria desde 1948,año en el que se publicó el primero de estos estudios2. Yel futuro se promete imparable en cuanto a la expansióncontinua de la información obtenida mediante la investi-gación. A modo de ejemplo del exceso de información alque nos vemos sometidos, si introducimos el término

«enfermedad de Crohn» o «Crohn’s disease» en cual-quiera de los buscadores de Internet actualmente disponi-bles (Altavista, Yahoo, Google, etc.), encontraremos másde 300.000 direcciones con información relacionada, loque evidentemente supone una cifra desorbitada.En segundo lugar, disponemos en la actualidad de un nú-mero inagotable de fuentes1; así, se publican anualmentemás de 25.000 revistas y más de 10 millones de referen-cias en MEDLINE. Por ejemplo, si introducimos de nue-vo el término «Crohn’s disease» en la casilla de PubMed(el motor de búsqueda más conocido de MEDLINE),identificaremos casi 20.000 referencias bibliográficas re-lacionadas con esa enfermedad, lo que de nuevo suponeuna cifra realmente difícil de digerir. En este sentido, unmédico que intente mantenerse al día sólo en su especiali-dad debería leer, teóricamente, más de 100 artículos com-pletos cada semana, o más de 500 el día de vuelta de susvacaciones de verano3. Por otro lado, el tiempo disponiblepara la búsqueda de información y el estudio es cada vezmás limitado. Como consecuencia de lo anterior, los co-nocimientos del médico se deterioran rápidamente tras fi-nalizar la carrera de medicina (o el programa de forma-ción continuada que posteriormente se haya llevado acabo). Este hecho está magníficamente expresado en unafigura ya clásica, donde el eje de ordenadas representa losconocimientos actualizados sobre el mejor tratamiento yel eje de abscisas, los años desde la graduación; y en di-cho gráfico se observa cómo existe lo que se ha denomi-nado una peligrosa «pendiente resbaladiza».En tercer lugar, la calidad de las diversas fuentes de infor-mación es desigual, por lo que el problema al que nos en-frentamos no es sólo el exceso de información, sino elque la calidad de la mayoría de las fuentes es deficiente1.Por último, los contenidos de las fuentes de informaciónse quedan obsoletos rápidamente, lo que supone una limi-tación adicional de los sistemas actuales. Por tanto, nece-sitamos disponer de herramientas que nos permitan acce-der a la información adecuada en términos de cantidad,calidad y actualidad.

Esta revisión ha sido realizada en parte gracias a la concesión de las becasdel Instituto de Salud Carlos III (C03/02 y G03/090) y de la Red Temática de«Medicina basada en l’evidència: la Col·laboració CochraneIberoamericana» (exp. 2003/XT/00087), Departament d’Universitats,Recerca i Societat de la Informació, Generalitat de Catalunya.

Correspondencia: Dr. J.P. Gisbert.Playa de Mojácar, 29. Urb. Bonanza.28669 Boadilla del Monte. Madrid. España.Correo electrónico: [email protected]

Recibido el 14-10-2003; aceptado para su publicación el 15-10-2003.

¿Cómo realizar, evaluar y utilizar revisiones sistemáticas y metaanálisis?J.P. Gisberta,b y X. Bonfillc

aServicio de Aparato Digestivo. Hospital Universitario de La Princesa. Universidad Autónoma de Madrid. Madrid. España.bEditor del Cochrane Upper Gastrointestinal and Pancreatic Diseases Group.cCentro Cochrane Iberoamericano. Servicio de Epidemiología Clínica y Salud Pública. Hospital de la Santa Creu i Sant Pau. Universidad Autónoma deBarcelona. Barcelona. España.

62.458

129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 129

Documento descargado de http://www.elsevier.es el 28/04/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.

Page 2: ¿Cómo realizar, evaluar y utilizar revisiones ...dsp.facmed.unam.mx/.../Gisbert-J....Rev-Sist-Gatroenterol-Hepatol-2004.pdf · tos relacionados con un tema, más que uno en profundi-dad

Las revisiones nos ofrecen la posibilidad de estar informa-dos sin necesidad de invertir la enormidad de tiempo antesmencionada3. Precisamente, una de las maneras más efi-cientes de encontrar la evidencia científica a la que hace re-ferencia la medicina basada en la evidencia es buscar unarevisión sistemática de los ensayos clínicos aleatorizadossobre los efectos de la atención sanitaria. Por tanto, necesi-tamos imperiosamente revisiones sistemáticas para integrarde forma eficiente toda la información válida y proporcio-nar una base para tomar decisiones de manera racional. Lasrevisiones sistemáticas establecen cuándo los efectos de laatención sanitaria son consistentes y cuándo pueden aplicar-se los resultados de la investigación a los diferentes gruposde población. El uso de métodos explícitos y sistemáticosen las revisiones limita el sesgo (esto es, el error sistemáti-co) y reduce los efectos encontrados por azar, de modo queproporciona resultados más fiables sobre los cuales sacarconclusiones y tomar decisiones. El metaanálisis, es decir,el uso de los métodos estadísticos para resumir los resulta-dos de estudios independientes entre sí, puede proporcionarestimaciones más precisas sobre los efectos de la atención sanitaria que las derivadas de los estudios individuales in-cluidos en una revisión.El presente trabajo versará sobre cómo realizar, evaluar yutilizar revisiones sistemáticas y metaanálisis, en concre-to de ensayos clínicos aleatorizados (randomised contro-lled trials), ya que éstos tienen mayores posibilidades deproporcionar información más fiable que otras fuentes deevidencia sobre los efectos diferenciales de las distintasopciones de atención en salud. A lo largo de ese artículose citarán numerosos ejemplos prácticos, con la intenciónde hacer más ameno y didáctico el enfoque de cada unode los aspectos de las revisiones sistemáticas.

DEFINICIÓN DE REVISIÓN SISTEMÁTICA

Las revisiones sistemáticas son investigaciones científicasen sí mismas, con métodos prefigurados y un ensamblajede los estudios originales, que sintetizan los resultados deéstos. Las características básicas que mejor definen a unarevisión sistemática se podrían resumir en las siguientes:a) son síntesis y análisis de la información con un enfo-que práctico; b) se basan en la mejor evidencia científicadisponible; c) formulan preguntas claramente definidas, yd) utilizan métodos sistemáticos y explícitos para identifi-car y seleccionar estudios, evaluar éstos críticamente, ex-traer los datos de interés y analizarlos.Consecuentemente, las revisiones sistemáticas pretendenser: a) rigurosas, en cuanto a los estudios incluidos (concriterios de calidad, etc.); b) informativas, esto es, enfoca-das hacia problemas reales, tratando de contestar una pre-gunta claramente delimitada o específica, e idealmenteanalizando y presentando los datos de la forma que mejorayude a la toma de decisiones; c) exhaustivas: su objetivoes identificar y utilizar la mayor cantidad posible de in-formación pertinente, sin introducir sesgos (de publica-ción, de selección, etc.), y d) explícitas, ya que todos losmétodos utilizados en la revisión deben describirse consuficiente detalle.

REVISIONES SISTEMÁTICAS FRENTE A NO SISTEMÁTICASLlegados a este punto, cabría preguntarse: ¿es que no sehan empleado desde siempre este tipo de revisiones «sis-temáticas»?, ¿es esto de las revisiones «sistemáticas»algo realmente novedoso? Tradicionalmente se ha reali-zado un tipo de revisiones que podríamos denominar «na-rrativas». El inconveniente de este tipo de revisiones esque utilizan métodos «informales», no explícitos, y a me-nudo personales y subjetivos3. En consecuencia, los lec-tores de una revisión narrativa encararán 2 problemas:primero, los autores no especifican el proceso que han seguido para buscar, reunir y evaluar la información queles ha llevado a ofrecernos sus conclusiones, y en segun-do lugar, y ante la ausencia de dicha información, no se-rán capaces de repetir y verificar los resultados y las con-clusiones de la revisión3.En resumen, los principales defectos de las revisiones tra-dicionales o narrativas son la dependencia de la subjetivi-dad del revisor y la falta de explicitación de los métodosde búsqueda y selección de las fuentes4. Las limitacionesantes mencionadas están magníficamente expresadas enla frase de D. Sackett, al referirse a las revisiones narrati-vas: «Creo que la razón de esta deficiencia en las revisio-nes se debe a la tradición de llamar a un experto en eltema para hacer la revisión… Esos autores comienzan suapartado de objetivos con una conclusión… Desafortuna-damente los resultados están ya anunciados». Además, la-mentablemente, la calidad de la mayoría de la revisionesmédicas tradicionales deja mucho que desear, debido aque las labores de recogida, análisis y publicación de losresultados no se realizan con el mismo cuidado y detalleque cuando se trata de un trabajo de investigación origi-nal. Esta falta de método lleva a la tendencia a extraerconclusiones que, en el mejor de los casos, están sesgadasy, en el peor de los casos, son erróneas2.En contraposición, como se ha señalado anteriormente,las revisiones sistemáticas emplean métodos explícitos ysistemáticos que limitan el sesgo, y de este modo propor-cionan resultados más fiables5,6. Como se deduce de sunombre, las revisiones sistemáticas, no satisfechas conaveriguar parte de la verdad, buscan «toda la verdad», esdecir, recogen y ensamblan todas las evidencias de cali-dad disponibles sobre una cuestión clínica en concreto.Además, esta forma de revisión da al lector una importan-te ventaja sobre otras revisiones: la posibilidad de repro-ducirla y verificar si se llega a la misma conclusión3.Otra diferencia importante es que las revisiones sistemáti-cas se generan para responder en profundidad a cuestio-nes clínicas generalmente muy concretas y específicas.Estas cuestiones pueden y deben formularse con precisión(véase más adelante el apartado «Componentes clave deuna pregunta»). Si la pregunta que trata la revisión noestá clara en su enunciado, en el resumen o en la intro-ducción, o si no se incluye un apartado de «Métodos», lomás probable es que el artículo sea una revisión narrativa,no sistemática.En contraposición, la mayor parte de los artículos de revi-sión de tipo narrativo abarcan un amplio abanico de asun-

130 Gastroenterol Hepatol 2004;27(3):129-49 30

GISBERT JP, ET AL. ¿CÓMO REALIZAR, EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS?

129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 130

Documento descargado de http://www.elsevier.es el 28/04/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.

Page 3: ¿Cómo realizar, evaluar y utilizar revisiones ...dsp.facmed.unam.mx/.../Gisbert-J....Rev-Sist-Gatroenterol-Hepatol-2004.pdf · tos relacionados con un tema, más que uno en profundi-dad

tos relacionados con un tema, más que uno en profundi-dad. Por ejemplo, una revisión narrativa sobre la pancrea-titis aguda, como la que puede encontrarse en el capítulode un libro de texto, incluiría apartados sobre anatomíadel páncreas, fisiopatología de la función pancreática, clí-nica, diagnóstico, complicaciones y tratamiento. Por lotanto, las revisiones narrativas pueden ser más útiles paraadquirir una perspectiva amplia sobre un tema, pero no loson tanto para obtener respuestas concretas y mensurablesante cuestiones clínicas específicas. En este sentido, unejemplo de una revisión sistemática de la ColaboraciónCochrane relacionada con este tema plantea concretamen-te la pregunta de si la nutrición parenteral total, en com-paración con la nutrición enteral, disminuye la mortali-dad, la morbilidad o la estancia hospitalaria en lospacientes con pancreatitis aguda.Por último, las recomendaciones halladas en las revisio-nes narrativas publicadas en las revistas y los libros detexto suelen diferir de las que se encuentran en las revi-siones sistemáticas7. Así, las revisiones narrativas, porejemplo, pueden retrasar más de una década la recomen-dación de un nuevo tratamiento de probada eficacia ocontinuar defendiendo un tratamiento mucho tiempo des-pués de que se haya demostrado su escasa eficacia o in-cluso su potencial iatrogénico. Asimismo, las revisionessistemáticas que incorporan técnicas cuantitativas puedendetectar mejor que las revisiones narrativas pequeños,aunque significativos, efectos del tratamiento.En resumen, se podría concluir que, de entre las múltiplesdiferencias que existen entre las revisiones narrativas ylas sistemáticas –resumidas en la tabla I–, destaca que las

primeras están basadas frecuentemente en opiniones (ade-más de, por supuesto, en algunos datos objetivos), mien-tras que las revisiones sistemáticas están basadas funda-mentalmente en pruebas8.

DEFINICIÓN DE METAANÁLISIS

El término «metaanálisis» fue introducido por Glass en1976 (es decir, hace relativamente poco tiempo), que lodefinía en los siguientes términos: «un análisis estadísticode una amplia serie de análisis de resultados de estudiosindividuales con el objetivo de integrar sus hallazgos»4.De entre las múltiples definiciones que se han propuestoposteriormente, una de las más difundidas quizá sea la deJenicek: «Una integración estructurada, con una revisióncualitativa y cuantitativa, de los resultados de diversos es-tudios independientes acerca de un mismo tema»4.Aunque a veces se utilicen indistintamente los 2 términos,revisión sistemática no es igual a metaanálisis3. La primeraes el proceso que nos lleva a obtener los estudios cuyos re-sultados pueden combinarse –o no– matemáticamente parapoder ofrecer conclusiones. Cuando los resultados de los es-tudios primarios se resumen pero no se combinan con méto-dos estadísticos, el resultado puede denominarse revisiónsistemática «cualitativa». Así, el método matemático llama-do metaanálisis (que daría como resultado una revisión siste-mática «cuantitativa») es sólo una parte, aunque muy impor-tante, de la revisión sistemática. Dicho de otro modo, unmetaanálisis es la combinación estadística de al menos 2 es-tudios para obtener una estimación o suma única del efectode la intervención en salud que estamos evaluando.

EVOLUCIÓN DE LAS REVISIONES SISTEMÁTICAS Y LOS METAANÁLISIS

Las revisiones sistemáticas en general, y los metaanálisisen particular, han experimentado en la última década uncrecimiento exponencial que se ha calificado de «epide-mia de metaanálisis». Baste el dato de que durante el pe-ríodo 1981-1986 se encontraron sólo 21 referencias conese encabezamiento en MEDLINE, mientras que una dé-cada después (período 1991-1996) esta cifra había au-mentado hasta 1.4594. En el año 2003, una búsqueda enesta base de datos que incluyera como descriptor o pala-bra clave el término «meta-analysis» recuperó nada me-nos que 14.000 referencias bibliográficas. La aplicacióndel metaanálisis se ha generalizado, habiéndose empleadoen la mayoría de las especialidades, por no decir en todas.En aparato digestivo, por ejemplo, no se había publicadoningún metaanálisis hasta el año 1986; entre los años1987 y 1991 se publicaron tan sólo 15, y esta cifra ascen-dió hasta 65 en el período 1992-19989. Además, dentro delas diversas especialidades, las técnicas metaanalíticas sehan utilizado en casi todas las áreas temáticas. A modo deejemplo, hasta el año 2003 se llevan publicados aproxi-madamente 130 metaanálisis relacionados con la infec-ción por Helicobacter pylori, una bacteria que se descu-brió hace relativamente poco tiempo.

31 Gastroenterol Hepatol 2004;27(3):129-49 131

GISBERT JP, ET AL. ¿CÓMO REALIZAR, EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS?

TABLA I. Revisiones sistemáticas frente a revisionesnarrativas

Característica Revisión narrativa Revisión sistemática

Pregunta de Con frecuencia amplia y Clara, concreta, investigación poco definida centrada en una

cuestión clínica biendefinida

Fuentes de No especificada. No Estrategia de búsqueda información dirigida a localizar sistemática y y revisión todos los estudios. Alta explícita de todas las de la probabilidad de sesgo fuentes y artículos bibliografía potencialmente

relevantesSelección de Generalmente sin criterios Descripción explícita de

estudios de selección. Alta criterios de selección. probabilidad de sesgo Selección aplicada de

manera uniformeCalidad de los Generalmente no evaluada Evaluación crítica de la

estudios calidad metodológicade los estudiosrevisados

Síntesis Resumen subjetivo, Basada en la calidad de datos generalmente cualitativo, metodológica de

sin un estimador los estudios, a estadístico menudo resumida

(cuantificada) por unestimador estadístico

Interpretación En ocasiones basada en la Generalmente basada en evidencia, pero con la evidencia frecuencia basada en científica, conlos estudios que se han identificación de las seleccionado lagunas de subjetivamente y en conocimiento que opiniones personales persisten

129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 131

Documento descargado de http://www.elsevier.es el 28/04/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.

Page 4: ¿Cómo realizar, evaluar y utilizar revisiones ...dsp.facmed.unam.mx/.../Gisbert-J....Rev-Sist-Gatroenterol-Hepatol-2004.pdf · tos relacionados con un tema, más que uno en profundi-dad

Las causas más probables de esta eclosión son fundamen-talmente 2: en primer lugar, el aumento de informaciónacaecido a partir de 1940, reflejado en el incremento delnúmero de revistas biomédicas, que pasó de 2.300 a másde 25.000, con más de 9 millones de artículos publicadospor año10; y en segundo lugar, el auge del movimiento de-nominado «medicina basada en la evidencia», que, basán-dose precisamente en la revisión sistemática de los trabajosrealizados en diversas áreas, busca dotar a la práctica de lamedicina de los argumentos más objetivos posibles10.Esta «fiebre de metaanálisis» ha suscitado vivas polémi-cas entre diversos autores, con posturas encontradas entrelos que afirman que «cualquiera que se inicie en una nue-va área de investigación, solicite una beca o realice su te-sis doctoral debería antes realizar un metaanálisis deltema, con el objeto de establecer lo que ya se conoce…»y los más heterodoxos, que manifiestan todo lo contrario:«prefiero fiarme de un buen estudio individual que de unmetaanálisis»4.

REVISIONES SISTEMÁTICAS, METAANÁLISIS Y GRADO DE EVIDENCIA CIENTÍFICA

Para evaluar el grado de evidencia científica existen di-versas escalas que puntúan la calidad de la informaciónen función del tipo de estudio que la soporta. Una de lasmás utilizadas es la propuesta por los National Institutesof Health de EE.UU., que se emplea para graduar las re-comendaciones en las guías de práctica clínica basadas enla evidencia y en la que las revisiones sistemáticas y losmetaanálisis ocupan una posición privilegiada4.

REVISIONES SISTEMÁTICAS Y METAANÁLISIS DE ENSAYOS CLÍNICOS

Archie Cochrane señalaba no hace mucho la necesidad deun mayor número de revisiones de conjunto sistemáticascuando escribió: «Seguramente es una crítica grave anuestra profesión el que no hayamos organizado un re-sumen crítico, por especialidades o subespecialidades,adaptado periódicamente, de todos los ensayos clínicosde asignación aleatoria relevantes»8. Precisamente, la res-puesta a ese desafío la constituyen las revisiones llevadasa cabo por la Colaboración que lleva su nombre, una or-ganización internacional sin ánimo de lucro que intentaayudar a tomar decisiones clínicas y sanitarias bien fun-damentadas preparando, manteniendo y divulgando revi-siones sistemáticas sobre los efectos de la atención sanita-ria. Las revisiones Cochrane tienen un formato estándar,perfectamente definido, que debe constar de los siguien-tes apartados (tabla II): un resumen en un formato estruc-turado; el texto de la revisión, que consta de una introduc-ción (antecedentes y objetivos), materiales (criterios deselección y estrategia de búsqueda), métodos, resultados(descripción de los estudios, calidad metodológica y re-sultados propiamente dichos), discusión y conclusionesde los revisores. Además, incorpora tablas y figuras es-tándar para mostrar las características de los estudios in-cluidos, la especificación de las intervenciones que se hancomparado, los resultados propiamente dichos y una listade los estudios que se han excluido. El programa ReviewManager (RevMan) está diseñado para ayudar a los revi-sores a construir las revisiones según el formato estructu-rado descrito y se puede adquirir gratuitamente en la webde la Colaboración Cochrane (www.Cochrane-net.org/revman).

PASOS NECESARIOS PARA REALIZAR, EVALUAR Y UTILIZAR UNA REVISIÓN SISTEMÁTICA

En la tabla III se resumen los pasos necesarios para pre-parar correctamente una revisión sistemática. La mayoríade lo que se expondrá en este apartado está basado en el«Manual de revisores» de la Colaboración Cochrane (ver-sión española de «Cochrane reviewers’ handbook» delCentro Cochrane Iberoamericano)11,12, texto de obligadaconsulta para todo aquel que quiera embarcarse, sin mie-do al naufragio, en la preparación de una revisión siste-mática. Las referencias bibliográficas utilizadas en este

132 Gastroenterol Hepatol 2004;27(3):129-49 32

GISBERT JP, ET AL. ¿CÓMO REALIZAR, EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS?

TABLA II. Esquema de una revisión Cochrane

CarátulaTítuloRevisoresFuentes de apoyoQué contenido es nuevo

Texto de la revisiónSinopsisResumenAntecedentesObjetivosCriterios para la selección de los estudios de esta revisión

Tipos de estudiosTipos de participantesTipos de intervencionesTipos de medidas de resultado (outcomes)

Estrategia de búsqueda para la identificación de los estudiosMétodos de revisiónDescripción de los estudiosCalidad metodológicaResultadosDiscusiónConclusiones de los revisores

Implicaciones para la prácticaImplicaciones para la investigación

AgradecimientosConflictos de interés

ReferenciasReferencias de los estudios

Estudios incluidosEstudios excluidosEstudios pendientes de evaluaciónEstudios en curso

Otras referenciasReferencias adicionalesOtras versiones publicadas de esta revisión

Tablas y figurasCaracterísticas de los estudios incluidosCaracterísticas de los estudios excluidosCaracterísticas de los estudios en cursoComparaciones, datos y gráficosTablas adicionales

TABLA III. Pasos para la preparación de una revisiónsistemática

1. Formulación del problema2. Localización y selección de los estudios3. Evaluación de la calidad de los estudios4. Extracción de datos. Metaanálisis5. Análisis y presentación de los resultados6. Interpretación de los resultados

129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 132

Documento descargado de http://www.elsevier.es el 28/04/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.

Page 5: ¿Cómo realizar, evaluar y utilizar revisiones ...dsp.facmed.unam.mx/.../Gisbert-J....Rev-Sist-Gatroenterol-Hepatol-2004.pdf · tos relacionados con un tema, más que uno en profundi-dad

artículo de revisión podrían ser innumerables; puesto quegran parte de éstas se encuentran recogidas en el «Manualde revisores», en este manuscrito citaremos únicamentealgunas de las más relevantes, remitiendo al lector intere-sado por un detalle bibliográfico más exhaustivo a la con-sulta del citado manual.

Primer paso: formulación del problema

Justificación de las preguntas bien formuladas

Las preguntas mal enfocadas conducen a decisiones pococlaras acerca de qué estudios conviene incluir en la revi-sión y cómo resumir sus datos. Así, una pregunta confusaconduce, con mucha probabilidad, a una respuesta tam-bién confusa, hecho que está magistralmente expresadoen la afirmación de Counsell13: «Ask a poor question andyou’ll get a poor review». Desde la perspectiva del lector,si el principal problema que aborda la revisión no estáclaro a partir del título o del resumen, probablemente nomerece la pena perder el tiempo leyendo el artículo de re-visión en su totalidad8. El desarrollo de un objetivo prin-cipal claramente definido a priori ayuda a luchar contralas denominadas «expediciones de pesca»3; éstas se orga-nizan cuando la pregunta principal es confusa y se optapor unir hallazgos atrayentes entre todos los estudios,hasta que finalmente alguna combinación de datos ofreceun resultado positivo. Al igual que en cualquier proyectode investigación, la primera y más importante decisión ala hora de preparar una revisión es determinar su enfoque,lo que se consigue planteando preguntas claramente deli-mitadas. Dichas preguntas y los objetivos de una revisiónsirven también a los lectores para valorar inicialmente surelevancia. Así, los lectores pueden utilizar las preguntasy los objetivos planteados para juzgar si la revisión lespuede resultar de interés y si es pertinente para las cues-tiones que ellos se plantean.

Componentes clave de una pregunta

Existen varios componentes clave que son necesariospara formular correctamente una pregunta y que debenespecificarse en la sección «Criterios de selección de losestudios» de la revisión. Una pregunta claramente defini-da debe especificar el tipo de personas (participantes), eltipo de intervenciones y el tipo de resultados que son deinterés para la revisión. A modo de ejemplo, una preguntacorrectamente planteada sería: «En la población asinto-mática de más de 50 años (los participantes), ¿el cribadocon colonoscopia (la intervención) se asocia con una re-ducción de la mortalidad debida al cáncer de colon (el re-sultado)?».Con respecto al tipo de participantes, resulta de utilidadconsiderar en 2 fases el tipo de personas que son objetode interés para la revisión. En primer lugar, hay que defi-nir las enfermedades o condiciones que pretendemos eva-luar, debiéndose establecer criterios que sean suficiente-mente explícitos para estas definiciones. En segundolugar, hay que identificar a la población y el ámbito de in-

terés. Esto implica tener que decidir si se está interesadoen un grupo específico de la población, en función de fac-tores como la edad, el sexo, la etnia, etc. Cualquier res-tricción basada en características específicas de la pobla-ción o del ámbito de estudio debe estar justificada porevidencia ya reconocida. Por ejemplo, enfocar una revi-sión sobre la efectividad del cribado (screening) del cán-cer de colon mediante colonoscopia dirigida únicamente aindividuos mayores de 50 años de edad parece estar justi-ficado por diversas razones, entre las que destaca que laincidencia de este tipo de cáncer en individuos menoresde 50 años es muy baja.El segundo componente clave de una pregunta bien for-mulada es especificar las intervenciones que son de inte-rés. También es importante definir las intervenciones conlas que éstas se compararán, es decir, el tipo de grupocontrol que es aceptable para la revisión. Así, debe consi-derarse con detenimiento si las personas en el grupo con-trol pueden estar recibiendo otras intervenciones (y cuá-les) distintas del placebo.El tercer componente clave de una pregunta bien formu-lada es la especificación –con criterios explícitos– deaquellos resultados concretos que sean de interés. Los re-visores deben evitar abrumar a los lectores con datos quetienen poca o ninguna trascendencia pero, al mismo tiem-po, han de tener cuidado en no omitir datos importantes.Un componente adicional al plantear una pregunta es eltipo de diseño de los estudios, pues algunos resultan su-periores a otros para tratar de responder a determinadascuestiones. Muchos autores consideran que los ensayosclínicos controlados y aleatorizados son una condiciónsine qua non para tratar asuntos referentes a la eficacia te-rapéutica. Ya que las revisiones Cochrane plantean cues-tiones acerca de los efectos de la atención sanitaria, éstasse centran principalmente en ensayos clínicos aleatoriza-dos. Existen 2 razones fundamentales por las que se debeser cauteloso a la hora de incluir estudios no aleatorizadosen una revisión sobre los efectos de la atención sanitaria,ambos relacionados con los sesgos. En primer lugar, laaleatorización es el único modo de controlar aquellos queno se conocen o no están cuantificados14. Datos empíricosindican que, por lo general, los estudios no aleatorizadostienden a sobreestimar los efectos de las intervencionessanitarias. A pesar de las consideraciones anteriores, a ve-ces resulta apropiado realizar una revisión sistemática delos estudios no aleatorizados sobre los efectos de un de-terminado tratamiento. Por ejemplo, en ocasiones el cursode una enfermedad es tan uniforme o los efectos de unaintervención son tan evidentes que resulta innecesario, eincluso dudosamente ético, realizar un ensayo clínico alea-torizado. Por último, otros aspectos relevantes acerca deldiseño de los estudios que merecen considerarse desde elinicio son si se revisarán únicamente los estudios que tie-nen un seguimiento de una cierta duración. No obstante,es preciso tener en cuenta que cuanto más restrictivossean los criterios exigidos acerca del diseño de los estu-dios para responder a la pregunta planteada, menos pro-babilidades habrá de encontrar datos que respondan deforma específica a preguntas tan restringidas.

33 Gastroenterol Hepatol 2004;27(3):129-49 133

GISBERT JP, ET AL. ¿CÓMO REALIZAR, EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS?

129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 133

Documento descargado de http://www.elsevier.es el 28/04/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.

Page 6: ¿Cómo realizar, evaluar y utilizar revisiones ...dsp.facmed.unam.mx/.../Gisbert-J....Rev-Sist-Gatroenterol-Hepatol-2004.pdf · tos relacionados con un tema, más que uno en profundi-dad

Identificación y selección de los estudios mediante los componentes clave de la pregunta

Una vez que se ha planteado correctamente una pregunta,deberían determinarse qué componentes clave se tendránen cuenta para definir la estrategia de búsqueda inicial15.Para las revisiones Cochrane, la búsqueda de estudios seve enormemente facilitada por la existencia de los regis-tros especializados de ensayos clínicos elaborados por losGrupos Colaboradores de Revisión. Las búsquedas querequieran de la presencia simultánea de varios de loscomponentes de la pregunta –o bien de formulacionesmuy específicas de ciertos componentes– suelen ser de-masiado específicas y tienden a pasar por alto informa-ción relevante. Por ejemplo, si uno busca estudios queaborden los efectos a largo plazo de la erradicación de H. pylori sobre la prevención de la recidiva ulcerosa duo-denal y lo hace buscando los que están indexados me-diante los términos «Helicobacter pylori», «tratamientoerradicador», «úlcera duodenal», «prevención», «recidivaulcerosa» y «largo plazo», es probable que no se identifi-quen estudios que pueden ser relevantes. Por otro lado, sisólo se emplean los términos «Helicobacter pylori» y«recidiva ulcerosa» en la búsqueda, se identificarán cien-tos de artículos irrelevantes. En general, los componentesclave que resultan de utilidad cuando se realiza una bús-queda incluyen la condición o enfermedad de interés y laintervención o exposición que se está evaluando. Aunquese pueda estar específicamente interesado en un ámbitodeterminado, los estudios no suelen estar indexados se-gún esta variable dentro de las bases de datos electróni-cas. Además, los estudios pueden evaluar múltiples resul-tados, algunos de los cuales pueden ser relevantes para larevisión, pero es posible que no formen parte de la inde-xación del artículo.

Amplitud de las preguntas

El alcance de las preguntas que aborda una revisión pue-de ser amplio o restringido. Por ejemplo, un revisor po-dría plantear una pregunta amplia al considerar si los ami-nosalicilatos son eficaces en la prevención de la recidivade la enfermedad inflamatoria intestinal crónica (en gene-ral, sin particularizar a ninguna subpoblación de pacien-tes). Por el contrario, otro revisor podría preguntarse siestos fármacos son efectivos para reducir el riesgo de re-cidiva únicamente en los pacientes con enfermedad deCrohn que han sido sometidos a cirugía de resección in-testinal. Son varias las ventajas y desventajas que se deri-van del hecho de formular preguntas amplias o restringi-das. Las revisiones enfocadas de manera restringida quizáno sean generalizables a entornos diversos, a distintas po-blaciones o a formas alternativas de una misma interven-ción. Además, un enfoque restringido comporta un eleva-do riesgo de conclusiones sesgadas cuando el revisorconoce la bibliografía sobre un determinado tema y res-tringe los criterios de inclusión de tal manera que quedenexcluidos algunos o varios estudios con resultados queestén en conflicto con la postura que defiende. Por su par-

te, la validez de las revisiones definidas en términos muyamplios puede no ser apropiada cuando existe evidenciasólida que induce a pensar que las diversas definicionesde la condición de interés se asocian con efectos de la in-tervención que son marcadamente diferentes.

Modificación de la pregunta

La pregunta debe plantearse en el protocolo antes de ini-ciar la revisión completa, pero no debe convertirse en una«camisa de fuerza» que impida la exploración de aspectosinesperados. Aunque es de esperar que se obtenga unacierta fluidez y refinamiento al formular las preguntas derevisión conforme se va adquiriendo una mayor compren-sión del problema, es importante protegerse del riesgo desesgo al modificarlas. Las preguntas a posteriori son másproclives al sesgo que aquellas que han sido formuladaspreviamente, y las preguntas modificadas por los propiosdatos pueden generar conclusiones falsas basadas en re-sultados espurios. Por tanto, en todo caso, debe documen-tarse y justificarse cualquier cambio que sufra el protoco-lo derivado de la modificación de la pregunta inicial derevisión.

Segundo paso: localización y selección de los estudios

Como se ha mencionado previamente, que la búsqueda delos estudios sea exhaustiva y no sesgada es una de las di-ferencias clave entre las revisiones sistemáticas y las tra-dicionales. Si bien las bases de datos electrónicas, comoMEDLINE, son potentes herramientas para la localiza-ción de estudios, sólo pueden identificar entre un 30 y un80% de todos los ensayos clínicos controlados aleatori-zados que se han publicado. Por una parte, esta base dedatos no incluye la totalidad de la bibliografía médica pu-blicada y, por otra, algunos estudios nunca llegan a publi-carse. Las referencias de estudios escritos en lengua noinglesa tienen una baja representación en MEDLINE, porlo que si se utiliza esta base de datos para identificar estu-dios la revisión puede estar afectada potencialmente porun sesgo de publicación, que se origina cuando lo que sepublica no es representativo de lo que se investiga16-18.Desde otra perspectiva, el sesgo de publicación puede de-berse a la tendencia existente entre autores, revisores yeditores de revistas a permitir que la dirección y la signi-ficación estadística de los resultados de la investigacióninfluyan en las decisiones de enviar y aceptar para publi-cación los resultados de la investigación, al seleccionarseprioritariamente estudios con resultados positivos. Aun-que en un principio se pensó que las revistas médicas po-dían ser las responsables fundamentales de este tipo desesgo, ya que tenderían a publicar únicamente estudioscon resultados significativos, en la actualidad, y a partirde las entrevistas efectuadas directamente con investiga-dores, se sabe que los principales responsables son lospropios autores al considerar que, si no hay resultadossignificativos, los estudios no son interesantes para su pu-

134 Gastroenterol Hepatol 2004;27(3):129-49 34

GISBERT JP, ET AL. ¿CÓMO REALIZAR, EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS?

129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 134

Documento descargado de http://www.elsevier.es el 28/04/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.

Page 7: ¿Cómo realizar, evaluar y utilizar revisiones ...dsp.facmed.unam.mx/.../Gisbert-J....Rev-Sist-Gatroenterol-Hepatol-2004.pdf · tos relacionados con un tema, más que uno en profundi-dad

blicación4. En el sesgo de publicación intervienen diver-sos factores: además de que los trabajos con resultadosestadísticamente significativos tienen mayor probabilidadde ser publicados que los que no arrojan diferencias, unavez aceptados se publican más rápidamente, lo hacen enrevistas de más impacto y son citados con más fre-cuencia10.Para evitar estos sesgos y asegurar que, en la medida delo posible, todos los datos relevantes sean incluidos enuna revisión, es necesario utilizar varias fuentes de infor-mación para identificar los estudios. Debe también te-nerse en cuenta la posibilidad de que haya un sesgo de referencias (una tendencia a citar preferentemente los estudios que apoyan el propio punto de vista) y evitarlomediante el empleo de múltiples estrategias de búsqueda.Posibles fuentes de información para la localización deestudios incluyen4: a) bases de datos bibliográficas com-putarizadas de estudios publicados en revistas indexadas(MEDLINE, EMBASE, Excerpta Medica, Índice MédicoEspañol, Cochrane Library); b) artículos de revisión ymetaanálisis; c) artículos originales (publicaciones preli-minares o completas) en publicaciones primarias; d) pu-blicaciones secundarias: resúmenes de artículos publica-dos en otras revistas como originales (Evidence BasedMedicine, ACP Journal Club, etc.); e) resúmenes de con-gresos; f) tesis doctorales (registro de publicaciones de fa-cultades); g) libros de texto sobre el tema; h) contactospersonales con expertos, sociedades científicas, grupos detrabajo, etc.; i) agencias financiadoras (FIS, CICYT, fun-daciones, etc.); j) registros de ensayos clínicos (Ministe-rio de Sanidad, Colaboración Cochrane, registros mo-nográficos, entre otros); k) industria farmacéutica, y l)búsquedas manuales a partir de las citas bibliográficas delos artículos originales. A continuación se revisan conmás detalle las fuentes de información más relevantespara la localización de los estudios.

Registros especializados de la Colaboración Cochrane

La principal fuente de estudios para las revisiones Coch-rane es el registro especializado de los Grupos Colabo-radores de Revisión. Al desarrollar una estrategia de búsqueda es importante consultar al coordinador de Bús-queda de Ensayos o al coordinador del grupo de revisióndel Grupo de Colaboradores de Revisión para evitar laduplicación innecesaria de esfuerzos y garantizar que seestá haciendo un uso eficiente de otras bases de datos adi-cionales.

Control de las listas de referencia

Los revisores deben controlar las listas de referencias detodos los artículos relevantes que hayan identificado. Engeneral, éste es un medio eficiente, aunque lento, de iden-tificar estudios. Algunas de las fuentes de referencia deensayos más obvias y convenientes son las revisiones yaexistentes. La Cochrane Library incluye la Base de Datosde Resúmenes de Revisiones de Efectividad (Database ofAbstracts of Reviews of Effectiveness-DARE), producida

por el NHS Centre for Reviews and Dissemination(CRD) en York (Reino Unido). MEDLINE, EMBASE yotras bases de datos bibliográficas también pueden usarsepara identificar artículos de revisión (en MEDLINE, porejemplo, los artículos de revisión aparecen indexadoscomo «Review» en el campo «Publication type»).

Comunicación personal

Los colegas pueden ser una importante fuente de infor-mación de ensayos recientes que todavía no se han publi-cado o de ensayos inéditos más antiguos. A veces estoscanales informales de comunicación pueden ser los úni-cos medios para identificar datos no publicados. La «lite-ratura gris u opaca» (grey literature), compuesta por in-formes técnicos, actas de congresos y tesis doctorales,entre otros, también puede resultar útil, ya que muchosestudios referenciados de esta manera no son publicadosen su totalidad2,19.

Bases de datos electrónicas

Desde octubre de 1996, la Colaboración Cochrane ha ve-nido desarrollando su propio registro de estudios, deno-minado «CENTRAL». Este registro incluye principal-mente referencias de los ensayos clínicos controlados enatención sanitaria, aportadas por grupos de revisión yotras entidades que han identificado los ensayos a travésde diversos mecanismos de búsqueda. Por su parte, IndexMedicus y Excerpta Medica son repertorios de revistas deciencias de la salud que están accesibles en formato elec-trónico bajo la denominación de MEDLINE y EMBASE,respectivamente. Estas bases de datos referenciales pue-den ser interrogadas mediante descriptores temáticos(subject terms) asignados por indexadores contratadospor las empresas productoras. Esta sencilla estrategia debúsqueda funciona bien si el objetivo es recuperar algúnbuen artículo sobre un tema o simplemente identificar unartículo específico. Sin embargo, cuando se realiza unarevisión sistemática debe considerarse con cierto escepti-cismo la precisión con la que se aplican los descriptores alas referencias, dado que los autores quizá no describanbien sus métodos u objetivos; además, los indexadores nosiempre son expertos en el área temática del artículo queestán indexando. Por otra parte, ninguna de las bases dedatos mencionadas cubre todas las revistas. Así, se ha cal-culado que el solapamiento entre MEDLINE y EMBASEes de tan sólo un tercio aproximadamente, por lo que unabúsqueda más exhaustiva requiere que se interroguen,como mínimo, ambas bases de datos.

Publicaciones secundarias

Las publicaciones secundarias seleccionan estudios origi-nales con la exigencia de que sean metodológicamentecorrectos y además clínicamente relevantes. Presentan un resumen estructurado de dichos estudios, junto con unbreve comentario de un experto que aporta una perspecti-va clínica a los resultados. Entre las publicaciones secun-

35 Gastroenterol Hepatol 2004;27(3):129-49 135

GISBERT JP, ET AL. ¿CÓMO REALIZAR, EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS?

129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 135

Documento descargado de http://www.elsevier.es el 28/04/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.

Page 8: ¿Cómo realizar, evaluar y utilizar revisiones ...dsp.facmed.unam.mx/.../Gisbert-J....Rev-Sist-Gatroenterol-Hepatol-2004.pdf · tos relacionados con un tema, más que uno en profundi-dad

darias se encuentran el ACP Journal Club (http://www.acpjc.org/) y el EBM online (http://ebm.bmjjournals.com/). Estas 2 publicaciones se encuentran reunidas enformato CD-ROM bajo el título Best Evidence. Algunasespecialidades disponen de publicaciones secundarias es-pecíficas, como es el caso de Evidence-Based Gastroen-terology (www.evidence-based-gastro.com/) en la espe-cialidad de aparato digestivo.

Desarrollo de una estrategia de búsqueda

Debe describirse el proceso mediante el que se seleccio-nan los estudios para su inclusión en una revisión, es de-cir, debe explicitarse la estrategia de búsqueda. La prime-ra etapa de revisión de los resultados de una búsquedaelectrónica implica la evaluación detallada de los títulos yresúmenes para determinar si cada artículo reúne los re-quisitos predeterminados para ser escogido. Si al exami-nar la información disponible se puede determinar que unartículo no cumple los criterios de inclusión, éste puederechazarse. Si, a criterio del revisor, el título o el resumendel artículo ofrecen dudas que impiden rechazarlo defini-tivamente, debería obtenerse el texto completo del artícu-lo. La revisión del texto completo puede llevar, finalmen-te, a la exclusión del estudio porque no reúna losrequisitos de inclusión. En cada etapa del proceso de se-lección es preferible errar por exceso que por defecto, yaque una vez que un estudio ha quedado excluido del pro-ceso de selección es improbable que se vuelva a conside-rar su inclusión. Debido a la importancia que tienen estasdecisiones, es aconsejable que más de un revisor examinecada registro obtenido antes de que sea rechazado.Aumentar la exhaustividad en una búsqueda implica re-ducir su precisión e identificar más artículos no relevan-tes. Aunque es importante que la búsqueda sea lo máscompleta posible, siempre es necesario mantener un equi-librio entre el grado de exhaustividad y su precisión. Amenudo, los bibliotecarios o documentalistas que se hanespecializado en búsquedas electrónicas pueden ser degran ayuda en el desarrollo y ejecución de éstas. El desa-rrollo de una estrategia de búsqueda es un proceso iterati-vo en el cual los términos que se utilizan se modifican se-gún los resultados que se vayan obteniendo. Por lo tanto,es importante trabajar estrechamente con un documenta-lista en el momento de decidir en qué bases de datos bus-car y qué estrategias de búsqueda utilizar en cada una deellas. Idealmente, los revisores deben estar junto al docu-mentalista cuando se ejecute la estrategia de búsqueda.Un buen abordaje para desarrollar una estrategia de bús-queda exhaustiva es empezar utilizando términos múlti-ples que describan la condición o enfermedad de interés ycombinarlos con el operador booleano «OR». Esto signi-fica que se identificarán los artículos indexados que in-cluyan por lo menos uno de los términos utilizados. Losresultados pueden reducirse utilizando posteriormente eloperador «AND». En este paso, se identifican los artícu-los que utilizan los términos que describen las interven-ciones que se están evaluando (agrupados con el operador«OR») si también abordan la condición de estudio (es de-

cir, si cumplen la intervención «Y» la condición). Porejemplo, una estrategia de búsqueda para evaluar la posi-ble relación entre la infección por el virus C de la hepati-tis y el linfoma no hodgkiniano sería: («hepatitis C» OR«hepatitis C virus» OR HCV) AND («lymphoma» OR«non-Hodgkin lymphoma» OR «lymphoproliferative di-sease» OR «lymphoproliferative disorder»).

Selección de estudios

Todas las referencias de estudios identificados como po-tencialmente elegibles deben evaluarse con posterioridadpara confirmar si cumplen los criterios de inclusión parala revisión. Los revisores deben decidir: a) cuándo se ne-cesitará que más de un revisor evalúe la relevancia decada artículo (actitud, en general, recomendable); b) si lasdecisiones en cuanto a la selección las tomarán especia-listas en el tema, no especialistas o ambos (los especialis-tas en un área específica con frecuencia tienen opinionesformadas previamente que pueden sesgar sus evaluacio-nes, tanto sobre la relevancia como sobre la validez de losartículos; por lo tanto, aunque es importante que al menosun revisor esté versado en el tema objeto de revisión, qui-zá sea una ventaja disponer de un segundo revisor que nosea un experto en esa área), y c) cómo se resolverán lasdiscrepancias si existe más de un revisor (generalmentemediante discusión, pues la causa del desacuerdo es amenudo un simple descuido por parte de uno de los revi-sores; cuando la discrepancia se deba a una diferencia deinterpretación más profunda, el tema debe resolverse porconsenso).

Documentación de una estrategia de búsqueda

La estrategia de búsqueda debe describirse con suficientedetalle en la revisión como para que el proceso pueda re-producirse. La documentación debe incluir las principalesfuentes de información utilizadas para identificar los estu-dios, la estrategia de búsqueda para cada base de datosconsultada y la fecha en la que se efectuó dicha búsqueda,las limitaciones temporales (p. ej., de 1966 a 2003) y laslimitaciones de idioma o de otro tipo (aunque éstas debenevitarse en la medida de lo posible).

Tercer paso: evaluación de la calidad de los estudios

Como expresa muy gráficamente el refrán inglés «garba-ge in, garbage out», si se introduce basura en una revi-sión sistemática se obtendrá también basura3,20. De estemodo, si la calidad de los estudios incluidos es defectuo-sa, la calidad de la revisión sistemática que los ha inclui-do será asimismo deficiente. En este caso, dicha revisiónno sólo no nos aportará beneficio alguno sino que inclusopodrá confundirnos en nuestra práctica clínica. Por tanto,la evaluación de la calidad de los estudios individualesque se incluyen en las revisiones sistemáticas es necesariapara limitar los sesgos y guiar la interpretación de resulta-dos. Incluso si la revisión incluye sólo ensayos clínicos

136 Gastroenterol Hepatol 2004;27(3):129-49 36

GISBERT JP, ET AL. ¿CÓMO REALIZAR, EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS?

129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 136

Documento descargado de http://www.elsevier.es el 28/04/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.

Page 9: ¿Cómo realizar, evaluar y utilizar revisiones ...dsp.facmed.unam.mx/.../Gisbert-J....Rev-Sist-Gatroenterol-Hepatol-2004.pdf · tos relacionados con un tema, más que uno en profundi-dad

aleatorizados, es importante conocer si éstos eran de bue-na calidad. Los factores que justifican una evaluación de-tallada de la calidad son los relacionados con la aplica-bilidad de los resultados, la validez de los estudios indivi-duales y ciertas características del diseño que afectan a lainterpretación de los resultados. La aplicabilidad, tambiénllamada validez externa o generalización, está relacionadacon la definición de los componentes clave de las pregun-tas correctamente formuladas, aspecto ya comentado enel apartado correspondiente. La interpretación de los re-sultados depende de la validez de los estudios incluidos yde otras características. Por ejemplo, una revisión quizáresuma 20 ensayos clínicos válidos que evalúan los efec-tos del tratamiento erradicador de H. pylori sobre los sín-tomas de la dispepsia funcional; sin embargo, los ensayosclínicos quizá examinen diferentes tipos de pacientes (condispepsia de tipo ulceroso o, por el contrario, de tipo dis-motilidad) y es posible que tengan períodos de segui-miento variables (desde unos pocos meses hasta más deun año). Estos aspectos afectarían a la interpretación aun-que quizá no estén relacionados directamente con la vali-dez interna de los ensayos. Dado que la mayoría de las revisiones Cochrane incluyen ensayos clínicos aleatoriza-dos, nos centraremos a continuación en cómo evaluar,precisamente, la validez de dichos estudios.

Validez. Sesgos en los ensayos clínicos

Antes de fijarnos en las conclusiones de una revisión sis-temática debemos valorar si nos las vamos a creer3. Cuan-ta mayor sea la validez de los estudios que sustentan di-cha revisión, más nos fiaremos de las conclusiones. En elcontexto de una revisión sistemática, la validez de un es-tudio se refiere a la capacidad de evitar los errores sis-temáticos o sesgos mediante el correcto diseño y rea-lización del estudio. En una revisión sistemática, las diferencias observadas en la validez de los estudios in-cluidos podrían ayudarnos a explicar la variabilidad desus resultados. De este modo, los estudios más rigurosostienen mayor probabilidad de dar resultados más próxi-mos a la «verdad», mientras que los estudios menos rigu-rosos suelen estar sesgados hacia la sobreestimación de laeficacia de la intervención.En resumen, el término «sesgo» hace referencia a losproblemas de validez interna de una investigación, estoes, se plantea si los resultados obtenidos son ciertos enla población de referencia a la que se pretende generali-zar los resultados16. Por ejemplo, si es cierta la menorincidencia de hemorragia digestiva por varices esofági-cas en los pacientes cirróticos que reciben profilaxis conbloqueadores beta. Por el contrario, la validez externade una investigación se plantea a la hora de generalizarlos resultados obtenidos, es decir, si los datos encontra-dos en una población son aplicables a otra16. En los estu-dios sobre los efectos de la atención sanitaria puedenexistir 4 tipos de sesgos o errores sistemáticos –de se-lección, de realización (performance bias), de desgasteo pérdida (attrition bias) y de detección– que se comen-tan a continuación:

– Sesgo de selección. Uno de los factores más importan-tes que puede sesgar y distorsionar las comparaciones en-tre tratamientos está relacionado con el proceso de obten-ción de los grupos a comparar. Así, en el diseño deensayos clínicos es muy importante utilizar un métodoapropiado para prevenir que se conozca de antemano laasignación de los tratamientos21. Mientras se evalúa laelegibilidad potencial de un participante en un ensayo clí-nico, las personas que reclutan a los participantes debendesconocer el tratamiento que corresponde a la próximaasignación. Lo ideal es que el proceso de asignación nopueda estar influido por las personas que lo llevan a cabo,para lo que debería instaurarse un programa de asigna-ción aleatoria implantado por alguien no implicado en elreclutamiento (p. ej., alguien ubicado en una oficina cen-tral del ensayo). Si no puede organizarse tal aleatoriza-ción central, entonces es necesario tomar otras precaucio-nes para evitar la manipulación del proceso de asignaciónpor las personas que participan en el reclutamiento. Elproceso de ocultar la asignación hasta que se asigna eltratamiento se denomina «ocultación de la asignación»(en inglés, allocation concealment), que no debe confun-dirse con el término «cegar», que se reserva para las me-didas tomadas para reducir el sesgo una vez que la inter-vención ya ha sido asignada.– Sesgo de realización. Hace referencia a las diferenciassistemáticas en la atención sanitaria proporcionada a losparticipantes en los grupos de comparación, aparte, claroestá, de la intervención objeto de estudio. Para protegercontra las diferencias en la atención y contra el efectoplacebo, puede «cegarse» a aquellos que dan y reciben eltratamiento para que no conozcan el grupo al que estánasignados quienes lo reciben.– Sesgo de desgaste o pérdida. Se refiere a las diferenciassistemáticas entre los grupos de comparación en cuanto ala pérdida de participantes durante el estudio. La manerade tratar las pérdidas puede sesgar los resultados, y la in-formación incompleta sobre cómo se tratan las pérdidaspuede ocultar este problema.– Sesgo de detección. El sesgo de detección se refiere alas diferencias sistemáticas entre los grupos de compara-ción en la evaluación de resultados. Los ensayos clínicosque ciegan la asignación de las intervenciones a quienesevalúan los resultados son, lógicamente, menos propen-sos a estar sesgados que los ensayos clínicos que no lohacen. El cegamiento es particularmente importante enaquellas investigaciones que utilizan medidas subjetivasde resultado, como el dolor.

Evaluación de la validez y calidad de los estudios

Si se han utilizado, como es aconsejable, varios criterios ex-plícitos para valorar la validez, es recomendable resumirlospara obtener una evaluación global de los resultados decada estudio22,23. Se han identificado al menos 25 escalas y9 listas que se han utilizado para evaluar la validez y la «ca-lidad» de los ensayos clínicos controlados y aleatorizados,pero ninguna de ellas puede recomendarse sin reservas24,25.Una de las más empleadas es la escala de calidad propuesta

37 Gastroenterol Hepatol 2004;27(3):129-49 137

GISBERT JP, ET AL. ¿CÓMO REALIZAR, EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS?

129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 137

Documento descargado de http://www.elsevier.es el 28/04/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.

Page 10: ¿Cómo realizar, evaluar y utilizar revisiones ...dsp.facmed.unam.mx/.../Gisbert-J....Rev-Sist-Gatroenterol-Hepatol-2004.pdf · tos relacionados con un tema, más que uno en profundi-dad

por Jadad et al26, en la que se puntúan por separado 3 com-ponentes esenciales: la aleatorización, el doble ciego y ladescripción de las pérdidas durante el seguimiento.Hay distintas formas de utilizar las evaluaciones de la va-lidez en una revisión: como un umbral para la inclusiónde estudios, como una posible explicación de las diferen-cias en los resultados entre los estudios, en los análisis desensibilidad y como pesos en el análisis estadístico de losresultados de los estudios. En algunas revisiones, si elriesgo de sesgo es elevado, se justifica la exclusión de losestudios que no cumplen uno o varios criterios de validez.Por ejemplo, para medidas de resultado muy subjetivas,como la dispepsia, podría decidirse incluir sólo los estu-dios que previenen el sesgo de realización mediante el ce-gamiento de los participantes.Hay diversos métodos para explorar si la validez puede ex-plicar las diferencias entre los resultados de los estudios in-cluidos. Se pueden utilizar gráficos visuales de los resulta-dos ordenando los estudios según su grado de validez. Unsegundo enfoque consiste en analizar subgrupos de estu-dios situados por encima del punto de corte metodológico,el cual preferiblemente debe especificarse a priori en elprotocolo de la revisión. Este enfoque puede utilizarse me-diante un análisis de sensibilidad, a fin de determinar si losresultados globales coinciden con los que se obtienencuando sólo se incluyen en el análisis los estudios con ries-go de sesgo bajo. También es posible ponderar los estudiossegún la validez, de manera que los estudios más válidostengan más influencia en la medida resumen de efecto (noobstante, no existe una base empírica para determinar quépeso debe asignarse a los distintos criterios de validez, porlo que este último enfoque es de dudosa utilidad).

Cuarto paso: proceso de extracción de datos

El formulario de recogida de datos es un puente entre loque han informado los investigadores de los estudios pri-marios y lo que, en último término, informa un revisor.Aunque la búsqueda y el proceso de selección deberíanhaber descartado la mayoría de estudios no elegibles, esconveniente comprobar la elegibilidad de éstos en el mo-mento del resumen o de la recogida de datos. Así, las re-visiones Cochrane incluyen una tabla de estudios exclui-dos en el caso de aquellos que inicialmente parecíanreunir los criterios de inclusión pero que, tras un examenmás minucioso, fueron finalmente excluidos.Algunas de las características de los métodos de los estu-dios que pueden ser relevantes incluyen la duración delestudio, el tipo de ensayo (diseños paralelos, cruzados), elcegamiento (de pacientes, proveedores y evaluadores deresultados), el número de pérdidas y de cambios de trata-miento, las cointervenciones y otros factores potencialesde confusión. Además, el apartado de métodos del formu-lario de recogida de datos debe incluir los criterios de va-lidez utilizados (véase el apartado anterior).Los criterios diagnósticos utilizados para definir el pro-blema de salud de interés pueden ser una fuente impor-tante de variabilidad clínica y deberían describirse con

detalle. Por ejemplo, en una revisión sobre terapia farma-cológica con infliximab en la enfermedad de Crohn esimportante conocer cómo se estableció en cada estudio elfenotipo (inflamatorio o fistulizante) y cómo se definió larefractariedad al tratamiento convencional (corticorresis-tencia o corticodependencia).Cómo medir el resultado de los estudios puede ser una delas secciones más difíciles de diseñar del formulario de ex-tracción de datos. Los informes de los estudios suelen in-cluir más de una medida de resultado (mortalidad, morbili-dad, calidad de vida, etc.); además, pueden presentar lamisma medida de resultado usando diferentes escalas decuantificación, pueden incluir medidas de resultado paradiferentes subgrupos de pacientes o pueden señalar medi-das de resultado en diferentes momentos del tiempo. Porejemplo, la valoración del efecto del tratamiento erradica-dor de H. pylori sobre la dispepsia funcional es un temamuy controvertido27. En parte, ello se debe a la falta deacuerdo entre los diversos estudios realizados sobre cómose deben cuantificar los síntomas dispépticos y por lo tantosu mejoría: los síntomas podrían considerarse una variablecuantitativa, y el beneficio, un descenso determinado en elvalor medio de todos los pacientes tras el tratamiento; otambién podría compararse el porcentaje de pacientes consíntomas dispépticos de una determinada gravedad antes ydespués del tratamiento; por último, otra opción más sim-plista consiste en definir como éxito terapéutico sencilla-mente la ausencia de síntomas dispépticos al final del estu-dio. Por otra parte, el momento preciso en que se evalúanlos síntomas tras haber administrado tratamiento erradica-dor de H. pylori puede ser también relevante, pues algúnestudio ha señalado que existe una cierta latencia desdeque desaparece la infección hasta que se comprueba la me-joría sintomática (en caso de que esto realmente ocurra).

Quinto paso: análisis y presentación de resultados.Metaanálisis

La razón fundamental para realizar las revisiones de for-ma sistemática es asegurar la validez de los resultados,pero el papel del análisis estadístico en las revisiones pue-de estar menos claro. A veces, el uso de la estadística(metaanálisis) puede parecer, y quizá lo sea, más un obs-táculo que una ayuda para los que no están familiarizadoscon estas técnicas. Existe también el riesgo de prestar de-masiada atención a la línea estadística inferior o al rom-bo-diamante situado al final del gráfico que resume losresultados de estudios individuales en un metaanálisis. Enocasiones, los revisores y los lectores, con las prisas dellegar al rombo-diamante, descuidan la importancia de lareflexión y de las consideraciones hechas en los pasos an-teriores al análisis o en el análisis mismo.

Justificación para realizar un metaanálisis en una revisión

Para preparar una revisión se deben obtener datos de losestudios individuales y, posteriormente, se pueden usar

138 Gastroenterol Hepatol 2004;27(3):129-49 38

GISBERT JP, ET AL. ¿CÓMO REALIZAR, EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS?

129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 138

Documento descargado de http://www.elsevier.es el 28/04/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.

Page 11: ¿Cómo realizar, evaluar y utilizar revisiones ...dsp.facmed.unam.mx/.../Gisbert-J....Rev-Sist-Gatroenterol-Hepatol-2004.pdf · tos relacionados con un tema, más que uno en profundi-dad

métodos estadísticos para analizar y resumir estos datos.Si se usan apropiadamente, dichos métodos proporcionanuna herramienta potente para llegar a unas conclusionesque tengan sentido y ayudan a evitar errores de interpreta-ción. Cuando en una revisión no se usan métodos estadís-ticos, es fácil cometer el error de comparar el número deestudios «positivos» con el número de estudios «negati-vos». Esta especie de «recuento de votos», en el que seconfiere el mismo valor a los estudios de pequeño y grantamaño es poco fiable y debe evitarse, porque un estudiopuede considerarse positivo o negativo dependiendo decómo interpreten los resultados los revisores, y ademásporque no tiene en cuenta el peso relativo de la evidenciafiable proporcionada por cada estudio8. Al «contar los vo-tos» también se tiende a pasar por alto los efectos peque-ños pero clínicamente relevantes, en particular al conside-rar negativos los estudios con resultados que no sonestadísticamente significativos (debido, con probabilidad,a un error beta consecuencia de la escasa potencia es-tadística). Además, un investigador puede interpretar unestudio como positivo mientras que otro lo considera ne-gativo; por ejemplo, un efecto importante que no sea esta-dísticamente significativo podría interpretarse como posi-tivo a la luz de la importancia clínica y como negativodesde la perspectiva de la significación estadística8. Sinembargo, los metaanálisis valoran los estudios de acuer-do, entre otras cosas, con su tamaño, de modo que conce-den un mayor peso a los más grandes; por este motivo,los resultados globales representan un promedio pondera-do de los resultados de los estudios individuales8. Por su-puesto, el uso de métodos estadísticos –metaanálisis– nogarantiza que los resultados de una revisión sean válidos,como ocurre también en un estudio primario. Así, comocualquier herramienta, matemática o no, los métodos es-tadísticos pueden utilizarse de modo inapropiado.

Objetivos de los metaanálisis

Entre los propósitos generales comunes a cualquier meta-análisis se encuentran los siguientes4:

1. Resumir los resultados de la bibliografía recogida y ha-cer de ella una valoración cualitativa y cuantitativa.2. Resolver la incertidumbre (p. ej., si un determinadofármaco tiene efecto beneficioso o no).3. Mejorar la precisión del estimador del efecto testado(esto es, aumentar el poder estadístico).4. Comparar y contrastar los resultados divergentes de losestudios individuales (resolver discrepancias).5. Responder preguntas nuevas que los estudios origina-les no habían planteado o no podían responder por no te-ner suficiente poder estadístico (análisis de subgrupos).6. Orientar futuros trabajos de investigación (generar hi-pótesis).

Indicaciones para la realización de un metaanálisis

Existen, además, ciertas situaciones concretas en las queestaría específicamente indicado realizar un metaanálisis4:

1. Cuando hay que tomar decisiones (p. ej., terapéuticas)y no se dispone de tiempo suficiente para realizar nuevosestudios. La revisión sistemática es un técnica científicaeficiente, pues, aunque es laboriosa y ocupa mucho tiem-po, este procedimiento es generalmente más rápido y me-nos costoso que embarcarse en un nuevo estudio2.2. Cuando existen muchos estudios no concluyentes sobrelos efectos de un tratamiento, bien porque el efecto espe-rable es pequeño –aunque relevante desde el punto de vis-ta clínico–, bien porque el estudio que se tendría que lle-var a cabo para obtener una respuesta definitiva esirrealizable. Así, los metaanálisis aumentan el poder esta-dístico de los estudios originales, lo que es especialmenteventajoso en condiciones de baja prevalencia o cuando seevalúan efectos de pequeña magnitud2. Un bonito ejem-plo es el representado por el logotipo de la ColaboraciónCochrane (fig. 1), que ilustra la capacidad de los corticoi-des para reducir la mortalidad perinatal en los recién naci-dos de mujeres con riesgo de parto prematuro, medianteun metaanálisis que incluye 7 ensayos clínicos aleatoriza-dos: el efecto beneficioso es estadísticamente significati-vo, a pesar de que sólo 2 de los estudios mostraban unclaro efecto a favor de los corticoides2.3. Cuando los resultados entre estudios son divergentes oincluso contradictorios. En estos casos el metaanálisispuede contribuir a explicar el porqué de las discrepanciasentre estudios.4. Cuando se desea establecer con cierta precisión lamagnitud de la eficacia de una intervención sanitaria.

Contraindicaciones para la realización de un metaanálisis

Por otro lado, hay también una serie de situaciones en lasque no debería llevarse a cabo un metaanálisis4:

1. Para decidir la aprobación o rechazo de un nuevo fár-maco (en las fases iniciales del desarrollo de un fármaco

39 Gastroenterol Hepatol 2004;27(3):129-49 139

GISBERT JP, ET AL. ¿CÓMO REALIZAR, EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS?

Fig. 1. Logotipo de la Colaboración Cochrane.

129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 139

Documento descargado de http://www.elsevier.es el 28/04/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.

Page 12: ¿Cómo realizar, evaluar y utilizar revisiones ...dsp.facmed.unam.mx/.../Gisbert-J....Rev-Sist-Gatroenterol-Hepatol-2004.pdf · tos relacionados con un tema, más que uno en profundi-dad

los ensayos clínicos aleatorizados constituyen la herra-mienta más apropiada para valorar la eficacia terapéu-tica).2. En situaciones en las que existe suficiente evidencia y seconoce con precisión el efecto de una intervención sanita-ria (es obvio que no tiene sentido efectuar metaanálisis so-bre aspectos en los que existe una certeza casi absoluta).3. Para intentar convertir un efecto clínicamente pequeñoen estadísticamente significativo combinando muchos es-tudios irrelevantes que muestran efectos insignificantes.4. Para suplir la necesidad de llevar a cabo un estudio ori-ginal, con el único objetivo de aumentar el número de pu-blicaciones (aunque esta situación pueda parecer absurda,no es excepcional encontrar en la bibliografía metaanáli-sis sin preguntas de interés científico o sanitario).

Resumen de los efectos de los estudios en un metaanálisis

Un objetivo de la mayoría de los metaanálisis es propor-cionar una estimación fiable de los efectos de una inter-vención, basada en una media ponderada de los resulta-dos de todos los estudios relevantes. Así, la síntesiscuantitativa o metaanálisis ocurre cuando al menos unamedida de resultados procedente de como mínimo 2 estu-dios diferentes se combina estadísticamente para obtenerun resultado llamado «efecto sumatorio global» (overallsummary effect en la terminología anglosajona)3. Gene-ralmente, a cada estudio se le asigna como peso el inversode su variancia; es decir, a las estimaciones más precisas,provenientes de estudios más amplios y con más sucesos,se les da más peso. También es posible dar más o menospeso a los estudios basándose en otros factores como sucalidad metodológica, pero esto raramente se hace.

Para el cálculo de un efecto global, la situación ideal es aquella en la que se cuenta con bastantes estudios depequeño tamaño, muy homogéneos tanto en su diseñocomo en sus resultados, lo que permitirá obtener una sóli-da estimación global del efecto10. La combinación de loshallazgos de un grupo de estudios tiene sentido si las di-ferencias observadas entre sus resultados no son estadísti-camente significativas o clínicamente relevantes. En talcaso, la combinación resulta relativamente sencilla y cadaestudio se resume usando una medida de efecto (riesgorelativo, odds ratio, etc.) que representa la comparacióndel grupo de intervención y de control. De este modo, losparticipantes en cada estudio se comparan únicamentecon los demás participantes en el mismo estudio.Para la presentación de los resultados se suelen empleargráficos, el más habitual de los cuales es el denominadoforest plot o gráfico de efectos, en el que se ordenan envertical, según un cierto criterio (p. ej., el nombre del au-tor o la fecha de publicación), los resultados obtenidos encada estudio, con su intervalo de confianza del 95% (lí-neas horizontales), así como el efecto global del metaaná-lisis. Se suele representar el valor medio de cada estudiomediante un símbolo (cuadrado o rombo) cuya área esproporcional al peso con el que interviene en el cálculoglobal (inversamente proporcional a la variancia), paraasí resaltar de algún modo los estudios más precisos10.En la figura 2 se puede observar el gráfico de efectos deun metaanálisis que compara los inhibidores de la bombade protones con los antagonistas H2 en el tratamiento dela hemorragia digestiva por úlcera péptica, siendo la me-dida de resultado evaluada la persistencia o la recidivahemorrágica28. Se observa cómo en la mayoría de los ca-sos el cuadrado que representa el efecto resumen de cada

140 Gastroenterol Hepatol 2004;27(3):129-49 40

GISBERT JP, ET AL. ¿CÓMO REALIZAR, EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS?

Peso%

17,67,82,19,87,1

14,511,15,12,5

12,49,0

0,03 (0,01-0,19)0,12 (0,01-1,09)1,59 (0,24-10,70)0,42 (0,12-1,45)0,29 (0,06-1,36)0,13 (0,03-0,63)0,63 (0,22-1,80)0,47 (0,08-2,58)0,36 (0,04-3,62)0,51 (0,17-1,49)1,11 (0,40-3,05)

100,0 0,40 (0,27-0,59)

OR(IC del 95%)

OR(IC del 95%)

17/207/242/209/235/13

12/5011/374/2523/43

11/1519/38

90/671

Antagonistas H2n/N

IBPn/N

3/191/213/206/284/262/508/38

2/2671/38

5/13111/43

46/681

Estudio

Brunner, 1990Cardi, 1997Labenz, 1997Lanas, 1995Lin, 1997Lin, 1998Michel, 1994Ortí, 1995Pérez Flores, 1994Uribarrena, 1994Villanueva, 1995

Total (IC del 95%)Test de heterogeneidad χ2 = 17,97 df = 10 p = 0,056Test de efecto global z = 4,52 p = 0,00001

0,01 0,1 1 10 100Favorece IBP Favorece antagonistas H2

Comparación: 01 IBP versus antagonistas H2 (todos juntos)Método de resultado: 02 hemografía persistente o recidivante

Fig. 2. Gráfico de efectos en el que se representa la odds ratio de cada estudio (cuadrado), sus intervalos de confianza del 95% (líneas horizontales)y la odds ratio global (diamante). Se trata de un metaanálisis que compara los inhibidores de la bomba de protones con los antagonistas H2 en el tra-tamiento de la hemorragia digestiva por úlcera péptica. La medida de resultado evaluada es la persistencia o la recidiva hemorrágica. IBP: inhibi-dores de la bomba de protones; H2 antagonistas: antagonistas H2 de la histamina; OR: odds ratio; IC: intervalo de confianza.

129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 140

Documento descargado de http://www.elsevier.es el 28/04/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.

Page 13: ¿Cómo realizar, evaluar y utilizar revisiones ...dsp.facmed.unam.mx/.../Gisbert-J....Rev-Sist-Gatroenterol-Hepatol-2004.pdf · tos relacionados con un tema, más que uno en profundi-dad

estudio se encuentra situado a la izquierda de la línea me-dia (la cual señala una odds ratio igual a la unidad, es de-cir, la ausencia de efecto) y, por tanto, indica un mayorefecto preventivo (sobre la persistencia o recidiva hemo-rrágica) de los inhibidores de la bomba de protones. Sinembargo, en esta misma figura se puede comprobar cómoen todos menos en 2 de los estudios la línea horizontal,que representa el intervalo de confianza del 95%, cruza lalínea media, lo que indica que, aunque exista una tenden-cia a un mayor efecto con los inhibidores de la bomba deprotones, las diferencias no alcanzan significación esta-dística en la mayoría de los estudios individuales (proba-blemente por el reducido tamaño muestral de éstos). Y esaquí donde la potencia del metaanálisis, que aglutina losresultados de todos los estudios, nos proporciona una esti-mación más precisa sobre el efecto del tratamiento: unaodds ratio global de 0,4 (representada por el rombo-dia-mante situado en la parte inferior de la figura) con un in-tervalo de confianza del 95% (representado por los extre-mos izquierdo y derecho de dicho rombo-diamente) queno incluye a la unidad (de 0,27 a 0,59) y, por consiguien-te, indica un efecto estadísticamente significativo.

Métodos estadísticos de los metaanálisis

El análisis estadístico es, quizá, la parte más sencilla en laejecución de un metaanálisis. Si los otros pasos se han se-guido con rigor, la combinación estadística de los valoresestimados por cada estudio es de naturaleza meramentemecánica4. Los metaanálisis utilizan diversas técnicas es-tadísticas pero, lamentablemente, no hay una única co-rrecta, pues la elección de ésta depende del tipo de datosanalizados. Para datos dicotómicos (o binarios) hay va-rios pros y contras en cada uno de los estadísticos de re-sumen disponibles: odds ratio, riesgo relativo y diferen-cia de riesgo. La interpretación de la odds ratio comoaproximación del riesgo relativo sólo es válida para tasaspequeñas, mientras que para sucesos frecuentes el primerestadístico no es una buena aproximación del segundo10.El «número necesario a tratar» (NNT), que puede obte-nerse fácilmente a partir de la diferencia de riesgos (es suinversa), es una forma útil e intuitiva, con mayor signifi-cación clínica, de expresar de nuevo los resultados: nosdice cuántos pacientes es necesario tratar con el nuevotratamiento para producir un evento de interés, en compa-ración con el placebo o el tratamiento control. Por ejem-plo, en un reciente metaanálisis que compara la inciden-cia de recidiva hemorrágica por úlcera péptica en lospacientes que reciben tratamiento erradicador de H. pylo-ri frente a los tratados únicamente con antisecretores (sinrecibir posteriormente tratamiento antisecretor de mante-nimiento), se calcula una odds ratio de 0,18 (con un inter-valo de confianza del 95% que no incluye la unidad)29.Esta cifra, que evidentemente indica un efecto protectordel tratamiento erradicador sobre la recidiva hemorrágica,no es fácil de «trasladar» a la práctica clínica. Sin embar-go, si expresamos la magnitud de dicho efecto protectordiciendo que el NNT correspondiente es de 5, lo que indi-ca que es necesario administrar tratamiento erradicador

(en comparación con el tratamiento antisecretor) a tansólo 5 pacientes para conseguir prevenir un episodio derecidiva hemorrágica, la interpretación es más directa eintuitiva.Aunque no existe regla alguna para clasificar un NNTcomo alto o bajo, parece evidente que un valor de 5 tra-duce un efecto terapéutico importante. Por el contrario,un reciente metaanálisis que evalúa el efecto del trata-miento erradicador de H. pylori sobre la mejoría de lossíntomas de la dispepsia funcional demuestra que el NNTcon terapia erradicadora para conseguir la mejoría sinto-mática de uno de estos pacientes (en comparación con elplacebo) es de 25, e incluso de 50 cuando se excluye unestudio responsable de heterogeneidad en los resultados27.Es obvio que esta última cifra (uno entre 50) supone unbeneficio más que dudoso, que deberá sopesarse con losposibles perjuicios que podría causar la administración detratamiento erradicador a los 49 pacientes restantes queno se beneficiarán de él.Cuando se presentan medidas absolutas –como el NNT–es útil dar la información para un intervalo de riesgos ba-sales (p. ej., para el intervalo observado en los estudiosincluidos). Por otra parte, los NNT son específicos de unperíodo de seguimiento y solamente deben calcularsecuando se combinan ensayos en los que esta variable tie-ne un valor similar. Por último, conviene recordar que elNNT es sumamente sensible a los sesgos de todo tipo yen particular a la heterogeneidad entre los estudios, por loque su uso a partir de los resultados globales de un metaa-nálisis debe ser siempre juicioso3.Las medidas absolutas pueden ser más informativas quelas relativas porque reflejan el riesgo basal y el cambio deriesgo con la intervención. No obstante, si la tasa en elgrupo control no es similar en todos los estudios, no escorrecto emplear una medida, como la reducción absolutade riesgo, para estimar el efecto global y habrá que utili-zar una medida relativa, como puede ser la odds ratio o elriesgo relativo10. Como resumen, podríamos recomendarque siempre que sea posible deberían describirse los re-sultados con una medida relativa (odds ratio, riesgo rela-tivo o reducción del riesgo relativo) y también medianteun estimador absoluto (NNT o diferencia de riesgos)4,30.

Evaluación de la heterogeneidad

En la actualidad constituye una de las motivaciones fun-damentales para realizar un metaanálisis, incluso mayorque el mero cálculo de una estimación del efecto global10.Es importante preguntarse si los resultados de los estu-dios son similares dentro de cada comparación. Una ma-nera de responder a esta pregunta es examinar una pre-sentación gráfica de los resultados. Si los intervalos deconfianza para los resultados de cada estudio (representa-dos típicamente mediante líneas horizontales) no se su-perponen, esto indica que es probable que las diferenciasentre los estudios sean estadísticamente significativas.Las pruebas de homogeneidad son análisis estadísticosformales para examinar si la variación observada en losresultados de los estudios es compatible con la variación

41 Gastroenterol Hepatol 2004;27(3):129-49 141

GISBERT JP, ET AL. ¿CÓMO REALIZAR, EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS?

129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 141

Documento descargado de http://www.elsevier.es el 28/04/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.

Page 14: ¿Cómo realizar, evaluar y utilizar revisiones ...dsp.facmed.unam.mx/.../Gisbert-J....Rev-Sist-Gatroenterol-Hepatol-2004.pdf · tos relacionados con un tema, más que uno en profundi-dad

esperada únicamente por azar. Cuanto más significativossean los resultados de la prueba (valor de p más peque-ño), más probable es que las diferencias observadas nosean debidas únicamente al azar. En general, las pruebasestadísticas que valoran la presencia de heterogeneidadsuelen tener una baja potencia estadística, por lo que eshabitual situar el punto de corte para la p10 en 0,1 en lugardel habitual 0,05. Además, una prueba no significativa nodescarta necesariamente la existencia de heterogeneidad.Por lo tanto, las diferencias clínicamente importantes en-tre los resultados de los estudios siguen imponiendo pre-caución en la interpretación de los hallazgos globales, apesar de que la prueba estadística de heterogeneidad pue-da no ser significativa8.En el ejemplo del metaanálisis anteriormente menciona-do sobre el efecto del tratamiento erradicador de H. pylorien la dispepsia funcional27, la mera observación de la re-presentación gráfica nos indica que uno de los estudios

(McColl, 1988) ofrece resultados claramente discordantes(fig. 3, panel superior). De hecho, la p del test de hetero-geneidad, con un valor de 0,1, confirma que nos encon-tramos en el límite estadístico que la define. Los resulta-dos contradictorios entre varios estudios podríanexplicarse, al menos en parte, por la diferente prevalenciade úlcera gastroduodenal en las distintas áreas geográfi-cas. Así, es posible que el efecto favorable de la terapiaerradicadora evidenciado en los ensayos clínicos positi-vos sea debido al tratamiento de la enfermedad ulcerosano diagnosticada, que, como es sabido, tiene una excelen-te respuesta a la erradicación de H. pylori. Por tanto, laterapia frente a H. pylori podría estar tratando únicamenteal reducido subgrupo de pacientes con úlcera péptica a losque se ha clasificado erróneamente como dispépticos fun-cionales al no objetivarse durante la gastroscopia una úlcera gastroduodenal activa. La elevada incidencia de úl-cera gastroduodenal en Escocia, donde se llevó a cabo el

142 Gastroenterol Hepatol 2004;27(3):129-49 42

GISBERT JP, ET AL. ¿CÓMO REALIZAR, EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS?

Peso(%)

100,0 1,20 (0,91-1,58)

OR(IC del 95%)

OR(IC del 95%)

375/958

Tratamientocontrol

n/N

Tratamiento.erradicador

n/N

45/16480/12947/749/15

55/8933/15440/45

32/13369/150

410/953

Estudio

Blum, 1998Bruley, 2000Froehlich, 2001Gisbert, 2001Koelz, 1998McColl, 1998Passos, 1998Talley, 1999 (ORCHID)Talley, 1999 (USA)

Total IC del 95%

Test de heterogeneidad χ2 = 13,31 df = 8 p = 0,1Test de efecto global z = 1,26 p = 0,2

0,01 0,1 1 5 10Mejor tratamiento control Mejor tratamiento erradicador

34/16474/12445/7016/3361/92

11/15432/36

31/14271/143

14,814,910,74,3

12,29,83,5

13,416,4

1,45 (0,87-2,41)1,10 (0,67-1,83)0,97 (0,59-1,91)1,59 (0,46-5,50)0,82 (0,45-1,51)3,55 (1,72-7,31)1,00 (0,25-4,03)1,13 (0,65-1,99)0,86 (0,55-1,37)

Peso(%)

100,0 1,06 (0,85-1,31)

OR(IC del 95%)

OR(IC del 95%)

364/804

Tratamientocontrol

n/N

Tratamiento.erradicador

n/N

45/16480/12947/749/15

55/8940/45

32/13369/150

377/799

Estudio

Blum 1998Bruley 2000Froehlich 2001Gisbert 2001Koelz 1998Passos 1998Talley 1999 (ORCHID)Talley 1999 (USA)

Total IC del 95%

Test de heterogeneidad χ2 = 3,43 df = 8 p = 0,84Test de efecto global z = 0,51 p = 0,6

0,01 0,1 1 5 10

34/16474/12445/7016/3361/9232/36

31/14271/143

17,718,110,03,0

12,52,4

14,621,9

1,45 (0,87-2,41)1,10 (0,67-1,83)0,97 (0,59-1,91)1,59 (0,46-5,50)0,82 (0,45-1,51)1,00 (0,25-4,03)1,13 (0,65-1,99)0,86 (0,55-1,37)

Tratamientocontrol

n/N

Mejor tratamiento control Mejor tratamiento erradicador

Fig. 3. Metaanálisis de la eficacia del tratamiento erradicador de Helicobacter pylori en la dispepsia funcional27. Panel superior: presencia de hete-rogeneidad, debida a los resultados discordantes del estudio de McColl et al; panel inferior: resultados homogéneos tras la exclusión de dicho estu-dio. OR: odds ratio; IC: intervalo de confianza.

129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 142

Documento descargado de http://www.elsevier.es el 28/04/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.

Page 15: ¿Cómo realizar, evaluar y utilizar revisiones ...dsp.facmed.unam.mx/.../Gisbert-J....Rev-Sist-Gatroenterol-Hepatol-2004.pdf · tos relacionados con un tema, más que uno en profundi-dad

único estudio con resultados positivos, apoyaría esta posi-bilidad. Precisamente, la heterogeneidad encontrada alprincipio en el metaanálisis desaparecía al excluir el estu-dio de McColl et al, situación en la que el valor de la pdel test de heterogeneidad ascendía hasta 0,84 (fig. 3, pa-nel inferior).Como se ha comentado antes, la existencia de heteroge-neidad estadísticamente significativa indica que las dife-rencias observadas en los resultados de los estudios in-dividuales podrían estar causadas por otros factores dis-tintos del azar. En este caso, los revisores deben alertar alos lectores de su revisión y recomendar cautela en la in-terpretación de los resultados combinados. Incluso podrí-an llegar a decidir que la heterogeneidad es de tal magni-tud que es preferible no combinar los resultados de losestudios individuales. Se debe tener siempre presente quelos tests estadísticos no pueden compensar la falta de sen-tido común, la perspicacia clínica y la plausibilidad bioló-gica. De este modo, existen revisiones en que la síntesisde datos no es posible (o mejor, no es deseable) y se que-dan en honrosas revisiones sistemáticas cualitativas3. Losrevisores pueden comentar, en ese caso, que les fue impo-sible combinar los resultados porque los estudios que en-contraron no ofrecían datos combinables. Por último, losrevisores deben intentar explorar las causas de la hetero-geneidad y tratar de explicarla, pero cualquier interpreta-ción debe ser cautelosa, puesto que estos análisis se hacenhabitualmente a posteriori. Idealmente, deben especifi-carse a priori, dentro del protocolo inicial de la revisión,los factores que podrían conducir a diferencias entre losresultados de estudios individuales. En resumen, es im-portante recalcar que un adecuado análisis de los factoresque pueden ser responsables de la heterogeneidad entrelos estudios es de mayor importancia que la idea simplistade buscar una medida de efecto global cuando existen re-sultados contradictorios entre los diversos estudios10.

Análisis de subgrupos

A menudo resulta interesante examinar una categoría par-ticular de participantes en una revisión (como mujeres, ungrupo de edad en particular o los sujetos con un subtipoespecífico o gravedad de la enfermedad). Es preciso re-calcar aquí que el término «subgrupos» se refiere a lasagrupaciones particulares de pacientes entre los estudios,no a subgrupos de estudios3. Con frecuencia se abusa delos análisis de subgrupos, por lo que los revisores deberánser cuidadosos al efectuarlas y los lectores al interpretar-las. Las preguntas incluidas en la tabla IV pueden utili-zarse para ayudar a decidir si se lleva o no a cabo estetipo de análisis. De entre ellas destaca la primera, queplantea si es plausible esperar que haya una diferencia ba-sándose en lo que se conoce acerca de la intervención ydel problema, ya que si no es así probablemente no debe-ría emplearse el análisis de subgrupos. En la medida de loposible, los revisores deben intentar reducir al mínimo elnúmero de estos análisis, pues cuanto más grande sea el número de hipótesis a evaluar mayor será el número delas diferencias que podrán encontrarse simplemente por

azar. Es más probable que las decisiones acerca de quéanálisis realizar estén reorientadas por los datos cuandose planean a posteriori y, en consecuencia, es más proba-ble que sean espurias. Se debe ser extremadamente caute-loso al examinar y plantear conclusiones acerca de laexistencia de diferencias en la respuesta de los subgruposbasándose en diferencias en los resultados entre los estu-dios, pues puede haber muchos factores que lo justifiquen(p. ej., diferencias en los fármacos, en las dosis, en los es-quemas de tratamiento específicos que se han utilizado,etc.). Incluso si la revisión incluye únicamente ensayosaleatorizados, debe recordarse que no se aleatorizó a lospacientes a un estudio o a otro, sino que, dentro de unmismo estudio, se les aleatorizó a recibir uno u otro trata-miento.

Análisis de sensibilidad

Dado que hay varios enfoques para realizar una revisiónsistemática, los revisores deben preguntarse cuán sensi-bles son los resultados del análisis a los cambios en elmodo en que éste fue realizado. Esto proporciona a los re-visores un mecanismo para probar cuán robustos son losresultados de la revisión en relación con las decisiones ycon las asunciones clave surgidas en el proceso de reali-zarla. Si los análisis de sensibilidad que se efectúan nocambian sustancialmente los resultados, la confianza quetendremos en éstos queda fortalecida. Por el contrario, silos resultados cambian de manera que conducen a conclu-siones diferentes, se deberá ser más cauteloso en la inter-pretación de los datos y al plantear las conclusiones.

Presentación de los resultados del metaanálisis

Con el ánimo de mejorar y homogeneizar la calidad de lapresentación de los resultados de los metaanálisis, el grupoQUOROM (Quality Of Reporting Of Meta-analysis) hapublicado recientemente un documento donde se destaca-ban los puntos que deberían exigirse ineludiblemente31,32.Según este grupo, existen 6 áreas temáticas generales im-portantes para la realización y presentación de los resulta-dos de cualquier metaanálisis de ensayos clínicos aleato-rizados: diseño del estudio, combinación adecuada de di-versos estudios, control del sesgo, análisis estadístico, aná-lisis de sensibilidad y problemas de aplicabilidad. Esta pro-puesta incluye una lista (fig. 4) que «obliga» a los autoresdel metaanálisis a ofrecer a los lectores información explí-cita sobre la estrategia de búsqueda, los criterios para la se-

43 Gastroenterol Hepatol 2004;27(3):129-49 143

GISBERT JP, ET AL. ¿CÓMO REALIZAR, EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS?

TABLA IV. Preguntas que ayudan a decidir si debe o no hacerse un análisis de subgrupos

1. ¿Hay evidencia indirecta que apoye la existencia de unadiferencia en algún subgrupo en particular?

2. ¿Las hipótesis acerca de la diferencia preceden al análisis y nosurgen después de éste?

3. ¿La diferencia se insinúa a partir de comparaciones dentro de losestudios y no entre los estudios?

4. ¿La diferencia es consistente a lo largo de los estudios?5. ¿La magnitud de la diferencia es clínicamente relevante?6. ¿La diferencia es estadísticamente significativa?

129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 143

Documento descargado de http://www.elsevier.es el 28/04/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.

Page 16: ¿Cómo realizar, evaluar y utilizar revisiones ...dsp.facmed.unam.mx/.../Gisbert-J....Rev-Sist-Gatroenterol-Hepatol-2004.pdf · tos relacionados con un tema, más que uno en profundi-dad

lección de estudios, la evaluación de la validez de éstos, elmodo en que se extrajeron los datos, las características delos diversos estudios y la síntesis cuantitativa de los datos.Además, la propuesta QUOROM incluye un diagrama deflujo (fig. 5) en el que los autores deberán aportar informa-ción detallada sobre el número de ensayos clínicos aleatori-zados identificados, incluidos y excluidos, y los motivospor los que estos últimos lo fueron.

Interpretaciones erróneas y limitaciones de los metaanálisis

Después de un notable entusiasmo inicial, las discrepan-cias entre las conclusiones extraídas de algunos metaaná-lisis y los hallazgos encontrados en macroensayos aleato-rizados33,34 han llevado a un planteamiento mucho máscrítico del papel del metaanálisis10. No se debe caer en elerror de considerar el metaanálisis una mera combinación

de múltiples estudios, como si fuera, por tanto, «una revi-sión ordinaria, pero más grande»20. Así, actualmente seprofundiza mucho más en el análisis de la heterogeneidadentre estudios y sus posibles causas, en la influencia delas características de los pacientes incluidos y en el análi-sis de sensibilidad de los resultados10. Por otra parte, nose debe olvidar que, en todo caso, el metaanálisis es unestudio observacional, con las limitaciones que ello com-porta10. Desde sus orígenes el metaanálisis ha sido y siguesiendo una técnica controvertida, sobre todo cuando se halimitado a un ingenuo cálculo del efecto global, dado quelos métodos estadísticos no pueden «corregir» o «ajustar»las discrepancias entre estudios, y mucho menos lograrque resultados contradictorios se combinen en una únicamedida global10. La aparente precisión con la que se efec-túa el cálculo de una estimación global en un metaanálisispuede disuadir de la realización de estudios posterioressobre ese asunto, lo que en ocasiones puede llegar a ser

144 Gastroenterol Hepatol 2004;27(3):129-49 44

GISBERT JP, ET AL. ¿CÓMO REALIZAR, EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS?

Categoría Subcategoría ¿Incluido eninforme? (S/N)

Ítem N.°páginas

Título

Resumen

Identificar el trabajo como un metaanálisis[o revisión sistemática] de ECC26

Objetivos

Utilizar un formato estructurado27

DescribirLa cuestión clínica explícitamente

Fuentes de datos Las bases de datos (es decir, una relación)y otras fuentes de información

Métodos de revisión Los criterios de selección (es decir,población, intervención, resultado y diseñodel estudio); los métodos de valoración de lavalidez, análisis de datos y característicasdel estudio, y síntesis de datos cuantitativossuficientemente detallada para permitirla repetición

Resultados Caraterísticas de los ECC incluidos yexcluidos: hallagos cualitativos y cuanti-tativos (estimaciones puntuales e interva-los de confianza), y análisis de subgrupo

Conclusión Resultados principales

Describir

Introducción El problema clínico concreto; los funda-mentos biológicos de la intervención y losfundamentos de la revisión

Métodos Las fuentes de información, con detalle28

(p.e. bases de datos, registros, ficherospersonales, expertos, agencias, búsquedamanual) y cualquier restricción (añosconsiderados, situación de publicación29,idioma de la publicación30,31)

Búsqueda

Los criterios de inclusión y exclusión(relativos a la población, la intervención,los resultados principales y el diseñodel estudio32)

Selección

Criterios y proceso utilizados (p.e.condiciones encubiertas, valoraciónde la calidad y sus hallazgos33-36)

Evaluaciónde la validez

Fig. 4. Lista (checklist) para evaluar lacorrecta presentación de los resultadosde un metaanálisis. Propuesta QUOROM(Quality Of Reporting Of Meta-analy-sis)32. ECC: ensayos clínicos controla-dos.

129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 144

Documento descargado de http://www.elsevier.es el 28/04/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.

Page 17: ¿Cómo realizar, evaluar y utilizar revisiones ...dsp.facmed.unam.mx/.../Gisbert-J....Rev-Sist-Gatroenterol-Hepatol-2004.pdf · tos relacionados con un tema, más que uno en profundi-dad

un inconveniente10. En este sentido, el metaanálisis nodebe sustituir a los ensayos clínicos de gran tamaño; sinembargo, cuando éstos no existen, el metaanálisis consti-tuye una guía para la práctica clínica e incluso para el di-seño de futuros ensayos10. No se debe caer en el error deconsiderar el metaanálisis un sustituto de los grandes en-sayos clínicos de elevada calidad. Así, el metaanálisisdebe ser una herramienta para la generación de hipótesismás que para la toma de decisiones10. Idealmente deberálocalizar dónde se encuentran las lagunas de conocimien-to, para así orientar las líneas de investigación futuras.Dicho de otro modo, el metaanálisis es complementario,no sustituto, del ensayo clínico aleatorizado de gran tama-ño y representa una estrategia coste-efectiva porque redu-ce el número de estudios primarios innecesarios.Como se ha comentado previamente, el metaanálisis noes la panacea que convierte estudios primarios metodoló-gicamente deficientes en una combinación brillante deensayos clínicos, por lo que hay que tener especial cuida-do en no combinar de forma indiscriminada (dando igualvalor) las investigaciones de buena y mala calidad. Mez-clar «manzanas y naranjas» en la misma cesta es también

un error que se comete frecuentemente al realizar un me-taanálisis, al ignorar las diferencias fundamentales entrelos distintos estudios y combinarlos sin más20. Por ejem-plo, no sería apropiado evaluar el efecto de los bloquea-dores beta en la prevención de la hemorragia digestivapor varices esofágicas mezclando, en el mismo metaaná-lisis, estudios dirigidos a la profilaxis primaria (del pri-mer episodio hemorrágico) y secundaria (de la recurren-cia de la hemorragia). Ambas poblaciones de pacientescirróticos tienen un riesgo de base diferente, del que de-pende directamente el valor de la variable que se pretendemedir, en este caso, la incidencia de hemorragia digestivapor varices esofágicas.En resumen, el metaanálisis, si se utiliza correctamente,constituye la mejor herramienta posible para combinar losresultados de diversos estudios en un mundo cada vezmás desbordado por el volumen de información que pre-cisa ser sintetizada10. Sin embargo, debido a su elevadapotencia, es también un arma de doble filo que puede lle-varnos a sacar conclusiones sesgadas a partir de estudiosimperfectos que aisladamente no habrían sido capaces de«confundirnos»20.

45 Gastroenterol Hepatol 2004;27(3):129-49 145

GISBERT JP, ET AL. ¿CÓMO REALIZAR, EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS?

ECC identificados potencialmente relevantesy sometidos a selección para su repuración (n = …)

ECC excluidos (motivos)(n = …)

ECC potencialmente adecuadospara su inclusión

en el metaanálisis (n = …)

ECC excluidos (motivos)(n = …)

ECC seleccionados para unaevaluación más detallada (n = …)

ECC excluidos del metaanálisis (motivos) (n = …)

ECC incluidos en el metaanálisis (n = …)

ECC retirados a causa del resutado (motivos) (n = …)

ECC con información útil segúnel resultado (n = …)

Fig. 5. Diagrama de flujo (flow diagram)para evaluar la correcta presentación delos resultados de un metaanálisis. Pro-puesta QUOROM (Quality Of ReportingOf Meta-analysis)32. ECC: ensayos clíni-cos controlados.

129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 145

Documento descargado de http://www.elsevier.es el 28/04/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.

Page 18: ¿Cómo realizar, evaluar y utilizar revisiones ...dsp.facmed.unam.mx/.../Gisbert-J....Rev-Sist-Gatroenterol-Hepatol-2004.pdf · tos relacionados con un tema, más que uno en profundi-dad

Sexto paso: interpretación de los resultados

Existen algunos temas que deben ser objeto de discusiónen una revisión sistemática y que pueden ser de ayuda enla toma de decisiones, como la solidez de la evidencia, laaplicabilidad de los resultados o el balance entre los bene-ficios esperados y los posibles daños y costes de la inter-vención de interés. Con respecto a la solidez de la eviden-cia, un buen punto de partida o de destino para la secciónde discusión de una revisión es abordar cualquier limita-ción metodológica importante de los estudios incluidos yde los métodos usados en la revisión que pueda afectar alas decisiones prácticas a tomar.En relación con la aplicabilidad, una de las ventajas de unarevisión de conjunto es que, dado que incluye numerososestudios, los resultados proceden de una variedad muy di-versa de pacientes8. Si los resultados son consistentes a tra-vés de los estudios, se aplicarán por tanto a esta amplia va-riedad de pacientes. Incluso así, se puede seguir teniendodudas sobre la aplicabilidad de los resultados. Por ejemplo,una revisión sobre la estrategia test-and-treat en la dispep-sia, basada en el diagnóstico y el consiguiente tratamientode la infección por H. pylori sin necesidad de practicar una

gastroscopia, se fundamenta en una serie de estudios queevalúan dicha estrategia en pacientes dispépticos jóvenes(p. ej., menores de 50 años), pues en este grupo de edad laincidencia de cáncer gástrico es mínima. Sin embargo, ellector puede que proceda de o resida en una zona de alta in-cidencia de adenocarcinoma gástrico como Japón o Latino-américa, donde probablemente no sea aplicable este puntode corte para la edad y sea prudente reducirlo. Por tanto, losusuarios de cualquier revisión sistemática deben decidir sila evidencia que encuentran en ella es o no aplicable a suscircunstancias específicas. Para hacerlo, deben determinarsi los participantes y los entornos en los estudios incluidosson razonablemente similares a su propia situación. En ge-neral, en lugar de aplicar rígidamente los criterios de inclu-sión y de exclusión de los estudios a situaciones específicas,es mejor preguntarse si hay razones evidentes por las cualeslos ensayos no deben aplicarse en ciertas circunstancias.Un tercer aspecto es si los beneficios compensan los ries-gos de la intervención. Por ejemplo, en una reciente revi-sión sistemática y metaanálisis, llevada a cabo por la Co-laboración Cochrane sobre el efecto del tratamientoerradicador de H. pylori en la dispepsia funcional, se con-cluye que la erradicación del microorganismo tiene unpequeño pero estadísticamente significativo efecto bene-ficioso35; los autores plantean un modelo económico queapunta finalmente a que este modesto beneficio es, proba-blemente, coste-efectivo.Finalmente, un error común que se comete cuando la evi-dencia disponible no es concluyente, tanto al describir re-sultados como al sacar conclusiones, es confundir «la fal-ta de evidencia de efecto» con «la evidencia de que nohay ningún efecto». Dicho de otro modo, no es lo mismodecir que un estudio «no ha demostrado diferencias esta-dísticamente significativas» entre 2 tratamientos que afir-mar que realmente «no existen diferencias» y que ambostratamientos son equivalentes. Los autores y los lectoresdeben ser cuidadosos para no caer en esta trampa, queafecta típicamente a los estudios (y también a los metaa-nálisis) que incluyen un reducido número de pacientes, loque se traduce en una escasa potencia estadística y, cuan-do no se demuestran diferencias entre los 2 grupos de tra-tamiento, una elevada probabilidad de cometer un errorbeta o de tipo II. Un ejemplo que destaca este problemade «equivalencia» es el siguiente: el tamaño muestral ne-cesario para demostrar que existen diferencias estadística-mente significativas entre un tratamiento A (con una tasade éxito terapéutico del 80%) y un tratamiento B (con unadiferencia clínicamente significativa de un 10%, esto es,una eficacia menor del 70% o mayor del 90%) es de nadamenos que 250 pacientes por grupo aproximadamente(500 en total) si aplicamos un contraste bilateral.Una segunda equivocación común consiste en sacar con-clusiones que van más allá de la evidencia que se analiza.Por ejemplo, si un metaanálisis ha demostrado que un de-terminado tratamiento es más eficaz que el placebo paracontrolar la hemorragia digestiva por varices en los pa-cientes con cirrosis hepática, esto no implica que dichotratamiento se siga necesariamente de una disminución dela mortalidad, ya que es posible que ésta dependa, como

146 Gastroenterol Hepatol 2004;27(3):129-49 46

GISBERT JP, ET AL. ¿CÓMO REALIZAR, EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS?

TABLA V. Lista de verificación (checklist) que permite la detección de errores importantes en una revisiónsistemática

1. Formulación de la pregunta¿Las preguntas de la revisión están bien formuladas y contienen

los componentes clave?2. Identificación de estudios

¿Se realiza una búsqueda minuciosa de datos pertinentes usando fuentes apropiadas?

¿Las estrategias de búsqueda son adecuadas para la pregunta que se ha planteado?

3. Selección de estudios¿Se aplican criterios de inclusión y de exclusión apropiados para

seleccionar los estudios?¿Se aplican los criterios de selección de manera que limiten los

sesgos?4. Evaluación de los estudios

¿Se valora de manera fiable la validez de los estudios individuales?

¿Se abordan de modo sistemático los parámetros importantes quepueden afectar a los resultados del estudio?

5. Obtención de datos¿Hay una mínima cantidad de datos no disponibles en los

resultados y en otras variables que se consideren clave para la interpretación de los resultados?

6. Síntesis de datos¿Se tomaron decisiones razonables con respecto a la manera de

combinar los datos?¿Se han considerado en la síntesis factores importantes como el

diseño de los estudios?¿Son sensibles los resultados a los cambios relacionados con el

modo en que se hizo el análisis?¿Se informa de la precisión de los resultados?

7. Discusión¿Se mencionan las limitaciones de los estudios y del proceso de

revisión?¿Se integran los resultados de la revisión en el contexto de otra

evidencia indirecta?8. Conclusiones de los revisores

¿Se apoyan las conclusiones en el contenido de la revisión?¿Se abordan explicaciones alternativas y verosímiles de los

efectos observados?¿Hay interpretaciones adecuadas acerca de la evidencia que no es

concluyente (sin evidencia de efecto frente a evidencia de que no hay efecto)?

¿Se identifican las consideraciones que resultan importantes para las personas que deben adoptar decisiones?

129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 146

Documento descargado de http://www.elsevier.es el 28/04/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.

Page 19: ¿Cómo realizar, evaluar y utilizar revisiones ...dsp.facmed.unam.mx/.../Gisbert-J....Rev-Sist-Gatroenterol-Hepatol-2004.pdf · tos relacionados con un tema, más que uno en profundi-dad

en realidad ocurre, de otros factores que no se ven modi-ficados por el tratamiento en cuestión. Por último, inclusoafirmaciones generales del tipo «se necesitan más estu-dios…», tan empleadas en las últimas líneas de muchosmanuscritos, deberían evitarse. En todo caso, los reviso-res deben especificar exactamente qué investigación senecesita y su justificación precisa.

EVALUACIÓN CRÍTICA DE UNA REVISIÓNSISTEMÁTICA

Al plantearse llevar a cabo una revisión sistemática, opara revisar una ya realizada por otros autores, es útil em-plear una lista de verificación (checklist) como guía paradescubrir errores importantes, como la propuesta en la ta-bla V. Otro formato alternativo para la evaluación críticade una revisión sistemática por parte de los lectores es lapropuesta por el grupo CASP (Critical Appraisal SkillsProgramme, o programa de habilidades en lectura crítica),que, como su nombre indica, tiene como objetivo ayudara desarrollar habilidades para hacer una lectura crítica dela evidencia científica. La lectura crítica sería el procesode evaluar e interpretar la evidencia aportada por la bi-bliografía científica, considerando sistemáticamente los

resultados que se presentan, su validez y su relevanciapara el trabajo propio. En España existe un grupo CASP(CASPe), en cuya página web (www.redcaspe.org) sepueden encontrar herramientas muy útiles para estas acti-vidades. Siguiendo las «guías para usuarios de la biblio-grafía médica» publicadas en la revista JAMA (en concre-to, el artículo escrito por Oxman et al8 sobre «cómoutilizar una revisión»), existen 3 preguntas fundamentalesque deben plantearse cuando se hace la lectura crítica de este tipo de artículos: a) ¿son válidos los resultados?(fig. 6); b) ¿cuáles son los resultados? (fig. 7), y c) ¿sonaplicables en el medio particular en que nos encontra-mos? (fig. 8). Las 2 primeras preguntas son «de elimina-ción» y se pueden responder rápidamente, con lo que esprobable que desechemos la mayor parte de las revisiones(entre otros motivos, porque la mayoría de las publicadashasta una época muy reciente son narrativas y no sistemá-ticas); sólo si la respuesta es afirmativa en ambas merecela pena continuar con la tercera pregunta.

A MODO DE CONCLUSIONES

En las páginas anteriores se han aportado los argumentosnecesarios para poder considerar las revisiones sistemáti-

47 Gastroenterol Hepatol 2004;27(3):129-49 147

GISBERT JP, ET AL. ¿CÓMO REALIZAR, EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS?

CASPe

CASPe

CASPe

CASPe

CASPe

CASPeCASPe

CASPe

CASPe

Sí NoNo sé

a) ¿Los resultados de la revisión son válidos?

Preguntas «de eliminación»

1 ¿Se hizo la revisión sobreun tema claramente definido?

Pista: un tema debe ser definidoen términos de:

– La población de estudio – La intervención realizada – Los resultados (“anteriores”) considerados

Sí NoNo sé

2 ¿Buscaron los autores el tipode artículos decuado?

Pista: el mejor “tipo de estudio”es el que:

– Se dirige a la pregunta objeto de la revisión – Tiene un diseño apropiado para la pregunta

Sí NoNo sé

3 ¿Crees que estaban incluidoslos estudios importantesy relevantes?

Pista: busca: – ¿Qué bases de datos bibliográficas se han usado? – ¿Seguimientos de la referencias? – ¿Contacto personal con expertos? – búsqueda de estudios no publicados? – ¿Búsqueda de estudios en idiomas distintos del inglés?

Sí NoNo sé

Sí NoNo sé

4 ¿Crees que los autores de larevisión han hecho sificienteesfuerzo para valorar la calidadde los estudios incluidos?

Pista: los autores necesitan considerar el rigor de los estudios que han identificado. La falta de rigor puede afectar al resultado de los estudios (“No es oro todo lo que reluce” El mercader de Venecia, Acto II)

5 Si los resultados de los diferentesestudios han sido mezclados paraobtener un resultado “combinado”,¿era razonable hacer eso?

Pista: considera si:

– Los resultados de los estudios eran similares entre sí – Los resultados de todos los estudios incluidos están claramente presentados – Están discutidos los motivos de cualquier variación de los resultados

Fig. 6. Preguntas propuestas por el grupo CASP (Critical Appraisal Skills Programme) para la lectura crítica de una revisión sistemática: a) ¿los re-sultados de la revisión son válidos?8.

129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 147

Documento descargado de http://www.elsevier.es el 28/04/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.

Page 20: ¿Cómo realizar, evaluar y utilizar revisiones ...dsp.facmed.unam.mx/.../Gisbert-J....Rev-Sist-Gatroenterol-Hepatol-2004.pdf · tos relacionados con un tema, más que uno en profundi-dad

cas como piezas fundamentales del complejo engranajeque constituye la producción y divulgación de los conoci-mientos científicos en medicina. Asimismo, se han deta-llado las diversas etapas metodológicas que conviene te-ner en cuenta para desarrollar con solvencia y validez unarevisión sistemática, según los criterios de la Colabora-ción Cochrane. Precisamente, uno de los rasgos distinti-vos de esta organización internacional, independiente y

sin ánimo de lucro, es que las revisiones sistemáticas sonelaboradas por las personas interesadas por un tema parti-cular. Es decir, no se llevan a cabo de manera centraliza-da por parte de un instituto especializado (aunque existendiversos organismos que producen revisiones sistemáticasde calidad), sino de una red de profesionales sanitarios (ytambién de pacientes y ciudadanos) de todo el mundo in-teresados en revisar críticamente la base científica quesustenta las diferentes decisiones clínicas y sanitarias.Para ello, la Colaboración Cochrane proporciona forma-ción y apoyo metodológico a todos aquellos que se mues-tran interesados en participar activamente en esta labor.El Centro Cochrane Iberoamericano es el que en España eIberoamérica se responsabiliza de coordinar este apoyo yfacilitar la información necesaria2,36, y desde aquí anima-mos a cualquiera que esté interesado en colaborar conesta organización a visitar su página web (http://www.co-chrane.es).Además, desde octubre de 2003 y gracias a una suscripciónrealizada por el Ministerio de Sanidad y Consumo, cualquierciudadano puede consultar gratuitamente la revista electró-nica Cochrane Library Plus, la cual contiene la versión encastellano de la Cochrane Library y otras publicaciones deinterés (http://www.update-software.com/clibplus).

BIBLIOGRAFÍA

1. Gisbert JP. Fuentes y centros de gestión del conocimiento. En-fermedad inflamatoria intestinal al día 2003;2:32-8.

2. López Arrieta JM, Qizilbash N. La medicina basada en prue-bas: revisiones sistemáticas. La Colaboración Cochrane. MedClin (Barc) 1996;107:581-5.

3. Sáenz A, Ausejo M. Guía para leer e interpretar una revisiónsistemática. Rev Soc Mad Med Fam Comunit 2000;2:29-36.

4. Gabriel-Sánchez R, Pladevall-Vila M. Evaluación de la eviden-cia en medicina: revisiones sistemáticas y metaanálisis. Medici-ne 1998;7:4845-51.

5. Cook DJ, Mulrow CD, Haynes RB. Systematic reviews: syn-thesis of best evidence for clinical decisions. Ann Intern Med1997;126:376-80.

6. Siwek J, Gourlay ML, Slawson DC, Shaughnessy AF. How towrite an evidence-based clinical review article. Am Fam Physi-cian 2002;65:251-8.

7. Antman EM, Lau J, Kupelnick B, Mosteller F, Chalmers TC. Acomparison of results of meta-analyses of randomized controltrials and recommendations of clinical experts. Treatments formyocardial infarction. JAMA 1992;268:240-8.

8. Oxman AD, Cook DJ, Guyatt GH. Users’ guides to the medicalliterature. VI. How to use an overview. Evidence-Based Medi-cine Working Group. JAMA 1994;272:1367-71.

9. Ceballos C, Valdizan JR, Artal A, Almarcegui C, Allepuz C,García Campayo J, et al. ¿Por qué la medicina basada en la evidencia? 20 años de metaanálisis. An Med Interna 2000;17:521-6.

10. Molinero LM. Interpretación, utilidad y limitaciones del metaa-nálisis. Gastroenterol Hepatol Continuada 2002;1:311-8.

11. Clarke M, Oxman AD, editors. Cochrane Reviewers’ Handbo-ok 4.2 [updated March 2003]. En: Review Manager (RevMan)[computer program]. Versión 4.2. Oxford, England: The Coch-rane Collaboration, 2003. Disponible en: http://www.cochra-ne.de/cochrane/hbook.htm

12. Centro Cochrane Iberoamericano. Manual de revisores (versiónespañola de «Cochrane Reviewers’ Handbook») [actualización dejunio 2000]. Barcelona: Centro Cochrane Iberoamericano, 2001.Disponible en: http://www.cochrane.es/Castellano/CC_Handbook

148 Gastroenterol Hepatol 2004;27(3):129-49 48

GISBERT JP, ET AL. ¿CÓMO REALIZAR, EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS?

CASPe

CASPe

CASPe

b) ¿Cuáles son los resultados?

6 ¿Cuál es el resultadoglobal de la revisión?

Pista: considera:– Si tienes claro los resultados últimos de la revisión– ¿Cuáles son? (numéricamente, si es apropiado)– Cómo están expresados los resultados? (NNT, odds ratio, etc.)

7 ¿Cuán precisos son los resultados?

Pista: busca los intervalos deconfianza de los estimadores

Fig. 7. Preguntas propuestas por el grupo CASP (Critical AppraisalSkills Programme) para la lectura crítica de una revisión sistemática:b) ¿cuáles son los resultados?8. NNT: número necesario a tratar.

CASPe

CASPe

CASPe

CASPe

CASPe

CASPe

c) ¿Son los resultados aplicables en tu medio?

8 ¿Se pueden aplicar losresultados en tu medio?

Pista: considera si:– Los pacientes cubiertos por la revisión pueden ser suficientemente diferentes de los de tu área– Tu medio parece ser muy diferente al del estudio

9 ¿Se han considerado todoslos resultados importantespara tomar la decisión?

Sí No

10 ¿Los beneficios merecen la penafrente a los perjuicios y costes?

No sé

No séSí No

Sí No

Aunque no esté planteadoexplicitamente en la revisión,¿qué opinas?

Fig. 8. Preguntas propuestas por el grupo CASP (Critical AppraisalSkills Programme) para la lectura crítica de una revisión sistemática:c) ¿son los resultados aplicables en el medio particular en que nos en-contramos?8.

129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 148

Documento descargado de http://www.elsevier.es el 28/04/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.

Page 21: ¿Cómo realizar, evaluar y utilizar revisiones ...dsp.facmed.unam.mx/.../Gisbert-J....Rev-Sist-Gatroenterol-Hepatol-2004.pdf · tos relacionados con un tema, más que uno en profundi-dad

13. Counsell C. Formulating questions and locating primary studiesfor inclusion in systematic reviews. Ann Intern Med 1997;127:380-7.

14. Kunz R, Oxman AD. The unpredictability paradox: review ofempirical comparisons of randomised and non-randomised cli-nical trials. BMJ 1998; 317:1185-90.

15. Dickersin K, Scherer R, Lefebvre C. Identifying relevant stu-dies for systematic reviews. BMJ 1994;309:1286-91.

16. Delgado-Rodríguez M, Sillero-Arenas M. Sesgos en el metaa-nálisis. Med Clin (Barc) 1999;112(Supl 1):43-50.

17. Egger M, Zellweger-Zahner T, Schneider M, Junker C, Lenge-ler C, Antes G. Language bias in randomised controlled trialspublished in English and German. Lancet 1997;350:326-9.

18. Sutton AJ, Duval SJ, Tweedie RL, Abrams KR, Jones DR. Em-pirical assessment of effect of publication bias on meta-analy-ses. BMJ 2000;320:1574-7.

19. McAuley L, Pham B, Tugwell P, Moher D. Does the inclusionof grey literature influence estimates of intervention effective-ness reported in meta-analyses? Lancet 2000;356:1228-31.

20. Huang JQ, Hunt RH. Uses and abuses of meta-analysis in gas-troenterology. Chin J Dig Dis 2002;3:39-42.

21. Chalmers TC, Celano P, Sacks HS, Smith H Jr. Bias in treat-ment assignment in controlled clinical trials. N Engl J Med 1983;309:1358-61.

22. Moher D, Pham B, Jones A, Cook DJ, Jadad AR, Moher M, et al.Does quality of reports of randomised trials affect estimates ofintervention efficacy reported in meta-analyses? Lancet 1998;352:609-13.

23. Juni P, Altman DG, Egger M. Systematic reviews in health care:assessing the quality of controlled clinical trials. BMJ 2001;323:42-6.

24. Oxman AD. Checklists for review articles. BMJ 1994;309:648-51.

25. Moher D, Jadad AR, Nichol G, Penman M, Tugwell P, WalshS. Assessing the quality of randomized controlled trials: an an-notated bibliography of scales and checklists. Control ClinTrials 1995;16:62-73.

26. Jadad AR, Moore RA, Carroll D, Jenkinson C, Reynolds DJ,Gavaghan DJ, et al. Assessing the quality of reports of rando-mized clinical trials: is blinding necessary? Control Clin Trials1996;17:1-12.

27. Gisbert JP, Calvet X, Gabriel R, Pajares JM. Infección por He-licobacter pylori y dispepsia funcional. Metaanálisis de la efi-cacia del tratamiento erradicador. Med Clin (Barc) 2002;118:405-9.

28. Gisbert JP, González L, Calvet X, Roque M, Gabriel R, PajaresJM. Proton pump inhibitors versus H2-antagonists: a meta-analysis of their efficacy in treating bleeding peptic ulcer. Ali-ment Pharmacol Ther 2001;15:917-26.

29. Gisbert JP, Khorrami S, Carballo F, Calvet X, Gené E, Domín-guez-Muñoz E. Helicobacter pylori eradication therapy versusantisecretory non-eradication therapy (with or without long-term maintenance antisecretory therapy) for the prevention ofrecurrent bleeding from peptic ulcer (Cochrane Review). En:The Cochrane Library, Issue 4, 2003. Chichester: John Willey& Sons, Ltd.

30. McQuay HJ, Moore RA. Using numerical results from systema-tic reviews in clinical practice. Ann Intern Med 1997;126:712-20.

31. Moher D, Cook DJ, Eastwood S, Olkin I, Rennie D, Stroup DF.Improving the quality of reports of meta-analyses of randomi-sed controlled trials: the QUOROM statement. Quality of Re-porting of Meta-analyses. Lancet 1999;354:1896-900.

32. Moher D, Cook DJ, Eastwood S, Olkin I, Rennie D, Stroup DF.Mejora de la calidad de los informes de los metaanálisis de en-sayos clínicos controlados: el acuerdo QUOROM. Rev Esp Sa-lud Pública 2000;74:107-18.

33. Cappelleri JC, Ioannidis JP, Schmid CH, De Ferranti SD, Au-bert M, Chalmers TC, et al. Large trials versus meta-analysis ofsmaller trials: how do their results compare? JAMA 1996;276:1332-8.

34. LeLorier J, Gregoire G, Benhaddad A, Lapierre J, DerderianF. Discrepancies between meta-analyses and subsequent largerandomized, controlled trials. N Engl J Med 1997;337:536-42.

35. Moayyedi P, Soo S, Deeks J, Delaney B, Harris A, Innes M, etal. Eradication of Helicobacter pylori for non-ulcer dyspepsia(Cochrane Review). En: The Cochrane Library, Issue 1, 2003.Oxford: Update Software.

36. Bonfill X, Etcheverry C, Martí J, Glutting JP, Urrutia G, Plade-vall M. El desarrollo de la Colaboración Cochrane española.Med Clin (Barc) 1999;112(Supl 1):17-20.

49 Gastroenterol Hepatol 2004;27(3):129-49 149

GISBERT JP, ET AL. ¿CÓMO REALIZAR, EVALUAR Y UTILIZAR REVISIONES SISTEMÁTICAS Y METAANÁLISIS?

129-149 ART ESPECIAL 4016 19/2/04 12:08 Página 149

Documento descargado de http://www.elsevier.es el 28/04/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.