muestreo dirigido por los participantes para el estudio de poblaciones de difícil acceso

5
Artı ´culo especial Muestreo dirigido por los participantes para el estudio de poblaciones de difı ´cil acceso Respondent-driven sampling for the study of difficult access populations Luis Sordo a,b , Sabina Pe ´ rez-Vicente c , Maria M. Rodrı ´guez del A ´ guila d y M. Jose ´ Bravo a,b, * a Centro Nacional de Epidemiologı´a, Instituto de Salud Carlos III, Madrid, Espan ˜a b Centro de Investigacio ´n Biome ´dica en Red de Epidemiologı´a y Salud Pu ´blica (CIBERESP), Madrid, Espan ˜a c Unidad de Apoyo a la Investigacio ´n, Agencia Sanitaria Costa del Sol, Marbella, Ma ´laga, Espan ˜a d Unidad de Gestio ´n Clı´nica de Medicina Preventiva, Vigilancia y Promocio ´n de la Salud, Hospital Virgen de las Nieves, Granada, Espan ˜a Introduccio ´n Entendemos por poblaciones de difı ´cil acceso aquellas que tienen un marco muestral escasamente definido o difı ´cil de construir. Sus miembros suelen recelar de revelar su pertenencia a la misma, bien porque sus actividades este ´n perseguidas por la ley (por ejemplo, consumir drogas ilegales), bien porque sean sancionadas socialmente (por ejemplo, la prostitucio ´ n) o posean caracterı ´sticas que pueden ser estigmatizadoras (por ejemplo, estar infectado por el virus de la inmunodeficiencia humana [VIH] o ser inmigrante ilegal) 1 . Por todo ello, a estas poblaciones, tambie ´n llamadas ocultas, no se les pueden aplicar los me ´ todos de muestreo tradicionales. Para facilitar el reclutamiento de estas poblaciones, desde hace an ˜os se han desarrollado diversas metodologı ´as, como el muestreo tiempo-lugar basado en horas y sitios concretos (time-location sampling) 1 , el muestreo en bola de nieve (snowball sampling) 2 o el centrado en lugares o poblaciones especı ´ficas (targeted sampling) 3 . Una limitacio ´n de estos me ´ todos es que no permiten generalizar los resultados a toda la poblacio ´n que se quiere estudiar (poblacio ´n de referencia). A finales de la de ´ cada de 1990 4 se desarrollo ´ un nuevo proceso, el muestreo dirigido por los participantes o respondent-driven sampling (RDS). Se trata de un me ´ todo que adema ´s de protocolizar una forma de muestreo en cadena para el reclutamiento de poblaciones de difı ´cil acceso, persigue obtener estimadores no sesgados generalizables a la poblacio ´n de referencia de donde se ha extraı ´do la muestra 5 . Para ello, se tienen en cuenta tanto las caracterı ´sticas del proceso de muestreo como variables especı ´ficas referidas a la red social 6 . El RDS es una metodologı ´a exigente en cuanto a las condiciones teo ´ ricas para la obtencio ´n de estimadores no sesgados. Adema ´s, presenta las dificultades an ˜adidas de tratar con observaciones que no son independientes entre ´y de no permitir el ca ´ lculo de los estimadores de incertidumbre asociados al proceso de muestreo. Esto hace que a pesar de la experiencia obtenida con su extensa aplicacio ´n en las u ´ ltimas 2 de ´ cadas en ma ´s de 30 paı ´ses, su superioridad sobre otras metodologı ´as siga debatie ´ ndose 7–9 . El presente artı ´culo tiene como objetivo identificar los aspectos teo ´ rico-metodolo ´ gicos esenciales del RDS, facilitar el conocimiento de sus herramientas y mostrar sus principales dificultades o limitaciones. Pasos para realizar un estudio con metodologı´a de muestreo dirigido por los participantes El muestreo se realiza en cascada y se inicia mediante la seleccio ´n no aleatoria de informantes iniciales (semillas), que sera ´n los encargados de seleccionar un nu ´ mero limitado de nuevos miembros de la poblacio ´n de referencia. Estos nuevos miembros seleccionados tendra ´n a su vez la funcio ´n de seleccionar a otros participantes, que a su vez seleccionara ´n a otros y ası ´ sucesiva- mente. Cada grupo de participantes derivado de una semilla se denomina cadena. El grupo reclutado en cada etapa es una ola, siendo el grupo seleccionado por las semillas la primera ola. Se generara ´ un nu ´ mero suficiente de olas para completar la muestra necesaria o prevista. Med Clin (Barc). 2013;140(2):83–87 I N F O R M A C I O ´ N D E L A R T I ´ C U L O Historia del artı´culo: Recibido el 11 de abril de 2012 Aceptado el 12 de julio de 2012 On-line el 31 de octubre de 2012 * Autor para correspondencia. Correo electro ´nico: [email protected] (M.J. Bravo). ww w.els evier.es /med ic in ac lin ic a 0025-7753/$ see front matter ß 2012 Elsevier Espan ˜a, S.L. Todos los derechos reservados. http://dx.doi.org/10.1016/j.medcli.2012.07.017

Upload: m-jose

Post on 05-Jan-2017

222 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Muestreo dirigido por los participantes para el estudio de poblaciones de difícil acceso

Med Clin (Barc). 2013;140(2):83–87

Artıculo especial

Muestreo dirigido por los participantes para el estudio de poblacionesde difıcil acceso

Respondent-driven sampling for the study of difficult access populations

Luis Sordo a,b, Sabina Perez-Vicente c, Maria M. Rodrıguez del Aguila d y M. Jose Bravo a,b,*a Centro Nacional de Epidemiologıa, Instituto de Salud Carlos III, Madrid, Espanab Centro de Investigacion Biomedica en Red de Epidemiologıa y Salud Publica (CIBERESP), Madrid, Espanac Unidad de Apoyo a la Investigacion, Agencia Sanitaria Costa del Sol, Marbella, Malaga, Espanad Unidad de Gestion Clınica de Medicina Preventiva, Vigilancia y Promocion de la Salud, Hospital Virgen de las Nieves, Granada, Espana

I N F O R M A C I O N D E L A R T I C U L O

Historia del artıculo:

Recibido el 11 de abril de 2012

Aceptado el 12 de julio de 2012

On-line el 31 de octubre de 2012

ww w.els evier .es /med i c in ac l in i c a

Introduccion

Entendemos por poblaciones de difıcil acceso aquellas quetienen un marco muestral escasamente definido o difıcil deconstruir. Sus miembros suelen recelar de revelar su pertenencia ala misma, bien porque sus actividades esten perseguidas por la ley(por ejemplo, consumir drogas ilegales), bien porque seansancionadas socialmente (por ejemplo, la prostitucion) o poseancaracterısticas que pueden ser estigmatizadoras (por ejemplo,estar infectado por el virus de la inmunodeficiencia humana [VIH]o ser inmigrante ilegal)1. Por todo ello, a estas poblaciones, tambienllamadas ocultas, no se les pueden aplicar los metodos de muestreotradicionales.

Para facilitar el reclutamiento de estas poblaciones, desde haceanos se han desarrollado diversas metodologıas, como el muestreotiempo-lugar basado en horas y sitios concretos (time-location

sampling)1, el muestreo en bola de nieve (snowball sampling)2 o elcentrado en lugares o poblaciones especıficas (targeted sampling)3.Una limitacion de estos metodos es que no permiten generalizarlos resultados a toda la poblacion que se quiere estudiar (poblacionde referencia).

A finales de la decada de 19904 se desarrollo un nuevo proceso,el muestreo dirigido por los participantes o respondent-driven

sampling (RDS). Se trata de un metodo que ademas de protocolizaruna forma de muestreo en cadena para el reclutamiento depoblaciones de difıcil acceso, persigue obtener estimadores nosesgados generalizables a la poblacion de referencia de donde se ha

* Autor para correspondencia.

Correo electronico: [email protected] (M.J. Bravo).

0025-7753/$ – see front matter � 2012 Elsevier Espana, S.L. Todos los derechos reserv

http://dx.doi.org/10.1016/j.medcli.2012.07.017

extraıdo la muestra5. Para ello, se tienen en cuenta tanto lascaracterısticas del proceso de muestreo como variables especıficasreferidas a la red social6.

El RDS es una metodologıa exigente en cuanto a lascondiciones teoricas para la obtencion de estimadores nosesgados. Ademas, presenta las dificultades anadidas de tratarcon observaciones que no son independientes entre sı y de nopermitir el calculo de los estimadores de incertidumbreasociados al proceso de muestreo. Esto hace que a pesar de laexperiencia obtenida con su extensa aplicacion en las ultimas2 decadas en mas de 30 paıses, su superioridad sobre otrasmetodologıas siga debatiendose7–9.

El presente artıculo tiene como objetivo identificar los aspectosteorico-metodologicos esenciales del RDS, facilitar el conocimientode sus herramientas y mostrar sus principales dificultades olimitaciones.

Pasos para realizar un estudio con metodologıa de muestreodirigido por los participantes

El muestreo se realiza en cascada y se inicia mediante laseleccion no aleatoria de informantes iniciales (semillas), que seranlos encargados de seleccionar un numero limitado de nuevosmiembros de la poblacion de referencia. Estos nuevos miembrosseleccionados tendran a su vez la funcion de seleccionar a otrosparticipantes, que a su vez seleccionaran a otros y ası sucesiva-mente. Cada grupo de participantes derivado de una semilla sedenomina cadena. El grupo reclutado en cada etapa es una ola,siendo el grupo seleccionado por las semillas la primera ola. Segenerara un numero suficiente de olas para completar la muestranecesaria o prevista.

ados.

Page 2: Muestreo dirigido por los participantes para el estudio de poblaciones de difícil acceso

Tabla 1Principales condiciones para la realizacion de un muestreo dirigido por los

participantes

Poblacion de estudio

No debe estar muy segmentada

Conectada por redes sociales

Estructurarse en redes sociales densas

Tamano de la muestra

Efecto de diseno de 2

Seleccion de semillas (caracterısticas)

Alta disponibilidad

Red social con un elevado numero de personas a las que sea previsible

poder acceder

Alta representatividad de las principales caracterısticas de la poblacion de

estudio

Instrucciones a participantes para que recluten

A personas conocidas (mınimo el nombre y vistas en el ultimo mes)

Con las que existe reciprocidad en la relacion

Preferiblemente que no sean familia

Incentivos

Primario como participante o semilla, secundario como reclutador

Que lleven a la colaboracion sin provocar picaresca (abono transporte,

bono para comida, etc.)

Seguimiento

A traves de cupones

Dando un codigo a cada paciente

Con apoyo de un telefono gratuito

Fijando fechas lımite para reclutar

L. Sordo et al / Med Clin (Barc). 2013;140(2):83–8784

A continuacion se revisan los principales aspectos que deben serincluidos en un protocolo de un estudio con RDS y que tienenconsideraciones especiales en este tipo de metodologıa (tabla 1).

Investigacion formativa

Constituye el primer paso y pretende determinar con la mayorclaridad posible las caracterısticas de la poblacion de referencia, lasdificultades de acceso y comunicacion con ella, las diferentessubpoblaciones que la componen y la profundidad de sus redessociales. Dada la heterogeneidad de las poblaciones que pueden serestudiadas, no existe una unica metodologıa para abordar estaetapa; generalmente se utilizan diversos abordajes que secomplementan, como por ejemplo la realizacion de grupos focalescon miembros potenciales de la poblacion de referencia, oentrevistas en profundidad con informantes clave que trabajancon dicha poblacion generalmente encuadrados en organizacionesno gubernamentales. Esto permitira valorar la factibilidad delestudio y confirmar que el RDS es la opcion adecuada de muestreo.Se han descrito 3 caracterısticas que han de estar presentes enla poblacion de referencia para que el RDS pueda aplicarse: lapoblacion debe encontrarse conectada por redes sociales, estas hande ser densas y la poblacion no debe estar muy segmentada10.

Determinacion del tamano muestral

Se realiza igual que para el resto de estudios, si bien el efecto dediseno recomendado es 2. Es decir, que el tamano muestralcalculado para el objetivo principal ha de ser el doble del que senecesitarıa con un muestreo aleatorio simple6,11. Son estudios enlos que las observaciones no son independientes. Esto conllevamayores intervalos de confianza en sus resultados. El aumento deltamano muestral pretende compensar este efecto.

Seleccion de semillas

Es uno de los elementos mas delicados de esta metodologıa y dela bondad con la que se realice dependeran en gran medida los

resultados. Las semillas deben cumplir los criterios de inclusiondefinidos en el protocolo para la poblacion de referencia, si bien enocasiones no se incluyen en el analisis como sujetos del estudio,sino simplemente como reclutadores. El numero de semillasseleccionadas suele variar entre 6 y 20 dependiendo de diferentesfactores, como el numero de subgrupos a estudiar (segun sexo,edad, etc.), tamano muestral requerido y posibilidad de nocumplimiento como reclutador.

No existe un metodo claramente definido para seleccionarlas;sin embargo, es importante que las semillas cumplan los siguientesrequisitos: tener muy buena disposicion para participar en elestudio, ser representativas de la poblacion de referencia(o subpoblaciones de interes) y tener una red social con un elevadonumero de personas a las que sea previsible poder acceder5.

No obstante, los errores o limitaciones derivados de unaseleccion poco adecuada podran ser corregidos en las sucesivasevaluaciones que se vayan realizando segun avance el recluta-miento. Las dificultades para encontrar unas semillas adecuadaspodran senalarse entre las limitaciones que se describan en ladiscusion de los resultados del estudio.

Proceso de reclutamiento a partir de las semillas

Una vez seleccionadas, a cada semilla se le pide que reclute,durante un perıodo limitado de tiempo, un maximo de 3 nuevosparticipantes que han de cumplir los criterios de inclusion. Otrasrecomendaciones que suelen darse son5,10:

- Que los reclutados sean conocidos de la semilla a los que estahaya visto en el ultimo mes y de los que sepa como mınimo elnombre de pila.

- Que la semilla conozca al reclutado en la misma medida que elreclutado a la semilla.

- Que preferiblemente no sean familiares de la semilla (paraprevenir la sobrerrepresentacion de las redes de un individuoconcreto).

Una vez integradas en el estudio las personas reclutadas por lassemillas, quedara constituida la primera ola. A estas personasreclutadas se les daran las mismas directrices que a las semillas,para que a su vez ellos recluten a nuevos participantes y se vayanconstituyendo sucesivas olas. Para que un estudio tenga validezexterna, se ha considerado que deben alcanzarse al menos entre 4 y6 olas5,12. Este principio de reclutamiento esta basado en la teorıade los 6 grados de separacion, segun la cual cualquier miembro deuna poblacion podrıa ser potencialmente vinculado a otra a travesde una cadena de conocidos de no mas de 6 personas12.

Desde el punto de vista teorico, en ese momento la composicionde la muestra podrıa alcanzar lo que se denomina equilibrio, esdecir, las variables de las personas reclutadas en esas olas serıanindependientes de las semillas de las que se partio y tienenvariaciones mınimas en su distribucion, menores del 2%13. Serıaentonces cuando las caracterısticas de la muestra convergerıan conlas caracterısticas poblacionales. Y este hecho solo se logra cuandose consigue llegar a poblaciones alejadas de las inicialmenteseleccionadas. Este equilibrio puede ser determinado durante elestudio14. De comprobarse que no se ha alcanzado, estaremos atiempo de seguir recogiendo sujetos en sucesivas olas hastaconseguir que las caracterısticas de estas ultimas no cambien deunas a otras.

Seguimiento, incentivos y otros aspectos logısticos

Para la identificacion de las personas que forman parte delestudio, y como herramienta de reclutamiento, se recomienda eluso de cupones. Cada semilla o reclutador recibira tantos cupones

Page 3: Muestreo dirigido por los participantes para el estudio de poblaciones de difícil acceso

1

1.1

1.2

1.3

CódigoParticipante:

Semilla

Primera ola

1.3.3

1.3.2

1.3.1

1.2.3

1.2.2

1.2.1

1.1.2

1.1.1

1.1.1.11.1.1.1.1

1.1.1.1.2

1.1.2.1.1

1.1.2.1.2

1.2.1.1.1

1.2.1.1.2.

1.2.2.1.1

1.2.1.1.1.3

1.3.1.1.1

1.3.1.2.1

1.3.2.2.1

1.3.3.1.1

1.3.3.2.1

1.3.3.3.1

1.3.3.3.2

1.3.3.3.3

1.1.1.1.1.1

1.1.1.1.1.2

1.1.1.1.2.1

1.1.2.1.1.1

1.1.2.1.1.2

1.2.1.1.1.1

1.2.1.1.2.1

1.2.2.1.1.1

1.3.1.1.1.1

1.3.1.1.1.2

1.3.1.2.1.1

1.3.2.2.1.1

1.3.2.2.1.2

1.3.3.1.1.1

1.3.3.1.1.2

1.3.3.3.1.1

1.3.3.3.2.1

1.3.3.3.2.2

1.3.3.3.3.1

1.3.3.3.3.2

1.3.3.3.3.3

1.1.1.2

1.1.1.3

1.1.2.1

1.1.2.2

1.2.1.1

1.2.2.1

1.2.3.1

1.3.1.1

1.3.1.2

1.3.2.1

1.3.2.2

1.3.3.1

1.3.3.2

1.3.3.3

Segunda ola Tercera ola Cuarta ola Quinta ola

Figura 1. Ejemplo de cadena de participantes a partir de una semilla y codigos. Elaboracion propia basada en CDC5 y Johnston et al.6.

L. Sordo et al / Med Clin (Barc). 2013;140(2):83–87 85

como personas se les indique que deberıan reclutar. De estamanera, aquellos candidatos que se presenten para participar en elestudio se identificaran mediante el cupon. En el cupon se indicaracomo, donde y cuando ponerse en contacto con el equipoinvestigador (lo ideal es un telefono gratuito), el tiempo lımitepara hacerlo (una especie de fecha de caducidad del cupon) y uncodigo de identificacion unico. Este codigo debe permitiridentificar la cadena y la ola a las que pertenece un participantedado. Para ello se recomienda codificar alfanumericamenteseparando cada ola con un punto. Ası, la semilla con el codigo 1generarıa una primera ola de 3 personas con los codigos 1.1, 1.2 y1.3, y ası sucesivamente6,12 (fig. 1). En este cupon, ademas, seregistrara el pago de los 2 incentivos recomendados: aquel querecibe cada persona por participar en el estudio (primario), y el querecibe cuando cumple su labor de reclutador (secundario)15.

El lugar de las entrevistas debe ser elegido cuidadosamentedesde la etapa de investigacion formativa. Debe facilitar el cribado(determinacion de que los sujetos cumplen los criterios delestudio) y el pago de los incentivos. Para elegirlo hay que valorar suaccesibilidad, seguridad, privacidad, posibles dificultades para eldesplazamiento de participantes y las reticencias de la poblacionde estudio a ser identificada por la comunidad o sus iguales.

Variables especıficas de muestreo dirigido por los participantes

El protocolo de un estudio con RDS, ademas de cumplir con lascondiciones anteriormente descritas, debe prever la recogida delas siguientes variables en el cuestionario que se aplique a losparticipantes:

- Nivel de aceptacion a participar en el estudio. De cadaparticipante se recogera el numero y las caracterısticas de laspersonas a las que se ofrecio participar en el estudio y lorechazaron.

- Red social de los participantes. Para cada uno se recogera elnumero total de personas que conoce con las mismas caracter-ısticas que las que ha reclutado.

A estas 2 variables se les sumara la que podemos registrar atraves de los codigos:

- Relacion entre las semillas y el resto de los participantes delestudio (quien recluta a quien). Ası, en el ejemplo del apartadoanterior, un participante con el codigo 1.2.3.2.1 podrıa serrapidamente identificado como perteneciente a la cuarta olaprocedente de la cadena generada por la semilla 1.

La primera de estas variables permitira la valoracion de posiblessesgos. En el siguiente apartado se vera la importancia de las2 ultimas en el analisis de los datos.

Analisis de datos

Una vez que hemos completado la muestra prevista, sianalizamos los resultados como si se tratara de un muestreoaleatorio simple, tendrıan el mismo significado que los de unmuestreo en bola de nieve y no serıan extrapolables a la poblacionde referencia.

Las 2 variables que nos permiten hacer la extrapolacion y quedan sentido al RDS son la que determina quien recluta a quien y laque describe la red social de los participantes. Estas variablespermiten determinar varios parametros necesarios para laobtencion de estimadores no sesgados en un estudio conmetodologıa de RDS. En el presente artıculo solo se describenlas bases conceptuales de los mas importantes.

Para una mejor comprension, se introducira un ejemplo(desarrollado con formulas en la figura 2) en el que el objetivoes determinar la prevalencia de la vıa inyectada para el consumo deopioides en una poblacion de difıcil acceso como la de usuariosde drogas ilegales. Los elementos a tener en cuenta serıan:

a) Distribucion de la variable o variables de interes en la muestra(por ejemplo, personas inyectadoras [i] y no inyectadoras [n]).

b) Datos derivados de la variable «quien recluta a quien». Para ellose elaborara una matriz de reclutamiento con la vıa de losreclutadores en las filas, y la vıa de los reclutados en lascolumnas. Esta matriz permite calcular las proporciones departicipantes de cada tipo (inyectadores o no inyectadores)captados a su vez por cada tipo, denominadas proporciones deseleccion (S), siendo, por ejemplo, Sin la proporcion de noinyectadores reclutados por inyectadores.

Page 4: Muestreo dirigido por los participantes para el estudio de poblaciones de difícil acceso

Distri bución por vía en sucesiva s o las a parti r de una semilla de no in yectadores

En las pr imeras olas la distri bución de la población fue heterogénea ll egando a equi librarse en las olas 8-9[Característ icas d e la muestra comienzan a converger con las d e la poblaci ón].

Resulta dos en fun ción de vía y prin cipal es est imad ore s de muestre o RDS

Vía del reclutado

Vía

del

rec

luta

do

r

Inyectado r (i) No inyect ado r(n) Total

Inyectado r (i)Recuento Reclutados 20 45 65

Proporció n m uest ral, S Sii Sin

0,308 0,69 2 1

NoInyectado r(n)

Recuento Reclutados 51 97 14 8

Proporció n m uest ral, S Sni Snn

0,345 0,65 5 1

Total

Distribución total de r eclutados 71 14 3 21 4

Distribución muestral, SD SDi SDn

0,332 0,66 8 1

Muest ra en equil ibrio, E Ei En0,332 0,66 8

Difer encia m edia entr e SD y E <0.001Tamaño medi o de la red ajus tadaN

Ni Nn30,070 31,89 0

Est imació n de la proporció npoblaci onal, P (IC) Pi= Sni* N n/ (Sni * N n) + (Sin * N i)

Pi Pn0,346 0,65 4

(0,235-0,456 ) (0,575 -0,732 )Homof ilia, HHi= (Sii- P i) (1 -P i)

Hi Hn

-0,05 8 0,00 3

El porcentaje estimado (P) de usuarios de droga inyectada es 34 .6%. La simi lit ud de los va lores de la muestra en equ ilibrio(E) con la distribución muestral (indicado por SD) ind ica un a muy buena se mejanz a entre la muestra observada y lapoblación de referencia. De la misma forma, un va lor de homofili a (H) muy cercano a 0 demuestra que los reclutadorestienden a reclutar parti cipant es con diferentes vías con i ndependencia d e l a suya.i: Inyectador; n: No inyect ador; ii: i reclutados por i; ni: i reclutados por n; in: n reclutados por i ;nn: n reclutados por n .S: Proporción muestral; SD: Di stribu ción Muestral; E: Equili brio; N: Tamaño medio del a red ajus tada; P: Proporción muestral;IC: Interva lo de confianza H: Hom ofili a.

Inye ctadores

No Inye ctadores

100

90

80

70

60

50P

orce

ntaj

e

40

30

20

10

00 1 2 3 4 5 6 7

Número de olas

8 9 10

Figura 2. Ejemplo de muestreo dirigido por los participantes (RDS) en usuarios de drogas: distribucion inyectadores o no (vıa).

H: homofilia; i: inyectador; IC: intervalo de confianza; ii: i reclutados por i; in: n reclutados por i; E: equilibrio; N: tamano medio de la red ajustada; n: no inyectador;

ni: i reclutados por n; nn: n reclutados por n; P: proporcion muestral; S: proporcion muestral; SD: distribucion muestral.

L. Sordo et al / Med Clin (Barc). 2013;140(2):83–8786

c) Numero medio (N) de relaciones o tamano de red de cadaparticipante. Ası, por ejemplo, Ni serıa el numero medio de

relaciones que tienen las personas inyectadoras.

A partir de estos valores obtenidos directamente de nuestramuestra, podemos calcular los estimadores poblacionales enusuarios de drogas inyectadores (Pi) y no inyectadores (Pn), juntocon sus intervalos de confianza (fig. 2). Ası, pasamos de las cifrasobtenidas en nuestra muestra a estimadores de la poblacion diana.Por ello, en la manera que se muestra en la figura 2, tantolos resultados recogidos como los estimados deben quedarregistrados a la manera que se indica en el documento STROBE16

con los datos sin ajustar y ajustados.Ademas de los estimadores de proporcion muestrales, existen

otros 2 conceptos clave para interpretar los resultados de unestudio de este tipo: homofilia y equilibrio. El equilibrio quedodefinido anteriormente (Proceso de reclutamiento a partir de

las semillas). La homofilia es una medida que permite cuantificarla tendencia de los participantes a reclutar individuos dentro desu mismo grupo, que habra de valorarse al interpretar losresultados. El valor asignado oscila entre 1 (todos los recluta-mientos se producen entre miembros de un mismo grupo)y -1 (todos los reclutamientos se hacen fuera de un grupodado o establecido). Mediante el calculo de la homofiliapodra determinarse las estructuras sociales existentes en lapoblacion de referencia. Pueden definirse 3 estructuras socialesbasicas:

1. Cohorte: se produce cuando toda la poblacion tiende a reclutar aindividuos con caracterısticas muy parecidas a las propias(homofilia positiva).

2. Bipartida: es aquella en la que todos sus miembros tienden areclutar a personas diferentes a ellos mismos (homofilianegativa).

Page 5: Muestreo dirigido por los participantes para el estudio de poblaciones de difícil acceso

L. Sordo et al / Med Clin (Barc). 2013;140(2):83–87 87

3. Core-periferica: es la mas frecuente y se caracteriza por tratarsede una red social fraccionada en 2. Una de sus partes (la central ocore) tiende a la estructura de cohorte, mientras la otra u otrastienden a la bipartida. En nuestro ejemplo, los inyectadorestenderıan a ser la parte central, mientras que los no-inyectadores constituirıan la parte periferica.

La estimacion de los parametros poblacionales se completa conel calculo de los intervalos de confianza. Para ello es necesariorecurrir a programas informaticos especıficos que permitanobtener estimadores de la incertidumbre en situaciones comomuestreos complejos o la no independencia de las observaciones.Su calculo se realiza mediante tecnicas de boostrap o de remuestreo(simulando que se extraen submuestras repetidas de la muestratotal obtenida), que requieren de una gran potencia de procesa-miento. Los calculos descritos con anterioridad, tratandose de unejemplo en una variable dicotomica, pueden realizarse consencillez. El ejemplo de la figura 2 utiliza tambien una variablede este tipo. Sin embargo, cuando la variable tiene m categorıas,hay que resolver un sistema de m ecuaciones con m incognitas quehace necesario recurrir a programas informaticos. Para profundizaren el analisis de estos datos existe un software especıfico, el RDSATo Respondent Driven Sampling Analysis Tool17. El paquete RDS delprograma R, que es gratuito, facilita igualmente el analisis de datoscon esta metodologıa.

Existen otros conceptos estadısticos a tener en cuenta queescapan del objetivo del presente estudio. Un recurso muy util paraacercarse a ellos se encuentra disponible en el enlace www.responddrivensample.com.

De esta manera, los resultados de una muestra que comenzosiendo seleccionada de manera no aleatoria podrıan extrapolarse atoda la poblacion de referencia como si se hubieran obtenidomediante muestreo aleatorio.

Dificultades y limitaciones

En los estudios con esta metodologıa pueden aparecerdiferentes dificultades. Algunas podran subsanarse, otras habraque identificarlas y tenerlas en cuenta al interpretar los resultados.

- Ruptura de cadena: es frecuente. Se da cuando una semilla o unreclutador de una ola dada no recluta a nadie. En principio sesubsana eligiendo otro reclutador que pueda crear una nuevacadena.

- Cadenas heterogeneas: se producen cuando hay grandesdiferencias en el grado de respuesta o reclutamiento entre unascadenas y otras. En este caso, habrıa que manejar la posibilidadde que exista un sesgo de seleccion aun dentro de la poblacionoculta.

- Red social insuficiente: se produce cuando el numero decontactos a conseguir queda estancado porque las redessociales de unas semillas han quedado cubiertas por otras.En principio ha de evitarse esta eventualidad en la fase deinvestigacion formativa, pero a veces aparece aunque se hayanseguido los pasos de una manera correcta. Podrıa deberse a quese satura la poblacion de referencia, llegando a coincidir lamuestra y la poblacion (con las implicaciones positivas ynegativas que de ello se derivarıan), pero lo mas normal es quese deba a que las semillas han sido elegidas dentro de un grupoautolimitado.

- Los reclutadores no valoran adecuadamente el numero total depersonas que conocen con los criterios que se han establecido. Las

preguntas que se les formulen para la valoracion del tamano desu red social han de ser muy precisas, ası como las instruccionessobre el no reclutamiento de desconocidos y familiares8.

- No se alcanza el equilibrio: aunque los modelos teoricos hablande un momento en el que las caracterısticas de la muestraconvergen con las de la poblacion, no siempre es posible alcanzareste equilibrio7,8. En ese caso, como cuando la red social esinsuficiente, nuestros resultados seran equiparables a los de unmuestreo realizado en bola de nieve y no podrıan inferirse a todala poblacion.

Financiacion

Fondo de Investigaciones Sanitarias (FIS) STPY 1448/11, y de laRed de Trastornos Adictivos (RTA) RD06/0001/1018.

Luis Sordo del Castillo disfruta de un contrato posdoctoral deperfeccionamiento de la investigacion «Sara Borrell».

Conflicto de intereses

Los autores declaran no tener ningun conflicto de intereses.

Bibliografıa

1. Semaan S. Time-space sampling and respondent-driven sampling with hard-to-reach populations. Methodological Innovations Online. 2010;5:60–75.

2. Heckathorn DD. Snowball versus respondent-driven sampling. Sociol Metho-dol. 2011;41:355–66.

3. Kral AH, Malekinejad M, Vaudrey J, Martinez AN, Lorvick J, McFarland W, et al.Comparing respondent-driven sampling and targeted sampling methods ofrecruiting injection drug users in San Francisco. J Urban Health. 2010;87:839–50.

4. Heckathorn DD. Respondent-driven sampling: a new approach to the study ofhidden populations. Soc Probl. 1997;44:174–99.

5. Conducting respondent driven sampling (RDS) studies in diverse settings: atraining manual for planning RDS studies. Centers for Disease Control andPrevention, Atlanta, GA and Family Health International, Arlington, VA; 2007.

6. Johnston LG, Malekinejad M, Kendall C, Luppa IM, Rutherford GW. Implemen-tation challenges to using respondent-driven sampling methodology for HIVbiological and behavioral surveillance: field experiences in international set-tings. AIDS Behav. 2008;12:131–41.

7. Heimer R. Critical issues and further questions about respondent-driven sam-pling: comment on Ramirez-Valles, et al. (2005). AIDS Behav. 2005;9:403–8.

8. Rudolph AE, Crawford ND, Latkin C, Heimer R, Benjamin EO, Jones KC, et al.Subpopulations of illicit drug users reached by targeted street outreach andrespondent-driven sampling strategies: implications for research and publichealth practice. Ann Epidemiol. 2011;21:280–9.

9. Semaan S, Santibanez S, Garfein RS, Heckathorn DD, Des Jarlais DC. Ethical andregulatory considerations in HIV prevention studies employing respondent-driven sampling. Int J Drug Policy. 2009;20:14–27.

10. Mantecon A, Juan M, Calafat A, Becona E, Roman E. Respondent-driven sam-pling: un nuevo metodo de muestreo para el estudio de poblaciones visibles yocultas. Adicciones. 2008;20:161–9.

11. Salganik MJ. Variance estimation, design effects, and sample size calculationsfor respondent-driven sampling. J Urban Health. 2006;83(6 Suppl):i98–112.

12. Semaan S, Lauby J, Liebman J. Street and network sampling in evaluationstudies of HIV risk-reduction interventions. AIDS Rev. 2002;4:213–23.

13. Wejnert C. An empirical test of respondent-driven sampling: point estimates,variance, degree measures and out-of-equilibrium data. Sociol Methodol.2009;39:73–116.

14. Abdul-Quader AS, Heckathorn DD, McKnight C, Bramson H, Nemeth C, Sabin K,et al. Effectiveness of respondent-driven sampling for recruiting drug users inNew York City: findings from a pilot study. J Urban Health. 2006;83:459–76.

15. Cottler LB, Compton WM, Keating S. What incentives are effective rewards for‘hidden populations’ interviewed as a part of research projects? Public HealthRep. 1995;110:178.

16. Von Elm E, Altman DG, Egger M, Pocock SJ, Gøtzsche PC, Vandenbroucke JP,STROBE Initiative. Strengthening the Reporting of Observational Studies inEpidemiology (STROBE) statement: guidelines for reporting observational stu-dies. BMJ. 2007;335:806–8.

17. Volz E, Wejnert C, Degani I, Heckathorn DD. Respondent-driven samplinganalysis tool. Version 6.0.1. Ithaca, NY: Cornell University; 2007.