medidas repetidas

En este trabajo se realiza una exposicin de los mtodos estadsticosque se utilizan ms frecuentemente en el anlisis de medidas repeti-das, haciendo nfasis en el tipo de datos y las limitaciones de cadamtodo. El objetivo principal consiste en dar una visin comparativade los distintos mtodos desde un punto de vista prctico en el entor-no de aplicaciones mdicas. Para cada una de las aproximaciones seplantea una breve introduccin matemtica, una discusin de lascondiciones de aplicacin que permiten tener una idea del tipo de di-seos en los que se puede utilizar y, finalmente, el anlisis de unosdatos concretos con una breve discusin de resultados.

Palabras clave: Medidas repetidas. Anlisis longitudinal. MANOVA.Modelos mixtos.

Repeated measures analysis

In this chapter we present the most frequent statistical methods usedon the repeated measures analysis, putting emphasis on the differenttypes of data and the limitation of each method. The main objectiveconsists in giving a comparison of the different methods from a prac-tical point of view and with a medical perspective. For each approachwe give a brief mathematical introduction, a discussion about theconditions for its application suggesting what kind of data are appro-priated and, finally, it is illustrated by the study of the analysis ofsome data sets including a brief discussion of the results.

Key words: Repeated measures. Longitudinal analysis. MANOVA. Mixedmodels.

Introduccin

En medicina clnica es frecuente disear ensayos en los quese dispone de varias observaciones del mismo sujeto y sepueden tener adems varios grupos de sujetos. Una de lassituaciones ms frecuentes en estos ensayos consiste en elanlisis de datos en los que se dispone de la evolucin dealguna variable a lo largo del tiempo para cada individuo(peso de pacientes, crecimiento tumoral, etc.) en diferentessituaciones experimentales (diferentes tratamientos, diferen-tes dietas, distinguiendo por sexos, etc.) y el objetivo del es-tudio consiste en realizar la comparacin de los grupos me-diante la comparacin de las curvas obtenidas. En otrassituaciones las observaciones repetidas sobre un mismo in-dividuo vienen ocasionadas por el hecho de que se sabeque la variabilidad entre los individuos que se utilizan pararealizar un determinado ensayo es muy grande. En estecaso, con una observacin por individuo ser difcil determi-nar, entre las diferencias entre grupos que se observan, qucomponente es debido a los tratamientos administrados yqu componente es debido a la propia variabilidad de la

muestra analizada. En estas situaciones suele ser interesan-te obtener varias medidas del mismo individuo para podertener una aproximacin (en trminos estadsticos nos referi-remos a control) a esta variabilidad individual.El concepto de medidas repetidas es un trmino que englo-ba las situaciones comentadas anteriormente. En trminosgenerales, se utiliza en aquellas situaciones en las que lavariable respuesta en cada unidad experimental se mide enmltiples ocasiones y, posiblemente, en condiciones experi-mentales distintas. Su mbito de aplicacin es variado, in-cluyendo la biologa, medicina, educacin, psicologa, eco-nometra, etc.Como se ha indicado anteriormente, este tipo de anlisissuelen plantearse en estudios que son longitudinales por na-turaleza, es decir, cuando las medidas se realizan a lo largodel tiempo. En estos casos para cada individuo se disponede una curva que indica el comportamiento de la variableobtenida a lo largo del tiempo y, por lo tanto, el inters secentra en el modelo matemtico que expresa la respuestacomo una funcin del tiempo. Esta funcin, en general, serno-lineal. En el mejor de los casos, podremos proponer unaexpresin determinada para esta funcin teniendo en cuentalas caractersticas del proceso que estamos observando. Sinembargo, en muchos casos deberemos considerar modelosms generales (lineal, cuadrtico, etc.).En determinados estudios experimentales, las medidas re-petidas correspondern a la asignacin de distintos trata-mientos a los sujetos del estudio. En estos casos a cada in-dividuo se le administran todos los tratamientos que sedesean estudiar dejando un perodo prudencial de tiempoentre la administracin de dos tratamientos consecutivospara evitar una posible interaccin entre ellos. En el anlisisde este tipo de situaciones el valor del tiempo en que se re-aliza cada medida es irrelevante, y el objetivo se centrar enla comparacin de los tratamientos teniendo en cuenta quese dispone de una medida de la variabilidad individual aldisponer de varias medidas sobre el mismo sujeto. Un casoparticular de este tipo de anlisis son los diseos cross-over.A modo de resumen, la tabla 1 indica las ventajas y los in-convenientes de este tipo de anlisis en su aplicacin en es-tudios clnicos.Independientemente del diseo experimental con medidasrepetidas que se utilice en una situacin concreta, una delas caractersticas particulares comn a todos ellos es laexistencia de una estructura de correlaciones muy particu-lar entre los datos: las observaciones de un mismo individuoestn correlacionadas, mientras que las observaciones deindividuos distintos estn incorrelacionadas. Este hechoplantea una serie de problemas desde el punto de vista deanlisis estadstico cuya solucin, teniendo adems encuenta el tipo de cuestiones a resolver, da lugar a distintasaproximaciones al problema. En este trabajo se van a indi-car los mtodos ms habituales para abordar este tipo deproblemas en funcin del diseo particular y de los objeti-vos del estudio, haciendo hincapi en la adecuacin decada mtodo a cada situacin concreta.

TCNICAS EMERGENTES

Med Clin (Barc) 2004;122(Supl 1):51-8 51

Anlisis de medidas repetidas

Maria del Carmen Ruiz de Villa

Departament dEstadstica i Investigaci Operativa. Universitat de Barcelona. Barcelona. Espaa.

Correspondencia: Dra. M.C. Ruiz de Villa.Departament dEstadstica. Universitat de Barcelona. Facultat Biologia-Principal.Avda. Diagonal, 645.08028 Barcelona. Espaa.Correo electrnico: [email protected]

09 SUPLEMENTO 2 51-58 23/1/04 10:03 Pgina 51

Documento descargado de http://www.elsevier.es el 30/05/2015. Copia para uso personal, se prohbe la transmisin de este documento por cualquier medio o formato.

En el mbito de la investigacin mdica, este tipo de tcni-cas proporciona una herramienta de anlisis de datos muyinteresante. Por ejemplo, se ha aplicado a la evaluacin decurvas de glucemia1 y al estudio de la concentracin de fr-macos en sangre2. El estudio de curvas de crecimiento esotra de las aplicaciones muy frecuentes3. Otros ejemplos deaplicacin seran el estudio del efecto de determinados tra-tamientos en el grosor de la crnea4 o la evaluacin de unprograma de vacunas de la hepatitis B5.Desde un punto de vista tcnico, y dada la importancia cre-ciente de estas tcnicas en medicina, han aparecido distin-tas revisiones que, desde distintos puntos de vista, analizanlos principales mtodos estadsticos de forma descriptiva6 obien con una cierta base estadstica7-10.

A pesar de que existe ya abundante informacin al respec-to, no se encuentra una exposicin de las distintas aproxi-maciones al anlisis estadstico en estos ensayos en la quese haga ms nfasis en el tipo de resultados que se puedenobtener con un ejemplo numrico de cada uno de los mto-dos que se pueden aplicar. Esta revisin se ha planteadocon el objetivo de suplir este vaco.

Definiciones bsicas

De cara a una mejor comprensin de los mtodos de an-lisis en los diseos de medidas repetidas es preciso defi-nir algunos conceptos estadsticos que son caractersticosde estos mtodos. Se suele referir como covariables aaquellas variables o factores que pueden afectar a la res-puesta. Estas covariables pueden clasificarse en dos cate-goras:

Internas (inner, within): varan en las observaciones deuna misma unidad experimental. Por ejemplo, seran eltiempo, los tratamientos en un diseo cross-over, etc. Externas (outer, between): se mantienen constantes paratodas las observaciones de una misma unidad experimen-tal. Por ejemplo, el sexo, los tratamientos cuando se admi-nistran a grupos de unidades experimentales, etc.

Dependiendo del nmero de medidas repetidas distinguire-mos entre:

Diseos equilibrados: con un nmero fijo de medidas porunidad experimental, tomadas a los mismos instantes detiempo para todas ellas y sin valores faltantes. Diseos no equilibrados: con un nmero variable de me-didas en cada unidad experimental, realizadas a distintosinstantes de tiempo.

Debido a la multitud de aplicaciones que tiene esta metodo-loga y a que existen diferentes aproximaciones estadsticaspara analizar los datos, suele suceder que un mismo con-cepto aparezca en la bibliografa con distintos nombres. Enparticular, una primera aproximacin al tema puede llevar-nos a cierta confusin, tanto en lo que se refiere a la estruc-tura de los datos y al diseo de los estudios como al mismoprocedimiento estadstico de anlisis de los mismos. Con elobjetivo de facilitar la comprensin de los distintos concep-tos, en la tabla 2 se definen los utilizados ms frecuente-mente. A lo largo de esta revisin, trataremos los diferentesmtodos para el anlisis de datos longitudinales. El estudiode los diseos cross-sectional queda fuera de los objetivosde este trabajo.

RUIZ DE VILLA MC. ANLISIS DE MEDIDAS REPETIDAS

52 Med Clin (Barc) 2004;122(Supl 1):51-8

TABLA 1

Ventajas e inconvenientes en el anlisis de medidasrepetidas

Ventajas del anlisisPermiten evaluar eficientemente los cambios entre unidades

experimentales y, dentro de stas, a lo largo del tiempoDada la correlacin positiva que existe entre las observaciones de una

misma unidad experimental, las comparaciones entre los tratamientos asignados a cada unidad experimental se harn con ms precisin

Desventajas del anlisisDada la correlacin positiva que existe entre las observaciones de

una misma unidad experimental, las comparaciones entre los tratamientos asignados a cada unidad experimental se harn con ms precisin

Las comparaciones entre tratamientos asignados a grupos de individuos (con el mismo tratamiento a lo largo del tiempo) se realizan de forma menos eficiente

Usualmente aparece una heterogeneidad entre las medidas repetidas que se suele reflejar en una heterocedasticidad, es decir, unavarianza distinta a lo largo del tiempo. Este problema escaracterstico en las curvas de crecimiento en las que en el tiempoinicial las curvas de las unidades experimentales partenprcticamente de un mismo punto, mientras que a medida queavanza el tiempo se van dispersando cada vez ms. La solucin aeste problema requiere una cierta habilidad para encontrar elmodelo de heterocedasticidad adecuado

Datos longitudinalesEn los que se estudia la variacin de la respuesta a lo largo del tiempo.

En ellos, fundamentalmente, interesa conocer el modelo querelaciona la respuesta con el tiempo

Medidas repetidasSe asignan repetidamente una serie de tratamientos a cada individuo,

de forma que cada unidad experimental se considera control de smisma. Este nombre ha pasado a designar de forma general losestudios en que se observa un individuo de forma repetida,independientemente de la forma del experimento

Curvas de crecimientoLa relacin que se desea estudiar es la de la respuesta en funcin de

la dosis o bien en funcin del tiempo siendo sta crecienteDatos agrupados (multilevel)

Son usuales cuando se estudian poblaciones con una estructura jerrquica (ciudad, hospital, etc.). En estos estudios el objetivo essaber en qu medida las caractersticas de un determinado nivelafectan al valor de la variable respuesta

Datos multivariantesSe habla de datos multivariantes cuando se dispone del valor de varias

variables sobre una misma unidad experimental,independientemente de cmo son estas variables y del tipo decorrelacin que exista entre ellas. En este caso una observacinmultivariante de un individuo sera el conjunto de medidas repetidasobtenidas en el mismo

Datos correlacionadosEste nombre incluye todo tipo de datos en los que se observa una

cierta estructura de correlacin

TABLA 2

Conceptos relacionados en distintos tipos de diseos y tcnicas de anlisis de medidas repetidas

TABLA 3

Resultado de un ensayo clnico donde se determina elestado de cada individuo a lo largo de tres instantes detiempo. La asignacin al grupo control y al grupo tratadose ha realizado al azar. Los datos son ficticios y seproponen a modo de ejemplo

Individuo t1 t2 t3

Control 1 4 7 62 3 10 73 4 8 64 5 11 5

Tratamiento 1 2 1 82 2 2 73 3 0 74 5 1 6



Aproximacin univariante

Supongamos que queremos estudiar el efecto de un trata-miento sobre una determinada enfermedad, y que para ellorealizamos un ensayo clnico controlado en el que compara-remos un grupo de individuos que han recibido el tratamien-to respecto a otro grupo control (tabla 3). Cada individuo seha observado en 3 instantes de tiempo que supondremosiguales para todos los individuos. Una primera aproximacinal anlisis de estos datos consiste en realizar una representa-cin grfica. sta puede hacerse individualmente (fig. 1a) obien con un grfico para cada grupo (fig. 1b).

Utilizacin del anlisis de la varianza (ANOVA)

En el ejemplo de la figura 1 encontramos una situacin tpi-ca de medidas repetidas en las que se pueden resaltar al-gunas caractersticas:

El comportamiento de ambos grupos a lo largo del tiempono es igual. A pesar de que en ambos grupos la funcin sepuede expresar mediante un polinomio de segundo grado,el hecho de que las curvas tengan una orientacin opuestaindica que algunos coeficientes de los polinomios tendrnsigno opuesto. El comportamiento de todos los individuos de un mismogrupo es similar, aunque se pueden observar diferenciasentre ellos respecto al comportamiento medio del grupo. En algunos instantes de tiempo la variabilidad es mayorque en otros.

Una primera aproximacin al problema consiste en plantearun diseo de anlisis de la varianza que refleje de algunaforma la correlacin que existe entre las observaciones deun mismo individuo. Un modelo adecuado sera:

yijk = + i + j(i) + k + ik + kj(i) + ijkdonde i corresponde al efecto del grupo (con i = 1,2 co-rrespondiendo a control y tratamiento, respectivamente), j(i)al efecto del individuo j (j = 1,2,3,4) del grupo i (indicamos

entre parntesis que cada individuo est exclusivamenteest anidado en un grupo i), k el efecto del tiempo (k =1,2,3) y los trminos ik y kj(i) a las interacciones entrefactores. Este tipo de diseo (conocido tambin como dise-o split-plot) ha sido muy utilizado en el anlisis de este tipode datos a pesar de que son necesarios una serie de requi-sitos de difcil cumplimiento, sobre todo en el mbito de losestudios clnicos. Estos requisitos son:

1. Homogeneidad de las matrices de covarianzas en cada gru-po. Es decir la variabilidad de los datos en cada instante detiempo tiene que ser la misma en todos los grupos y tambinla dependencia entre observaciones de un mismo individuo.2. La matriz de covarianzas debe presentar la propiedad desimetra compuesta (compound symmetry), es decir la co-rrelacin entre observaciones alejadas en el tiempo, para unmismo individuo, ha de ser la misma independientementede la distancia entre las observaciones.



2 3 4 5 6Tiempo

2 3 4 5 6

2 3 4 5 6 2 3 4 5 6

8 6 7 5

1 3 2 4

10

8

6

4

2

0

10

8

6

4

2

0Y

A

Figs. 1a y b. Representacin de los datosde la tabla 3. A: Por individuos. B: por gru-pos.

Fig. 1b.

10

8

6

4

2

0

2 3 4 5 6

2 3 4 5 6

Tiempo

Y

1 2

B



3. El diseo debe ser equilibrado.4. El nmero de individuos en cada grupo ha de ser el mis-mo.

La condicin 2 es muy estricta, ya que requiere que exista lamisma dependencia tanto entre dos observaciones seguidasen el tiempo como entre dos observaciones alejadas. En elcaso particular de nuestro ejemplo se cumplen las condicio-nes para la aplicacin del mtodo univariante, por lo que pro-cedemos a realizar el anlisis correspondiente. La tabla 4 con-tiene los resultados del anlisis de la varianza (tabla ANOVA).A partir de estos resultados podemos concluir que hay dife-rencias entre los grupos, entre los tiempos y adems la inte-raccin entre el tiempo y el grupo tambin es significativa.Esta interaccin se interpreta como un comportamiento dis-tinto, en cada grupo, de la evolucin de la variable medida alo largo del tiempo. Este comportamiento viene expresado entrminos de una funcin matemtica. En este caso se ha es-tudiado si podemos admitir una funcin lineal o una cuadr-tica. Tal como se ve en la tabla 4 es la componente cuadrti-ca la que es significativa (como ya se intua en la fig. 1).

Utilizacin incorrecta del anlisis

Frente a unos datos del tipo del ejemplo anterior, se podrapensar que un anlisis vlido y sencillo sera realizar unacomparacin de los grupos en cada instante (por ejemplo,una t de Student en caso de 2 muestras). Esta solucin seobserva frecuentemente en trabajos de investigacin mdi-ca con una estructura de datos similar a la de este ejemplo.Sin embargo, los resultados obtenidos mediante esta aproxi-macin no se pueden considerar como vlidos debido a lassiguientes razones:

No se tiene en cuenta la correlacin de los datos para unmismo individuo a lo largo del tiempo. El error asociado total sera mucho mayor que el que seobtiene cuando se realiza una sola prueba (es decir, esta-mos frente a un problema de comparaciones mltiples). La forma de las curvas en cada grupo puede ser distinta(como en nuestro ejemplo) y eso no queda reflejado en elanlisis tiempo a tiempo. Normalmente el nmero de individuos utilizados en cadagrupo es pequeo. Si se realiza un ANOVA, este problemano es grave ya que para realizar los contrastes se utiliza lainformacin de todos los datos. Sin embargo, al realizar lascomparaciones a cada instante de tiempo slo se utilizanlos datos de ese tiempo con lo que el anlisis acostumbratener una potencia (capacidad para encontrar diferenciasentre grupos) muy baja.

Aproximacin multivariante

En la mayora de las situaciones experimentales relaciona-dos con este tipo de diseo de datos no se cumplen lascondiciones de aplicacin del anlisis anterior. En estos ca-sos ser necesario plantear nuevas aproximaciones quepermitan resolver el problema de forma eficaz. Una solucinconsiste en utilizar las ventajas que ofrece el anlisis multi-variante de la varianza (MANOVA). Esta tcnica no precisade ningn requisito para la forma de la matriz de covarian-zas (aunque s es necesario que las matrices sean igualesentre grupos).El MANOVA considera que todas la medidas repetidas deun mismo sujeto no son ms que una observacin multiva-riante y, por lo tanto, la comparacin de grupos se realizamediante la versin multivariante del anlisis de la varianza.Este anlisis ser apropiado cuando se pretenda detectardiferencias entre grupos a partir del conjunto de medidasrepetidas, pero no interesen tanto las medidas individualesa cada instante de tiempo.Desde un punto de vista de estructura de datos, y de formasimilar al modelo anterior, los instantes de tiempo en losque se realizan las observaciones deben ser iguales para to-dos los individuos y se deben tener observaciones comple-tas. A modo de ejemplo, la tabla 5 contiene un conjunto dedatos acerca de la frecuencia cardaca (latidos por minuto)medidos en 20 varones asignados al azar a cada uno de 4tratamientos (5 personas por tratamiento) y medidos cada 5minutos durante 7 intervalos de tiempo. El conjunto de es-tas medidas no cumple las condiciones requeridas en elanlisis univariante comentadas anteriormente. Por lo tantoaplicaremos el mtodo multivariante.

Anlisis de perfiles

En el MANOVA, la forma explcita de realizar la compara-cin de grupos es mediante el llamado anlisis de perfiles.Este anlisis estudia la forma de las curvas asociadas acada sujeto permitiendo profundizar en las causas de las di-ferencias observadas en las observaciones y obtener resul-tados similares al estudio univariante. As se podr estudiar: La comparacin de grupos, analizando la coincidencia delos perfiles de las curvas de los individuos de cada grupo. El efecto del tiempo, es decir, la equivalencia de las res-puestas a partir de la constancia de los perfiles. La interaccin entre el tiempo y el grupo, a partir del estu-dio del paralelismo de los perfiles.

La tabla 6 contiene los resultados de aplicar el anlisis MANO-VA a los datos del ejemplo de la tabla 5. Para cada uno de los



TABLA 4

Tabla ANOVA correspondiente al anlisis de los datos de la tabla 3

Efecto Valor F Valor de p

Grupo 64 0,000Tiempo 10,8 0,002Grupo tiempo 26,8 0,000

Efecto lineal 2,182 0,190Efecto cuadrtico 56,889 0,000

Tratamiento Individuo t1 t2 t3 t4 t5 t6 t7

1 1 73 74 74 78 79 81 791 2 78 77 76 79 84 88 861 3 73 73 74 78 81 81 791 4 75 72 73 74 79 82 801 5 75 74 73 78 82 84 822 6 72 74 76 80 81 83 812 7 77 77 78 81 85 86 842 8 72 74 78 80 84 86 842 9 77 80 78 83 85 86 842 10 74 75 75 80 84 85 833 11 79 80 81 83 83 83 823 12 73 76 74 81 79 82 813 13 68 68 74 75 76 78 773 14 75 77 80 81 85 89 883 15 72 74 81 79 82 83 824 16 78 82 83 87 91 92 874 17 78 81 81 85 89 92 874 18 78 80 81 82 87 87 824 19 71 75 76 80 85 85 804 20 80 83 86 86 90 90 85

TABLA 5

Estudio de la frecuencia cardaca en 4 tratamientos. Cadaindividuo ha sido observado en siete instantes de tiempodistintos



factores analizados aparecen 4 valores de test con su nivel designificacin, y se observa que hay diferencias entre trata-mientos, entre tiempos y en la interaccin. De estos resultadoscabe destacar el anlisis de la interaccin. Como la interaccinentre el tiempo y el tratamiento es significativa, podemos con-cluir que los perfiles no son paralelos y, por lo tanto, el com-portamiento de los individuos de los 4 grupos es distinto.

Modelos mixtos

Los 2 mtodos anteriores no tienen en cuenta alguna de lascaractersticas tpicas de los datos con medidas repetidas.Estas caractersticas se ponan de manifiesto en el ejemplode la figura 1 y se presentan frecuentemente en medicina.As, por un lado se observa que existe una curva muy claraen la evolucin de las observaciones de ambos grupos a lolargo del tiempo (en el ejemplo comentado, los resultadosdel grfico sugieren un polinomio de segundo grado), sien-do del mismo tipo para ambos grupos, pero seguramentecon coeficientes distintos (la orientacin del polinomio esdistinta en cada grupo). Por otro lado, dentro de cada grupose observa una gran variabilidad en las curvas individuales,lo que indica que un modelo que no tenga en cuenta esteproblema tendr una variabilidad experimental muy grande,con lo cual no resultar eficaz para realizar el anlisis. Laaproximacin a partir de los modelos mixtos es idnea parahacer frente a estos problemas ya que permite, por un lado,establecer la expresin funcional que explica la evolucinde la medida observada a lo largo del tiempo y, por el otro,que los parmetros de esta funcin puedan variar de sujetoa sujeto. As, podemos tener modelos lineales, que suponenque la relacin se puede expresar mediante la ecuacin deuna recta o de un polinomio, o bien modelos no linealesque incluyen cualquier otro tipo de funcin. La decisin so-bre el tipo de modelo puede ser un inconveniente en la utili-zacin de estos modelos, ya que no siempre es fcil decidircul es la funcin que mejor se ajusta a nuestros datos.A pesar de este inconveniente, los modelos mixtos presen-tan muchas ventajas frente a los modelos anteriores por va-rias razones:

Se basan en plantear un modelo para un individuo tpico,i, al que se han realizado pi observaciones a instantes detiempo ti1,ti2,...,tipi. En este modelo no es necesario tener losmismos instantes de tiempo para cada individuo ni observa-ciones completas. Tampoco es necesario que los grupostengan el mismo nmero de unidades experimentales.

El modelo individual, con parmetros propios, consisteen una funcin (lineal o no lineal, aunque en nuestro

caso, para simplificar, consideraremos que es lineal) cu-yos coeficientes se expresan como una suma de 2 com-ponentes: una componente poblacional, fija para todoslos individuos y que representa el valor medio del par-metro dentro del grupo, y una componente aleatoria, dis-tinta para cada individuo, que expresa la parte del par-metro que es propia de cada sujeto. Con ello los modelosmixtos recogen aquellas situaciones en las que los perfi-les de los individuos de un mismo grupo puedan diferirentre s. Las matrices de covarianzas no tienen por qu tener unaestructura concreta y adems permiten dar un modelo paraexplicar la diferente variabilidad de los datos a lo largo deltiempo y para identificar la correlacin entre las observacio-nes a lo largo del tiempo.

Modelo

En nuestro ejemplo, a partir de los grficos de cada grupo(fig. 1), se puede concluir que un modelo apropiado podraser un polinomio de segundo grado. El modelo mixto sera:

yij = (0 + b0i) + (1 + b1i)tij + (2 + b2i)tij2 + ijen el que yij es la respuesta del individuo i a tiempo tij; 0, 1y 2 corresponden a los parmetros poblacionales y b0i, b1i yb2i a la componente aleatoria de los mismos. El efecto delgrupo se incorpora como un elemento ms del modelo.Desde un punto de vista terico, se supone que b0i, b1i y b2ison variables aleatorias de media 0 y matriz de covarianzasdesconocida , y que los errores siguen una ley normal conuna matriz de covarianzas i, con una estructura similar paratodos los individuos diferencindose solamente en la dimen-sin pues, tal como hemos indicado, cada individuo puedetener un nmero distinto de observaciones. En esta ltimamatriz se recogen las varianzas a cada instante de tiempo ylas covarianzas (correlaciones) entre los tiempos. Aparte deesta matriz, el hecho de que todas las observaciones de unindividuo compartan los mismos valores de b0i, b1i y b2i esotra forma de expresar la correlacin de los datos.

De forma general se puede expresar el modelo mixto como:

yi = Xi + Zibi + isiendo yi el vector de pi observaciones repetidas del indivi-duo i, Xi la matriz de diseo de los efectos fijos, Zi la matrizde diseo de los efectos aleatorios, bi el vector de efectosaleatorios N(0,) y i los residuos, N(0,i) siendo estos dosltimos independientes.



Fuente Suma de cuadrados gl Media cuadrtica F Valor de p

Trat 615,736 3 205,245 4,570 0,017

Efecto Valor F Gl hiptesis Gl del error Valor de p

TiempoTraza de Pillai 0,995 470,983 5,000 12,000 0,000Lambda de Wilks 0,005 470,983 5,000 12,000 0,000Traza de Hotelling 196,243 470,983 5,000 12,000 0,000Raz mayor de Roy 196,243 470,983 5,000 12,000 0,000

Tiempo tratTraza de Pillai 1,910 4,908 15,000 42,000 0,000Lambda de Wilks 0,003 15,737 15,000 33,528 0,000Traza de Hotelling 78,109 55,544 15,000 32,000 0,000Raz mayor de Roy 75,678 211,897 5,000 14,000 0,000

TABLA 6

Tabla MANOVA resultado del anlisis de los datos de la tabla 5. Se indican los valores de las distintas aproximacionesal test



Anlisis estadstico

El anlisis estadstico de los modelos mixtos se basa en de-ducir y estimar el modelo que, con un mnimo nmero deparmetros, se ajusta a los datos experimentales. Para estose sigue una serie de pasos sucesivos:

1. Se estima el modelo propuesto considerando que: Todos los parmetros tienen una componente fija y aleato-ria. La matriz i tiene la estructura ms sencilla posible, con-sistente en un valor de varianza igual a todos los tiempos(2) e incorrelacin de los datos. Es decir i = 2I.Con este modelo los parmetros a estimar son: la compo-nente fija de los parmetros (0, 1 y 2 en nuestro ejemplo),la estimacin de los elementos de la matriz (con lo queser posible conocer la estimacin de las componentes ale-atorias) y la estimacin de 2.

2. A partir de los resultados obtenidos se reajusta el modelosiguiendo los siguientes criterios: Si la varianza de la componente aleatoria de algn par-metro est cercana a cero, se elimina la componente aleato-ria consiguiendo un modelo con menos trminos y, por lotanto, ms fcil de interpretar. Mediante el anlisis de un grfico de residuos del modelose cambia la matriz i dndole una estructura concreta.Este paso puede presentar alguna dificultad y requiere unacierta experiencia.

3. Cada vez que se considera un nuevo modelo, a partir dela modificacin de un modelo previo, es necesario compro-bar la validez de la modificacin mediante una prueba esta-dstica que certifique la mejora del ajuste con el nuevo mo-delo. En caso de que el test estadstico indique una mejorasignificativa, se aceptar la modificacin. En este procesoiterativo de mejora del modelo, un punto importante es elestudio de la influencia de las covariables que identifican alos grupos de individuos y que se introducen en el modelocomo un factor ms. En caso de que el factor sea significati-vo, podremos confirmar la diferencia entre las curvas expe-rimentales de los distintos grupos.

Ejemplo de modelo mixto

A modo de ilustracin, consideraremos un ejemplo clsicoanalizado por Little y Rubin11 y que corresponde al segui-miento del proceso de crecimiento en 11 nias y 16 nios.A cada nio se le midi la distancia desde el centro de la pi-tuitaria a la fisura maxilar, a las edades de 8, 10, 12 y 14aos. En este caso, se considera que la relacin entre lamedida y el tiempo es lineal. Los anlisis han sido realiza-dos mediante el paquete estadstico S-Plus12.La figura 2 muestra, para cada sexo, la adecuacin de unmodelo lineal para explicar la relacin entre la distancia y laedad. Tambin se observa la presencia de algn nio conun comportamiento errtico y que podra ser un candidato aser excluido, aunque nosotros lo dejaremos en el anlisis yaque la exclusin de observaciones debe hacerse en colabo-racin con el experimentador.A continuacin se detallan los pasos seguidos para obtenerel modelo definitivo con los resultados parciales que se hanido obteniendo y que justifican el proceso que se ha segui-do. A lo largo del anlisis se van a ir planteando distintosmodelos que se estimarn y que nos permitirn determinarsi se cumplen las hiptesis de igualdad de grupos. El primerajuste realizado ha sido a un modelo mixto completo, es de-cir suponiendo que todos los parmetros del modelo tienenparte fija y aleatoria, con la matriz de varianzas y covarian-zas de los efectos aleatorios sin una estructura particularque permita simplificar el modelo y con la matriz de varian-zas y covarianzas de los errores igual a 2I. Este primer mo-delo (que llamaremos modelo I) es, por lo tanto:

yij = (0 + b0i) + (1 + b1i)xij + ijdonde yij es la distancia del nio i medida a la edad j, xij laedad j del nio i. La estimacin de los parmetros que ca-racterizan este modelo son:

1. Para los efectos aleatorios, la estimacin de las varianzasde los 2 parmetros y de la correlaciones entre ambos essuficiente para conocer la matriz :

2(b0i) = 5,415, 2 (b0i) = 0,0513, corr(b0ib1i) = 0,609



Edad (aos)

8 9 10 11 12 13 14

8 9 10 11 12 13 14

30

25

20

Dis

tanc

ia d

e la

pitu

itaria

a la

fisu

ram

axila

r (m

m)

Varn Mujer

Fig. 2. Representacin por sexos de losdatos del ejemplo de la tabla 5.



2. El valor de 2 es 1,716.

3. Para los parmetros fijos: 0 = 16,7611, 1 = 0,662, am-bos significativos. El hecho de que 1 sea significativo indicaque hay diferencias a lo largo de la edad.

El grfico de residuos (fig. 3) muestra una mayor variabili-dad en los nios que en las nias, con lo que se sugiereuna estructura para la matriz i que incluya esta heteroce-dasticidad. El modelo propuesto consiste en una matriz enla que la varianza de los residuos toma dos valores: unopara las observaciones de los nios y otro para la de las ni-as. A continuacin se realiza la estimacin de los parme-tros anteriores: 2 (nios) = 2,707 y 2 (nias) = 0,4418, yse ajusta un nuevo modelo (modelo II) corrigiendo el ante-rior a partir de las estimaciones de las varianzas obtenidas.La comparacin entre ambos modelos es significativa conun mejor ajuste para el segundo. El grfico de residuos (queno se indica) muestra que en el modelo corregido los resi-duos ya no presentan heterocedasticidad. Como no se de-tecta la presencia de ninguna estructura de correlacionespara los residuos, se decide no analizar con ms detalle laestructura de la matriz i.Debido a que en la figura 2 se observaba que las rectas delos nios parecan distintas de las de las nias, se continael estudio incluyendo la covariable Sex en el modelo inicial.La manera de incluirla consiste en definir el nuevo modelo(modelo III) con dos trminos ms, uno que recoge la in-fluencia del sexo en las curvas y otro que recoge la interac-cin entre la edad y el sexo:

yij = (0 + b0i) + (1 + bli)xij + 2Sex + 3Sex*xij + ijEl anlisis de la significacin de los dos trminos aadidoses equivalente al estudio del efecto grupo y de la interaccinde las aproximaciones univariante y multivariante descritaspreviamente. Este nuevo modelo ajusta significativamentemejor que el anterior (el valor del estadstico de razn de ve-

rosimilitud es 11,75 con un valor de p de 0,0028). Como re-sultado del ajuste la estimacin de los parmetros fijos deeste nuevo modelo es:

0 = 16,857, 1 = 0,516, 2 = 0,632 y 3 = 0,152, siendo2 no significativo.Este hecho sugiere suprimir este trmino del modelo yajustar un cuarto modelo (modelo IV). El nuevo modelopresenta un ajuste equivalente al tercero (el test de raznde verosimilitud es 0,5337 con un valor de p de 0,5021).Como que es ms sencillo que el modelo III, ya que tieneun parmetro menos, se decide escoger este ltimo comovlido. Al haber excluido el trmino 2Sex, se deduce quelas rectas de los nios y las nias tienen aproximadamentela misma ordenada en origen; es decir, no hay diferenciasal inicio del ensayo entre ambos grupos, aunque la existen-cia de un trmino de interaccin Sex*xij indica que la evo-lucin de ambos grupos a lo largo de las distintas edadesha sido distinta.El siguiente paso consiste en analizar si la parte del mode-lo propuesta para los efectos aleatorios puede ser simplifi-cada. Recordemos que esto implica analizar con detalle laestructura de la matriz . Debido a que en los resultadosdel primer modelo se observaba una correlacin baja(0,609) vamos a considerar el caso en que sea nula.Para ello se ajusta un quinto modelo (modelo V) bajo estasuposicin. La comparacin con el anterior mediante eltest de razn de verosimilitud da un estadstico de 0,4505con un valor de p de 0,5021. Estos resultados muestranque no hay diferencias significativas entre ambos mode-los, siendo el ltimo ms simple y, por lo tanto, el modelodefinitivo escogido. Por lo tanto, el modelo que se ajustamejor a las observaciones de los nios y las nias es:

yij = (16,857 + b0i) + (0,516 + b1i)xij 0,152Sex.xij + ijcon

2(b0i) = 5,415, 2(b0i) = 0,0513, corr(b0ib1i) = 0



3

2

1

0

1

2

3

Res

iduo

s es

tand

ariz

ados

Valores (mm)

18 20 22 24 28 3026

18 20 22 24 28 3026

Fig. 3. Grfico de residuos de modelo Icorrespondiente al anlisis mediante latcnica de modelos mixtos (vase texto).



La utilizacin de los modelos mixtos aporta un buen conoci-miento del tipo de estructura estadstica subyacente a losdatos aunque, tal como se observa en este ejemplo, su apli-cacin requiere conocer adecuadamente el mtodo estads-tico y tener una cierta experiencia en su aplicacin.

Conclusiones

A lo largo de este trabajo, y mediante la discusin de losejemplos, se ha intentado dar una visin comparativa de laforma de abordar el anlisis de medidas repetidas en fun-cin del tipo de datos disponibles. Tal como se ha indicado,la aproximacin univariante tiene como principal caracters-tica su facilidad de aplicacin al poderse utilizar un softwareestndar para el anlisis y, sobre todo, la facilidad de inter-pretacin por la simplicidad de la tcnica empleada. El prin-cipal inconveniente reside en la restriccin que supone enla matriz de covarianzas, lo que delimita seriamente sucampo de aplicacin a casos muy concretos. Como primeraalternativa, el mtodo multivariante no tiene tantas restric-ciones en cuanto a la matriz de covarianzas, pero requiereque los datos sean equilibrados y completos, aspecto difcilde conseguir en los estudios mdicos donde el seguimientode los pacientes se realiza mediante visitas que no siemprese realizan en la fechas programadas. En este caso tambinse dispone de software estndar para realizar los anlisisaunque la interpretacin de los resultados ya no sea tan in-tuitiva como en el caso anterior.Los modelos mixtos aportan una potencia de anlisis que nopermitan los mtodos anteriormente indicados. Esta mejoraen la capacidad de obtener el mximo de informacin delos datos va, no obstante, unida a una complejidad del m-todo que determina que un usuario con conocimientos bsi-

cos de estadstica no pueda realizar el anlisis de forma efi-ciente. En este caso es necesario acudir a un especialistapara que, utilizando un software especfico, pueda obtenerel mejor modelo y nos ayude a explicar el comportamientode los datos obtenidos.

REFERENCIAS BIBLIOGRFICAS

1. Sievenpipe JL, Arnason JT, Leiter LA, Vuskan V. Variable effects of Ame-rican ginseng: a batch of American ginseng (Panax quinquefolius L.)with a depressed ginseniside profile does not affect postprandial glyce-mia. Eur J Clin Nutr 2003;57:243-8.

2. Kinon BJ, Stauffer VL, McGuire HC, Kaiser CJ, Dickson RA Kennedy JS.The effects of antipsychotic drug treatment on prolactin concentration inelderly patients. J Am Med Dir Assoc 2003;4:189-94.

3. Hanna SE, Law MC, Rosembaum PL, King GA, Walter SD, Rusell DJ.Development of hand function among children with cerebral palsy:growth curve analysis for ages 16 to 70 months. Dev Med Child Neurol2003;45:448-55.

4. Pall BR, Barr JT, Szczotka LB, Mitchell GL, Gleason W. Corneal thick-ness results in the Menicon Z 30-day continuous wear and ACUVUE 7day extended wear contact lens clinical trial. Eye Contact Lens2003;29:10-3.

5. Renard D, Bruckers L, Molenberghs G, Vellinga A, Van Damme P. Repe-ated measures models to evaluate a hepatitis B vaccination programme.Stat Med 2001;20:951-63.

6. Hennen J. Statistical methods for longitudinal research on bipolar disor-ders. Bipolar Disord 2003;5:156-68.

7. Goldstein H, Browne W, Rasbash J. Multilevel modelling of medical data.Statistics in Med 2002;21:3291-315.

8. Sithole JS, Jones PW. Repeated measures models for prescribing chan-ge. Stat Med 2002;21:571-87.

9. Park T, Lee YJ. Covariance models for nested repeated measuresdata:analysis of ovarian steroid secretion data. Stat Med 2002;21:143-64.

10. Littell RC, Pendergast J, Natarajan R. Modelling covariance structure inthe analysis of repeated measures data. Stat Med 2000;19:1793-819.

11. Little RAJ, Rubin DB. Statistical analysis with missing data. New York:John Wiley, 1997.

12. Pinheiro J, Bates D. Mixed models in S and S-Plus. Statistics and com-puting series. New York: Springer Verlag, 2000.





medidas repetidas

Documents