predeterminación del tamaño muestral iñaki pérez estadístico unidad de desarrollo clínico j....

Predeterminación del tamaño muestral

Iñaki PérezEstadísticoUnidad de Desarrollo ClínicoJ. Uriach y Compañía S.A.

2

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Sumario

¿Por qué?

Procedimiento

Software

Ejemplos

3

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Necesidad del cálculo de tamaño muestral

Ensayo Clínico

Estudio Epidemiológico

Estudio Observacional

Encuesta

4

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Necesidad del cálculo de tamaño muestral

Ensayo Clínico

Estudio Epidemiológico

Estudio Observacional

Encuesta

5

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Sumario

6

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Muestra de la población

Población diana

Población en estudio

Muestra

7

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Muestra de la población

8

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Tamaño muestral: ¿Por qué?

Económicos

Éticos

Científicos

El número de pacientesnecesario para contestar

adecuadamente laspreguntas

Suficiente para detectar las diferencias si existen

realmente

Incrementar pacientes incrementaproporcionalmente el coste

del estudio

El principio general que justifica trabajar con muestras es que resulta más barato, más rápido y más fácil que hacerlo con poblaciones completas

9

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Tipos de muestreo

Muestreo aleatorio simple• Cada sujeto tiene la misma probabilidad de ser incluido en la muestra

• El más utilizado

• Evita sesgos

Muestreo estratificado• Se clasifica a los individuos según variables conocidas de interés (sexo, grupos etarios,…)• Muestreo simple dentro de cada estrato• Mayor precisión pero análisis más complicado

Muestreo por conglomerados• Se clasifica a los individuos según grupos (familías, escuelas, barrios,…)• Selección de los grupo y de todos los individuos que lo componen

10

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

El tamaño de la muestra depende de...

Las características, objetivos y diseño del estudio

La(s) variable(s) principal(es) y distribución de referencia

La magnitud del efecto del tratamiento ( ó ) a detectar

La variabilidad de la medida o imprecisión

Contraste de hipótesis (pruebas de hipótesis)

Los errores de Tipo I y II y el poder (, y 1-)

La tasa de retiradas del estudio y pérdidas de seguimiento

11

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Características, objetivos y diseño

Prevalencia de migraña en la población

Estimación de parámetros poblacionales

Promedio de las cifras de colesterol en la población infantil

Riesgo relativo de padecer retinopatia en los diabéticos tipo I

frente a los de tipo II

Podría un programa de vacunación reducir la mortalidad

infantil en más de un 15%

Es diferente la eficacia analgésica de A en relación a B

Está asociada la microalbuminuria con las cifras de TA

Contraste de hipótesis

12

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Estimación por intervalos de confianza

Estadísticos s p OR

Información de la muestra

Características de la poblaciónParámetros

μ σ π ω

X

13

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Estimación de parámetros (población infinita)

Queremos estimar una proporción en una población de origen¿Qué tamaño de la muestra deberíamos tomar?

211

2 )1(w

ppkn

K: Factor relacionado con la confianza p1: previsión del resultado w: Imprecisión (error) admisible en la estimación

14

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Queremos estimar una proporción en una población de origen¿Qué tamaño de la muestra deberíamos tomar?

Muestra representa más de 5% del total de la población K: Factor relacionado con la confianza p1: previsión del resultado

w: Imprecisión (error) admisible en la estimación

21 1

21 1

(1 )

( 1) (1 )

k p p Nn

w N Kp p

Estimación de parámetros (población finita)

15

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Distribución del estadístico p1 en el muestro

211

2 )1(w

ppkn

π

npp )1( 11

p1

+w-w

npp

kKnw)1( 11

16

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Valores de K y niveles de confianza

KNivel de confianza

3.29 0.999

2.8 0.995

2.58 0.99

2.32 0.98

2.24 0.97

1.96 0.95

1.64 0.90

1.28 0.80

1.03 0.70

0.84 0.60

0.67 0.50

0.52 0.40

0.38 0.30

0.25 0.20

17

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Ejemplo 1: Estimación de proporciones

¿ Cual es el número de niños en edad escolar que es necesario

analizar para estimar la prevalencia de la dislexia ?

niñosw

ppkn 385

03.090.0*10.0*96.1)1(

2

2

211

2

K: nivel de confianza de 95% =1.96 p1: previsión del resultado = 10% w: imprecisión (error) admisible en la estimación = 3%

18

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Ejemplo 2: Y si la realidad es diferente…

Disléxicos (n=385) Prevalencia Imprecisión

4 0.01 0.01

19 0.05 0.02

39 0.1 0.03

77 0.2 0.04

116 0.3 0.05

La imprecisión aumenta con resultados hacia el 50%

19

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Ejemplo 3: Estimación de proporciones (finita)

¿ Cual es el número de niños en edad escolar que es necesario

analizar para estimar la prevalencia de la dislexia ?

K: nivel de confianza de 95% =1.96 p1 : previsión del resultado = 10% w: imprecisión (error) admisible en la estimación = 3%

21 1

21 1

(1 )202

( 1) (1 )

k p p Nn

w N Kp p

20

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Ejemplo 4: Estimación de medias

¿ Cuál es el número de casos que es necesario analizar para

estimar la media de la densidad en mujeres postmenopausicas

(<55 años) ?

2 2 2 21 / 2

2 2

1.96 *10062

25

zn

w

K: nivel de confianza de 95% =1.96 : media esperada = 1050 mg/ml σ : desviación típica se asume que es 100 mg/ml w: imprecisión máxima aceptable es +- 25 mg/ml

X

21

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Ejemplo 5: Estimación de OR

¿ Qué tamaño de muestra se necesitaría en cada uno de los

grupos de un estudio de casos-controles para estimar el OR con

un IC de 0.95 ? : nivel de confianza de 95% =1.96 OR esperado = 2 p1 : proporción de expuestos en los controles = 0.30

p2 : proporción de expuestos en los casos = 0.46

w: imprecisión máxima aceptable es +- 0.50

21 / 2

1 1 2 2

1 1 1 1409

1 1

zn

w p p p p

( / lim inf O ) 0.2876w LnOR Ln OR R

1 / 2z

lim inf (O ) 2 0.5 1.5R

22

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Estimación de RR

21 / 2 1 2

1 2

1 1z p pn

w p p

( / lim inf w LnRR Ln RR RR

23

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Características, objetivos y diseño

Prevalencia de migraña en la población

Estimación de parámetros poblacionales

Promedio de las cifras de colesterol en la población infantil

Riesgo relativo de padecer retinopatia en los diabéticos tipo I

frente a los de tipo II

Podría un programa de vacunación reducir la mortalidad

infantil en más de un 15%

Es diferente la eficacia analgésica de A en relación a B

Está asociada la microalbuminuria con las cifras de TA

Contraste de hipótesis

24

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Fórmula intuitiva

AN = K B

(Variabilidad)

(Tamaño del efecto)

25

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Jugadores Basket

190(5)

Pigmeos

140(5)

ALTURA

ALTURA

Fre

cu

en

cia

300

200

100

0

Desv. típ. = 25.54

Media = 165.1

N = 2000.00

Ejemplo : Pigmeos vs jugadores de basket (1)

26

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica


Jugadores Basket

190(10)

Pigmeos

140(10)

ALTURA

ALTURA

Fre

cue

nci

a

300

200

100

0

Desv. típ. = 26.94

Media = 165.0

N = 2000.00

27

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Jugadores Basket

190(20)

Pigmeos

140(20)

ALTURA

ALTURAF

recu

en

cia

120

100

80

60

40

20

0

Desv. típ. = 32.27

Media = 165.1

N = 2000.00

AN = K B

Fórmula intuitiva


28

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

El tamaño de la muestra depende de...

Las características, objetivos y diseño del estudio

La(s) variable(s) principal(es) y distribución de referencia

La magnitud del efecto del tratamiento ( ó ) a detectar

La variabilidad de la medida o imprecisión

Contraste de hipótesis (pruebas de hipótesis)

Los errores de Tipo I y II y el poder (, y 1-)

La tasa de retiradas del estudio y pérdidas de seguimiento

29

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Objetivos

Eficacia (superioridad/no inferioridad) y/o Seguridad y

tolerabilidad

Determinación del perfil farmacocinético

Biodisponibilidad relativa /bioequivalencia / Interacción

con alimentos

Búsqueda de dosis

Eficacia y/o Seguridad en determinadas poblaciones (por

edades, sexos, etc.)

Dos parametros bioquímicos están asociados

30

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Diseño (1)

a) Paralelo randomizado

Placebo (PL) y/o FR

A

B

C

RND

D

FR: Fármaco de referencia

31

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Diseño (2)

Periodos

Secuencia 1 2 3 4

I A B PL C

I I B C A PL

I I I C PL B A

RND

I V PL A C B

b) Cruzado randomizado

32

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Diseño (3) : Efecto diseño

DE Dif.

Diseño

Paralelo Cruzado

0.2

2.642 28 16

1 109 57

1.742 13 8

1 49 26

0.1

2.642 38 20

1 146 75

1.742 17 10

1 64 34

Diseño paralelo versus cruzado

33

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Diseño (4). Tipos de comparación entre tratamientos

Superioridad

Equivalencia

No-inferioridad

CE

C E

C E

Procedimiento Características, objetivos y diseño del estudio

34

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Variable principal

La hipótesis de trabajo se centra en una variable de interés que puede ser categórica o continua

El teorema central del límite permite aproximar las distribución de la proporción o de las medias de todas las muestras posibles mediante la distribución normal cuando n> 30 sujetos

En caso contrario se deben contemplar distribuciones como binomial exacta, la de Poisson, la de Student, etc

35

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Variable principal: Ejemplos

Porcentaje de pacientes que experimentan como mínimo un acontecimiento cardíaco: muerte por cualquier causa o infarto de miocardio agudo o revascularización

Porcentaje de pacientes que experimentan una mejoría del dolor de cabeza a las dos horas de la administración del fármaco

Valoración del dolor por el paciente mediante una Escala Analógica Visual (EAV) en mm; 0 = sin dolor, 100 = máximo dolor

Presión arterial diastólica en mm de Hg

Procedimiento Variable Principal de eficacia

36

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

La magnitud del efecto del tratamiento a detectar y variabilidad de los datos

Magnitud del efecto del tratamiento a detectar ( ó ):

ó = E - C

donde, E es el efecto del tratamiento experimental y C es el efecto del tratamiento control o estándar Variabilidad de los datos (variabilidad = 2):

2 = 2E + 2C

Si desconocemos la 2E, entonces 2 = 2

C

37

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

La magnitud del efecto del tratamiento a detectar : Efecto lupa

Diferencias reales diminutas

Diferencias reales

gandes

Diferencias reales

38

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Contraste de hipótesis: clases

Unilateral (una cola)

Ho: E - C = 0H1: E - C > 0 ó H1: E - C < 0

Bilateral (dos colas)

Ho: E - C = 0H1: E - C 0

39

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Los errores de Tipo I, II y el poder

Realidad

Ttos. Iguales Ttos. Diferentes

Ttos. Iguales Acierto Error tipo II

() Conclusión

Ttos. Diferentes Error tipo I

() Acierto


Ho: E - C = 0H1: E - C 0

Error tipo I (): La probabilidad de rechazar la hipótesis nula siendo verdadera

El valor del error tipo I ó es igual o inferior a 0.05 (5%)

Error tipo II (): La probabilidad de aceptar la hipótesis nula siendo falsa

El valor del error tipo II ó es igual o inferior a 0.20 (20%)

40

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Tasa de pérdidas de seguimiento

La tasa de pérdidas de seguimiento es el porcentaje de sujetos que abandonan el estudio

La relación entre el tamaño de la muestra ajustado (n’) y la tasa de abandonos (d) es la siguiente:

n n’ = 1 - d

donde n es el tamaño de la muestra estimado

41

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Tamaño de la muestra

Magnitud del efecto del tratamiento a detectar () Variabilidad de las observaciones (2 ) Errores Tipo I y II ( y ) Relación:

donde C es una función de y : f(, )

¿Qué información se necesita para la estimación del tamaño de la muestra ?

C 2

Tamaño de la muestra = ()2

42

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

=(E-C) es la diferencia clínicamente relevante entre tratamientos

que se quiere detectar

s2 es, normalmente, desconocida y es estimada en el momento

del análisis. Sin embargo, debe ser estimada antes del inicio del

estudio

Los valores de ( 0.05), ( 0.20) y el poder (1-) ( 0.80)

Fórmulas : parámetros a decidir

43

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Valores de f(, )

f(, ) = (U + U)2

(1 cola) 0.050 0.025 0.005

(2 colas) 0.100 0.050 0.010

(1 cola)

0.200 6.183 7.849 11.679

0.100 8.564 10.507 14.879

0.050 10.822 12.995 17.814

44

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Fórmulas

n = número de sujetos por grupo de tratamiento

Comparación de medias :2

2

2( , )

( )E C

sn f

X X

pE (1 - pE) + pC (1 - pC) n = f(, ) (pE - pC)2

Comparación proporciones :

45

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Tratamiento experimental: E Tratamiento control: C E es la verdadera media de E

es la estimación de E

c es la verdadera media de C

es la estimación de C

es una estimación de (E - C)

~ N ((E - C), 2 2/n)

s2 es la estimación de la verdadera varianza (variabilidad) entre pacientes en un mismo tratamiento (2) :

EX

CX

( )E CX X

( )E CX X

2

2

2( , )

( )E C

sn f

X X

Fórmulas : distribución normal

222EC SSS

46

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Ejemplo 6: Comparación de medias (dist. Normal)

Queremos comparar el cambio de la presión arterial de un nuevo fármaco frente a placebo. Esperamos encontrar una diferencia de 5 mmHg, con una desviación estándard de 10 mmHg ¿cuántos pacientes son necesarios para un ensayo con =0.05 bilateral y un poder de 1-=0.9?

= 0.05 de dos colas Poder = (1 - ) = 0.90 f( , )=10.507

s n por grupo

¿ ¿ 5 10 84

EX CX ( )E CX X

2

2

2( , )

( )grupoE C

sn f

X X


Ho: E - C = 0H1: E - C 0

2

2

2(10)10.507 84

(5)grupon

47

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Tratamiento experimental: E Tratamiento control: C PE es la verdadera proporción de sujetos que presentan un

determinado evento en E En la fórmulas, pE es la estimación de PE

PC es la verdadera proporción de sujetos que presentan un determinado evento en C

En la fórmulas, pC es la estimación de PC

= (pE - pC) es una estimación de (PE - PC)

s2 es la estimación de la verdadera varianza (variabilidad) entre pacientes en un mismo tratamiento (2) :

pE (1 - PE) + pC (1 - PC) n = f(, ) (pE - pC)2

Fórmulas : datos binarios (porcentajes)

)1()1(2EECC ppppS

48

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Ejemplo 7: Comparación de proporciones

Se está planteando un ensayo con estimulación eléctrica transcutánea (EET) para el alivio de dolor en pacientes con osteoartritis en base a resultados preliminares que obtuvieron un 25% de respuesta con placebo y un 65% con EET ¿cuántos pacientes son necesarios para un ensayo con =0.05 bilateral y un poder de 1-=0.9?

= 0.05 de dos colas Poder = (1 - ) = 0.90 90 f( , )=10.507

pE pC (%) n por grupo

65 25 40 30

pE (1 - PE) + pC (1 - PC)

n = f(, ) (pE - PC)2


Ho: E - C = 0H1: E - C 0

0.65 (1 – 0.65) + 0.25 (1 – 0.25) n = 10.507 (0.65 – 0.25)2

49

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Ejemplo : magnitud del efectoEl tamaño de la muestra depende del valor de la magnitud del efecto =E - C y 2 :


s n por grupo

20 10 10 25 133

30 20 10 25 133

20 10 10 30 191

30 20 10 30 191

EX CX ( )E CX X


pE pC (%) n por grupo

20 10 10 266

30 20 10 392

40 30 10 477

50 40 10 519

50

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Ejemplo : Tasa de pérdidas de seguimiento

Terapia

estándar (%)

Terapia

experimental (%)

Reducción (%)

(%)

No. de pacientes (2 tratamientos)

Poder

0.80 0.85

10 9.0 10 1.0 26990 30874

8.5 15 1.5 11712 13396

8.0 20 2.0 6426 7352

7.5 25 2.5 4010 4586

26990 n’ = = 35987 pacientes 1 - 0.25

Si la tasa de pérdidas esperada es del 25%:

51

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

K> 2 grupos a comparar (1)

¿Y si tenemos más de dos grupos comparar ?

Existen varios métodos para el cálculo de la N

NQuery 4.0 realiza cálculos de N para más de un grupo en determinados casos:

Comparación de Medias Comparación de Proporciones NO realiza cálculos para Supervivencia, Asociación o

Regresión

52

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

K> 2 grupos a comparar (2)

Habitualmente Bonferroni:

Pero en realidad es:

Pero tranquilos, no hay grandes diferencias!!!!

n

n)1(1

53

Met

od

olo

gia

Est

ad

isti

ca A

pli

cad

a a

la

Inve

stig

acio

n C

lin

ica

Software

nQuery Advisor 4.0 Statistical Solutionswww.statsol.ie/nquery/nquery.htmSe puede descargar un versión “Demo”

GranmoIMIMhttp://www.imim.es/software/catLibre utilización

ENEhttp://www.e-biometria.com/ene-ctm/index.htmServicios y Productos Bioestadísticos de GSK en España

predeterminación del tamaño muestral iñaki pérez estadístico unidad de desarrollo clínico j....

Documents