predeterminación del tamaño muestral iñaki pérez estadístico unidad de desarrollo clínico j....
TRANSCRIPT
Predeterminación del tamaño muestral
Iñaki PérezEstadísticoUnidad de Desarrollo ClínicoJ. Uriach y Compañía S.A.
2
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Sumario
¿Por qué?
Procedimiento
Software
Ejemplos
3
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Necesidad del cálculo de tamaño muestral
Ensayo Clínico
Estudio Epidemiológico
Estudio Observacional
Encuesta
4
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Necesidad del cálculo de tamaño muestral
Ensayo Clínico
Estudio Epidemiológico
Estudio Observacional
Encuesta
5
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Sumario
6
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Muestra de la población
Población diana
Población en estudio
Muestra
7
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Muestra de la población
8
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Tamaño muestral: ¿Por qué?
Económicos
Éticos
Científicos
El número de pacientesnecesario para contestar
adecuadamente laspreguntas
Suficiente para detectar las diferencias si existen
realmente
Incrementar pacientes incrementaproporcionalmente el coste
del estudio
El principio general que justifica trabajar con muestras es que resulta más barato, más rápido y más fácil que hacerlo con poblaciones completas
9
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Tipos de muestreo
Muestreo aleatorio simple• Cada sujeto tiene la misma probabilidad de ser incluido en la muestra
• El más utilizado
• Evita sesgos
Muestreo estratificado• Se clasifica a los individuos según variables conocidas de interés (sexo, grupos etarios,…)• Muestreo simple dentro de cada estrato• Mayor precisión pero análisis más complicado
Muestreo por conglomerados• Se clasifica a los individuos según grupos (familías, escuelas, barrios,…)• Selección de los grupo y de todos los individuos que lo componen
10
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
El tamaño de la muestra depende de...
Las características, objetivos y diseño del estudio
La(s) variable(s) principal(es) y distribución de referencia
La magnitud del efecto del tratamiento ( ó ) a detectar
La variabilidad de la medida o imprecisión
Contraste de hipótesis (pruebas de hipótesis)
Los errores de Tipo I y II y el poder (, y 1-)
La tasa de retiradas del estudio y pérdidas de seguimiento
11
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Características, objetivos y diseño
Prevalencia de migraña en la población
Estimación de parámetros poblacionales
Promedio de las cifras de colesterol en la población infantil
Riesgo relativo de padecer retinopatia en los diabéticos tipo I
frente a los de tipo II
Podría un programa de vacunación reducir la mortalidad
infantil en más de un 15%
Es diferente la eficacia analgésica de A en relación a B
Está asociada la microalbuminuria con las cifras de TA
Contraste de hipótesis
12
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Estimación por intervalos de confianza
Estadísticos s p OR
Información de la muestra
Características de la poblaciónParámetros
μ σ π ω
X
13
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Estimación de parámetros (población infinita)
Queremos estimar una proporción en una población de origen¿Qué tamaño de la muestra deberíamos tomar?
211
2 )1(w
ppkn
K: Factor relacionado con la confianza p1: previsión del resultado w: Imprecisión (error) admisible en la estimación
14
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Queremos estimar una proporción en una población de origen¿Qué tamaño de la muestra deberíamos tomar?
Muestra representa más de 5% del total de la población K: Factor relacionado con la confianza p1: previsión del resultado
w: Imprecisión (error) admisible en la estimación
21 1
21 1
(1 )
( 1) (1 )
k p p Nn
w N Kp p
Estimación de parámetros (población finita)
15
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Distribución del estadístico p1 en el muestro
211
2 )1(w
ppkn
π
npp )1( 11
p1
+w-w
npp
kKnw)1( 11
16
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Valores de K y niveles de confianza
KNivel de confianza
3.29 0.999
2.8 0.995
2.58 0.99
2.32 0.98
2.24 0.97
1.96 0.95
1.64 0.90
1.28 0.80
1.03 0.70
0.84 0.60
0.67 0.50
0.52 0.40
0.38 0.30
0.25 0.20
17
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Ejemplo 1: Estimación de proporciones
¿ Cual es el número de niños en edad escolar que es necesario
analizar para estimar la prevalencia de la dislexia ?
niñosw
ppkn 385
03.090.0*10.0*96.1)1(
2
2
211
2
K: nivel de confianza de 95% =1.96 p1: previsión del resultado = 10% w: imprecisión (error) admisible en la estimación = 3%
18
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Ejemplo 2: Y si la realidad es diferente…
Disléxicos (n=385) Prevalencia Imprecisión
4 0.01 0.01
19 0.05 0.02
39 0.1 0.03
77 0.2 0.04
116 0.3 0.05
La imprecisión aumenta con resultados hacia el 50%
19
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Ejemplo 3: Estimación de proporciones (finita)
¿ Cual es el número de niños en edad escolar que es necesario
analizar para estimar la prevalencia de la dislexia ?
K: nivel de confianza de 95% =1.96 p1 : previsión del resultado = 10% w: imprecisión (error) admisible en la estimación = 3%
21 1
21 1
(1 )202
( 1) (1 )
k p p Nn
w N Kp p
20
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Ejemplo 4: Estimación de medias
¿ Cuál es el número de casos que es necesario analizar para
estimar la media de la densidad en mujeres postmenopausicas
(<55 años) ?
2 2 2 21 / 2
2 2
1.96 *10062
25
zn
w
K: nivel de confianza de 95% =1.96 : media esperada = 1050 mg/ml σ : desviación típica se asume que es 100 mg/ml w: imprecisión máxima aceptable es +- 25 mg/ml
X
21
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Ejemplo 5: Estimación de OR
¿ Qué tamaño de muestra se necesitaría en cada uno de los
grupos de un estudio de casos-controles para estimar el OR con
un IC de 0.95 ? : nivel de confianza de 95% =1.96 OR esperado = 2 p1 : proporción de expuestos en los controles = 0.30
p2 : proporción de expuestos en los casos = 0.46
w: imprecisión máxima aceptable es +- 0.50
21 / 2
1 1 2 2
1 1 1 1409
1 1
zn
w p p p p
( / lim inf O ) 0.2876w LnOR Ln OR R
1 / 2z
lim inf (O ) 2 0.5 1.5R
22
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Estimación de RR
21 / 2 1 2
1 2
1 1z p pn
w p p
( / lim inf w LnRR Ln RR RR
23
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Características, objetivos y diseño
Prevalencia de migraña en la población
Estimación de parámetros poblacionales
Promedio de las cifras de colesterol en la población infantil
Riesgo relativo de padecer retinopatia en los diabéticos tipo I
frente a los de tipo II
Podría un programa de vacunación reducir la mortalidad
infantil en más de un 15%
Es diferente la eficacia analgésica de A en relación a B
Está asociada la microalbuminuria con las cifras de TA
Contraste de hipótesis
24
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Fórmula intuitiva
AN = K B
(Variabilidad)
(Tamaño del efecto)
25
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Jugadores Basket
190(5)
Pigmeos
140(5)
ALTURA
ALTURA
Fre
cu
en
cia
300
200
100
0
Desv. típ. = 25.54
Media = 165.1
N = 2000.00
Ejemplo : Pigmeos vs jugadores de basket (1)
26
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Ejemplo : Pigmeos vs jugadores de basket (2)
Jugadores Basket
190(10)
Pigmeos
140(10)
ALTURA
ALTURA
Fre
cue
nci
a
300
200
100
0
Desv. típ. = 26.94
Media = 165.0
N = 2000.00
27
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Jugadores Basket
190(20)
Pigmeos
140(20)
ALTURA
ALTURAF
recu
en
cia
120
100
80
60
40
20
0
Desv. típ. = 32.27
Media = 165.1
N = 2000.00
AN = K B
Fórmula intuitiva
Ejemplo : Pigmeos vs jugadores de basket (3)
28
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
El tamaño de la muestra depende de...
Las características, objetivos y diseño del estudio
La(s) variable(s) principal(es) y distribución de referencia
La magnitud del efecto del tratamiento ( ó ) a detectar
La variabilidad de la medida o imprecisión
Contraste de hipótesis (pruebas de hipótesis)
Los errores de Tipo I y II y el poder (, y 1-)
La tasa de retiradas del estudio y pérdidas de seguimiento
29
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Objetivos
Eficacia (superioridad/no inferioridad) y/o Seguridad y
tolerabilidad
Determinación del perfil farmacocinético
Biodisponibilidad relativa /bioequivalencia / Interacción
con alimentos
Búsqueda de dosis
Eficacia y/o Seguridad en determinadas poblaciones (por
edades, sexos, etc.)
Dos parametros bioquímicos están asociados
30
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Diseño (1)
a) Paralelo randomizado
Placebo (PL) y/o FR
A
B
C
RND
D
FR: Fármaco de referencia
31
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Diseño (2)
Periodos
Secuencia 1 2 3 4
I A B PL C
I I B C A PL
I I I C PL B A
RND
I V PL A C B
b) Cruzado randomizado
32
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Diseño (3) : Efecto diseño
DE Dif.
Diseño
Paralelo Cruzado
0.2
2.642 28 16
1 109 57
1.742 13 8
1 49 26
0.1
2.642 38 20
1 146 75
1.742 17 10
1 64 34
Diseño paralelo versus cruzado
33
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Diseño (4). Tipos de comparación entre tratamientos
Superioridad
Equivalencia
No-inferioridad
CE
C E
C E
Procedimiento Características, objetivos y diseño del estudio
34
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Variable principal
La hipótesis de trabajo se centra en una variable de interés que puede ser categórica o continua
El teorema central del límite permite aproximar las distribución de la proporción o de las medias de todas las muestras posibles mediante la distribución normal cuando n> 30 sujetos
En caso contrario se deben contemplar distribuciones como binomial exacta, la de Poisson, la de Student, etc
35
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Variable principal: Ejemplos
Porcentaje de pacientes que experimentan como mínimo un acontecimiento cardíaco: muerte por cualquier causa o infarto de miocardio agudo o revascularización
Porcentaje de pacientes que experimentan una mejoría del dolor de cabeza a las dos horas de la administración del fármaco
Valoración del dolor por el paciente mediante una Escala Analógica Visual (EAV) en mm; 0 = sin dolor, 100 = máximo dolor
Presión arterial diastólica en mm de Hg
Procedimiento Variable Principal de eficacia
36
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
La magnitud del efecto del tratamiento a detectar y variabilidad de los datos
Magnitud del efecto del tratamiento a detectar ( ó ):
ó = E - C
donde, E es el efecto del tratamiento experimental y C es el efecto del tratamiento control o estándar Variabilidad de los datos (variabilidad = 2):
2 = 2E + 2C
Si desconocemos la 2E, entonces 2 = 2
C
37
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
La magnitud del efecto del tratamiento a detectar : Efecto lupa
Diferencias reales diminutas
Diferencias reales
gandes
Diferencias reales
38
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Contraste de hipótesis: clases
Unilateral (una cola)
Ho: E - C = 0H1: E - C > 0 ó H1: E - C < 0
Bilateral (dos colas)
Ho: E - C = 0H1: E - C 0
39
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Los errores de Tipo I, II y el poder
Realidad
Ttos. Iguales Ttos. Diferentes
Ttos. Iguales Acierto Error tipo II
() Conclusión
Ttos. Diferentes Error tipo I
() Acierto
Bilateral (dos colas)
Ho: E - C = 0H1: E - C 0
Error tipo I (): La probabilidad de rechazar la hipótesis nula siendo verdadera
El valor del error tipo I ó es igual o inferior a 0.05 (5%)
Error tipo II (): La probabilidad de aceptar la hipótesis nula siendo falsa
El valor del error tipo II ó es igual o inferior a 0.20 (20%)
40
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Tasa de pérdidas de seguimiento
La tasa de pérdidas de seguimiento es el porcentaje de sujetos que abandonan el estudio
La relación entre el tamaño de la muestra ajustado (n’) y la tasa de abandonos (d) es la siguiente:
n n’ = 1 - d
donde n es el tamaño de la muestra estimado
41
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Tamaño de la muestra
Magnitud del efecto del tratamiento a detectar () Variabilidad de las observaciones (2 ) Errores Tipo I y II ( y ) Relación:
donde C es una función de y : f(, )
¿Qué información se necesita para la estimación del tamaño de la muestra ?
C 2
Tamaño de la muestra = ()2
42
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
=(E-C) es la diferencia clínicamente relevante entre tratamientos
que se quiere detectar
s2 es, normalmente, desconocida y es estimada en el momento
del análisis. Sin embargo, debe ser estimada antes del inicio del
estudio
Los valores de ( 0.05), ( 0.20) y el poder (1-) ( 0.80)
Fórmulas : parámetros a decidir
43
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Valores de f(, )
f(, ) = (U + U)2
(1 cola) 0.050 0.025 0.005
(2 colas) 0.100 0.050 0.010
(1 cola)
0.200 6.183 7.849 11.679
0.100 8.564 10.507 14.879
0.050 10.822 12.995 17.814
44
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Fórmulas
n = número de sujetos por grupo de tratamiento
Comparación de medias :2
2
2( , )
( )E C
sn f
X X
pE (1 - pE) + pC (1 - pC) n = f(, ) (pE - pC)2
Comparación proporciones :
45
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Tratamiento experimental: E Tratamiento control: C E es la verdadera media de E
es la estimación de E
c es la verdadera media de C
es la estimación de C
es una estimación de (E - C)
~ N ((E - C), 2 2/n)
s2 es la estimación de la verdadera varianza (variabilidad) entre pacientes en un mismo tratamiento (2) :
EX
CX
( )E CX X
( )E CX X
2
2
2( , )
( )E C
sn f
X X
Fórmulas : distribución normal
222EC SSS
46
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Ejemplo 6: Comparación de medias (dist. Normal)
Queremos comparar el cambio de la presión arterial de un nuevo fármaco frente a placebo. Esperamos encontrar una diferencia de 5 mmHg, con una desviación estándard de 10 mmHg ¿cuántos pacientes son necesarios para un ensayo con =0.05 bilateral y un poder de 1-=0.9?
= 0.05 de dos colas Poder = (1 - ) = 0.90 f( , )=10.507
s n por grupo
¿ ¿ 5 10 84
EX CX ( )E CX X
2
2
2( , )
( )grupoE C
sn f
X X
Bilateral (dos colas)
Ho: E - C = 0H1: E - C 0
2
2
2(10)10.507 84
(5)grupon
47
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Tratamiento experimental: E Tratamiento control: C PE es la verdadera proporción de sujetos que presentan un
determinado evento en E En la fórmulas, pE es la estimación de PE
PC es la verdadera proporción de sujetos que presentan un determinado evento en C
En la fórmulas, pC es la estimación de PC
= (pE - pC) es una estimación de (PE - PC)
s2 es la estimación de la verdadera varianza (variabilidad) entre pacientes en un mismo tratamiento (2) :
pE (1 - PE) + pC (1 - PC) n = f(, ) (pE - pC)2
Fórmulas : datos binarios (porcentajes)
)1()1(2EECC ppppS
48
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Ejemplo 7: Comparación de proporciones
Se está planteando un ensayo con estimulación eléctrica transcutánea (EET) para el alivio de dolor en pacientes con osteoartritis en base a resultados preliminares que obtuvieron un 25% de respuesta con placebo y un 65% con EET ¿cuántos pacientes son necesarios para un ensayo con =0.05 bilateral y un poder de 1-=0.9?
= 0.05 de dos colas Poder = (1 - ) = 0.90 90 f( , )=10.507
pE pC (%) n por grupo
65 25 40 30
pE (1 - PE) + pC (1 - PC)
n = f(, ) (pE - PC)2
Bilateral (dos colas)
Ho: E - C = 0H1: E - C 0
0.65 (1 – 0.65) + 0.25 (1 – 0.25) n = 10.507 (0.65 – 0.25)2
49
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Ejemplo : magnitud del efectoEl tamaño de la muestra depende del valor de la magnitud del efecto =E - C y 2 :
= 0.05 de dos colas Poder = (1 - ) = 0.90 f( , )=10.507
s n por grupo
20 10 10 25 133
30 20 10 25 133
20 10 10 30 191
30 20 10 30 191
EX CX ( )E CX X
= 0.05 de dos colas Poder = (1 - ) = 0.90 f( , )=10.507
pE pC (%) n por grupo
20 10 10 266
30 20 10 392
40 30 10 477
50 40 10 519
50
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Ejemplo : Tasa de pérdidas de seguimiento
Terapia
estándar (%)
Terapia
experimental (%)
Reducción (%)
(%)
No. de pacientes (2 tratamientos)
Poder
0.80 0.85
10 9.0 10 1.0 26990 30874
8.5 15 1.5 11712 13396
8.0 20 2.0 6426 7352
7.5 25 2.5 4010 4586
26990 n’ = = 35987 pacientes 1 - 0.25
Si la tasa de pérdidas esperada es del 25%:
51
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
K> 2 grupos a comparar (1)
¿Y si tenemos más de dos grupos comparar ?
Existen varios métodos para el cálculo de la N
NQuery 4.0 realiza cálculos de N para más de un grupo en determinados casos:
Comparación de Medias Comparación de Proporciones NO realiza cálculos para Supervivencia, Asociación o
Regresión
52
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
K> 2 grupos a comparar (2)
Habitualmente Bonferroni:
Pero en realidad es:
Pero tranquilos, no hay grandes diferencias!!!!
n
n)1(1
53
Met
od
olo
gia
Est
ad
isti
ca A
pli
cad
a a
la
Inve
stig
acio
n C
lin
ica
Software
nQuery Advisor 4.0 Statistical Solutionswww.statsol.ie/nquery/nquery.htmSe puede descargar un versión “Demo”
GranmoIMIMhttp://www.imim.es/software/catLibre utilización
ENEhttp://www.e-biometria.com/ene-ctm/index.htmServicios y Productos Bioestadísticos de GSK en España