introducción probabilidad, estadística e inferencia científica marco pavesi senior epidemiologist...

41
Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A.

Upload: eleuterio-burgo

Post on 28-Jan-2016

223 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

IntroducciónProbabilidad, estadística e inferencia científica

Marco PavesiSenior EpidemiologistCIS Clinical EpidemiologyNovartis Farmacéutica S.A.

Page 2: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 2

Intro: hace 2.500 años…

• Antístenes: “…yo veo estos caballos, blancos, negros, grises……¡¡pero la ‘caballinidad’ no la he visto nunca!!”

• Platón: “Cierto, porque tienes los ojos del cuerpo para ver los caballos blancos y negros, pero los ojos de la mente para ver la idea de ‘caballo’ no los tienes…”

Page 3: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 3

Intro: el método científico (I)

En el siglo XIV, los científicos empezaron a darle la razón al pobre filósofo ridiculizado por Platón:

• La ciencia se basa en EXPERIENCIAS OBJETIVAS

• ‘Experiencia objetiva’ significa OBSERVACIONES PÚBLICAS (intersubjetivas) y REPETIBLES

Page 4: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 4

Intro: el método científico (II)

Otras características de la ciencia moderna son:

• EL RIGOR metodológico

• La MODELIZACIÓN de la realidad

• La importancia vital del ERROR en el desarrollo científico

Page 5: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 5

El arco del conocimiento

Experiencia: datos Predicciones: datos

Inducción Deducción

TEORÍA Hipótesis

Page 6: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 6

InducciónLa parte ascendiente del “arco” se basa en el

PRINCIPIO DE INDUCCIÓN:

X1 ==> Y1

X2 ==> Y2

…..

Xn ==> Yn

X ==> Y

Page 7: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 7

Inducción y Verdad

Bertrand Russell presenta…

El pavo inductivista

Page 8: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 8

Problemas para el inductivista “pavo”

1) …cree que el resultado observado en una muestra de la población es verdadero para la población.

2) …cree que la inducción es el método científico para demostrar la verdad

3) …cree que la estadística es el instrumento para llegar a esta demostración “matemática”

Page 9: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 9

Problemas para el inductivista “pavo”

Resultado...

Page 10: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 10

El inductivista “sofisticado”

1) …reconoce que las inferencias científicas siempre tienen un “valor” que depende del nº de observaciones realizadas (tamaño de la muestra).

Page 11: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 11

El inductivista “sofisticado”

2) …sabe que solo es posible APROXIMAR / MODELIZAR / ESTIMAR la realidad y que cada estimación tiene su margen de error.

Page 12: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 12

El inductivista “sofisticado”

3) …sabe que no existen hipótesis verdaderas, pero podemos rechazar una hipótesis y aceptar otra en función de las “evidencias” de las que disponemos.

Page 13: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 13

Karl Popper: gorilas y contrastes de hipótesis

Hipótesis: todos los gorilas son negros

C1 ==> negro

C2 ==> negro

...

Cn ==> ‘Copito de nieve’

Rechazo la hipótesis inicial

No es posible verificar una hipótesis, pero sí es posible

rechazarla a partir de un número suficiente de evidencias

contrarias

Page 14: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 14

Cualquier tipo de conocimiento de las ciencias naturales (empíricas) es probabilístico:

• Se aproxima la realidad con una determinada precisión

• Se acepta un determinado margen de error para cualquier aproximación

• No se “demuestra” una hipótesis, se descarta (con un margen de error) la hipótesis contraria.

Desplazamiento probabilístico

Page 15: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 15

Probabilidades directas e inversas

• “Sé (asumo) que este dado no está trucado: ¿qué probabilidad tengo de sacar siempre un 1 en 15 jugadas seguidas”

==> CÁLCULO (matemáticas)

• “He sacado siempre 1 en 15 jugadas seguidas.

¿Estará trucado el dado?

==> ESTADÍSTICA (inferencial)

Page 16: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 16

Estadística inferencial y cálculo de probabilidades

Experiencia: datos Probabilidades (frecuencias)

Inducción Deducción

HIPÓTESIS/TEORÍA

Cálculo de probabilidades

Estadística inferencial

Page 17: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 17

La estadística en los contrastes de hipótesis

Únicamente se tiene en cuenta la información

experimental (muestral)

PUNTOS FUERTES: Objetividad de los datos.

Métodos (relativamente) sencillos.

PUNTOS DÉBILES: no conocemos la probabilidad de

una hipótesis o de un resultado, sino la probabilidad

del resultado observado asumiendo H0.

Page 18: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 18

Contrastes de hipótesis (I)

Hipótesis de trabajo del investigador:

El fármaco F es eficaz para reducir de forma

clínicamente relevante la TAS después de “x” días

de tratamiento

Page 19: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 19

Contrastes de hipótesis (II)

Hipótesis nula (H0): el fármaco F no tiene ningún

efecto sobre la tensión arterial sistólica

…¿qué significa “efecto cero”?

H0 para el estadístico: la diferencia entre el fármaco F

y un placebo en la reducción de la TAS después de

“x” días de tratamiento es inferior o igual a 10 mm

Hg (diferencia CLÍNICAMENTE RELEVANTE)

Page 20: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 20

Contrastes de hipótesis (III)

Hipótesis alternativa (H1): la diferencia entre el

fármaco F y un placebo en la reducción de la TAS

después de “x” días de tratamiento es mayor de 10

mm Hg (diferencia CLÍNICAMENTE

RELEVANTE)

Page 21: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 21

Contrastes de hipótesis (IV)

Ingredientes:

• Mínima diferencia clínicamente relevante (Delta)

• Márgenes de error del contraste de hipótesis

• Poder estadístico del contraste

• Tamaño de la muestra (representativa de la

población): la “N” depende de todo lo anterior

Page 22: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 22

Un pequeño margen de error... α

En cada contraste de hipótesis asumimos 2 riesgos:

El RIESGO α (error Tipo I):

• Probabilidad de observar Delta y rechazar H0

cuando, en realidad, H0 es verdadera.

• Porcentaje de resultados FALSOS POSITIVOS

que decidimos asumir.

Page 23: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 23

Un pequeño margen de error... β

En cada contraste de hipótesis asumimos 2 riesgos:

El RIESGO β (error Tipo II):

• probabilidad de NO llegar a observar Delta y

aceptar H0 cuando, en realidad, H1 es verdadera.

• Porcentaje de resultados FALSOS NEGATIVOS

que decidimos asumir.

Page 24: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 24

Un gran poder...estadístico

El PODER ESTADÍSTICO (P = 1-β):

• es la probabilidad de acertar cuando rechazamos H0

• puede interpretarse como el VALOR PREDICTIVO

DE LA PRUEBA PARA LOS RESULTADOS

POSITIVOS.

Page 25: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 25

Errores en un contraste de hipótesis

Realidad

H0 cierta H0 falsa

Resultado de la prueba estadística

p<α(rechazo H0)

Error tipo I (α)

Poder estadístico

(1- β)p≥α

(no rechazo H0)No error Error tipo II

(β)

Page 26: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 26

Y por fin...…la “p” ! (1)

El VALOR DE SIGNIFICACIÓN (p-value):

• Es la probabilidad de observar un resultado como el

que hemos observado en la muestra cuando, en la

realidad, H0 es verdadera.

….es decir, la PROBABILIDAD DE OBSERVAR

ESTE RESULTADO ÚNICAMENTE POR AZAR.

Page 27: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 27

Y por fin...…la “p” ! (2)

El VALOR DE SIGNIFICACIÓN (p-value):

• es un índice de la EVIDENCIA del resultado

observado, de cuanto es FIABLE el resultado

comparado con su variabilidad.

Page 28: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 28

Y por fin...…la “p” ! (3)

• valor de significación GRANDE =

PROBABILIDAD ELEVADA de que el resultados

obtenido se deba al AZAR.

P = 0,750 ==> hay un 75% de posibilidades (3 de cada

4 estudios) de equivocarnos al rechazar H0

Page 29: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 29

Y por fin...…la “p” ! (4)

• valor de significación PEQUEÑO = PROBABILIDAD

MUY BAJA de que el resultados obtenido se deba al

AZAR.

P = 0,015 ==> hay un 1,5% de posibilidades (15 de cada

1000 estudios) de equivocarnos al rechazar H0

Page 30: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 30

Y por fin...…la “p” ! (5)

¿Qué es un VALOR DE SIGNIFICACIÓN PEQUEÑO?

POR CONVENCIÓN (no porque lo diga la Biblia…) descartamos el papel del azar si la ‘p’ es inferior a ciertos valores (0,05 ó 0,01, por ejemplo).

La decisión se basa en criterios CLÍNICOS: ¿qué tasa de FALSOS POSITIVOS estamos dispuestos a aceptar?

Page 31: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 31

Y por fin...…la “p” ! (6)

…sobre todo, recordad:

¡¡LA p NO NOS DICE NADA SOBRE

LA RELEVANCIA CLÍNICA DEL

RESULTADO OBSERVADO!!

Page 32: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 32

Y por fin...…la “p” ! (7)

…por ejemplo...

Fármaco A. Tasa de curación: 22%

Fármaco B. Tasa de curación: 11%

…y efectivamente…

Fármaco A. Tasa de curación: 2/9

Fármaco B. Tasa de curación: 1/9

P=0,98

Page 33: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 33

Y por fin...…la “p” ! (8)

…por ejemplo...

Fármaco A. Tasa de curación: 22%

Fármaco B. Tasa de curación: 11%

…y efectivamente…

Fármaco A. Tasa de curación: 35/154

Fármaco B. Tasa de curación: 18/158

P=0,008

Page 34: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 34

Y por fin...…la “p” ! (9)

…y por otra parte...

Fármaco A. Tasa de curación conocida: 50%

Fármaco B. Tasa de curación esperada: 52%

Δ=2%; Riesgo Tipo I: 0,05; Riesgo Tipo II: 0,20

N (por grupo): 9.806

Page 35: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 35

…y el riesgo β y el Poder, ¿qué?...

¡NO SON MENOS IMPORTANTES!

• Con un riesgo β elevado y un Poder insuficiente, un

resultado NEGATIVO no permite llegar a NINGUNA

CONCLUSIÓN

• En algunos estudios (ej., nuevos fármacos) queremos estar

muy seguros de un resultado NO SIGNIFICATIVO

• CONVENCIÓN: Riesgo β <= 0,20-0,10

Page 36: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 36

Y para acabar: pequeña galería de los horrores...

“No se observan diferencias estadísticamente significativas

entre los dos grupos de tratamiento.

Conclusión: los dos tratamientos son igual de efectivos…”

….NNNOOOOORRRRRRLLLLL….!!!!!!

“Absence of evidence is not evidence of absence” (Douglas G. Altman)

Page 37: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 37

La ‘p’ de la comparación entre el tratamiento A y el

Placebo és menor de la ‘p’ de la comparación entre el

tratamiento B y el Placebo.

Conclusión: A es mejor que B...

….NNNOOOOORRRRRRLLLLL….!!!!!!

Y para acabar: pequeña galería de los horrores...

La ‘p’ solo nos informa sobre la fiabilidad del resultado de un contraste de hipótesis.

Page 38: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 38

Y para acabar: pequeña galería de los horrores...

Estadístico: “¿Cuál es tu hipótesis de trabajo?”

Investigador (es un decir...): “¿Hipótesis? Todas, las

tengo todas…”

….NNNNOOOOORRRRLLLLLL….!!!!!!

UN estudio, UNA hipótesis de trabajo, UN contraste de hipótesis. EL ESTUDIO

UNIVERSAL NO EXISTE !

Page 39: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

Mayo-2007 M.Pavesi: inferencia y estadística 39

Y para acabar: pequeña galería de los horrores...

Investigador (al pobre estadístico): “Mira, he venido a

verte porque tengo una base de datos…”

….NNNOOOOORRRRRRLLLLL….!!!!!!

El riesgo α se incrementa exponencialmente al multiplicar los contrastes de hipótesis:

1 test: Riesgo α = 5%……5 tests: Riesgo α > 20%

Page 40: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

….en fin...

(Darrell Huff: “How to lie with statistics”)

Page 41: Introducción Probabilidad, estadística e inferencia científica Marco Pavesi Senior Epidemiologist CIS Clinical Epidemiology Novartis Farmacéutica S.A

…¡¡ Gracias por vuestra

atención !!...Marco PavesiSenior Epidemiologist

CIS Clinical Epidemiology

Novartis Farmacéutica S.A.

([email protected])