análisis estadístico aplicado a la fisioterapia introducción fernando tuya, investigador i3...

30
Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C. www.fernandotuya.org

Upload: iago-alcaraz

Post on 22-Jan-2016

220 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C

Análisis estadístico aplicado a la fisioterapiaIntroducción

Fernando Tuya, Investigador I3Universidad de Las Palmas de G.C.

www.fernandotuya.org

Page 2: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C

2

Presentación

¿Quiénes son Vds.?

¿Qué hacen? ¿Precisan de ayuda en sus diseños y/o análisis? ¿Traen datos para analizar?

Page 3: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C

3

Gran carga matemática/

algebraica“Monkey”

¿Análisis estadístico?

“No necesitas ser un mecánico para conducir un coche: pero si saber las normas de educación vial”

Punto medio

….

Page 4: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C

4

Quinn, G.P. y Keough, M.J. Experimental Design and Data Analysis forBiologists. Cambridge University Press. 2002

Gotelli, N.J., Ellison, A.M. A Primer of Ecological Statistics. Sinauer Associates, Inc. 2004

Referencias claves

que aúnen conceptos de diseños muestral/experimental con estadística de forma sencilla

Page 5: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C

5

Medidas de tendencia central y dispersión: ejemplo

F(x)

µ

µ = S Xi / N

X = S Xi / ns2

s2 = S (Xi - µ)2 / N

s2 = S (Xi - X)2 / (n-1)

S = desviación estándar

Error estándar = s / Ö n

Nos medimos la altura; generamos histograma de casos; esa función presenta distribución (normal o gaussiana en este caso), con su media/mediana/moda y su dispersión/curtosis, etc..

Page 6: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C

6

Repaso: medidas de tendencia central y dispersión

F(x)

µ

µ = S Xi / N

X = S Xi / ns2

s2 = S (Xi - µ)2 / N

s2 = S (Xi - X)2 / (n-1)

S = desviación estándar

Error estándar = s / Ö n

10

20

30

Núm

ero

de

mue

s tr a

s

1 2 3 4 5 6

Histograma

Page 7: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C

7

Naturaleza del problema

Observaciones

Definir objetivos, cuestiones…y por tanto un modelo a contrastar

Hipótesis (hipótesis nula)

Muestreo y/o experimentoRechazar hipótesis

Refinar el modelo

Retener hipótesis

¿Y este rollo? método científico (hipotético-deductivo) karl Popper

Page 8: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C

8

¿ Ven la diferencia entre modelo (proposición general) e hipótesis (postulados particulares derivados del modelo)?

Clave para una buena investigación…

Page 9: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C

9

· Inferencia estadística – generalizar resultados de unas muestras (universo muestral) a la población (universo poblacional). La inferencia permite verificar hipótesis y, consecuentemente, modelos: representación/abstracción de la realidad

Conceptos; al pan, pan y al vino, vino¡

Distribución de una variable (ej. variable muestral) – tipo de distribución de acuerdo a un modelo (e.g. gaussiana o normal; si n>30 toda variable tiende a la normalidad)

10

20

30Número de erizos por m2

Núm

ero

de

mue

s tr a

s

1 2 3 4 5 6

Page 10: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C

10

Réplica – nivel más bajo de muestreo en un diseño – se corresponde con la unidad de muestreo (p.e. personas que entrevisto)

Muestreo aleatorio – las unidades de muestreo (p.e. personas que entrevisto) se distribuyen en el espacio y/o tiempo aleatoriamente y con independencia una de las otras (ausencia de independencia = resultados falsos)….Pensemos un caso de falta de independencia

Conceptos…continuamos

Ej. de “confounding” = “confusión experimental” (p.e. encuestas telefónicas en los 50s)

Page 11: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C

11

· Variables – mediciones que hacemos. Son:Dependientes (Y) = variables respuestaIndependientes (X) = predicen la variable respuesta = variables predictoras/ quiero conocer su influencia. · Las variables pueden ser:Numéricas (cualquier valor numérico en un rango) Categóricas (solo determinados valores o caracteres alfanuméricos, p.e. si/no, hombre mujer, alto/medio/bajo)

Factores – aquellas variables predictoras categóricas cuyo efecto queremos conocer sobre otra(s) variable(s); cada categoría = nivel (p.e. en ANOVAs)

Conceptos…continuamos (MUY IMPORANTE)

Page 12: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C

12

Veamos un ejemplo….variables continuas y categóricas

Pero… quiénes son mis variables - ¿cómo tabulo? ¿quién es la dependiente? ¿quién es la independiente?¿Son continuas o categóricas?

Page 13: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C

13

Cada variable se tabula (en su columna) acorde a sus niveles

Page 14: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C

14

Continuemos…

Page 15: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C

15

Ejemplo para razonar algunas cosas…

Mido la altura de los chicos y chicas de un grupo (muestra); quiero generalizar (inferencia) a un universo poblacional:

¿Son los chicos más altos que las chicas?Ho: No hay diferencias entre chicos y chicas

H1: Si hay…

Hipótesis de nulidad

Page 16: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C

16

1,861,70

n ↓, para poder decir que hay diferencias a nivel poblacional (inferencia), tendrá que haber grandes diferencias a nivel muestral

1,82

Si n ↑, las diferencias muestrales no tendrán que ser tan grandes para detectar diferencias significativas para un nivel de confianza dado

Page 17: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C

17

Universo poblacional (N)

Universo muestral (n)

Page 18: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C

18

Además, la detección (o no) de diferencias sign. no sólo depende n; tb del nivel de confianza de la inferencia

Todo test estadístico para el contraste objetivo de hipótesis incorpora 2 atributos clave:

Tamaño de la muestra (n) y la confianza de la inferencia

La confianza de la inferencia se determina mediante nivel de significación (α)…siempre hay un margen de error q cometemos y necesitamos conocer independientemente de “n”

Page 19: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C

19

DecisiónHo verdadera Ho falsa

Rechazar Ho

Aceptar Ho

Error tipo I (α) = P (rechazar Ho/Ho verdad)

No hay error (1-α) Error tipo II (β) =P(aceptar Ho/Ho es falsa)

No hay error (1-β)

α determina nuestro nivel de confianza. Si α=0.05, esto significa que tengo una confianza del 95% en mi inferencia. Si fijo α = 0.01, la confianza sería del 99%

1-β: “poder del análisis” = P(escoger H1/H1 es verdad) – capacidad de detectar diferencias – evidencia para rechazar Ho ¡¡

Page 20: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C

20

nn

Pequeño, poco poder para detectar diferencias sign.

Grande - $

Compromiso: ¿qué n?

Si queremos ↑ poder = aumentar n…pero ojo q ↑ n es difícil ($, tiempo)…necesitamos equilibrio

Page 21: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C

21

Universomuestral

Universo poblacional

Contraste de hipótesis: ¿evidencia para rechazar la Ho?

Inferir (Ho)

Ho: las cosas son igualesH1: las cosas son distintas o diferentes a algo que espero

Estadísticof(mis datos; x, n)

Distribución de probabilidad conocida

Protocolo general (idea conceptual):

extraigof(Ho)

Se compara

región de rechazo: si el valor del estadístico aquí= rechazo HoRegión crítica en función de gl y α

Podemos calcular la probabilidad de q “entre” el estadístico (“el valor p”)

Page 22: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C

22

Región de rechazo

Tabuladas en f(α y grados libertad proxy a n)

Page 23: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C

23

Por ello, cuando P < 0.05 ó 0.01 decimos q es significativo

Hace años: sólo decíamos si P era > ó < 0.05 /0.01Hoy: sabemos el P-valor exacto = sabemos si el resultado es “muy significativo”, “poco significativo” o “marginalmente significativo” – evidencia para rechazar o no la Ho

¿Qué hacemos en la práctica? Software estadístico

Buscan el "valor p"= la probabilidad de equivocarnos si rechazamos H0

Como la P (rechazar H0 cuando es verdad) α = 0.05; un P < 0.05 nos proporciona evidencia para rechazar la H0

Page 24: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C

24

Software estadístico

Existe una amplísima amalgama….la uni = SPSS

Nosotros vamos a aprender el uso de Rcommander (freeware)

Nos hacen todos los cálculos, fantástico¡¡¡ Es decir, a partir de nuestros datos calcula el valor del estadístico (en función del test) y su significación¡¡¡

pero debemos (1) seleccionar el análisis adecuado para nuestros datos, (2) saber interpretarlos y (3) saber conectar su interpretación con las gráficas – ojo con esto.

Page 25: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C

25

¿Cómo elijo el test estadístico adecuado a mis datos?

Depende de:

(i) tipo de datos y de (ii) cómo se comporten

Page 26: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C

26

Independiente (predictoras)

Categórica ContinuaDependiente(o respuesta)

Categórica Tabular (tabla contingencia) Regresión Logística

Continua

ANOVA (t student, caso más simple) y sus equivalentes no

paramétricos Regresión lineal

Tipo de datos

Variables continuas (altura, peso, abundancia, etc..) vs. categóricas (e.g. sexo, trabajo, grupo de edad, etc.)

Page 27: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C

27

Técnicas estadísticas paramétricas vs. no paramétricas

Paramétricas: “datos se comportan bien” = asumimos ciertas asunciones: tomados al azar, normales, hay homogeneidad de varianzas

¿Qué ocurre cuando los datos no se comportan bien? Técnicas no paramétricas

· Técnicas no paramétricas: convierten los datos a rangos- perdemos información¡¡¡¡¡ (veamos ej. en la pizarra)

¿Cómo se comportan los datos?

Page 28: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C

28

Pragmáticamente, en cualquier estudio/experimento:

Ho: variación en la variable dependiente no relacionada con la variables(s) respuesta – predictor(es); es decir, no es mayor que la esperada por casualidad

H1: la casualidad no explica totalmente la variación en esta variable respuesta; hay “algo” de variación atribuida a la variable(s) respuesta

Hipótesis de nulidad

Ho: las cosas son igualesH1: las cosas son distintas o diferentes a algo que espero

Page 29: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C

29

Resumiendo…cómo procedemos…

Page 30: Análisis estadístico aplicado a la fisioterapia Introducción Fernando Tuya, Investigador I3 Universidad de Las Palmas de G.C

30

Especifica la pregunta q quieres contestar

Pon esta pregunta en forma de una Ho/Ha estadística

Determina qué variables y factores son relevantes para tu pregunta. ¿Qué tipo de variables son? ¿Continuas o categóricas?

Selecciona el mejor test estadístico en función: tipo y nº de variables, las asunciones paramétricas, etc.

Haz el estudio y pregúntate si los resultados cambiarían conceptualmente en función del tamaño muestral (replicación); hazte la siguiente pregunta: ¿si n hubiera sido distinto, mi interpretación de los resultados sería la misma?

Guarda los datos y juega con ellos: mira si siguen las asunciones de tu test. Aplica un test adecuado e interpreta los resultados

Comunica los resultados eficientemente – gráficas/tablas