análisis estadístico aplicado a la fisioterapia introducción fernando tuya, investigador i3...

Post on 22-Jan-2016

226 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Análisis estadístico aplicado a la fisioterapiaIntroducción

Fernando Tuya, Investigador I3Universidad de Las Palmas de G.C.

www.fernandotuya.org

2

Presentación

¿Quiénes son Vds.?

¿Qué hacen? ¿Precisan de ayuda en sus diseños y/o análisis? ¿Traen datos para analizar?

3

Gran carga matemática/

algebraica“Monkey”

¿Análisis estadístico?

“No necesitas ser un mecánico para conducir un coche: pero si saber las normas de educación vial”

Punto medio

….

4

Quinn, G.P. y Keough, M.J. Experimental Design and Data Analysis forBiologists. Cambridge University Press. 2002

Gotelli, N.J., Ellison, A.M. A Primer of Ecological Statistics. Sinauer Associates, Inc. 2004

Referencias claves

que aúnen conceptos de diseños muestral/experimental con estadística de forma sencilla

5

Medidas de tendencia central y dispersión: ejemplo

F(x)

µ

µ = S Xi / N

X = S Xi / ns2

s2 = S (Xi - µ)2 / N

s2 = S (Xi - X)2 / (n-1)

S = desviación estándar

Error estándar = s / Ö n

Nos medimos la altura; generamos histograma de casos; esa función presenta distribución (normal o gaussiana en este caso), con su media/mediana/moda y su dispersión/curtosis, etc..

6

Repaso: medidas de tendencia central y dispersión

F(x)

µ

µ = S Xi / N

X = S Xi / ns2

s2 = S (Xi - µ)2 / N

s2 = S (Xi - X)2 / (n-1)

S = desviación estándar

Error estándar = s / Ö n

10

20

30

Núm

ero

de

mue

s tr a

s

1 2 3 4 5 6

Histograma

7

Naturaleza del problema

Observaciones

Definir objetivos, cuestiones…y por tanto un modelo a contrastar

Hipótesis (hipótesis nula)

Muestreo y/o experimentoRechazar hipótesis

Refinar el modelo

Retener hipótesis

¿Y este rollo? método científico (hipotético-deductivo) karl Popper

8

¿ Ven la diferencia entre modelo (proposición general) e hipótesis (postulados particulares derivados del modelo)?

Clave para una buena investigación…

9

· Inferencia estadística – generalizar resultados de unas muestras (universo muestral) a la población (universo poblacional). La inferencia permite verificar hipótesis y, consecuentemente, modelos: representación/abstracción de la realidad

Conceptos; al pan, pan y al vino, vino¡

Distribución de una variable (ej. variable muestral) – tipo de distribución de acuerdo a un modelo (e.g. gaussiana o normal; si n>30 toda variable tiende a la normalidad)

10

20

30Número de erizos por m2

Núm

ero

de

mue

s tr a

s

1 2 3 4 5 6

10

Réplica – nivel más bajo de muestreo en un diseño – se corresponde con la unidad de muestreo (p.e. personas que entrevisto)

Muestreo aleatorio – las unidades de muestreo (p.e. personas que entrevisto) se distribuyen en el espacio y/o tiempo aleatoriamente y con independencia una de las otras (ausencia de independencia = resultados falsos)….Pensemos un caso de falta de independencia

Conceptos…continuamos

Ej. de “confounding” = “confusión experimental” (p.e. encuestas telefónicas en los 50s)

11

· Variables – mediciones que hacemos. Son:Dependientes (Y) = variables respuestaIndependientes (X) = predicen la variable respuesta = variables predictoras/ quiero conocer su influencia. · Las variables pueden ser:Numéricas (cualquier valor numérico en un rango) Categóricas (solo determinados valores o caracteres alfanuméricos, p.e. si/no, hombre mujer, alto/medio/bajo)

Factores – aquellas variables predictoras categóricas cuyo efecto queremos conocer sobre otra(s) variable(s); cada categoría = nivel (p.e. en ANOVAs)

Conceptos…continuamos (MUY IMPORANTE)

12

Veamos un ejemplo….variables continuas y categóricas

Pero… quiénes son mis variables - ¿cómo tabulo? ¿quién es la dependiente? ¿quién es la independiente?¿Son continuas o categóricas?

13

Cada variable se tabula (en su columna) acorde a sus niveles

14

Continuemos…

15

Ejemplo para razonar algunas cosas…

Mido la altura de los chicos y chicas de un grupo (muestra); quiero generalizar (inferencia) a un universo poblacional:

¿Son los chicos más altos que las chicas?Ho: No hay diferencias entre chicos y chicas

H1: Si hay…

Hipótesis de nulidad

16

1,861,70

n ↓, para poder decir que hay diferencias a nivel poblacional (inferencia), tendrá que haber grandes diferencias a nivel muestral

1,82

Si n ↑, las diferencias muestrales no tendrán que ser tan grandes para detectar diferencias significativas para un nivel de confianza dado

17

Universo poblacional (N)

Universo muestral (n)

18

Además, la detección (o no) de diferencias sign. no sólo depende n; tb del nivel de confianza de la inferencia

Todo test estadístico para el contraste objetivo de hipótesis incorpora 2 atributos clave:

Tamaño de la muestra (n) y la confianza de la inferencia

La confianza de la inferencia se determina mediante nivel de significación (α)…siempre hay un margen de error q cometemos y necesitamos conocer independientemente de “n”

19

DecisiónHo verdadera Ho falsa

Rechazar Ho

Aceptar Ho

Error tipo I (α) = P (rechazar Ho/Ho verdad)

No hay error (1-α) Error tipo II (β) =P(aceptar Ho/Ho es falsa)

No hay error (1-β)

α determina nuestro nivel de confianza. Si α=0.05, esto significa que tengo una confianza del 95% en mi inferencia. Si fijo α = 0.01, la confianza sería del 99%

1-β: “poder del análisis” = P(escoger H1/H1 es verdad) – capacidad de detectar diferencias – evidencia para rechazar Ho ¡¡

20

nn

Pequeño, poco poder para detectar diferencias sign.

Grande - $

Compromiso: ¿qué n?

Si queremos ↑ poder = aumentar n…pero ojo q ↑ n es difícil ($, tiempo)…necesitamos equilibrio

21

Universomuestral

Universo poblacional

Contraste de hipótesis: ¿evidencia para rechazar la Ho?

Inferir (Ho)

Ho: las cosas son igualesH1: las cosas son distintas o diferentes a algo que espero

Estadísticof(mis datos; x, n)

Distribución de probabilidad conocida

Protocolo general (idea conceptual):

extraigof(Ho)

Se compara

región de rechazo: si el valor del estadístico aquí= rechazo HoRegión crítica en función de gl y α

Podemos calcular la probabilidad de q “entre” el estadístico (“el valor p”)

22

Región de rechazo

Tabuladas en f(α y grados libertad proxy a n)

23

Por ello, cuando P < 0.05 ó 0.01 decimos q es significativo

Hace años: sólo decíamos si P era > ó < 0.05 /0.01Hoy: sabemos el P-valor exacto = sabemos si el resultado es “muy significativo”, “poco significativo” o “marginalmente significativo” – evidencia para rechazar o no la Ho

¿Qué hacemos en la práctica? Software estadístico

Buscan el "valor p"= la probabilidad de equivocarnos si rechazamos H0

Como la P (rechazar H0 cuando es verdad) α = 0.05; un P < 0.05 nos proporciona evidencia para rechazar la H0

24

Software estadístico

Existe una amplísima amalgama….la uni = SPSS

Nosotros vamos a aprender el uso de Rcommander (freeware)

Nos hacen todos los cálculos, fantástico¡¡¡ Es decir, a partir de nuestros datos calcula el valor del estadístico (en función del test) y su significación¡¡¡

pero debemos (1) seleccionar el análisis adecuado para nuestros datos, (2) saber interpretarlos y (3) saber conectar su interpretación con las gráficas – ojo con esto.

25

¿Cómo elijo el test estadístico adecuado a mis datos?

Depende de:

(i) tipo de datos y de (ii) cómo se comporten

26

Independiente (predictoras)

Categórica ContinuaDependiente(o respuesta)

Categórica Tabular (tabla contingencia) Regresión Logística

Continua

ANOVA (t student, caso más simple) y sus equivalentes no

paramétricos Regresión lineal

Tipo de datos

Variables continuas (altura, peso, abundancia, etc..) vs. categóricas (e.g. sexo, trabajo, grupo de edad, etc.)

27

Técnicas estadísticas paramétricas vs. no paramétricas

Paramétricas: “datos se comportan bien” = asumimos ciertas asunciones: tomados al azar, normales, hay homogeneidad de varianzas

¿Qué ocurre cuando los datos no se comportan bien? Técnicas no paramétricas

· Técnicas no paramétricas: convierten los datos a rangos- perdemos información¡¡¡¡¡ (veamos ej. en la pizarra)

¿Cómo se comportan los datos?

28

Pragmáticamente, en cualquier estudio/experimento:

Ho: variación en la variable dependiente no relacionada con la variables(s) respuesta – predictor(es); es decir, no es mayor que la esperada por casualidad

H1: la casualidad no explica totalmente la variación en esta variable respuesta; hay “algo” de variación atribuida a la variable(s) respuesta

Hipótesis de nulidad

Ho: las cosas son igualesH1: las cosas son distintas o diferentes a algo que espero

29

Resumiendo…cómo procedemos…

30

Especifica la pregunta q quieres contestar

Pon esta pregunta en forma de una Ho/Ha estadística

Determina qué variables y factores son relevantes para tu pregunta. ¿Qué tipo de variables son? ¿Continuas o categóricas?

Selecciona el mejor test estadístico en función: tipo y nº de variables, las asunciones paramétricas, etc.

Haz el estudio y pregúntate si los resultados cambiarían conceptualmente en función del tamaño muestral (replicación); hazte la siguiente pregunta: ¿si n hubiera sido distinto, mi interpretación de los resultados sería la misma?

Guarda los datos y juega con ellos: mira si siguen las asunciones de tu test. Aplica un test adecuado e interpreta los resultados

Comunica los resultados eficientemente – gráficas/tablas

top related