Análisis estadístico aplicado a la fisioterapiaIntroducción
Fernando Tuya, Investigador I3Universidad de Las Palmas de G.C.
www.fernandotuya.org
2
Presentación
¿Quiénes son Vds.?
¿Qué hacen? ¿Precisan de ayuda en sus diseños y/o análisis? ¿Traen datos para analizar?
3
Gran carga matemática/
algebraica“Monkey”
¿Análisis estadístico?
“No necesitas ser un mecánico para conducir un coche: pero si saber las normas de educación vial”
Punto medio
….
4
Quinn, G.P. y Keough, M.J. Experimental Design and Data Analysis forBiologists. Cambridge University Press. 2002
Gotelli, N.J., Ellison, A.M. A Primer of Ecological Statistics. Sinauer Associates, Inc. 2004
Referencias claves
que aúnen conceptos de diseños muestral/experimental con estadística de forma sencilla
5
Medidas de tendencia central y dispersión: ejemplo
F(x)
µ
µ = S Xi / N
X = S Xi / ns2
s2 = S (Xi - µ)2 / N
s2 = S (Xi - X)2 / (n-1)
S = desviación estándar
Error estándar = s / Ö n
Nos medimos la altura; generamos histograma de casos; esa función presenta distribución (normal o gaussiana en este caso), con su media/mediana/moda y su dispersión/curtosis, etc..
6
Repaso: medidas de tendencia central y dispersión
F(x)
µ
µ = S Xi / N
X = S Xi / ns2
s2 = S (Xi - µ)2 / N
s2 = S (Xi - X)2 / (n-1)
S = desviación estándar
Error estándar = s / Ö n
10
20
30
Núm
ero
de
mue
s tr a
s
1 2 3 4 5 6
Histograma
7
Naturaleza del problema
Observaciones
Definir objetivos, cuestiones…y por tanto un modelo a contrastar
Hipótesis (hipótesis nula)
Muestreo y/o experimentoRechazar hipótesis
Refinar el modelo
Retener hipótesis
¿Y este rollo? método científico (hipotético-deductivo) karl Popper
8
¿ Ven la diferencia entre modelo (proposición general) e hipótesis (postulados particulares derivados del modelo)?
Clave para una buena investigación…
9
· Inferencia estadística – generalizar resultados de unas muestras (universo muestral) a la población (universo poblacional). La inferencia permite verificar hipótesis y, consecuentemente, modelos: representación/abstracción de la realidad
Conceptos; al pan, pan y al vino, vino¡
Distribución de una variable (ej. variable muestral) – tipo de distribución de acuerdo a un modelo (e.g. gaussiana o normal; si n>30 toda variable tiende a la normalidad)
10
20
30Número de erizos por m2
Núm
ero
de
mue
s tr a
s
1 2 3 4 5 6
10
Réplica – nivel más bajo de muestreo en un diseño – se corresponde con la unidad de muestreo (p.e. personas que entrevisto)
Muestreo aleatorio – las unidades de muestreo (p.e. personas que entrevisto) se distribuyen en el espacio y/o tiempo aleatoriamente y con independencia una de las otras (ausencia de independencia = resultados falsos)….Pensemos un caso de falta de independencia
Conceptos…continuamos
Ej. de “confounding” = “confusión experimental” (p.e. encuestas telefónicas en los 50s)
11
· Variables – mediciones que hacemos. Son:Dependientes (Y) = variables respuestaIndependientes (X) = predicen la variable respuesta = variables predictoras/ quiero conocer su influencia. · Las variables pueden ser:Numéricas (cualquier valor numérico en un rango) Categóricas (solo determinados valores o caracteres alfanuméricos, p.e. si/no, hombre mujer, alto/medio/bajo)
Factores – aquellas variables predictoras categóricas cuyo efecto queremos conocer sobre otra(s) variable(s); cada categoría = nivel (p.e. en ANOVAs)
Conceptos…continuamos (MUY IMPORANTE)
12
Veamos un ejemplo….variables continuas y categóricas
Pero… quiénes son mis variables - ¿cómo tabulo? ¿quién es la dependiente? ¿quién es la independiente?¿Son continuas o categóricas?
13
Cada variable se tabula (en su columna) acorde a sus niveles
14
Continuemos…
15
Ejemplo para razonar algunas cosas…
Mido la altura de los chicos y chicas de un grupo (muestra); quiero generalizar (inferencia) a un universo poblacional:
¿Son los chicos más altos que las chicas?Ho: No hay diferencias entre chicos y chicas
H1: Si hay…
Hipótesis de nulidad
16
1,861,70
n ↓, para poder decir que hay diferencias a nivel poblacional (inferencia), tendrá que haber grandes diferencias a nivel muestral
1,82
Si n ↑, las diferencias muestrales no tendrán que ser tan grandes para detectar diferencias significativas para un nivel de confianza dado
17
Universo poblacional (N)
Universo muestral (n)
18
Además, la detección (o no) de diferencias sign. no sólo depende n; tb del nivel de confianza de la inferencia
Todo test estadístico para el contraste objetivo de hipótesis incorpora 2 atributos clave:
Tamaño de la muestra (n) y la confianza de la inferencia
La confianza de la inferencia se determina mediante nivel de significación (α)…siempre hay un margen de error q cometemos y necesitamos conocer independientemente de “n”
19
DecisiónHo verdadera Ho falsa
Rechazar Ho
Aceptar Ho
Error tipo I (α) = P (rechazar Ho/Ho verdad)
No hay error (1-α) Error tipo II (β) =P(aceptar Ho/Ho es falsa)
No hay error (1-β)
α determina nuestro nivel de confianza. Si α=0.05, esto significa que tengo una confianza del 95% en mi inferencia. Si fijo α = 0.01, la confianza sería del 99%
1-β: “poder del análisis” = P(escoger H1/H1 es verdad) – capacidad de detectar diferencias – evidencia para rechazar Ho ¡¡
20
nn
Pequeño, poco poder para detectar diferencias sign.
Grande - $
Compromiso: ¿qué n?
Si queremos ↑ poder = aumentar n…pero ojo q ↑ n es difícil ($, tiempo)…necesitamos equilibrio
21
Universomuestral
Universo poblacional
Contraste de hipótesis: ¿evidencia para rechazar la Ho?
Inferir (Ho)
Ho: las cosas son igualesH1: las cosas son distintas o diferentes a algo que espero
Estadísticof(mis datos; x, n)
Distribución de probabilidad conocida
Protocolo general (idea conceptual):
extraigof(Ho)
Se compara
región de rechazo: si el valor del estadístico aquí= rechazo HoRegión crítica en función de gl y α
Podemos calcular la probabilidad de q “entre” el estadístico (“el valor p”)
22
Región de rechazo
Tabuladas en f(α y grados libertad proxy a n)
23
Por ello, cuando P < 0.05 ó 0.01 decimos q es significativo
Hace años: sólo decíamos si P era > ó < 0.05 /0.01Hoy: sabemos el P-valor exacto = sabemos si el resultado es “muy significativo”, “poco significativo” o “marginalmente significativo” – evidencia para rechazar o no la Ho
¿Qué hacemos en la práctica? Software estadístico
Buscan el "valor p"= la probabilidad de equivocarnos si rechazamos H0
Como la P (rechazar H0 cuando es verdad) α = 0.05; un P < 0.05 nos proporciona evidencia para rechazar la H0
24
Software estadístico
Existe una amplísima amalgama….la uni = SPSS
Nosotros vamos a aprender el uso de Rcommander (freeware)
Nos hacen todos los cálculos, fantástico¡¡¡ Es decir, a partir de nuestros datos calcula el valor del estadístico (en función del test) y su significación¡¡¡
pero debemos (1) seleccionar el análisis adecuado para nuestros datos, (2) saber interpretarlos y (3) saber conectar su interpretación con las gráficas – ojo con esto.
25
¿Cómo elijo el test estadístico adecuado a mis datos?
Depende de:
(i) tipo de datos y de (ii) cómo se comporten
26
Independiente (predictoras)
Categórica ContinuaDependiente(o respuesta)
Categórica Tabular (tabla contingencia) Regresión Logística
Continua
ANOVA (t student, caso más simple) y sus equivalentes no
paramétricos Regresión lineal
Tipo de datos
Variables continuas (altura, peso, abundancia, etc..) vs. categóricas (e.g. sexo, trabajo, grupo de edad, etc.)
27
Técnicas estadísticas paramétricas vs. no paramétricas
Paramétricas: “datos se comportan bien” = asumimos ciertas asunciones: tomados al azar, normales, hay homogeneidad de varianzas
¿Qué ocurre cuando los datos no se comportan bien? Técnicas no paramétricas
· Técnicas no paramétricas: convierten los datos a rangos- perdemos información¡¡¡¡¡ (veamos ej. en la pizarra)
¿Cómo se comportan los datos?
28
Pragmáticamente, en cualquier estudio/experimento:
Ho: variación en la variable dependiente no relacionada con la variables(s) respuesta – predictor(es); es decir, no es mayor que la esperada por casualidad
H1: la casualidad no explica totalmente la variación en esta variable respuesta; hay “algo” de variación atribuida a la variable(s) respuesta
Hipótesis de nulidad
Ho: las cosas son igualesH1: las cosas son distintas o diferentes a algo que espero
29
Resumiendo…cómo procedemos…
30
Especifica la pregunta q quieres contestar
Pon esta pregunta en forma de una Ho/Ha estadística
Determina qué variables y factores son relevantes para tu pregunta. ¿Qué tipo de variables son? ¿Continuas o categóricas?
Selecciona el mejor test estadístico en función: tipo y nº de variables, las asunciones paramétricas, etc.
Haz el estudio y pregúntate si los resultados cambiarían conceptualmente en función del tamaño muestral (replicación); hazte la siguiente pregunta: ¿si n hubiera sido distinto, mi interpretación de los resultados sería la misma?
Guarda los datos y juega con ellos: mira si siguen las asunciones de tu test. Aplica un test adecuado e interpreta los resultados
Comunica los resultados eficientemente – gráficas/tablas