presentación de powerpoint - usalsimfit.usal.es/gonzalez/diapositivas/tema7a_tests...tests...

51
Tests estadísticos habituales Tests estadísticos habituales Fco. Javier Burguillo Universidad de Salamanca Tema 7 Con variable cuantitativa

Upload: others

Post on 09-Apr-2020

14 views

Category:

Documents


0 download

TRANSCRIPT

Tests estadísticos habituales

Tests estadísticos habituales

Fco. Javier Burguillo

Universidad de Salamanca

Tema 7

Con variable cuantitativa

Tests estadísticos habituales

Antecedentes Bibliográficos

Diseño de experimentos

Obtención datos, calibrados, etc.

Exploración de datos

Análisis : tests estadísticos,

ajuste de curvas , A. multivariante….

Etapas de una investigación

Tests estadísticos habituales

PoblaciónConjunto todos los individuos

MuestraSubconjunto individuos

Inferencia estadística

(Tests estadísticos)

Media (m)

Desviación Estándar (s)

Media

Desviación Estándar (s)

x

Especificar población y muestra

Tests estadísticos habituales

Pasos en tests de contraste de hipótesis

2) Decidir el test a usar:Paramétrico (ej.: test “t” Student)

No Paramétrico (ej.: est U de Mann Whitney)

4) Aplicar el test

3) Fijar la probabilidad de equivocarse al rechazar H0 siendo ésta verdadera:

Riesgo de equivocarse del 5 ó 1 % 0 1.00 5.0 ór i e s g o

)( 21 mm H1= Las 2 medias son diferentes (test bilateral o de 2 colas)

1) Decidir hipótesis nula y alternativa a comparar, por ej. con 2 medias:

)( 21 mm H0= Las 2 medias poblacionales son iguales

(test unilateral ó 1 cola superior))( 21 mm H1= La media 1 es mayor que la 2

)( 21 mm H1= La media 1 es menor que la 2 (test unilateral ó 1 cola inferior)

Tests estadísticos habituales

Tests paramétricos y no paramétricos

“Requisitos” de los tests paramétricos:

La muestra pertenece a una población cuya distribución de probabilidad

es conocida (por ej. distribución normal).

Comparan los grupos a través de un “parámetro” de la distribución

(por ej: la media en la distribución normal).

Se utilizan con muestras no muy pequeñas en las que es posible

comprobar la distribución que siguen los datos.

“Requisitos” de los tests no paramétricos:

No se presupone que los datos sigan una distribución determinada.

Se realizan con procedimientos de ordenación, rangos y recuentos.

Se usan con muestras pequeñas (n < 10) en las que se desconoce la

distribución que siguen los datos.

Tests estadísticos habituales

Tests paramétricos: La

distribución normal

2

22

2

1)( s

m

s

x

exf

Normal:

2

2

2

1)(

z

ezf

Normal estandarizada:

s

m )( i

i

xz

:adosestandariz valores

Tests estadísticos habituales

Exploración de datos Otras distribuciones

Distribución t de Student:1 nlibertad de grados :

s

m )(:

xzvariablela eas

)( ss quecomprueba se

Otras distribuciones: Poisson,

Ji-cuadrado, binomial.

Distribución F de Snedecor :

11 2211

2

2

2

2

2

1

2

1

nn

s

sF" F" variable

s

s

;

:

11 2211 n nlibertad de grados :2

2

2

1 ss onc spoblacione 2Si

ns

xt" t" valores

n

nn

/:

m1

1 n

G.L.numerador G.L.denominador

G.L

Tests estadísticos habituales

Por ejemplo: comparación de 2 medias en

muestras pequeñas por el test “t de student”

Si... Si...

•Se quiere determinar si la presión sistólica en hombres y mujeres de Salamanca es la misma

Distribuciones normales

Misma varianza15.2, 16.3, 17.2, 16.1,...........15.7 14.1, 13.3, 14.2, 13.1,...........12.7

•Se toman 2 muestras al azar de hombres y mujeres de Salamanca:

Hombres Mujeres

Test “t” de datos independientes de tipo bilateral (2 colas)

21 21

2

22

2

11

nnnn

1)s-(n1)s-(n

XXT

11

2

21

Estadístico T

sigue distrib.

“t student”

tTc o l a s ) ) 0 .0 5 ( 2y 2-nc o n ( t a b l a sc

21

n

(Las medias en las poblaciones de

hombres y mujeres son iguales)H0 = No hay diferencia

(p<0.05)

tTc o l a s ) ) 0 .0 5 ( 2y 2-c o n ( t a b l a sc

21

nn

(Las medias en las poblaciones de

hombres y mujeres no son iguales)

H1 = Si hay diferencia

Requisitos

Tests estadísticos habituales

Test t student bilateral (2 colas)

o unilateral (1 cola)

Test bilateral con riesgo = 0.05

Test unilateral cola superior con = 0.05 Test unilateral cola inferior con = 0.05

tc- tc

tc - tc

tTc o l a s0 . 0 5,c 2

tT1 c o l a0 . 0 5,c

tT

c o l a 10 . 0 5,c

Curva distribución valores de “t” )( 21 mm

)( 21 mm

21 21

2

22

2

11

nnnn

1)s-(n1)s-(n

XXT

11

2

21

)( 21 mm

221 nn

221 nn 221 nn

Grados de libertad

Estadístico T

Tests estadísticos habituales

¿Cómo se decide el hacer un test

de 2 colas ó 1 cola?

• Las hipótesis bilaterales o de 2 colas son las más

habituales en investigación.

• Las hipótesis unilaterales o de 1 cola sólo se eligen

cuando hay evidencia empírica de que esa dirección a

contrastar es la única posible:

a) Porque se ha hecho un estudio piloto o está bien

documentado en bibliografía.

b) Porque la dirección contraria es imposible.

c) Se debe tomar la decisión antes de hacer el test.

Tests estadísticos habituales

Tabla de valores “tc” para test bilateral (2 colas) o

unilateral (1 cola) a diferentes riesgos

Riesgo 0.10 0.05 0.025 ------

Valor “ tc ”

(2 colas)1.73 2.10 2.44 ------

Valor “ tc ”

(1 cola)1.33 1.73 2.10 -------

Valores críticos de “t” para grados de libertad 18 ( = 10+10-2 = 18)

2 colas

1 cola

superior

2.10

1.73

Nota: Obsérvese que para el mismo valor de tc (2.10) , el riesgo pasa a ser el doble cuando se cambia de “1cola” a “2 colas” (la

mitad en cada cola).

Tests estadísticos habituales

Clasicamente: tablas de valores “tc” para 2 colas y 1 cola

Actualmente: ordenadores dan el p-valor exacto

2 colas

= 0.05

1 cola

superior

= 0.05

1.73

2.10

Degrees of freedom = n1 +n2-2 = 10 +10 - 2 =18

El doble

para 2 colas

que para 1

cola

Tests estadísticos habituales

• Los datos pueden refutarla

• Es la que se acepta si las pruebas no indican lo contrario

• El riesgo de rechazarla por error tiene graves consecuencias

Riesgos al tomar decisiones

• No debería ser aceptada sin una gran evidencia a favor.

• El riego de rechazarla por error tiene consecuencias consideradas menos graves que la anterior

Basado en: Fco. Javier Barón (U. Málaga)

• H1: Hipótesis alternativa

– Es culpable

• H0: Hipótesis nula

– Es inocente

Tests estadísticos habituales

Los dos riesgos asociados a un test de hipótesis:

Error tipo I (riesgo ) y tipo II (riesgo b)

Acierto

Acierto

Potencia del test = 1-b

Simil: declarar culpable a un

inocente () y viceversa (b).

Realid

ad

Decisión test

H0H0

H0

H0

Imaginemos un test de hipótesis para una media de una población de media m

Se tiene una

media muestral

m0 m1

Región de aceptación H0 Región de rechazo H0

Región de rechazo H1Región de aceptación H1

0.05 tipo Ib 0.20 tipo II

Línea de decisión

(riesgo):

Potencia del

test : 1-b 0.80

Tests estadísticos habituales

Eligiendo el test

estadístico con

variables de tipo

cuantitativo

Tests estadísticos habituales

1 muestra Kolmogorov-Smirnov (comprobar qué distribución siguen los datos)

Datos independientes

Shapiro-Wilks (probar si los datos siguen la distribución normal)

2 muestras

“t de student” para comparar una media experimental con una media teórica

“t de student” de datos independientes para 2 medias)Paramétrico

Datos apareados

No paramétricoU de Mann Whitney para igualdad de medianas

“t de student” de datos apareados para 2 mediasParamétrico

No paramétrico Wilcoxon de rangos con signos para igualdad de medianas

n muestras

Independientes Test F para probar igualdad de varianzas

Datos independientes

ANOVA de 1 factor + test de TukeyParamétrico

No paramétrico Kruskal –Wallis para 1 factor

ANOVA de medidas repetidas de 1 factorParamétrico

No paramétrico Test de Friedman para “n” medianas

ANOVA de 2 factores factorial

Datos apareados

IndependientesTest de Bartlett o de Levene para probar igualdad de “n” varianzas

Paramétrico

No paramétrico

Kolmogorv-Smirnov 2 muestras (igualdad distribuciones)

Tests habituales con variable cuantitativa

Tests estadísticos habituales

Tests estadísticos en SIMFIT

Diferentes ANOVASTests habituales

Tests estadísticos habituales

Eligiendo el Test estadístico

•Test “t” de comparación de la media de los datos

(experimental) con una media teórica (Paramétrico)

•Test de Kolmogorov-Smirnov para probar si los datos

siguen una distribución determinada (No Paramétrico)

•Test de Shapiro Wilks para probar si los datos siguen una

distribución normal (No Paramétrico)

¿Qué tests se pueden hacer con 1 muestra?: 15.2, 16.3, 17.2, 16.1,...........15.7

Variables de tipo cuantitativo

Tests estadísticos habituales

Comparación de 1 media experimental con una

media teórica por el test paramétrico t-student

ns

XT

X

0m

•Se dispone de una muestra de 150 sujetos de una población que siguen dieta

mediterránea y tienen una media de colesterol de 221 y una desviación

estándar de 39.6; y se quiere probar que su colesterol a nivel poblacional es

inferior al colesterol medio de la población general que es de 235.

Hy H 0100 mmmm :: Hy H 235235 100 mmm ::

p<0.05

Conclusión: Se rechaza la hipótesis nula con una p < 0.05. La dieta mediterránea

produce en promedio un colesterol inferior a la dieta general con p < 0.05.

En este

ejemplo:3 34

1 5 063 9

2 3 52 2 1.

.

T 1T 1 c o l a0 . 0 51 4 9 , 6 6.

tT1 c o l a0 . 0 5,c

1 n

Si…(Test de 1 cola inferior)

Requisito:

Normalidad

Tests estadísticos habituales

d+

d-

Test no paramétrico de Kolmogorov Smirnov para probar si

unos datos siguen una distribución determinada

¿Siguen una

distribución

normal?

Para probar sólo si unos datos siguen una

distribución normal hay otro test llamado

de Shapiro-Wilks, pero no se debe utilizar

con muestras excesivamente pequeñas o

mayores de 5000.

Distancias entre

cdf exp. y la cdf

teóricaP > 0.05 (2 colas)

Los datos sí que

siguen una

distribución normal

Tests estadísticos habituales

Para probar sólo si unos datos siguen una

distribución normal hay otro test llamado

de Shapiro-Wilks, pero no se debe utilizar

con muestras excesivamente pequeñas o

mayores de 5000.

Test de Shapiro-Wilks

Tests estadísticos habituales

Eligiendo el Test estadístico (cont.)

•Test “t” de comparación de 2 medias con datos independientes

(Paramétrico)

•Test “U” de Mann-Whitney comparación 2 medianas de datos

independientes (No paramétrico)

•Test “t” de comparación de 2 medias con datos apareados (Paramétrico)

•Test de rangos con signo de Wilcoxon para comparación de 2 medianas

en datos apareados ((No paramétrico)

•Test de Bartlett de comparación de 2 varianzas (equivalente a test F)

(Paramétrico)

15.2, 16.3, 17.2, 16.1,...........15.7

14.1, 13.3, 14.2, 13.1,...........12.7

¿Qué tests se pueden hacer con 2 muestras?:

Variables de tipo continuo

Tests estadísticos habituales

Comparación de 2 medias con datos independientes

con el test paramétrico t-student (2 colas)

d i f e r e n c i ah a y n otTS i c o l a s ) ) ( 2 0 . 0 5,(c

21 21

2

22

2

11

nnnn

1)s-(n1)s-(n

XXT

11

2

21

d i f e r e n c i ah a y s i tTS i c o l a s ) ) ( 2 0 . 0 5 ,(c (p<0.05)

Normalidad

Varianzas iguales15.2, 16.3, 17.2, 16.1,...........15.7 14.1, 13.3, 14.2, 13.1,...........12.7

Requisitos

Tests estadísticos habituales

Caso particular: t-student de 2 medias con datos independientes con

varianzas desiguales (corrección de Welch)

Normalidad

Distinta varianza17.1, 16.8, 17.3, 15.1,...........16.7 13.1, 14.3, 13.2, 14.1,...........13.7

TW

(p<0.05)

d i f e r e n c i ah a y n otTS i c o l a s ) ) ( 2 0 . 0 5,(cW

d i f e r e n c i ah a y s i tTS i c o l a s ) ) ( 2 0 . 0 5 ,(cw

Requisitos

Grados de libertad

según Welsch

Tests estadísticos habituales

Ejemplo de t-Student de 2 medias en SIMFIT con

datos independientes asumiendo varianzas

iguales o desiguales (entre corchetes)

[Welsch]

Requisitos

test t student

Normalidad (se podría perdonar)

Varianzas iguales (o desiguales

haciendo Corrección de Welch).

Tests estadísticos habituales

Comparación de 2 medianas con datos independientes

por el test no paramétrico U de Mann-Whitney

No necesaria normalidad ni

varianzas iguales16, 11,14, 21, 18, 34, 22, 7,12,12 12, 14, 11, 30,10, 13

X (tamaño m) Y (tamaño n)

H0 = Las medianas son iguales ; H1= una muestra domina a la otra en distribución

1) Se ordenan conjuntamente todos los valores (x e y) de menor a mayor.

2) Se asigna un nº de orden a cada uno (rango).

3) Se suman los rangos de la muestra x:

4) Se calcula el estadístico U:

5) d i f e r e n c i ah a y n oU cUS i 0 . 0 5 ) ,n,( n 21

d i f e r e n c i ah a y s i U cUS i 0 . 0 5 ) ,n,( n 21 (p<0.05)U

Requisitos ninguno

(Estadístico U)

Tests estadísticos habituales

Ejemplo de: Comparación de 2 medianas con datos

independientes por el test U de Mann-Whitney

Tests estadísticos habituales

Td sigue una distribución t

con n-1 grados de libertad

Td

Comparación de 2 medias con datos

apareados por test t-Student

Normalidad

misma varianza17.1, 16.8, 17.3, 15.1,...........16.7 13.1, 14.3, 13.2, 14.1,...........13.7

x y

estadístico

Requisitos

d i f e r e n c i ah a y n otTS i 0 . 0 5 ),(cd

d i f e r e n c i ah a y s i tTS i 0 . 0 5 ) ,(cd

(p<0.05)1 n

Tests estadísticos habituales

Ejemplo de comparación de 2 medias con

datos apareados por test t-Student

TdTd

)Td)

Tests estadísticos habituales

Test no paramétrico de Wilcoxon de rangos con signo

de datos apareados, para probar si la mediana de las

diferencias es cero.

•Se calcula la diferencia para cada pareja de datos

con sus signos respectivos.

•Se ordenan las diferencias de menor a mayor

(rangos) sin tener en cuenta el signo.

•Se suman todos los rangos con signo negativo (suma1)

y lo mismo con los rangos positivos (suma2)

•La suma más pequeña de las dos es el estadístico W.

•El estadistico W sigue una distribución determinada

“W”, a partir de la cual se calcula el p-valor.

Tests estadísticos habituales

Ejemplo de comparación de 2 medias con datos

apareados por test de Wilcoxon de rangos con signo

Tests estadísticos habituales

Test de Kolmogorov-Smirnov para 2 muestras

Se trata de probar si 2 muestras son comparables o una tiende a ser más

pequeña o más grande que la otra.

Tests estadísticos habituales

Test F para igualdad de 2 varianzas con datos independientes ? (equivalente a test de Bartlett con 2 varianzas y mismo nº datos por muestra)

211

210

ss

ss

:

:

H

H

2

2

2

1

2

2

2

1

ssmín

ssmáxF

,

,exp

iguales varianzasldgglnFFSi c ).,,(exp 050

2

2

2

1 ssmáxden(gln

numerador libertad Grados

,

2

2

2

1 ssmínden(gld

rdenominado libertad Grados

,

distintas varianzasldgglnFFSi c ).,,(exp 050

Tests estadísticos habituales

Ejemplo de test F para igualdad de 2

varianzas con datos independientes

• Un laborator io desea comparar la prec is ión de 2 ba lanzas.

• Real iza 20 pesadas de una c ier ta masa con la ba lanza 1 y

ot ras 15 pesadas con una balanza 2.

• La balanza 1 t iene una desviac ión estándar de 0.009 mg y

la 2 de 0.013 mg.

Comprobar s i ex is te una d i ferencia de prec is ión entre las 2

ba lanzas (d i ferentes var ianzas) .

No hay diferencia

significativa entre las 2

varinzas

Basado en Domenech 1982, Bioestadística, Ed. Herder, pag. 378.

Tests estadísticos habituales

•ANOVA de una vía para comparación de n medias en grupos

independientes (Paramétrico).

•Test de Kruskal-Wallis para comparación de n medias en

grupos independientes (No paramétrico).

•ANOVA de 1 vía con medidas repetidas para comparación de n medias

en grupos apareados (Paramétrico).

•Test de Friedman (ANOVA una vía) para comparación de n medias en

grupos apareados (No paramétrico).

• Test de Barlett o Levene para comparación de n varianzas

¿Qué tests se pueden hacer con n muestras?:

15.2, 16.3, 17.2, 16.1,...........15.7

14.1, 13.3, 14.2, 13.1,...........12.7

11.1, 12.3, 17.2, 16.1,...........19.7

Eligiendo el Test estadístico (cont.)

Tests estadísticos habituales

Comparando “n” medias (ANOVA de 1 factor)

Dieta [colesterol total]

Carbohidratos 115, 130, 20,………..

Grasas 180, 194, 199,……….

Proteinas 125, 136, 134, ………

H0= Las 3 medias son iguales

H1= Al menos 2 medias son distintas

Planteamiento

Razonamiento

H0=Las 3 dietas producen el mismo colesterol,

los datos proceden una misma población con s2

Si H0 fuese verdad, entonces la varianza sb2

estimada a partir de las medias (between

(entre) las dietas) habría de ser

aproximadamente igual a la varianza sw2

estimada a partir de cada una de las dietas

(withing (dentro) de las dietas), ya que

ambas estiman la misma s2 de la población

Luego el cociente entre sb2 y sw

2 debería ser

aproximadamente 1:

12

2

w

b

s

sF

Dieta 1

3Y

2

1s

1Y 2

2s

2

3s

2

xs

Dieta 2

Dieta 3

mezclados

2Y

1Y

2Y3Y

n

n

n

N=3n

Ojo: los datos tienen que

seguir distribución

normal y con la misma

varianza entre grupos

b (between (entre))

w (withing (dentro))

Tests estadísticos habituales

Cálculos y tabla final de un ANOVA de 1 factor

(con J grupos o niveles del factor) (1/3)

El modelo ANOVA de 1 factor se establece con el llamado “modelo lineal general”:

e r r o r c o n t r o l a d oF a c t o r eD e p e n d i e n tV a r i a b l e

i j

F a c t o r

ji j eY mf a c t o r d e l n i v e l e s J l o s d e g l o b a lm e d i a e s m

f a c t o r d e l J n i v e l a l a t r i b u i b l e e f e c t o e l e s j

n i v e l ) s ud em e d i a m e n o s s u j e t oe n n( p u n t u a c i ó Ye ji ji j m

Si sustituimos lo parámetros anteriores por sus estimadores muestrales:

)()( ji jji j YYYYYY )()( ji jji j YYYYYY

Considerando todas las muestras con sumatorios y haciendo el cuadrado:

22 i j

ji jj

i j

i j YYYYY( Y )()()

Tests estadísticos habituales

Cálculos y tabla final de un ANOVA de 1 factor

(con J grupos o niveles del factor) (2/3)

22 i j

ji jj

i j

i j YYYYY( Y )()()

)()(2)()()(Y 22

i j

2ji j

i j

j

i j i j

ji jji j YYYYYYYYY

Es cero

Luego: i j i j

jijjij YYYYY 22

i j

2 )()()(Y

Total SSQ = SSQ (b) (entre grupos) + SSQ (w) (dentro grupos)

Cuadrados

medios (MSQ) :Jn

YY

wM S QJ

YY

bM S Qi j

ji j

i j

j

22

1

)(

)(

)(

)(

Haciendo el cuadrado de la suma:

Tests estadísticos habituales

Cálculos y tabla final de un ANOVA de 1 factor

(con J grupos o niveles del factor) (3/3)

Cuadrados

medios (MSQ):

Jn

YY

wMSQJ

YY

bMSQi j

ji j

i j

j

22 )(

)(1

)(

)(

.)(" j" nivel cada de medias las departir a

lpoblaciona varianzala deestimador un es )(

2

bs

bMSQ

.)( j nivel cada de varianzaslas de media la haciendo

lpoblaciona varianzala deestimador un es )(

2

ws

wMSQ

Se construye ahora el estadístico F como:

)(

)(

wM S Q

bM S QF

Si H0 es cierta F se aproximará a 1 y si H0 es falsa F >1

El estadístico F se distribuye según la distribución F de Snedecor

con grados de libertad (J-1 , N-J), obteniéndose el p-valor

Tests estadísticos habituales

Dieta [colesterol total]

Carbohidratos 115, 130, 20,………..

Grasas 180, 194, 199,……….

Proteinas 125, 136, 134, ………

H0= Las 3 medias son iguales

H1= Al menos 2 medias son distintas

Fuente de variación SSQ NDOF MSQ F p

Entre Grupos 3.898E+04 2 1.949E+04 1.278E+02 0.0000

Dentro grupos 3.203E+03 21 1.525E+02

Total 4.219E+04 23

Ejemplo de ANOVA de 1 factor (1/2)

Luego rechazamos H0 con riesgo p=0.0000 de equivocarnos (las 3

medias no son iguales, hay diferencia significativa entre ellas).

025251

049491

E

EF

.

.

Tests estadísticos habituales

Ejemplo: ANOVA de 1 factor (2/2)

Representar medias

Tests estadísticos habituales

Ejemplo: test de Tukey en ANOVA de 1 factor

Test de Tukey para comparaciones 2 a 2 a posteriori

Test Q de Tukey para 3 medias y 3 comparaciones

Columnas Q p 5% 1%

2 1 2.015E+01 0.0001 * *

2 3 1.895E+01 0.0001 * *

3 1 1.202E+00 0.6768 NS NS

Hay diferencias significativas (p<0.01) entre las medias

2 y 1 y 2 y 3, pero no entre las medias 3 y 1.

Tests estadísticos habituales

Dieta colesterol

Carbohidratos 115, 130, 20,………..

Grasas 180, 194, 199,……….

Proteinas 125, 136, 134, ………

H0= Las 3 medias son iguales

H1= Al menos 2 medias son distintas

Ejemplo de ANOVA no paramétrico de 1 factor por

Kruskal-Wallis (datos independientes)

KW

•Asignar rangos a los datos como

serie única.

•Sumar los rangos de cada muestra

y calcular el estadístico KW:

131

12

1

2

2

nkkRnkkn

KWk

j

j)(

Tests estadísticos habituales

H0= Las 3 medias son iguales

H1= Al menos 2 medias son diferentes

Ejemplo de ANOVA paramétrico de 1 factor

con medidas repetidas (datos apareados)

• Las columnas deben seguir normalidad y tener la misma varianza.

• Pero hay un requerimiento nuevo: homogeneidad de covarianzas,

que se comprueba con el test de esfericidad de Mauchly (existen

correcciones conservadoras a este test debidas a Geisser-Green-

House, Huynh-Feldt y Lower–bound que reducen los grados de

libertad del numerador y denominador del test F del ANOVA)

Tests estadísticos habituales

Requisito Previo:Test de homogeneidad de covarianzas

H0= Las 3 medias son iguales

H1= Al menos 2 medias son diferentes

Ejemplo de ANOVA paramétrico de 1 factor

con medidas repetidas (datos apareados)

Existe homogeneidad

de covarianzas

ANOVA de medidas repetidas

Con homogeneidad

P < 0.05

Tests estadísticos habituales

H0= Las 3 medianas son iguales

H1= Al menos 2 medianas son distintas

Test de Friedman no paramétrico para

medidas repetidas (datos apareados)

• Se asumen k filas y columnas y las puntuaciones de cada columna se

ordenan por rangos rij para la fila i y la columna j.

• Luego se hace la suma de los rangos como:

l

j i ji rt1

• Se calcula el estadistico de Friedman:

• Finalmente se calcula el p-valor en

base a la distribución: 2

1k

l

Estadístico de Friedman

Tests estadísticos habituales Ing. Felipe Llaugel

Comparando medias con más de un factor

(ANOVA de 2 factores o de 2 vías o ANOVA factorial)

Imaginemos un tratamiento para disminuir el colesterol, donde la variable

respuesta que se mide es la concentración de colesterol total en plasma, pero

ahora se quieren estudiar 2 factores: “Dieta” con 2 niveles(carbohidratos,

grasas) y “Ejercicio” con 2 niveles (poco, mucho).

Factor “dieta”

Carbohidratos

Carbohidratos

Carbohidratos

Carbohidratos

Grasas

Grasas

Grasas

Grasas

Factor “ejercicio”

220

190

154

167

188

181

124

154

[Colesterol]

Poco

Poco

Mucho

Mucho

Poco

Poco

Mucho

Mucho

Paciente

1

2

3

4

5

6

7

8

Datos ficticios con fines de ejemplo……etc

Tests estadísticos habituales Ing. Felipe Llaugel

Comparando medias con más de un factor

(ANOVA de 2 factores o ANOVA factorial)

Dieta x ejercicio

EjercicioDieta

En SIMFIT es: Factorial: 0 blocks, 2 factors

Tests estadísticos habituales

Tests de Bartlett para igualdad de n varianzas: (equivalente a test F en el caso de 2 varianzas y mismo nº de datos por muestra)

(Datos siguen una distribución Normal)

(Datos no siguen distribución Normal)

Si las series de datos no siguen

una distribución normal

usualmente se aplica el test de

Levene basado en la mediana

Tests estadísticos habituales

Test de Barlett de igualdad de n varianzas

de muestras con distribución normal

Si hay k grupos, de tamaño de muestra ni , con i= ni−1, y varianza s2i ,

entonces la varianza combinada (pooled) s2p y los parámetros B and C

se calculan así:

El estadísitico de Bartlett :

BC = B/C

sigue una distribución ji-cuadrado

con k−1 grados de libertad, a partir

de la cual se calcula el p-valor.

Tests estadísticos habituales

Ejemplo del test de igualdad de n varianzas

por test de Bartlett

28.2 39.6 46.3 41.0 56.3

33.2 40.8 42.1 44.1 54.1

36.4 37.9 43.5 46.4 59.4

34.6 37.1 48.8 40.2 62.7

29.1 43.6 43.7 38.6 60.0

31.0 42.4 40.1 36.3 57.3

Imaginemos las siguientes 5 series de datos con distribución normal:

Homogeneity of variance test by Bartlett test

Transformation = x (untransformed data)

B = 6.90064E-01

C = 1.08000E+00

B/C = 6.38948E-01

NDOF = 4

P(chi-square >= B/C) = 0.9586

Upper tail 1% point = 1.32767E+01

Upper tail 5% point = 9.48773E+00

P-valor > 0.05, luego

las 5 varianzas son

iguales (se acepta la

hipótesis nula).