curso de bioestadística parte 17 métodos no paramétricos dr. en c. nicolás padilla raygoza...

26
Curso de Bioestadística Parte 17 Métodos no paramétricos Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de la Salud e Ingenierías Campus Celaya-Salvatierra Universidad de Guanajuato México

Upload: ramona-aragon

Post on 01-Jan-2015

10 views

Category:

Documents


4 download

TRANSCRIPT

Page 1: Curso de Bioestadística Parte 17 Métodos no paramétricos Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de

Curso de BioestadísticaParte 17

Métodos no paramétricos

Dr. en C. Nicolás Padilla RaygozaDepartamento de Enfermería y ObstetriciaDivisión Ciencias de la Salud e Ingenierías

Campus Celaya-SalvatierraUniversidad de Guanajuato México

Page 2: Curso de Bioestadística Parte 17 Métodos no paramétricos Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de

Presentación

Médico Cirujano por la Universidad Autónoma de Guadalajara. Pediatra por el Consejo Mexicano de Certificación en Pediatría. Diplomado en Epidemiología, Escuela de Higiene y Medicina

Tropical de Londres, Universidad de Londres. Master en Ciencias con enfoque en Epidemiología, Atlantic

International University. Doctorado en Ciencias con enfoque en Epidemiología, Atlantic

International University. Profesor Asociado C, Departamento de Enfermería y

Obstetricia, División Ciencias de la Salud e Ingenierías, Campus Celaya Salvatierra, Universidad de Guanajuato.

[email protected]

Page 3: Curso de Bioestadística Parte 17 Métodos no paramétricos Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de

Competencias

Aplicará pruebas no paramétricas para análisis de datos

Obtendrá intervalo de confianza para análisis no paramétrico

Aplicará prueba de rangos señalados de Wilcoxon

Aplicará prueba de suma de rangos de Wilcoxon

Alicará r de Spearman.

Page 4: Curso de Bioestadística Parte 17 Métodos no paramétricos Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de

Introducción

Métodos paramétricos Se basan en medias, desviaciones estándar o

probabilidades. La distribución Normal no es siempre

apropiada Para estudiar variables con pocas

observaciones, Distribuciones asimétricas, o Variables que pueden tomar más de dos

valores

Page 5: Curso de Bioestadística Parte 17 Métodos no paramétricos Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de

Introducción (contd…)

Cuando sucede lo anterior, usamos otros métodos de análisis

Métodos no paramétricos No se basan en las mismas suposiciones que

los medios paramétricos, pero también tienen algunas suposiciones.

Page 6: Curso de Bioestadística Parte 17 Métodos no paramétricos Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de

Categorías (ranking), medias, mediana

Algunos métodos no paramétricos usan los rankings en lugar de los valores reales.

Las categorías se usan para comparar los datos, más por el ranking que por su tamaño.

Paciente Glucosa en sangre (mg/dl)

1 135

2 225

3 70

4 100

5 110

6 150

7 90

8 100

9 170

10 60

11 80

Page 7: Curso de Bioestadística Parte 17 Métodos no paramétricos Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de

Categorías (ranking), medias, mediana

Rankeamos en orden ascendente

Paciente Glucosa en sangre (mg/dl)

Ranking

10 60 1

3 70 2

11 80 3

7 90 4

4 100 5

8 100 6

5 110 7

1 135 8

6 150 9

9 170 10

2 225 11

Page 8: Curso de Bioestadística Parte 17 Métodos no paramétricos Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de

¿Son la media y la mediana, iguales?

Para usar la media y que el intervalo de confianza sea adecuado, la distribución de los valores debe ser simétrica.

En cambio, para que la mediana y su intervalo de confianza sean adecuados, no se requiere suposiciones.

Page 9: Curso de Bioestadística Parte 17 Métodos no paramétricos Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de

¿Son la media y la mediana, iguales?

Usando el orden (ranking) en lugar de los valores originales, disminuye la necesidad de suposiciones acerca de la distribución, se hacen los cálculos más simples y rápidos.

La desventaja es que los valores originales se pierden.

Por esto, los métodos no paramétricos se usan sólo para probar hipótesis, no para estimación de efectos.

Page 10: Curso de Bioestadística Parte 17 Métodos no paramétricos Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de

Métodos no paramétricos

Situación Método no paramétrico

Método paramérico

Muestra única Prueba de rangos señalados de Wilcoxon

Prueba de Z (prueba de t)

Dos muestras independientes

Suma de rangos señalados de Wilcoxon

Prueba de Z para dos muestras independientes (Prueba t)

Dos muestras pareadas

Prueba de rangos señalados de Wilxocon

Prueba de Z pareada (Prueba t pareada)

Muestra única, dos variables

Coeficiente de correlación de Spearman

Coeficiente de correlación de Pearson

Page 11: Curso de Bioestadística Parte 17 Métodos no paramétricos Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de

Datos de una muestra

Se muestran los datos de los 11 pacientes con niveles de glucosa.

Queremos saber si el promedio es de 100 mg/dl.Paciente Glucosa en sangre

(mg/dl)Ranking

10 60 1

3 70 2

11 80 3

7 90 4

4 100 5

8 100 6

5 110 7

1 135 8

6 150 9

9 170 10

2 225 11

Page 12: Curso de Bioestadística Parte 17 Métodos no paramétricos Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de

Datos de una muestra

La prueba no paramétrica alternativa es la prueba de rangos señalados de Wilcoxon.

Puede ser usada para evaluar si los valores de la muestra están centrados en 100 mg/dl.

Esta prueba no requiere Normalidad de la distribución de los datos, pero requiere que la distribución sea simétrica, aunque no es necesario que tome la forma de “campana” como la Normal.

Page 13: Curso de Bioestadística Parte 17 Métodos no paramétricos Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de

Datos de una muestra

La prueba de rangos señalados de Wilcoxon es calculada por los siguientes seis pasos:

1. Calcule la diferencia entre cada observación y el valor de interés, 100 mg/dl.

2. Excluya cualquier diferencia = 0.3. Clasifique y ordene (ranking) las diferencias por

magnitud, ignorando el signo.4. Sume las categorías con diferencias positivas.5. Sume las categorías de las diferencias negativas.6. Seleccione el más pequeño de las dos sumas y

llámelo T.

Page 14: Curso de Bioestadística Parte 17 Métodos no paramétricos Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de

Datos de una muestra

Paciente Glucosa en sangre (mg/dl)

Diferencias con 100 mg/dl

Rnking

10 60 -40 6

3 70 -30 4

11 80 -20 3

7 90 -10 2

4 100 0

8 100 0

5 110 10 1

1 135 35 5

6 150 50 7

9 170 70 8

2 225 125 9

Page 15: Curso de Bioestadística Parte 17 Métodos no paramétricos Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de

Dos grupos independientes

30 adolescentes con apendicitis aguda, fueron distribuidos 15 para ser sometidos a apendicetomía tradicional y 15 para apendicetomía por laparoscopía.

En ambos casos se valoró el dolor postoperatorio.

Dolor postoperatorio Tradicional Laparoscopía

Ninguno 1 3

Leve 5 7

Moderado 5 4

Severo 4 1

Total 15 15

Page 16: Curso de Bioestadística Parte 17 Métodos no paramétricos Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de

Dos grupos independientes

Para comparar el dolor postoperatorio en los dos grupos, podemos usar la prueba de suma de rangos de Wilcoxon.

Definimos la hipótesis nula Ho: las dos distribuciones se sobreponen.

Definimos la hipótesis alternativa Hi: las dos distribuciones no se sobreponen.

Page 17: Curso de Bioestadística Parte 17 Métodos no paramétricos Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de

Dos grupos independientes

La prueba de suma de rangos de Wilcoxon consta de tres pasos: Ordenar los valores de ambos grupos en

orden ascendente. Calcular T como la suma de los rankings de la

muestra más pequeña o de uno de los grupos, si son iguales.

Compara el valor de T en la tabla de valores críticos de la suma de rangos de Wilcoxon.

Page 18: Curso de Bioestadística Parte 17 Métodos no paramétricos Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de

Dos grupos independientes

Dolor postoperatorio Tradicional Laparoscopía

Rankings

Ninguno 1 1+

Ninguno 3 4

Leve 5 9+

Leve 7 16

Moderado 5 21+

Moderado 4 25

Severo 4 29+

Severo 1 30

Total 15 15

Page 19: Curso de Bioestadística Parte 17 Métodos no paramétricos Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de

Dos grupos pareados La tabla muestra las horas de mejoría que proporcionan dos

analgésicos en 12 pacientes con artritis reumatoide. Para probar que la mejoría es la misma con los dos analgésicos

podemos usar la t pareada o la prueba de rangos señalados de Wilcoxon.

En ambos se calcula la diferencia en horas de mejoría para cada paciente. Paciente Analgésico A Analgésico B

1 3.5 3.5

2 3.6 5.7

3 2.6 2.9

4 2.6 2.4

5 7.3 9.9

6 3.4 3.3

7 14.9 16.7

8 6.6 6.0

9 2.3 3.8

10 2.0 4.0

11 6.8 9.1

12 8.5 26.9

Page 20: Curso de Bioestadística Parte 17 Métodos no paramétricos Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de

Dos grupos pareados

Con la prueba de rangos señalados de Wilcoxon, no se requiere Normalidad, sino que estén los datos simétricos a ambos lados de la mediana.

Ho: diferencia de medianas = 0 Hi= diferencia de medianas ≠ 0Paciente Analgésico A Analgésico B Diferencia Rankings

1 3.5 3.5 0

2 3.6 5.7 -2.1 8

3 2.6 2.9 -0.3 3

4 2.6 2.4 0.2 2

5 7.3 9.9 -2.6 10

6 3.4 3.3 0.1 1

7 14.9 16.7 -1.8 6

8 6.6 6.0 0.6 5

9 2.3 3.8 -1.5 4

10 2.0 4.0 -2.0 5

11 6.8 9.1 -2.3 7

12 8.5 26.9 -18.4 11

Page 21: Curso de Bioestadística Parte 17 Métodos no paramétricos Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de

Dos grupos pareados

Calculamos la prueba de rangos señalados de Wilcoxon para las diferencias haciendo lo siguiente:

1.- Cuente cuantas diferencias no 0 hay.2.- Ordene las diferencias por su magnitud, ignorando el signo.3.- Sume los rankings de todas las diferencias positivas.4.- Sume los rankings de todas las diferencias negativas.5.- Seleccione la más pequeña de las dos sumas y llámela T.

(Suma de diferencias – 59, suma de diferencias + 8, T = 8)6.- Compare el valor de T con las tablas de valores críticos para la

prueba de rangos señalados de Wilcoxon. T = 8, 0.01<p<0.02.

Page 22: Curso de Bioestadística Parte 17 Métodos no paramétricos Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de

Correlación de rangos de Spearman

La tabla y gráfica muestran la incidencia de cáncer de colon y el promedio de consumo de carne per cápita en 13 países.

País Incidencia Ca Colon Promedio de consumo de carne

1 10 1

2 8 9

3 11 5

4 12 5

5 22 33

6 67 37

7 73 32

8 48 8

9 37 41

10 31 12

11 21 29

12 17 3

13 3 1

0

10

20

30

40

50

60

70

80

0 10 20 30 40 50

Consumo de carne

Inci

denc

ia d

e C

a de

Col

on x

10

0,00

0

Page 23: Curso de Bioestadística Parte 17 Métodos no paramétricos Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de

Correlación de rangos de Spearman

Es apropiada para relaciones monotónicas, no lineales.

Se usa la misma forma de cálculo que la r de Pearson, sólo usando los rankings.

Se calcula en tres pasos: Los valores de la primera variable son ordenados, Los valores de la segunda variable son ordenados, Se aplica la fórmula de r de Pearson, usando los

rankings en lugar de los valores originales.

Page 24: Curso de Bioestadística Parte 17 Métodos no paramétricos Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de

Correlación de rangos de Spearman

País Incidencia Ca Colon

Promedio de consumo de carne

Ranking de Cáncer

Ranking de consumo de carne

1 10 1 3 1

2 8 9 2 7

3 11 5 4 5

4 12 5 5 4

5 22 33 8 11

6 67 37 12 12

7 73 32 13 10

8 48 8 11 6

9 37 41 10 13

10 31 12 9 8

11 21 29 7 9

12 17 3 6 3

13 3 1 1 2

Page 25: Curso de Bioestadística Parte 17 Métodos no paramétricos Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de

Comparación de métodos

Ejemplo Método paramétrico Método no paramétrico

Glucosa en sangre

Prueba de t para una muestra p>0.1

Prueba de rangos señalados de Wilcoxon, p>0.05

Intensidad del dolor postquirúrgico

t para una muestra pareada p<0.05

Prueba de suma de rangos de Wilxocon, p>0.05

Mejoría del dolor Prueba t pareada p>0.05

Prueba de rangos señalados de Wilcoxon, p<0.05

Correlación entre cáncer de colon y consumo de carne

R de Pearson, r= 0.65 R de Spearman, r=0.74

Page 26: Curso de Bioestadística Parte 17 Métodos no paramétricos Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de

Bibliografía

1.- Last JM. A dictionary of epidemiology. New York, 4ª ed. Oxford University Press, 2001:173.

2.- Kirkwood BR. Essentials of medical ststistics. Oxford, Blackwell Science, 1988: 1-4.

3.- Altman DG. Practical statistics for medical research. Boca Ratón, Chapman & Hall/ CRC; 1991: 1-9.