curso de bioestadística parte 8 inferencias acerca de una media dr. en c. nicolás padilla raygoza...

24
Curso de Bioestadística Parte 8 Inferencias acerca de una media Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de la Salud e Ingenierías Campus Celaya Salvatierra Universidad de Guanajuato México

Upload: milagros-santoyo

Post on 01-Jan-2015

22 views

Category:

Documents


5 download

TRANSCRIPT

Page 1: Curso de Bioestadística Parte 8 Inferencias acerca de una media Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias

Curso de BioestadísticaParte 8

Inferencias acerca de una media

Dr. en C. Nicolás Padilla RaygozaDepartamento de Enfermería y ObstetriciaDivisión Ciencias de la Salud e Ingenierías

Campus Celaya SalvatierraUniversidad de Guanajuato México

Page 2: Curso de Bioestadística Parte 8 Inferencias acerca de una media Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias

Presentación

Médico Cirujano por la Universidad Autónoma de Guadalajara. Pediatra por el Consejo Mexicano de Certificación en Pediatría. Diplomado en Epidemiología, Escuela de Higiene y Medicina

Tropical de Londres, Universidad de Londres. Master en Ciencias con enfoque en Epidemiología, Atlantic

International University. Doctorado en Ciencias con enfoque en Epidemiología, Atlantic

International University. Profesor Asociado B, Departamento de Enfermería y

Obstetricia, División Ciencias de la Salud e Ingenierías, Campus Celaya Salvatierra, Universidad de Guanajuato.

[email protected]

Page 3: Curso de Bioestadística Parte 8 Inferencias acerca de una media Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias

Competencias

Aplicará prueba de Z para obtener inferencias de una media.

Obtendrá intervalo de confianza para una media.

Aplicará prueba de t para una media en una muestra pequeña.

Obtendrá el intervalo de confianza para una media en una muestra pequeña.

Page 4: Curso de Bioestadística Parte 8 Inferencias acerca de una media Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias

Introducción

Si medimos la estatura de estudiantes de la FEOC, podemos obtener su media y desviación estándar: Número de estudiantes: 269 Media de estatura: 161.6 cm Desviación estándar: 6.3 cm Mediana: 159 cm Rango: 149 a 185 cm.

Page 5: Curso de Bioestadística Parte 8 Inferencias acerca de una media Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias

Notación

Para parámetros de la población usamos letras griegas, para parámetros de la muestra, usamos letras latinas.

Parámetro Población Muestra

Media μ _

X

Desviación estándar

σ s

Page 6: Curso de Bioestadística Parte 8 Inferencias acerca de una media Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias

Distribución de muestreo

Si tomamos muchas muestras del mismo tamaño de la misma población, cada muestra puede tener media y desviación estándar diferentes.

Si graficamos esas medias de las muestras podemos obtener una distribución de muestreo.

Sabiendo que el tamaño de muestra es grande, la distribución de las medias de las muestras es aproximadamente Normal, aunque la distribución de los datos en la población no sea Normal.

Page 7: Curso de Bioestadística Parte 8 Inferencias acerca de una media Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias

Distribución de muestreoEstatura en cm. n % % acumulado

149 2 0.7 0.7

150 3 1.1 1.8

152 6 2.2 4.0

154 12 4.5 8.5

155 27 10.0 18.5

157 29 10.8 29.3

158 26 9.7 39.0

159 33 12.3 51.3

163 37 13.8 65.1

164 16 5.9 71.0

165 24 8.9 79.9

168 18 6.7 86.6

169 14 5.2 91.8

171 6 2.2 94.0

174 7 2.6 96.6

175 1 0.4 97.0

177 4 1.5 98.5

179 2 0.7 99.2

184 1 0.4 99.6

185 1 0.4 100.0

Total 269 100.0

Datos de estudiantes de la FEOC. Si tomamos otras 999 muestras de estudiantes podemos graficar la distribución de sus medias.

Distribución de muestreo 1000 muestras; n=269

050

100150200250300

158 157 158 159 160 161 162

Medias de estatura en cm

Frec

enci

a

Page 8: Curso de Bioestadística Parte 8 Inferencias acerca de una media Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias

Intervalos de confianza al 95%

Usa la teoría de la probabilidad para extraer conclusiones acerca de una población, a partir de los datos obtenidos en una muestra.

Es muy difícil estudiar a toda la población, por lo que estudiamos muestras.

Métodos para hacer estimaciones y probar hipótesis son fundamentales para obtener inferencias.

Page 9: Curso de Bioestadística Parte 8 Inferencias acerca de una media Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias

Intervalos de confianza al 95% (cont…) Entonces los intervalos de confianza para una media

se calculan así: _ X ± 1.96 (ES) _ X es el estimado obtenido de la muestra 1.96 es el múltiplo de errores estándar para 95% ES es el error estándar

Deberíamos esperar que el intervalo de confianza al 95% alrededor de la media de la muestra incluya la media de la población en el 95% de las veces, si tomamos miles de muestras.

Page 10: Curso de Bioestadística Parte 8 Inferencias acerca de una media Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias

Intervalos de confianza al 95% (cont…) Calculemos el intervalo de confianza al 95%

para la primera muestra de 269 estudiantes de la FEOC:

_X = 161.6

ES= 6.3/√269= 0.38

IC95%= 161.6 ± 1.96 (0.38) = 161.6 ± 0.74 =

160.86 a 162.34

Page 11: Curso de Bioestadística Parte 8 Inferencias acerca de una media Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias

Intervalos de confianza al 95% (cont…) Podemos usar intervalos de confianza a otro

porcentaje de confianza, sólo debemos cambiar el múltiplo del error estándar: Por ejemplo, al 90% cambia a 1.69. Para el 95.4% cambia a 2. Para el 99% cambia a 3.

Page 12: Curso de Bioestadística Parte 8 Inferencias acerca de una media Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias

Prueba de hipótesis para una media La prueba de hipótesis es comprobar si nuestra estimación

concuerda con una valor específico. Nuestra muestra de 269 estudiantes fue de 161.6 con

desviación estándar de 6.3 y error estándar de 0.38. En un estudio similar en los estudiantes de la Facultad de

Contabilidad y Administración, obtuvieron una media de estatura de 167 cm.

¿Cómo podemos demostrar si la estatura de los estudiantes de la FEOC es igual o diferente de los estudiantes de la FCA? Media de FEOC 161.6 Media de FCA 167 Podemos ver, obviamente que no son iguales.

Pero no sabemos si la diferencia observada es real o es debido a error de muestreo, ya que 161.6 es una estimación de muchas que pudimos haber obtenido.

Page 13: Curso de Bioestadística Parte 8 Inferencias acerca de una media Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias

Prueba de hipótesis para una media

Para evaluar si la diferencia observada es real, se hace lo siguiente: Hipótesis nula señala que las medias de ambas

poblaciones es la misma (la primera población es la población de estudiantes de la FEOC y la población de referencia es la de estudiantes de Contabilidad).

La hipótesis nula se escribe Ho. Si la media de la hipótesis es μo y la media en estudio

es μ, entonces la hipótesis nula se escribe como HO : μ = μo

Hipótesis alternativa La hipótesis alternativa es que las medias de las dos

poblaciones no son iguales. Usualmente se escribe como H1: μ≠μ0

Page 14: Curso de Bioestadística Parte 8 Inferencias acerca de una media Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias

Prueba de hipótesis para una media

Ya que se ha señalado la hipótesis nula, calculamos la probabilidad de obtener los datos observados si la hipótesis nula es verdad.

Para obtener esta probabilidad, calculamos una prueba estadística y la comparamos a la distribución implicada por la hipótesis nula.

En muchos casos será la distribución Normal.

Page 15: Curso de Bioestadística Parte 8 Inferencias acerca de una media Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias

Prueba de hipótesis para una media

La forma general de la prueba estadística compara los valores observados estimados de la muestra y el valor esperado si la hipótesis nula fuera verdad.

También toma en cuenta la variabilidad en la población usando el error estándar.

Esta prueba estadística se llama Z y es igual a: _ X – μo Z= ------------ ES

_

Entonces, la prueba es una diferencia estandarizada entre X y μo.

Page 16: Curso de Bioestadística Parte 8 Inferencias acerca de una media Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias

Ejemplo

La muestra de estudiantes de la FEOCMedia = 161.6S = 6.3IC 95% = 160.6 a 162.60

La hipótesis nula es que no hay diferencia entre las medias de estatura de estudiantes de la FEOC y FCA

Ho: μ = 167cmNecesitamos usar la prueba de z: _ X – μo 161.6 -167z = ----------- = ---------------- = - 14.21 ES(X) 0.38

Page 17: Curso de Bioestadística Parte 8 Inferencias acerca de una media Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias

Muestras pequeñas

Si el tamaño de muestra es pequeño, usamos la distribución t.

Su forma depende de los grados de libertad, que es una medida de qué tan pequeña es el tamaño de muestra.

Los grados de libertad de una distribución t es igual al tamaño de muestra menos 1.

Page 18: Curso de Bioestadística Parte 8 Inferencias acerca de una media Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias

Muestras pequeñas

Entre menos grados de libertad, menos probabilidad de estar alrededor de la muestra y altas probabilidad de estar en las colas.

Las distribuciones t con los más pequeños grados de libertad tienen las más pequeñas probabilidades a los lados de la media y mayores probabilidades en las colas.

Sin embargo, entre mayor el tamaño de muestra y por lo tanto, mayor grados de libertad, más parecida es la distribución t a la distribución Normal.

Hay tablas publicadas de valores seleccionados del área bajo la distribución t que usaremos cuando calculemos intervalos de confianza y pruebas de hipótesis.

Page 19: Curso de Bioestadística Parte 8 Inferencias acerca de una media Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias

Muestras pequeñas

Así, cuando el tamaño de muestra es pequeño, menos de 100, las fórmulas para el intervalo de confianza y la prueba de hipótesis, son:

95%IC Prueba de hipótesisEstimación ± multiplicador (error estándar) Para probar Ho: μ=μoEstimación es la media estimada Para probar H1: μ≠μoMultiplicador es el valor de t que _

corresponde a p=0.05 con grados de X – μ0

libertad igual al tamaño de muestra t = ---------menos 1 ES

Page 20: Curso de Bioestadística Parte 8 Inferencias acerca de una media Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias

Valores de p

¿Una o dos colas? Ahora sabemos que el valor de p es la probabilidad de

haber obtenido un resultado al menos tan extremo como el encontrado con nuestra muestra si la hipótesis nula fuera verdad.

Pero, ¿qué significa extremo? Cuando la hipótesis alternativa es H1: µ ≠ µo Luego resultados extremos pueden ocurrir por azar a

cada lado de la media de la hipótesis, µo. Debido a esto usamos las tablas para dos colas de las

distribuciones Normal y t.

Page 21: Curso de Bioestadística Parte 8 Inferencias acerca de una media Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias

Valores de p

Hay situaciones menos comunes donde la hipótesis alternativa es H1: µ < µo o H1: µ > µo

Entonces, valores extremos podrían ocurrir sólo a la izquierda o sólo a la derecha, de la media de la hipótesis.

¿Cuán pequeño es pequeño para el valor de p? Muchas personas usan el valor de p de 0.05 como punto de

corte. Es un valor arbitrario, pero muy sensible. Significa que estamos preparados para rechazar la hipótesis nula al menos una vez de 20 cuando es verdad.

Note que cuando el valor de una prueba tiene un valor de p menor a 0.05, el intervalo de confianza no incluye el valor de la hipótesis.

Page 22: Curso de Bioestadística Parte 8 Inferencias acerca de una media Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias

Valores de p

¿Si tenemos un valor de p de 0.048 podemos rechazar la hipótesis nula?

¿Si tenemos un valor de p de 0.052 no rechazamos la hipótesis nula?

Cuando los valores de p estén entre 0.07 y 0.03 deberán ir acompañados del valor real de p, ya que están en los bordes de ser significativos.

Page 23: Curso de Bioestadística Parte 8 Inferencias acerca de una media Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias

Presentación de resultados

Presente sus resultados acompañados de los intervalos de confianza

Clarifique cuál es sus hipótesis nula y alternativa De el valor de p de cada prueba, pero es suficiente

con decir p< 0.001 cuando sea el caso. No malinterprete los valores de p

Un valor pequeño de p da lugar a rechazar la hipótesis nula

Un valor de p grande da lugar sólo a no rechazar la hipótesis nula

Page 24: Curso de Bioestadística Parte 8 Inferencias acerca de una media Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias

Bibliografía

1.- Last JM. A dictionary of epidemiology. New York, 4ª ed. Oxford University Press, 2001:173.

2.- Kirkwood BR. Essentials of medical ststistics. Oxford, Blackwell Science, 1988: 1-4.

3.- Altman DG. Practical statistics for medical research. Boca Ratón, Chapman & Hall/ CRC; 1991: 1-9.