lección pública tema 5 · pdf fileel nivel de confianza y de error son fijados a...
TRANSCRIPT
LECCIÓN PÚBLICA
Tema 5 Algunas Pruebas de Hipótesis
Profa. María Fátima Dos Santos
1
Prueba t de Student (contraste de medias para muestras independientes)
ANOVA de una vía. Pruebas post hoc
Prueba Chi Cuadrado (fe-fo)
Fundamentos de estadística inferencial
Método hipotético deductivo (Juego de hipótesis)
Elementos en el contraste de hipótesis (H0-H1, zona de rechazo, etc)
TEMARIO
Lección Pública 2
Prueba t de Student (contraste de medias para muestras independientes)
ANOVA de una vía. Pruebas post hoc
Prueba Chi Cuadrado (fe-fo)
Fundamentos de estadística inferencial
Método hipotético deductivo (Juego de hipótesis)
Elementos en el contraste de hipótesis (H0-H1, zona de rechazo, etc)
TEMARIO
Lección Pública 3
Fundamentos de estadística inferencial Lección Pública 4
Tema 5: Pruebas de Hipótesis
Ventajas del estudio de muestras
La inferencia estadística se clasifica en: • Estimación (puntual y por intervalos) • Contraste de hipótesis
La inferencia es una parte de la estadística que permite estimar el comportamiento de la población a partir del estudio de una muestra.
Fundamentos de estadística inferencial Lección Pública 5
Tema 5: Pruebas de Hipótesis
Imaginemos una población compuesta por siete elementos (1, 2, 3, 4, 5, 6, 7), de los cuales seleccionaremos muestras de 3. Esto produce 35 muestras de 3 casos, en cada una de las cuales podríamos calcular la media.
123 124 125 …
467 567
2 2,33 2,66
… 5,66
6
Muestra X La representación gráfica de esta distribución de medias muestrales sigue la forma de una distribución binomial, que para un número suficientemente grande de muestras, y siguiendo el postulado de De Moevre, se comporta en forma análoga a una curva normal.
Características
Fundamentos de estadística inferencial Lección Pública 6
Tema 5: Pruebas de Hipótesis
Si sumamos y restamos un valor a la media de cada una de estas muestras, produciríamos un intervalo dentro del cual se supone que estará el valor poblacional buscado. No todos los intervalos contienen al parámetro.
De allí se derivan las nociones de confianza y error. Confianza: Proporción de intervalos que contienen al parámetro Error: Proporción de intervalos que no contienen al parámetro
Fundamentos de estadística inferencial Lección Pública 7
Tema 5: Pruebas de Hipótesis
El nivel de confianza y de error son fijados a priori y determinan la precisión del intervalo confidencial elaborado a partir de ellos. Por ejemplo, un intervalo alrededor de la media muestral:
El intervalo generado va de Li a Ls, con una confianza de 95%. Esperamos que nuestra muestra forme parte del 95% de intervalos que incluyen al parámetro, pero hay una probabilidad de 5% de que sea uno de los intervalos que no lo contienen.
Prueba t de Student (contraste de medias para muestras independientes)
ANOVA de una vía. Pruebas post hoc
Prueba Chi Cuadrado (fe-fo)
Fundamentos de estadística inferencial
Método hipotético deductivo (Juego de hipótesis)
Elementos en el contraste de hipótesis (H0-H1, zona de rechazo, etc)
TEMARIO
Lección Pública 8
Método hipotético deductivo 9 Lección Pública
Tema 5: Pruebas de Hipótesis
Cuando trabajamos con muestras es frecuente conseguir diferencias entre ellas (o entre ellas y la población). El procedimiento de contraste de hipótesis nos permite decir si es posible que estas mismas diferencias estén presentes en la población. Pasos en el contraste de hipótesis: Plantear hipótesis nula y alternativa con base en las hipótesis específicas de la investigación Seleccionar el nivel de error (significancia) Establecer el estadístico de prueba Formular la regla de decisión Medir la muestra y aplicar el contraste En base a los resultados, rechazar H0 o no rechazar H0
H0
Prueba t de Student (contraste de medias para muestras independientes)
ANOVA de una vía. Pruebas post hoc
Prueba Chi Cuadrado (fe-fo)
Fundamentos de estadística inferencial
Método hipotético deductivo (Juego de hipótesis)
Elementos en el contraste de hipótesis (H0-H1, zona de rechazo, etc)
TEMARIO
Lección Pública 10
Elementos en el contraste de hipótesis 11 11 Lección Pública
Tema 5: Pruebas de Hipótesis
Sea cual sea la curva de referencia (normal, t de Student, Chi Cuadrado, F de Snedecor, etc), al hacer contraste de hipótesis, el área total bajo la curva (probabilidad total) se verá repartida en dos áreas: Zona de aceptación de H0
Zona de rechazo de H0
La decisión que tomemos es probabilística, así que es posible que no corresponda con la realidad. Existe cierto riesgo de tomar la decisión equivocada: rechazar H0 siendo verdadera (Error Tipo I) o no rechazar H0 siendo falsa (Error Tipo II). En todos los contrastes se cometen ambos tipos de error, y a medida que uno aumenta, disminuye el otro.
Elementos en el contraste de hipótesis 12 12 Lección Pública
Tema 5: Pruebas de Hipótesis
Para todos los contrastes hay dos modos de comparación:
Usando valores: Se compara el valor calculado con el crítico Se rechaza si el valor calculado es mayor (en módulo) al crítico Usando áreas: Se compara α ó α/2 con el pvalor
Se rechaza si el pvalor es menor a α
Los contrastes pueden ser unidireccionales (una cola) o bidireccionales (dos colas).
Prueba t de Student (contraste de medias para muestras independientes)
ANOVA de una vía. Pruebas post hoc
Prueba Chi Cuadrado (fe-fo)
Fundamentos de estadística inferencial
Método hipotético deductivo (Juego de hipótesis)
Elementos en el contraste de hipótesis (H0-H1, zona de rechazo, etc)
TEMARIO
Lección Pública 13
Elementos en el contraste de hipótesis 14 14 Lección Pública
Tema 5: Pruebas de Hipótesis
• Deseamos comparar la media de dos muestras. • Muchas diferencias de medias producen valores distintos a 0, debido al error
muestral. El contraste de hipótesis se centra en saber a partir de qué punto esas diferencias son lo suficientemente grandes como para no poder atribuirlas al azar. Es decir, saber si cabe esperar que esas diferencias también se observen en la población.
Usaremos un contraste t de Student. • Si representamos la diferencia entre las medias, obtenemos una distribución con
media de 0, de forma aplanada y más abierta en los extremos: t de Student.
t de Student
Prueba t de Student 15 15 Lección Pública
Tema 5: Pruebas de Hipótesis
𝑡 = 𝑋_
1 − 𝑋_
2
𝑛1− 1 𝑠21 + 𝑛2− 1 𝑠
22
𝑛1+ 𝑛2 − 21𝑛1+1𝑛2
t de Student
Variaciones
𝑡 = 17,3 −19,4
44 1,43+ 51 2,58
96
1
45+1
52
=2,1
62,92+128,52
96
1
45+1
52
=2,1
1,99 0,24=
2,1
0,4776=3,04
gl= 𝑛1+ 𝑛2 − 2
gl= 45 + 52 − 2 = 95 gl95 = 1,98 3,04 > 1,98 Hay evidencia para rechazar H0
Dinero Reconocimiento 𝑋_
1 = 17,3 𝑋_
2 = 19,4 𝑠21 = 1,43 𝑠22 = 2,58 𝑛1 = 45 𝑛2 = 52
H0 = No hay diferencia entre los tratamientos H1 = Hay diferencia entre los tratamientos
tcrítica tcalculada
Prueba t de Student (contraste de medias para muestras independientes)
ANOVA de una vía. Pruebas post hoc
Prueba Chi Cuadrado (fe-fo)
Fundamentos de estadística inferencial
Método hipotético deductivo (Juego de hipótesis)
Elementos en el contraste de hipótesis (H0-H1, zona de rechazo, etc)
TEMARIO
Lección Pública 16
ANOVA de una vía 17 17 Lección Pública
Tema 5: Pruebas de Hipótesis
Puede conducir a rechazar H0
Puede conducir a rechazar H0
Puede conducir a no rechazar H0
Análisis de Varianza (ANOVA) Distribución de las Muestras de los Grupos
ANOVA de una vía 18 18 Lección Pública
Tema 5: Pruebas de Hipótesis
Análisis de Varianza (ANOVA)
* Tomado de Arnau Grass, Psicología Experimental
ANOVA de una vía 19 19 Lección Pública
Tema 5: Pruebas de Hipótesis
A1 A2 A3 A4
2 4 6 9
1 3 7 7
3 5 8 8
4 7 7 9
2 6 5 8
12 25 33 41
2,4 5 6,6 8,2
5 5 5 5
111
5,55
20
Totales
Medias
N
SCTotal: (2)2 + (1)2 + … + (8)2 – (111)2 / 20 = 731 – 616,05 = 114,95
SC Entre Grupos: (12)2/5 + (25)2/5 + (33)2/5 + (41)2/5 – (111)2/20 = 707,8 – 616,05 = 91,75
SC Intra Grupos: 114,95 – 91,75
Análisis de Varianza (ANOVA) (Cálculo)
ANOVA de una vía 20 20 Lección Pública
Tema 5: Pruebas de Hipótesis
• El valor de F calculada se contrasta contra la F crítica (o se contrasta pvalor vs a)
• El valor de contraste de F resulta diferente dependiendo de los g de l. • Como F es una razón de la varianza total sobre la varianza entre grupos, medida que aumentan los g de l, el valor de contraste se hace más pequeño, acercándose a 1
Análisis de Varianza (ANOVA)
ANOVA de una vía 21 21 Lección Pública
Tema 5: Pruebas de Hipótesis
Asumiendo varianzas iguales
Newman-Keuls, DSM, Bonferroni, Sidak, Scheffé, R-E-G-W F, R-E-G-W Q, S-N-K, Tukey, Tukey-b, Duncan, GT2 de Hochberg, Gabriel, Waller-Duncan, Dunnett
No asumiendo varianzas iguales T2 de Tamhane, T3 de Dunnett, Games-Howell, C de Dunnett
Comparan todos los posibles pares de grupos para identificar entre cuáles de ellos se presentan diferencias significativas.
A B 0,178 C 0,001 B A 0,178 C 0,011 C A 0,001 B 0,011
Sig
A B C
Pruebas Post Hoc
Prueba t de Student (contraste de medias para muestras independientes)
ANOVA de una vía. Pruebas post hoc
Prueba Chi Cuadrado (fe-fo)
Fundamentos de estadística inferencial
Método hipotético deductivo (Juego de hipótesis)
Elementos en el contraste de hipótesis (H0-H1, zona de rechazo, etc)
TEMARIO
Lección Pública 22
Prueba Chi Cuadrado 23 23 Lección Pública
Tema 5: Pruebas de Hipótesis
Chi Cuadrado (χ2)
Usado como mínimo para tablas 3x2, con variables nominales u ordinales.
♀ ♂ TOTAL
Caracas 10 5 15
Maracaibo 5 10 15
Valencia 8 12 20
TOTAL 23 27 50
♀ ♂ TOTAL
Caracas 6,9 8,1 15
Maracaibo 6,9 8,1 15
Valencia 9,2 10,8 20
TOTAL 23 27 50
♀ ♂ TOTAL
Caracas 1,39 1,19 2,58
Maracaibo 0,52 0,45 0,97
Valencia 0,16 0,13 0,29
TOTAL 2,07 1,77 3,84
fo fe (fo-fe)2 / fe
χ2 = (fo−fe)2
𝑓𝑒
χ2crítico = 5,99 < χ2
calculado = 3,84 Las variables son independientes
tcrítica tcalculada
¡Gracias!
24 24 24 Lección Pública
Tema 1: Estadística y Método Científico