compara medias
TRANSCRIPT
Inferencia Estadística
Inferencia Estadística
Inferencia Estadística
Según su Naturaleza
Según la Posición
en la Investigación .
Parámetro
Es un número que resume la cantidad de
datos que pueden derivarse del estudio de
una variable estadística. El cálculo de este
número está bien definido, usualmente
mediante una fórmula aritmética obtenida
a partir de datos de la población
Inferencia Estadística
Se llaman así porque su cálculo implica una estimación de
los parámetros de la población con base en muestras
estadísticas. Mientras más grande sea la muestra más
exacta será la estimación, mientras más pequeña, más
distorsionada será la media de las muestras por los valores
raros extremos.
•Más poder de eficiencia.
•Menos posibilidad de errores.
• Muestras obtenidas aleatoriamente
• Distribución normal de las observaciones
• Existe un parámetro de interés que buscamos estimar
1. Independencia de las observaciones excepto datos apareados.
2. Las observaciones para la variable dependiente se han obtenido de
manera aleatoria de una población con distribución normal.
3. La variable dependiente es medida al menos en una escala de
intervalo.
4. Se recomienda un tamaño por muestra mínimo de 30.
5. Los datos son obtenidos de poblaciones que tienen varianzas
iguales (una varianza no debe ser el doble o mayor que la otra).
6. Habitualmente las hipótesis se hacen sobre valores numéricos,
especialmente el promedio de una población (μ), como ejemplo:
Ho: μ1 = μ2
H1: μ1 ≠ μ2
Inferencia Estadística
Son procedimientos estadísticos para prueba de hipótesis que
no requieren de la suposición de la normalidad de la población
de la cual fue extraída la muestra y se pueden aplicar a datos de
tipo cuantitativo y cualitativo.
1. Determinación sencilla. Mediante fórmulas simples de combinación.
2. Fáciles de aplicar.
3. Rápidas de aplicar. Cuando las muestras son pequeñas.
4. Tipo de medición requerida. Se pueden utilizar con datos ordinales o
nominales.
5. Tamaño de la muestra. Cuando la muestra es < 10 son sencillas, rápidas y
sólo un poco menos eficaces. Conforme aumenta el tamaño de la muestra se
hacen más laboriosas y tardadas, y menos efectivas.
DECISIONES AL SELECCIONAR LA MUESTRA
Se quiere saber cómo se comporta una cierta característica en unUniverso particular
El Universoestá biendefinido
?
Definir El
Universo
Es posibleobservar todo el
Universo ?
Observaruna Muestra
Hacerun Censo
NONO
Sí
Sí
Tomaruna Muestra
No representativa
Tomar una Muestra
Representativa
Se quiereinferir la medición
al Universo
?
NO
Sí
Las observaciones
pueden atribuirse a los miembros del
Universo
Las observaciones solo pueden
atribuirse a la muestra, NO a los miembros del Universo
Las observaciones
pueden atribuirse a los miembros del
Universo
Inferencia Estadística
INDEPENDIENTE
Una muestra es independiente cuando los datos de la misma no se pueden
relacionar con los de otra. Se trata entonces de dos conjuntos de datos
independientes entre sí y cuyos tamaños de muestra pueden ser diferentes.
DEPENDIENTE
Una muestra es dependiente cuando existen dos conjuntos de datos
relacionados por la misma muestra, es decir, existe un antes y un después.
Las observaciones se realizan sobre las mismas unidades muestrales.
Tips
– Datos de dos poblaciones distintas. DI/DnA
– Datos de la misma persona en dos momentos diferentes. DD/DA
Inferencia Estadística
Inferencia Estadística
Se aplica la distribución normal, utilizando el estadístico Z o lo que es
comúnmente llamado como Prueba Z.
Significación de la Media Se establece la diferencia entre una media muestral y una media
poblacional hipotética conocida.
Se supone conocida la varianza.
Estadístico de prueba
n
Z
0
Inferencia Estadística
Hipótesis alternativa µ < µ0
Rechace la hipótesis nula
0z
α
Z
Hipótesis alternativa µ > µ0
z
Rechace la hipótesis nula
α
0
Rechace la hipótesis nula
z
Rechace la hipótesis nula
α/2
Hipótesis alternativa µ ≠ µ0
0
α/2
2
Z
2
Z
Z
• Un investigador en el campo de la educación conoce que la cantidad de
estudiantes que aprueban un determinado curso es de 260 con una
desviación típica de 10. Para comprobar la validez de esta hipótesis, se
tomo una muestra al azar de 36 observaciones obteniendo que el promedio
de aprobados fuera de 267. ¿Está este valor muestral obtenido, de acuerdo
con la hipótesis al 5% de significancia?
Paso 1: plantear las hipótesisH0: µ = µ0
H1: µ ≠ µ0
Paso 2: Se establece el nivel de significancia α = 0,05
Paso 3: Estadístico de prueba
n
Z
0
3610
260267 = =
67,1
7= 4,19
Paso 4: Se establece la región de aceptación y la de rechazo o región
crítica para una prueba de dos extremos. (Como se plantearon las
hipótesis H0: µ = µ0 H1: µ ≠ µ0 se establece 2 colas)
0,025
Región de aceptación
0,95 0,025
2
Z
21
Z
2
ZZ
2
1
ZZ
Región Crítica:
se rechaza H0
2
Z
21
Z
Se buscan los valores de y
En la tabla Z para el nivel de significancia dado
α = 0,05
Por lo tanto la región crítica es:
96,1Z 96,1Z
Paso 5: Decisión y conclusiones.
Como Z = 4,19 > 1,96.
Se rechaza la hipótesis H0
(no existen diferencias significativas entre la media muestral y la
poblacional)
Por lo tanto se toma la H1
(existe diferencia significativa)
Se recomienda no considerar en estudios futuros el
promedio de aprobados anualmente en el curso, como de
260 estudiantes.
Pruebas Estadísticas para la comparación de Medias
TEST T PARA DIFERENCIA PAR
TEST T PARA MUESTRAS INDEPENDIENTES
Las pruebas t desapareadas o de muestras
independientes, se utilizan cuando se obtienen dos
grupos de muestras aleatorias, independientes e
idénticamente distribuidas a partir de las dos
poblaciones a ser comparadas.
Supóngase que estamos evaluando el efecto de un tratamiento
médico, y reclutamos a 100 sujetos para el estudio. Luego elegimos
aleatoriamente 50 sujetos para el grupo en tratamiento y 50 sujetos
para el grupo de control. En este caso, obtenemos dos muestras
independientes y podríamos utilizar la forma desapareada de la
prueba t. La elección aleatoria no es esencial en este caso, si
contactamos a 100 personas por teléfono y obtenemos la edad y
género de cada una, y luego se utiliza una prueba t bimuestral para
ver en que forma la media de edades difiere por género, esto también
sería una prueba t de muestras independientes, a pesar de que los
datos son observacionales.
Las pruebas t de muestras dependientes o apareadas,
consisten típicamente en una muestra de pares de valores
con similares unidades estadísticas, o un grupo de
unidades que han sido evaluadas en dos ocasiones
diferentes (una prueba t de mediciones repetitivas).
Cuando los sujetos sean evaluados antes y después de
un tratamiento.
Ejemplo: Prueba Diagnóstica aplicada al inicio de la
clase.
Pruebas Estadísticas para la comparación de Medias
No paramétricas
Para datos apareados
Equivalente a T de
STUDENT
Muestra pequeñas, Mayor a 6 Menores a
25
Pruebas Estadísticas para la comparación de Medias
Trabaja con datos
ordinales
Establece diferencias
de magnitudes
(+ y -)
Dos muestras
apareadas
Establece Diferencias
Muestras, grandes
Mayores a 25 , se
intenta lograr distribución
Normal
Pruebas Estadísticas para la comparación de Medias
Pruebas Estadísticas para la comparación de Medias
Pruebas Estadísticas para la comparación de Medias
Pruebas Estadísticas para la comparación de Medias
Pruebas Estadísticas para la comparación de Medias
Pruebas Estadísticas para la comparación de Medias
Pruebas Estadísticas para la comparación de Medias
Pruebas Estadísticas para la comparación de Medias
Pruebas Estadísticas para la comparación de Medias
Pruebas Estadísticas para la comparación de Medias
Pruebas Estadísticas para la comparación de Medias
Pruebas Estadísticas para la comparación de Medias
Pruebas Estadísticas para la comparación de Medias
Pruebas Estadísticas para la comparación de Medias
Pruebas Estadísticas para la comparación de Medias
Pruebas Estadísticas para la comparación de Medias
Pruebas Estadísticas para la comparación de Medias
Pruebas Estadísticas para la comparación de Medias
Pruebas Estadísticas para la comparación de Medias
Prueba de U de Mann Whitney
Pruebas No Paramétricas
Permiten analizar datos enescala nominal u ordinal apesar de que no se conozcanlos parámetros de unapoblación.
Utiliza el criterio de que no plantea hipótesissobre parámetros o el de que analiza datosobtenidos con una escala de medida débil(datos que aun cuando están cuantificados seaprovechan sus características nominales uordinales).
Se habla dedistribucion libre alaplicar estas pruebasporque no establecesupuestos exigentessobre las poblacionesoriginales sobre dondese muestrea.
Prueba de Mann Whitney
Se usa cuando se quiere
comparar dos poblaciones
usando muestras
independientes
Cuyos datos han sido medidos al menos en una escala de nivel
ordinal.
Es, de hecho, la versión no
paramétrica de la
habitual prueba t de Student.
Prueba de U de Mann Whitney
• Con ella se calcula el llamado estadístico
U, cuya distribución para muestras con
más de 20 observaciones se aproxima
bastante bien a la distribución normal
Pasos para Efectuar la Prueba
• Para efectuar la prueba, se combinan dos
muestras en un arreglo ordenado,
identificando los valores muestrales, de
acuerdo con el grupo muestral al que
pertenecen.
Pasos para Efectuar la Prueba
• Luego se determinar el tamaño de las
muestras (n1 y n2). Si n1 y n2 son
menores que 20, se consideran
muestras pequeñas, pero si son
mayores que 20, se consideran
muestras grandes.
Pasos para Efectuar la Prueba
• En caso de muestras grandes, calcular el
valor Z, pues en estas condiciones se
distribuye normalmente.
Pasos para Efectuar la Prueba
• Despues se ordenan los valores de menor
a mayor, asignando el rango uno al valor
mas pequeño.
• Cuando se encuentran valores
iguales(ligas o empates ), se le asigna el
promedio de sus rangos
Pasos para Efectuar la Prueba
• Se calculan los valores de U1 y U2, de
modo que se elija el más pequeño para
comparar con los críticos de U Mann-
Whitney de la tabla de probabilidades
asociadas con valores pequeños como los
de U en la prueba de Mann-Whitney
Pasos para Efectuar la Prueba
• Luego se designa mediante U a la
estadística que se calcula para realizar
esta prueba y el cual se basa en el
numero de veces que un puntaje de un
grupo antecede aun puntaje de otro grupo,
si hay dos grupos.
Pasos para Efectuar la Prueba
• Y por ultimo decidir si se acepta o se
rechaza la Ho
No obstante es mas fácil basarse en la suma de rangos de
cualquiera de las dos muestras aleatorias mediante las
siguientes formulas:
U1 y U2 = valores estadísticos de U Mann-
Whitney.
n1 = tamaño de la muestra del grupo 1.
n2 = tamaño de la muestra del grupo 2.
R1 = sumatoria de los rangos del grupo 1.
R2 = sumatoria de los rangos del grupo 2.
Ejemplos Muestras Pequeñas
• Un experimentador utiliza dos métodos para enseñar a leer a
un grupo de 10 niños de 6 años, quienes ingresan por
primera vez a la escuela. El experimentador quiere demostrar
que el procedimiento ideado por él es más efectivo que el
tradicional; para ello, mide el desempeño en la lectura en
función de la fluidez, comprensión, análisis y síntesis. El plan
experimental preliminar consiste en elegir al azar tanto una
muestra de 10 niños como el método por utilizar.
Hipótesis de Trabajo
• Hipótesis alterna (Ha). Las calificaciones de
ejecución de lectura, según el método de
enseñanza del experimentador son más altas y
diferentes que las observadas en el método
tradicional.
• Hipótesis nula (Ho). Las diferencias observadas
entre las calificaciones de ejecución de lectura
mediante los dos métodos se deben al azar.
• Nivel de significación.
Para todo valor de probabilidad igual o
menor que p = 0.05, se acepta Ha y se
rechaza Ho.
• Zona de rechazo.
Para todo valor de probabilidad mayor que
0.05, se acepta Ho y se rechaza Ha.
Dos métodos diferentes
aplicados en dos grupos de
niños.
• Aplicación de la prueba estadística.
De acuerdo con los paso, las
observaciones se deben ordenar en
rangos del menor al mayor.
• Rangos de lectura de la tabla anterior.
• De los dos valores de U calculados, se elige el
más pequeño (4) y se comparan con los valores
críticos de U Mann-Whitney
• En caso de que el valor de U calculado no se
localice en las tablas correspondientes, se
transformará en la fórmula siguiente
U = n1n2 - U'
• En esta fórmula, U' corresponde al valor más
alto.
SPSS
Decisión.
A la probabilidad del valor U de Mann-
Whitney, calculado anteriormente,
corresponde 0.048, el cual es más
pequeño que el nivel de significancia; por
lo tanto, se acepta Ha y se rechaza Ho.
Interpretación • Entre las calificaciones de la ejecución de lectura
mediante los dos métodos de enseñanza existe una
diferencia significativa a un nivel de probabilidad de
error menor que 0.05; es decir, aun cuando las
muestras son pequeñas, las calificaciones más altas
mediante el método diseñado por el experimentador
señalan más efectividad, con la probabilidad de
equivocarse de 0.048 para aceptarlo.
Inferencia Estadística
Es lo que se conoce como análisis de a Varianza, este
procedimiento es para mas de dos (2) pruebas es decir realiza una
comparación de medias en Variable cuantitativas; se usa para
contrastar la Hipótesis de que varias medias son iguales.
•Analizar una respuesta cuantitativa
•Condiciones experimentales identificadas
•Posibilidad de crear subconjuntos
Pruebas Estadísticas para la comparación de Medias
Es un método no paramétrico para probar si un grupo de datos proviene de la misma población, intuitivamente idéntico al anova. Es el método mas adecuado para comparar poblaciones cuyas distribuciones no son normales, permitiendo comparar mas de dos muestras.
Esta prueba se emplea como sustituta del análisis de varianza ya que no supone ni la normalidad de la población ni la homogeneidad de la varianza como la ANOVA
Pruebas Estadísticas para la comparación de Medias
Por lo que la hipótesis nula afirma que las muestras son aleatorias, extraídas de las mismas o idénticas distribuciones poblaciones
No hace predicción alguna sobre las medias
de la población, sólo afirma que cuando
menos una de las distribuciones
poblaciones es diferente de algunas de las
otras distribuciones poblacionales
Pruebas Estadísticas para la comparación de Medias
Esta prueba utiliza rango muestrales de tres o más poblaciones independientes
Cada muestra tiene al menos cinco observaciones
Si los rangos se distribuyen de una manera equitativa entre los grupos muestrales, entonces H debe ser un número relativamente pequeño por lo que no se rechazará la hipótesis nula
Pruebas Estadísticas para la comparación de Medias