compara medias

Inferencia Estadística

Según su Naturaleza

Según la Posición

en la Investigación .

Parámetro

Es un número que resume la cantidad de

datos que pueden derivarse del estudio de

una variable estadística. El cálculo de este

número está bien definido, usualmente

mediante una fórmula aritmética obtenida

a partir de datos de la población


Se llaman así porque su cálculo implica una estimación de

los parámetros de la población con base en muestras

estadísticas. Mientras más grande sea la muestra más

exacta será la estimación, mientras más pequeña, más

distorsionada será la media de las muestras por los valores

raros extremos.

•Más poder de eficiencia.

•Menos posibilidad de errores.

• Muestras obtenidas aleatoriamente

• Distribución normal de las observaciones

• Existe un parámetro de interés que buscamos estimar

1. Independencia de las observaciones excepto datos apareados.

2. Las observaciones para la variable dependiente se han obtenido de

manera aleatoria de una población con distribución normal.

3. La variable dependiente es medida al menos en una escala de

intervalo.

4. Se recomienda un tamaño por muestra mínimo de 30.

5. Los datos son obtenidos de poblaciones que tienen varianzas

iguales (una varianza no debe ser el doble o mayor que la otra).

6. Habitualmente las hipótesis se hacen sobre valores numéricos,

especialmente el promedio de una población (μ), como ejemplo:

Ho: μ1 = μ2

H1: μ1 ≠ μ2


Son procedimientos estadísticos para prueba de hipótesis que

no requieren de la suposición de la normalidad de la población

de la cual fue extraída la muestra y se pueden aplicar a datos de

tipo cuantitativo y cualitativo.

1. Determinación sencilla. Mediante fórmulas simples de combinación.

2. Fáciles de aplicar.

3. Rápidas de aplicar. Cuando las muestras son pequeñas.

4. Tipo de medición requerida. Se pueden utilizar con datos ordinales o

nominales.

5. Tamaño de la muestra. Cuando la muestra es < 10 son sencillas, rápidas y

sólo un poco menos eficaces. Conforme aumenta el tamaño de la muestra se

hacen más laboriosas y tardadas, y menos efectivas.

DECISIONES AL SELECCIONAR LA MUESTRA

Se quiere saber cómo se comporta una cierta característica en unUniverso particular

El Universoestá biendefinido

?

Definir El

Universo

Es posibleobservar todo el

Universo ?

Observaruna Muestra

Hacerun Censo

NONO

Sí

Sí

Tomaruna Muestra

No representativa

Tomar una Muestra

Representativa

Se quiereinferir la medición

al Universo

?

NO

Sí

Las observaciones

pueden atribuirse a los miembros del

Universo

Las observaciones solo pueden

atribuirse a la muestra, NO a los miembros del Universo

Las observaciones

pueden atribuirse a los miembros del

Universo


INDEPENDIENTE

Una muestra es independiente cuando los datos de la misma no se pueden

relacionar con los de otra. Se trata entonces de dos conjuntos de datos

independientes entre sí y cuyos tamaños de muestra pueden ser diferentes.

DEPENDIENTE

Una muestra es dependiente cuando existen dos conjuntos de datos

relacionados por la misma muestra, es decir, existe un antes y un después.

Las observaciones se realizan sobre las mismas unidades muestrales.

Tips

– Datos de dos poblaciones distintas. DI/DnA

– Datos de la misma persona en dos momentos diferentes. DD/DA


Se aplica la distribución normal, utilizando el estadístico Z o lo que es

comúnmente llamado como Prueba Z.

Significación de la Media Se establece la diferencia entre una media muestral y una media

poblacional hipotética conocida.

Se supone conocida la varianza.

Estadístico de prueba

n

Z

0


Hipótesis alternativa µ < µ0

Rechace la hipótesis nula

0z

α

Z

Hipótesis alternativa µ > µ0

z


α

0


z


α/2

Hipótesis alternativa µ ≠ µ0

0

α/2

2

Z

2

Z

Z

• Un investigador en el campo de la educación conoce que la cantidad de

estudiantes que aprueban un determinado curso es de 260 con una

desviación típica de 10. Para comprobar la validez de esta hipótesis, se

tomo una muestra al azar de 36 observaciones obteniendo que el promedio

de aprobados fuera de 267. ¿Está este valor muestral obtenido, de acuerdo

con la hipótesis al 5% de significancia?

Paso 1: plantear las hipótesisH0: µ = µ0

H1: µ ≠ µ0

Paso 2: Se establece el nivel de significancia α = 0,05

Paso 3: Estadístico de prueba

n

Z

0

3610

260267 = =

67,1

7= 4,19

Paso 4: Se establece la región de aceptación y la de rechazo o región

crítica para una prueba de dos extremos. (Como se plantearon las

hipótesis H0: µ = µ0 H1: µ ≠ µ0 se establece 2 colas)

0,025

Región de aceptación

0,95 0,025

2

Z

21

Z

2

ZZ

2

1

ZZ

Región Crítica:

se rechaza H0

2

Z

21

Z

Se buscan los valores de y

En la tabla Z para el nivel de significancia dado

α = 0,05

Por lo tanto la región crítica es:

96,1Z 96,1Z

Paso 5: Decisión y conclusiones.

Como Z = 4,19 > 1,96.

Se rechaza la hipótesis H0

(no existen diferencias significativas entre la media muestral y la

poblacional)

Por lo tanto se toma la H1

(existe diferencia significativa)

Se recomienda no considerar en estudios futuros el

promedio de aprobados anualmente en el curso, como de

260 estudiantes.

Pruebas Estadísticas para la comparación de Medias

TEST T PARA DIFERENCIA PAR

TEST T PARA MUESTRAS INDEPENDIENTES

Las pruebas t desapareadas o de muestras

independientes, se utilizan cuando se obtienen dos

grupos de muestras aleatorias, independientes e

idénticamente distribuidas a partir de las dos

poblaciones a ser comparadas.

Supóngase que estamos evaluando el efecto de un tratamiento

médico, y reclutamos a 100 sujetos para el estudio. Luego elegimos

aleatoriamente 50 sujetos para el grupo en tratamiento y 50 sujetos

para el grupo de control. En este caso, obtenemos dos muestras

independientes y podríamos utilizar la forma desapareada de la

prueba t. La elección aleatoria no es esencial en este caso, si

contactamos a 100 personas por teléfono y obtenemos la edad y

género de cada una, y luego se utiliza una prueba t bimuestral para

ver en que forma la media de edades difiere por género, esto también

sería una prueba t de muestras independientes, a pesar de que los

datos son observacionales.

Las pruebas t de muestras dependientes o apareadas,

consisten típicamente en una muestra de pares de valores

con similares unidades estadísticas, o un grupo de

unidades que han sido evaluadas en dos ocasiones

diferentes (una prueba t de mediciones repetitivas).

Cuando los sujetos sean evaluados antes y después de

un tratamiento.

Ejemplo: Prueba Diagnóstica aplicada al inicio de la

clase.


No paramétricas

Para datos apareados

Equivalente a T de

STUDENT

Muestra pequeñas, Mayor a 6 Menores a

25


Trabaja con datos

ordinales

Establece diferencias

de magnitudes

(+ y -)

Dos muestras

apareadas

Establece Diferencias

Muestras, grandes

Mayores a 25 , se

intenta lograr distribución

Normal

Prueba de U de Mann Whitney

Pruebas No Paramétricas

Permiten analizar datos enescala nominal u ordinal apesar de que no se conozcanlos parámetros de unapoblación.

Utiliza el criterio de que no plantea hipótesissobre parámetros o el de que analiza datosobtenidos con una escala de medida débil(datos que aun cuando están cuantificados seaprovechan sus características nominales uordinales).

Se habla dedistribucion libre alaplicar estas pruebasporque no establecesupuestos exigentessobre las poblacionesoriginales sobre dondese muestrea.

Prueba de Mann Whitney

Se usa cuando se quiere

comparar dos poblaciones

usando muestras

independientes

Cuyos datos han sido medidos al menos en una escala de nivel

ordinal.

Es, de hecho, la versión no

paramétrica de la

habitual prueba t de Student.

Prueba de U de Mann Whitney

• Con ella se calcula el llamado estadístico

U, cuya distribución para muestras con

más de 20 observaciones se aproxima

bastante bien a la distribución normal

Pasos para Efectuar la Prueba

• Para efectuar la prueba, se combinan dos

muestras en un arreglo ordenado,

identificando los valores muestrales, de

acuerdo con el grupo muestral al que

pertenecen.


• Luego se determinar el tamaño de las

muestras (n1 y n2). Si n1 y n2 son

menores que 20, se consideran

muestras pequeñas, pero si son

mayores que 20, se consideran

muestras grandes.


• En caso de muestras grandes, calcular el

valor Z, pues en estas condiciones se

distribuye normalmente.


• Despues se ordenan los valores de menor

a mayor, asignando el rango uno al valor

mas pequeño.

• Cuando se encuentran valores

iguales(ligas o empates ), se le asigna el

promedio de sus rangos


• Se calculan los valores de U1 y U2, de

modo que se elija el más pequeño para

comparar con los críticos de U Mann-

Whitney de la tabla de probabilidades

asociadas con valores pequeños como los

de U en la prueba de Mann-Whitney


• Luego se designa mediante U a la

estadística que se calcula para realizar

esta prueba y el cual se basa en el

numero de veces que un puntaje de un

grupo antecede aun puntaje de otro grupo,

si hay dos grupos.


• Y por ultimo decidir si se acepta o se

rechaza la Ho

No obstante es mas fácil basarse en la suma de rangos de

cualquiera de las dos muestras aleatorias mediante las

siguientes formulas:

U1 y U2 = valores estadísticos de U Mann-

Whitney.

n1 = tamaño de la muestra del grupo 1.

n2 = tamaño de la muestra del grupo 2.

R1 = sumatoria de los rangos del grupo 1.

R2 = sumatoria de los rangos del grupo 2.

Ejemplos Muestras Pequeñas

• Un experimentador utiliza dos métodos para enseñar a leer a

un grupo de 10 niños de 6 años, quienes ingresan por

primera vez a la escuela. El experimentador quiere demostrar

que el procedimiento ideado por él es más efectivo que el

tradicional; para ello, mide el desempeño en la lectura en

función de la fluidez, comprensión, análisis y síntesis. El plan

experimental preliminar consiste en elegir al azar tanto una

muestra de 10 niños como el método por utilizar.

Hipótesis de Trabajo

• Hipótesis alterna (Ha). Las calificaciones de

ejecución de lectura, según el método de

enseñanza del experimentador son más altas y

diferentes que las observadas en el método

tradicional.

• Hipótesis nula (Ho). Las diferencias observadas

entre las calificaciones de ejecución de lectura

mediante los dos métodos se deben al azar.

• Nivel de significación.

Para todo valor de probabilidad igual o

menor que p = 0.05, se acepta Ha y se

rechaza Ho.

• Zona de rechazo.

Para todo valor de probabilidad mayor que

0.05, se acepta Ho y se rechaza Ha.

Dos métodos diferentes

aplicados en dos grupos de

niños.

• Aplicación de la prueba estadística.

De acuerdo con los paso, las

observaciones se deben ordenar en

rangos del menor al mayor.

• Rangos de lectura de la tabla anterior.

• De los dos valores de U calculados, se elige el

más pequeño (4) y se comparan con los valores

críticos de U Mann-Whitney

• En caso de que el valor de U calculado no se

localice en las tablas correspondientes, se

transformará en la fórmula siguiente

U = n1n2 - U'

• En esta fórmula, U' corresponde al valor más

alto.

Decisión.

A la probabilidad del valor U de Mann-

Whitney, calculado anteriormente,

corresponde 0.048, el cual es más

pequeño que el nivel de significancia; por

lo tanto, se acepta Ha y se rechaza Ho.

Interpretación • Entre las calificaciones de la ejecución de lectura

mediante los dos métodos de enseñanza existe una

diferencia significativa a un nivel de probabilidad de

error menor que 0.05; es decir, aun cuando las

muestras son pequeñas, las calificaciones más altas

mediante el método diseñado por el experimentador

señalan más efectividad, con la probabilidad de

equivocarse de 0.048 para aceptarlo.


Es lo que se conoce como análisis de a Varianza, este

procedimiento es para mas de dos (2) pruebas es decir realiza una

comparación de medias en Variable cuantitativas; se usa para

contrastar la Hipótesis de que varias medias son iguales.

•Analizar una respuesta cuantitativa

•Condiciones experimentales identificadas

•Posibilidad de crear subconjuntos


Es un método no paramétrico para probar si un grupo de datos proviene de la misma población, intuitivamente idéntico al anova. Es el método mas adecuado para comparar poblaciones cuyas distribuciones no son normales, permitiendo comparar mas de dos muestras.

Esta prueba se emplea como sustituta del análisis de varianza ya que no supone ni la normalidad de la población ni la homogeneidad de la varianza como la ANOVA


Por lo que la hipótesis nula afirma que las muestras son aleatorias, extraídas de las mismas o idénticas distribuciones poblaciones

No hace predicción alguna sobre las medias

de la población, sólo afirma que cuando

menos una de las distribuciones

poblaciones es diferente de algunas de las

otras distribuciones poblacionales


Esta prueba utiliza rango muestrales de tres o más poblaciones independientes

Cada muestra tiene al menos cinco observaciones

Si los rangos se distribuyen de una manera equitativa entre los grupos muestrales, entonces H debe ser un número relativamente pequeño por lo que no se rechazará la hipótesis nula

compara medias

Technology