clase 6 estadística

ESTADISTICA APLICADA A LA ING. AMBIENTAL

SEMANA Nº 6 ESTADISTICA NO PARAMETRICA CON SPSS V22.

Mag. Ing. Marco A. Sánchez Alvarado

INTRODUCCIÓNEn las clases previas se han estudiado una serie de procedimientos estadísticos diseñados para analizar variables cuantitativas: la prueba T para contrastar hipótesis sobre medias, el estadístico F del análisis de varianza y de la prueba de Levene, etc. Todos ellos coinciden en una serie de características

1.Permiten contrastar hipótesis referidas a algún parámetro.

2. Exigen el cumplimiento de determinados supuestos sobre las poblaciones originales de las que se extraen los datos (generalmente normalidad y homocedasticidad).

3. Analizan datos obtenidos con una escala de medida de intervalo o razón.

• Estas tres características combinadas permiten agrupar estos procedimientos estadísticos en una gran familia de técnicas de análisis denominada contrastes paramétricos. Son, sin duda, las técnicas estadísticas más frecuentemente utilizadas por analistas e investigadores en todo tipo de áreas científicas, pero su utilidad se ve reducida, fundamentalmente, por dos razones: por un lado exigen el cumplimiento de algunos supuestos que en ocasiones pueden resultar demasiado exigentes; por otro, obligan a trabajar con unos niveles de medida que, especialmente en las ciencias sociales y de la salud, no siempre resulta fácil de alcanzar.

• Afortunadamente, los contrastes paramétricos no son los únicos disponibles. Existen contrastes que permiten poner a prueba hipótesis no referidas a parámetros poblacionales, existen también contrastes que no necesitan establecer supuestos exigentes sobre las poblaciones de donde se extraen las muestras; y existen, por último, contrastes que no necesitan trabajar con datos obtenidos con una escala de medida de intervalo o de razón. Esta otra familia de contraste se conoce con el nombre de contrastes no paramétricos (o pruebas no paramétricas).

PRUEBAS PARA UNA MUESTRA

1. Prueba Chi cuadrado de bondad de ajuste La prueba chi cuadrado de bondad de Ajuste consiste

en determinar si los datos de cierta muestra corresponden a cierta distribución poblacional. En este caso es necesario que los valores de la variable en la muestra y sobre la cual queremos realizar la inferencia esté dividida en clases de ocurrencia, o equivalentemente, sea cual sea la variable de estudio, deberemos categorizar los datos asignado sus valores a diferentes clases o grupos.

Ejemplo.Estamos interesados en comprobar la perfección de un dado

cúbico (un dado normal de 6 caras). Para esto realizamos 100 lanzamientos del dado anotando los puntos obtenidos en cada lanzamiento. A la vista de los resultados obtenidos, ¿podemos concluir que el dado no es perfecto? Utilice un nivel de significancia de 0,05.

• Planteamiento de Hipótesis: H 0: La distribución del dado es uniforme.H 1: La distribución del dado no es uniforme.Elegimos un nivel de significancia de 0,05, Para la Prueba Chi cuadrado se procede de la siguiente

manera:

Analizar > Pruebas no paramétricas> Chi cuadrado…

2. Prueba de Rachas

La prueba de rachas sirve para evaluar si una determinada secuencia de observaciones es aleatoria, es decir, para estudiar si las observaciones de una determinada muestra son independientes entre sí.

El concepto de racha hace referencia a una secuencia de observaciones de un mismo tipo. Supongamos que se lanza una moneda al aire 10 veces y se obtiene el siguiente resultado: CCCXCCXXXC. En este resultado hay 5 rachas: CCC, X, CC, XXX y C. a simple vista el resultado obtenido es aleatorio.

Pues bien, la prueba de las rachas permite determinar si el número de rachas observado en una determinada muestra de tamaño n es lo suficientemente grande o lo suficientemente pequeño como para poder rechazar la hipótesis de independencia (o aleatoriedad) entre las observaciones.

Ejemplo.

• Verificar si los elementos correspondientes a una muestra de 10 elementos pueden considerarse una secuencia aleatoria. Utilice un nivel de significancia de 0,05.

• 505 495 496 497 501 502 520

Planteamiento de Hipótesis:

HO: La secuencia de observaciones es aleatoriaH 1: La secuencia de observaciones no es aleatoria

Elegimos un nivel de significancia del 0,05, Procedimiento a seguir con el SPSS

Para la Prueba se procede de la siguiente manera:• Analizar > Pruebas no paramétricas> Rachas…•

PRUEBA PARA DOS MUESTRAS INDEPENDIENTESPRUEBA U DE Mann Whitney

La prueba U de Mann Whitney es una buena alternativa a la prueba t sobre diferencia de medias cuando no se cumplen los supuestos en los que se basa la prueba t (normalidad y homocedasticidad), o cuando no es apropiado utilizar la prueba t porque el nivel de medida de los datos es ordinal.

Ejemplo. Se eligieron dos muestras aleatorias de profesores de

dos colegios particulares y la información corresponde a los sueldos mensuales. Verificar si existe diferencia significativa entre los sueldos promedios reales de los profesores de estos dos colegios.

S. / MES 1 2 3 4 5 6 7 8 9 10 11 12 13 14

STA. ROSA 142 311 262 302 195 253 199 236 216 211 176 249 214

INMACULADA 175 132 218 151 200 219 234 149 187 123 148 206 179 206

Planteamiento de HipótesisH0 : Sueldos son iguales (μ 1 = μ 2) H1 : Sueldos son diferentes (μ 1 ≠ μ 2) Se elige nivel de significancia =0.05

Procedimiento a seguir con el SPSS

ANALIZAR> P no Paramétrica> 2 muestras independientes

PRUEBA PARA VARIAS MUESTRAS INDEPENDIENTES.Prueba H de Kruskal Wallis.

• La prueba de Mann Whitney para dos muestras independientes fue extendida al caso de más de dos muestras por Kruskal Wallis. Teniendo en cuenta que en muchas situaciones reales resulta demasiado arriesgado suponer normalidad y homocedasticidad (especialmente si las muestras son pequeñas y/o los tamaños muestrales desiguales), y considerando además que en otras situaciones el nivel de medida de los datos puede no ir más allá del ordinal, la prueba Kruskal Wallis representa una excelente alternativa al ANOVA de un factor completamente aleatorizado.

EJEMPLO DE LA P. KRUSKAL –WALLIS

• Una psicóloga, empleada por una gran compañía, quiere evaluar dos programas para la reducción de peso que piensa utilizar con los trabajadores de su corporación. Esta psicóloga realiza un experimento en donde 18 empleados obesos se asignan de manera aleatoria a tres condiciones, con 6 sujetos por condición. Los individuos bajo la condición 1 reciben una dieta que reduce su ingesta diaria en 500 calorías. Los sujetos bajo la condición 2 reciben la misma dieta, pero además deben caminar 2 millas por día. La condición 3 es de control, en la cual se pide a los sujetos que continúen con su consumo normal de alimentos y con sus hábitos de ejercicio. Los datos de la tabla representan el número de libras perdidas por cada sujeto durante un periodo de 6 meses. Un número positivo indica una pérdida de peso y un número negativo una ganancia de ésta. Utilizar α = 0, 05

Planteamiento de Hipótesis: H0: La perdidad de peso es igual en los tres tratientos HI : La perdida de peso es diferentes en los tres tratamientos.

Procedimiento a seguir con el SPSS

ANALIZAR> P no Parametricas>K muestras independientes

PRUEBA PARA DOS MUESTRAS RELACIONADAS PRUEBA DE WILCOXON

Para el caso en que dos muestras han sido recolectadas como observaciones pareadas, la prueba de Wilcoxon sirve para contrastar hipótesis sobre igualdad de medianas.

• Ejemplo. Se realizó un experimento psicológico para comparar los tiempos de reacción (en segundos) para dos estímulos diferentes. Con el objeto de eliminar la variabilidad natural de persona a persona en las respuestas, se aplicaron en ambos estímulos a cada uno de 9 individuos, lo que permite realizar un análisis de la diferencia entre los estímulos para cada persona.

INDIVIDUO 1 2 3 4 5 6 7 8 9

ESTIMULO 1 9.4 7.8 5.6 12.1 6.9 4.2 8.8 7.7 6.4

ESTIMULO 2 10.3 8.9 4.1 14.7 8.7 7.1 11.3 5.2 7.8


HO: Los tiempos de reacción son iguales para ambos estímulosH1 :Los tiempos de reacción son diferentes para ambos estímulosSe asumen un α = 0.05

PROCEDIMIENTOI A SEGUIR CON EL SPSS ANALIZAR>P no Parametricas> 2 Muestras relacionadas

PRUEBA PARA VARIAS MUESTRAS RELACIONADAS PRUEBA DE FRIEDMAN

Esta prueba sirve para comparar J promedios poblacionales cuando se trabaja con muestras relacionadas. Como en el caso de la prueba de Kruskal Wallis, para esta prueba tampoco es necesario establecer los supuestos de normalidad y heterocedasticidad y permite trabajar con datos ordinales, por tanto, esta prueba constituye una alternativa al estadístico F cuando no se cumplen los supuestos ya señalados del ANOVA o el nivel de medida de los datos es ordinal.

EJEMPLO DE LA PRUEBA DE FRIEDMAN Se realizó un experimento para investigar los efectos tóxicos de tres productos químicos A, B, C, en la piel de ratas. Se marcan tres cuadrados adyacentes de una pulgada sobre el lomo de 8 ratas y se aplica cada uno de los productos químicos a cada rata. Los cuadrados de piel se califican de 0 a 10, según el grado de irritación. Los datos se muestran en la tabla siguiente: ¿Existe evidencia suficiente para apoyar la hipótesis de investigación de que la distribución de probabilidad de los resultados de la irritación en la piel que corresponde a los 3 productos difieren en ubicación?


H0: El nivel de irritación es el mismo para los tres productos.

H1: El nivel de irritación es diferente para los tres productos

Se asumen un α = 0.05 PROCEDIMIENTO A SEGUIR CON EL SPSS

ANALIZAR> P no Paramétricas> K de muestras relacionadas.

clase 6 estadística

Documents