pruebas no parametricas

4
PRUEBAS NO PARAMETRICAS MARCO TEÓRICO La mayor parte de los procedimientos de prueba de hipótesis se basan en la suposición de que las muestras aleatorias se seleccionan de poblaciones normales.  Afortuna damente , la mayor p arte de e stas pruebas aún so n confia bles cuando experimentamos ligeras desviaciones de la normalidad, en particular cuando el tamaño de la muestra es grande. Tradicionalmente, estos procedimientos de prueba se denominan mtodos paramtricos. !n este traba"o se consideran varios procedimientos de prueba alternativos, llamados no paramtricos o mtodos de distribución libre, que a menudo no suponen conocimiento de ninguna clase acerca de las distribuciones de las poblaciones fundamentales, excepto que stas son continuas.  Asimismo la s pruebas no param tricas competen a la estadística no paramétrica que es una rama de la  estad#stica que estudia las pruebas y modelos estad#sticos cuya distribución subyacente no se a"usta a los llamados criterios paramtricos . La utili$ación de estos mtodos se hace recomendable cuando no se puede asumir que los datos se a"usten a una distribución conocida, cuando el nivel de medida empleado no sea, como m#nimo, de intervalo. Los procedimientos no paramtricos o de distribución libre se usan con mayor frecuencia por los analistas de datos. !xisten muchas aplicaciones en la ciencia y la ingenier#a donde los datos se reportan no como valores de un continuo sino m%s bien en una escala ordinal tal que es bastante natural asignar rangos a los datos. &na definición m%s simple y especifica es la denominación que se da a las pruebas no paramtricas como aquellas que no presuponen una distribución de probabilidad para los datos, por ello se conocen tambin como de distribución libre. !n la mayor parte de ellas los resultados estad#sticos se derivan únicamente a partir de procedimientos de ordenación y recuento, por lo que su base lógica es de f%cil comprensión. 'uando traba"amos con muestras pequeñas (n ) *+ en las que se desconoce si es v%lido suponer la normalidad de los datos, conviene utili$ar pruebas no paramtricas, al menos para corroborar los resultados obtenidos a partir de la utili$ación de la teor#a basada en la normal . !ntre las principales pruebas no paramtricas encontramos : - -rueba de i 'uadrado - -rueba de /ignos - -rueba 0ilcoxon - -rueba de 1rus2al30allis

Upload: luis-robles-inchicaqui

Post on 08-Jan-2016

2 views

Category:

Documents


0 download

DESCRIPTION

pruebas no paramentaras, control estadístico de procesos

TRANSCRIPT

Page 1: Pruebas No Parametricas

7/17/2019 Pruebas No Parametricas

http://slidepdf.com/reader/full/pruebas-no-parametricas-568ee7b1cb806 1/4

PRUEBAS NO PARAMETRICAS

MARCO TEÓRICO

La mayor parte de los procedimientos de prueba de hipótesis se basan en la suposición

de que las muestras aleatorias se seleccionan de poblaciones normales.

 Afortunadamente, la mayor parte de estas pruebas aún son confiables cuando

experimentamos ligeras desviaciones de la normalidad, en particular cuando el tamaño de

la muestra es grande. Tradicionalmente, estos procedimientos de prueba se

denominan mtodos paramtricos. !n este traba"o se consideran varios procedimientos

de prueba alternativos, llamados no paramtricos o mtodos de distribución libre, que a

menudo no suponen conocimiento de ninguna clase acerca de las distribuciones de las

poblaciones fundamentales, excepto que stas son continuas.

 Asimismo las pruebas no paramtricas competen a la estadística no paramétrica que es

una rama de la estad#stica que estudia las pruebas y modelos estad#sticos cuyadistribución subyacente no se a"usta a los llamados criterios paramtricos. La utili$ación

de estos mtodos se hace recomendable cuando no se puede asumir que los datos se

a"usten a una distribución conocida, cuando el nivel de medida empleado no sea, como

m#nimo, de intervalo.

Los procedimientos no paramtricos o de distribución libre se usan con mayor frecuencia

por los analistas de datos. !xisten muchas aplicaciones en la ciencia y la ingenier#a donde

los datos se reportan no como valores de un continuo sino m%s bien en una escala ordinal

tal que es bastante natural asignar rangos a los datos.

&na definición m%s simple y especifica es la denominación que se da a las pruebas no

paramtricas como aquellas que no presuponen una distribución de probabilidad para losdatos, por ello se conocen tambin como de distribución libre. !n la mayor parte de ellas

los resultados estad#sticos se derivan únicamente a partir de procedimientos de

ordenación y recuento, por lo que su base lógica es de f%cil comprensión. 'uando

traba"amos con muestras pequeñas (n ) *+ en las que se desconoce si es v%lido suponer 

la normalidad de los datos, conviene utili$ar pruebas no paramtricas, al menos para

corroborar los resultados obtenidos a partir de la utili$ación de la teor#a basada en la

normal.

!ntre las principales pruebas no paramtricas encontramos:

- -rueba de i 'uadrado

- -rueba de /ignos- -rueba 0ilcoxon- -rueba de 1rus2al30allis

Page 2: Pruebas No Parametricas

7/17/2019 Pruebas No Parametricas

http://slidepdf.com/reader/full/pruebas-no-parametricas-568ee7b1cb806 2/4

a) Pruea de C!i Cuadrada

La distribución chi cuadrada es toda una familia de distribuciones. Existe unadistribución chi-cuadrada para cada grado de libertad.

Los resultados obtenidos de muestras no siempre concuerdan exactamente con

los resultados teóricos esperados, según las reglas de probabilidad. Porejemplo, aunque consideraciones teóricas conducan a esperar !" caras # !"cruces cuando se lana $"" %eces una moneda bien hecha, es raro que seobtengan exactamente estos resultados.

&upóngase que en una determinada muestra se obser%an una serie de posiblessucesos E$, E', E(, . . . , E) , que ocurren con frecuencias o$, o', o(, . . ., o) ,llamadas frecuencias observadas # que, según las reglas de probabilidad, seespera que ocurran con frecuencias e$, e', e(, . . . ,e) llamadas frecuenciasteóricas o esperadas.

* menudo se desea saber si las frecuencias obser%adas di+eren

signi+cati%amente de las frecuencias esperadas. Para el caso en que solamenteson posibles dos sucesos E$ # E' como, por ejemplo, caras o cruces,defectuoso, etc., el problema queda resuelto satisfactoriamente con losmtodos de las unidades anteriores. En esta unidad se considera el problemageneral.

e+nición de . /na medida de la discrepancia existente entre las frecuenciasobser%adas # esperadas es suministrada por el estad0stico ', dado por:

onde si el total de frecuencias es 1,

&i ' 2 ", las frecuencias obser%adas # esperadas concuerdan exactamente,mientras que si '3", no coinciden exactamente. * %alores ma#ores de ',ma#ores son las discrepancias entre las frecuencias obser%adas # esperadas.&i las frecuencias esperadas son al menos iguales a !, la aproximación mejorapara %alores superiores.

El número de grados de libertad est4 dado por:

 2 5 6 $ 6 m

En donde:) 2 número de clasi+caciones en el problema.m 2 número de par4metros estimados a partir de los datos mustrales paraobtener los %alores esperados.

Page 3: Pruebas No Parametricas

7/17/2019 Pruebas No Parametricas

http://slidepdf.com/reader/full/pruebas-no-parametricas-568ee7b1cb806 3/4

) Pruea de "rus"a#$%a##is

!n estad#stica, la pruea de &rus"a#$%a##is (de 0illiam 1rus2al y 0. Allen 0allis es

un mtodo no paramtrico para probar si un grupo de datos proviene de la misma

población. 4ntuitivamente, es idntico al A567A con los datos reempla$ados por

categor#as. !s una extensión de la prueba de la & de 8ann30hitney para 9 o m%s grupos.

Las hipótesis son:

  H 0 : Todas las k  poblaciones tienen la misma distribución.

  H 1: 5o todas las k  poblaciones tienen la misma distribución.

;a que es una prueba no paramtrica, la prueba de 1rus2al30allis no

asume normalidad en los datos, en oposición al tradicional A567A. /# asume, ba"o la

hipótesis nula, que los datos vienen de la misma distribución. &na forma común en que se

viola este supuesto es con datos heteroced%sticos.

*. !l estad#stico est% dado por:

<onde:

•  es el número de observaciones en el grupo

•  es el rango (entre todas las observaciones de la observación en el

grupo

•  es el número total de observaciones entre todos los grupos

• ,

•  es el promedio de .

5ote que el denominador de la expresión para es exactamente.

Page 4: Pruebas No Parametricas

7/17/2019 Pruebas No Parametricas

http://slidepdf.com/reader/full/pruebas-no-parametricas-568ee7b1cb806 4/4

Luego

  .

=. /e puede reali$ar una corrección para los valores repetidos dividiendo por

, donde es el número de grupos de diferentes rangos

repetidos, y es el número de observaciones repetidas dentro del grupo quetiene observaciones repetidas para un determinado valor. !sta corrección hace

cambiar a muy poco al menos que existan un gran número de observaciones

repetidas.

9. >inalmente, el  p-value (valor  p es aproximado por . /i algún

es pequeño ( la distribución de puede ser distinta de la chi3cuadrado.