2.2.1 de uniformidad. (chi cuadrada^j kolmogorov - smirnov)

8

Click here to load reader

Upload: oscar-munoz

Post on 04-Dec-2015

494 views

Category:

Documents


11 download

DESCRIPTION

Información sobre las pruebas estadisticas. de uniformidad como son Prueba de frecuencias o chi-cudrada y el de kolmogorov-smirnov

TRANSCRIPT

Page 1: 2.2.1 De uniformidad. (chi cuadrada^J kolmogorov - Smirnov)

2.2.1 DE UNIFORMIDAD (CHI CUADRADA, KOLMOGOROV- SMIMOV)

UNIFORMIDAD

Semejanza o igualdad que presentan las características de los distintos elementos

de un conjunto.

PRUEBA DE CHI CUADRADA

La prueba chi-cuadrada también conocida como la prueba de Pearson o la prueba

de frecuencias es una prueba de bondad de ajuste que establece si difiere o no la frecuencia observada de una distribución teórica. El inglés Karl Pearson desarrolló

a principios del siglo XX esta prueba, y hasta la fecha tiene muchas aplicaciones en el campo estadístico.

La prueba chi-cuadrada es una de las pruebas más útiles y ampliamente utilizadas en la estadística. La distribución Chi-Cuadrada es en teoría una distribución

matemática que se aplica ampliamente en el trabajo estadístico. El término Chi-cuadrada proviene del uso de la letra griega χ el cual se pronuncia ji o chi y es el que define a esta distribución. La hipótesis nula y alternativa son las siguientes:

Esta prueba es utilizada para determinar qué tan significativa es la diferencia entre las frecuencias observadas y esperadas de uno o más categorías (subintervalos).

La diferencia entre las frecuencias esperadas y observadas, son consideradas como el error muestral. Las frecuencias observadas son calculadas a partir de un

conteo de los números que coinciden en un subintervalo determinado, y las frecuencias esperadas están en función a una distribución de probabilidad teórica.

Procedimiento:

1. Generar la muestra de números aleatorios de tamaño N.

2. Subdividir el intervalo [0,1] en n subintervalos.

3. Para cada subintervalo contar la frecuencia observada F0 y calcular la frecuencia esperada FE de números aleatorios, la cual se obtiene dividiendo N/n.

4. Calcular el estadístico de prueba.

Page 2: 2.2.1 De uniformidad. (chi cuadrada^J kolmogorov - Smirnov)

5. Comparar el valor calculado X02 contra el valor tabulado de la distribución X2, con

(n-1) grados de libertad y una significancia ?. Si X02 es menor que X2(n-1),? entonces no se puede rechazar la uniformidad de los números aleatorios.

EJEMPLO 4. Realizar la prueba de bondad de ajuste Ji-cuadrada a la siguiente

muestra de tamaño 30 de números aleatorios uniformes

0.15 0.31 0.81 0.48 0.01 0.60

0.26 0.34 0.70 0.31 0.07 0.06

0.33 0.49 0.77 0.04 0.43 0.92

0.25 0.83 0.68 0.97 0.11 0.00

0.18 0.11 0.03 0.59 0.25 0.55

INTERVALO FE FO (FE-FO)2/FE

0.00 - 0.20 6 10 2.67

0.21 - 0.40 6 7 0.17

0.41 - 0.60 6 6 0.00

0.61 - 0.80 6 3 1.50

0.81 - 1.00 6 4 0.67

X20=5.01

Sea alfa= 5%. Tenemos (5-1) grados de libertad, es decir V=4. El valor en tablas de

la distribución Ji cuadrada es:

X24.5% = 9.49

Como X02 es menor que X24.5% es decir; 5.01 es menor que 9.49. Entonces no se

puede rechazar la uniformidad de los números aleatorios.

Para una secuencia de 100 números, y 5 subintervalos tenemos que: N=100, n=5, la FEi = N/n = 100/5 = 20 para cualquier i. y la frecuencia observada es la cantidad

de números que coinciden en cada subintervalo.

Page 3: 2.2.1 De uniformidad. (chi cuadrada^J kolmogorov - Smirnov)

La hipótesis de que todas las frecuencias son iguales en cada subintervalo se basa

en dividir el intervalo (0, 1) en n subintervalos para luego realizar las comparaciones encada subintervalo entre la frecuencia esperada contra la frecuencia observada.

Si son parecidas entonces se dice que la muestra proviene de una distribución uniforme. El estadístico que se 𝜒0

2 utiliza es el cual hace uso de la letra griega ji

(CHI), el cual es obtenido de la siguiente expresión:

Dónde: N = Tamaño de la muestra, n=cantidad de subintervalos, FOi = frecuencia observada en el subintervalo i, FEi = frecuencia esperada en el subintervalo i.

Una vez obtenido el estadístico de la muestra 𝜒02 se compara con el estadístico

teórico de la población 𝜒𝑎,𝑛−12 para rechazar o no la hipótesis que la secuencia de

números proviene de una distribución uniforme.

Donde:

𝜒𝛼,𝑛−12 , es el estadístico teórico chi-cuadrada que proviene de la tabla Chi

Cuadrada mostrada en el apéndice A, con un nivel de significancia α y n-1 grados

de libertad.

Page 4: 2.2.1 De uniformidad. (chi cuadrada^J kolmogorov - Smirnov)

Ejemplo Se desea realizar la prueba de chi-cuadrada a una secuencia de 100 números

pseudoaleatorios (Tabla 2.3) Solución

Paso 1.- Determinar N, y n. Se cuenta con 100 números por lo que N=100, y se determina arbitrariamente 5 subintervalos (n=5).

Paso 2.- Se calcula la frecuencia esperada y observada. FE = 100/5 = 20, por lo que la FE1= FE2= FE3= FE4=FE5=20.

Se contabiliza las frecuencias observadas en cada uno de los 5 subintervalos, y se obtiene:

Paso 3.- Calcular el estadístico muestral:

Paso 4.- Buscar el estadístico teórico de la tabla de chi-cuadrada en el apéndice A,

tomando como alfa=5%=0.05 y 5-1 grados de libertad se obtiene:

Paso 5.- Comparar los estadísticos para decidir si se rechaza o no la hipótesis.

Page 5: 2.2.1 De uniformidad. (chi cuadrada^J kolmogorov - Smirnov)

PRUEBA DE KOLMOGOROV-SMIRNOV

La prueba de Kolmogorov-Smirnov también conocida como la prueba K-S, trata de

determinar sí dos conjuntos de datos difieren significativamente. La prueba K-S tiene la ventaja de no asumir acerca de la distribución de los datos, aunque esto tiene un costo no documentado.

La prueba K-S se realiza basado en la hipótesis de que la distribución acumulada

de una variable aleatoria x es F(x). Para llevar a cabo esta hipótesis, se requiere de una muestra de tamaño n obtenida de una distribución continua F(x), para luego determinar la distribución acumulada de la muestra referida como Fn(x),

posteriormente se compara con la distribución acumulada hipotética F0(x). Si Fn(x) difiere de F0(x), entonces es evidencia de que Fn(x) no es igual a Fn(x).

La prueba K-S compara la función de distribución (probabilidad acumulada) teórica con la observada, y calcula un valor de discrepancia, representado habitualmente

como d, que corresponde a la discrepancia máxima en valor absoluto entre la distribución observada y la distribución teórica, proporcionando asimismo un valor

de probabilidad P, que corresponde, si estamos verificando un ajuste a la distribución normal, a la probabilidad de obtener una distribución que discrepe tanto como la observada si verdaderamente se hubiera obtenido una muestra aleatoria,

de tamaño n, de una distribución normal.

Si esa probabilidad es grande no habrá por tanto razones estadísticas para suponer que nuestros datos no proceden de una distribución, mientras que si es muy pequeña, no será aceptable suponer ese modelo probabilístico para los datos.

El procedimiento para realizar la prueba K-S es el siguiente:

1. Generar n números pseudoaletaorios uniformes 2. Ordenar dichos números en orden ascendente.

3. Calcular la distribución acumulada de los números generados con la

siguiente expresión: 𝐹𝑛(𝑥) =𝑖

𝑛

Donde i es la posición que ocupa el número Xi en el vector obtenido en el paso 2

4. Calcular el estadístico Kolmogorov-Smirnov del modo siguiente (ver figura 3.5)

𝐷𝑛 = 𝑚á𝑥 |𝐹𝑛(𝑋𝑖) − 𝑋𝑖| 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑎 𝑋𝑖

5. Si Dn < dα,n entonces no se puede rechazar la hipótesis de que los números generados provienen de una distribución uniforme.

Page 6: 2.2.1 De uniformidad. (chi cuadrada^J kolmogorov - Smirnov)

La distribución de Dn ha sido tabulada (ver tabla 3.5) como una función de n y α para cuando 𝐹𝑛(𝑥) = 𝐹0 (𝑥).

Page 7: 2.2.1 De uniformidad. (chi cuadrada^J kolmogorov - Smirnov)
Page 8: 2.2.1 De uniformidad. (chi cuadrada^J kolmogorov - Smirnov)

FUENTES BIBIOGRAFICAS

LIMUSA

NORIEGA EDITORES

https://www.academia.edu/7207310/Librodesimulacion