estadistica 8

13
Prueba de la Bondad del Ajuste Estadística CIMACO Dr. Carlos Cáceres Martínez, presentación preparada a partir del trabajo de la Ing. María Isabel Bautista y otros mas

Upload: carlos-caceres

Post on 29-Jun-2015

3.568 views

Category:

Education


0 download

DESCRIPTION

Octava presentación para el curso de estadística CIMACO, Chi Cuadrada

TRANSCRIPT

Page 1: Estadistica 8

Prueba de la Bondad del Ajuste

Estadística CIMACO

Dr. Carlos Cáceres Martínez, presentación preparada a partir del trabajo de la Ing. María Isabel Bautista y otros mas

Page 2: Estadistica 8

Prueba de la Bondad del Ajuste 2

Introducción Cuando se realizan investigaciones,

con frecuencia es importante obtener información a través de una muestra sobre la forma como se distribuyen los datos de una población.

Algunos estudios producen resultados sobre los que no podemos afirmar que se distribuyen Normalmente, es decir con forma acampanada concentrados sobre la media.

 En estos casos si nos ocupamos de su análisis tendremos que recurrir al empleo de técnicas de estadística denominadas no paramétricas que se utilizan ampliamente en las aplicaciones de las ciencias sociales, cuando no se puede asumir a priori que los datos de una muestra se ajusten a una distribución normal.

Ahora nos ocuparemos del problema de verificar

si de un conjunto de datos se puede afirmar que

proviene de una determinada distribución

¿ ?

Page 3: Estadistica 8

Prueba de la Bondad del Ajuste 3

Estadística No Paramétrica

La estadística no paramétrica es una rama de la estadística que estudia las pruebas y modelos estadísticos cuya distribución subyacente no se ajusta a los llamados criterios paramétricos.

Algunos experimentos producen respuestas que no son cuantificables, es decir generan mediciones que pueden ordenarse, pero la posición de la respuesta en una escala de medición es arbitraria.

Por ejemplo, suponga que desea evaluar

y comparar las habilidades de cinco profesores de educación física, o las características de atención de los alumnos de una clase…

Las pruebas no paramétricas no asumen ningún parámetro de distribución de las variables muestrales.

Las pruebas paramétricas asumen que los parámetros de la de la variable (media y varianza) tienen un tipo de

distribución normal

Las pruebas no paramétricas no asumen

ningún parámetro de distribución de las

variables muestrales.

Page 4: Estadistica 8

Prueba de la Bondad del Ajuste 4

Prueba de la Bondad del Ajuste

Para resolver este problema utilizaremos unas pruebas estadísticas que reciben el nombre general de "Pruebas de Bondad de Ajuste" y específicamente estudiaremos la prueba Chi - Cuadrado (ji dos) aunque existen otras pruebas :

binomial, de Anderson-Darling, de Fisher, etc.

Estas no serán objeto de estudio por ahora.

  El cálculo de estas pruebas, es sencillo,

desde el punto de vista manual y matemático, sin embargo y siguiendo con nuestra práctica, facilita el trabajo hacerlo con la hoja de calculo de Excel pues lo importante es descargarnos la tarea de cálculo matemático y dedicarnos a la interpretación de resultados y toma de decisiones.

PRUEBA DE FISHER

Es la prueba estadística de elección cuando la prueba de chi.cuadrado no puede ser empleada por tamaño muestral insuficiente.

Ejemplo para practicar, descárguelo

Page 5: Estadistica 8

Prueba de la Bondad del Ajuste 5

Prueba de Chi-cuadrado (2) 

La prueba de Chi- Cuadrado es considerada como una prueba no paramétrica que mide la discrepancia (bondad de ajuste) entre una distribución observada a partir de la muestra y otra teórica que se supone debe seguir esa muestra, indicando en qué medida las diferencias existentes entre ambas, de haberlas, se deben al azar en el contraste de hipótesis.

  Esta prueba se basa en la hipótesis nula (H0) de que no hay

diferencias significativas entre la distribución muestral y la teórica. Mientras que la hipótesis alternativa (H1) siempre se enuncia como que los datos no siguen la distribución supuesta.

H0: La distribución de la

probabilidad es NormalH0 : f( x, θ) = F0 (x, θ)

H1: La distribución de la

probabilidad NO es NormalH1 : f( x, θ) ≠ F0 (x, θ)

Page 6: Estadistica 8

Prueba de la Bondad del Ajuste 6

Naturaleza de la prueba de Chi-cuadrado

Clases Frecuencias observadas

(foi)

Frecuencias esperadas en

base a H0 (fei)

(foi – fei) 2

___________fei

1 fo1 fe1 (fo1 – fe1) 2 / fe1

2 fo2 fe2 (fo2 – fe2) 2 / fe2

3 fo3 fe3 (fo3 – fe3) 2 / fe3

: : : :

K fok fek (fok – fek) 2 / fek

Total n n X2 = Σ(foi – fei) 2 / fei

La estructura básica de la prueba para la bondad del ajuste se muestra en la siguiente tabla

Page 7: Estadistica 8

Prueba de la Bondad del Ajuste 7

Estadístico de Prueba El estadístico de prueba está definido como la

sumatoria de los residuos expresados en términos de las frecuencias esperadas para cada una de las clases:

2 = Σi=1 hasta K (foi - fei)2 / fei

donde:

• foi = Total de valores que caen en el intervalo i.

• fei = Número esperado de valores en el intervalo i.

• k = Número de intervalos de clase en que se distribuyen las observaciones.

Formulación de Hipótesis:• H0: f(x,q) = fo (x, q)

• H1: f(x,q) ≠ fo (x,q)

• Donde fo (x,q) es la distribución que se supone sigue la muestra aleatoria. La hipótesis alternativa siempre se enuncia como que los datos no siguen la distribución supuesta.

• Aceptar H0 si no existe diferencia significativa entre la distribución de la frecuencia observada en la muestra y la distribución teórica de la población.

La prueba se basa en qué tan buen ajuste se tiene entre la frecuencia de

ocurrencia de las observaciones en una

muestra observada y las frecuencias esperadas

que se obtienen a partir de la distribución hipotética.

Page 8: Estadistica 8

Prueba de la Bondad del Ajuste 8

Estadístico de Prueba Interpretación: cuanto mayor sea el valor de 2, menos

verosímil es que la hipótesis H0 sea correcta. De la misma forma, cuanto más se aproxima a cero el valor de Chi-cuadrado, más ajustadas están ambas distribuciones.

Si 2 =0 La frecuencia teórica y observada concuerdan exactamente. Si 2 >0 Mientras mayor es la diferencia mayor es la discrepancia.

Debemos comparar el valor calculado, con el observado para determinar si dicha variación es aleatoria.

En la práctica :Si Ho. = 0 no existe diferencia significativa entre la distribución de la frecuencia Observada y la distribución Teórica específicamente con los mismos parámetros.

Page 9: Estadistica 8

Prueba de la Bondad del Ajuste 9

Consideraciones; Para formular la hipótesis nula deberán tenerse en cuenta los siguientes aspectos:

Muestra

• La muestra es aleatoria simple de una población

• El tamaño de la muestra es razonablemente grande (n ≥ 20)

• Para esta prueba es necesario agrupar o distribuir las observaciones de la muestra en intervalos de clase, preferiblemente del mismo tamaño.

Naturaleza de los datos a analizar

• Se hacen conteos con números reales.

• Por ejemplo, si tratamos de investigar la distribución que siguen los errores de ortografía cometidos por los alumnos en un dictado, podríamos pensar en una distribución de Poisson, así que en principio no consideraríamos una distribución normal.

La prueba se basa en la comparación de las frecuencias observadas• Por lo tanto la forma que tome el

histograma de frecuencia es quizás la mejor indicación del tipo de distribución a considerar.

• Es decir, se quiere determinar si las frecuencias observadas en la muestra están lo suficientemente cerca de las frecuencias esperadas bajo la hipótesis nula.

Ordenar las observaciones

• El número de intervalos de clase debe ser por lo menos cinco.

• El número esperado de observaciones en cada intervalo debe ser mayor o igual a cinco; en caso contrario, deberían agruparse varios intervalos para lograr esto.

Page 10: Estadistica 8

Prueba de la Bondad del Ajuste 10

Ejemplo Se realizo una encuesta en la comunidad costera y se les pregunto a los

habitantes si estarían o no de acuerdo en sustituir por completo el régimen federal por el privado en la ZOFEMAT y se obtuvieron los siguientes datos:

Hombres Mujeres Descripción

30 10 Están de acuerdo

10 30 Neutrales

60 60 No están de acuerdo

Hombres (Esperado)

Mujeres (Esperado)

Descripción

20 20 Están de acuerdo

20 20 Neutrales

60 60 No están de acuerdo

Se desea comprobar si la probabilidad de que las

tendencias de la muestra sean iguales a las tendencias esperadas

en la población

H0: fo – fe= 0H1: fo – fe≠ 0

PRUEBA.CHI 4.53999E-05 Se aproxima a 0

Acepto H0, los datos de la muestra se comportan muy parecido a los

esperados PRUEBA.CHI se calcula con Excel:

devuelve el valor de la distribución chi cuadrado (χ2) para la estadística y los

grados de libertad apropiados.

Page 11: Estadistica 8

Prueba de la Bondad del Ajuste 11

Como se calcularon las frecuencias esperadas…

Observado

Hombres Mujeres Total

30 10 40

10 30 40

60 60 120

Total 100 100 200

Esperado

20* 20

20 20

60 60

* (Total Columnai) x (total reglónj)

Total de totales i,j

Page 13: Estadistica 8

Prueba de la Bondad del Ajuste 13

Lista de Referencias Sandoval, A. (s/f), Estadística II, Escuela de Ciencias

Contable Económico Administrativas de la Universidad Panamericana. Grupo Editorial Iberoamérica. México.

Mendenhall, Willian. (1978), Estadística para Administradores y Economía. Universidad Nacional Autónoma de México. Grupo Editorial Iberoamérica. México.

Navarro, A. (2000), Estadística Aplicada al área económica y empresarial. Ediciones de la Universidad Ezequiel Zamora. Colección Docencia Universitaria. Barinas, Venezuela

Tarjeta de referencia rápida: Funciones estadísticas de Excel

http://support.microsoft.com/kb/828296/es