grupo 46 trabajo colaborativo 2

20
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA Escuela de ciencias básicas tecnologías e Ingeniería Inferencia Estadística 2011 Intersemestral TRABAJO COLABORATIVO No. 2 INFERENCIA ESTADISTICA Presentado por Grupo 46: HUMBERTO PERDOMO TRUJILLO COD 83237201 MILTON FERNEY PARRA MEDINA COD:83169930 MANUEL ALFONSO RINCON MENDEZ COD 83232445 Presentado a: Prof. Danis Brito UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD - www.unad.edu.co 1/20

Upload: william-arias

Post on 30-Sep-2015

17 views

Category:

Documents


3 download

DESCRIPTION

INFERENCIA ESTADISTICA

TRANSCRIPT

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

Escuela de ciencias bsicas tecnologas e Ingeniera

Inferencia Estadstica2011 Intersemestral

TRABAJO COLABORATIVO No. 2

INFERENCIA ESTADISTICA

Presentado por Grupo 46:

HUMBERTO PERDOMO TRUJILLO

COD 83237201

MILTON FERNEY PARRA MEDINA

COD:83169930MANUEL ALFONSO RINCON MENDEZ

COD 83232445

Presentado a:Prof. Danis Brito

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

UNAD 2011

INTRODUCCION

La mayora de las decisiones tomadas por los seres humanos en muchas reas de su desempeo se hacen con base en creencias que se tienen en relacin a un concepto de realidad. Cada una de estas creencias o supuestos origina una hiptesis, que es una proposicin avanzada con posibilidad de ser verdadera. Surge entonces la necesidad de que la decisin sea tomada con base en la prueba de dicha hiptesis, mediante un mtodo sistemtico de evaluar creencias sobre la realidad que requiere de la confrontacin de esa creencia con evidencia y as decidir si es aceptable o por el contrario debe descartarse.

Este marco conceptual servir no solo para la toma de decisiones, sino tambin para extraer conclusiones sobre las caractersticas desconocidas de una poblacin cuando se desea conocer la homogeneidad que existe entre varias medias mustrales, midiendo la variabilidad entre estas, tcnica que se conoce como anlisis de varianza. De esta manera se determina cules son las variables independientes de importancia en un estudio, y en qu forma interactan y afectan la respuesta, de manera que sirven para determinar si se rechaza una hiptesis o no.

El propsito de este trabajo es que como estudiantes nos apropiemos e interactuemos con cada uno de los conceptos de tal forma, que los podamos poner en prctica para un mejor desenvolvimiento en problemas en los que se desee comprobar la efectividad de estndares preestablecidos, como lo es el caso de la prueba de hiptesis que nos permite comprobar con mayor certeza el grado de acierto en la fijacin de estas dificultades, por ende la prueba de hiptesis, anlisis de varianza y estadstica no paramtrica nos servir de apoyo para el anlisis y estudio de la presente unidad.Esta actividad se realiz con la masiva participacin de los integrantes de este grupo colaborativo, mostrando dinamismo y armona.

OBJETIVOS

OBJETIVO GENERAL

Adquirir y entender los conocimientos bsicos de la Unidad 2 que nos servirn de base para solucionar problemas relacionados con esta rea en el campo profesional y personal.

OBJETIVOS ESPECIFICOS

Conocer las herramientas provenientes de la Inferencia Estadstica, con la intencin de utilizarlas en campos de la ciencia, la tecnologa y en nuestra vida cotidiana.

Aprender a trabajar en grupo, aportando ideas significativas para la solucin de problemas asignados, y posteriormente debatir con los compaeros para lograr una respuesta bien estructurada.

Aprender conceptos bsicos y tiles la Inferencia Estadstica, y con ello alcanzar con los objeticos del curso y poder aplicarlos en nuestros campos profesional, ya que esta herramienta matemtica es muy verstil y tiene mucha aplicabilidad.

Trabajar en equipo, para dar los puntos de vistas de cada integrante del grupo y luego debatir la solucin de cada problema.

Aplicar los fundamentos tericos en los que se basa la prueba de hiptesis estadstica, considerada como alternativa para toma de decisiones. Conocer las diversas tcnicas que ofrece la inferencia estadstica de manera, que sean herramientas poderosas en la evaluacin, ratificacin y extraccin de conclusiones sobre caractersticas de una poblacin partiendo del buen trato estadstico que sobre una muestra de la misma se haga.

CUERPO DEL TRABAJO

1. Establezca la diferencia entre: Nivel de significacin y potencia de una prueba; pruebas paramtricas y pruebas No paramtricas:

NIVEL DE SIGNIFICACIONPOTENCIA DE UNA PRUEBA

Es un resultado se denomina estadsticamente significativo cuando no es probable que haya sido debido al azar. Una "diferencia estadsticamente significativa" solamente significa que hay evidencias estadsticas de que hay una diferencia; no significa que la diferencia sea grande, importante, o significativa en el sentido estricto de la palabra.Es la probabilidad de rechazar la hiptesis nula cuando de hecho esta es falsa y debera ser rechazada. Una manera en que podemos controlar la probabilidad de cometer un error del tipo II en un estudio, consiste en aumentar el tamao de la muestra. Tamaos ms grandes de muestra, nos permitirn detectar diferencias incluso muy pequeas entre las estadsticas de muestra y los parmetros de la poblacin.

2. Para tomar la decisin en un contraste de hiptesis se puede comparar el P-Valor con el nivel de significacin. Explique cules son las condiciones en trminos de magnitud de estos factores para rechazar una hiptesis unilateral derecha o unilateral izquierda.

Se debe realizar un procedimiento de contraste por medio del cual se toma una decisin basada en la muestra aleatoria seleccionada de la poblacin en estudio. Para llevar a cabo este procedimiento es necesario seleccionar un estadstico de contraste, calcularlo con base en la muestra y luego tomar la decisin de rechazar o no H0, dependiendo de si este estadstico es o no consistente con H0. Es decir, si el valor calculado del estadstico es muy diferente del valor supuesto en H0, suponiendo que sta es cierta, entonces se rechaza H0. Sin embargo, si el valor calculado del estadstico de contraste es consistente con lo supuesto en H0, entonces no hay razn suficiente para rechazar H0 en favor de la Ha. En resumen, el estadstico de contraste es una variable aleatoria cuya distribucin se conoce, en el supuesto de que H0 es verdadera y sirve para tomar la decisin de rechazar o no H0.

3. Qu significan el error tipo I y el error tipo II. Explique su interpretacin con un ejemplo:

Error Tipo I: Es el error que se comete cuando el investigador no acepta la hiptesis nula (Ho) siendo sta verdadera en la poblacin.

Ejemplo: Cuando un investigador necesita saber las causas por las cuales una poblacin determinada presenta altos niveles de desercin escolar. Plantea como hiptesis nula que se debe a causas culturales; sin embargo, este mismo investigador rechaza su propia hiptesis; sin embargo, se comprueba que era cierta.

4. Explique cules son los supuestos de homogeneidad, homocedasticidad, independencia y Normalidad, que deben cumplirse para validar un anlisis de varianzas.

La nocin de homogeneidad define a la igualdad mayor o menor de los valores de una variable o de una combinacin de caractersticas en un conjunto geogrfico. Los parmetros de dispersin estadstica, en particular la varianza, miden su inversa, la heterogeneidad.

Dos variables estadsticas son estadsticamente independientes cuando el comportamiento estadstico de una de ellas no se ve afectado por los valores que toma la otra; esto es cuando las relativas de las distribuciones condicionadas no se ven afectadas por la condicin, y coinciden en todos los casos con las frecuencias relativas marginales.

La homocedasticidad se presenta en un modelo cuando los errores presentan en todas las observaciones de la variable endgena la misma varianza. Dado que hablamos de varianza, la homocedasticidad es un concepto estadstico.

Un modelo estadstico relaciona el valor de una variable a predecir con el de otras. Si el modelo es insesgado, el valor predicho es la media de la variable a predecir. En cualquier caso, el modelo nos da una idea del valor que tomar la variable a predecir.

La normalidad es una de las distribuciones de muestreo ms utilizadas. Caracterizada por una media poblacional y una varianza poblacional 2. Estos parmetros se aproximan por los estadsticos y S2. Muchos datos en realidad siguen una distribucin normal y los que no, si se tienen suficientes datos, se pueden agregar para que los datos agregados sigan una distribucin aproximadamente normal (Teorema del

Lmite Central)

5. Comprueben a partir de dos muestras independientes de igual tamao de hombres y mujeres, la opinin de acuerdo o desacuerdo con algn tema de su inters, a travs del contraste de una hiptesis, en la que se establezca si existen diferencias de opinin entre los hombres y mujeres sobre el tema de inters consultado. Interprete los resultados a que quiere llegar este caso. Para dar respuesta a este caso utilice los pasos para el contraste de una hiptesis.

CONTRASTE DE HIPOTESIS EJEMPLO.

1. Establecimiento de las hiptesis nula y alternativa.

- La hiptesis nula H0 ser aceptada si los datos de la muestra no evidencian que es falsa.

- La hiptesis alternativa H1 es la afirmacin que se acepta si se rechaza la hiptesis nula.Hiptesis nula: Las mujeres hablan ms que los hombres.

Hiptesis alterna: Los dos gneros hablan por igual.

2. Determinacin del criterio de contraste.

Se debe especificar el nivel de significacin, el tipo de distribucin y los valores crticos. Al tomar una decisin respecto a una hiptesis, existen las cuatro situaciones posibles que se indicaron en la tabla anterior.El criterio de contraste son la cantidad de palabras promedio que cada uno de los gneros utiliza diariamente. Que ambos gneros hablan en promedio 16.000 palabras por da mientras est despierto. Segn estudio realizado en EEUU y Mexico.

3. Clculo del estadstico de prueba.

El estadstico de prueba es un valor obtenido a partir de la informacin de la muestra para compararlo con el criterio de contraste y rechazar o aceptar la hiptesis. Depende de la distribucin que se utilice, de modo que los ms utilizados en el mbito de laboratorios para la media y la desviacin estndar de la muestra son los siguientes:Cantidad de palabras por minuto en una muestra de 400 personas durante todo un da, dando como resultado:

16.215 para mujeres

15.669 para hombres

Siendo resultados estadsticamente iguales

Toma de la decisin y conclusiones de tipo estadstico.

Una regla de decisin supone establecer las condiciones sobre las cuales la hiptesis nula es rechazada o no rechazada.

- Si el estadstico de prueba queda dentro de la zona crtica, la hiptesis nula deber ser aceptada.

- Si el estadstico de prueba queda fuera de la zona crtica, la hiptesis nula deber ser rechazada.Se rechaza la hiptesis nula, debido a los resultados estadsticos del estudio. Se acepta la hiptesis alterna, ya que los resultados la corroboran.

6. Establezca las consideraciones que deben hacerse para seleccionar entre un modelo paramtrico o sus correspondiente no paramtrico.

Una hiptesis estadstica es una asuncin relativa a una o varias poblaciones, que puede ser cierta o no. Las hiptesis estadsticas se pueden contrastar con la informacin extrada de las muestras y tanto si se aceptan como si se rechazan se puede cometer un error. La hiptesis formulada con intencin de rechazarla se llama hiptesis nula y se representa por H0. Rechazar H0 implica aceptar una hiptesis alternativa (H1). La situacin se puede esquematizar: H0 cierta H0 rechazada H0 no rechazada.

Ejemplo

Se toman datos sobre un nuevo parque de diversiones, calificando el parque de diversiones de 1 a 10, donde 1 es muy malo y 10 es muy bueno.

Tema encuestado:

Calificacin del parque de diversiones

Respuestas posibles:Valores entre 1 y 10

Cantidad de hombres:20

Cantidad de mujeres:20

MujeresCalificacinHombresCalificacin

1813

2929

37310

41046

5758

6669

7577

8988

9894

108106

119119

125128

136139

145149

156158

166168

178178

186188

197198

206207

Se desea probar la diferencia de opinin entre hombres y mujeres, con un nivel de significancia del 0.05

Definiendo las medias poblacionales:

(1 = 7.05

(2 = 7.6

Desarrollo

Paso 1:

Se plantean las hiptesis Nula H0 y la Alternativa H1

H0: (1 = (2 Las dos medias son iguales

H1: (1 (2 Las dos medias son diferentes

Paso 2:

Se elige el nivel de significancia, que en este caso se ha planteado en 0.05 y se utiliza la distribucin t student ya que las muestras son menores que 30.

Los grados de libertad para este caso son:

20 + 20 2 = 38

Ahora, como la hiptesis alternativa H1 est planteada como diferente, la prueba es de dos colas.

Paso 3:

Como son dos muestras se debe calcular las medias y las varianzas de cada grupo:

HombresMujeres

7.67.05

n2020

S1.731.50

Para el clculo del valor estadstico se usa la siguiente frmula:

El valor estadstico aplicando la frmula es:

Paso 4:

Debido a que el nivel de significancia es de 0.05 y dado que la hiptesis alternativa planteada no seala una direccin, se debe trabajar con una prueba de dos colas.

La grfica entonces es:

Paso 5:

Despus de hacer el respectivo anlisis se decide no rechazar la hiptesis nula (H0) dado que el valor del estadstico de prueba 1.07 y se ha ubicado en la zona de aceptacin de dicha hiptesis; se concluye entonces que no existe diferencia en la opinin (de acuerdo o desacuerdo) entre los 20 hombres y las 20 mujeres con relacin al gusto por del parque de diversiones, con un nivel de significancia del 5%.

7. Una de las opciones que tiene la estadstica para realizar inferencia sobre los parmetros de una poblacin es la prueba de hiptesis. Explique las ventajas y desventajas con respecto al otro mtodo de estimacin.

VENTAJASDESVENTAJAS

No incorpora los supuesto restrictivos de las pruebas paramtricas.El uso de pruebas no paramtricas con datos que pueden manejarse con pruebas paramtricas produce un desperdicio de informacin.

No requiere que la poblacin subyacente este normalmente distribuido.La aplicacin de algunas de las pruebas no paramtricas puede ser laboriosa para muestras grandes.

El uso de rangos permite menos errores.

8. Los dos mtodos No paramrtico para realizar una bondad de ajuste de los datos de una variable con respecto a una distribucin de probabilidad son: El de Chi-cuadrado y el de Kolmogorov - Smirnov . Explique en qu condiciones debe usarse cada uno de ellos.

La prueba Chi-cuadrado es otro tipo de prueba que se utiliza para contrastar hiptesis, usada en aquellos casos en que se asume que la distribucin de datos no se ajusta a la distribucin normal, y por lo tanto no es significativo usar t de Student. Se asume que cuanto menor sea el valor de chi-cuadrado calculado ms se aproximan entre si los comportamientos de las dos muestras (cuando son dos), o mejor se aproxima el comportamiento de una sola muestra al valor hipottico de la media asumido para la poblacin. La prueba Kolmogorov - Smirnov debe usarse cuando la variable de anlisis es continua. Sin embargo, si la prueba se usa cuando la distribucin de la poblacin no es continua, el error que ocurre en la probabilidad resultante est en la direccin segura. Es decir, cuando se rechaza la hiptesis nula, tenemos verdadera confianza en la decisin. Tambin puede aplicarse para tamaos demuestra pequeos, lo que no sucede con la chi cuadrado.

9. El anlisis de varianza es una tcnica estadstica utilizada para medir el efecto que tiene cada uno de los niveles en que se clasifica una variable sobre otra variable que representa las repuestas a las mediciones realizadas una experimentacin. Explique las condiciones que se deben imponer a las dos variables y los supuestos que deben cumplirse para que tenga validez el uso de esta tcnica.

Para utilizar el ANOVA de forma satisfactoria deben cumplirse tres tipos de hiptesis, aunque se aceptan ligeras desviaciones de las condiciones ideales:1. Cada conjunto de datos debe ser independiente del resto. 2. Los resultados obtenidos para cada conjunto deben seguir una distribucin normal. 3. Las varianzas de cada conjunto de datos no deben diferir de forma significativa.

Cuando se utiliza la tcnica anova se deben cumplir los siguientes supuestos: 1. Las personas de los diversos subgrupos deben seleccionarse mediante el muestreo aleatorio, a partir de poblaciones normalmente distribuidas. 2. La varianza de los subgrupos debe ser homognea. 3. Las muestras que constituyen los grupos deben ser independientes. Amenos de que las muestras sean independientes, y que por lo tanto, generen estimaciones de varianza independientes, la razn de las varianzas inter e intra no adoptar la distribucin F.

10. Existen dos tipos de modelo de anlisis de varianza: de efectos fijos y de efectos aleatorios. Explique el significado cada uno de ellos en un anlisis de varianza.

Anlisis de varianza de efectos fijosAnlisis de varianza de efectos aleatorios

El modelo de efectos fijos de anlisis de la varianza se aplica a situaciones en las que el experimentador ha sometido al grupo o material analizado a varios factores, cada uno de los cuales le afecta slo a la media, permaneciendo la "variable respuesta" con una distribucin normal.

Este modelo se supone cuando el investigador se interesa nicamente por los niveles del factor presentes en el experimento, por lo que cualquier variacin observada en las puntuaciones se deber al error experimental.Los modelos de efectos aleatorios se usan para describir situaciones en que ocurren diferencias incomparables en el material o grupo experimental. El ejemplo ms simple es el de estimar la media desconocida de una poblacin compuesta de individuos diferentes y en el que esas diferencias se mezclan con los errores del instrumento de medicin.

Este modelo se supone cuando el investigador est interesado en una poblacin de niveles, tericamente infinitos, del factor de estudio, de los que nicamente una muestra al azar (t niveles) estn presentes en el experimento.

CONCLUSIONES

Del anterior trabajo se puede concluir no solo la importancia que tiene la inferencia estadstica hoy da sino tambin como podemos llegar a aplicar dichos conceptos en las diferentes ciencias del saber.

Despus de haber realizado a plenitud este trabajo, se ha visto ms detalladamente y con ms exactitud las pruebas de hiptesis, anlisis de varianza y estadstica no paramtrica; estos temas estn relacionados en cierta forma ya que para dar solucin a algunos de los problemas planteados se necesita de la unin de todos los conceptos adquiridos en el curso.

Se debe entender que el desarrollo dinmico de estos ejercicios entre los compaeros del grupo es una gran herramienta y oportunidad de aprendizaje e intercambio de opiniones.

El trabajo realizado permiti poder interpretar y aplicar los conceptos adquiridos en el transcurso del curso, facilitando el entendimiento y desarrollo de los ejercicios propuestos.

REFERENCIAS Rondn Duran, Jorge Eliecer (2010). Mdulo de Calculo Diferencial. Segunda Edicin, Bogot Colombia. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA.

Pruebas no paramtricas. Recuperado el da 10 de Julio de 2011 de:

http://www.slideshare.net/freddygarcia/pruebas-no-parametricas-presentation Errores de Tipo I y de Tipo II. Recuperado el da 13 de Julio de 2011 de:

http://es.wikipedia.org/wiki/Errores_de_tipo_I_y_de_tipo_II Pruebas paramtricas. Recuperado el da 15 de Julio de 2011 de:

http://members.fortunecity.com/bucker4/estadistica/paramdesc.htm El anlisis de la varianza. Recuperado el da 19 de Julio de 2011 de:

http://www.quimica.urv.es/quimio/general/anovacast.pdf Kelsey IL, Thompson WD, Evans A. Methods in observational epidemiology. New York. Oxford University Press 1986. Anderson D. Sweeney D. Williams T. Estadstica para administracin y economa, International Thomson Editores. Mxico. 1999.

Montgomery D.Runger G. Probabilidad y estadstica aplicadas a la ingeniera, McGraw-Hill. Mxico 1996.

Criterios para seleccionar una prueba estadstica. Recuperado el da 12 de Julio de 2011 de:

http://members.fortunecity.com/bucker4/estadistica/criteriosselecprueb.htm.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD - www.unad.edu.co 1/13