procesos de decisión estadística

Upload: alberto-jv

Post on 07-Mar-2016

217 views

Category:

Documents


0 download

DESCRIPTION

fgh

TRANSCRIPT

PROCESOS DE DECISIN ESTADSTICA

PROCESOS DE DECISIN ESTADSTICAESTADSTICA INFERENCIALLa estadstica Inferencial, es el proceso por el cual se deducen (infieren) propiedades o caractersticas de una poblacin a partir de una muestra significativa. INTRODUCCIN.El propsito.La prueba de hiptesis ayuda a tomar una decisin acerca de una poblacin mediante el examen de una muestra de ella.

Definicin. Es una proposicin acerca de una o ms poblaciones.

Un mdico puede suponer que un medicamento ser eficaz en cierto porcentaje de casos que se utilice.Por medio de la prueba de hiptesis se determina si tales proposiciones son compatibles o no con los datos disponibles.TIPOS DE HIPTESISTIPOS DE HIPTESIS ESTADSTICAS

Estableciendo la hiptesis estadsticaPueden utilizar conectores matemticos como:=, ,

Ejemplo: Se puede concluir que la media de los pesos de los nios en el grupo 2A es diferente a 40 kgs.?

Ho:=40kgs

HA:40kgsSe desea saber si puede concluirse que la media de la produccin de trigo para este ao es mayor de 4000 tons.Ho:4000tonsHA:>4000tons

Reglas para decidir qu proposicin se utiliza como hiptesis nula y cul como alternativa.

Se toma como HA a la conclusin a la que se desea o espera llegar como resultado de la prueba.La Ho debe contener una proposicin de igualdad (=, , ) y es la que debe ser comprobadaAmbos tipos de hiptesis son complementarias.

Nivel de significancia.Es el grado de confianza calculado de que un procedimiento estadstico realizado con los datos de la muestra, producir un resultado correcto para la poblacin muestreada.

Propsito: proporcionar una estimacin intervalar del valor de un parmetro desconocido de la poblacin y expresar con precisin la confianza que tenemos de que el parmetro caiga dentro de ese intervalo.Este intervalo de valores calcula el nivel de error esperado: que es la diferencia entre el nivel de confianza determinado y la confianza perfecta del 100%.

Intervalo de confianza.Objetivo: consiste en estimar un parmetro de poblacin dentro de un margen especfico o intervalo de valores.

Se define por el LIC que es el lmite inferior de confianza y el LSC lmite superior de confianza.

Cinco pasos para calcular un intervalo de confianza de una media poblacional xEnuncie la pregunta de investigacin, identifique el nivel de medicin de la variable, liste las especificaciones y elabore un diagrama conceptual de la poblacin y muestra de inters.Calcule el error estndar y el trmino de error.Calcule el Lmite Inferior de Confianza (LIC) y el Lmite Superior de Confianza (LSC) del intervalo de confianza.Proporcione una interpretacin en lenguaje cotidiano.Proporcione una interpretacin estadstica que ilustre la nocin de confianza en el procedimientoEjemplo.Se estudia la estructura salarial de una empresa que da trabajo a varios miles de ensambladores de computadoras. Se requiere obtener una idea general del salario medio por hora de esa poblacin. Se seleccionan aleatoriamente 130 expedientes de personal para revisar los salarios/hora. Se encuentra una media de $8 y una desviacin estndar de $1.70. Calcule el intervalo de confianza al 95% para el salario medio por hora de esos trabajadores.Paso 1. Pregunta de investigacin: dentro de un margen especfico de cantidades en dlares, Cul es el parmetro, x, el salario medio por hora de la poblacin de ensambladores?Especificaciones: X = salario por hora, variable de tipo intervalo/razn.Poblacin de inters: ensambladores de computadoras de la planta.Estadsticos de la muestra:

Poblacional Paso 2.Calculo del error estndar, puntuacin crtica y el trmino de error.Error estndar:

Puntuacin critica:Tomando la tabla de puntuaciones z (dado que son mas de 30 valores) se tiene que la puntuacin critica con 95% 0.95 de nivel de confianza, implica un error esperado de 5% 0.05, que al implicar LIC y LSC se consideran ambas colas del grfico de distribucin de frecuencias. Entonces, ese 0.05 se REPARTE teniendo 0.025 junto a 0.95 se tiene 0.975. Al observar la tabla se tiene un valor crtico de 1.96Trmino de error

Lmite de la desviacin 13Paso 3Clculo de LIC y LSC.Para ello se requiere aplicar la siguiente frmula:

Aplicando valores:

Paso 4Interpretacin en lenguaje cotidiano:

Estoy 95 por ciento seguro de que el salario medio por hora de los ensambladores de computadoras de la planta est entre $7.71 y $8.29

Paso 5.Interpretacin estadstica que ilustra la nocin de confianza:Si el mismo muestreo y procedimientos estadsticos se realizan 100 veces, el parmetro verdadero poblacional x se incluir 95 veces en los intervalos seleccionados, y 5 veces no suceder as. De modo que, yo tengo 95% de confianza de que este nico intervalo de confianza que calcul incluye el parmetro verdaderoTamao de la muestra. Para poblacin finita cuando los datos son cualitativos, es decir para anlisis de fenmenos sociales o cuando se utilizan escalas nominales para verificar la ausencia o presencia del fenmeno a estudiar.Para un intervalo de confianza de una proporcin poblacional (variable tipo nominal/ordinal), se utiliza la siguiente frmula:

Donde:n = tamao de la muestra requerido.Zx= puntuacin z crtica correspondiente al nivel de confianza en tablas.Px= p(de la categora de xito en la muestra)Qx= p(de la categora de fracaso en la muestra)Trmino de error: precisin deseada en los resultados que se van a reportar.

P x Prob. De xitoQx Prob. De fracaso Ejemplo.Si Usted dirige un sondeo para determinar el porcentaje de estudiantes registrados que actualmente apoyan al candidato A para la sociedad de alumnos. Los resultados se informarn con 95% de confianza y un trmino de error de 2%. Qu tamao de muestra debe obtener?Consejo: Px se desconoce debido a que no se han recabado muestras. No se puede hablar acerca de la probabilidad de que el valor caiga en zona de aceptacin. Se recomienda asignar 0.5 (50%).Por lo anterior, como Qx es la probabilidad de lo contrario, tambin toma el valor de 0.5 (50%)Aplicando la frmula para proporciones.

Se requieren de 2401 estudiantes para cumplir con estas condiciones.Tamao de la muestra.Para un intervalo de confianza de una media poblacional (variable tipo intervalo/razn), se utiliza la siguiente frmula:

Donde:n= tamao de la muestra requerido.Zx= puntuacin z crtica correspondiente al nivel de confianza en tablas.Sx= desviacin estndar de una muestra para la variable X.Trmino de error = precisin deseada en los resultados que se van a reportar

Ejemplo.Se va a dirigir una investigacin para determinar la edad media de las docentes jubilados de una organizacin de cuidado de salud (OCS). Desea informar los resultados con 99% de confianza con un trmino de error de mas menos 3 aos. Qu tamao de muestra necesitar? La desviacin estndar de las edades de la poblacin general de la ciudad donde la OCS se localiza es de 8.6 aos. Utilice esto como una estimacin para calcular el tamao necesario de la muestra.Aplicando la frmula para media.

Se requieren de aproximadamente 56 pacientes.Tamao de la muestra para la poblacin finita y conocidaEjemplo:Si contamos con una poblacin estudiantil de 600 alumnos, cul es la cantidad requerida como muestra para inferir sobre dicha poblacin?Si se sabe de antemano, que existe una probabilidad de xito de 70%, con un 95% de confianza y un error que se prev cometer de 10%.

Desarrollo:Estadstico de prueba.Se aplica a partir de los datos de la muestra. Sirve como la gua para tomar decisiones de aceptacin o rechazo de la hiptesis nula.

Entre los estadsticos de prueba se tienen:El estadstico t para muestras < 30El estadstico z para muestras 30

Tabla de la Distribucin Normal (una cola)

Tabla de valores crticos para tSignificancia de una cola

Significancia en dos colas. Cuando se est interesado en los valores extremos en ambos lados la curva de distribucin.

Prctica.Practique el arte de identificar hiptesis estadsticas y concebir distribuciones muestrales. En trminos generales, prediga que resultados de la muestra espera que ocurran con el muestreo repetido, cuando las siguientes hiptesis estadsticas (nulas) son verdaderas.Hiptesis estadstica: La mitad del pblico televidente mira un noticiero nocturno.Hiptesis estadstica (H.E.): La velocidad media de los automviles en la ltima recta de la carrera interestatal es de 80 millas por hora.H.E.: Cuarenta por ciento de los estudiantes del ltimo ao de preparatoria han consumido alcohol ilegalmente.H.E.: La edad media de los vicepresidentes corporativos es de 49 aos.

Hiptesis estadstica: La mitad del pblico televidente mira un noticiero nocturno.Prediccin: al extraer repetidamente muestras de la opinin publica, las medias muestrales de quienes ven televisin por la noche indicarn que 0.50 de ellos mira noticias.

Hiptesis estadstica: La velocidad media de los automviles en la ltima recta de la carrera interestatal es de 80 millas por hora.Prediccin: al extraer repetidamente muestras de participantes de la carrera interestatal, las medias muestrales de la velocidad media de los participantes ser de 80 millas por hora.

H.E.: Cuarenta por ciento de los estudiantes del ltimo ao de preparatoria han consumido alcohol ilegalmente.Prediccin: al extraer muestras repetidas de estudiantes del ltimo ao de preparatoria, la media muestral indicar que 40% de ellos ha consumido alcohol ilegalmente.H.E.: La edad media de los vicepresidentes corporativos es de 49 aos.Prediccin: al extraer muestras repetidas de vicepresidentes corporativos, la media muestral de las edades ser de 45 aos.

Prctica.Una pregunta de investigacin constituye una meta del proyecto, que puede declararse en trminos de una hiptesis. Practique el arte de determinar si cada una de las siguientes preguntas de investigacin constituirn la hiptesis nula (estadstica) o la hiptesis alternativa. Argumente su respuesta.En promedio, los conductores exceden el lmite de velocidad de 70 millas por hora en la ltima recta de la carrera interestatal?Usando una muestra de 30 de los 125 jugadores, el peso promedio del equipo de futbol de este ao es igual al del ao pasado, que fue de 224 libras?Este casino emplea dados cargados? AlternativaEn promedio ocurren mas de seis actos violentos por semana en cada serie de televisin dramtica en horario preferente. Alternativa, 1 cola En una apuesta, Alberto lanz 10 monedas y en todas obtuvo cara, sus monedas tienen doble cara? Alternativa hay sesgo (1 cola)es verdadero el estereotipo de que mas del 90% de las personas sin hogar son adictas al alcohol o a las drogas?Alternativa. De 1 cola (90%)Prctica.La direccin y el signo de la prueba de hiptesis se especifican en la hiptesis alternativa. Decida si las siguientes hiptesis alternativas son de una cola en direccin negativa, de una cola en direccin positiva o des dos colas no direccional.Ha: Ms del 50% de las victimas de cncer pulmonar son o han sido fumadores. Alternativa de 1 cola Ha: El promedio de estudiantes hombres y mujeres no es el mismo. Alternativa de dos colas Ha: En las escuelas del DF, menos del 60% de los graduados de preparatoria siguen sus estudios universitarios.Alternativa de 1 cola Pasos para realizar una prueba de hiptesis.

Ejemplo. Prueba para una media poblacionalUn gimnasio Sparta en Tijuana, invita al pblico a tomar el programa indicando que con ellos, se logra reducir el peso en mas de 5.3 kilos. Una muestra aleatoria de 42 personas, revela que el promedio de reduccin de peso es de 4.6 kilos, con una desviacin estndar de 2.1 kilos. Tomando un nivel de confianza del 99%, es fiable la publicidad del gimnasio Sparta?Datos. = 5.3 kilos n = 42

2.- Se selecciona el nivel de significancia.El problema mismo, lo propuso. El nivel es del 99% o lo que es igual, hay 1% de cometer un error tipo I (recurdese que implica rechazar Ho cuando es verdadera)

Como se busca probar que el peso es menor al promedio, esto implica hacer la prueba de UNA COLA por el lado izquierdo.

3.- Se calcula el estadstico de prueba.

Sustituyendo valores

Resto de los gym El de Sparta Desviacin 4.- Se formula una regla de decisin

Se acepta Ho de lo contrario se rechaza aceptando la alternativa.

5.- Tomar una decisin

Como:

Cae en la regin de aceptacin, NO se rechaza la hiptesis nula.

Conclusin: Los datos ofertados por el gimnasio Sparta NO se pueden considerar como correctos y fiables al 99% de confianza.Ejemplo. Para una proporcin poblacional. Al hacer un estudio estadstico con fines de mercado, el corporativo Grupo Caliente establece que el 75% de fanticos al equipo de futbol Xolos, NO apoya la idea de que se vendan las acciones del Club a los fanticos en general. Una muestra aleatoria de 600 aficionados, revel que 500 de ellos estn de acuerdo con la propuesta. A un nivel de significancia del 5%, tendrn razn los fanticos encuestados?Datos.

1.- Formular la hiptesis. No existe diferencia significativa entre lo que dicen las estadsticas y la proporcin de la muestra.

La proporcin de la muestra es mayor.

En lenguaje estadstico:

2.- Seleccionar un nivel de significancia.

3.- Calcular el estadstico de prueba.En este caso, como se habla de proporciones. Se utilizar una prueba Z de proporciones.Recurdese que la muestra es mayor de 30, por ello el uso de Z.

sustituyendo

4.- Formular una regla de decisin.

Se acepta Ho, de lo contrario se rechaza y se acepta H1

5.- Tomar una decisin.

Como el Z calculado es mayor que Z de tabla, se CAE EN LA REGIN DE RECHAZO de HoConclusinEstadsticamente, le asiste la razn a los encuestados al creer que se deben vender las acciones del Club Tijuana a los fanticos, puesto que mas del 75% de ellos as lo considera.Ejemplo. Con muestra menor que 30 El gerente de ventas de una empresa editora de libros, afirma que cada uno de sus representantes realiza 40 visitas por semana a profesores. Varios vendedores dicen que esa estimacin es muy baja. Para investigar lo anterior, una muestra aleatoria de 28 representantes de ventas revel que el nmero medio de visitas realizadas la semana pasada fue de 42. Se calcul que la desviacin estndar de la muestra fue de 2.1 visitas. Al nivel de significancia de 0.05, se puede concluir que el nmero medio de visitas realizadas por vendedor y por semana es mayor que 40?Se formula la hiptesis.Se formula la hiptesis:

Ho=No hay diferencia significativa entre el promedio anunciado por el gerente de la editorial y el promedio de la muestra.

H1=El promedio anunciado por los vendedores es mayor.

En nmeros:

Ho: = 40 visitas

H1: > 40 visitas

2.- Seleccionar el nivel de significancia.

En los estadsticos t, se consideran los grados de libertad por la pequeez de muestra. Para disminuir posibles sesgos, se utiliza gl= n 1, es decir, 28-1=273.- Calcular estadstico de prueba.

sustituyendo4.944.- Formular una regla de decisin. Se compara el t de tablas con el t calculado.

Se tiene5.04 > 1.7035.- Se toma una decisin.Dado que t calculado es mayor que t de tablas, se tienen elementos para rechazar Ho y aceptar H1

Se acepta la Ho y se rechaza la H156Conclusin.Dado que el estadstico de prueba SUPER al establecido en tablas a un nivel de significancia del 95%. Se puede expresar que los empleados tienen razn al afirmar que lo dicho por el gerente no es cierto, ya que el promedio de visitas a profesores es superior a 40 a la semana.Prctica.Pregunta de investigacin: Los atletas tiene menos inteligencia que los estudiantes en general?El estereotipo tonto est sustentado por hechos?DatosX= puntuacin de coeficiente intelectual CIn = 150 atletasPrueba de medias con muestra nica.Se trata de probar que los estudiantes que hacen deporte igualan un CI de 100 que es el promedio aceptado para estudiantes de preparatoria. Al 95% de confianza