inferencia estadística

15
Dirección General de Educación Superior Tecnología Instituto tecnológico de Lerma Alumno: Daniel Arsenio Caamal Bojórquez Profesor: Cancino Córdova Luis Alberto 2 do Semestre Carrera: Ing. Mecatrónica Estadística y control de calidad Unidad 2 Inferencia estadística

Upload: daniel-cb

Post on 24-Nov-2015

32 views

Category:

Documents


1 download

TRANSCRIPT

Direccin General de Educacin Superior TecnologaInstituto tecnolgico de Lerma

Alumno:Daniel Arsenio Caamal Bojrquez

Profesor:Cancino Crdova Luis Alberto

2do Semestre Carrera: Ing. Mecatrnica

Estadstica y control de calidad

Unidad 2Inferencia estadsticaResumenContenidoInferencia estadstica3Concepto3Estimacin4Prueba de hiptesis5Mtodo clsico de estimacin puntual8Estimador insesgado9Intervalos de confianza10

Inferencia estadsticaConcepto Es el procedimiento que permite realizar afirmaciones de naturaleza probabilstica respecto a una poblacin, en base a los resultados obtenidos en una muestra seleccionada de esa poblacin.Puesto que las poblaciones son descritas por medidas numricas descriptivas, llamados parmetros, se puede hacer inferencias acerca de la poblacin haciendo inferencias respecto a sus parmetros. Puede definirse la Inferencia Estadstica comoEl conjunto de mtodos estadsticos que permiten deducir (inferir)como se distribuye la poblacin en estudio o las relaciones estocsticas entre varias variables de inters a partir de la informacin queproporciona una muestraPara que un mtodo de inferencia estadstica proporcione buenos resultados debe de: Basarse en una tcnica estadstico-matemtica adecuada al problema y suficientemente validada. Utilizar una muestra que realmente sea representativa de la poblacin y de un tamao suficiente

Objetivos de la Inferencia Estadstica.El objetivo de la Estadstica es medir y modelar la variabilidad del proceso mediante un modelo probabilstico.Para modelar la variabilidad de una variable aleatoria si slo se dispone del conocimiento de una muestra de la misma se sigue el siguiente modo de actuacin:

1. Planteamiento del problema.2. Seleccin de la muestra (Muestreo estadstico), en algunos estudios la muestra se obtiene por simulacin (Simulacin Estadstica)3. Estudio descriptivo de la muestra, analtico y grfico (Estadstica Descriptiva).4. En base al conocimiento de los modelos probabilsticos ms utilizados y teniendo en cuenta el planteamiento del problema y el estudio descriptivo previo, elegir un modelo de probabilidad (Teora de la Probabilidad).

5. Estimar los parmetros del modelo supuesto a partir de las observaciones mustrales utilizando los mtodos de Inferencia Estadstica: estimacin puntual, estimacin por intervalos de confianza y contrastes de hiptesis paramtricos.6. Chequear que el modelo de probabilidad ajustado a los datos es adecuado y que se verifican las hiptesis supuestas en el estudio, por ejemplo, que las observaciones mustrales son independientes, que no existen observaciones errneas,...,etc. Para ello se utilizan los mtodos deInferencia no Paramtrica.7. Si se acepta que el modelo ajustado es adecuado se puede utilizar para obtener resultados y conclusiones sobre la variable en estudio. En caso contrario, se debe reformular el modelo de probabilidad y repetir el proceso desde el paso 4Estimacin

Efectuar una estimacin es usar las medidas calculadas en una muestra (estimadores) para predecir el valor de uno o ms parmetros de la poblacin.Un estimador es a menudo expresado en trminos de una frmula matemtica que da la estimacin como una funcin de las medidas mustrales.La estimacin de un parmetro poblacional puede realizarse de dos maneras:Por punto.Se usan las medidas de la muestra para calcular un nico valor numrico que es la estimacin del parmetro de la poblacin.Por intervaloLas medidas de la muestra pueden tambin usarse para calcular dos valores numricos que definen un intervalo el cual, con un cierto nivel de confianza, se considera que incluye al parmetro. La probabilidad de que una estimacin por intervalo incluya el parmetro se denomina nivel de confianzaEs el procedimiento utilizado para conocer las caractersticas de un parmetro poblacional, a partir del conocimiento de la muestra.Con una muestra aleatoria, de tamao n, podemos efectuar una estimacin de un valor de un parmetro de la poblacin; pero tambin necesitamos precisar un: Intervalo de confianzaSe llama as a un intervalo en el que sabemos que est un parmetro, con un nivel de confianza especfico. Nivel de confianzaProbabilidad de que el parmetro a estimar se encuentre en el intervalo de confianza. Error de estimacin admisibleQue estar relacionado con el radio del intervalo de confianzaEn otras palabras, la eficiencia se refiere al tamao de error estndar de la estadstica. Si comparamos dos estadsticas de una muestra del mismo tamao y tratamos de decidir cul de ellas es un estimador ms eficiente, escogeramos la estadstica que tuviera el menor error estndar, o la menor desviacin estndar de la distribucin de muestreo.Tiene sentido pensar que un estimador con un error estndar menor tendr una mayor oportunidad de producir una estimacin ms cercana al parmetro de poblacin que se est considerando.Como se puede observar las dos distribuciones tienen un mismo valor en el parmetro slo que la distribucin muestral de medias tiene una menor varianza, por lo que la media se convierte en un estimador eficiente e insesgado. CoherenciaUna estadstica es un estimador coherente de un parmetro de poblacin, si al aumentar el tamao de la muestra se tiene casi la certeza de que el valor de la estadstica se aproxima bastante al valor del parmetro de la poblacin. Si un estimador es coherente se vuelve ms confiable si tenemos tamaos de muestras ms grandes. SuficienciaUn estimador es suficiente si utiliza una cantidad de la informacin contenida de la muestra que ningn otro estimador podra extraer informacin adicional de la muestra sobre el parmetro de la poblacin que se est estimando.Es decir se pretende que al extraer la muestra el estadstico calculado contenga toda la informacin de esa muestra. Por ejemplo, cuando se calcula la media de la muestra, se necesitan todos los datos. Cuando se calcula la mediana de una muestra slo se utiliza a un dato o a dos. Esto es solo el dato o los datos del centro son los que van a representar la muestra. Con esto se deduce que si utilizamos a todos los datos de la muestra como es en el caso de la media, la varianza, desviacin estndar, etc. se tendr un estimador suficiente.Prueba de hiptesis

Qu es una hiptesis?Es una proposicin de una o ms poblaciones. La hiptesis es la conjetura o suposicin que motiva la investigacin Una creencia sobre la poblacin principalmente sobre sus parmetros: Media Varianza proporcinEs una rama importante de la inferencia estadstica, se denomina tambin docimasia de hiptesis o contraste de hiptesis Una hiptesis estadstica es un supuesto acerca de algn parmetro poblacional o sobre alguna situacin existente en la poblacinHiptesis nula.Denotada por Ho, es la primera afirmacin que se va a someter a prueba o comprobacin experimental para rechazarla o no. Los resultados experimentales nos permitirn seguir aceptndola como verdadera o si, por el contrario, debemos rechazarla como tal.La hiptesis nula siempre debe contener un signo igual porque es la hiptesis que se va a probar y es necesario que incluya un valor especfico del parmetro.Hiptesis alternativa.Denotada por H1 o Ha es aquella que se acepta cuando la hiptesis nula es rechazada.Tambin se le conoces como hiptesis del investigador, por ser la afirmacin que realmente le gustara validar

Prueba de dos colasSe denomina as a toda la prueba de hiptesis alternativa H1 es bilateral. Si la regin de aceptacin es un intervalo abierto entre dos puntajes crticos.La prueba de hiptesis Ho: = o contra Ho o bilateral de dos colas

Prueba de una colaSe denomina as a toda la prueba de hipotesis alternativa H1 es unilateral

Prueba de cola a la derecha.Si la regin de rechazo est a la derecha del puntaje crtico.La prueba de hiptesis Ho: 0 contra Ho: > 0 unilateral de una cola.

Prueba de cola a la izquierdaSi la regin de rechazo est a la izquierda del puntaje critico La prueba de hiptesis Ho: 0 contra Ho: < 0 unilateral de una cola.Procedimiento de la prueba de hiptesis.Previamente debe formularse el problema estadstico, determinar la variable en estudio y el mtodo estadstico adecuado para la solucin del problema. El procedimiento general de la prueba de hiptesis de parmetros se resume en los siguientes pasos: Formula la hiptesis nula Ho: = 0 o Ho : 0 o H o 0 Y la hiptesis alternativa adecuada Ha: 0 o Ho : < 0 o Ho > 0 Especificar el nivel de significacin Seleccionar la estadstica apropiada a usar en la prueba Establecer la regla de decisin, determinando la regin critica de la prueba.Calcular el valor del estadstico de la prueba a partir de los datos de la muestraTomar la decisin de rechazar la hiptesis Ho si el valor del estadstico de la prueba est en la regin critica. En caso contrario, no rechazar Ho

Mtodo clsico de estimacin puntual

La inferencia estadstica est casi siempre concentrada en obtener algn tipo de conclusin acerca de uno o ms parmetros (caractersticas poblacionales). Para hacerlo, se requiere que un investigador obtenga datos mustrales de cada una de las poblaciones en estudio. Entonces, las conclusiones pueden estar basadas en los valores calculados de varias cantidades mustrales.Por ejemplo, representamos con (parmetro) el verdadero promedio de resistencia a la ruptura de conexiones de alambres utilizados para unir obleas de semiconductores. Podra tomarse una muestra aleatoria de 10 conexiones para determinar la resistencia a la ruptura de cada una, y la media muestral de la resistencia a la ruptura se poda emplear para sacar una conclusin acerca del valor de. De forma similar, si es la varianza de la distribucin de resistencia a la ruptura, el valor de la varianza muestral s2 se podra utilizar para inferir algo acerca de.Cuando se analizan conceptos generales y mtodos de inferencia es conveniente tener un smbolo genrico para el parmetro de inters. Se utilizar la letra griega para este propsito. El objetivo de la estimacin puntual es seleccionar slo un nmero, basados en datos de la muestra, que represente el valor ms razonable de. Una muestra aleatoria de 3 bateras para calculadora podra presentar duraciones observadas en horas de x1 =5.0, x2 =6.4 y x3 =5.9. El valor calculado de la duracin media muestral es = 5.77, y es razonable considerar 5.77 como el valor ms adecuado de.Una estimacin puntual de un parmetro es un slo nmero que se puede considerar como el valor ms razonable de. La estimacin puntual se obtiene al seleccionar una estadstica apropiada y calcular su valor a partir de datos de la muestra dada. La estadstica seleccionada se llama estimador puntual de.El smbolo (theta sombrero) suele utilizarse para representar el estimador de y la estimacin puntual resultante de una muestra dada. Entonces se lee como "el estimador puntual de es la media muestral. El enunciado "la estimacin puntual de es 5.77" se puede escribir en forma abreviada.Ejemplo:En el futuro habr cada vez ms inters en desarrollar aleaciones de Mg de bajo costo, para varios procesos de fundicin. En consecuencia, es importante contar con mtodos prcticos para determinar varias propiedades mecnicas de esas aleaciones. Examine la siguiente muestra de mediciones del mdulo de elasticidad obtenidos de un proceso de fundicin a presin:44.2 43.9 44.7 44.2 44.0 43.8 44.6 43.1Suponga que esas observaciones son el resultado de una muestra aleatoria. Se desea estimar la varianza poblacional. Un estimador natural es la varianza muestral:

En el mejor de los casos, se encontrar un estimado para el cual siempre.Sin embargo, es una funcin de las Xi mustrales, por lo que en s misma una variable aleatoria. Error de estimacin entonces el estimador preciso sera uno que produzca slo pequeas diferencias de estimacin, de modo que los valores estimados se acerquen al valor verdadero.Estimador insesgado

Se le llama sesgo ya que es la diferencia que hay entre el valor esperado y el valor del parmetro que se va a estimar.Se le denomina insesgado cuando la diferencia entre el valor esperado y el valor del parmetro que se va a estimar sea cero.Un ejemplo podra ser:Cuando se va a calcular la media de una poblacin sera un estimador insesgado ya que la media aritmtica de la muestra seria el mismo valor esperado y este es igual a la media poblacional.Otra propiedad razonable que podemos pedir al estimador de un parmetro es que, en promedio, sus valores coincidan con . Cuando sucede esto decimos que el estimador es centradooinsesgado.

Podemos fijarnos que en la diana del tirador insesgado, el centro de masas de los disparos coincide con el centro de la diana (que representa el verdadero valor del parmetro). Como ya vimos anteriormente, el concepto de centro de masas est relacionado con la esperanza de una variable aleatoria y, precisamente as, obtenemos la definicin formal de estimador insesgado: un estimadorTde un parmetro diremos que es centrado o insesgado si su esperanza es precisamente .

Si, al contrario, tenemos un estimador U sesgado, la desviacin respecto al verdadero valor a estimar se mide por el sesgo:

De manera que el sesgo de un estimador puede ser: Positivo: Si producen, en promedio,estimaciones por exceso. Cero: Si es un estimador centrado o insesgado. Negativo: Si producen, en promedio,estimaciones por defecto.Intervalos de confianza Enestadstica, se llama a un par o varios pares de nmeros entre los cuales se estima que estar cierto valor desconocido con una determinada probabilidad de acierto. Formalmente, estos nmeros determinan unintervalo, que se calcula a partir de datos de unamuestra, y el valor desconocido es unparmetro poblacional. La probabilidad de xito en la estimacin se representa con1 - y se denominanivel de confianza. En estas circunstancias,es el llamadoerror aleatorioonivel de significacin, esto es, una medida de las posibilidades de fallar en la estimacin mediante tal intervalo.

El nivel de confianza y la amplitud del intervalo varan conjuntamente, de forma que un intervalo ms amplio tendr ms probabilidad de acierto (mayor nivel de confianza), mientras que para un intervalo ms pequeo, que ofrece una estimacin ms precisa, aumenta su probabilidad de error.Para la construccin de un determinado intervalo de confianza es necesario conocer ladistribucinterica que sigue el parmetro a estimar,2. Es habitual que el parmetro presente unadistribucin normal. Tambin pueden construirse intervalos de confianza con ladesigualdad de Chebyshev.

En definitiva, un intervalo de confianza al 1 - por ciento para la estimacin de un parmetro poblacionalque sigue una determinadadistribucin de probabilidad, es una expresin del tipo [1,2] tal que P[1 2] = 1 - , dondePes lafuncin de distribucinde probabilidad de.

En el contexto de estimar un parmetro poblacional, un intervalo de confianza es un rango de valores (calculado en una muestra) en el cual se encuentra el verdadero valor del parmetro, con una probabilidad determinada.La probabilidad de que el verdadero valor del parmetro se encuentre en el intervalo construido se denominanivel de confianza, y se denota 1-. La probabilidad de equivocarnos se llamanivel de significanciay se simboliza. Generalmente se construyen intervalos con confianza 1-=95% (o significancia=5%). Menos frecuentes son los intervalos con=10% o=1%.Para construir un intervalo de confianza, se puede comprobar que la distribucin Normal Estndar cumple1:P(-1.96 < z < 1.96) = 0.95(Lo anterior se puede comprobar con una tabla de probabilidades o un programa computacional que calcule probabilidades normales).Luego, si una variable X tiene distribucin N(,), entonces el 95% de las veces se cumple:

Despejandoen la ecuacin se tiene:

El resultado es un intervalo que incluye alel 95% de las veces. Es decir, es unintervalo de confianza al 95% para la mediacuando la variable X es normal yes conocido.II- Intervalo de confianza para un promedio:Generalmente, cuando se quiere construir un intervalo de confianza para la media poblacional, la varianza poblacionales desconocida, por lo que el intervalo paraconstruido al final de II es muy poco prctico.Si en el intervalo se reemplaza la desviacin estndar poblacionalpor la desviacin estndar muestrals, el intervalo de confianza toma la forma:

La cual es una buena aproximacin para el intervalo de confianza de 95% paracondesconocido. Esta aproximacin es mejor en la medida que el tamao muestral sea grande.Cuando el tamao muestral es pequeo, el intervalo de confianza requiere utilizar la distribucin t de Student (con n-1 grados de libertad, siendo n el tamao de la muestra), en vez de la distribucin normal (por ejemplo, para un intervalo de 95% de confianza, los lmites del intervalo ya no sern construidos usando el valor 1,96