ejercicios de analisis u2

33
TECNOLÓGICO NACIONAL DE MÉXICO INSTITUTO TECNOLÓGICO DE MINATITLÁN EJERCICIOS DE TAREA UNIDAD II: “Tcnicas de muestreo y pruebas de hipótesis.” Equipo.- Aguilando Joachín Brenda Shaian Palacios Alfonso Karen Jahaira Palomeque Morales Samangtha Lynett Torres Valencia Gabriela Estefhanie Materia.- Análisis de datos experimentales Docente: Ing. Patricia del Carmen Rodríguez Ingles Carrera: Ingeniería Química Semestre y Grupo: 3 er Semestre Av-31M

Upload: palacios-alfonso-karen

Post on 12-Apr-2016

74 views

Category:

Documents


8 download

DESCRIPTION

SHIPSHIPEXCERCISESTHINK PLUS

TRANSCRIPT

Page 1: Ejercicios de Analisis U2

TECNOLÓGICO NACIONAL DE MÉXICO

INSTITUTO TECNOLÓGICO DE MINATITLÁN

EJERCICIOS DE TAREA

UNIDAD II: “Tecnicas de muestreo y pruebas de hipótesis.”

Equipo.-Aguilando Joachín Brenda Shaian

Palacios Alfonso Karen JahairaPalomeque Morales Samangtha Lynett

Torres Valencia Gabriela Estefhanie

Materia.-Análisis de datos experimentales

Docente:

Ing. Patricia del Carmen Rodríguez InglesCarrera:

Ingeniería Química

Semestre y Grupo:3er Semestre Av-31M

Fecha de entrega: Minatitlán, Ver a 23 de Octubre 2015

Page 2: Ejercicios de Analisis U2

TECNOLÓGICO NACIONAL DE MÉXICO INSTITUTO TECNOLÓGICO DE MINATITLÁN

10. Se compara la producción diaria promedio de dos procesos químicos. Durante 72 días se observó la producción diaria de los dos procesos con los siguientes resultados:x1 = 834, x2 = 808, s1

2 = 346, s22 = 302. ¿Proporcionan los datos suficiente evidencia que indique

una diferencia en la producción media de los dos procesos?

Ejercicios Unidad II: Técnicas de muestreo y pruebas de Hipótesis

Page 3: Ejercicios de Analisis U2

TECNOLÓGICO NACIONAL DE MÉXICO INSTITUTO TECNOLÓGICO DE MINATITLÁN

11. Se supone que una máquina mezcla cacahuates, avellanas, nueces y pepitas en la relación 4:3:2:1. Una lata contiene 500 de estos frutos mezclados y se encuentra que 269 son cacahuates, 112 avellanas, 74 nueces y 45 pepitas. En un nivel de significancia del 5 %, pruebe la hipótesis de que la máquina está mezclando en la relación 4:3:2:1.

Ejercicios Unidad II: Técnicas de muestreo y pruebas de Hipótesis

Page 4: Ejercicios de Analisis U2

TECNOLÓGICO NACIONAL DE MÉXICO INSTITUTO TECNOLÓGICO DE MINATITLÁN

12. Una compañía opera cuatro máquinas tres turnos al día. De los registros de producción, se obtienen los datos siguientes sobre el número de fallas:13.

TurnoMáquina

A B C D123

413115

201117

12916

161410

Pruebe la hipótesis de que el número de fallas es independiente del turno. Utilice un valor P en su decisión.

Ejercicios Unidad II: Técnicas de muestreo y pruebas de Hipótesis

Page 5: Ejercicios de Analisis U2

TECNOLÓGICO NACIONAL DE MÉXICO INSTITUTO TECNOLÓGICO DE MINATITLÁN

A) TAREA DE INVESTIGACIÓN

MUESTREO:a)IMPORTANCIA DEL MUESTREO

A lo largo del curso se hacen uso de dos tipos de razonamiento: el deductivo y el inductivo. El primero está relacionado directamente con la teoría de probabilidad, y que a partir de las características de la población se obtienen las posibles características de una muestra. El segundo tipo de razonamiento se relaciona con la denominada inferencia estadística: utilizar las características de un subconjunto de la población (la muestra) para hacer afirmaciones (inferir) sobre la población en general.

El muestro, como ya se mencionó, implica algo de incertidumbre que debe ser aceptada para poder realizar el trabajo, pues aparte de que estudiar una población resulta ser un trabajo en ocasiones demasiado grande :

Recursos limitados. Es decir, no existen los recursos humanos, materiales o económicos para realizar el estudio sobre el total de la población. Es como cuando se compra un aparato, un automóvil usado (por ejemplo), que se prueba unos minutos (el encendido, una carrerita, etc.) para ver si funciona correctamente y luego se adquiere, pero no se espera a probarlo toda la vida (encendiéndolo y apagándolo o, simplemente, dejándolo encendida) antes de realizar la adquisición. 

Escasez. Es el caso en que se dispone de una sola muestra. Por ejemplo, para el estudio paleontológico de los dinosaurios (el T. Rex por ejemplo) sería muy bueno contar con, al menos, muchos restos fósiles y así realizar tales investigaciones; sin embargo, se cuenta sólo con una docena de esqueletos fosilizados (casi todos incompletos) de esas criaturas en todo el mundo. 

Pruebas destructivas. Es el caso en el que realizar el estudio sobre toda la población llevaría a la destrucción misma de la población. Por ejemplo, si se quisiese saber el conteo exacto de hemoglobina de una persona habría que extraerle toda la sangre.

El muestreo puede ser más exacto. Esto es en el caso en el que el estudio sobre la población total puede causar errores por su tamaño o, en el caso de los censos, que sea necesario utilizar personal no lo suficientemente capacitado; mientras que, por otro lado, el estudio sobre una muestra podría ser realizada con menos personal pero más capacitado.

 

b) TIPOS DE MUESTREO

Existen diferentes criterios de clasificación de los diferentes tipos de muestreo, aunque en general pueden dividirse en dos grandes grupos: métodos de muestreo probabilísticos y métodos de muestreo no probabilísticos.

Ejercicios Unidad II: Técnicas de muestreo y pruebas de Hipótesis

Page 6: Ejercicios de Analisis U2

TECNOLÓGICO NACIONAL DE MÉXICO INSTITUTO TECNOLÓGICO DE MINATITLÁN

I. Muestreo probabilístico Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamaño n tienen la misma probabilidad de ser seleccionadas. Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra extraída y son, por tanto, los más recomendables. Dentro de los métodos de muestreo probabilísticos encontramos los siguientes tipos:

1.- Muestreo aleatorio simple:

El procedimiento empleado es el siguiente: 1) se asigna un número a cada individuo de la población y 2) a través de algún medio mecánico (bolas dentro de una bolsa, tablas de números aleatorios, números aleatorios generados con una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el tamaño de muestra requerido.Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la población que estamos manejando es muy grande.

2.- Muestreo aleatorio sistemático:

Este procedimiento exige, como el anterior, numerar todos los elementos de la población, pero en lugar de extraer n números aleatorios sólo se extrae uno. Se parte de ese número aleatorio i, que es un número elegido al azar, y los elementos que integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el resultado de dividir el tamaño de la población entre el tamaño de la muestra: k= N/n. El número i que empleamos como punto de partida será un número al azar entre 1 y k. El riesgo este tipo de muestreo está en los casos en que se dan periodicidades en la población ya que al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una homogeneidad que no se da en la población. Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son varones y los 5 últimos mujeres, si empleamos un muestreo aleatorio sistemático con k=10 siempre seleccionaríamos o sólo hombres o sólo mujeres, no podría haber una representación de los dos sexos.

3.- Muestreo aleatorio estratificado:

Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y suelen reducir el error muestral para un tamaño dado de la muestra. Consiste en considerar categorías típicas diferentes entre sí (estratos) que poseen gran homogeneidad respecto a alguna característica (se puede estratificar, por ejemplo, según la profesión, el municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de interés estarán representados adecuadamente en la muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarán parte de la muestra. En ocasiones las dificultades que plantean son demasiado grandes,

Ejercicios Unidad II: Técnicas de muestreo y pruebas de Hipótesis

Page 7: Ejercicios de Analisis U2

TECNOLÓGICO NACIONAL DE MÉXICO INSTITUTO TECNOLÓGICO DE MINATITLÁN

pues exige un conocimiento detallado de la población. (Tamaño geográfico, sexos, edades,...). La distribución de la muestra en función de los diferentes estratos se denomina afijación, y puede ser de diferentes tipos:

Afijación Simple: A cada estrato le corresponde igual número de elementos muéstrales.

Afijación Proporcional: La distribución se hace de acuerdo con el peso (tamaño) de la población en cada estrato.

Afijación Optima: Se tiene en cuenta la previsible dispersión de los resultados, de modo que se considera la proporción y la desviación típica. Tiene poca aplicación ya que no se suele conocer la desviación.

4.- Muestreo aleatorio por conglomerados:

Los métodos presentados hasta ahora están pensados para seleccionar directamente los elementos de la población, es decir, que las unidades muéstrales son los elementos de la población. En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la población que forman una unidad, a la que llamamos conglomerado. Las unidades hospitalarias, los departamentos universitarios, una caja de determinado producto, etc., son conglomerados naturales. En otras ocasiones se pueden utilizar conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los conglomerados son áreas geográficas suele hablarse de "muestreo por áreas". El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de conglomerados (el necesario para alcanzar el tamaño muestral establecido) y en investigar después todos los elementos pertenecientes a los conglomerados elegidos.

II. Métodos de muestreo no probabilísticos

A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso y se acude a métodos no probabilísticos, aun siendo conscientes de que no sirven para realizar generalizaciones (estimaciones inferenciales sobre la población), pues no se tiene certeza de que la muestra extraída sea representativa, ya que no todos los sujetos de la población tienen la misma probabilidad de se elegidos. En general se seleccionan a los sujetos siguiendo determinados criterios procurando, en la medida de lo posible, que la muestra sea representativa. En algunas circunstancias los métodos estadísticos y epidemiológicos permiten resolver los problemas de representatividad aun en situaciones de muestreo no probabilístico, por ejemplo los estudios de caso-control, donde los casos no son seleccionados aleatoriamente de la población.

Ejercicios Unidad II: Técnicas de muestreo y pruebas de Hipótesis

Page 8: Ejercicios de Analisis U2

TECNOLÓGICO NACIONAL DE MÉXICO INSTITUTO TECNOLÓGICO DE MINATITLÁN

Entre los métodos de muestreo no probabilísticos más utilizados en investigación encontramos:

1.- Muestreo por cuotas:

También denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un buen conocimiento de los estratos de la población y/o de los individuos más "representativos" o "adecuados" para los fines de la investigación. Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el carácter de aleatoriedad de aquél. En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de individuos que reúnen unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes en Gijón. Una vez determinada la cuota se eligen los primeros que se encuentren que cumplan esas características. Este método se utiliza mucho en las encuestas de opinión.

2.- Muestreo intencional o de conveniencia:

Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" mediante la inclusión en la muestra de grupos supuestamente típicos. Es muy frecuente su utilización en sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto. También puede ser que el investigador seleccione directa e intencionadamente los individuos de la población. El caso más frecuente de este procedimiento el utilizar como muestra los individuos a los que se tiene fácil acceso (los profesores de universidad emplean con mucha frecuencia a sus propios alumnos).

3.- Bola de nieve:

Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc.

4.- Muestreo Discrecional ·

A criterio del investigador los elementos son elegidos sobre lo que él cree que pueden aportar al estudio.

c)TIPOS DE ERROR

Un proceso inductivo (que va de lo particular a lo general) se asocia inevitablemente a la posibilidad de cometer errores y este es mayor en la medida que la parte observada sea más pequeña, y sobre todo, cuando dicha parte no refleja o “representa” la realidad sobre la que recaen las conclusiones de la inferencia. El error que se comete debido al hecho de que se sacan conclusiones sobre cierta realidad, a partir de la observación de sólo una parte de ella, se denomina error de muestreo.

Ejercicios Unidad II: Técnicas de muestreo y pruebas de Hipótesis

Page 9: Ejercicios de Analisis U2

TECNOLÓGICO NACIONAL DE MÉXICO INSTITUTO TECNOLÓGICO DE MINATITLÁN

Obtener una “buena muestra” significa, obtener una versión simplificada de la población, que reproduzca de algún modo sus rasgos básicos (una población en miniatura) cuyo propósito es ahorrar recursos.

Error estándarEl error estándar es la desviación estándar estimada de un estadístico muestral. Por ejemplo, el error estándar de la media de una muestra es una estimación de la desviación estándar probable que tendrían las medias de un número infinito de muestras.El error estándar ofrece una indicación de la precisión de la media de la muestra como una estimación de la media de la población. Cuanto menor es el error estándar, menor es la dispersión y mayor es la probabilidad de que las medias muestrales estén próximas a la media de la población, es decir, hay una probabilidad del 68% de que la media real de la población esté a +/- 1 errores estándar de la media muestral.

1.1 TIPOS DE ERROR Y POTENCIA ESTADÍSTICAHay dos tipos de errores posibles al efectuar un análisis estadístico. El error de tipo I, conocido también como falso positivo, es el error de rechazar una

hipótesis nula cuando es cierta. Es decir, se concluye que hay una diferencia donde no existe ninguna.

El error de tipo II, conocido también como falso negativo, es el error de no rechazar una hipótesis nula cuando no es cierta. Es decir, no se concluye que hay una diferencia cuando de hecho sí la hay.

La potencia de una prueba es la probabilidad de rechazar correctamente una hipótesis nula cuando es falsa. Esta probabilidad es inversamente proporcional a la probabilidad de cometer un error de tipo II, no rechazar la hipótesis nula cuando es falsa.Por ejemplo, ANOVA presenta una potencia estadística alta. Existe una probabilidad menor de un error de tipo II, al pensar que no hay una relación cuando sí la hay.

Ejercicios Unidad II: Técnicas de muestreo y pruebas de Hipótesis

Page 10: Ejercicios de Analisis U2

TECNOLÓGICO NACIONAL DE MÉXICO INSTITUTO TECNOLÓGICO DE MINATITLÁN

ESTIMACIÓN ESTADÍSTICA:En inferencia estadística se llama estimación al conjunto de técnicas que permiten dar un valor aproximado de un parámetro de una población a partir de los datos proporcionados por una muestra. Por ejemplo, una estimación de la media de una determinada característica de una población de tamaño N podría ser la media de esa misma característica para una muestra de tamaño n.

Importancia

Estimar puede tener dos significados interesantes. Significa querer e inferir. Desde luego, el primer significado es más trascendente. Pero no tiene ningún peso en la estadística, disciplina que no se ocupa de los asuntos del amor. El segundo significado es el importante aquí. Una estimación estadística es un proceso mediante el que establecemos qué valor debe tener un parámetro según deducciones que realizamos a partir de estadísticos. En otras palabras, estimar es establecer conclusiones sobre características poblacionales a partir de resultados muestrales. Estimar qué va a ocurrir respecto a algo (o qué está ocurriendo, o qué ocurrió), a pesar de ser un elemento muy claramente estadístico, está muy enraizado en nuestra cotidianidad. Dentro de ello, además hacemos estimaciones dentro de un intervalo de posibilidades. Por ejemplo: “creo que terminaré la tarea en unos 5-6 días”. Lo que hacemos en el terreno del análisis de datos es aplicar matizaciones técnicas a este hábito

Tipos de estimación:

Estimación puntual

Una estimación puntual del valor de un parámetro poblacional desconocido (como puede ser la media μ , o la desviación estándar σ ), es un número que se utiliza para aproximar el verdadero valor de dicho parámetro poblacional. A fin de realizar tal estimación, tomaremos una muestra de la población y calcularemos el parámetro muestral asociado (x para la media, s para la desviación estándar, etc.). El valor de este parámetro muestral será la estimación puntual del parámetro poblacional.

Por ejemplo, supongamos que la compañía Sonytron desea estimar la edad media de los compradores de equipos de alta fidelidad. Seleccionan una muestra de 100 compradores y calculan la media de esta muestra, este valor será un estimador puntual de la media de la población.

Características que debe tener un buen estimador

a) Debe ser insesgado: un estimador es insesgado, si en promedio, tiende a tomar valores que están por encima del parámetro de la población con la misma frecuencia y la misma extensión,

Ejercicios Unidad II: Técnicas de muestreo y pruebas de Hipótesis

Page 11: Ejercicios de Analisis U2

TECNOLÓGICO NACIONAL DE MÉXICO INSTITUTO TECNOLÓGICO DE MINATITLÁN

con la que tiende a asumir valores por debajo del parámetro de población que se está estimando.

b) Debe ser eficiente: de varios estimadores insesgados, el más eficiente es el que tiene el error estándar más pequeño.

c) Debe ser consistente: significa que a medida que aumenta el tamaño de la muestra, la estimación se aproxima al valor del parámetro.

d) Debe ser suficiente: significa que ningún otro estimador puede suministrar más información sobre el parámetro.Nivel de Confianza Probabilidad asociada con una estimación de intervalo de un parámetro de población. Ésta indica qué tan seguro se está de que la estimación de intervalo incluirá al parámetro de la población. Los niveles de confianza que más se utilizan son 90%, 95% y 99%.

Intervalo de Confianza

Es el alcance, rango o recorrido de la estimación que se hace y que tiene designada una probabilidad de que incluya el valor real del parámetro de la población que se está estimando.

Límites de Confianza

Son el límite inferior y superior de un intervalo de confianza.

Coeficiente de Confianza

Es el nivel de confianza (en valores relativos) que tenemos en que el intervalo contiene el valor desconocido del parámetro. Por ejemplo, para un nivel de confianza del 90%, el coeficiente de confianza es 0,9.

Estimación por intervalo

Dada una población X, que sigue una distribución cualquiera con media u y desviación estándar

1. Sabemos (por el TCL) que, para valores grandes de n, la media muestra x sigueuna distribución aproximadamente normal con media y desviación estándar.

2. Por otra parte, el Teorema de Chebyshev nos dice que, en una distribución normal, aproximadamente un 95% de los datos estaban situados a una distancia inferior a dos desviaciones estándar de la media.

Ejercicios Unidad II: Técnicas de muestreo y pruebas de Hipótesis

Page 12: Ejercicios de Analisis U2

TECNOLÓGICO NACIONAL DE MÉXICO INSTITUTO TECNOLÓGICO DE MINATITLÁN

Por tanto, ésta última fórmula nos da un intervalo de valores tal que la probabilidad de que la media de la población μ esté contenida en él es de 0,95.Este tipo de intervalos se llaman intervalos de confianza de un parámetro poblacional. El nivel de confianza (1 - α) del intervalo es la probabilidad de que éste contenga al parámetro poblacional. En el ejemplo anterior, el nivel de confianza era del 95% (α = 0,05).

1. Intervalo de confianza para µ con conocida.

Un vendedor mayorista de partes automotrices necesita una estimación de la vida media que puede esperar de los limpiaparabrisas en condiciones normales de manejo. La administración de la empresa ya ha determinado que la desviación estándar de la vida útil de la población es de seis meses. Supongamos que se selecciona una sola muestra aleatoria de 100 limpiaparabrisas, y obtenemos que la vida media de estos 100 limpiaparabrisas es de 21 meses. Se pide calcular un intervalo de confianza del 95% para la vida media de la población de los limpiaparabrisas. Tenemos X como la distribución de la vida útil en meses de la población de limpiaparabrisas, no sabemos qué distribución tiene, al igual que desconocemos su media.En este caso sí conocemos la desviación estándar poblacional.

La media muestral X por el teorema central del límite se va a aproximar la distribución normal:

Por lo tanto, el intervalo de confianza del 95% para la vida media en meses de toda la población de limpiaparabrisas, es decir para µ

Ejercicios Unidad II: Técnicas de muestreo y pruebas de Hipótesis

Page 13: Ejercicios de Analisis U2

TECNOLÓGICO NACIONAL DE MÉXICO INSTITUTO TECNOLÓGICO DE MINATITLÁN

El error máximo de estimación es la mitad de la longitud del intervalo, Con una confianza del 95%, la vida media de la población de limpiaparabrisas que vende este mayorista está entre 19,824 meses y 22,176 meses. Si extraemos varias muestras del mismo tamaño y calculamos un intervalo de confianza para cada muestra, el 95% de todos los intervalos van a incluir a la vida media poblacional en meses de todos los parabrisas que vende este mayorista.

2. Intervalo de confianza para µ con desconocida.

El administrador de una planta industrial generadora de energía desea estimar, por intervalo, la cantidad de carbón que se consumió por término medio semanalmente durante año pasado. Para ello toma una muestra de 10 semanas. El consumo medio fue de 11.400 toneladas, la desviación estándar muestral 700 toneladas. ¿Cuál será el intervalo de confianza del 95% para el consumo medio semanal durante el año pasado? (supongamos normalidad). Tenemos X como la distribución de toneladas de carbón consumidas cada semana del año pasado por la planta de energía y su media y su desviación estándar desconocidas.

Aunque n < 30, suponemos que la media muestral, X, sigue una distribución normal:

Para estimar la desviación estándar poblacional vamos a utilizar la desviaciónestándar muestral S que es 700 toneladas.Por lo tanto, el intervalo de confianza del 95% para el consumo promedio de toneladasde carbón en cada semana del año pasado, es decir para µ , será:

Utilizamos la t-Student porque la desviación estándar poblacional es desconocida. En las tablas, 2 2 262 t (10 - 1,0,05) =, 2,262 una t-Student con 10 – 1 = 9 grados de libertad que deja su derecha un área de 0,025. = 0,05 porque el nivel de confianza es de 1 - = 0,95 Con una confianza del 95%, el consumo promedio semanal de carbón durante el año pasado por esta planta de energía estará entre 10.899 toneladas y 11.901 toneladas. Si extraemos varias muestras del mismo tamaño y calculamos un intervalo de confianza para cada muestra, el 95% de todos los intervalos van a incluir al consumo promedio poblacional de toneladas de carbón por semana durante el año pasado por la planta de energía.

3. Intervalo de confianza para la probabilidad de éxito p en una binomial.

Ejercicios Unidad II: Técnicas de muestreo y pruebas de Hipótesis

Page 14: Ejercicios de Analisis U2

TECNOLÓGICO NACIONAL DE MÉXICO INSTITUTO TECNOLÓGICO DE MINATITLÁN

Durante un año y medio las ventas han estado disminuyendo de manera coherente en los 1.500 establecimientos de una cadena de comida rápida. Una empresa de consultoría ha determinado que el 30% de una muestra de 95 sucursales tiene claros signos de una mala administración. Construir un intervalo de confianza del 95% para esta porción.A la población de todos los establecimientos de ésta cadena de comida rápida le vamos a llamar X que seguirá una binomial con probabilidad de éxito, probabilidad de tener signo de mala administración, p desconocida. A fin de estimar dicho parámetro, se toma una muestra de tamaño n = 95 y definimos p como la proporción de éxitos en la muestra. En este caso p es 0,3 y 1-p =0,7.

Como p es desconocida, la aproximaremos por p que es la estimación puntual de p. Entonces, la proporción muestral de éxitos, que la hemos utilizado para estimar la proporción de la población tendrá la siguiente distribución:

Por lo tanto, la estimación del error estándar de la proporción de establecimientos que tiene claros signos de mala será 0,057. El intervalo de confianza del 95% para la probabilidad de éxito poblacional p viene dado por:

Por lo tanto, con un nivel de confianza del 95%, la proporción de establecimientos de esta cadena de comida rápida que tiene mala administración estará entre 0,20788 y 0,39212.Si extraemos varias muestras del mismo tamaño y calculamos un intervalo de confianza para cada muestra, el 95% de esos intervalos van a incluir a la verdadera proporción de establecimientos con mala administración.

EL ERROR

Un mismo estimador ofrece distintos valores para distintas muestras del mismo tamaño extraídas de la misma población. Por lo tanto, deberíamos tener una medida de la variabilidad del estimador respecto del parámetro que se trata de estimar. Esta variabilidad se mide en términos de la desviación estándar del estimador, la cual recibe el nombre de error estándar.

El error estándar de un estimador T de un parámetro  es la desviación estándar del estimador.

Ejercicios Unidad II: Técnicas de muestreo y pruebas de Hipótesis

Page 15: Ejercicios de Analisis U2

TECNOLÓGICO NACIONAL DE MÉXICO INSTITUTO TECNOLÓGICO DE MINATITLÁN

Así por ejemplo, si tomamos  como estimador de  , entonces el error estándar está

dado por  .

Error de estimación es el valor absoluto de la diferencia entre una estimación particular y el valor del parámetro.

En realidad, por cada valor estimado del parámetro se tiene un error de estimación por lo general diferente. Sin embargo, es posible fijar un intervalo dentro del cual se encontrarán la mayoría de los valores de error de estimación para un estimador y parámetro dados.

PARÁMETRO ESTIMADOR ERROR ESTÁNDAR ESTIMADOR DEL ERROR

=

N

=

PRUEBAS DE HIPÓTESIS:Una hipótesis es una expresión a manera de conjetura, es decir, una proposición tentativa en modo afirmativo acerca de la relación general o específica entre dos o más variables. En la formulación de cualquier hipótesis es conveniente observar los dos criterios siguientes: deben expresar relaciones entre variables; y además, ser inferencias que permitan probar las

Ejercicios Unidad II: Técnicas de muestreo y pruebas de Hipótesis

Page 16: Ejercicios de Analisis U2

TECNOLÓGICO NACIONAL DE MÉXICO INSTITUTO TECNOLÓGICO DE MINATITLÁN

relaciones establecidas. Esto indica que toda expresión hipotética estará integrada por dos o más variables mensurables y tener una forma explícita del tipo de relación que se supone existe entre éstas

Es una afirmación acerca de una o más poblaciones. En general, la hipótesis se refiere a los parámetros poblacionales acerca de las cuales se hace la afirmación. Probar una hipótesis requiere tomar una decisión cuando se compara la muestra observada con la teoría

IMPORTANCIA DE LAS PRUEBAS DE HIPÓTESIS

El propósito de las pruebas de hipótesis es ayudar al investigador, al médico o administrador a tomar una decisión en torno a una población, examinando una muestra de ella.

Observa la naturaleza, formula una teoría y la confronta con lo observado. En nuestro contexto el científico plantea una hipótesis respecto a uno o más parámetros poblacionales: de que son iguales a valores especificados. En seguida toma una muestra de la población y compara sus observaciones con la hipótesis. Si las observaciones no concuerdan con la hipótesis, las rechaza. De lo contrario, concluye que la hipótesis es verdadera o que la muestra no detectó la diferencia entre los valores real e hipotético de los parámetros poblacionales.

Son las herramientas de trabajo de la teoría, esto es, de las teorías se pueden deducir hipótesis. Estas se pueden demostrarse, es decir, se puede establecer que son probablemente ciertas o probablemente falsas.

Son un instrumento poderoso para el progreso del conocimiento, porque ayudan a confirmar o negar una teoría en forma independiente de la opinión del investigador.

En algunas ocasiones una hipótesis dada puede ser demasiado amplia para ser probada. Si es una buena hipótesis podrá demostrarse a través de otras deducidas de ella. Las hipótesis no se prueban directamente, sino a través de las inferencias inducidas de ellas. Finalmente debe enfatizarse que los resultados de toda investigación deben aplicarse al problema en particular, a las hipótesis y finalmente a la teoría.

La prueba de hipótesis se lleva a cabo en todos los campos en los que la teoría se puede probar como observación.

TIPOS DE HIPÓTESIS

Hipótesis estadística

Se identifica tanto a la hipótesis nula como a la hipótesis alterna. Proposición o supuesto sobre los parámetros de una o más poblaciones. Sus elementos son:

1. Hipótesis nula, H0

Ejercicios Unidad II: Técnicas de muestreo y pruebas de Hipótesis

Page 17: Ejercicios de Analisis U2

TECNOLÓGICO NACIONAL DE MÉXICO INSTITUTO TECNOLÓGICO DE MINATITLÁN

2. Hipótesis alternativa, Ha

3. Estadístico de prueba4. Región de rechazo

Hipótesis nula

Es una hipótesis construida para anular o refutar, con el objetivo de apoyar una hipótesis alternativa. Cuando se utiliza, la hipótesis nula se presume verdadera hasta que una prueba estadística en la forma de una prueba empírica de la hipótesis indique lo contrario. Si la hipótesis nula no es rechazada, esto no quiere decir que sea verdadera.

Es la hipótesis que debe probarse. Se designa como . Se establece con el propósito de

ser rechazada.

Hipótesis alternativa

Es igualmente una afirmación acerca de la población de origen. Muchas veces, aunque no siempre, consiste simplemente en  negar la afirmación de H0. La hipótesis alternativa se designa con el símbolo H1

Pruebas de hipótesis

Pruebas hipótesis unilaterales

La prueba de hipótesis bilateral, llamada así porque la región de rechazo se divide entre dos lados o colas de la distribución de la estadística de prueba. Una prueba de hipótesis pude ser unilateral, en cuyo caso toda la región de rechazo está en una u otra cola de la distribución. El que se utilice una prueba unilateral o bilateral depende de la naturaleza de la cuestión planteada por el investigador.

En caso de que los valores tanto pequeños como grandes causen el rechazo de la hipótesis nula, lo indicado es utilizar una prueba bilateral. Cuando únicamente valores suficientemente “pequeños” o suficientemente “grandes” causen el rechazo de la hipótesis nula, lo indicado es utilizar una prueba unilateral.

Prueba unilateral derecha

Está/ formada por todos los valores del estadístico de prueba θ ubicados a la

Ejercicios Unidad II: Técnicas de muestreo y pruebas de Hipótesis

Page 18: Ejercicios de Analisis U2

TECNOLÓGICO NACIONAL DE MÉXICO INSTITUTO TECNOLÓGICO DE MINATITLÁN

derecha del parámetro θ cuya probabilidad de ocurrencia es menor a la del nivel de significación. Se especifica cuando

Prueba unilateral izquierda

Está formada por todos los valores del estadístico de prueba θ ubicados a la izquierda del parámetro θ cuya probabilidad de ocurrencia es menor a la del nivel de significación.

Prueba bilateral

Ejercicios Unidad II: Técnicas de muestreo y pruebas de Hipótesis

Page 19: Ejercicios de Analisis U2

TECNOLÓGICO NACIONAL DE MÉXICO INSTITUTO TECNOLÓGICO DE MINATITLÁN

La zona de rechazo puede ser dividida en dos partes iguales ubicadas a cada lado del parámetro. La zona de la derecha y de la izquierda están formadas por todos los valores del estadístico de prueba θ cuya probabilidad de ocurrencia es menor a la mitad de la probabilidad del nivel de significación α

Prueba de hipótesis diferencia entre las medias de dos poblaciones

La prueba de hipótesis que comprende la diferencia entre la media de dos poblaciones se utiliza con más frecuencia para determinar si es razonable o no concluir que las dos son distintas. En tales casos se prueba una o las demás de las siguientes hipótesis:

(1)

(2)

(3)

Sin embargo, es posible probar la hipótesis de que la diferencia es igual a, mayor o igual que, o menor o igual que algún valor distinto de cero.

Prueba de hipótesis: proporción de una sola población

La prueba de hipótesis respecto a las proporciones de una población se realiza casi en la misma forma que para las medias cuando se satisfacen las condiciones necesarias para

Ejercicios Unidad II: Técnicas de muestreo y pruebas de Hipótesis

Page 20: Ejercicios de Analisis U2

TECNOLÓGICO NACIONAL DE MÉXICO INSTITUTO TECNOLÓGICO DE MINATITLÁN

utilizar la curva normal. Pueden efectuarse pruebas unilaterales o bilaterales, dependiendo de la cuestión que se plantee.

Prueba de hipótesis: diferencia entre las proporciones de dos poblaciones

La prueba se realiza a la diferencia entre las proporciones de dos poblaciones que se utilizan con más frecuencia que aquella en la que su diferencia es cero. Sin embargo, es posible probar que dicha diferencia es igual a algún otro valor. Pueden llevarse a cabo pruebas tanto unilaterales como bilaterales.

Cuando la hipótesis nula que va a probarse es p1-p2=0, está suponiendo que las proporciones de las dos poblaciones son iguales. Se utiliza esto como justificación para combinar los resultados de las dos muestras y llegar a una estimación mancomunada de la proporción común supuesta.

Prueba de hipótesis : variancia de una sola población

La varianza es importante dado que nos ofrece una mejor visión de dispersión de datos.

Prueba de hipótesis: razón de las variancias de dos poblaciones

Las decisiones referentes a la comparación de las variancias de dos poblaciones se basan en general en la prueba de la razón de las variancias, que es una prueba de la hipótesis nula de que las variancias de dos poblaciones son iguales. Cuando se prueba la hipótesis de que las variancias de dos poblaciones son iguales, se está probando la hipótesis de que su razón es igual a 1.

TIPOS DE ERROR

Luego de diseñar el experimento, obtener datos y analizarlos, el investigador debe usar los resultados observados para tomar una decisión sobre sus hipótesis. Si se observa datos contrarios a la hipótesis nula, la decisión debe ser la de rechazarla a favor de la hipótesis alternativa. En el caso en que no se haya observado evidencia suficientemente fuerte en contra de la hipótesis nula, la decisión será la de no rechazarla. La decisión tomada debe ser fiel expresión de los datos observados. Idealmente los datos y por lo tanto, la decisión tomada, deben reflejar y ser cónsonas con la realidad poblacional desconocida. Sin embargo esto no siempre ocurre, aún en el experimento, encuesta o estudio mejor diseñado y realizado. Las medidas que se tomen siempre muestran variabilidad, pues los instrumentos tienen precisión finita. Además se introduce variabilidad al tomar una muestral. Por lo tanto, es posible que por mero accidente aleatorio, la muestra no refleje fielmente la población. Por estas razones, al tomar cualquier decisión, siempre existe siempre la posibilidad de cometer algún tipo de error estadístico.

Ejercicios Unidad II: Técnicas de muestreo y pruebas de Hipótesis

Page 21: Ejercicios de Analisis U2

TECNOLÓGICO NACIONAL DE MÉXICO INSTITUTO TECNOLÓGICO DE MINATITLÁN

Error tipo I

La realidad poblacional tiene sólo uno de dos posibles estados: la hipótesis nula es cierta; o la hipótesis nula es falsa. Si la hipótesis nula es cierta no debe ser rechazada a favor de la hipótesis alternativa. En el caso en que sea falsa debe ser rechazada a favor de la alternativa.

Sin embargo, los datos contienen necesariamente elementos de variación pues generalmente provienen de una muestra que puede ser o no representativa, los instrumentos de medición tienen una precisión limitada y los materiales usados pueden cambiar por distintos factores tal como la humedad del aire, temperatura, manejo o reacción con otros materiales. Una muestra, aún tomada científicamente siempre tendrá una pequeña probabilidad de no reflejar la realidad poblacional.

Aun habiendo usado una metodología científica para tomar la mejor muestra posible, obtenido datos con muy poco error experimental, y tomado una decisión cónsona a los datos observados, es posible que se cometa el error de tomar la decisión de rechazar la hipótesis nula aún siendo cierta.

Este tipo de error se conoce como error tipo I. La probabilidad de cometer un error tipo I se puede controlar y reducir, pero sólo se puede eliminar si nunca se toma la decisión de rechazar la hipótesis nula. Esta última situación no es deseable ya que llevaría a nunca descartar premisa alguna, no importa cuán irracional sea la misma o cuánto los datos obtenidos contradigan esa premisa. El investigador es conservador cuando selecciona una probabilidad muy pequeña de cometer error tipo I, pues sólo rechazará el status quo, la hipótesis nula, si obtiene evidencia muy contundente en contra de esta hipótesis. La probabilidad máxima de cometer error tipo I se conoce como la significancia de la prueba y se denota usualmente por la letra griega alfa. La probabilidad de cometer error tipo I se escribe de la siguiente manera:

= Proba (Rechazar H0 | H0 es cierta)

Los valores de uso más común para la significancia de una prueba son 0.01, 0.05 y 0.10. La significancia es en ocasiones presentada como un por ciento, tal como 1%, 5% o 10%. Esto quiere decir que con el fin de adelantar la ciencia, el investigador está dispuesto a permitir

Ejercicios Unidad II: Técnicas de muestreo y pruebas de Hipótesis

Page 22: Ejercicios de Analisis U2

TECNOLÓGICO NACIONAL DE MÉXICO INSTITUTO TECNOLÓGICO DE MINATITLÁN

una probabilidad de 0.01, 0.05, o 0.10 de rechazar la hipótesis nula cuando es cierta, o de cometer un error tipo I.

El valor de la significancia es seleccionado antes de comenzar a hacer el experimento en una de varias formas. El valor de puede estar dictado por el uso y costumbre de la disciplina, por ejemplo, de los artículos que se publican en revistas científicas. Otra forma de seleccionarlo es que sencillamente sea impuesto por la persona o compañía para la cual se trabaja y que son quienes pagan el salario de los investigadores. Finalmente, puede ser seleccionado tomando en cuenta el costo de cometer un error tipo I. Mientras más alto el costo, más pequeña debe ser la probabilidad de cometer error tipo I. El valor usual de en las ciencias naturales y sociales es de 0.05.

La probabilidad de error tipo I no puede ser igual a cero ya que si se desea = 0, nunca se podría tomar la decisión de rechazar la hipótesis nula. Siempre que se tome la decisión de rechazar la hipótesis nula, ya que la decisión se basa en una muestra y no en la población, existe una probabilidad positiva de cometer un error tipo I.

Error tipo II

En el caso en que la hipótesis nula sea falsa, cuando el valor del parámetro es consistente con la hipótesis alternativa, puede surgir la situación de que los datos obtenidos llevan al investigador a no rechazarla, cometiendo entonces un error tipo II. Usualmente no se controla este tipo de error directamente. El Lema de Neyman-Pearson2 dice que una vez se decide el nivel de error tipo I aceptable para el problema, la probabilidad de cometer error tipo II asume su valor mínimo al usar las pruebas estadísticas que se estudian aquí. Este valor mínimo no es cero e incluso puede ser considerado muy alto por algunos. Es usual denotar la probabilidad de error tipo II por la letra griega.

Entonces P (error tipo II) = θ = P( No rechazar H0 | H0 es falsa).

Ejercicios Unidad II: Técnicas de muestreo y pruebas de Hipótesis

Page 23: Ejercicios de Analisis U2

TECNOLÓGICO NACIONAL DE MÉXICO INSTITUTO TECNOLÓGICO DE MINATITLÁN

FÓRMULAS PARA LAS PRUEBAS DE HIPÓTESIS

Pruebas para medias, muestras grandes

Pruebas para medias, muestras pequeñas

Ejercicios Unidad II: Técnicas de muestreo y pruebas de Hipótesis

Page 24: Ejercicios de Analisis U2

TECNOLÓGICO NACIONAL DE MÉXICO INSTITUTO TECNOLÓGICO DE MINATITLÁN

Pruebas para variancias

Prueba para proporciones

BIBLIOGRAFÍA

Ejercicios Unidad II: Técnicas de muestreo y pruebas de Hipótesis

Page 25: Ejercicios de Analisis U2

TECNOLÓGICO NACIONAL DE MÉXICO INSTITUTO TECNOLÓGICO DE MINATITLÁN

http://www.edu-esta.org/materiales/Stats_text/Hyp_Tests.pdf

http://www.andragogy.org/_Cursos/Curso00195/Temario/pdf%20leccion%207/7%20PRUEBA%20DE%20HIPOTESIS.pdf

http://asignatura.us.es/dadpsico/apuntes/EstimacionEstadistica.pdf

https://es.wikipedia.org/wiki/Estimaci%C3%B3n_estad%C3%ADstica

http://www.vitutor.net/2/12/estimacion_estadistica.html

http://www.spentamexico.org/v5-n1/5(1)237-255.pdf

Wayne W. Daniel, BIOESTADÍSTICA. Base para el análisis de las ciencias de la salud. Editorial Limusa.

Ejercicios Unidad II: Técnicas de muestreo y pruebas de Hipótesis