ejemplo de muestra

14
Estadística Aplicada Ingeniería En Industrias Alimentarias IAM-0511 2 Teoría de la Estimación 2.1 Introducción a la Teoría de la Estimación 2.2 Propiedades de los Estimadores 2.3 Estimación Puntual 2.4 Estimación por Intervalos 2.4.1 Intervalos de Confianza para la Media con varianza conocida y con Varianza desconocida 2.4.2 Intervalos de Confianza para Proporciones 2.4.3 Intervalos de Confianza para una Varianza 2.5 Determinación del tamaño de una muestra para medias, y Proporciones En este documento se encuentra el temario y material desarrollado. 2 Teoría de la Estimación 2.5 Determinación del tamaño de una muestra para medias, y Proporciones TAMAÑO DE LA MUESTRA A la hora de determinar el tamaño que debe alcanzar una muestra hay que tomar en cuenta varios factores: el tipo de muestreo, el parámetro a estimar, el error muestral admisible, la varianza poblacional y el nivel de confianza.

Upload: everperez

Post on 05-Feb-2016

11 views

Category:

Documents


3 download

DESCRIPTION

6

TRANSCRIPT

Page 1: Ejemplo de Muestra

Estadística Aplicada

Ingeniería En Industrias Alimentarias

IAM-0511

2 Teoría de la Estimación 2.1 Introducción a la Teoría de la Estimación 2.2 Propiedades de los Estimadores 2.3 Estimación Puntual 2.4 Estimación por Intervalos

2.4.1 Intervalos de Confianza para la Media con varianza conocida y con Varianza desconocida

2.4.2 Intervalos de Confianza para Proporciones 2.4.3 Intervalos de Confianza para una Varianza

2.5 Determinación del tamaño de una muestra para medias, y Proporciones

En este documento se encuentra el temario y material desarrollado.

2 Teoría de la Estimación

2.5 Determinación del tamaño de una muestra para medias, y Proporciones

TAMAÑO DE LA MUESTRAA la hora de determinar el tamaño que debe alcanzar una muestra hay que tomar en cuenta varios factores: el tipo de muestreo, el parámetro a estimar, el error muestral admisible, la varianza poblacional y el nivel de confianza. Por ello antes de presentar algunos casos sencillos de cálculo del tamaño muestral delimitemos estos factores.

Para calcular el tamaño de una muestra hay que tomar en cuenta tres factores:1. El porcentaje de confianza con el cual se quiere generalizar los datos desde la

muestra hacia la población total.

Page 2: Ejemplo de Muestra

2. El porcentaje de error que se pretende aceptar al momento de hacer la generalización.

3. El nivel de variabilidad que se calcula para comprobar la hipótesis.

La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los resultados obtenidos. Esto quiere decir que un porcentaje del 100% equivale a decir que no existe ninguna duda para generalizar tales resultados, pero también implica estudiar a la totalidad de los casos de la población. Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser prácticamente imposible el estudio de todos los casos, entonces se busca un porcentaje de confianza menor. Comúnmente en las investigaciones sociales se busca un 95%.

El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipótesis que sea falsa como si fuera verdadera, o la inversa: rechazar a hipótesis verdadera por considerarla falsa. Al igual que en el caso de la confianza, si se quiere eliminar el riesgo del error y considerarlo como 0%, entonces la muestra es del mismo tamaño que la población, por lo que conviene correr un cierto riesgo de equivocarse.

Comúnmente se aceptan entre el 4% y el 6% como error, tomando en cuenta de que no son complementarios la confianza y el error.

La variabilidad es la probabilidad (o porcentaje) con el que se aceptó y se rechazó la hipótesis que se quiere investigar en alguna investigación anterior o en un ensayo previo a la investigación actual. El porcentaje con que se aceptó tal hipótesis se denomina variabilidad positiva y el porcentaje con el que se rechazó se la hipótesis es la variabilidad negativa

El muestreo es el proceso de tomar una proporción o parte de un universo de elementos, con la finalidad de analizar en dichos elementos, características sujetas a estudio o fenómenos factibles de observación y en base al análisis de la muestra o proporción tomada obtener conclusiones que se refieran no sólo a la muestra sino a todo el universo. Para fines estadísticos, el universo puede considerarse finito o infinito. Se considera finito si el número de elementos que lo constituyen es menor a 500,000 e infinito si es igual o mayor a este número. Siempre que hagamos la elección de una muestra, debemos tener cuidado de que ésta reúna las siguientes características:· Que sea suficiente: es decir que la cantidad de elementos seleccionados sea el que se requiere para que el nivel de confiabilidad sea el que se ha establecido previamente.· Que sea representativa: esto quiere decir que los elementos seleccionados deberán presentar características similares a las de la población o universo.Al utilizar muestras en lugar de universos tenemos grandes ventajas, algunas de las más importantes son:· El costo se reduce, pues los gastos serán únicamente los ocasionados por una parte del universo (muestra tomada) y no por la totalidad de él.· Si la muestra es representativa, las deducciones resultantes sobre el universo serán confiables.· Como solamente se estudia una parte del universo, la información obtenida se realiza en menor tiempo.

Page 3: Ejemplo de Muestra

¿Cómo obtener el tamaño de la muestra a utilizar?

Una de las preguntas planteadas con mayor frecuencia al iniciar una investigación y difícil de contestar, sobre todo por falta de información del problema, es: ¿cuántas observaciones se deben obtener para que el tamaño de la muestra sea realmente representativo del universo estadístico? En este sentido -la decisión del tamaño de la muestra de una población -, es necesario considerar que las muestras varían en su composición de una a otra. La magnitud de la variación depende del tamaño de la muestra y de la variabilidad original de la población. Así, el tamaño de la muestra queda determinada por el grado de precisión que se desea obtener y por variabilidad inicial de la población.

La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes:

1. Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a dicho nivel de confianza, un nivel de confianza igual o mayor al 92% es aceptable estadísticamente.

2. Evaluar la probabilidad a favor de que suceda un evento o situación esperada (esta probabilidad se le denomina p).

3. Evaluar la probabilidad en contra de que suceda en un evento o situación esperada (a esta probabilidad se le denomina q= 1 – p).

4. Determinar el error (e) máximo para el nivel de precisión que vayamos a permitir en los resultados (error máximo de estimación), comúnmente se trabaja con errores de estimación entre el 2% y el 6%, ya que la validez de la información se reduce demasiado para valores mayores del 6%.· Determinamos el tamaño de la población o universo.

5.- Se elige la fórmula a utilizar para calcular el tamaño de la muestra; dependiendo de si la población o universo sujeto a estudio se va a considerar infinito ó infinito. (Una población o universo se considera infinito si el número de elementos de los que consta es igual o mayor a 500,000 y es considerado finito si el número de elementos es menor a esta cantidad).

Diferentes niveles de confianza utilizados en la práctica

Nivel de Confianza 99.73% 99% 98% 96% 95.45% 95% 90% 80% 68.27% 50%

Valores de Z 3.00 2.58 2.33 2.05 2.00 1.96 1.645 1.28 1.00 0.6745

Page 4: Ejemplo de Muestra

El tamaño de la muestra:

Al realizar un muestreo probabilística nos debemos preguntar ¿Cuál es el número mínimo de unidades de análisis ( personas, organizaciones, capitulo de telenovelas, etc), que se necesitan para conformar una muestra ( que me asegure un error estándar menor que 0.01 ( fijado por el muestrista o investigador), dado que la población es aproximadamente de tantos elementos.

En el tamaño de una muestra de una población tenemos que tener presente además si es conocida o no la varianza poblacional.Para determinar el tamaño de muestra necesario para estimar con un error máximo permisible

prefijado y conocida la varianza poblacional ( ) podemos utilizar la formula:

(1)que se obtiene de reconocer que es el error estándar o error máximo prefijado y está dado por la

expresión para el nivel de confianza y constituye una medida de la precisión de

la estimación, por lo que podemos inferir además que .

Ejemplo 1

Se desea estimar el peso promedio de los sacos que son llenados por un nuevo instrumento en una industria. Se conoce que el peso de un saco que se llena con este instrumento es una variable aleatoria con distribución normal. Si se supone que la desviación típica del peso es de 0,5 kg. Determine el tamaño de muestra aleatoria necesaria para determinar una probabilidad igual a 0,95 de que el estimado y el parámetro se diferencien modularmente en menos de 0,1 kg.

Solución:

Evidentemente un tamaño de muestra no puede ser fraccionario por lo que se debe aproximar por exceso. El tamaño de muestra sería de 97.

Si la varianza de la población es desconocida, que es lo que mas frecuente se ve en la práctica el tratamiento será diferente, no es posible encontrar una fórmula cuando la varianza poblacional es desconocida por lo que para ello aconsejamos utilizar el siguiente procedimiento-

Primeramente, se toma una pequeña muestra, que se le llama muestra piloto, con ella se estima la varianza poblacional ( ) y con este valor se evalúa en la formula (1), sustituyendo ( ) por su

estimación ( ). El valor de obtenido será aproximadamente el valor necesario, nuevamente con

Page 5: Ejemplo de Muestra

ese valor de se extrae una muestra de este tamaño de la población se le determina la varianza a

esa muestra, como una segunda estimación de ( ) y se aplica de nuevo la formula (1), tomando

la muestra con el obtenido como muestra piloto para la siguiente iteración, se llegará a cumplir

con las restricciones prefijadas. Se puede plantear esta afirmación ya que la de tiende a

estabilizarse a medida que aumenta alrededor de la por lo que llegará el momento en que se encuentre el tamaño de muestra conveniente, sin embargo, en la práctica es mucho más sencillo pues, a lo sumo con tres iteraciones se obtiene el tamaño de muestra deseado, este procedimiento para obtener el tamaño de muestra deseado se puede realizar utilizando en Microsoft Excel en la opción análisis de datos las opciones estadística descriptiva para ir hallando la varianza de cada una de las muestras y la opción muestra para ir determinado las muestras pilotos. Para obtener el tamaño de la muestra utilizando este método recomendamos la utilización de un paquete de cómputo como por ejemplo el Microsoft Excel, aplicando las opciones muestra y estadística descriptiva.

Para determinar el tamaño de la muestra cuando los datos son cualitativos es decir para el análisis de fenómenos sociales o cuando se utilizan escalas nominales para verificar la ausencia o presencia del fenómeno a estudiar, se recomienda la utilización de la siguiente formula:

(2)

siendo sabiendo que:

es la varianza de la población respecto a determinadas variables.

es la varianza de la muestra, la cual podrá determinarse en términos de probabilidad

como

es error estándar que está dado por la diferencia entre ( ) la media poblacional y la media muestral.

es el error estándar al cuadrado, que nos servirá para determinar , por lo que =

es la varianza poblacional.

Ejemplo 2

De una población de 1 176 adolescentes de una ciudad X se desea conocer la aceptación por los programas humorísticos televisivos y para ello se desea tomar una muestra por lo que se necesita saber la cantidad de adolescentes que deben entrevistar para tener una información adecuada con error estándar menor de 0.015 al 90 % de confiabilidad.Solución:

= 1 176= 0,015

por lo que

Es decir para realizar la investigación se necesita una muestra de al menos 298 adolescentes.

Page 6: Ejemplo de Muestra

Cálculo del tamaño de la muestra

A la hora de determinar el tamaño que debe alcanzar una muestra hay que tomar en cuenta varios factores: el tipo de muestreo, el parámetro a estimar, el error muestral admisible, la varianza poblacional y el nivel de confianza. Por ello antes de presentar algunos casos sencillos de cálculo del tamaño muestral delimitemos estos factores.

Parámetro. Son las medidas o datos que se obtienen sobre la población. Estadístico. Los datos o medidas que se obtienen sobre una muestra y por lo tanto una estimación de los parámetros.

Error Muestral, de estimación o Standard. Es la diferencia entre un estadístico y su parámetro correspondiente. Es una medida de la variabilidad de las estimaciones de muestras repetidas en torno al valor de la población, nos da una noción clara de hasta dónde y con qué probabilidad una estimación basada en una muestra se aleja del valor que se hubiera obtenido por medio de un censo completo. Siempre se comete un error, pero la naturaleza de la investigación nos indicará hasta qué medida podemos cometerlo (los resultados se someten a error muestral e intervalos de confianza que varían muestra a muestra). Varía según se calcule al principio o al final. Un estadístico será más preciso en cuanto y tanto su error es más pequeño. Podríamos decir que es la desviación de la distribución muestral de un estadístico y su fiabilidad.

Nivel de Confianza. Probabilidad de que la estimación efectuada se ajuste a la realidad. Cualquier información que queremos recoger está distribuida según una ley de probabilidad (Gauss o Student), así llamamos nivel de confianza a la probabilidad de que el intervalo construido en torno a un estadístico capte el verdadero valor del parámetro.

Varianza Poblacional. Cuando una población es más homogénea la varianza es menor y el número de entrevistas necesarias para construir un modelo reducido del universo, o de la población, será más pequeño. Generalmente es un valor desconocido y hay que estimarlo a partir de datos de estudios previos.

Tamaño de muestra para estimar la media de la población

Veamos los pasos necesarios para determinar el tamaño de una muestra empleando el muestreo aleatorio simple. Para ello es necesario partir de dos supuestos: en primer lugar el nivel de confianza al que queremos trabajar; en segundo lugar, cual es el error máximo que estamos dispuestos a admitir en nuestra estimación. Así pues los pasos a seguir son:

Page 7: Ejemplo de Muestra

Veamos los pasos necesarios para determinar el tamaño de una muestra empleando el muestreo aleatorio simple. Para ello es necesario partir de dos supuestos: en primer lugar el nivel de confianza al que queremos trabajar; en segundo lugar, cual es el error máximo que estamos dispuestos a admitir en nuestra estimación. Así pues los pasos a seguir son:

1.- Obtener el tamaño muestral imaginando que N

Donde:

: z correspondiente al nivel de confianza elegido

: varianza poblacional e: error máximo

2.- Comprobar si se cumple

Si esta condición se cumple el proceso termina aquí, y ese es el tamaño adecuado que debemos muestrear.

Si no se cumple, pasamos a una tercera fase:

3.- Obtener el tamaño de la muestra según la siguiente fórmula:

Veamos un ejemplo:

La Consejería de Trabajo planea un estudio con el interés de conocer el promedio de horas semanales trabajadas por las mujeres del servicio doméstico. La muestra será extraída de una población de 10000 mujeres que figuran en los registros de la Seguridad Social y de las cuales se conoce a través de un estudio piloto que su varianza es de 9.648. Trabajando con un nivel de confianza de 0.95 y estando dispuestos a admitir un error máximo de 0,1, ¿cuál debe ser el tamaño muestral que Empleemos?.

Page 8: Ejemplo de Muestra

Buscamos en las tablas de la curva normal el valor de que corresponde con

el nivel de confianza elegido: = ±1.96 y seguimos los pasos propuestos arriba.

1.

2.- Comprobamos que no se cumple, pues en este caso 10000 < 3706 (3706 - 1); 10000 < 13730730

3.-

Tamaño de muestra para estimar la proporción de la población

Para calcular el tamaño de muestra para la estimación de proporciones poblaciones hemos de tener en cuenta los mismos factores que en el caso de la media. La fórmula que nos permitirá determinar el tamaño muestral es la siguiente:

donde

: z correspondiente al nivel de confianza elegido P: proporción de una categoría de la variable e: error máximo N: tamaño de la población Siguiendo con el estudio planteado en el punto anterior, supongamos que tratamos de estimar la proporción de mujeres que trabajan diariamente 10 horas o más. De un estudio piloto se dedujo que P=0.30, fijamos el nivel de confianza en 0.95 y el error máximo 0.02.

TAMAÑO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO SIMPLE ALEATORIO

Page 9: Ejemplo de Muestra

 Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente relación:  

de donde: n = tamaño de la muestra. N = tamaño de la población.  = variable estandarizada de distribución normal. S² = varianza de la muestra. d(e) = precisión del muestreo.  = Nivel de significancia. Generalmente es necesario hacer un premuestreo de 30 elementos, con el objetivo de hacer una primera estimación de S². Ejemplo: En un lote de frascos para medicina, con una población de 8000 unidades, se desea estimar la media de la capacidad en centímetros cúbicos de los mismos. A través de un premuestreo de tamaño 35 se ha estimado que la desviación estándar es de 2 centímetros cúbicos. Si queremos tener una precisión 0.25 cms3, y un nivel de significancia del 5%. ¿De que tamaño debe de ser la muestra? DATOS: S = 2 cms3; N = 8000; d = 0.25 cms3; = 0.05 (5%)  = 1.96 

Frascos.

 Solo faltaría muestrear 204 frascos, pues los datos de los 35 frascos del premuestreo siguen siendo válidos.

 TAMAÑO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON MUESTREO SIMPLE ALEATORIO

Page 10: Ejemplo de Muestra

 En bastantes ocasiones, la variable bajo estudio es de tipo binomial, en ese caso para calcular el tamaño de muestra bajo el muestreo simple aleatorio, se haría de la siguiente manera:

De donde: p = probabilidad de éxito. q = probabilidad de fracaso. d = precisión expresada en porcentaje. En este caso para la estimación de la varianza, tenemos dos opciones: a) hacer un premuestreo.b) asumir varianza máxima. Ejemplo: En una investigación, se desea determinar en que proporción los niños de una región toman leche en el desayuno. Si se sabe que existen 1.500 niños y deseamos tener una precisión del 10 %, con un nivel de significancia del 5 %. ¿De que tamaño debe de ser la muestra? DATOS: N = 1500; d = 10 % = 0.1; α = 5 %  p = 0.5 y q = 0.5 (asumiendo varianza máxima). Zα/2 = 1.96

Se deben de muestrear 90 niños.