muestreo y estimación uca

Post on 27-Jun-2015

63 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

UNIVERSIDAD CENTROAMERICANAUNIVERSIDAD CENTROAMERICANA

Tema:

MUESTREO Y ESTIMACION

OCTUBRE 2010

VENTAJAS DEL MUESTREO. Menor costo para obtener la información Mayor oportunidad en los datos recolectados

debido a la mayor rapidez en la obtención de datos menos numerosos.

Mayor factibilidad de realizar un muestro en casos en donde al obtener una

observación se destruye el objeto observado. Mejor calidad de la información.

MUESTREO Y ESTIMACION– METODOS DE MUESTREO

• MUESTREO NO PROBABILISTICO - Se usan el conocimiento, la experiencia y la opinion

personal para identificar los elementos de la población que van a incluirse en la muestra. Desafortunadamente, si se hace uso del muestreo no probabilistico no se podra medir la precisión que alcancen las estimaciones.

.• MUESTREO PROBABILISTICO

- Es un método de muestreo en el cual cada elemento de la población tiene una probabilidad conocida (no igual a cero) de ser incluido en la muestra.

MUESTREO Y ESTIMACION

TIPOS DE MUESTREOS PROBABILISTICOS

MUESTRA ALEATORIA SIMPLE: pasos a seguir: Construir el marco muestral (Lista completa y actualizada de

todos los elementos de la población) Especificar si el muestreo será con o sin reposición. Con reposición P=1/N y sin reposición P=1/NCn

Asignar códigos, elegir una entrada, elegir una dirección. Elegir la muestra.

Ejemplo: Seleccione una muestra de tamaño 3 de esta clase.

MUESTREO Y ESTIMACION

• MUESTRA ALEATORIA SISTEMATICA

1. Numerar u ordenar los elementos poblacionales

2. Obtener el intervalo de muestreo: k = N/n 3. Seleccionar al azar un punto de arranque

r donde 1 <r<k 4. Tomar cada k-ésimo elemento a partir del

punto de arranque r La muestra estará formada por los n números: r, r + k, r + 2k, . . . r + nk

Muestreo y Estimacion

Ejemplo: Un auditor quiere investigar el total de páginas que tienen los documentos de una empresa. En su poder hay 280 documentos numerados del 001 al 280.

a) Seleccione una muestra aleatoria simple de 20 cuentas.

b) Selecciona una muestra aleatoria sistemática de 20 cuentas.

MUESTREO Y ESTIMACION

1.4 MUESTREO ALEATORIO ESTRATIFICADO

Consiste en dividir la población en sub-poblaciones o estratos de manera de que cada estrato debe presentar una pequeña variación en su interior con respecto a la característica de interés X que estemos investigando, y entre los distintos estratos las diferencias sean las más grandes posibles. Luego seleccionamos una sub-muestra de cada estrato utilizando muestreo aleatorio simple para finalmente conformar la muestra aleatoria estratificada.

Muestreo y Estimacion MUESTREO ALEATORIO POR CONGLOMERADOS. Consiste en dividir la población en colecciones de

elementos que llamaremos conglomerados de tal forma que lo ideal es que cada conglomerado se parezca a los demás.

Considerando a estos conglomerados como unidades muestrales tomamos una muestra aleatoria simple de conglomerados y después hacemos un censo a cada conglomerado. El muestreo por conglomerados parte de la base de que en ocasiones existen agrupamientos naturales de los elementos de la población, que se convierten en subpoblaciones; estas podrian ser zonas geográficas, políticas o sociales.

Muestreo y Estimación

DISTRIBUCION MUESTRAL DE UN ESTIMADOR Supongamos que tenemos un estimador cualesquiera de un

parámetro de cierta población Consideremos todas las muestras posibles de tamaño n que

pueden seleccionarse de esa población y calculemos para cada muestra un estimado del parámetro. A partir de todos los estimados podemos obtener una distribución de probabilidad del estimador, que será llamada la distribución muestral del estimador.

Es precisamente la media y la varianza de la distribución muestral del estimador lo que nos ayudará a conocer las propiedades deseables de un estimador para hacer las mejores inferencias sobre los parámetros.

PROPIEDADES DE UN ESTIMADOR Supondremos que (theta) representa un parámetro cualquiera de cierta población y

que ( theta con acento circunflejo ) representa su estimador correspondiente Un buen estimador de un parámetro debe cumplir básicamente las siguientes propiedades:

Insesgadura. Un estimador de un parámetro es insesgado si tiene una distribución muestral con

media de igual a , lo cual denotaremos así Eficiencia Si se tienen dos estimadores 1 y 2 de un mismo parámetro y la varianza

del estimador σ 1 es menor que la varianza del estimador σ2 , lo cual denotaremos así. <

Entonces el estimador 1 es más eficiente que el estimador 2

Suficiencia: Un estimador es suficiente si hace uso de toda la informacion disponible en la muestra.

Consistencia : Al incrementarse el tamaño de muestra la variación entre la media de la muestra y la media de la poblacion se hace mas pequeña.

2

1 2ˆ2

Muestreo y Estimacion Consideraremos la desviación estándar del estimador , denotada por como un error de muestreo esperado (promedio) que

será llamado error estándar del estimador y que vendrá a ser un indicador de la precisión del estimador

MUESTREO EN POBLACIONES CON UNA DISTRIBUCION DE PROBABILIDAD

Puede demostrarse que si tenemos un población cuya variable de interés X tiene una distribución de probabilidad con media y desviación estándar entonces seguirá una distribución de probabilidad con

y para cualquier n

siempre que el muestro se haya realizado de una población infinita o bien muestreamos con reposición de una población finita.

μμX n

σ σX

ˆ

Muestreo y Estimacion

En símbolos tendríamos que

Si el muestreo se hizo sin reposición de una población finita de tamaño N, se debe usar el factor de corrección para población finita (F C P F) al expresar el error estándar de x así

) n

, ( X ) , ( X Xormal Normal ~ ~ XN

l - N

n - N

n

σ σX

Muestreo y Estimacion

Muestreo en poblaciones normales Puede demostrarse que si tenemos una

población normal con media y desviación estándar entonces seguirá también una distribución normal

En símbolos tendríamos que )

n , ( X ) , ( X Xormal Normal ~ ~ XN

Muestreo en poblaciones no normales Teorema del límite central Si muestreamos una población no normal, con media y

desviación estandar , utilizando un tamaño de muestra suficientemente grande, esto es n 30, entonces tendrá una distribución aproximadamente normal.

En símbolos tendríamos que

siempre que el muestro se haya realizado de una población infinita

) n

σ σ ,μ μ ( Normalaprox. X 30 ny ) σ ,μ ( Normal No X XX ~ ~

Estimador puntual y por intervalo Un estimador puntual de un parámetro es aquel que

proporciona un único estimado de ese parámetro al utilizar los datos muestrales.

Un estimador por intervalo de confianza de un parámetro es aquel que define un par de variables aleatorias Li y Ls (que llamaremos límite inferior y límite superior del intervalo) entre los cuales diremos que hay una probabilidad de 1 - (que llamaremos nivel de confianza) de que el parámetro se encuentre entre dichos límites; y también diremos que hay una probabilidad (que llamaremos riesgo) de que no se encuentre entre dichos límites.

ESTIMADOR PUNTUAL DE Un estimador puntual de la media poblacional es la media muestral

ESTIMADOR POR INTERVALO PARA ( CONOCIDA) Un estimador por intervalo de confianza del (1 - )100%

para estará dado por

donde será el límite inferior y será el límite superior del intervalo.

N

xN

n

X

X

n

i

z - X /2 X z Xx/2

x/2 σ z X

Si la población es infinita

Si la población es finita. para cualquier n. Determinación del tamaño de muestra Para una población infinita SI

1 - N

n - N

n

σ z X /2

n

σ z X /2

2

E

σ z n /2

2

E

σ z n /2

o

0.05, N

no

) 1 - N ( n

Nn n

o

o

POB. FINITA

n0 puede reducirse

Muestreo y Estimación

EJEMPLO Consideremos el conjunto de todas las pequeñas industrias de

un determinado artículo. Se quiere estimar la producción anual promedio de las industrias y se sabe, en base a estudios anteriores, que la desvia ción estándar poblacional de las producciones anuales es igual a 2 en miles de unidades. Con tal propósito se selecciona de un listado actualizado de 850 industrias una muestra aleatoria de 50 industrias, obteniendo una producción anual promedio de 5.52 en miles de unidades.

Encuentre un intervalo de confianza del 90% para la producción anual promedio

Cual debe ser el tamaño de muestra necesario si se quiere estimarla producción anual promedio con un error má.ximo permitido de 300 unidades

MUESTREO Y ESTIMACION

Se desea estimar la venta promedio por cliente, en córdobas, de una tienda. Sobre la base de datos de otras tiendas similares, se sabe que la desviación estándar de ese tipo de ventas es de aproximadamente C$ 3200.

¿Qué tamaño de muestra se debe utilizar, como mínimo, si desea estimar la venta promedio con un margen de error de C$ 1000 y una confianza del 99%?

MUESTREO Y ESTIMACION

La distribución t de Student Se utiliza cuando la desv. estándar poblacional es desconocida y n es

menor que 30 Esto da como resultado que la estandarización de ya no sea la variable

aleatoria Z sino otra variable aleatoria que representaremos por t y que tendrá una distribución de probabilidad conocida con el nombre de distribución t de Student con n – 1 grados de libertad, ya que fue investigada originalmente por William Gossett, quien publicó sus escritos con el seudónimo “Student”.

El hecho de tener que estimar el parámetro con los mismos n datos que se utilizan para poder calcular el valor del estadístico t, hace que t pierda un grado de libertad, esto es, que quede con n – 1 grados de libertad (g.l).

MUESTREO Y ESTIMACION

CARACTERISTICAS 1. Es una familia de distribuciones t de tal forma que cada vez que se

especifiquen sus grados de libertad n – 1, se produce una distribución t particular.

2. Es simétrica y de forma acampanada 3. Como es ligeramente superior a 1, la distribución t es aplastada en

comparación a la normal estándar, es decir, platicúrtica. 4. Cuando el número de grados de libertad tiende a infinito, la

distribución t se convierte en distribución Z. La distribución t se considera muy parecida a la distribución Z

cuando n 30

MUESTREO Y ESTIMACION

ESTIMADOR POR INTERVALO PARA

Un estimador por intervalo de confianza del ( 1 - ) 100% para está dado así:

Para una población infinita siempre que n 30 Para una población finita siempre que n 30

n

S t X /2

1 - N

n - N

n

S t X /2

MUESTREO Y ESTIMACION

Observación 1. Si la población es normal y n 30 entonces según la característica

4 de la distribución t, podemos escribir en todas las fórmulas anteriores z como una aproximación de t

Observación 2. Si la población es no normal, pero n 30 entonces según el

teorema del límite central y la característica 4 de la distribución t, también podemos escribir en todas las fórmulas anteriores z como una aproximación de t.

Según la distribución poblacional y el tamaño de muestra se presentan en la tabla de abajo distintas situaciones en las cuales los estadísticos Z o t pueden ser utilizados.

MUESTREO Y ESTIMACION

Ejemplo: Un auditor quiere estimar el saldo promedio y el saldo total de una población de 1000 cuentas por cobrar. Con tal propósito selecciona al azar una muestra de 6 cuentas, obteniendo los siguientes resultados en miles de córdobas.

2.6 , 3.0 , 3.5 , 2.4 , 2.0 1.5 Si suponemos que los saldos de las cuentas se

distribuyen aproximadamente normal. Determine un intervalo de confianza del 90% para: el saldo promedio de las cuentas si la media es 2.5 en

miles de córdobas y la desv. estándar de 0.7099

MUESTREO Y ESTIMACION

ESTIMADOR POR INTERVALO DE CONF PARA P

Para una población infinita

Para una población finita

n

) p - 1 ( p z p SS/2 S

1 - Nn - N

n) p - 1 ( p z p SS

/2S

MUESTREO Y ESTIMACION

Para una población infinita

Para una población finita

Si puede reducirse

2

/2

Ez

p)p(1n

2/2

0 Ezp)p(1n

0.05, N

no ) 1 - N ( n

Nn n

o

o

on

Muestreo y Estimación

Ejemplo: El gerente de una cadena de tiendas de departamentos desea determinar la proporción de poseedores de tarjetas de crédito que comprarían en las tiendas, si estuvieran abiertas, los domingos. Con tal propósito decide seleccionar una muestra aleatoria de 100 tarjeta-habientes, la cual informó que 60 comprarían los domingos.

Encuentre un intervalo de confianza del 99% para la proporción real de tarjeta-habientes que comprarían los domingos.

top related