mic sesión 6

40
MÉTODOS DE INVESTIGACIÓN CUANTITATIVA Sesión 6 DISTRIBUCIÓN NORMAL. DISTRIBUCIONES MUESTRALES. ESTIMACIÓN FÁTIMA PONCE 1

Upload: metodoscuantitativos

Post on 21-Jan-2017

80 views

Category:

Education


0 download

TRANSCRIPT

Page 1: Mic sesión 6

MÉTODOS DE INVESTIGACIÓN CUANTITATIVA

Sesión 6

DISTRIBUCIÓN NORMAL. DISTRIBUCIONES MUESTRALES. ESTIMACIÓN

FÁTIMA PONCE 1

Page 2: Mic sesión 6

FÁTIMA PONCE 2

PUNTOS A TRATAR

Sesión 6:

DISTRIBUCIÓN NORMAL. DISTRIBUCIONES MUESTRALES. ESTIMACIÓN.

Distribución de Muestreo.Estimación Puntual y Estimación por Intervalo.

Propiedades de los estimadoresEjercicios.

Page 3: Mic sesión 6

FÁTIMA PONCE 3

ESTADÍSTICA INFERENCIAL: IMPORTANCIA DE LA MUESTRA

La estadística inferencial requiere explicitar el vínculo que hay entre la población y la muestra (usualmente a través de un modelo probabilístico).

Por ejemplo, en el contexto inferencial, la edad promedio de los encuestados (muestra) es una estimación de la edad poblacional. ¿Qué tan confiable será esta estimación?, depende de:1) la cantidad de personas encuestadas (tamaño de la

muestra) 2) Qué tan heterogénea es la población? 3) Características del proceso de estimación

(propiedades del estimador).

Page 4: Mic sesión 6

FÁTIMA PONCE 4

DISTRIBUCION DE MUESTREO Si se quisiera saber la estatura promedio de los niños

peruanos de 10 años. Se podría tomar varias muestras de “n” niños peruanos

de 10 años y calcular en cada una de ellas su valor medio (Xbarra) y su desviación estándar (s).

Las estadísticas resultantes de cada muestra no necesariamente serían iguales, lo más probable es que varíen de muestra en muestra.

Distribución de muestreo de la media: es una distribución de probabilidad de todas las medias posibles de las muestras.

También se puede tener: Distribución de muestreo de la mediana, de las desviaciones, o de una proporción.

Page 5: Mic sesión 6

FÁTIMA PONCE 5

DISTRIBUCION DE MUESTREO DE LA MEDIA

POBLACIÓN (N)Variable aleatoria X=Estatura

µ2

 Muestra 1x1

xn

 

.

.

.

 

.

.

.

Distribución de Muestreo de la Media

(tiene una media y una variabilidad)

Es una VariableAleatoria

Es una distribución de probabilidad de las medias de todas las muestras posibles.

Muestra 2x1

xn

Muestra kx1

xn

Page 6: Mic sesión 6

FÁTIMA PONCE 6

Distribución de la población tiene como parámetros:

(media de la distribución de la población) y, (desviación estándar de la población).

DISTRIBUCIÓN DE MUESTREO DE LA MEDIA

Distribución muestral de la media tiene parámetros: _ = media de la distribución muestral de las medias x _ = error estándar de la media muestral (SE) x

Cada distribución de frecuencia de la muestra tiene: _ su propia media muestral = X y su propia desviación estándar = s

Page 7: Mic sesión 6

FÁTIMA PONCE 7

Distribución de Muestreode la Media

x1 x2

xkx3

Distribución de las “k” muestrasDistribución de lapoblación

POBLACIÓN Y DISTRIBUCIÓN DE MUESTREO

x

nx

s1 s2

s3 sk

X

Page 8: Mic sesión 6

FÁTIMA PONCE 8

Cuando la población está distribuida normalmente, la distribución de muestreo de la media también es normal.

1. La media de la distribución de muestreo es igual a la media de la población:

DISTRIBUCION DE MUESTREO (POBLACIÓN NORMAL)

_ = / n X

_ =

X

2. El error estándar de la distribución de muestreo es igual a la desviación estándar de la población entre la raíz cuadrada de n

Page 9: Mic sesión 6

FÁTIMA PONCE 9

Si la población no tiene distribución normal: Se aplica el Teorema del Límite Central, que muestra una relación entre la forma de la distribución de la población y la forma de la distribución de muestreo:

POBLACIÓN NO NORMAL Y TEOREMA DEL LÍMITE CENTRAL

“La distribución de muestreo de la media se aproxima a la normal al incrementarse el tamaño de la muestra”.

Si n > 30 se emplea la distribución normal.

Page 10: Mic sesión 6

FÁTIMA PONCE 10

ESTANDARIZACIÓN

Si se quisiera estandarizar la media muestral: _

x - Z = ----------

_ x

_ x -

Z = ------------- / n

_ X N( , 2/n ) para n suficientemente grande

Page 11: Mic sesión 6

FÁTIMA PONCE 11

1. Distribución Muestral de la media se caracteriza por:

2. Sólo nos basamos en una muestra de la población.3. Pregunta:¿Nuestra media en esa muestra ( ) se encuentra

cerca de la media de la distribución muestral ( )?. Si está cerca tendremos una buena estimación de µ.

RESUMIENDO:

_ = /n

X

_ =

X

xX

4. Para evaluar ello:i) Estimar

ii) Probar hipótesis: - Si la prob. de que nuestra esté cerca a = µ es alta el

investigador podrá generalizar. - Si la prob. de que nuestra esté cerca a = µ es baja dudará

en generalizar.

X

xX

X x

Page 12: Mic sesión 6

FÁTIMA PONCE 12

ESTIMACIÓN:

“Conjetura educada y en base a datos, acerca de una magnitud desconocida”.

Walter Sosa

Page 13: Mic sesión 6

FÁTIMA PONCE 13

TIPOS DE ESTIMACIÓN

1. Estimación Puntual: Utiliza un estadístico para obtener Un solo valor puntual

estimado del parámetro a partir de la información de muestreo. _ ^

X ó 2. Estimación por Intervalo o Intervalo de Confianza (IC).

Un IC denota el rango dentro del cual puede encontrarse el parámetro y el nivel de confianza que el intervalo contiene el parámetro. (“Intervalo de confianza de 95% el parámetro tal…”.)

_ _ (LI, LS) = ( X - a , X + a)

Page 14: Mic sesión 6

FÁTIMA PONCE 14

ESTIMACIÓN PUNTUAL

Parámetro Poblacional

= Media poblacional de X

= Desviación estándar poblacional de X P= proporción poblacional

Estimador Puntual

_ n

X = Media muestral de X = xi / n i=1

_s = Desviación (xi-X)2

estándar = --------- muestral de X (n-1) p = proporción muestral = n1/n

Page 15: Mic sesión 6

FÁTIMA PONCE 15

PROPIEDADES DE UN BUEN ESTIMADOR

INSESGADEZ: Un estimador es insesgado si la media de su distribución muestral es igual al parámetro correspondiente

EFICIENCIA: Dado un conjunto de estimadores insesgados el estimador más eficiente es el que tiene la menor varianza.

CONSISTENCIA(propiedad cuando n es grande): Para que el estimador sea consistente debe ser insesgado y su varianza debe tender a 0 a medida que n se incrementa.

SUFICIENCIA: Si utiliza tanta información de la muestra que ningún otro estimador puede extraer información adicional acerca del parámetro poblacional que se está estimando.

_ Para la media muestral: E(X) = ^ ^ En general para un estimador : E() =

Page 16: Mic sesión 6

FÁTIMA PONCE 16

Denota el rango dentro del cual puede encontrarse el parámetro y el nivel de confianza que el intervalo contiene el parámetro poblacional.

ESTIMACIÓN INTERVALO (IC)

_ I.C. para estimar = X margen de error

Estimación puntual

Depende de:i) El nivel de confianza

deseado 100(1-)%, dado por el valor Z, y;

ii) Si conocemos o no .

Page 17: Mic sesión 6

FÁTIMA PONCE 17

ESTIMACIÓN INTERVALO (IC)

Los IC tienen un Límite Inferior (LI) y un Límite Superior (LS)

_LI= X - margen de error

_ LS= X + margen de error

INTERPRETACIÓN: “Un 100(1-)% de confianza de que la media poblacional desconocida (µ) esté entre el LI y el LS”.

Page 18: Mic sesión 6

FÁTIMA PONCE 18

_

X Z _

X

IC para estimar

s _ = s /n X

_X Z s _

X

s debe ser estimada

Cuando se conoce : Cuando no se conoce :

_ = /n

X

Z es el valor de la tabla Z al nivel de confianza deseado 100(1-)%,

Page 19: Mic sesión 6

FÁTIMA PONCE 19

RECORDAR

Nivel de confianza: Probabilidad que asociamos con una estimación de intervalo. 99%

95%

90%

Valores de Z para los niveles de confianza más usados: Nivel de confianza /2 Z/2 90% .10 .05 1.65 95% .05 .025 1.96 99% .01 .005 2.58

Page 20: Mic sesión 6

FÁTIMA PONCE 20

INTERVALO DE CONFIANZA (resumen)

I.C. de 99% para estimar la media ():Si se conoce _ X 2.58 / n

Si no se conoce _ X 2.58 s/ n

I.C. de 95% para estimar la media ():

Si se conoce _ X 1.96 / n

Si no se conoce _ X 1.96 s/ n

Page 21: Mic sesión 6

FÁTIMA PONCE 21

Por ejemplo: Se desea calcular un IC para el sueldo anual inicial para graduados de Gestión. No se conoce .

PASOS PARA ESTIMACIÓN IC

_ I.C. para estimar = X Z s _

X

1. Se calcula la media muestral (estimación puntual)2. Como no se conoce se debe calcular la desviación

estándar muestral (s), para obtener s _ = s/n

X

3. Se hace uso de la Regla Empírica para hallar Z.4. Se tiene :

Page 22: Mic sesión 6

FÁTIMA PONCE 22

EJERCICIOS

Page 23: Mic sesión 6

FÁTIMA PONCE 23

EJERCICIO 1

Suponga que tiene una muestra aleatoria de 256 gerentes de Lima. Un elemento de interés es su ingreso anual. La media muestral es S/ 45,420 y la desviación estándar muestral es S/ 2,050.

a) ¿Cuál es el ingreso medio estimado de todos los gerentes de Lima?.

b) ¿Cuál es el IC de 95% para la media de la población?.

c) Interprete los resultados.

n=256 media muestral=S/45,420 s=S/ 2,050.

Page 24: Mic sesión 6

FÁTIMA PONCE 24

a)Ingreso medio estimado de todos los gerentes (la población)? = Es la media muestral =S/ 45,420 = Estimación Puntual para µ.

b) IC de 95% para la media de la población: _ X 1.96 s/ n = 45420 1.96 (2050/ 256 )= 45420 251.125 LI=45168.9 LS=45671.1 Intervalo de Confianza para µ

EJERCICIO 1: Estimación de µ

Page 25: Mic sesión 6

FÁTIMA PONCE 25

c) Interpretación: Si hubiera tiempo para seleccionar muchas muestras de

tamaño 256 de la población, y calcular sus medias muestrales y los IC, la media poblacional () del ingreso anual se encontraría aprox. en 95 de los 100 IC.

Aprox. 5 de los 100 IC no incluyen a la media poblacional del ingreso anual.

EJERCICIO 1: Estimación de µ

Page 26: Mic sesión 6

FÁTIMA PONCE 26

Con una muestra de 100 clientes se obtiene un recibo de luz promedio de S/. 80 y una s=10.

a. Hallar IC para la media poblacional al 99% y al 95%.

b. ¿Cuál es más estrecho?

c. ¿Hay alguna relación entre el nivel de confianza y la amplitud del IC?

EJERCICIO 2: Relación entre Nivel de Confianza e IC

Page 27: Mic sesión 6

FÁTIMA PONCE 27

_

n = 100 clientes, X = 80 y s=10.

Hallar IC para la media poblacional al 99% y al 95%.

EJERCICIO 2: Relación entre Nivel de Confianza e IC

I.C. al 99% para

I.C. al 95% para = 80 1.96 (10/100)

LI LS

El IC del 95% es más estrecho Para > grado de confianza (> exactitud), el margen de error (ancho del IC) debe ser > (se sacrifica precisión en el IC).

77.42 82.58

2.58 (10/100)= 80

78.04 81.96

Page 28: Mic sesión 6

FÁTIMA PONCE 28

Estimación de una Proporción de la población

A veces se desea estimar una proporción de unidades de una población (P= conteo del número de elementos que poseen la característica de interés con relación al número total) y no necesariamente el parámetro poblacional.

Estimación Puntual: Si el número de éxitos en la muestra es n1 y en la

muestra hay n observaciones Estimación puntual de la proporción de la población (P) es la proporción muestral: p = n1/n

Page 29: Mic sesión 6

FÁTIMA PONCE 29

I.C. para P = p Z _

p

IC para una Proporción de la población (P)

_ = p(1-p)/n

p

Error estándar de la proporción

p = proporción muestralZ = valor Z que depende de (1-)% elegido.n = tamaño de la muestra.

I.C. para estimar P = p Z p(1-p)/n

Page 30: Mic sesión 6

FÁTIMA PONCE 30

EJERCICIO 3: Estimación de P

Suponga que el dueño de una gasolinera está interesado en la proporción de mujeres que compran gasolina con tarjeta de crédito. Después de realizar un estudio con 100 mujeres, pudo determinar que 80 de sus clientes pagaban con tarjeta de crédito.

a) ¿Cuál es la proporción estimada puntual de mujeres en la población que pagan sus consumos de gasolina con tarjeta de crédito?

b) Elabore un intervalo de confianza del 95% para la proporción de mujeres que pagan la gasolina con tarjeta de crédito.

Page 31: Mic sesión 6

FÁTIMA PONCE 31

EJERCICIO 3: Estimación de P

p Z p(1-p)/n

I.C. para estimar P = p Z p(1-p)/n

= 0.8 1.96 (0.8(1-0.8)) / 100

= 0.8 0.0784

LI=0.722 y LS=0.878

b)

a) = 80/100 = 0.8 Estimación Puntual de P.

Estimación por Intervalo o IC para P.

Page 32: Mic sesión 6

FÁTIMA PONCE 32

CONTROL DEL ANCHO DE UN INTERVALO

Como se ha visto, es preferible un IC más estrecho debido a la precisión que proporciona.

Hay 2 formas para lograr un IC más preciso:i) Reducir el nivel de confianza (1-)% El valor de Z al 99% es 2.58 y el valor de Z al 95% es 1.96.

Por lo que el IC al 95% es más estrecho que al 99%. El costo de mayor precisión del IC es que el nivel de

confianza bajó a 95% (la probab. del error aumentó a 5%).ii) Aumentar el tamaño de la muestra. Al aumentar n se puede reducir el error estándar: /n.

Page 33: Mic sesión 6

FÁTIMA PONCE 33

PARA MUESTRAS GRANDES

Si n > 30 Se emplea la distribución Normal Estándar: Z

Hay dos casos:

Se conoce

No se conoce , se requiere estimar “s” con los datos de la muestra grande (al menos 30 obs).

_ X - µ Z= --------- s / n

Page 34: Mic sesión 6

FÁTIMA PONCE 34

PARA MUESTRAS PEQUEÑAS

Si n 30 se emplea la distribución t de Student: t .

En general la t se emplea cuando:

es desconocida. la muestra es pequeña (n 30).

Al utilizar la t suponemos que la distribución poblacional es normal o casi normal.

Page 35: Mic sesión 6

FÁTIMA PONCE 35

DISTRIBUCIÓN t DE STUDENT

Características:AcampanadaSimétricaMás planaNo se conoce σ

0zt

“t” con 5 grados de

libertad

Normal Estándar

“t” con13 grados de

libertad

Page 36: Mic sesión 6

FÁTIMA PONCE 36

El estadístico t se calcula como:

_

X - µ s_ x

t =

Estadístico t e IC para muestras pequeñas

IC para estimar la media poblacional () en muestras pequeñas:

_ _I.C. para estimar = X±t(s_) = X ±t/2

(n-1) s/n x

Valor de tabla de la t-student con (n-1) grados de libertad para un nivel de /2.

Page 37: Mic sesión 6

FÁTIMA PONCE 37

EJERCICIO 4: Estimación IC para µ, con muestra pequeña

Una empresa está considerando un programa asistido por computadora con el fin de capacitar a sus empleados. Para evaluar este programa, el gerente solicita una estimación de la media poblacional del tiempo requerido para que los empleados completen la capacitación. Considere una muestra de 20 empleados que siguen la capacitación.

Halle un IC para la media si tiene la siguiente tabla.Duración de la capacitación, en días (para 20 empleados)

52 59 54 4244 50 42 4855 54 60 5544 62 62 5745 46 43 56

Page 38: Mic sesión 6

FÁTIMA PONCE 38

EJERCICIO 4: Estimación IC para µ, con muestra pequeña

Datos intermedios: x = 1030

(x- )2 = 889 Media Muestral = 51.5 días. Desv Estándar (s) = 889/19 = 6.84 días. _ _ I.C. para estimar = X ± t0.025 s/n

t/2 con grados de libertad=n-1

= 51.5 2.093 (6.84/20)

= 51.5 3.2

LI = 48.3 y LS = 54.7 días

X

Page 39: Mic sesión 6

FÁTIMA PONCE 39

Tabla t

2.093

g.De l.

Page 40: Mic sesión 6

FÁTIMA PONCE 40

BIBLIOGRAFIA

Anderson, D., Sweeney, D. y Williams T. (2008). Cap 7-8.

Levin y Rubin (2010) Cap. 6 y 7.