lecturas de teor a de muestreo · pdf filemuestreo por conglomerado en una etapa muestreo...

Lecturas de Teorıa de Muestreo

M.Sc. Fidel Ordonez

Junio-Agosto 2013

Editado por Mauricio Zelaya Aguilar en www.write LATEX.com 1

Contenido

• Introduccion de terminos tecnicos

• Etapas fundamentales en la estructuracion de la teorıa del muestreo

• Muestreo aleatorio simple

• Estimadores de razon y de regresion

• Muestreo estratificado

• Muestreo sistematico

• Muestreo por conglomerado en una etapa

• Muestreo polietapico

• Muestreo doble

Introduccion

Poblacion (N, Y , σ2, P, R), elementos, parametro, estimadores, distribuciones muestrales, unidad demuestreo, marco muestralPoblacion (N, Y , σ2, P, R), muestra (n, y, σ2, p, r)

Etapas

a. Definicion de los parametros a estimar (θ)

b. Proponer los estimadores (θ)

c. Propiedades de los estimadores (insesgamiento,consistencia)

d. Precision de los estimadores. Var[θ] insesgado, ECM(θ) no insesgado mide la variabilidad conrespecto al valor promedio del estimador

Var[θ] = E[(θ − E(θ))2]

ECM(θ) = E[(θ − θ)2]

= Var(θ) + (B(θ))2

e. Estimar la confianza de la precision de los estimadores Var[θ] y ˆECM(θ)

Ejemplo

N = 4, y1 = 3, y2 = 4, y3 = 6, y4 = 7, µ = 5, σ2 = 52

a. Muestra aleatoria (m.a. = 2) sin reposicion para estimar µ(N

µ = y

n∑i=1

Distribucion muestral de ymi yi f(yi)y1, y2 3.5 1/6y1, y3 4.5 1/6y1, y4 5.0 1/6y2, y3 5.0 1/6y2, y4 5.5 1/6y3, y4 6.5 1/6

µy = E[y]

σ2y = Var[y]

E(y) = µ

Var(y) =σ2

=N − nN − 1

es el factor de correlacion para poblacion finita.P (|y − µ| ≤ 1) = 4

b. m.a. = 2 con reposicion

Nn = 24

Distribucion muestral de yyi f(yi)3.0 1/163.5 2/164.0 1/164.5 2/165.0 4/165.5 2/166.0 1/166.5 2/167.0 1/16

µy = E(y)

σ2y = Var(y)

P (|y − µ| ≤ 1) = 1216

Parametros

Poblacion y1, y2, . . . , yN , Y total, Y media, σ2 varianza, P proporcion, A total, R razon

Y =n∑i=1

N∑i=1

σ2 =1

n∑i=1

(yi − Y )2

N∑i=1

(y2i − Y 2

N − 1

n∑i=1

(yi − Y )2

A =N∑i=1

donde yi =

{1 i ∈ C0 i /∈ C

Muestreo Aleatorio Simple MAS

Una muestra de tamano n − elementos es tomada de una poblacion de N − elementos es MAS sicualquier otra muestra de tamano n tiene igual probabilidad de ser tomadaC =

)posibles muestras. S1, S2, . . . , SC , P (Si) = 1

Poblacion: y1, y2, . . . , yN , muestra:y1, y2, . . . , yn

Estimacion de una Media Y

1. Parametro Y

n∑i=1

2. Estimador ˆY

ˆY = y

=n∑i=1

3. a. Insesgado P:D. E(y) = Y

E(y) = E

n∑i=1

= Y♦

b. Consistente

Var(y) =N − nN − 1

=N − nN

= (1− f)S2

donde f = nN

se llama fraccion de muestreo, recordando que

Cov(X, Y ) = E[(X − µX)(Y − µY )]

Var(X + Y ) = Var(X) + Var(Y ) + 2 Cov(X, Y )

ρ(X, Y ) =Cov(X, Y )

σXσY

Cov(yi, yj) = E[(yi − Y )(yj − Y )]

= E[yiyj]− Y 2

=N∑i 6=j

N − 1−( 1

N∑i=1

N(N − 1)

( N∑i=1

−N∑i=1

= − 1

( N∑i=1

= − σ2

N − 1

Var(y) = Var

n∑i=1

(n∑i=1

[n∑i=1

Var(yi) +∑i 6=j

∑i 6=j

Cov(yi, yj)

[n∑i=1

σ2 +∑i 6=j

∑i 6=j

(− σ2

N − 1

[nσ2 + n(n− 1)

(− σ2

N − 1

)]=N − nN − 1

σ2 =1

N∑i=1

(yi − Y )2

N∑i=1

y2i − Y 2

Var(y) = Var(y)

=N − nN

= (1− f)s2

n− 1

n∑i=1

(yi − y)2

E[s2] = E

n− 1

n∑i=1

(yi − y)2

n− 1E

[n∑i=1

(yi − y)2

n− 1

{n∑i=1

E(yi − y)2 + nE[(y − Y )2]

n− 1

[ n∑i=1

Var(yi)− nVar(y)]

n− 1

[n∑i=1

σ2 − nN − nN

n− 1

[nσ2 − nN − n

n− 1

[nN − 1

NS2 − N − n

P.D E[Var(y)] = Var(y)

E[Var(y)] = E

[(1− f)

(1− f)

nE[S2]

=(1− f)

= Var(y)

` es insesgado ♦

Intervalo de confianza (IC) del (1− α)100% para YY + /− Zα/2, Zα/2 cuantil de una N(0, 1)Tamano de la muestra para estimar YPrecision deseada,confianza que deseamos para esa precision.Sea d = %y el maximo error dispuestos a aceptar.Sea z = Zα/2 confianza del (1 − α)100% de que el error de estimacion no sera mayor a d, la varianzadeseada es

Var =( d

Queremos que Var(y) ≤ Var (1− n

n≤ Var

n− S2

N≤ Var

n≤ Var +

S2≥ 1

Var +S2

n ≥ S2

Var +S2

1 + 1N

1 + n0

n0 =S2

== Zα/2S

Ejemplo

N = 5000 empleados de una empresa, n =?, Y ingreso promedio por empleado, d = 0.05Y con unaconfianza del 95%Suponga que en una investigacion anterior ˆY = 10, 000, S = 1500(1− α)100% = 95%, α = 0.05, α/2 = 0.025, Zα/2 = 1.96

d = 0.05× 10, 000

n0 =(1.96)2(1500)2

(500)2

1 + 35500

5000= 0.007

Estimacion de un Total Y

1. Parametro Y

Y =N∑i=1

2. Estimador Y

Y = Ny

n∑i=1

E(Y ) = E(Ny)

= N E(y)

b. Consistente

Var(Y ) = Var(Ny)

= N2 Var(y)

= N2(1− f)S2

Var = N2(1− f)s2

Tamano de la muestra para estimar Y , d = %Y , Zα/2 cuantil (1 − α2) de la N(0, 1) de que el error no

sera mayor que d

Y = Ny

Var(Y ) = N2 Var(y)

= N2(1− f)S2

d error maximo que se acepta con una confianza del (1− α)100%, la varianza deseada

Queremos que Y ≤ Var

1− n

n≤ Var

n0 =N2S2

=N2Zα/2S

1 + n0

Estimacion de una Proporcion P

1. Parametro P

A =n∑i=1

{1 i ∈ C0 i /∈ C

2. Estimador p

a =n∑i=1

3. Insesgado, consistente

N − 1

N∑i=1

(yi − Y )2

N − 1

N∑i=1

(yi − P )2

N − 1

{N∑i=1

y2i −NP 2

N − 1{NP −NP 2}

N − 1PQ;Q = 1− P

N∑i=1

Var = Var(y)

= (1− f)S2

N − 1(1− f)

n− 1

n∑i=1

(yi − y)2

n− 1

n∑i=1

(yi − p)2

N − 1

{n∑i=1

y2i − np2

n− 1pq; q = 1− p

n∑i=1

Var(p) = (1− f)pq

n− 1; (1− f) =

N − nN

IC del (1− α)100% para P , p± Zα/2√

Var(p)Tamano de muestra para estimar P , d = %P error maximo que pueda suceder, Zα/2 para confianza del(1− α)100%, la varianza deseada

Queremos que Var(p) ≤ Var, consideremos N − 1 ≈ N(1− n

) PQn≤ Var

n ≥PQVar

1 + 1N

(PQVar

=Z2α/2PQ

1 + n0

Usar P = 0.5 cuando no se conoce nada sobre P

Ejemplo

Se piensa utilizar MAS para estimar la proporcion de hogares que utilizan lena para cocinar en un paisdeterminado, se desea que el error de estimacion no sea mayor a 3% con una confianza del 95%.Suponga que una investigacion anterior ha reportado que esa proporcion es de 30%d = 0.03, Z0.025 = 1.96 confianza del 95%, P = 0.30

n0 =(1.96)2(0.3)(0.7)

(0.03)2

Estimacion de una Razon R

1. Parametro R

2. Estimador R

x =n∑i=1

y =n∑i=1

3. Consistente, sesgado

ECM(R).= Var(R)

(1− f)

∑Ni=1(yi −Rxi)2

N − 1

ˆVar( ˆ )R

(1− f)

∑ni=1(yi − Rxi)2

n− 1

(1− f)

∑ni=1 y

2i − 2R

∑i=1 xiyi + R2

∑ni=1 x

n− 1

En la practica si no se conoce X usar x. IC del (1− α)100% para R.

R± Zα/2√

Var(R)

Si n es grande, entonces

R−R =y

x− Y

.=y − YX

=y −Rxx

=y −RxX

E(R−R).=

X(y − Y )

ECM(R) = E[(R−R)2

X2E[(y −Rx)2

]Sea di = yi −Rxi, luego d = y −Rx

Var(R).=

X2E(d2)

X2Var(d)

(1− f)

∑Ni=1(yi −Rxi)2

N − 1

D = Y −RX= Y − Y= 0

Ejemplo

En un pequeno pueblo de 3000 familias se eligio una muestra aleatoria de 40 de ellas, a cada familia dela muestra se le pregunto el numero de miembros y de autos que tenia.Determine un IC del 95% para el numero de miembros por auto en esas 3000 familias, si los resultadosde la muestra son los siguientes:yi numero de miembros de la familia ixi numero de autos de la familia i

40∑i=1

yi = 23640∑i=1

xi = 11540∑i=1

xiyi = 11540∑i=1

y2i = 1494

40∑i=1

x2i = 401

N = 3000, n = 40, IC del 95% para R numero de miembros por auto

115= 2.05

Var(R).=

1− 403000

40(2.875)2

1494− 2(2.05)(6.85) + (2.05)2(401)

ee(R).= 0.1673

2.05± 1.96(0.16739)

2.05± 0.33

1.72 ≤ R ≤ 2.38 es IC del 95%

Estimadores de Razon para MAS

Si xi es correlacionada positivamente con yi, podemos mejorar la estimacion Y , Y usando estimadoresde razon, usando las xi como variable auxiliar.

ˆYR =y

MAS :y1 y2 . . . ynx1 x2 . . . xn

y =n∑i=1

x =n∑i=1

Var( ˆYR) = X2 Var(R)

(1− f)

∑ni=1(yi −Rxi)2

N − 1

(1− f)

∑ni=1 y

2i − 2R

∑ni=1 xiyi +

∑ni=1 x

n− 1

Muestreo Estratificado

N =L∑h=1

Se particiona la poblacion en L estratos.Se seleccionan muestras aleatorias independientes (MAI) en cada estrato.yh valor de y en la i esima unidad del estrato h.

Nh tamano del estrato h, N tamano de la poblacion, Wh = Nh

Nponderacion del estrato

Nh∑i=1

Yh = NhYh

Nh − 1

Nh∑i=1

(yhi − Yh)

L∑h=1

Nh∑i=1

L∑h=1

=L∑h=1

Y = NY

Suposicion

Suponga que las muestras dentro de los estratos son MAS.nh tamano de la muestra en el estrato h

n =L∑h=1

fh =nhNh

nh∑i=1

nh − 1

nh∑i=1

(yhi − yh)

Estimacion de una Media

1. Parametro Y

2. Estimador yst

yst =L∑h=1

3. Consistente, insesgado

E(yst) =L∑h=1

Wh E(yh)

=L∑h=1

Var(yst) =L∑h=1

W 2h Var(yh)

=L∑h=1

W 2h (1− f)

5. Insesgado

Var(yst) =L∑h=1

W 2h (1− fh)

Afijacion Proporcional al Tamano de los Estratos MAEP

Se distribuye la muestra proporcional al tamano de los estratos

N=⇒ nh =

La muestra resulta ser autoponderada (cada unidad tiene igual probabilidad de ser seleccionada)

Estimacion de una Media

1. Parametro Y

2. Estimador yst

yst =L∑h=1

=L∑h=1

nh∑i=1

L∑h=1

nh∑i=1

3. Ya esta hecho

Var(yst) =1− fnN

L∑h=1

Var(yst) =1− fnN

L∑h=1

d = %Y , Zα/2 confianza del (1− α)100%, la varianza deseada

Queremos que Var(yst) ≤ Var

L∑h=1

1 + n0

Afijacion Optima de la Muestra en los Estratos MAEO

Se distribuyen los nh para min Var(yst) con C dado (fijo)

C = C0 +L∑h=1

con Var(yst) dado

minC = C0 +L∑h=1

Los nh resultan ser

WhSh√Ch∑L

h=1NhSh√Ch

NhSh√Ch∑L

h=1NhSh√Ch

Ch = C =⇒ nh =WhSh∑Lh=1 WhSh

=NhSh∑Lh=1 NhSh

A (1) se le conoce como afijacion de Neyman

Demostracion

Var = Var(yst)

=L∑h=1

W 2h (1− fh)

=L∑h=1

L∑h=1

Minimizar Var dado C o minimizar C dado Var, es equivalente a minimizar Var′C ′ con

Var′ = Var +L∑h=1

=L∑h=1

C ′ = C − C0

=L∑h=1

Recordando el teorema de Cauchy-Schwarz (∑a2h)(∑b2h) ≥ (

∑ahbh)

2, la igualdad de cumple cuandoahbh

= cte, luego

Var′C ′ =

(L∑h=1

)(L∑h=1

(L∑h=1

WhSh√Ch

ah =WhSh√nh

bh =√nhCh

La igualdad se cumple cuando

WhSh√nh√nhCh

WhSh√nh√nh

WhSh√nh∑L

h=1WhSh√nh

Varmin(yst) =(∑WhSh)

n−∑WhS

con la afijacion de Neyman

nh =NhSh∑NhSh

n =(∑NhSh)

Var + 1N

∑WhS2

d = %Y , Zα/2 confianza del (1− α)100%, la varianza deseada

Dado n VarMAEO(yst) ≤ VarMAEP (yst) ≤ VarMAS(yst), usar

S2 =L∑h=1

WhS2h +

L∑h=1

Wh(Yh − Y )2

VarMAS(y) = (1− f)S2

=(1− f)

L∑h=1

WhS2h +

(1− f)

L∑h=1

Wh(Yh − Y )2

= VarMAEP (yst) +(1− f)

L∑h=1

Wh(Yh − Y )2

VarMAEP (yst)− VarMAEO(yst) =1

L∑h=1

WhS2h −

(L∑h=1

L∑h=1

Wh(Sh − S)2

S =L∑h=1

VarMAS(y) = VarMAEO(yst) +1

L∑h=1

Wh(Sh − S)2

+(1− f)

L∑h=1

Wh(Yh − Y )2♦

Estimadores de Razon en Muestreo Estratificado

1. Estimacion de Razon Separada

Y =L∑h=1

yhxhXh

=L∑h=1

yhxhXh

Xh es un dato auxiliar (externo) no viene de la muestra

Rh =yhxh

Con muestras grandes

Var(YRS) =L∑h=1

N2(1− fh)nh(nh − 1)

nh∑h=1

(yhi − Rhxhi)2

nh∑h=1

(yhi − Rhxhi)2 =

nh∑h=1

y2hi− 2Rh

nh∑h=1

xiyhi + R2h

nh∑h=1

2. Estimacion de razon Combinada

YRc =Yst

=ystxst

R =ystxst

Si n es grande

Var(YRC) =L∑h=1

N2h(1− fh)

nh(nh − 1)

nh∑h=1

[(yhi − yh)− R(xhi − xh)

]Teorema

Si se ignoran los terminos1

relativamente a la unidad, entonces tenemos que

VarMAEO ≤ VarMAEP ≤ VarMAS

donde la asignacion optima para n fijo, o sea que nh ∝ NhSh

VarMAS = (1− f)S2

=(1− f)

WhS2h +

Wh(Yh − Y )2

=(1− f)

∑WhS

(1− f)

∑Wh(Yh − Y )2

VarMAEP = (1− f)∑

∑WhS

n−∑WhS

VarMAEO =(∑WhSh)

n−∑WhS

Nh − 1

Nh∑i=1

(yhi − Y )2

(N − 1)S2 =L∑h=1

Nh∑i=1

(yhi − Y )2

=L∑h=1

(Nh − 1)S2h +

Nh(Yh − Y )2

[(yhi − Yh)− (Yh − Y )2]

[(yhi − Y ) +

∑(Yh − Y 2 + 2

∑(yhi − Yh)(Yh − Y )

]=∑h

(yhi − Y )2 +∑

Nh(Yh − Y )2

(N − 1)S2h +

∑Nh(Yh − Y )2

(1− 1

)=∑h

N− 1

)+∑ Nh

N(Yh − Y )2

S2 =∑h

WhS2h +

(Yh − Y

VarMAEP −VarMAEO =1

[∑WhS

2h −

(∑WhSh

[∑WhS

2h −

(∑WhSh

−(∑

[∑WhS

2h − 2

(∑WhSh

∑(WhS

2h − 2WhShS +WhS

∑Wh(S

2h − 2ShS + S2)

∑Wh(Sh − S)2

S =∑

Muestreo por Conglomerados

Unidad de muestreo es un conglomerado de elementos.Poblacion: M elementos en N unidades (conglomerados)Yij el valor de y en el j esimo elemento de la unidad iMi tamano del conglomerado i (numero de elementos)Conglomerado: 1, 2, . . . , i, . . . , NTamano: M1, 2, . . . ,Mi, . . . ,MN

N∑i=1

Conglomerado i: Yi1, Yi2, . . . , Yij, . . . , YiMi

Mi∑j=1

Yij Yi =YiMi

S2w:i =

Mi−1

Mi∑j=1

(Yij − Yi)2 cuasi varianza dentro de la unidad i

N∑i=1

Yi media por unidad

Y =N∑i=1

=N∑i=1

Mi∑j=1

Yij total

¯Y =1

N∑i=1

Yi media por elemento

S2B:y =

N − 1

N∑i=1

(yi − Y )2 varianza entre conglomerados

I. MAS de n Conglomerados y Censo de los Elementos de los Conglomeradosde la Muestra(Una Etapa)

1. Estimadores Insesgados para Y, Y , ¯Y

a. Para Y

Y = Ny

n∑i=1

Var(Y ) = N2Var(Y )

b. Para Y :

ˆY = y

n∑i=1

Var =(1− f)

∑ni=1(yi − y)2

n− 1f =

c. Para ¯Y :

ˆY = ¯y

Var(¯y) =1

M2Var(y)

Todos los estimadores son insesgados y consistentes

2. Estimadores de Razon

a. Para Y

∑ni=1 Yi∑ni=1Mi

Var(YR).=N2(1− f)

∑Mi=1(Yi − ¯yRMi)

n− 1

b. Para ¯Y

ˆY = ¯yR

∑ni=1 Yi∑ni=1 Mi

Var(¯yR).=

(1− f)

∑ni=1(Yi − ¯yRMi)

n− 1

(1− f)

∑Y 2i − 2¯yR

∑MiYi + ¯y2

n− 1

c. Para P

PR = pR

∑pi=1 Ai∑ni=1Mi

Mi∑i=1

yij yi =

{1 i ∈ C0 i /∈ C

(1− f)

∑ni=1(Ai − pRMi)

n− 1

(1− f)

∑A2i − pR

∑MiAi + p2

n− 1

Todos los estimadores son insesgados y consistentes

II.Muestra PPT de Conglomerados y Censo de los Elementos de los Con-glomerados de la Muestra(Una Etapa)

PPT probabilidad proporcional al tamano, relativo al numero de elementos.Se selecciona el i esimo conglomerado con probabilidad

zi =Mi

MMi∑Ni=1Mi

Para ¯Y se tiene que

ˆY =¯PPT

n∑i=1

Mi∑i=1

n∑i=1

Var(¯yPPT ) =1

n(n− 1)

n∑i=1

− ¯yPPT

n(n− 1)

n∑i=1

(Yi − ¯yPPT )2

Para Y : Y = M ¯yPPTVar(Y ) = M2Var(¯yPPT )

a. Si Yi no correlacionado con Mi usar I1

b. Si Yi correlacionado con Mi, I1yII mejor que I1

i. Si S2w:i no cambia con Mi, II mejor que I2

ii. Si S2w:i se incrementa con Mi, mejor I2 que II

Ejemplo

Sean M = 10, 000 empleados, N = 600 oficinas, n = 20Oficina i # empleados Mi # hijos < 4 anos Yi M2

i Y 2i MiYi

1 15 30 225 900 4502 18 54 324 2916 972...

......

...20 25 75 625 5625 1875

734 7186 33,336 14,241

Coeficiente de Correlacion Intraclase y Efecto del Diseno DEFF

Sea ρI = DEFF , ρI mide la homogeneidad o heterogeneidadDEFF cuanto aumenta la varianza por usar un diseno de muestreo determinado a usar MAS

DEFF =Vardiseno utilizado

VarMAS

Supongamos que Mi = M0, luego M = NM0 (conglomerados de igual tamano)

ρI =E(yij − ¯Y )(yij′ − ¯Y )2

E(yij − ¯Y )2j = j′

Recordando que

∑Ni=1

j=1(yij − ¯Y )2

NM0 − 1cuasi-varianza por elemento

E(yij − ¯Y )(yij′ − ¯Y ) =1

NM0(M0 − 1)

N∑i=1

M0∑j 6=j′

(yij − ¯Y )(yij′ − ¯Y )

E(yij − ¯Y )2 =1

N∑i=1

M0∑j=1

(yij − Y )2

∑Ni=1

j 6=j′(yij − ¯Y )(yij − ¯Y )

(m0 − 1)(nm0 − 1)S2

Por otro lado

Var(¯y) =1

(1− n

) ∑Ni=1(Yi − ¯Y )2

N − 1

(1− nM0

)S2[1 + (M0 − 1)ρI ]

VarMAS =1

(1− nM0

)S2 DEFF = 1 + (M0 − 1)ρI

Muestreo Sistematico

Sea N tamano de la poblacion, n tamano de la muestraSi se selecciona al azar un elemento dentro de los primeros k, y luego a partir de este, cada k esimo

elemento se considera en la muestra, decimos que tenemos una muestra sistematica de 1 en k k =N

nsuponga N = kn

y11 y21 . . . yi1 . . . yk1

y11 y22 . . . yi2 . . . yk2...

......

...y1j y21 . . . yi1 . . . yk1...

......

...y1n y2n . . . yin . . . ykny1. y2. . . . yi. . . . yk.

1. Parametro Y = y.. donde

y.. =1

k∑i=1

=y..nk

y.. =k∑i=1

n∑j=1

2. Estimador ˆY

ˆY = ysist

Var(ysist) =1

k∑i=1

(yi. − y..)2

No se pueden estimar con una sola muestra sistematica de tamano n

Ejemplo

1. 12345678910 N = 10, n = 2, k =10

2= 5, Aleat=3, Aleat+k=8

2. N = 1000, n = 50, k =1000

50= 20

r, r + k, r + 2k4, . . . , r + (n− 1)k7, 27, 47, 67, 87, . . . , 987

Si la poblacion es aleatoria con respecto a y

Var(ysist = (1− f)s2

n− 1

n∑j=1

(yij − yi.)

= Var(yMAS)

si la poblacion esta ordenada de acuerdo a la magnitud de y, entonces

Var(ysist) ≤ Var(yMAS)

Var(ysist) = (1− f)s2

Si la poblacion es cıclica el muestreo sistematico tiene problemas

Var(ysist) =s2

n[1 + (n− 1)ρ]

Muestreo por Conglomerado en Dos Etapas

Poblacion N conglomerados, Mi numero de elementos del conglomerado i

Submuestreo

En la primera etapa se selecciona una muestra aleatoria de conglomerados que se les llama unidadesprimarias de muestreo (UPM).Seguido de una segunda etapa de una muestra aleatoria de elementos de cada conglomerado en la muestra(USM)Muestra n conglomerados, mi numero de elementos seleccionados de los Mi que tiene el conglomeradoi de la muestra, yij valor de y en el j esimo elemento del conhglomerado i

mi∑j=1

I. MAS de n Conglomerados y MAS de Elementos Dentro de los Conglomerados de laMuestra

Poblacion

M =N∑i=1

1 . . . i . . . NM1 . . . Mi . . . Mn

Primera etapa:MAS de n conglomerados UPM(Nn

)Segunda estapa:MAS de mi elementos de los Mi del conglomerado i de la muestra (USM)

n∑i=1

)1. Estimadores Insesgados

Parametro ¯YEstimador

¯y =1

n∑i=1

MiYi yi =1

mi∑j=1

insesgado, consistente

Var(¯y) =1− f1

n∑i=1

M2i (1− f2

Nf21 =

variabilidad de la primera etapa, variabilidad de la segunda etapa

n− 1

n∑i=1

(Miyi − M ¯y)2

n− 1

[n∑i=1

(Miyi)2 − 2M ¯y

n∑i=1

Miyi + n(M ¯y)2

S22i =

mi − 1

mi∑j=1

(yij − yi)2

2. Estimadores de RazonParametro YREstimador

¯yR =

∑ni=1Miyi∑ni=1 Mi

Var(¯y) =(1− f)

1 +(1− f)

n∑i=1

M2i (1− f2i)

n− 1

n∑i=1

M2i (yi − ¯yR)2

II. Seleccion PPT de Conglomerados y MAS de Elementos en los Conglomerados de laMuestra

Para ¯Y

¯yPPT =1

n∑i=1

yi yi =1

mi∑j=1

Var(¯yPPT ) =1

n(n− 1)

n∑i=1

(yi − ¯yPPT )2

n(n− 1)

n∑i=1

y2i − 2yPPT

n∑i=1

yi + n(¯yPPT )

Ejemplo

N = 800, n = 100 PPT , mi = m = 10 MAS o sistematica

Pij = PiPj|i

Factor =1

Muestra auto ponderada es cuando cada elemento tiene igual probabilidad de salir seleccionado en lamuestra

Tamano de la Muestra

Recordar que

DEFF =Var(¯y)

VarMAS(¯y)

= 1 + (m− 1)ρI

Para cada estimador hay un DEFF. ρ decrece a medida que la unidad es mas grande. m numero deelementos seleccionados en el conglomerado.

Ejemplo

Numero de viviendas que usan lena para cocinar

p = 0.20 E = 0.03 z = 1.96 m = 10 DEFF = 1.6 de un censo anterior

mMAS =(1.96)2(0.20)(0.80)

(0.03)2

m = 683(1.6)

= 1093

n = 110

m =?, n =? Que minimice Var(¯y) para C fijo o minimizar C con Var(¯y) fija.C1 costo de muestreo de cada conglomeradoC2 costo de muestreo por elemento C costo total

C = nC1 +mnC2

Suponiendo Mi = M = constante recordemos que

¯y =1

n∑i=1

Sin considerar las correcciones para poblaciones finitas (CPF) entonces

Var(¯y) =σ2b

n+σ2w

σ2b varianza entre medias verdaderas de los conglomeradosσ2w varianza entre elementos del conglomerado

mopt =

√σ2w

de otra investigacion

σ2w = S2

n∑i=1

σ2b = S2

1 −S2

n− 1

n∑i=1

(yi − ¯y)2

Muestro Doble

LLamado muestreo en dos fasesFase 1 −→ nL

↑Fase 2 −→ n

lecturas de teor a de muestreo · pdf filemuestreo por conglomerado en una etapa muestreo...

Documents

muestreo aleatorio simple y muestreo sistemático de las

control del muestreo determinación de errores del muestreo

especificacion tec. aislador poliet perno recto mt

a.12.1. métodos de muestreo existen dos métodos de...

muestreo y distribuciones de muestreo-2012

normas internacionales para medidas … · métodos...

muestreo estadistico ;)

ialm- 801 control estadistico de procesos · muestreo (mil...

introducción muestreo

muestreo. tema 6 -...

pruebas selectivas - ecoeediciones.com · capítulo 2....

guÍa de muestreo estadÍstico en auditorÍa ...muestreo...

“curso de estadÍstica bÁsica para … · muestreo sin...

introducion al muestreo y tipos de muestreo

muestreo - universitat de...

muestreo fao guia-muestreo-fao

muestreo tema 1 2. muestreo aleatorio 3. tipos de muestreo...

el plan de muestreo - digi.usac.edu.gt · y la forma en la...

aacap 6 muestreo y distribuciones de muestreo

utensilios y complementos cocina -...