unidad ii distribuciones muestralesvirtual.usalesiana.edu.bo/web/conte/archivos/4384.pdf ·...
TRANSCRIPT
34
UNIDAD II
DISTRIBUCIONES MUESTRALES
Competencia:
-El estudiante debe saber utilizar las diferentes distribuciones muestrales ,es decir las diferentes
distribuciones de cualquier estadístico estimado a partir de muestras aleatorias para realizar
eficientemente la Inferencia Estadística
Objetivos.
-Utilizar correctamente el concepto de muestra aleatoria en las diferentes distribuciones
muestrales ,para realizar generalizaciones respecto de una población en base a estadísticos
Descripción general de la unidad:
-Esta unidad comprende el desarrollo de los siguientes conceptos:Población-Parámetro Muestra
aleatoria-Estadístico; Distribución muestral:de la Media ,Diferencia de Medias,de la Proporción y
la diferencia de Proporciones,de la Varianza y razón de Varianzas,con sus respectivas
distribuciones especiales como: la “t” student,La Normal,La “Chi Cuadrado” y La “F” de Fisher.
Lectura:Millar/Freund/Jonson “Probabilidad y Estadística para Ingenieros”Edo.de
México 1992 Pgs. 187 al 205
Bibliografía Básica: Moya y Saravia (1988) “Probabilidad e Inferencia Estadística((2ª
ed) Perú .Pags.559 al 623
Referencia electrónica:
http://www.itcomitan.edu.mx/tutoriales/estadística/contenido/unidad_2_4.html
35
INTRODUCCIÓN Se llama distribución muestral, cuando la variable resulta ser un estadístico o estadígrafo, calculado en base a los datos de una m.a. Estos estadísticos se utilizan para realizar inferencia estadística para la toma de decisiones, respecto alguna característica de la población ó respecto a la distribución de la misma. Para desarrollar las distribuciones muéstrales es necesario recordar algunos conceptos básicos: POBLACION f(x);P(x);X,Y Estadísticamente población es el conjunto de todas las observaciones posibles que puede tomas una v.a. X. Por lo tanto la distribución de la población es la distribución de la v.a. X. Las poblaciones de acuerdo a su magnitud pueden ser: POBLACIONES FINITAS (N) Son aquellas que están limitadas o acotadas POBLACIONES INFINITAS Son aquellas que no están imitadas, estadísticamente las poblaciones muy grandes se las consideran infinitas. - El proceso para obtener la información de toda la población es el CENSO PARÁMETROS Son todas las medidas descriptivas que caracterizan a la población como por ejemplo la
media = , la varianza 2 etc. Los parámetros se denotan con las letras griegas MUESTRA ALEATORIA
(m.a n) una m.a. de tamaño “n” es un subconjunto representativo de la población, el proceso para obtener la información se llama muestreo ESTADISTICO, Son todas las medidas descriptivas que se obtienen a partir de la información de al m.a. como por ejemplo: la media = x , la varianza= S2 etc. Generalmente se las denota con
las letras castellanas. DEFINICIÓN DE m.a.
Dada una población f(x);P(x) ó X con media y varianza 2 Se llama m.a. De tamaño “n” al conjunto de n.v.a X1, X2,... Xn tal que satisfacen 2 requisitos:
1. Xi son independientes donde la distribución conjunta es a) Si X es discreta )()()....()(),....,( 2121 xPXpXPXPXXXP nn
b) Sí X ex continua )()()....()(),....,( 2121 xfXfXfXfXXXf nn
2. Xi tienen la misma distribución X a) f(xi) = f(x)ó P (xi)= P(x); i=1,2…n
b) 2)(;)( ii xVxE
36
Nota. Esta definición es valida cuando:
1. La población es infinita con ó sin reposición 2. La población es finita, con reposición
Ejemplo
Sea una población X N ( , 2), se toma un m.a. tamaño n X1, X2,... Xn
a) Escribir la función de probabilidad conjunta de la m.a.
b) Sí n = 6 ; =20; 2 =25 Calcular la probabilidad de que b) X1 +X3+ X4 -X6 sea mayor que 52
DEFINICIÓN
como X N ( , 2) sabemos que f(x)=
2
2
1
2
1x
e
a) la función de probabilidad conjunta de la m.a. de tamaño “n” es
f(X1, X2,... Xn)=
n
n
iini
x
exfxfxfxfxf
2
2
1
2
1)()()()...()( 2
b) Sí X1 +X3+ X4 -X6 =Y por la propiedad reproductiva Y N( y y2), donde:
y=E(Y)=E(X1 +X3+ X4 -X6)= E(X1)+E(X3)+E( X4 )-E(X6)=20+20+20-20=40
y2=V(Y)= V(X1 +X3+ X4 -X6)= V(X1)+V(X3)+V( X4 )-V(X6)=25+25+25-25=100
y=10
Mediante el teorema central del limiteY
YYZ ; (0.1)
1151.02.112.112.110
405252 FZPZPZYP
DISTRIBUCIÓN MUESTRAL DE LA MEDIA
Sea una población X con media y varianza 2 del cual se toma una m.a. de tamaño n: X1, X2,... Xn del cual se obtiene su media muestral x
Se cumple: a) ;)(xE
b) n
xV2
)(
37
c) nx
Z ; N (0.1)
Nota
1) Cuando xnn
N j
2
cuando n 30, no importa si la población es
discreto o continuo
2) Cuando n 2 si X N( , 2) x n
N2
3) Si el muestreo es sin reemplazo de una población finita de tamaño N
V x1
22
N
nN
nx factor de corrección
Ejemplo Suponiendo que una población consta de los siguientes valores observados:3,4,7,9,12. Calcular
a) La media y Varianza poblacionales b) Determinar la distribución muestral de la media de la m.a. de tamaño 2 escogidos
con reposición c) Se extrae una m.a de tamaño 36 con reposición cual la 85 xP
SOLUCIÓN
Como N 5 75
129743
N
xi
2863.3;8.105
547
5
299)( 2222 xPx
b) La distribución muestral de la media se obtiene mediante:
12.12
12.9
12.7
12.4
12.3
9.12
9.9
9.7
9.4
9.3
7.12
7.9
7.7
7.4
7.3
4.12
4.9
4.7
4.4
4.3
3.12
3.9
3.7
3.4
3.3
12
9
7
4
3
12
5.10
5.9
8
5.7
12
5.10
9
8
5.6
6
9
5.9
8
7
5.5
5
8
5.6
5.5
4
5.3
4
5.7
6
5
5.3
3
3
x
x
x
x
x
x P( x ) x P( x ) 2x P( x )
3
3.5
4
5
5.5
6
6.5
7
7.5
8
9
9.5
10.5
12 25
1
252
252
251
254
252
251
252
252
252
252
251
252
251
253
2512
259
25144
TOTAL 25
175
38
4.5725
1360)(
725
175
2222 xPxxV
xPxxEx
x
c) Se extrae una m.a. tamaño 36 con reposición
n = 36 sabemos que xnx
Zyn
2
,
7
2863.3
3678
2863.3
367512863.32 ZP
9664.009664.065.3)83.1(
65.383.183.165.3
FF
ZPZPZP
DISTRIBUCIONES ESPECIALES UTILIZADAS EN PRUEBAS Cuando las m.a, son pequeñas n<30 no se pueden suponer que la distribución muestral es NORMAL, TAMPOCO SE PUEDE APLICAR EL teorema central del limite, por lo que se debe recurrir otras distribuciones muéstrales las especiales que estén relacionadas con la NORMAL;entre estas distribuciones tenemos: la CHI-cuadrado, la t-Student y la F de Fisher
DISTRIBUCIÓN CHI CUADRADO 22 XÓX R
Es un caso particular de la distribución gamma, tiene muchas aplicaciones entre ellas para la construcción de IC y las pruebas de Hipótesis de la Varianza DEFINICION
Sean r v.a. independientes: Z1,Z2,…Zr tal que Zi N (0.1)
Sumando los cuadrados r
i
ir ZZZZ1
2222
21
2rX grados de libertas, Sii
FUNCIÓN DE DENSIDAD
XeXxfXV
r rx0;
2
122
22
1
2
;esc Donde = función gamma
r = grados de libertad o Nº de variables
R=1
R=3 R=7 R=10
39
CARACTERÍSTICAS
1) A medida que aumente los grados de libertad tienden a normalizarse
2) LA MEDIA rxE )( 2
3) LA VARIANZA rxE 2)( 22
PROPIEDAD REPRODUCTIVA Sean K v.a. independiente: X1, X2,... Xk tal que Xi ~ X2
(ri)
Si sumamos 2
iX ~ 2
1
k
i
ir
X
FUNCIÓN DE DISTRIBUCIÓN
dxxfXxPxFx
)()(2
0
2
Cuando 11 22 XxPXxP
USO DE TABLAS Dada la importancia y la complejidad de su calculo, se tiene confeccionado tablas, en base a la función de distribución con 2 entradas, donde: La 1ra columna representa los grados de libertad “r” La 1ra fila representa el nivel de significancia ó probabilidad 10
La intersección de fila columna de le valor critico 2X
Ejemplo 1
X ~ 2
26X Determinar las siguientes probabilidades
a) 29.17xP
b) 88.38xP
c) 64.4584.13 xP
d) 40xP
SOLUCIÓN Como v=26
1
F(x)
40
a) 10.029.17 210.0XxPxP
b) 05.095.01188.38188.38 295.0XxPxPxP
c) 965.0025.099.084.1364.4564.4584.13 2025.0
299.0 XxPXxPxPxPxP
d) 96.040 296.0XxPxP mediante interpolación
96.0409.41
975.0
9.3840
95.0
975.0
9.4140
95.0
9.38
Ejemplo 2
Si X 2rX hallar los valores críticos:
a) “a” tal que 30999.0 rsiaxP
b) “a” y “b” tal que 1395.0 rsibxaP ; además 023.0bxP
c) “a” tal que 8015.0 rsiaxP
a) 7.59999.07.5930999.0 axPrsiaxP
b) 95.0)(95.0 axPbxPbxaP
como 7.24975.0025.01025.0)(1025.0)( bbxPbxP
c) 8015.0 rsiaxP
interpolando
8267.13533.018.2
015.0
01.0
53.0
18.2
025.001.0
025.0015.0
18.265.1
18.2
01.0
65.1
015.0025.0
18.2
a
a
aa
DISTRIBUCIÓN MUESTRAL DE LA VARIANZA DEFINICIÓN
Sea una v.a. ó una población X N( , 2) donde ,y 2 son desconocidos, por lo tanto se toma una m.a. de tamaño n para estimar la media x y la varianza S2 tal que
41
a) x y S2.son dos estadísticos independientes donde n
xxS
i
2
2 además la
varianza muestral insesgada es 1
ˆ2
2
n
xxS
i
b) El estadístico2
2ˆ1 SnX2(n-1) g.d.l. cuando n
c) n
nSE
22 1
d) 2
2nS X2(n-1) g.d.l.
Ejemplo
Se tiene una población X N( , 2)del cual se toma una m.a. tamaño 15 y se tiene S2. Calcular:
a) 9427.13107.02
2SP ;
b) 0814.2ˆ
3329.02
2SP
SOLUCION a)
98.001.099.0
6605.41405.291405.296605.4
)15(9427.115.03107.09427.13107.0
2
01.0
2
14
2
99.0
2
14
2
14
2
14
2
14
2
142
2
XXPXXP
XPXPXP
XPS
P
;
b)
98.001.0991.0
6606.491396.291396.26606.4
)14(20814.0)14(3329.00814.2ˆ
3329.0
214
214
214
2142
2
XPXPXP
XPS
P
DISTRIBUCIÓN t –STUDENT (T) - Es otra distribución relacionada con la NORMAL y la gamma que se usa principalmente en las estimaciones y en las pruebas de hipótesis de la media cuando las m.a. son pequeñas:n<30 DEFINICIÓN Sean 2 variables aleatorias independientes:
- Z N(0.1); Y 2RX dividiendo ambas variables
r
Y
ZT Se dice que tiene una distribución t-student con v grados de libertad Sii
42
FUNCION DE PROBABILIDAD
tr
tfr
t
r
r
:12
2
2
1
Esta distribución está completamente determinado solo por el parámetro r Gráficamente tienen las siguientes características
1) Es simétrica con respecto t=0= 2) Cuando n o v se hace grande tiende a normalizarse 3) Tiene mayor dispersión que la normal
t=0= ESPERANZA MATEMÁTICA
1;0)()( rdttftTExE
VARIANZA
2;2
0)()()( 22222 vr
rdttftttETV
USO DE TABLAS Dada la importancia en la Estadística Inferencial y la complejidad de su calculo, se tiene confeccionado tablas con 2 entradas. Esta tabla esta confeccionada en función de la acumulada tTP Donde en la primera
fila se tiene los percentiles o probabilidades en la primera columna se tiene los grados de libertad n ó r, la intersección de fila columna corresponde a los valores críticos
t Porque dttftTPt
)(
Como la distribución es simétrica itt
N(0.1)
r=5
r=3
f(t)
t
43
Ejemplo Determinar el valor critico de 90.0tTP con v=5 g.d.l.
SOLUCIÓN
90.0176.1TP
EJEMPLO 2 Determinar el valor crítico de 10.0tTP con v=5 g.d.l.
SOLUCIÓN
010476.190.010.01 TPtTPtTP
DISTRIBUCIÓN DE S
nx t(n-1)g.d.l.
LA V. A. O ESTADÍSTICO Ejemplo Si x es la media y S2 es la varianza de una m.a. de tamaño 9 seleccionado de una
población NORMAL con media 90 Calcular
245.075.0995.0
7059.03549.33549.37059.0
91183.192353.01183.190
2353.0
888 TPTPTP
TPs
xP
DISTRIBUCIÓN F O DE FISHER X órrF 21,21 ,; rrf
Esta distribución especial generalmente se utiliza para comparar las varianzas de 2 v.a independientemente o de 2 poblaciones normales, mediante los IC y las pruebas de hipótesis sobre sus varianzas mediante la razón de las mismas DEFINICIÓN
Sean 2 v.a. independientes V 2
2rx y r 2
2rx
Si se donde 2
1
rV
rU
F ...)( 21 ldgrrF Sii
44
FUNCIÓN DE DENSIDAD
Zvv
Zfvv
vv
F
vv
0;
0
22
212
21
2
12
2
1
21
Cuya gráfica nos permite determinar sus características
1) A medida que aumentan los grados de libertad tienen a normalizarse de manera positiva
MEDIA
2;2
)()( 2
2
2 vv
vFEF
2) VARIANZA
4;4)2(
2)()( 2
22
21
21222 v
vvv
vvZvFVF
FUNCIÓN DE DISTRIBUCIÓN O ACUMULADA
fFPxF
Cuando 11 fFPFFP
criticovf .
USO DE TABLAS Se tiene 3 entradas: La 1ra columna representa los g.d.l. del denominado r2
La 2da columna representa la probabilidad (p= )
La 1ra fila representa los grados de libertad (g.d.l.) del numerador r1
La intersección de filas columnas nos da el valor critico f
ff(2)
F(10.2)
F(10.2)
1-
F(x)
45
Ejemplo 1
Si X )5.4(F hallar probabilidades
a) 39.7xP
b) 4.11xP
c) 8xP
d) 0645.0xP
Solución Como v1= 4: v2=5 a) 975.039.7 975.0fxPxP
b) 01.099.0114.1114.11 99.0fxPxPxP
c) 9773.08 9773.0fxPxP interpolando
Ejemplo 2
Si F F(6,10) Hallar el valor “c”(valor crítico) tal que a) 99.0cxP
b) 05.0cxP
SOLUCIÓN
a) 246.099.0246.099.0 cxPcxP
b) 22.395.022.3
95.005.0105.0
cxP
cxPcxPcxP
DISTRIBUCIÓN MUESTRAL DE LA PROPORCION
Sea una población X b(n.p) Donde se desconoce p, se toma una m.a. tamaño “n”: X1,
X2,... Xn se estima la proporción n
x
np
X ...X X n21
Donde
1) xEnn
xEpE p
1)( de la distribución binomial E(x)=np
reemplazando pnpn
pE1
)(
2)
n
pqnpq
n
xVnn
xVpV
2
2
1
)(1
de la binomial V(x)= npq
n
pPÓ
n
pq
n
pqpV pp
)1(
3) Cuando n
n
pq
ppZcavla ... :Z N(0.1)
46
Nota 1 Si la m.a. de tamaño”n” se obtiene de una población finita de tamaño N Sin reemplazo
1N
nN
n
pqp
Zpp
Z
NnN
n
pq:
1
N(0.1)
El factor de corrección por continuad en la distribución muestral de proyección es n2
1
Ejemplo Suponiendo que un lote de 50 ordenadores hay 10 defectuosos Cual la probabilidad de que en una m.a. de tamaño n, ordenadores elegidos al azar
1) Con reposición a)n=5 b)n=60 :i)20%; ii) más de 20% ordenadores sean defectuosos
2) SIN REPOSICION SOLUCION
1. con reposición :n=5; 80.0:2050
10qp
a)
i) X b(5;0.20) donde X:”Nº de PC ordenadores entre 5 con reposición
5...2,1,0:)80.0(20.0)( 55
x
xxRxxP
x= el 20% de 5=1
4096.08.020.01)1(20.04
5
xPpP
2627.07373.01)20.0;5;1(111120.0) BXPXppPii
b) i) con n=60 como n>30 podemos aproximar mediante la normal
5.125.111220.0 xPocorrigiendxPpP
Estandarizando mediante 0984.3
12
)80.0)(2.0(60
)20.0(60 xxZ
1272.01)16.0(2
16.0116.016.016.016.016.0
16.016.00984.3
125.12
0984.3
125.1112
F
FFFFzPZP
ZPZPxp
47
Mediante la binomial 1278.08.020.012)12(4812
60
xP
Aplicando la verdadera distribución de la proporción, mediante
n
pq
ppZ donde el factor de corrección es
n2
1
)60(2
120.0
)60(2
120.0)020( pPpP
2083.01917.0 pP ; estandarizado
16.016.020.02083.00201917.0
60
)80.0)(20.0(
60
)80.0)(20.0(ZPZP
1272.01)5636.0(2116.02
16.0116.016.016.016.016.0
F
FFFFzPzP
ii) 20.0pP Binomialmente
)(11211212
0
xPxPxP como es demasiado largo recurrimos mediante
la aproximación a la normal, mediante
5.1215.01215.0
xPxpnpq
npxZ donde np=(60)(0.2)=12
estandarizando 4364.05636.01)16.0(116.010984.3
125.121 FzPzP
mediante la distribución de la proporción
n
pq
ppZ cuyo factor de corrección es
n21
)60(2
120.0120.0120.0 pPpPpP
4364.05636.0116.0116.010516.0
0083.01
20.02083.01tan2083.01
60
)80.0)(20.0(
FZPzP
ZPdarizandoespP