estadísticas y distribuciones de muestreo - diana...
Post on 24-Feb-2018
224 Views
Preview:
TRANSCRIPT
1
D I A N A D E L P I L A R C O B O S D E L A N G E L
Estadísticas y distribuciones de muestreo
27/11/2011
Estadísticas
Una estadística es cualquier función de las observaciones en una
muestra aleatoria que no depende de parámetros desconocidos.
Por ejemplo, si X1, X2,…,Xn es una muestra aleatoria de tamaño
n, entonces la media de la muestra , la varianza de la muestra S2
y la desviación estándar S son estadísticas.
El proceso de extraer conclusiones en torno a poblaciones con
base en datos de muestras utiliza estadísticas en forma
considerable.
X
n
X
X
n
i
i 1
1
)(1
2
2
n
XX
S
n
i
i
2
Diana Cobos del Angel 27/11/2011
2
Distribuciones muestrales
Supóngase que se toma una muestra aleatoria de tamaño n,
X1, X2, …, Xn de una población con distribución Normal,
N(m,s2).
Cada observación es una v.a. con distribución N(m,s2)
Entonces la media es una v. a. con distribución
N(m,s2/n)
X
3
Diana Cobos del Angel 27/11/2011
Teorema de Límite Central
Si es la media de una muestra aleatoria de tamaño n que se toma
de una población con media m y varianza s2, entonces, el
estadístico
Se aproxima a una distribución Normal estándar cuando n tiende a
infinito.
Observación: esta aproximación será mejor para n ≥ 30 sin
importar la forma de la población. Si n < 30 la aproximación es
buena sólo si la población no difiere mucho de una distribución
Normal.
X
n
XZ
/s
m
4
Diana Cobos del Angel 27/11/2011
3
Distribución Ji cuadrada c2
Sean Z1, Z2, …, Zn variables aleatorias con distribución normal
estándar, es decir N(0,1). Entonces
Tiene la función de densidad Ji cuadrada con n grados de libertad
222
2
2
1
1
2 ... nn
n
i
i ZZZZY c
5
Diana Cobos del Angel 27/11/2011
Distribución Ji cuadrada c2 6
Diana Cobos del Angel 27/11/2011
4
Características de Ji cuadrada c2
Asimétrica y asintótica al eje x por la derecha; Su dominio va de 0 a +
Área bajo la curva desde 0 a + =1 Tiene parámetro = n (g.l.) Al aumentar n se aproxima a la normal Representa distribución muestral de varianza. Entre las aplicaciones: Determinación intervalos confianza para varianzas Pruebas de hipótesis para una varianza El ajuste de datos a una distribución dada conocida Las pruebas de independencia.
7
Diana Cobos del Angel 27/11/2011
Gráficas de Ji cuadrada c2 8
Diana Cobos del Angel 27/11/2011
5
Distribución Ji cuadrada c2 9
Diana Cobos del Angel 27/11/2011
Probabilidad c2 Excel
=DISTR.CHI(x;)
Devuelve la probabilidad de una variable aleatoria continua siguiendo una distribución Ji cuadrada de una sola cola con gl.
P(X>c2)
10
Diana Cobos del Angel 27/11/2011
6
Probabilidad c2 11
Diana Cobos del Angel 27/11/2011
Probabilidad c2 Inversa Excel
=PRUEBA.CHI.INV(P,)
Devuelve el valor de c2 para una probabilidad dada, de una distribución Ji-cuadrada de una sola cola con g.l.
12
Diana Cobos del Angel 27/11/2011
7
Ejercicios Ji cuadrada c2
a) Calcular la probabilidad de obtener un valor mayor de
23.7 en una distribución c2 con = 14 g.l., es decir
b) Calcular el valor de c2 después del cual se encuentre el 5 % del área en una distribución Ji-cuadrado con 4 g.l., es decir
)7.23( 2
14 cP
05.0)( 22
4 ccP
13
Diana Cobos del Angel 27/11/2011
Distribución “t” de Student
Desarrollada con base en distribuciones de frecuencia
empíricas por el estadístico William Gosset, cuyo
seudónimo era “Student”.
Gosset trabajó en la Cervecería Guiness de Dublín y
tenía dificultades al usar la distribución Normal en
muestras pequeñas
“The probable error of a mean” Biometrika 1908
Fisher fue quien encontró mas aplicaciones para ésta.
14
Diana Cobos del Angel 27/11/2011
8
Distribución “t” de Student
La distribución muestral de la media de una muestra aleatoria se ajusta muy bien a la distribución Normal si se conoce s. Si n es grande, esto no presenta ningún problema, aún cuando s sea desconocida, por lo que en este caso es razonable sustituirla por s.
Sin embargo, en el caso de usar valores de n < 30, o sea en el caso de pequeñas muestras, esto no funciona tan bien, y la distribución que mejor se ajusta es la t de Student.
X
15
Diana Cobos del Angel 27/11/2011
Distribución “t” de Student
Sean Z es una v.a. Normal estándar y V es una v.a. Ji con k grados de libertad. Si Z y V son independientes, entonces la v.a.
tiene una distribución t con n grados de libertad, cuya función de densidad es:
kV
ZT
/
16
Diana Cobos del Angel 27/11/2011
9
Distribución “t” de Student
Definiendo el estadístico t:
Se puede probar que siendo `x la media de una muestra de tamaño n tomada de una población Normal con media m y varianza s2, el estadístico t es el valor de una variable aleatoria con distribución "t" de Student y parámetro (grados de libertad) = n-1.
t =x -
s / n
m
17
Diana Cobos del Angel 27/11/2011
Distribución “t” de Student 18
Diana Cobos del Angel 27/11/2011
10
Distribución “t” de Student 19
Diana Cobos del Angel 27/11/2011
Características de la distribución “t”
Tiene media igual 0, es asintótica al eje x y su dominio va de - a +;
El área bajo la curva desde - a + es igual a 1
m 0, s2 depende parámetro (grados libertad)
Varianza > 1, pero se aproxima a 1 cuando n
Al aumentar n, la distribución “t se aproxima a la Normal; n > 30 ó más, excelente aproximación
Entre las aplicaciones:
Estimación de intervalos de confianza para medias a partir de muestras pequeñas
Pruebas de hipótesis basadas en muestras < 30
20
Diana Cobos del Angel 27/11/2011
11
Distribución “t” de Student 21
Diana Cobos del Angel 27/11/2011
Distribución “t” de Student
Las tablas brindan sólo los puntos porcentuales de la cola
superior
22
Diana Cobos del Angel 27/11/2011
12
Probabilidad “t” en Excel
=DISTR.T(x,,colas) Devuelve el área a la derecha de x (a)
x= valor de t (solo positivo)
= grados de libertad
Colas = 1 o 2 colas
colas= 1, P( X>t )
colas = 2, P(|X| > t); P(X > t o X < -t).
23
Diana Cobos del Angel 27/11/2011
Probabilidad “t” Inversa en Excel
=DISTR.T.INV(a,)
Devuelve el valor de t de dos colas, después del cual se encuentra el a x 100% del área de la curva.
P(|X| > t) = P(X < -t o X > t).
Para una cola, remplazar a por 2 a.
24
Diana Cobos del Angel 27/11/2011
13
Ejercicio distribución “t” de Student
a) Calcular la probabilidad de obtener un valor mayor que 2,26 en una distribución t con 9 gdl
b) Calcular la probabilidad de obtener un valor mayor que 2,26 o menor que -2,26 en una distribución t con 9 gdl
c) Calcular el valor de t después del cual se encuentre el 5% del área de la curva con 9 gdl
d) Calcular el valor de t para a= 0,05 con 9 gdl y dos colas
25
Diana Cobos del Angel 27/11/2011
Distribución "F” de Fisher
Sean W y Y v.a. con distribución Ji cuadrada, independientes con
n1 y n2 grados de libertad respectivamente. Entonces el cociente
Sigue la distribución F con n1= u g.l. en el numerador y n2 = v g.l.
en el denominador y su función de densidad es:
2
1
/
/
nY
nWF
26
Diana Cobos del Angel 27/11/2011
14
Distribución "F” de Fisher
También llamada "F” de Fisher - Schnedecor
Representa la distribución muestral de la razón de dos varianzas. Es decir que se obtiene de la razón de dos distribuciones Ji-cuadradas.
Definimos el estadístico F como:
El cual es el valor de una variable aleatoria que tiene distribución F con parámetros n1 y n2
2
2
2
1
s
s=F
27
Diana Cobos del Angel 27/11/2011
Propiedades de distribución F
Asimétrica, y asintótica al eje x por el lado derecho
Su dominio va de 0 a +
Área bajo curva desde 0 a + =1
Tiene parámetros n1 y n2
Entre sus aplicaciones: Pruebas de hipótesis entre 2 varianzas
Análisis de varianza
Análisis de covarianza.
28
Diana Cobos del Angel 27/11/2011
15
Gráfica de la distribución F 29
Diana Cobos del Angel 27/11/2011
Propiedades de Distribución F
)4()2(
)2(2)(
2)(
2
2
21
21
2
2
2
2
nnn
nnnFV
n
nFE
30
Diana Cobos del Angel 27/11/2011
16
Gráfica de la distribución F 31
Diana Cobos del Angel 27/11/2011
Probabilidad F Excel
=DISTR.F(x,1, 2)
Devuelve el área a la derecha de un valor en una distribución F con 1 y 2 g.l.
P( F>x )
32
Diana Cobos del Angel 27/11/2011
17
Probabilidad F Inversa Excel
=DISTR.F.INV(a, 1, 2)
Devuelve el valor crítico de F(a) para una distribución F con 1, 2 g.l.
33
Diana Cobos del Angel 27/11/2011
Ejercicios sobre la distribución F
a) Determine la probabilidad de tener un valor de F mayor que 9.28 en una distribución F con 1=3 y 2=3 g.l.
b) Halle la el valor crítico de F(0.05) para 1=3 y 2=15 g.l.
34
Diana Cobos del Angel 27/11/2011
top related