teoria unidad 4 - intervalos [modo de compatibilidad]

21
BIOESTADÍSTICA Universidad Nacional del Comahue Facultad de Ciencias del Ambiente y la Salud 1er cuatrimestre 2016 CONTENIDOS UNIDAD 4: Estimación de parámetros. Teorema central del límite. Estadísticos. Distribuciones muestrales. Estimación de parámetros. Condiciones de un buen estimador. Métodos de máxima verosimilitud y de mínimos cuadrados. Intervalos de confianza para la Media y la Variancia de una población Normal, y para la proporción. Intervalos de confianza para la diferencia de Medias y el cociente de Variancias de poblaciones Normales independientes, y para la diferencia de proporciones.

Upload: adonai-sala

Post on 07-Jul-2016

216 views

Category:

Documents


1 download

DESCRIPTION

intervalos de confianza UNCo

TRANSCRIPT

Page 1: Teoria Unidad 4 - Intervalos [Modo de Compatibilidad]

BIOESTADÍSTICA

Universidad Nacional del ComahueFacultad de Ciencias del Ambiente y la Salud

1er cuatrimestre 2016

CONTENIDOS

UNIDAD 4: Estimación de parámetros. Teorema central del

límite. Estadísticos. Distribuciones muestrales. Estimación de

parámetros. Condiciones de un buen estimador. Métodos de

máxima verosimilitud y de mínimos cuadrados. Intervalos de

confianza para la Media y la Variancia de una población Normal, y

para la proporción. Intervalos de confianza para la diferencia de

Medias y el cociente de Variancias de poblaciones Normales

independientes, y para la diferencia de proporciones.

Page 2: Teoria Unidad 4 - Intervalos [Modo de Compatibilidad]

DESCRIPTIVA INFERENCIAL

Auxilio de la Teoría de Probabilidades

ESTADÍSTICA

X1

X2...

Xi...XN

Muestra

Población

X1...Xn

El campo de la inferencia estadística esta formado por los métodosutilizados para tomar decisiones u obtener conclusiones sobre unapoblación utilizando la información contenida en una muestra

“se puede pensar en la inferencia estadística como una colección demétodos para aprender de la experiencia” C. Batanero

Page 3: Teoria Unidad 4 - Intervalos [Modo de Compatibilidad]

Población: es la totalidad de los elementos, o las

observaciones realizadas sobre ellos, que son objeto de

discusión y acerca de los cuales se desea información

Muestra: es un subconjunto de una población

Muestra Experimento Aleatorio

Debe poderse definir con absoluta precisión

Debería ser representativa de la población, una buena muestra

)()(...)(.)(),......,(1

2121

n

iinn XfXfXfXfXXXg

Sea f(x) la función de densidad de una variable aleatoria X, correspondiente a cierta población:

Muestra aleatoria: las variables aleatorias (X1 , X2 , X3 , … , Xn)

constituyen una muestra aleatoria de tamaño n si:

(i) las Xi son variables aleatorias independientes, y

(ii) todas las Xi tienen la misma distribución de probabilidad

por lo tanto su distribución conjunta será:

Page 4: Teoria Unidad 4 - Intervalos [Modo de Compatibilidad]

La comprensión del concepto de muestra aleatoria implica el equilibrioadecuado entre dos ideas aparentemente antagónicas: la representatividadmuestral y la variabilidad muestral. La primera de estas ideas nos sugiereque la muestra tendrá a menudo características similares a las de lapoblación, si ha sido elegida con las precauciones adecuadas. La segunda, elhecho de que no todas las muestras son iguales entre si.

Ejemplo:

3

5

7

3

3

3

5

3

7

5

3

5

5

5

7

7

3

7

5

7

7

TEORÍA DEL MUESTREO

COMO CUANTO

Muestreo simple al azar

Muestreo estratificado al azar

Variabilidad de los datos

Error admisible

Confianza

Page 5: Teoria Unidad 4 - Intervalos [Modo de Compatibilidad]

Estimación de Parámetros Pruebas de Hipótesis

I N F E R E N C I A

Ejemplo de estimación de parámetros:

¿ que proporción de esas 400.000 manzanas están dañadas ?

Page 6: Teoria Unidad 4 - Intervalos [Modo de Compatibilidad]

podemos partir unas pocas manzanas y basándonos en ese resultado, hacer una afirmación sobre el nro de fruta

‘bichada’ que hay en el cuadro ?

NO en forma exacta pero SI en términos probabilísticos

Ejemplo de prueba de hipótesis:

¿ las peras son más suceptibles al daño por carpocapsa que las manzanas ?

Inferencia Inductiva

base de las ciencias empíricas y del progreso científico

Page 7: Teoria Unidad 4 - Intervalos [Modo de Compatibilidad]

Inductiva:

Inferencia

- Premisa mayor

- Premisa menor

- Conclusión

- Hipótesis

- Observación experimental sobreunos pocos frutos de cada cuadro

- Conclusión sobre que pasa en ambos cuadros

Deductiva:

Sujeta a incertidumbre

- María es mayor de 18 años

Concluyente

- Todos los estudiantes del curso de estadística son mayores de 18 años

- María es estudiante del curso de estadística

Imaginemos una bodega que tiene huevos frescos. Por ej. supongamos quecontiene 5000 huevos.

¿qué proporción de estos 5000 huevos sondefectuosos?

Otro ejemplo de estimación de parámetros:

Podemos seleccionar aleatoriamente unos pocos huevos y basándonos en eseresultado, hacer una afirmación sobre el número de huevos defectuosos que hayen la bodega.

Page 8: Teoria Unidad 4 - Intervalos [Modo de Compatibilidad]

Otro ejemplo de prueba de hipótesis:

¿ los huevos del fabricante ‘A’ son ´mejores´ que los producidos por ‘B’ ?

Productor ‘ A’ Productor ‘ B’

Estadístico: es cualquier función de las variables

aleatorias que se observaron en la muestra y que no

contiene cantidades desconocidas

Parámetro: es una caracterización numérica de la

distribución de probabilidad de una población, de manera

que la describe en forma parcial o completa

Sea la muestra M(m): x1 , x2 , x3 , …. , xn

T1(M): (x1 + x2 + x3 +….+ xn) / n

T2(M): (log x1 + log x2 + log x3 +….+ log xn) / n

T3(M): x1 + x2Son Variables Aleatorias

!!!!

Page 9: Teoria Unidad 4 - Intervalos [Modo de Compatibilidad]

Si T se emplea para predecir el valor de un parámetro desconocido recibe el nombre de estimador

Es decir, un estimador, es un estadístico o función obtenido de los datos deuna muestra y que pretendemos que represente lo más fielmente posible a unparámetro poblacional desconocido, que es el objeto de nuestro estudio.

Muestra

Población

Estimación de Parámetros

Para que estos estimadores hagan ‘buenas’ estimaciones deben satisfacer ciertas propiedades:

ser insesgados

ser consistentes

de mínima variancia

Por otro lado hay distintas formas o métodos para realizar una estimación:

Estimación por mínimos cuadrados

Máxima verosimilitud

Método de los momentos

Page 10: Teoria Unidad 4 - Intervalos [Modo de Compatibilidad]

Propiedades de un buen estimador:

• Ser INSESGADO: )ˆE(

h

)E(x

n2

i2 i 1

x

(x x)S

n 1

con

)E(s

ˆE( )

sesgo

Page 11: Teoria Unidad 4 - Intervalos [Modo de Compatibilidad]

• Ser de MINIMA VARIANCIA (eficiente):

si y son 2 estimadores insesgados de se dice que es

mejor que si <

1θ 2θ

1ˆV(θ ) 2

ˆV(θ )

• Ser CONSISTENTE:

sea mejor a medida que aumenta el tamaño de muestra, esto es a

medida que n aumenta la distribución de se concentra más alrededor

de

nlim

Plim

n

θ

θ

Cuando se propone algún estimador se debe estudiar

su distribución para ver como se comporta

θ

Error Cuadrático Medio (ECM)

A veces no hay alternativa y es necesario utilizar estimadores sesgados

( ), en tales casos, es importante el ECM de ese estimador que se

define como:

2 2 2ˆ ˆ ˆ ˆ ˆECM(θ) = E E E( ) E( )

ˆE(θ)

2ˆV( ) sesgo

exactitudprecisión

Grado de cercanía que tienen las mediciones con respecto al valor objetivo

Grado de dispersión presente

en los datos

Page 12: Teoria Unidad 4 - Intervalos [Modo de Compatibilidad]

Eficiencia relativa

1

2

ˆECM(θ )ECM( )

Exacto Preciso Exacto y Preciso

Distribuciones de muestreo

3

5

7

3

3

3

5

3

7

5

3

5

5

5

7

7

3

7

5

7

7

5X

66,22

X

543 321 xxx

654 654 xxx

765 987 xxx

9

1 ixXPComo

XE(X) 5

2XV(X) 1,33

Page 13: Teoria Unidad 4 - Intervalos [Modo de Compatibilidad]

xXXE )(

nXV X

X

22)(

XXDE (X)

n

Error estándar de la media

Si X1 , X2 , X3 , …. , Xn es un muestra aleatoria que consiste en n v.a.

independientes normalmente distribuidas con E(Xi) = y V(Xi) = 2.

Entonces la distribución de la media muestral es normal con media

y variancia 2/nX

X N ( ; 2/n)

Sean X1 , X2 , X3 , …. , Xn n variables aleatorias IID con una distribución de

probabilidad no especificada y que tienen una media y una variancia 2

finita. El promedio muestral tiene una distribución con media y variancia

2/n que tiende hacia una normal conforme n tiende a infinito.

En otras palabras, la variable aleatoria Z tiene como límite una distribución

normal estándar.

X

1,0N

n

XZ n

Teorema Central del Límite

En situaciones en que se conoce 2

Tamaño de muestra

Pruebas de hipótesis acerca del valor de Intervalos de

confianza para

Page 14: Teoria Unidad 4 - Intervalos [Modo de Compatibilidad]

1

2 3

4 5

6

5,3X

9167,22 X

Ejemplo:

Muestreo n = 2 :

1 2 3 4 5 6

X

0%

5%

10%

15%

20%

Pro

b

2,78%

5,56%

8,33%

11,11%

13,89%

16,67%

13,89%

11,11%

8,33%

5,56%

2,78%

1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0

Media Muestral

Pro

b

Gamma

Uniforme

Población n=2 n=5

Población n=2 n=5

Page 15: Teoria Unidad 4 - Intervalos [Modo de Compatibilidad]

Conociendo establecer x1 y x2 tal que:x

P(x1< x <x2) = 1-

Operando:

nzxi

)/()(

Tamaño de muestra óptimo:

EA

.zn

1a. Intervalo de confianza para con 2 conocida

Yo se que: 95,096,196,1P z

96,196,1P

n

x

nx

n

96,196,1P

x

nx

n

96,196,1P

95,096,196,1P

nx

nx

Por TCL:

Operando:

Page 16: Teoria Unidad 4 - Intervalos [Modo de Compatibilidad]

Si una población normal tiene media = 20 y varianza 2 = 16

a) Cómo se distribuye una media muestral basada en 25 datos extraídos de esa población?

b) Haga un esquema de ambas distribuciones.

Y si no conocemos 2 ??????

Distribución t-Student:

t(n -1)

-5 -4 -3 -2 -1 0 1 2 3 4 50,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

0,45

ns

tx ni );/()(

1b. Intervalo de confianza para con 2 desconocida

ns

x

x

x William Sealey Gosset (Student)1876-1937

Page 17: Teoria Unidad 4 - Intervalos [Modo de Compatibilidad]

2. Intervalo de confianza para 2

Empírica: 2(n -1)

sn )(

f

2(n-3) (n-1)

E(2) = n - 1 Mo (2) = n - 3 V(2) = 2 (n -1)

Distribución Chi-cuadrado

Teórica: suma del cuadrado de n-1 variables independiente con distribuciónN(0,1)

z12 + z1

2 + z12 + ... + zn-1

2 2(n -1)

);()(

)(

nii

sn con i = (1-/2) y (/2)

Page 18: Teoria Unidad 4 - Intervalos [Modo de Compatibilidad]

3. Intervalo de confianza para una proporción

Npoblación la en éxitos de Nro

P nmuestra la en éxitos de Nro

p

V.A.

nx

p con x Bi(n ;P) entonces yP)pE( n

P)-P.(1)pV(

por lo tanto:

nP)-P.(1

P-p

N(0;1)

nzi

P)-P.(1.p)P( i(P)

ˆ ˆp.(1-p)p z.

n

Factor de corrección por población finita:

Si la población de donde se extrae la muestra es finita y su tamaño N no es lolo suficientemente grande respecto al tamaño de la muestra n como paragarantizar de que se trate de una muestra aleatoria (datos independientes), lavarianza del estimador debe ser corregido por el siguiente factor:

P.(1 -P) N-nV(p) .

n N-1ˆ

N - nfcpf

N -1

Page 19: Teoria Unidad 4 - Intervalos [Modo de Compatibilidad]

μ1 ?

X1μ2 ?

X2

n1 n2

x x

4. Intervalo de confianza para diferencia de medias

2

22

1

21

2121 ;N ~nn

XX

1 2 1 20 2 2

1 2

1 2

(X X ) ( )Z

n n

Con Z0 ~ N(0;1)

4a. Con varianzas poblacionales conocidas

(iguales o distintas)

Page 20: Teoria Unidad 4 - Intervalos [Modo de Compatibilidad]

Si y nx = ny22

yx

y

y

x

xi nn

zyxyx

)/()( )(

nzyx

yxi

)/()( )(

Si las varianzas poblacionales no son distintas, ambas variancias muestralesestiman la variancia común 2, entonces podemos combinarlas para produciruna sola estimación, digamos:

nnsnsn

s p)()(

Situación 1:

4b. Con varianzas poblacionales desconocidas

y

p

x

pnni n

sns

tyxyxyx

);/()( )(

yxpnn nn

styxyx

);/()(

Page 21: Teoria Unidad 4 - Intervalos [Modo de Compatibilidad]

Situación 2:

Si la homocedasticidad no es sustentable la distribución no esexactamente t con nx+ny-2 grados de libertad pero igualmente funcionacomo una muy buena aproximación:

y

y

x

xnni n

sns

tyxyxyx

22

)2;2/1()( )(

2

1)/(

1)/(

2

22

22

1

21

21

2

2

21

1

21

nns

nns

ns

ns

Nota: los grados de libertad (gl) se deberían calcular como unaponderación de las variancias y se los denomina grados de libertadefectivos ().

5. Intervalo de confianza para diferencia de proporciones

2

22

1

11)2/1(21)(

)ˆ1(ˆ)ˆ1(ˆ)ˆˆ(

21 npp

npp

zppPPi

NOTA: hay casos en que ambas proporciones muestrales son extraídas de una única muestra, en ese caso existe un solo n (n1=n2=n).

nnxx

p

21)2/1(21)(

11)ˆ1.(ˆ)ˆˆ(

21 nnppzppPPi