estimacion de parametros

Post on 13-Jul-2016

24 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

DESCRIPTION

Estimacion de parametros Probabilidady Estadistica

TRANSCRIPT

Distribuciones gaussianas con igual media pero varianza

diferente.

Distribuciones gaussianas con diferentes medias e igual

dispersión.

DISTRIBUCIONES EN EL

MUESTREO

Si un estadístico puede ser calculado para cada una de las muestras de tamaño n obtenidas de una población , la distribución del estadístico obtenido de de cada una las muestras se denomina distribución en el muestreo.

Sx,

LA DISTRIBUCION DE LOS PROMEDIOS MUESTRALES SE DENOMINA

DISTRIBUCION EN EL MUESTREO DE LA MEDIA

PROPIEDADES DE LA MEDIA – Insesgada: El valor medio que se obtiene de todos

los promedios muestrales debe ser el valor del parámetro.

– Consistente: Cuando el tamaño de la muestra crece, el valor del estadístico se aproxima al valor del parámetro desconocido.

– Eficiente: Al estadístico no puede exigírsele que, para una muestra cualquiera se obtenga el valor exacto del parámetro. Sin embargo podemos pedirle que su dispersión (varianza) sea tan pequeña como sea posible. La media muestral es más estable de una muestra a otra que el modo y la mediana, su dispersión con respecto al valor central es menor que la de los otros dos.

)(

• ERROR ESTÁNDAR DE LA MEDIA

nx

Teorema del límite central:

Cuando el tamaño de las muestras se vuelve suficientemente grande, la

distribución en el muestreo del promedio se puede aproximar a una distribución normal. Esto es válido cualquiera sea la distribución de los valores individuales de la población.

• ERROR ESTÁNDAR DE LA MEDIA (ó desvío estándar de las medias muestrales)

nx

Consecuencias del Teorema

• Cualquiera sea la distribución de la población, cuando n >= 30 , la distribución de los promedios muestrales será aproximadamente normal.

• Si la distribución de la población tiene una simetría razonable, la distribución en el muestreo de la media, para n por lo menos de 15, también tiene distribución normal.

• Si la distribución de la población es normal, la distribución en el muestreo de la media, para cualquier tamaño de muestra, también tiene distribución normal

De acuerdo al TEOREMA DEL LÍMITE CENTRAL: podremos

entonces considerar a la distribución de las medias

muestrales

),(n

Nx

ESTIMACIONES DE PARAMETROS

• Estimación puntual: Usa un solo valor de la muestra para estimar el

parámetro de la población

22

S

x

Estimación Busco una relación en la que intervengan el

parámetro desconocido junto con su estimador y de modo que estos se distribuyan según una ley de probabilidad que es bien conocida y de ser posible tabulada.

Tomamos un intervalo que contenga una masa de probabilidad determinada que llamamos 1-

Este intervalo lo tomamos simétrico con respecto a la media, allí es donde se acumula más masa (para que sea lo más pequeño posible)

ESTIMACIONES DE PARAMETROS

• Estimación por intervalos: En lugar de tener una estimación basada

en un solo valor, se toma un intervalo, que tiene una confianza específica, o probabilidad de estimar en forma correcta el valor real del parámetro de la población.

ESTIMACIONES DE PARAMETROS

• Estimación puntual: Usa un solo valor de la muestra para estimar el

parámetro de la población

22

S

x

La distribución y el intervalo más pequeño posible

INTERVALO PARA LA MEDIA SI SE CONOCE LA VARIANZA DE

LA POBLACIONcon un nivel de confianza de 1

1..

nzx

nzxp

nzx

INTERVALO PARA LA MEDIA SI NO SE CONOCE LA VARIANZA

DE LA POBLACIONcon un nivel de confianza 1

1..

11

nStx

nStxp nn

nStx

La distribución de Student

Función de densidad de una de distribución t de Student

Comparación entre las funciones t (para n=1) y Normal N(0,1)

Cuando aumentan los g. de libertad, la distribución t se

aproxima a la distribución normal estándar.

Características de la distribución t de Student

  

• Al igual que la distribución Z, es una distribución continua• La distribución t tiene una media de cero, es simétrica

respecto de la media y se extiende de - á + • Tiene forma acampanada • No hay una distribución t, sino una "familia" de distribuciones

t, todas con la misma media cero, pero con su respectiva desviación estándar diferente de acuerdo con el tamaño (n) de la muestra.

• La distribución t es más ancha y más plana en el centro que la distribución normal estándar como resultado de ello se tiene una mayor variabilidad en las medias de muestra calculadas a partir de muestras más pequeñas, pero a medida que aumenta el tamaño de la muestra, la distribución t se aproxima a la distribución normal estándar

.

Cálculo de t

nSxt

n

1

Determinación del tamaño de la muestra para la media

2

22.

.

ezn

ezn

despejandon

ze

ex

Siendo• e = error muestral, es la diferencia entre

el promedio de la muestra y el promedio de la población (error muestral permitido)

• Z = que depende del nivel de confianza• = varianza de la población

2

Planteo un problema para estimar la proporción de una población

Una empresa recibe una partida de tubos de ensayo más económicos que lo habitual.El propietario de la empresa desea estimar la proporción de tubos defectuosos. Para esto se toma una muestra de 200 tubos y en ella se encuentran 20 defectuosos. Establecer una estimación por intervalo, con 90% de confianza, de la proporción de tubos defectuosos recibidos. Si la partida se puede devolver en caso de más del 5% de defectuosos, entonces en base a los resultados obtenidos con la muestra, ¿está en condiciones el propietario de la empresa de solicitar le cambien la partida?

Distribución en el muestreo de la proporción

Primero, hay que recordar: • la distribución Binomial se puede aproximar a

la distribución Normal cuando

• Para la distribución binomial el

• La desviación estándar

5. pn

pn.

qpn ..

Si en lugar de considerar el número de éxitos, consideramos la proporción de éxitos en los n ensayos que determinan el experimento

p= x/nla media para la proporción de éxitos

el error estándar de la proporción de éxitos Recordando por el Teorema del Límite Central ahora

pp

nqp

p.

x

xZ

nqpppZ´´.

´

• Siendo:• p´= x/n donde x es el número de éxitos de

una muestra • q´= 1-p´• n = tamaño de la muestra

• En se usan los valores de la muestra ya que los de la población son justamente los que se deben estimar

nqp

INTERVALO DE CONFIANZA PARA LA PROPORCIÓN DE UNA POBLACIÓNcon un nivel de confianza de 1

nqpzpp

.

1´´..´´´..´

nqpzpp

nqpzpP

Resolución del problema planteado de proporción

:%90%)48,13%5,6(%90)1348,0065,0(

%90)0348,010,00348,010,0(

%90200

90,0.10,0.64,110,0200

90,0.10,0.64,110,0

ConclusiónpPpP

pP

pP

Determinación del tamaño de la muestra para la proporción

2

2 ´´..

´´..

''..

´

eqpzn

eqpzn

despejandonqpze

epp

Distribución Ji ó Chi cuadrado:Si de una población normal se obtienen muestras de tamaño n, la distribución en el muestreo de:

Los coeficientes son positivos y la curva no es simétrica , pero para

2

22 .1

Sn

Nn 2

2

Distribución Ji ó Chi cuadradaSi de una población normal se obtienen todas

las muestras de tamaño n, la distribución en el muestreo de

Tiene una distribución de probabilidad con asimetría positiva, los coeficientes son positivos, la curva no es simétrica , pero para:

2

22 1

Sn

Nn 2

2

DISTRIBUCION JI ó CHI CUADRADO para distintos tamaños de muestra

INTERVALO DE CONFIANZA PARA LA VARIANCIA DE UNA POBLACIÓNcon un nivel de confianza de:

1).1().1(2

22

2

2 SnSnp

Despejo

De

1

2

22 .1

Sn

2

22 1

Sn

PRUEBAS DE HIPOTESISUna hipótesis estadística es una proposición o

supuesto respecto a un parámetro de una ó más poblaciones.

Las hipótesis son proposiciones sobre los parámetros de la población, no de las muestras.

El procedimiento que conduce a una decisión sobre la hipótesis planteada recibe el nombre de prueba de hipótesis.

Este procedimiento depende del empleo de la información contenida en una muestra de la población.

Procedimiento general para la prueba de hipótesis

• Establecer la hipótesis nula H0

• Establecer la hipótesis alternativa H1• Establecer un estadístico de prueba apropiado (Z , t, ji

cuadrado, F)• Establecer la región de rechazo y la región de no rechazo ó

aceptación.Con el fin de tomar una decisión respecto de la hipótesis nula, debemos determinar el valor critico del estadístico de prueba.

• Sustituir en la ecuación del estadístico de prueba las cantidades determinadas por la muestra.

• Determinar si la prueba ha caído en la región de rechazo o en la de no rechazo, o sea verificar si se debe ó no rechazar la hipótesis nula.

• Expresar la decisión estadística en términos del problema.

Tipos de Pruebas de Hipótesis• Una prueba con hipótesis planteada de la

siguiente manera:

Se denomina prueba bilateral.

01

00

HH

En una prueba bilateral, la región de rechazo se separa en dos partes con la misma

probabilidad en cada cola de la distribución del estadístico de prueba.

Tipos de Pruebas de Hipótesis

• Una prueba con hipótesis planteada de la siguiente manera:

ó

Se denomina prueba unilateral.

01

00

HH

01

00

HH

En una prueba unilateral:Para el primer caso: La región de rechazo es

una sola, y se encuentra en la cola superior de la distribución del estadístico de prueba.

01

00

HH

Para el segundo caso: La región de rechazo es una sola, y se encuentra en la cola inferior de la distribución del estadístico de prueba.

01

00

HH

Grados de libertadPara el cálculo de un estadístico, es necesario emplear tanto observaciones de muestra como propiedades de ciertos parámetros de la población. Si estos parámetros son desconocidos, hay que estimarlos a partir de la muestra; el número de grados de libertad de un estadístico, se define como el número “n" de observaciones independientes en la muestra (o sea, el tamaño de la muestra) menos el número K de parámetros de la población, que debe ser estimado a partir de observaciones muéstrales.En símbolos, g.l. = n – k.

Prueba de hipótesis bilateral para la varianza

Prueba de hipótesis unilateral para la varianza

Prueba de hipótesis unilateral para la varianza

   

El problema de rechazar o aceptar una hipótesis puede plantearse como un problema de decisión, en el que evidentemente existe la posibilidad de fracasar o acertar en la elección o decisión a la hora de concluir que la hipótesis, bien nula o bien alternativa, son rechazables o no.

Relación entre los errores

En realidad no hay una elección que minimice a β y α simultáneamente, pues, como se observa, su comportamiento es inverso

Cuando se realiza una prueba de hipótesis pueden suceder las

siguientes situaciones:

No rechazar Ho Rechazar Ho

Ho es cierta Correcto Error tipo I

Probabilidad: 1-α

Probabilidad: α

Ho es falsa Error Tipo II Correcto

Probabilidad: β

Probabilidad: 1-β

Prueba de hipótesis para dos poblaciones

PARA LA DIFERENCIA DE MEDIAS DE POBLACIONES CON DISTRIBUCIÓN NORMAL (Con muestras independientes)

Planteadas así ó

211

210

::

HH

0:0:

211

210

HH

SE CONOCEN LAS VARIANZAS POBLACIONALES ( y )

Antes z se calculaba:

Ahora:

21 2

2

2

22

1

21

21

nn

xxzcalc

n

xZ

NO SE CONOCEN LAS VARIANZAS POBLACIONALES ( y )Si se considera que:

Se estima una varianza conjunta

22

21

21 2

2

Ahora

21

21

11nn

s

xxt

p

calc

2

11

21

222

2112

nn

snsns p

nSxt

Antes

Si se considera que: 22

21

NO SE CONOCEN LAS VARIANZAS POBLACIONALES ( Y )2

1 22

Ahora

2

22

1

21

21

ns

ns

xxtcalc

OBSERVACIONES PAREADASCuando los datos se obtienen antes y después de

realizar un determinado proceso.Ahora:

Es el promedio de las diferencias de las muestras

Es el desvío estándar de las diferencias de las muestras

nSdtd

calc

d

dS

PRUEBAS DE HIPÓTESIS PARA COMPARAR LAS DESVIACIONES

ESTÁNDAR DE DOS POBLACIONES

Las hipótesis se plantean de la siguiente manera:

211

210

::

HH

0:0:

211

210

HH

Se usa el estadístico F, que considera el cociente de las varianzas de las dos muestras:

La distribución F ó de Snedecor está tabulada, no es simétrica (tiene asimetría positiva), sólo toma valores positivos, y siempre se debe colocar en el numerador el S mayor.

Determino valores críticos.

2

2

2

1

SSF

La tabla contiene los valores teóricos de F

correspondientes a la cola superior de la curva , como la curva no es simétrica, para calcular el valor de F de la cola inferior:

a= grados de libertad de la muestra 1b= grados de libertad de la muestra 2

),sup(1),inf(abF

baF

top related