pruebas de hipotesis · de una muestra aleatoria, ... (una media con varianza conocida) un...

23
PRUEBAS DE HIPOTESIS Es posible estimar un parámetro a partir de datos muestrales, bien sea una estimación puntual o un intervalo de confianza. Pero: ¿Si mi objetivo no es estimar un parámetro, sino determinar el ¿Si mi objetivo no es estimar un parámetro, sino determinar el cumplimiento de una hipótesis sobre el parámetro? R=/ Pruebas de Hipótesis

Upload: trinhthien

Post on 06-Sep-2018

276 views

Category:

Documents


3 download

TRANSCRIPT

PRUEBAS DE HIPOTESIS

Es posible estimar un parámetro a partir de datos muestrales, biensea una estimación puntual o un intervalo de confianza. Pero:

¿Si mi objetivo no es estimar un parámetro, sino determinar el¿Si mi objetivo no es estimar un parámetro, sino determinar el

cumplimiento de una hipótesis sobre el parámetro?

R=/ Pruebas de Hipótesis

PRUEBAS DE HIPOTESIS

Población (N)

µ

Muestra (n)

Resultados Decisión

lX

Parece que

lµ =

lµ = lµ >O

Hipótesis

µ? Evidencia

lX

l X

Al parecer

lµ >

PRUEBAS DE HIPOTESIS

Definición: Procedimiento estadístico que, a través del estudiode una muestra aleatoria, permite determinar el cumplimiento deuna hipótesis planteada sobre alguna característica de lapoblación.

Características:Características:

• La decisión se toma partiendo de la evidencia que se recaba a través deuna muestra aleatoria

• Determina mediante calculo de probabilidades si el cumplimiento de lahipótesis es razonable

PRUEBAS DE HIPOTESIS

Algunas Definiciones:

Hipótesis de investigación: Idea o conjetura que se tiene a priori yque se desea contrastar a través de la realidad.

“Es la suposición de una verdad que aún no se ha establecido, es decir, una

conjetura que se hace sobre la realidad que aún no se conoce y que se haconjetura que se hace sobre la realidad que aún no se conoce y que se haformulado precisamente con el objeto de llegar a conocimiento de nuevoshechos” Grasseau. Teoria de la Ciencia. Pag 103.

Ejemplos:

H1. La Planta de tratamiento de aguas residuales (PTAR) remueve un30% de las bacterias que llegan en los vertimientos.

H2.El tiempo de vida promedio de determinada bacteria es menor a10 días.

PRUEBAS DE HIPOTESIS

Algunas Definiciones:

Hipótesis Estadística: Representación de la hipótesis deinvestigación en forma de ecuación matemática y en función deparámetros poblacionales.

Ejemplo:Ejemplo:

H1: P = 0.30 La Planta de tratamiento de aguas residuales (PTAR) remueveun 30% de las bacterias que llegan en los vertimientos.

H2: El tiempo de vida promedio de determinada bacteria es menora 10 días.

10<µ

Las hipótesis de investigación pueden desglosarse en dos hipótesisestadísticas que se denominan Hipótesis nula e Hipótesis Alterna:

PRUEBAS DE HIPOTESIS

La hipótesis nula siempre debe plantearse en términos deigualdad, mientras que la hipótesis alterna dependerá delconocimiento que tenga el investigar del problema o de lahipotesis de investigación.

Ejemplo:

Caso 1. La Planta de tratamiento de aguas residuales (PTAR) remueve un30% de las bacterias que llegan en los vertimientos.

(H0): P = 0.3 vs (H1): P≠0.3 ó P>0.3 ó P<0.3

Caso 2. El tiempo de vida promedio de determinada bacteria es menora 10 días.

(H0): vs (H1):10<µ

Ejemplo:

10=µ

Bajo que criterio acepto o no acepto la hipótesis nula?

�La verdad o falsedad de la hipótesis NO puede conocerse contotal seguridad a menos que pueda examinarse toda lapoblación

�La única herramienta de la cual se dispone es aceptar orechazar la hipótesis nula con base en lo que se observe en una

0.250.25 0.30 0.30 0.350.35

Región Crítica Región de aceptación Región Crítica

Se acepta H1 Se acepta H0 Se acepta H1

P ≠ 0. 30 P = 0.30 P ≠ 0.30

Valores CríticosValores Críticos

rechazar la hipótesis nula con base en lo que se observe en unamuestra aleatoria. Es decir el valor del estimador dará algunaevidencia sobre el valor que asume el parámetro.

PRUEBAS DE HIPOTESIS

“Se debe entender que la aceptación de una hipótesisimplica tan solo que los datos no arrojaron suficienteevidencia que indique que esta no se cumple”.

ERRORES EN LAS PRUEBA DE HIPOTESIS

Condición realDecisión H0 verdadera H0 falsa

Rechazar H0 Error Tipo I ok

Aceptar H0 ok Error Tipo II

TIPOS DE ERROR EN PRUEBAS DE HIPOTESIS

Error Tipo I: Rechazar una hipótesis nula cuando es verdadera

Error Tipo II: No rechazar una hipótesis nula cuando es falsa

P(Error Tipo I) = = Nivel de significanciaα

βP(Error Tipo II) =

Potencia de la Prueba = 1- P(Error Tipo II)

Capacidad que tiene la prueba de rechazar una hipótesis nula cuando esta es falsa.

β

Lo ideal seria que tanto como sean muy pequeños, pero esto solo se logra aumentando el tamaño de la muestra

α β

ERRORES EN PRUEBAS DE HIPOTESIS

HH0 0 verdaderaverdadera HH00 FalsaFalsa

Valor Critico

No acepto H0Acepto H0

αβ

Nótese como los errores en pruebas de hipótesis están relacionados de manera inversa

EJECUCION DE UNA PRUEBA DE HIPOTESIS

1. Plantear una hipótesis de investigación.

2. Traducir la hipótesis de investigación en hipótesis estadísticas

3. Fijar Nivel de Significancia

4. Determinar un estadístico de prueba con distribución conocida (verificar supuestos).

α

(verificar supuestos).

5. Determinar región de aceptación y región de rechazo

6. Evaluar el estadístico de prueba en la muestra obtenidaaleatoriamente.

7. Contrastar estadístico de prueba versus región de aceptación y rechazo.

8. Decisión. Rechaza Ho si el valor del estadístico de prueba cae en la

región de rechazo

Estadísticos de prueba y sus distribuciones

H0 H1 SupuestosEstadístico de Prueba

Distribución

Varianza conocida

Varianza desconocida0µµ =

0µµ ≠

Caso 1 Comparación contra un valor objetivo

0µµ >

n

XZ

σ

µ0

−= Z

Varianza desconocida0µµ = 0µµ >

0µµ <

0PP =

0PP ≠

0PP >

0PP <

nS

XT 0

µ−=

n

PP

PPZ

oo )1(

0

−=

)1( −nt

Z

0σσ =0σσ ≠

0σσ >

0σσ <2

0

2

2 )1(

σ

SnX

−= 2

)1( −nχ

Estadísticos de prueba y sus distribuciones

H0 H1 SupuestosEstadístico de

PruebaDistribución

Varianzas conocidas

Varianzas desconocidas d=−µµ

2

2

2

1

2

1

2121 )()(

nn

xxZ

σσ

µµ

+

−−−=

Caso 2 Comparación de 2 poblaciones

Zd≠− 21 µµ

2121)()( xx

T−−−

=µµd>− 21 µµ Varianzas desconocidas

e iguales

Varianzas desconocidas y diferentes

Tamaño de muestra grande

Normalidad

d=− 21 µµ

Z

21

2121

11

)()(

nnS

xxT

p +

−−−=

µµ

2

*)1(*)1(

21

2

22

2

11

−+

−+−=

nn

SnSnS p 1

)(

1

)(

2

2

2

2

2

1

2

1

2

2

2

2

1

2

1

1

−+

+

=

n

nS

n

nS

n

S

n

S

V

)2( 21 −+ nntd>− 21 µµ

d<− 21 µµ

)(vt

dPP =−21

dPP ≠− 21

dPP >− 21

dPP <− 21

2

2

2

1

S

SF =

( ) ( )

2

22

1

11

2121

)ˆ1(ˆ)ˆ1(ˆ

ˆˆ

n

pp

n

pp

PPppZ

−+

−−−=

)1,1( 21 −− nnF12

2

2

1 =σ

σ1

2

2

2

1 ≠σ

σ

Forma de la Región de Rechazo

La forma región de rechazo depende de cómo se plantee lahipótesis alterna:

1. Hipótesis alterna unilateral (Una sola cola)

2. Hipótesis Alterna Bilaterales (dos colas)

Ejemplo

ASOFONDOS es la asociación que regula los fondos depensiones. Esta entidad sugiere que la edad de jubilacióndebe incrementarse, debido a que las condiciones de riesgode los individuos en la actualidad ha disminuido, lograndoincrementar su esperanza de vida, que hasta hace algunosaños se había calculado en 70 años, con una desviaciónaños se había calculado en 70 años, con una desviaciónestándar de 8.9 años. Su afirmación la planteafundamentándose en una muestra de 100 registros demuertes que dio como resultado una edad promedio demuerte de 71,8 años Que opina usted sobre la afirmación.

Determine el valor P.

Valor P como Criterio de Decisión

Definición: Probabilidad de que el estadístico de prueba arroje un resultado tan extremo o más extremo que el observado cuando la Hipótesis nula es verdadera

Criterio de Decisión

Si el valor P es relativamente grande (valor p > significancía)Si el valor P es relativamente grande (valor p > significancía)

Es razonable pensar que la Hipótesis nula puede ser cierta (se acepta Ho)

Si el valor P es muy pequeño (valor p < significancía) se rechaza la Hipótesis nula

“De forma ligera puede verse como la probabilidad de que la Hipótesis Nula sea Verdadera”

SOLUCIÓN

Paso 1. Planteamiento de Hipótesis de Investigación

La edad promedio de muerte es superior a 70 años

Paso 2. Planteamiento de Hipótesis Estadísticas

0 1: 70 VS : 70H Hµ µ= >

70µ >

Paso 3. Selección nivel de significancia

Paso 4. Selección y calculo del estadístico de prueba

0 1: 70 VS : 70H Hµ µ= >

05.0=α

02.21009.8

708.710 =−

=−

=n

xzc

σ

µ

SOLUCIÓN

Paso 5. Determinación Región de Aceptación, Rechazo

Región de rechazo

0.051.64z =

Paso 6. Contraste del estadístico de Prueba

Paso 7. Decisión

Rechazo Ho Parece lógico pensar que la esperanza de vida ha aumentado

Paso 8. Calculo del Valor P

2.02c

z =

0217.0)02.2( =>zp

Ejemplos

Ejemplo 1: (una media con varianza conocida)

Un fabricante de sistemas de aspersión utilizados para protección de incendiosen edificios de oficina, afirma que el verdadero valor promedio de activación delsistema es de 130°F. Una muestra de 9 sistemas, produce un promedio muestralde temperatura de activación de 131.08°F. Si la distribución de los tiempos deactivación es normal con desviación de 1.5°F, ¿Los datos contradicen laafirmación del fabricante al nivel de significancia del 0.01?afirmación del fabricante al nivel de significancia del 0.01?

Estadístico de prueba Distribución Referencia

n

XZ

σ

µ0−=

Z

Ejemplos

Ejemplo 2: (Una media con varianza desconocida)

Históricamente se ha observado que la cantidad promedio de oxigeno disuelto encierto rió es de 4,7 mg/lt. En los últimos días se ha instalado una nueva fabricaque arroja sus vertimientos sobre este rió y se tiene la idea de que estosvertimientos están contaminándolo. Para probar lo anterior se han tomadomuestras de agua durante 15 días, y se les mide la cantidad de oxigeno disuelto,observando un valor promedio de 3.8 con una desviación estándar de 0.9 mg/l.observando un valor promedio de 3.8 con una desviación estándar de 0.9 mg/l.Será necesario tomar correctivos frente a esta fabrica?. Asuma que lo datosproviene de una distribución normal.

Estadístico de prueba Distribución Referencia

ns

XT 0µ−

= )1( −nt

Ejemplos

Ejemplo 3: (Comparación de medias de 2poblaciones independientes, Varianzas conocidas)

Se investiga la resistencia a la tensión de ruptura del hilo proporcionado por dosfabricantes. De la experiencia con los procesos de los fabricantes, se sabe quepsi y psi. Una muestra aleatoria de 30 especímenes de prueba provenientede cada fabricante arroja como resultados psi, S=5 yfdfdfdfdd psi, S = 4, respectivamente. ¿Existe alguna evidencia que apoye la

51

=σ 42 =σ881 =x

912

=xfdfdfdfdd psi, S = 4, respectivamente. ¿Existe alguna evidencia que apoye laafirmación de que el hilo del fabricante 2 tiene mayor resistencia media?

912

=x

Estadístico de prueba Distribución Referencia

21

2121

11

)()(

nnS

xxT

p +

−−−=

µµ2

*)1(*)1(

21

2

22

2

11

−+

−+−=

nn

SnSnS p

)2( 21 −+nnt

EjemplosEjemplo 4: (Comparación de medias de 2poblaciones relacionadas (apareadas))

En un programa de control de enfermedades crónicas, la hipertensión estáincluida como la primera patología a controlar. 15 pacientes hipertensos sonsometidos al programa y controlados en su presión antes y después de 6 mesesde tratamiento. Los datos son los siguientes:

¿Se puede decir a un nivel de significación del 5% que el tratamiento es efectivoy logra disminuir en un promedio superior a 15 mmHg ?

Estadístico de prueba Distribución Referencia

1( 1)nt −

Inic. 180 200 160 170 180 190 190 180 190 160 170 190 200 210 220

Fin. 140 170 160 140 130 150 140 150 190 170 120 160 170 160 150

d

d

dT

S n

µ−=

EjemplosEjemplo 5: (Comparación de medias de kpoblaciones independientes)

Un ingeniero de desarrollo tiene interés en investigar la resistencia a la tensiónde una fibra sintética nueva que se usará para hacer telas de camisa paracaballero. Por experiencia se sabe que la calidad de la tela se ve afectada porla composición de algodón, el cual debe variar entre el 10% y 40% de lamezcla. Por tanto decide probar cinco niveles de algodón (15,20,25,30 y 35%)y como necesita valoración de la variabilidad decide hacer 5 replicaciones pory como necesita valoración de la variabilidad decide hacer 5 replicaciones porcada nivel.

Identifique:

a) Factor (es) de diseñob) Niveles del factor de diseñoc) Posibles Factores Perturbadoresd) Unidades Experimentalese) Cual seria su estrategia para eliminar un posible efecto de factoresperturbadores