teoria de prueba de hipotesis 2013

PRUEBA DE HIPÓTESIS

La estadística inferencial es el proceso de usar la información de una muestra para describir el estado de una población. Sin embargo es frecuente que usemos la información de una muestra para probar un reclamo o conjetura sobre la población. El reclamo o conjetura se refiere a una hipótesis. El proceso que corrobora si la información de una muestra sostiene o refuta el reclamo se llama prueba de hipótesis.

HIPÓTESIS Y NIVELES DE SIGNIFICANCIAEn la prueba de hipótesis se pone a prueba un reclamo hecho sobra la naturaleza de una población a base de la información de una muestra. El reclamo se llama hipótesis estadística.

Hipótesis Estadística: Una hipótesis estadística es un reclamo hecho sobre la naturaleza de una población.

Por ejemplo, la premisa formulada por un productor de baterías para autos de que su batería dura en promedio 48 meses, es una hipótesis estadística porque el manufacturero no inspecciona la vida de cada batería que él produce.

Si surgieran quejas de parte de los clientes, entonces se pone a prueba el reclamo del manufacturero. La hipótesis estadística sometida a prueba se llama la hipótesis nula, y se denota como H0.

COMO ESTABLECER LA HIPÓTESIS NULA Y LA ALTERNA

Hipótesis Nula (H0): premisa, reclamo, o conjetura que se pronuncia sobre la naturaleza de una o varias poblaciones.

Por ejemplo, para probar o desaprobar el reclamo pronunciado por el productor de baterías debemos probar la hipótesis estadística de que 48. Por lo tanto, la hipótesis nula es:

H0 : 48.

Luego se procede a tomar una muestra aleatoria de baterías y medir su vida media. Si la información obtenida de la muestra no apoya el reclamo en la hipótesis nula (H0), entonces otra cosa es cierta. La premisa alterna a la hipótesis nula se llama hipótesis alterna y se representa por H1.

Hipótesis Alterna: Una premisa que es cierta cuando la hipótesis nula es falsa.

Por ejemplo, para el productor de bateríasH0

: 48 yH

1 : < 48

Para probar si la hipótesis nula es cierta, se toma una muestra aleatoria y se calcula la información, como el promedio, la proporción, etc. Esta información

muestral se llama estadística de prueba.

Estadística de Prueba: Una estadística de prueba se basa en la información de la muestra como la media o la proporción .

ERROR TIPO 1 Y ERROR TIPO 2

A base de la información de una muestra nosotros podemos cometer dos tipos de errores en nuestra decisión.

1. Podemos rechazar un H0 que es cierto.

2. Podemos aceptar un H0 que es falso.

El primero se llama error Tipo 1

Error Tipo 1: Cuando rechazamos una Hipótesis Nula que es cierta cometemos error tipo 1.

Y el segundo error se llama error Tipo 2.

Error Tipo 2: Cuando aceptamos una Hipótesis Nula que es falsa cometemos error tipo 2.

NIVEL DE SIGNIFICANCIA ()

Para ser muy cuidadosos en no cometer el error tipo 1, debemos especificar la probabilidad de rechazar H0, denotada por . A ésta se le llama nivel de significancia.

Nivel de Significancia: La probabilidad ( más alta de rechazar H0 cuando H0 es cierto se llama nivel de significancia.

Comentario: Para mantener la probabilidad de cometer el error tipo 1 baja, debemos escoger un valor pequeño de .

Usando un valor preasignado de se construye una región de rechazo o región crítica en la curva normal estándar o en la curva t que indica si debemos rechazar H0.

Región Crítica o de Rechazo: Una región crítica o de rechazo es una parte de la curva de z o de la curva t donde se rechaza H0.

La región puede ser de una cola o de dos dependiendo de la hipótesis alterna.

Ejemplos Para H1: > valor aceptado, la región de rechazo está dada por:

(cola derecha, z ó t)

Para H1 : < valor aceptado, la región de rechazo está dada por:

(cola izquierda, z ó t)

Para H1 : valor aceptado, la región de rechazo es de dos colas y está

dada por:

(2-colas, z ó t)

Ejemplo 1: Determine si la región de rechazo es de la cola derecha, de la cola izquierda o de dos colas.

a. H0 : = 15, H

1 : 15, =.05

b. H0 : p 0.7, H

1 : p > 0.7, =.02

Solución: La forma de la región de rechazo está determinada por la hipótesis alterna.

a. H1 : 15 significa que la región está en ambas colas.

b. H1 : p > 7 significa que la región está en la cola derecha.

Ejemplo 2: En el Ejemplo 1a, presumamos que la región de rechazo es parte de la curva normal estándar. Complete el dibujo de la región crítica para los valores siguientes:

a. = .05

/2/2

.05/2 .05/2

.02

Solución:

a. Del ejemplo 1(a), tenemos:

Ejemplo 3: En el ejemplo 1a, presumamos que la región de rechazo es parte de la curva t. Complete el dibujo de la región de rechazo para:

a. = .05 y = 14

Solución:a. Del ejemplo 1(a), = .05, y = 14, tenemos:

Ejemplo 4: Establezca las hipótesis nula y alterna.

a. Las millas por galón (mpg) promedio de un nuevo modelo de automóvil es 32.

b. Más del 65% de los empleados de un colegio aportan a Fondos Unidos.

c. En promedio, los empleados de cierta compañía viven a no más de 15 millas de la misma.

d. Al menos un 60% de la población adulta de una comunidad votará en las próximas elecciones Presidenciales.

e. El peso promedio de un pollo para asar es de al menos cuatro libras.

Solución:a. H

0 : = 32 b. H

0 : p .65 c.

H0 : 15

H1 : 32 H

1 : p < .65

H1 : > 15

d. H0 : p .6 e. H

0 : 4

.05/2=0.025 .05/2=0.025De la tabla de la distribución normal, laP(Zz) =.025 corresponde a un valor Z= -1.96. Por simetría la P(Z>z)=.025 corresponde a Z= 1.96.

1.96-1.96

.05/2=0.025 .05/2=0.025De la tabla de la distribución t, laP(Tt) =.025 corresponde a un valor t= -2.086. Por simetría la P(T>t)=.025 corresponde a t= 2.086.

2.086-2.086

H1 : p < .6 H

1 : < 4

EJERCICIOS

En los ejercicios (1-6) determine si la región de rechazo para la hipótesis nula está en la cola izquierda, en la cola derecha, o ambas colas. Para el nivel de significancia dibuje la región de rechazo.

1. H0 : 11; H

1 : > 11 2. H

0 : 5.8; H

1 : < 5.8

3. H0 : p = 0.4; H

1 : p 0.4 4. H

0 : = 110; H

1 : 110

5. H0 : p 0.3; H

1 : p < 0.3 6. H

0 : p 0.8; H

1 : p < 0.8

En los ejercicios (7 - 18) complete la región de rechazo (encuentre el valor de z y t).

7. a) z, si = .05 b) t, si = .025 y = 9

8. a) z, si = .01 b) t, si = .05 y = 13

9. a) z, si = .02 b) t, si = .01 y = 5

10. a) z, si = .025 b) t, si = .01 y = 9

11. a) z, si = .05 b) t, si =.05 y = 10

12. a) z, si = .01 b) t, si =0.1 y = 7

/2 /2

/2 /2

En los ejercicios (13 - 18) establezca las hipótesis nula y alterna.

13. Los automóviles estacionados en el estacionamiento de periodo prolongado del aeropuerto internacional de Baltimore permanecen un promedio de 2.5 días.

14. Una nueva marca de llantas radiales dura en promedio más de 48,000 millas.

15. El balance promedio de una cuenta de cheques en el First State Bank es de al menos $150.

16. Se reclama que al menos el 60% de las compras realizadas en cierta tienda por departamentos son artículos de especiales.

17. Se reclama que el 20% de los graduados de cierto colegio privado solicitan admisión a escuelas de medicina.

18. Un dentista reclama que el 5% de sus pacientes sufren enfermedades en las encías.

¿Prueba? de hipótesis

La inferencia estadística o estadística inferencial se refiere a un

conjunto de métodos mediante los cuales podemos hacer afirmaciones

con respecto a una población completa a partir únicamente de la

observación de una parte de ella.

Dos formas básicas para realizar inferencia estadística son la

estimación y el contraste de hipótesis, también llamado "prueba de

hipótesis". Una hipótesis estadística es una afirmación con respecto a

una distribución de probabilidad (por ejemplo, podríamos decir que un

cierto fenómeno se comporta de forma que puede explicarse por una

distribución binomial). En particular, una hipótesis estadística puede

ser una afirmación con respecto a un parámetro (si sabemos que la

distribución es binomial, entonces podríamos establecer la hipótesis de

que la probabilidad de éxito es p = 0.5).

Un contraste estadístico de hipótesis es un procedimiento mediante el

cual se compara lo propuesto por una hipótesis contra la evidencia

empírica que proporciona la observación de datos provenientes de la

población sobre la cual se hace la hipótesis. El título que se ha dado a

esta discusión tiene qué ver con una cuestión básica en el contraste de

hipótesis, por la cual podría considerarse que no es muy adecuado el

nombre “prueba”. Lo anterior, porque este sustantivo podría dar al

lector la impresión de que el procedimiento implica certeza, lo cual en

estadística desde luego difícilmente se tiene.

Adicionalmente, una situación que suele causar dudas en los

estudiantes que aprenden por primera vez el método de contraste

estadístico de hipótesis con el enfoque de Neyman-Pearson es la de

por qué se dice:

No se rechaza la hipótesis nula

y no puede simplemente decirse

Se acepta la hipótesis nula

Consideremos la siguiente situación, muy simplificada, pero que nos

sirve para aclarar ideas:

Supongamos que se nos presenta una caja opaca y cerrada, dentro de

la cual sabemos hay 100 canicas que pueden ser rojas, blancas o una

mezcla de ambas. A nosotros nos interesa decir algo con respecto a

todas las canicas dentro de la caja (son todas rojas, todas blancas o

cuántas hay de cada tipo). ¿Cuál sería una forma completamente

segura de hacerlo? Si tuviéramos la posibilidad de vaciar la caja, por

ejemplo, y examinar el contenido completo, entonces sabríamos con

toda certeza las condiciones que existen dentro de la caja; pero, ¿qué

pasa entonces si por algún motivo no podemos examinar todo el

contenido, aunque sí una parte de él?

Una forma de lidiar con la imposibilidad de examinar todo el contenido

es hacer intervenir a la probabilidad. Supongamos que se nos dice que

la caja contiene solamente canicas blancas, pero que nuestra

suposición es que en realidad hay algunas rojas dentro.

Podemos plantear nuestro primer contraste de hipótesis prototipo de la

siguiente forma:

H0: En la caja solamente hay canicas blancas

Ha: En la caja hay al menos una canica roja

Ahora necesitamos contrastar nuestra hipótesis nula contra la

evidencia que obtenemos al observar datos, para lo cual sacamos una

pequeña cantidad de canicas de la caja (sin poder observar las demás)

y examinamos su color.

Nuestro estadístico de prueba, al que llamaremos X, en este caso es el

número de canicas rojas entre las extraídas. Dado que la aparición de

al menos una canica roja haría completamente evidente que la

hipótesis nula no es verdadera, la región de rechazo es R = {X ≥ 1}.

Por tanto rechazaríamos la hipótesis nula si X ≥ 1.

Supongamos que las limitaciones de recursos nos permiten solamente

extraer cinco canicas, lo cual hacemos, y observamos que TODAS son

blancas.

Ahora surgen dos preguntas importantes:

1. ¿Los datos observados contradicen la hipótesis nula?

Desde luego no lo hacen, porque el estadístico de la prueba

no tomó un valor que estuviera dentro de la región de

rechazo, es decir, ninguna de las canicas extraídas fue roja.

En este punto estamos en la imposibilidad de comprobar

nuestra suposición de que al menos algunas canicas de la

caja son rojas, por lo cual lo más que podemos decir es: "No

existe evidencia estadística en contra de H0", con lo que

justamente indicamos que la pequeña porción de la

realidad que las limitaciones de recursos nos

permitieron observar no está en desacuerdo con lo que

dice la hipótesis nula. Hasta aquí, entonces, "No podemos

rechazar H0".

2. Por otro lado, el que ninguna de las canicas que extrajimos

sea roja ¿DEMUESTRA que todas las de la caja son blancas?

Claro que no. La única manera en que nuestra observación

demostraría que todas las canicas de la caja son blancas

sería la situación en que las observáramos todas, lo cual

inicialmente dijimos que no era posible.

Por tanto, aunque nuestra observación no contradice la

hipótesis nula, tampoco la demuestra de manera

irrefutable. En consecuencia, no sería correcto decir

"Aceptamos que H0 es verdadera", porque esto en realidad

no nos consta.

teoria de prueba de hipotesis 2013

Documents