tarea tres de estadistica
TRANSCRIPT
UNIVERSIDAD DE EL SALVADOR
FACULTAD MULTIDISCIPLINARIA ORIENTAL
DEPARTAMENTO DE CIENCIAS NATURALES Y MATEMATICA
SECCION DE MATEMATICA
“Prueba de hipótesis”
Asignatura: Probabilidad e inferencia estadística
Docente: Mst. Es. María del Tránsito Gutiérrez Reyes
Estudiantes: Mauricio Ernesto Flores Hernández
José Gerardo Menjivar
Especialidad: Profesorado en Matemática
Ciudad Universitaria Oriental, 26 de octubre de 2011
Pruebas de hipótesis para muestras grandes
Partes de una prueba estadística
Hipótesis nula: una contradicion de la hipótesis alternativa.
Hipótesis alternativa : la hipótesis que el investigador quiere apoyar
Estadístico de prueba y su valor p: la evidencia muestral calculada de los datos
de la muestra
Región de rechazo- valores críticos y nivel de significación: valores que
separan el rechazo y el no rechazo de la hipótesis nula, estableciendo la
significación practica de su conclusión
Errores y significación estadística
El nivel de significación: es la probabilidad de rechazar H0 cuando de hecho es
cirta.
El valor p: es la probabilidad de observar un estadístico de prueba tan extremo
como o mas extremo que el observado; también, el valor mas pequeño de con el
cual se puede recharzar H0
Cuando el valor p es menor que el valor de significación : se rechaza la
hipotesis nula. Esto pasa cuando el estadístico de prueba excede el valor critico.
En un error tipo II, : es la probabilidad de aceptar H0 cuando de hecho es falsa. La
potencia de la prueba es (1-) la probabilidad de rechazo es H0 cuando es falsa.
9.1 prueba de hipótesis respecto a los parámetros.
La inferencia estadística se podría requiere a estimar un parámetro de la población o
tomar decisiones respecto al valor del parámetro. El razonamiento usado en una prueva
de hipótesis estadística es similar al proceso en un juicio, cuando los tamaños de la
muestra son grandes los estimadores puntuales para cada uno de estos cuatro
parámetros tiene distribuciones muéstrales normales, de tal manera que las cuatro
pruebas estadísticas con una muestra grande sigue el mismo modelo general.
9.2 prueba de hipótesis estadística
Una prueba de hipótesis estadística consta de cinco partes:
a) La hipótesis nula denotada por H0
b) la hipótesis alternativa , denotada por Ha
c) el estadístico de prueba y su valor p
d) la región de rechazo
e) la conclusión
cuando se especifican estos cinco elemento se están refiriendo a una prueba particular
si modifica una o mas de las partes se crea una nueva prueba.
Definición: las dos hipótesis en competencia son la hipótesis alternativa Ha por lo
general es la hipótesis que el investigador desea apoyar y la hipótesis
Como pronto se verá, es más fácil mostrar el soporte de la hipótesis alternativa
demostrando que la hipótesis nula es falsa un. Por tanto, el investigador estadístico
siempre empieza suponiendo que la hipótesis nula Ho es cierta qué. Así, a partir de los
datos de la muestra el investigador decide si la evidencia favorece a Ha y no a H0 y
llega una de estas dos conclusiones:
Rechazar Ho y concluir que Ha es verdadera.
Aceptar (no rechazar) a H0 como verdadera.
La decisión de rechazar aceptar la hipótesis nula se basa en la información que
contiene una muestra extraída de la población de interés. Esta información toma estas
formas:
Estadístico de prueba: un solo número calculado a partir de la información
muestral.
Valor P: una probabilidad calculada mediante el estadístico de prueba
Cualquiera de las dos medidas o ambas actúan como marca de decisión para el
investigador rechazar aceptar H0.
Estadístico de prueba x = 15 encuentros encuentra
Z= x - µ = 15 - 14 = 5 σ/ √n 0.2 σ/ √ Z= x - n 0.2
Desviación estándar de la media poblacional µ.
El Valor p es la probabilidad de observar un estadístico de prueba que este a
cinco o más desviaciones estándar de la media. Puesto que z mide el número de
desviaciones estándar a que una variable aleatoria normal esta de su media, se
tiene
Valor p = P (z > 5)+P (z˂ - 5) ≈ 0
El Valor grande del estadístico de prueba y el Valor pequeño de P significan que se
ha observado un evento muy improbable, si en realidad H0 es verdadera y µ = 14
Región de región de Región de Región de
Rechazo Aceptación rechazo x
$ 14
Valor crítico Valor crítico
Región de
Rechazo
P
Valor crítico 0.03
Si el estadístico de prueba cae en la región de rechazo, entonces se rechaza la
hipótesis nula. Si el estadístico de prueba se encuentra la región de aceptación,
entonces se acepta la hipótesis nula o se considera que la prueba no será concluyente.
Se aclararán los distintos tipos de conclusiones apropiadas cuando se estudien los
ejemplos prácticos de pruebas de hipótesis.
Por último, ¿cómo elegir sobre los valores críticos que separa las regiones de
aceptación y rechazó? Es decir, ¿de qué manera se decide cuanta evidencia
estadística se necesita antes de rechazar H0 ? Esto depende de la confianza que el
investigador quiera dar a las conclusiones de la prueba y el nivel significación α, el
riesgo que está dispuesto a correr al tomar una decisión incorrecta.
Definición: un error tipo I para una prueba estadística es el que se comete al rechazar
la hipótesis nula cuando es verdadera. El nivel significación α para una prueba de
hipótesis que es
α= P (error tipo I) = P (rechazar falsamente a H0) = P (rechazar H0 cuando es
verdadera)
Este Valor α representa el riesgo tolerable máximo o rechazar de manera incorrecta a
Ho. Una vez que este nivel de significación se determina, la región del rechazo se puede
establecer para permitir al investigador rechazar Ho con un grado fijo de confianza en la
decisión.
En la siguiente sección se muestra cómo usar una prueba de hipótesis para probar el
valor de una media poblacional µ. Como continuamos se aclararan algunos de los
detalles de cálculo y se agregarán algunos otros conceptos para ayudar a la
comprensión completa de las pruebas de hipótesis.
9.3 prueba de la media poblacional para muestra
Considere una muestra aleatoria de n mediciones tomado de una población con una
media µ y desviación estándar σ. Se requiere probar una hipótesis de la forma
H0 : µ = µ0
Contra una hipótesis alternativa de una cola donde µo es algún valor hipotético para
Ha : µ > µ0
El subíndice cero indica el valor del parámetro especificado por H0. Observe que H0
proporciona un valor exacto para el parámetro que ese probará, en tanto que le H a da
un intervalo de valores posibles para µ.
Elementos esenciales de la prueba
La media muestral x es la mejor estimación del valor real de µ, la cual está
actualmente en cuestión. ¿Qué valores de x lo llevarían a creer que H0 es falsa y que µ
es, de hecho, mayor que el Valor hipotético? Esos valores de x que son
extremadamente grandes querrían decir que µ es más grande que el valor hipotético.
Por tanto, usted puede rechazar H0 si x es demasiado grande.
El siguiente problema es definir el significado de (demasiado grande). No es muy
probable que ocurran los valores de x que quieren a demasiadas desviaciones estándar
a la derecha de la media. Esos valores tienen un área muy pequeña a su derecha.
Entonces, se puede definir (demasiado grande) cuando está a demasiadas
desviaciones estándar de µ0. ¿Pero qué es demasiadas? Esta pregunta se contesta
cuando el nivel de significación α, la probabilidad de rechazar H0 cuando es verdadera
recuerde que el error estándar de x se calcula mediante
σ x¯= _ σ __
√n
Puesto que la distribución muestral de la media x es aproximadamente normal cuando n
es grande, el número de de desviaciones estándar que están entre x y µ0 se determina
mediante el estadístico de prueba estandarizado:
Z= x - µ0
σ/ √n
La cual tiene una distribución normal estándar cuando H0 es verdadera y µ = µ0. El
nivel de significación α es igual al área bajo la curva normal que está más allá de la
región de rechazo. Entonces, si se quiere que α =0.01, rechazara H0 cuando x esta a
más de 2.33 desviaciones estándar a la derecha de µ0. En forma equivalente, usted
rechazará H0 si el estadístico de prueba estandarizado Z es mayor que 2.33
Prueba estadística como estas grandes para µ
1. Hipótesis nula: H0 : µ=µ0
2. Hipótesis alternativa:
Prueba de cola prueba de dos colas
H a: µ>µ0 Ha : µ ≠ µ0
(o bien H a: µ˂µ0)
Calculo del valor P
Definición: el valor p 0 nivel de significación observado de una prueba estadística es el
valor mas pequeño de α con la cual puede rechazarse H0. Es el riesgo real de cometer
un error tipo I, si se rechaza la orden de con base en el Valor observado del estadístico
de prueba. El Valor de mi de la fuerza de la evidencia contra.
Definición: en un Si el Valor P menor que un nivel de significación pre asignado,
entonces puede rechazar se la hipótesis nula, e informar que los resultados son
estadísticamente significativos en el nivel α.
Si usted está leyendo el informe de una investigación, y ¿que tan pequeña debe ser el
Valor p un para que decida rechazar H0? muchos investigadores usan una escala móvil
para clasificar su resultados.
si el Valor p de es menor que 0.01, es de rechazar H0 los resultados son muy
significativos
Si el Valor p está entre 0.01 y 0.05, se rechaza H0. Los resultados son
estadísticamente significativos.
Si el Valor está entre 0.05 y 0.10, generalmente no se rechaza H0. Los resultados
son estadísticamente significativos.
Si el Valor p es mayor que 0.10, no se rechaza H0. Los resultados no son
estadísticamente significativos.
Ejemplo: las normas establecidas por las intenciones gubernamentales seña{lan que
los estados unidos no deben exceder una ingestión promedio diaria de sodio de 3300
mg. Para averiguar si están excediendo este limite se selecciona una muestra de 100
estado unidenses, y se encuentra que la media y la desviación estándar de la ingestión
diaria de sodio son 3400 mg, respectivamente. Use = 0.05 para efectuar una prueba
de hipótesis.
Sol: H0: = 3300ncontra Ha: 3300
El estadístico de prueba es
Z=×−μ
θ/√n≈ 3400−33001100 /√100
=0.91
Los dos métodos desarrollados en esta sección llegan a las mismas conclusiones en.
El método del Valor crítico: como el nivel de significación es 0.05 y la prueba
es una cola, la región de rechazo se determina por medio de un Valor crítico con
un área de cola igual 0.05; es decir, H0 se puede rechazar z 1.645. Como
Z = 0.91 y no es mayor que el Valor crítico, H0 no se rechaza.
El método del Valor p: calcule el Valor p, la probabilidad que el Z sea mayor o
igual que z =0.91:
Valor p = P(z0.91)= 0.5- 0.3186 = 0.1814
Solo se puede rechazar la hipótesis nula si el Valor p es menor que el nivel de
significación especificado 5%. Por consiguiente. H0 no se rechaza y los resultados
no son estadísticamente significativos. No hay suficiente evidencia para señalar que
la ingestión promedio diaria de sodio excede en 3300 mg.
Valor p= 0.1814
= 0.05
Rechazar H0(z1.645)
Observe que estos dos métodos son, de hecho, el mismo, como se ilustra en la
figura 9.6. Tan pronto el Valor calculado del estadístico de prueba de z se vuelve
más grande que el Valor crítico, z, el valor p se vuelve menor que el valor
significativo de . Puede usar el método que mas le convenga; ¡las conclusiones a
las que llegue siempre serán las mismas! Sin embargo, el método del valor p tiene
dos ventajas:
Los resultados estadísticos que se obtienen por medio de paquetes como
minitab generalmente dan el valor p de la prueba.
Con base en el valor p es posible evaluar los resultados de su prueba usando
cualquier nivel de significación que desee. Muchos investigadores indican el
nivel de significación mas pequeño posible para el cual resultados son
estadísticamente significativos.
Dos tipos de errores
Usted podría preguntarse por que, cuando no se rechaza la H0 en el ejemplo
anterior, no se dijo definitivamente que H0 era verdadera y que = 3300. La razón
es que si se escoge aceptar H0 debe haber una medida de la probabilidad de
error asociada con esta decisión.
Puesto que hay dos opciones en una prueba estadística , también hay dos tipos
de errores que se pueden cometer. De hecho, la hipótesis nula puede ser
verdadera o falsa, independiente de la decisión que tome el investigador.
Hipótesis nula
Además del error tipo I con probabilidad definido al principio en sección, es posible
cometer un segundo error, llamado error tipo II, el cual tiene probabilidad .
Error tipo I: para una prueba estadística es el que se cometer al rechazar la hipótesis
nula cuando es verdadera.la probabilidad de cometer un error tipo I se denota con el
símbolo .
Error tipo II: para una prueba estadística es el que se comete al aceptar la hipótesis
nula cuando es falsa y alguna hipótesis alternativa es verdadera. La probabilidad de
cometer un error tipo II se denota mediante el símbolo
Potencia de una prueba estadística
La bondad de una prueba estadística se mide por el tamaño de los dos índices de
error:, la probabilidad de rechazar H0 cuando e verdadera y , la probabilidad de
aceptar H0 cuando Ha es verdadera. “Una buena prueba“es aquella en la cual ambos
índices de error son pequeños. El investigador empieza por seleccionar, la
probabilidad de cometer un error tipo I.si también decide controlar el valor , la
probabilidad de aceptar H0 cuando Ha es verdadera, entonces escoge un tamaño
apropiado para la muestra. Otra manera de evaluar la prueba es considerar el
complemento de un error tipo II, es decir, rechazar H0 cuando Ha es verdadera, el
cual tiene la probabilidad
Decisión verdadera Falsa
Rechazar
H0
Aceptar H0
Error tipo I
Decisión
correcta
decisión
correcta
error tipo II
1 - P (rechazar H0 cuando Ha es verdadera)
La cantidad (1 - ) se llama potencia de la prueba por que mide la probabilidad de
tomar la acción que deseamos que ocurra, es decir, rechazar la hipótesis nula
cuando es falsa.
Definición: la potencia de la prueba estadística, dada como
1 - = p (rechazar H0 cuando Ha es verdadera)
mide la actitu de la prueba para comportarse como se requiere
una grafica (1 - ), la probabilidad de rechazar H0 cuando en efecto es falsa, como
funcion del valor verdadero del parámetro de interés se llama curva de potencia para
la prueba estadística. En condiciones perfectas querria que fuera pequeña y que
la potencia (1 - ) fuera grande.
Pruebas de hipótesis con muestras grnades para la diferencia entre dos medias
poblacionales
En muchas situaciones, la pregunta estadística que se tiene que contestsar requiere
la comparación de dos medios poblacionales. El estadístico que resume la
información de la muestra con respecto a la difencia en las medias poblacionales (1
- 2) es la diferencia en las medias muestrales (1-2).. Por consiguiente, al probar si
la diferencia en las medias muestrales que la verdadera diferencia de las medias
poblacionales difiere de un valor especificado (1 - 2) = D0, se puede usar el error
estándar de (1-2).
SE = √❑12
n1
❑22
n2
En la forma de un estadístico z para medir a cuantas desviaciones estándar esta la
diferncias (1-2). De la diferencia hipotética de D0. El procedimiento de la prueba
formal se describe a continuación.
Prueba estadística con muestras grandes para (1 - 2)
1. hipótesis nula : H0 : (1 - 2) = D0, donde D0 es alguna diferencia especificada que
desea probar. En muchas pruebas se supondrá que no hay diferencia entre 1 y 2;
es decir, D0 = 0
2. hipótesis alternativa:
prueba de una cola prueba de dos colas
Ha : (1 - 2) D0 Ha : (1 - 2) D0
o Ha : (1 - 2) D0
3.estadístico de prueba: z = (1−2 )−D
SE=¿
(1−2 )−D
√❑12
n1
❑22
n2
si 21 y 2
2, don dos desconocidos(lo cual casi siempre es el caso ), sustituya las
varianzas muestrales S21 y S
22
21 y
22, respectivamente.
4. región de rechazo: rechase H0 cuando
Prueba de una cola prueba de dos colas
Z z Z z/2 o bien z - z/2
[o bien, z - z cuando la hipótesis alternativa es Ha : (1 - 2) D0 ]o bien cuando el
valor p
Prueba de hipótesis de intervalo de confianza
Si usa el método del valor critico o el valor p para probar la hipótesis de (1 - 2),
siempre llegara a la misma conclusión porque el valor calculado del estadístico de
prueba y el valor critico están relacionados exactamente del mismo modo que el
valor p y el nivel de significación . Recordara que los intervalos de confianza
presentados en el capitulo ocho también se podrían usar para constestar la pregunta
sobre la diferencia entre dos medias poblacionales.De hecho, para una
si el intervalo de confianza que se construya contiene el valor del parámetro
espesificado por H0, entonces ese valor es uno de los valores probables o posibles
del parámetro, y no debe rechazar H0
si el valor hipotético queda fuera de los limites de confianza, la hipótesis nula se
trechaza en el nivel de significación .
Prueba de hipótesis para una proporción binomial en una muestra grande.
Cuando se extrae una muestra aleatoria de n ensayos idénticos de una población
binomial, la proporción muestral ~p tiene una distribución aproximadamente normal
cuando n es grande, con media p y error estándar.
SE=√ pqn
Cuando se prueba una hipótesis respecto a p, la proporción en la población que
posee un cierto atributo , la prueba sigue la misma forma general que las pruebas de
muestras grandes de las asociaciones para probar una hipótesis de la forma.
H 0 : p=p0
contra unaalternativade unaodoscolas
H a : p p0 obienH a : p p0 obienH a : p p0
El estadístico estdistico de prueba se construye ~p el mejor estimador de la población
verdadera p. la proporción muestral ~p se estandariza por medio de la medio de la
media y el error estándar hipotético, para formar un estadístico de prueba z que
tiene una distribcion normal estándar sin H0 es sierta se resume esta prueba para
muestras grandes.
Pruebaestad í stica para penunamuestra grande
1Hipotesisnula :H 0 : p=p 0
2hipotesis alternativa :
Pruebadeunacola prueba dedos colas
H a : p p0H a : p p0
3estadistico de prueba : z=~p−p0SE ❑
=~p−p0
√ p0−q0n
con~p= xn
Donde xes el numerode é xitosennensayos binomiales .
4 regionderec hazo :rechace H 0cuando
Pruebadeunacola prueba dedos colas
Z z z obie n z−z
(o bien z−za cuando lahip ó tesis alternativaes H a: p p0)
Ocuandoel valor p α
prueba de hipotesis de la diferencia entre dos proporciones binomiales para
muestras grnades
cuando se elige una muestra aleatoria e independientes de dos poblaciones
binomiales el objetivo del experimento ppuede ser la diferncia (p1-p2) en las
proporciones de individuos o articulos que poseen una caracteristica especifica en
las poblaciones. En esta situacion, se puede usar la diferencia de las proporciones
muestrales (~p1−~p2) junto con su error estandar,
√ p1q1+¿n1
p2q2n2
¿
En la forma de un estadístico z para probar para una diferencia significativa en las
dos proporciones poblacionales. La hipótesis nula por probar normalmente es de la
forma.
H 0 : p1=p2o bienH 0 :( p1=p2)=0
Contra una hipótesis alternativa de una o dos colas. La prueba formal de hipótesis .
para estimar el error estándar del estadístico z, se puede usar el hecho de que H0 es
cierta, las dos proporciones poblacionales son iguales a un valor común
~p= numero totalde exitosnumerototal deensayos
=x1+x2n1+n2
Recuerde que para la diferencia de las proporciones muestrales tengan una distribución
aproximadamente normal, los tamaños de la muestra deben ser grandes y las
proporciones no deben de estar cerca de ceo o uno
Pruebade estad í stica de( p1 – p2)=0oquivalente a H 0 : p1=p2
Hipó tesis alternativa :
Pruebadeunacola prueba dedos colas
H a :( p1=p2)0H a :( p1=p2)0
[H a:( p1=p2)0]
Estad í sticode prueba :
Z= ~¿¿¿ =
~p1−~p2
√ p1q1+ p2q2n1n2
= ~p1−~p2
√ pqn1
+ pqn2
Donde ~p1= x1/n1y ~p2 = ~x2/n2. Puesto que no se conoce el valor común de p1 =p2 = p
(utilizando el error estándar ), se estima por
~p =x1+x2n1+n2
Y el estadístico de prueba es
Z=~¿¿¿¿ o bien z= ~¿¿¿¿
Región de rechazo: rechaze H0 cuando
Prueba de una cola prueba de dos colas
Z z Z z/2 o bien z - z/2
[ o bien z - zcuando la hipótesis alternativa es Ha (p1- p2) D0]
O cuando el valor de p