uia-ing · web viewdeterminar la probabilidad de que el estadístico de prueba calculado ocurra al...

60
PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007 PRUEBAS DE HIPÓTESIS DE UNA POBLACION 1

Upload: others

Post on 01-Feb-2020

14 views

Category:

Documents


0 download

TRANSCRIPT

UIA-ING

PRUEBAS DE HIPÓTESIS DE UNA POBLACIÓN P. Reyes/Sept. 2007

PRUEBAS DE HIPÓTESIS

DE UNA POBLACION

P. Reyes

Septiembre 2007

CONTENIDO

1. Introducción

2. Pruebas de hipótesis para una población

3. Prueba de hipótesis estadística

4. Ejemplos de fórmulas para calcular los estadísticos de prueba

5. Ejemplos de pruebas de hipótesis de una población

6. Ejercicios adicionales

Pruebas de hipótesis de una población

1. Introducción

La inferencia estadística es el proceso mediante el cual se utiliza la información de los datos de una muestra para extraer conclusiones acerca de la población de la que se seleccionó la muestra. Las técnicas de inferencia estadística se dividen en dos áreas principales: Estimación de intervalos de confianza y Pruebas de hipótesis.

En cada prueba estadística, se comparan algunos valores observados contra algunos esperados u otro valor observado comparando estimaciones de parámetros (media, desviación estándar, varianza).

Estas estimaciones de los verdaderos parámetros son obtenidos usando una muestra de datos y calculando los estadísticos.

La capacidad para detectar una diferencia entre lo que es observado y lo que es esperado depende del desarrollo de la muestra de datos.

Incrementando el tamaño de la muestra mejora la estimación y la confianza en las conclusiones estadísticas.

Al realizar pruebas de hipótesis, se parte de que un valor supuesto (hipotético) es el parámetro poblacional. Después de recolectar una muestra aleatoria, se compara el estadístico muestral, así como la media (x), con el parámetro hipotético, se compara con una supuesta media poblacional (). Después se acepta o se rechaza el valor hipotético, según proceda. Se rechaza el valor hipotético sólo si el resultado muestral resulta muy poco probable cuando la hipótesis es cierta.

Se trata de probar una afirmación sobre parámetros de la población (media (; varianza σ2 o proporción () en base a datos de estadísticos de una muestra (X media, s2 o p respectivamente):

Por ejemplo, probar las afirmaciones en los parámetros se usan los estadísticos:

En una población

· La media poblacional (( = 12;

estadístico Zc

· La varianza poblacional( σ2 = 12; estadístico (c2

· La proporción poblacional ( = 0.3 estadístico Zc

En dos poblaciones

· Las medias poblacionales son iguales ( (1 = ((2 o ((1 - ((2 = 0; estadístico Zc o Tc

· Las varianzas poblacionales(son iguales σ12 = σ22 o σ12 - σ22 = 0; estadístico Fc

· Las proporciones poblacionales son iguales (1 = (2 o (1 - (2 = 0 estadístico Zc

La prueba de hipótesis tiene varias etapas:

Etapa 1.- Planear la hipótesis nula y la hipótesis alternativa. La hipótesis nula (H0) es el valor hipotético del parámetro que se compra con el resultado muestral resulta muy poco probable cuando la hipótesis es cierta.

Etapa 2.- Especificar el nivel de significancia que se va a utilizar. El nivel de significancia del 5%, entonces se rechaza la hipótesis nula solamente si el resultado muestral es tan diferente del valor hipotético que una diferencia de esa magnitud o mayor, pudiera ocurrir aleatoria mente con una probabilidad de 0.05 o menos.

Etapa 3.- Elegir el estadístico de prueba. El estadístico de prueba puede ser el estadístico muestral (el estimador no segado del parámetro que se prueba) o una versión transformada de ese estadístico muestral. Por ejemplo, para probar el valor hipotético de una media poblacional, se toma la media de una muestra aleatoria de esa distribución normal, entonces es común que se transforme la media en un valor Z el cual, a su vez, sirve como estadística de prueba.

Etapa 4.- Establecer el valor o valores críticos del estadístico de prueba. Habiendo especificado la hipótesis nula, el nivel de significancia y el estadístico de prueba que se van a utilizar, se procede a establecer el o los valores críticos del estadístico de prueba. Puede haber uno o más de esos valores, dependiendo de si se va a realizar una prueba de uno o dos extremos o colas.

Etapa 5.- Determinar el valor real del estadístico de prueba. Por ejemplo, al probar un valor hipotético de la media poblacional, se toma una muestra aleatoria y se determina el valor de la media muestral. Si el valor crítico que se establece es un valor de Z, entonces se transforma la media muestral en un valor de Z.

Etapa 6.- Tomar la decisión. Se compara el valor observado del estadístico muestral con el valor (o valores) críticos del estadístico de prueba. Después no se rechaza o se rechaza la hipótesis nula. Si se rechaza ésta, se acepta la alternativa; a su vez, esta decisión tendrá efecto sobre otras decisiones de los administradores operativos, como por ejemplo, mantener o no un estándar de desempeño o cuál de dos estrategias de mercadotecnia utilizar.

La distribución apropiada de la prueba estadística se divide en dos regiones: una región de rechazo y una de no rechazo. Si estadístico de prueba cae en esta última región no se puede rechazar la hipótesis nula y se llega a la conclusión de que el proceso funciona correctamente.

Al tomar la decisión con respecto a la hipótesis nula, se debe determinar el valor crítico en la distribución estadística que divide la región del rechazo (en la cual la hipótesis nula no se puede rechazar) de la región de rechazo. A hora bien el valor crítico depende del tamaño de la región de rechazo.

Pasos de la prueba de hipótesis:

1. Definir el Problema ( Problema Práctico).

2. Señalar los Objetivos ( Problema Estadístico).

3. Determinar tipo de datos: Atributo o Variable.

4. Si son datos Variables: Hacer Prueba de Normalidad.

5. Establecer las Hipótesis: Hipótesis Nula (Ho con signo igual), o la Hipótesis Alterna (Ha con signo de mayor o menor).

6. Seleccionar el nivel de Alfa (normalmente 0.05 o 5%).

7. Establecer el tamaño de la muestra,

Z

a/2

0

-

Z

a/2

Región de

Rechazo

Región de

Rechazo

.

8. Desarrollar el Plan de Muestreo.

9. Seleccionar Muestras y Obtener Datos.

10. Decidir la prueba estadística apropiada y calcular el estadístico de prueba (Z, t, X2 o F) a partir de los datos.

11. Obtener el estadístico correspondiente de tablas o Excel.

12. Determinar la probabilidad de que el estadístico de prueba calculado ocurra al azar.

13. Comparar el estadístico calculado con el de tablas y ver si cae en la región de rechazo o ver si la probabilidad es menor a alfa, rechace Ho y acepte Ha. En caso contrario no rechace Ho.

14. Con los resultados interprete una conclusión estadística para la solución práctica.

2. Pruebas de hipótesis para una población

Se trata de probar una afirmación sobre parámetros de la población (media (; varianza σ2 o proporción () en base a datos de estadísticos de una muestra (X media, s2 o p respectivamente):

Elementos de LA prueba:

· Prueba Estadística: Procedimiento para decidir aceptar o rechazar hipótesis.

· Hipótesis: Es una afirmación acerca de una o más poblaciones.

· Hipótesis Nula (Ho): Usualmente es una afirmación representando una situación “status quo”. Generalmente deseamos rechazar la hipótesis nula.

· Es la hipótesis o afirmación a ser probada

· Puede ser por ejemplo ( =, σ, o ( a constante

· Sólo puede ser rechazada o no rechazada

· Hipótesis Alterna (Ha): Es lo que aceptamos si podemos rechazar la hipótesis nula. Ha es lo que queremos probar.

· Es la hipótesis que se acepta como verdadera cuando se rechaza Ho, es su complemento

· Puede ser por ejemplo 7 para prueba de dos colas

· < 7 para prueba de cola izquierda

· > 7 para prueba de cola derecha

· Estadístico de prueba: Calculado con datos de la muestra.

· Región de Rechazo: Indica los valores de la prueba estadística para que podamos rechazar la Hipótesis nula (Ho). Esta región esta basada en un riesgo a deseado, normalmente 0.05 o 5%.

· Estadístico de prueba(Z, t, X2 o F): Para probar la hipótesis nula se calcula un estadístico de prueba con la información de la muestra el cual se compara a un valor crítico apropiado. De esta forma se toma una decisión sobre rechazar o no rechazar la Ho.

· Error tipo I (alfa = nivel de significancia, normal=0.05): Se comete al rechazar la Ho cuando en realidad es verdadera. También se denomina riesgo del productor

· Error tipo II (beta): Se comete cuando no se rechaza la hipótesis nula siendo en realidad falsa. Es el riesgo del consumidor

Las pruebas de hipótesis pueden ser de dos colas, de cola derecha o de cola izquierda, a continuación se esquematizan cada una de ellas.

10

³

3. Prueba de hipótesis Estadística

· Hipótesis nula Ho, complemento de la Hipótesis alterna:

· Es la hipótesis o afirmación a ser probada

· Puede ser por ejemplo ( =, (, o ( a 5

· Sólo puede ser rechazada o no rechazada

· Hipótesis alterna Ha, complemento de la hipótesis nula:

· Es la hipótesis que se acepta como verdadera cuando se rechaza Ho, es su complemento

· Si el signo de la hipótesis alterna es ( entonces se trata de una prueba de dos colas; si es > de cola derecha y si es < de cola izquierda.

· Puede ser por ejemplo ( ( 5 para prueba de dos colas

·

Z

a/2

0

-

Z

a/2

Región de

Rechazo

Región de

Rechazo

Pruebas de Hipótesis de dos colas:

Ho: a = b

Ha: a

¹

b

Pruebas de Hipótesis de cola derecha:

Ho: a

£

b

Ha: a >

b

Pruebas de Hipótesis cola i

zquierda:

Ho: a

³

b

Ha: a <

b

Z

a/2

0

-

Z

a/2

Región de

Rechazo

Región

de

Rechazo

Z

a/2

0

Región de

Rechazo

Z

a/2

0

-

Z

a/2

Región de

Rechazo

( < 5 para prueba de cola izquierda

·

P(Z>= + Zexcel ) = alfa

( > 5 para prueba de cola derecha

Región de

rechazo

Zexcel (0.01)

P(Z<= - Zexcel ) = alfa

Región de

rechazo

Pasos de la prueba de hipótesis:

· Se plantea inicialmente la Ha si en el problema se muestra la afirmación de ser menor o mayor a un valor establecido histórico.

· Se plantea inicialmente la Ho si en el problema se muestra la afirmación igual (es, históricamente ha sido); mayor o igual (cuando menos) o menor o igual (a lo más) a un valor establecido histórico.

· No importa cual se plantee primero, siempre la conclusión se hace contra la Ho (se rechaza o no se rechaza)

· El intervalo de confianza es el intervalo donde se estima que se encuentre el parámetro de la población (media (; varianza σ2 o proporción () para un cierto nivel de confianza o de significancia.

Estadístico de prueba

· Para probar la hipótesis nula se calcula un estadístico de prueba con la información de la muestra el cual se compara a un valor crítico apropiado. De esta forma se toma una decisión sobre rechazar o no rechazar la Ho

· Error tipo I (alfa = nivel de significancia, es común = 0.05 ). Alfa = 1- Nivel de confianza

· Se comete al rechazar la Ho cuando en realidad es verdadera. También se denomina riesgo del productor.

· Error tipo II (beta )

· Se comete cuando no se rechaza la hipótesis nula siendo en realidad falsa. Es el riesgo del consumidor

Pruebas de Hipótesis de dos colas:

Si la Ho: ( = que un valor poblacional, entonces el riesgo alfa se reparte en ambos extremos de la distribución. Por ejemplo si Ha: (≠ 10 se tiene:

Ho: a = b

Ha: a ( b

Pruebas de Hipótesis de cola derecha:

Si la Ho: ( (, que un valor poblacional, entonces el riesgo alfa se coloca en el extremo derecho de la distribución. Por ejemplo si Ho ( ( 10 y Ha: ( >10 se tiene una prueba de cola derecha:

Ho: a ( b

Ha: a > b

P(Z>= + Zexcel ) = alfa/2P(Z<= - Zexcel ) = alfa/2

Regiones de rechazo

Pruebas de Hipótesis cola izquierda:

Si la Ho: ( ( que un valor poblacional, entonces el riesgo alfa se coloca en el extremo izquierdo de la distribución. Por ejemplo si Ho ( ( 10 y Ha: ( < 10 se tiene una prueba de cola izquierda:

Ho: a ( b

Ha: a < b

Pasos para realizar una prueba de hipótesis

Probar la hipótesis de igualdad de una media ( para n > 30

1) Establecer las hipótesis e identificar el nivel de significancia alfa o 1- Nivel de confianza (NC)

Ho: (((( Ha: ((((

2) Calcular el estadístico de prueba Zc o Tc con fórmula

3) Determinar el estadístico de tablas Zt o Tc de Excel para una cierta alfa o 1-NC

4) Establecer la región de rechazo con Zt y ver si cae ahí Zc

Las regiones de rechazo prueba de 2 colas: -Z(/2 y Z(/2

5) Determinar el Intervalo de confianza para la media y ver si incluye a la media de la hipótesis, si no rechazar Ho

6) Determinar el valor P correspondiente a Zc y comparar contra Alfa/2, si es menor rechazar Ho

4. Fórmulas para calcular los estadísticos de prueba

Fórmulas para Intervalos de confianza de parámetros de una población

a) Intervalo de confianza para estimar ( con muestras grandes (n >= 30 ) y cuando ya se cuenta con historial, o sea que ( es conocida:

n

Z

X

para

IC

s

m

a

2

/

±

=

Si la ( no se conoce entonces se usa S de la muestra en su lugar

n

S

Z

X

para

IC

2

/

a

m

±

=

b) Intervalo de confianza para estimar ( con muestras pequeñas (n < 30; grados de libertad = gl. = n –1):

n

S

t

X

para

IC

gl

,

2

/

a

m

±

=

c) Intervalo de confianza para estimar ( proporción poblacional:

p

p

S

Z

p

para

IC

n

p

p

S

2

/

)

1

(

a

p

±

=

-

=

d) Tamaño de muestra para estimar ( en función del error

)

(

m

-

X

:

2

2

2

/

)

(

m

a

-

=

X

Z

n

e) Tamaño de muestra para estimar ( en función del error

)

(

p

-

p

, en el peor caso ( = 0.5:

2

2

2

/

)

(

)

1

)(

(

p

p

p

a

-

-

=

p

Z

n

Fórmulas para calcular los estadísticos utilizados en las pruebas de Hipótesis de una pob.

f) Estadístico Zc muestras grandes (n >= 30 ) y cuando la ( es conocida (ya se tiene historial):

n

X

Zc

HIPOTESIS

s

m

-

=

f) Si no se conoce la ( entonces se reemplaza por la S de la muestra.

g) Estadístico tc para muestras pequeñas (n < 30) y la ( es desconocida:

n

s

X

t

HIPOTESIS

C

m

-

=

h) Estadístico Zc para proporciones y muestras grandes (n >= 30):

p

HIPOTESIS

HIPOTESIS

HIPOTESIS

p

p

Zc

n

s

p

p

p

s

-

=

-

=

)

1

(

Ejemplos de cada uno de los casos

a) Estadístico Zc muestras grandes (n >= 30 ) o cuando la ( es conocida (ya se tiene historial):

valor

Ha

valor

Ho

¹

=

m

m

:

:

n

X

Zc

HIPOTESIS

s

m

-

=

Estadístico de tablas Zalfa o Zalfa/2 en Excel =DISTR.NORM.ESTAND.INV(alfa o alfa/2)

Estadístico de tablas Zalfa o Zalfa/2 en Minitab >Calc >Probability distributions> Normal:

Inverse Cummulative prob; Mean = 0; Std. Dev. = 0; Input constant = Alfa o alfa/2

Intervalo de confianza para estimar ( con muestras grandes (n >= 30) o cuando ya se cuenta con historial, o sea que ( es conocida:

n

Z

X

para

IC

s

m

a

2

/

±

=

Si no se conoce la ( entonces se reemplaza por la S de la muestra.

n

S

Z

X

para

IC

2

/

a

m

±

=

El valor p de probabilidad correspondiente al estadístico Zc se determina como sigue:

P value en Excel =DISTR.NORM.ESTAND(Zc)

P value en Minitab >Calc >Probability distributions> Normal:

Cummulative prob; Mean = 0; Std. Dev. = 0; Input constant = Zc

Prueba de hipótesis en Minitab:

>Stat >Basic statistics > 1-Sample Z

Utilizar Sample in columns o Summarized data

Sample size 49Mean 11.5 Standar deviation 1.1

Test Mean 12

Graphs – Seleccionar º! Individual value plot

Confidence level 90%

Alternative not equal

OK

Resultados:

One-Sample Z

Test of mu = 12 vs not = 12

The assumed standard deviation = 1.1

N Mean SE Mean 90% CI Z P

49 11.5000 0.1571 (11.2415, 11.7585) -3.18 0.001

Criterios de rechazo de Ho:

Si Zc cae en la zona de rechazo

El valor de la Hipótesis no se encuentra en el Intervalo de confianza

El valor P es menor que el valor de alfa (prueba de una cola) o de alfa/2 (dos colas).

b) Estadístico tc para muestras pequeñas (n < 30) y la ( es desconocida:

valor

Ha

valor

Ho

¹

=

m

m

:

:

n

s

X

t

HIPOTESIS

C

m

-

=

Estadístico de tablas Talfa o Talfa/2 en Excel =DISTR.T.INV(2*alfa o alfa, grados de libertad n-1)

Estadístico de tablas Talfa o Talfa/2 en Minitab >Calc >Probability distributions> :

Inverse Cummulative prob; Degrees of freedom = n-1; Input constant = Alfa o alfa/2

Intervalo de confianza para estimar ( con muestras pequeñas (n < 30; grados de libertad (gl.) = n –1):

n

S

t

X

para

IC

gl

,

2

/

a

m

±

=

El valor p de probabilidad correspondiente al estadístico Tc se determina como sigue:

P value en Excel =DISTR.T(Tc, grados de libertad, 1 o 2 colas)

P value en Minitab >Calc >Probability distributions> T:

Cummulative prob; Degrees of freedom = n-1; Input constant = Tc

Prueba de hipótesis en Minitab:

>Stat >Basic statistics > 1-Sample t

Utilizar Sample in columns o Summarized data

Sample size 10Mean 11277 Standar deviation 3772

Test Mean 12000

Graphs – Seleccionar º! Individual value plot

Confidence level 95%

Alternative not equal

OK

Resultados:

One-Sample T

Test of mu = 12000 vs not = 12000

N Mean StDev SE Mean 95% CI T P

10 11277.0 3772.0 1192.8 (8578.7, 13975.3) -0.61 0.559

Criterios de rechazo de Ho:

Si Tc cae en la zona de rechazo

El valor de la Hipótesis no se encuentra en el Intervalo de confianza

El valor P es menor que el valor de alfa (prueba de una cola) o de alfa/2 (dos colas).

c) Estadístico Zc para proporciones y muestras grandes (n >= 30):

valor

Ha

valor

Ho

¹

=

p

p

:

:

p

HIPOTESIS

HIPOTESIS

HIPOTESIS

p

p

Zc

n

s

p

p

p

s

-

=

-

=

)

1

(

Estadístico de tablas Zalfa o Zalfa/2 en Excel =DISTR.NORM.ESTAND.INV(alfa o alfa/2)

Estadístico de tablas Zalfa o Zalfa/2 en Minitab >Calc >Probability distributions> Normal:

Inverse Cummulative prob; Mean = 0; Std. Dev. = 0; Input constant = Alfa o alfa/2

Intervalo de confianza para estimar ( proporción poblacional:

p

p

S

Z

p

para

IC

n

p

p

S

2

/

)

1

(

a

p

±

=

-

=

El valor p de probabilidad correspondiente al estadístico Zc se determina como sigue:

P value en Excel =DISTR.NORM.ESTAND(Zc)

P value en Minitab >Calc >Probability distributions> Normal:

Cummulative prob; Mean = 0; Std. Dev. = 0; Input constant = Zc

Prueba de hipótesis en Minitab

>Stat >Basic statistics > 1- Proportion

Summarized data

Number of trial 500Number of events 225

Graphs – Seleccionar º! Individual value plot

Confidence level 98%Test proportion 0.40 Alternative Less than

º! Use test and interval based on normal distribution

OK

Resultados

Test and CI for One Proportion

Test of p = 0.4 vs p < 0.4

98%

Upper

Sample X N Sample p Bound Z-Value P-Value

1 225 500 0.450000 0.495693 2.28 0.989

Criterios de rechazo de Ho:

Si Zc cae en la zona de rechazo

El valor de la Hipótesis no se encuentra en el Intervalo de confianza

El valor P es menor que el valor de alfa (prueba de una cola) o de alfa/2 (dos colas).

d) Cálculo del estadístico con base en Chi cuadrada para prueba de una varianza.

Ho:

2

s

=

2

0

s

Ho:

2

s

(

2

0

s

El estad

Donde:

2

0

s

la varianza de la hipótesis

N = número de datos de la muestra

S2 = varianza de los datos de la muestra

e) Tamaño de muestra para estimar ( en función del error

)

(

m

-

X

:

2

2

2

/

)

(

m

a

-

=

X

Z

n

f) Tamaño de muestra para estimar ( en función del error

)

(

p

-

p

, en el peor caso ( = 0.5:

2

2

2

/

)

(

)

1

)(

(

p

p

p

a

-

-

=

p

Z

n

5. Ejemplos de pruebas de hipótesis de una población

Ejemplos de Prueba de hipótesis Estadística

Paso 1. Para una muestra grande (n >30) probar la hipótesis de una media

m

. Establecer alfa.

Ho:

o

m

m

=

Ha:

0

m

m

¹

Paso 2. Calcular el estadístico de prueba

n

s

Z

calc

0

m

m

-

=

Paso 3. Establecer la región de rechazo, para prueba de 2 colas:

2

2

a

a

y

Z

Z

-

Paso 4. Si el valor del estadístico de prueba cae en la región de rechazo rechazaremos Ho de otra manera no podemos rechazar Ho.

Paso 5. Calcular el intervalo de confianza IC para un nivel de confianza de 1-alfa, si la media de la hipótesis se encuentra dentro del intervalo, no rechazar Ho y viceversa.

Paso 6. Calcular el valor de Probabilidad P para el estadístico calculado a partir de la muestra Zc o Tc por medio de:

Para Zc: P = distr.norm.estand.inv(-Zc)

Para Tc: P = distr.t.inv(Tc, grados de libertad, 1 o 2 colas)

Para Chi2: P = Prueba.chi.inv(Chi c, grados de libertad)

Si el valor de P es menor o igual a alfa se rechaza Ho y se acepta Ha (en el caso de dos colas el valor de P total es del doble del calculado).

Prueba Z de 2 colas

Problema 1

Los enanos de Blanca Nieves le informan que excavan 12 toneladas promedio por semana. Nieves recolecta datos de 49 semanas y obtiene X=11.5, s= 1.1 a un nivel de significancia α=10%. Los Enanos están en lo cierto.

Solución

1) Planteamiento de hipótesis

Ho: μ=12

Ha: μ≠12

2) Determinar estadístico de la prueba Z

Zc= 11.5 – 12/ (1.1 / √49) = -0.5/ 0.157 = -3.185

3) Determinar el valor de Zt de acuerdo al valor de alfa

10% / 2 = 0.05

Z de tablas 0.05 = -1.64

4) Interpretación y conclusiones

Dado que Zc=-3.185 es menor que Zt=-1.64 la Ho se rechaza a un nivel alfa del 10%.

Los enanos no excavan 12 toneladas al día

5) Intervalo de confianza

IC = Media +-Zalfa/2* S/ raiz(n)

IC = 11.5+- 1.64* 1.1/raiz(49) = (11.242, 11.75)

La media de la hipótesis no se encuentra en el intervalo de confianza, se rechaza Ho.

6) Valor P del estadístico de prueba

P =distr.norm.estand(Zc) =distr.norm.estand(-3.18) = 0.00073

Como el valor P es menor a alfa/2 entonces se rechaza Ho

Prueba Minitab:

>Stat >Basic statistics > 1-Sample Z

Summarized data

Sample size 49Mean 11.5 Standar deviation 1.1

Test Mean 12

Graphs – Seleccionar º! Individual value plot

Confidence level 90%

Alternative not equal

OK

RESULTADOS Y CONCLUSIONES……

Problema 2

Se quiere probar la afirmación de que la distancia promedio viajada por pelotas de golf es de 250 yardas a un 95% de confianza.

ZSe toma una muestra de 16 distancias

269

300

268

278

282

263

301

295

288

278

276

286

296

265

271

279

RESULTADOS Y CONCLUSIONES……

En vez de seleccionar Summarized data, seleccionar Samples in columns

Prueba Z de una cola

Problema 3

Se planea en un restaurante eliminar del menú el pollo frito. Se afirma que las ventas habían descendido por debajo de la media histórica de $4500. ¿Parece una decisión adecuada si en una muestra de n=144 observaciones se observa Xmedia= 4,477, s=1,128 con α= 2%?

Solución

1) Planteamiento de hipótesis

Ho: μ≥4500

Ha: μ<4500

2) Determinar estadístico de la prueba Z

Zc= 4477 – 4500 / (1128 / √144) = -23/ 94= -0.245

3) Determinar el valor de Z en tablas de acuerdo al valor de alfa 2%

Zt de tablas 0.02 = -2.053

4) Interpretación y conclusiones

Dado que Zc=-0.245 es mayor que Zt=-2.053 la Ho no se rechaza a una alfa del 2%.

5) Intervalo de confianza

IC = Media +-Zalfa/2* S/ raiz(n)

IC = 4477 +- 2.053* 1128/raiz(144) = (4284.01, 4669.98)

La media de la hipótesis si se encuentra en el intervalo de confianza, no se rechaza Ho.

6) Valor P del estadístico de prueba

P =distr.norm.estand(Zc) =distr.norm.estand(-0.245) = 0.4032

Como el valor P es mayor a alfa entonces no se rechaza Ho, no han descendido las ventas.

Prueba Minitab (Options: Confidence level 98%

Alternative Less Than)

RESULTADOS Y CONCLUSIONES……

Prueba t de dos colas

Problema 4

Un distribuidor piensa que el promedio de sus ventas son de $12000 al mes. Selecciona n=10 meses y encuentra X=11,277, s=3,772. Aun alfa del 5% ¿qué se puede concluir?

Solución

1) Planteamiento de hipótesis

Ho: μ=12000

Ha: μ≠12000

2) Determinar estadístico de la prueba t

tc= 11277 – 12000 / (3772 / √10) = -723 / 1192.81 = - 0.6061

3) Determinar el valor de t en tablas de acuerdo al valor de alfa y los grados de libertad

gl= n-1= 10-1 =9 para un alfa / 2 de 0.05/2= 0.025

tt de tablas para 0.025 con 9 gl = 2.262 con =distr.t.inv(0.05,9) = 2.262

4) Interpretación y conclusiones

Dado que tc= -0.6061 es mayor que tt= - 2.262 la Ho no se rechaza a un nivel alfa del 5%.

Las ventas son de $12000 al mes

5) Intervalo de confianza

IC = Media +-Talfa/2* S/ raiz(n)

IC = 11277+- 2.262* 3772/raiz(10) = ( 8578.86, 13975.14)

La media de la hipótesis se encuentra en el intervalo de confianza, NO se rechaza Ho.

6) Valor P del estadístico de prueba

P =distr.t(Tc, gl, colas) =distr.t(0.6061, 9, 2) = 0.5594

Como el valor P es mayor a alfa/2 entonces NO se rechaza Ho, las ventas son de $12000.

Prueba Minitab

>Stat >Basic statistics > 1-Sample t

Summarized data

Sample size 10Mean 11277 Standar deviation 3772

Test Mean 12000

Graphs – Seleccionar º! Individual value plot

Confidence level 95%

Alternative not equal

OK

RESULTADOS Y CONCLUSIONES……

Problema 5

Las ganancias por acción son de 3 dolares, probar para un 95% de confianza si esto es cierto. Una muestra de datos arrojó los resultados siguientes:

1.92

2.16

3.63

3.16

4.02

3.14

2.2

2.34

3.05

2.38

RESULTADOS Y CONCLUSIONES……

Prueba t de una cola

Problema 6

La vida útil de un foco es de 5,000 horas. Un nuevo diseño se piensa incremente esta vida. Se prueban n=25 focos con fusión a X=5,117, s= 1,886. Concluir para un nivel alfa del 5%.

Solución

1) Planteamiento de hipótesis

Ho: μ≤5000

Ha: μ>5000

2) Determinar estadístico de la prueba t

tc= 5117 – 5000 / (1886 / √25) = 117 / 377.2 = 0.310

3) Determinar el valor de t en tablas de acuerdo al valor de alfa y los grados de libertad

gl= n-1= 25-1 =24 para alfa de 0.05

tt de tablas 0.05 con 24 gl = 1.71 de =distr.t.inv(0.1,24) =1.71

4) Interpretación y conclusiones

Dado que tc=0.310 es menor que tt=1.71 la Ho no se rechaza a un nivel alfa de 5%.

La vida de los focos es de 5000 horas.

5) Intervalo de confianza

IC = Media +-Talfa/2* S/ raiz(n)

IC = 5117+- 1.71* 1886/raiz(25) = ( 4471.988, 5762.012 )

La media de la hipótesis se encuentra en el intervalo de confianza, NO se rechaza Ho.

6) Valor P del estadístico de prueba

P =distr.t(Tc, gl, colas) =distr.t(0.31, 24, 1) = 0.3796

Como el valor P es mayor a alfa entonces NO se rechaza Ho, la vida es de 5000 Hrs.

Prueba Minitab (Confidence level 95%Alternative greater than)

RESULTADOS Y CONCLUSIONES……

Problema 7

Las horas tomadas para plantar un árbol mediano son las siguientes. Probar a un 5% si el tiempo es > 2 Hrs.

1.9

1.7

2.8

2.4

2.6

2.5

2.8

3.2

1.6

2.5

RESULTADOS Y CONCLUSIONES……

Prueba Z para una proporción

Problema 8

Midwest planea comercializar un producto sólo si por lo menos el 40% del público lo prefiere. En una muestra de 500 personas encuentra que 225 lo prefieren. ¿A un nivel alfa de 2%, Midwest debe comercializar el producto?

Solución

1) Planteamiento de hipótesis

Ho: π≥0.40

Ha: π<0.40

2) Determinar estadístico de la prueba Z

σp = √(0.40)(1-0.40) / 500 = 0.022

p= 225/500 = 0.45

Zc= 0.45-0.40/ 0.022) = 0.05/ 0.022 = 2.27

3) Determinar el valor de Z en tablas de acuerdo al valor de alfa

0.02%

Z de tablas para 0.02 = -2.053

4) Interpretación y conclusiones

Dado que Zc=2.27 es mayor que Zt=-2.053 la Ho no se rechaza a un nivel alfa del 2%.

La proporción no es menor al 40% se debe comercializar el producto.

5) Intervalo de confianza

p = 225/500 = 0.45

Sp = raiz (p(1-p)/n)) = raiz(0.45(0.55)/500) = 0.02418

IC = p +- Zalfa/2 * Sp

IC = 045 +- 2.053*0.024 = (0.400, 0.4992)

La media de la hipótesis se encuentra en el intervalo de confianza, NO se rechaza Ho.

6) Valor P del estadístico de prueba

P =distr.norm.estand (Zc) =distr.norm.estand (2.27) = 0.98839

Como el valor P es mayor a alfa/2 entonces NO se rechaza Ho, la proporción es 0.40.

Prueba Minitab

>Stat >Basic statistics > 1- Proportion

Summarized data

Number of trial 500Number of events 225

Graphs – Seleccionar º! Individual value plot

Confidence level 98%Test proportion 0.40

Alternative Less than

º! Use test and interval based on normal distribution

OK

RESULTADOS Y CONCLUSIONES……

Problema 9

Un estudio indicó que el 64% de los consumidores de supermercado creen en las marcas propias.El fabricante de una salsa de tomate preguntó a 100 compradores donde 52 prefieren marca propia, probar si el porcentaje de preferencias es menor al 64%, para un 5% de nivel de significancia

Ha: pi < 0.64 Ho: Pi >= 0.64

Trials100

Prueba de cola izquierda

Events52

NC95%

Alternate

Less Than

RESULTADOS Y CONCLUSIONES……

Problema 10

Midlakes canceló sus vuelos ya que se estimó que más del 18% involucraba aviones con fallas mecánicas. ¿Este estimado se confirma a un nivel alfa del 0.05 si D = 24 aviones de n = 120 tenían fallas?

Solución

1) Planteamiento de hipótesis

Ho: π ≤0.18

Ha: π >0.18

2) Determinar estadístico de la prueba Z

σp = √(0.18)(1-0.18) / 120 = 0.035

p= 24/120 = 0.2

Zc= 0.2-0.18/ 0.035) = 0.02/ 0.035 = 0.571

3) Determinar el valor de Z en tablas de acuerdo al valor de alfa de 0.05%

Z de tablas para 0.05 = 1.64

4) Interpretación y conclusiones

Dado que Zc=0.571 es menor que Zt=1.64 la Ho no se rechaza a un nivel de confianza del 5%.

La proporción de aviones con falla es del 0.18

5) Intervalo de confianza

p = 24/120 = 0.2

Sp = raiz (p(1-p)/n)) = raíz(0.2(0.8)/120) = 0.0365

IC = p +- Zalfa/2 * Sp

IC = 0.2 +- 1.64*0.0365 = (0.1402, 0.2598)

La media de la hipótesis se encuentra en el intervalo de confianza, NO se rechaza Ho.

6) Valor P del estadístico de prueba

P =distr.norm.estand (Zc) =distr.norm.estand (-0.571) = 0.284

Como el valor P es mayor a alfa/2 entonces NO se rechaza Ho, la proporción es 0.18.

Prueba Minitab (Confidence level 95%Alternative Greater than)

RESULTADOS Y CONCLUSIONES……

Prueba de hipótesis para una varianza

Problema 10

Se trata de probar si la varianza poblacional de las rentas en las ciudades es de 30.

Los datos de la renta para diferentes ciudades es la siguiente:

Ciudad

Renta

A

47

B

50

C

53

D

45

E

40

F

43

G

39

H

37

La varianza de los datos en Excel es: = Var( datos de rentas ) = 31.0714286

Paso 1. (2 = (02

(2 ( (02

Ho: Varianza = 30

Ha: Varianza ( 30

Paso 2. Estadístico de Prueba Chi cuadrado calculado Chic:

Donde:

(02 = Varianza de Ho = 30;

N = número de datos = 8;

Varianza de datos S2= 31.0714286

(c2 = (8-1)*31.0714286 / 30 = 7.25

Paso 3. Estadístico correspondiente a alfa ( =0.05 (por tanto (/2 = 0.025).

De tablas o con Excel por ser una prueba de dos colas:

(2(/2, n-1 = prueba.chi.inv(0.025, 8-1) = 16.0127643

(2 (1-(/2), n-1 = prueba.chi.inv(0.975, 8-1) = 1.68986919

Paso 4. Se observa si el (2c cae en la zona de rechazo, como en este caso no es así, no hay evidencia suficiente para rechazar Ho, y se considera que la varianza si es de 30.

Paso 5. Calculando el valor P correspondiente a la Chi calculada ((2c se tiene:

P = distr.Chi((2c, n-1) = distr.chi(7.25, 7) = 0.4033

Como el valor P correspondiente a X2c es mayor que Alfa/2, no se rechaza la Ho

Paso 6. Calculando ahora el intervalo de confianza para la varianza poblacional se tiene:

Sustituyendo valores se tiene: (13.58291398, 128.7081872)

Como el 30 de la Ho se encuentra en el intervalo de confianza, no se rechaza Ho indicando que la varianza no es diferente de 70.

6. Ejercicios adicionales:

12. Los tiempos que toma el registro de las órdenes en un negocio son los siguientes:

1.9

1.7

2.8

2.4

2.6

2.5

2.8

3.2

1.6

2.5

a) Probar a un Nivel de Confianza del 90% si el tiempo es mayor a 1.98.

b) Probar a un alfa de 0.02 si la desviación estándar es mayor a 0.6.

13. Se quiere probar la afirmación de que la distancia viajada por pelotas de golf es de 250 yardas a un 95% de confianza.Se toma una muestra de 36 distancias

269

300

268

278

282

263

301

295

288

278

276

286

296

265

271

279

284

260

275

282

260

266

270

293

272

285

293

281

269

291

274

277

299

263

264

273

14. Las Ganancias por acción son de 3 dólares para un 95% de confianza, probar esta afirmación..

Una muestra de datos arrojó los resultados siguientes:

1.92

2.16

3.63

3.16

4.02

3.14

2.2

2.34

3.05

2.38

15. Un estudio encontró que 40% de los usuarios de Internet recibieron más de 10 mensajes diarios. Si de 420 usuarios 188 recibieron estos mensajes, a un nivel de 5% ¿Cuál es la conclusión?

16. Un estudio indicó que el 64% de los consumidores de supermercado creen en las marcas propias. El fabricante de una salsa de tomate preguntó a 100 compradores donde 52 prefieren marca propia,probar si el porcentaje de preferencias es menor al 64%, para un 5% de nivel de significancia.

17. Un restaurante planea una oferta especial si más del 15% de los clientes compra vasos de diseño especialcon personajes de caricaturas. En una prueba 88 de 500 clientes compraron vasos. A un 0.01 de nivel de significancia, ¿Cuál es su recomendación?

18. Las rentas diarias de automoviles en Dólares de ocho ciudades se muestra a continuación:

Ciudad

A

B

C

D

E

F

G

H

Renta

47

50

53

45

40

43

39

37

¿A un 5% se comprueba la hipótesis de que la varianza de la población es de 30?

19. Se midió la temperatura de fusión de un aceite vegetal hidrogenado en n=16 muestras y se encontró una media de 94.32. Si la temperatura de fusión sigue una distribución normal con sigma = 1.20.

a) Probar a un 95% de nivel de confianza de que la media se ha mantenido en 95.

20. La duración promedio de cierto foco es de 750 horas. El cliente cambiaría de marca sólo que se demuestre que de manera concluyente que la vida de los focos es menor que la anunciada. Se elige una muestra aleatoria de 20 focos, se determina su duración y se obtiene una vida media de 738.44 con una desviación estándar de 38.20.

a) ¿Cuál sería la conclusión a un 95% de nivel de confianza?

21. Después de ciertas horas de trabajo se determinó el desgaste de flechas en 0.0001” para cada una de las n=8 máquinas que tienen plomo y cobre como material de soporte, y se obtuvo como resultado que la media fue de 3.72 con desviación estándar de 1.25.

a) Se desea probar si el desgaste es mayor a 3.5 a un 95% de nivel de confianza.

22. Las lecturas de radiación de Radón tomadas en 12 lugares fueron como sigue:

105.6, 90.9, 91.2, 96.9, 96.5, 91.3, 100.1, 105, 99.6, 107.7, 103.3 y 92.4.

a) A un alfa de 5%, ¿indican las lecturas que difieren de 100?.

23. Se prueban 100 baterías de Ni-H para celdas de prueba y se determina que 14 de ellas se ampoyan en sus placas fallando. Para un 5% de nivel de significancia.

a) ¿Proporciona lo anterior una evidencia de que más del 10% de las baterías fallan?

24. Para un cierto servicio los tiempos de respuesta son de 3 horas, probar la afirmación para un 98% de nivel de confianza.

Una muestra de datos arrojó los resultados siguientes:

1.92

2.16

3.63

3.16

4.02

3.14

2.2

2.34

3.05

2.38

25. Las horas tomadas para mantenimiento son las siguientes. Probar a un 5% si el tiempo es > 2 Hrs.

Tiempos

1.9

1.7

2.8

2.4

2.6

2.5

2.8

3.2

1.6

2.5

26. Un estudio encontró que 40% de los usuarios de Internet recibieron más de 10 mensajes diarios

Si de 420 usuarios 188 recibieron estos mensajes, a un nivel de 5% ¿Cúal es la conclusión?

27. Un estudio indicó que el 64% de los consumidores de supermercado creen en las marcas propias. El fabricante de una salsa de tomate preguntó a 100 compradores donde 52 prefieren marca propia,

probar si el porcentaje de preferencias es menor al 64%, para un 5% de nivel de significancia.

(/2 = 0.025

P =0.4033

(/2 = 0.025

(/2 = 0.025

� EMBED Word.Picture.8 ���

PAGE

5

_1125072391.unknown
_1250417464.unknown
_1250417577.unknown
_1250417641.unknown
_1250417657.unknown
_1250417549.unknown
_1125072956.unknown
_1250417331.unknown
_1250417351.unknown
_1250417144.unknown
_1125072568.unknown
_1125071585.unknown
_1125072004.unknown
_1125072116.unknown
_1125072136.unknown
_1125072022.unknown
_1125071692.unknown
_1083251763.unknown
_1125071218.unknown
_1125071413.unknown
_1083527885.unknown

_1083527546.doc

Z

0

-

Z

Región de

Rechazo

Región de

Rechazo

_1058180741.unknown
_1058181317.unknown
_1058180915.unknown
_1058093615.unknown