contraste de hipÓtesis · compuesta: si la hipótesis asigna un rango de valores a los parámetros...

28
1 CONTRASTE DE HIPÓTESIS HAMLET MATA MATA Un Contraste o Test de Hipótesis es una técnica de Inferencia Estadística que permite comprobar si la información que proporciona una muestra observada concuerda (o no) con la hipótesis estadística formulada sobre el modelo de probabilidad en estudio y, por tanto, se puede aceptar (o no) la hipótesis formulada. Llamaremos hipótesis estadística a una afirmación respecto a una característica de una población. Contrastar una hipótesis es comparar las predicciones que se deducen de ella con la realidad que observamos: si hay coincidencia, dentro del margen de error admisible, mantendremos la hipótesis; en caso contrario, la rechazaremos. La hipótesis estadística puede ser: Paramétrica: es una afirmación sobre los valores de los parámetros poblacionales desconocidos. Las hipótesis paramétricas se clasifican en: Simple: si la hipótesis asigna valores únicos a los parámetros Compuesta: si la hipótesis asigna un rango de valores a los parámetros poblacionales desconocidos No Paramétrica: es una afirmación sobre alguna característica estadística de la población en estudio. Por ejemplo, las observaciones son independientes, la distribución de la variable en estudio es normal, la distribución es simétrica. La hipótesis que se contrasta se denomina hipótesis nula y, normalmente, se denota por H 0 . Si se rechaza la hipótesis nula es porque se asume como correcta una hipótesis complementaria que se denomina hipótesis alternativa y se denota por H 1 o H a . Rechazar una hipótesis implica sustituirla por otra capaz de explicar los datos observados. Las siguientes afirmaciones son hipótesis estadísticas: 1. El tabaco produce cáncer de pulmón. 2. Disminuir la grasa en las comidas evita los infartos. 3. Las mujeres son más disciplinadas que los hombres. Estas tres hipótesis no se refieren a individuos particulares, sino al conjunto de elementos de una o varias poblaciones. En estos ejemplos vemos que el contraste de hipótesis requiere, como pasos previos: 1. Especificar la población de interés 2. Definir la variable a que nos referimos y como medirla. 3. Relacionar la hipótesis con los parámetros de la o las poblaciones. HIPÓTESIS "La imaginación, impaciente por remontarse a las causas, se complace en crear hipótesis y a menudo deforma los hechos para plegarlos a su labor: en tales casos, las hipótesis son peligrosas. Pero cuando sólo se las considera como medios para conectar entre sí los fenómenos a fin de descubrir sus leyes, cuando, procurando no atribuirles realidad, se las rectifica continuamente con ayuda de nuevas observaciones, entonces pueden llevarnos a las causas verdaderas o, por lo menos, ponernos en condiciones de inferir de los fenómenos observados aquellos que, dadas las circunstancias, han debido originarlos". Pierre Simon de Laplac Ensayo filosófico sobre las probabilidades (de las diversas formas de acercarse a la certeza) 1795 .

Upload: others

Post on 21-Mar-2020

9 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: CONTRASTE DE HIPÓTESIS · Compuesta: si la hipótesis asigna un rango de valores a los parámetros poblacionales desconocidos No Paramétrica: es una afirmación sobre alguna característica

1

CONTRASTE DE HIPÓTESIS

HAMLET MATA MATA

Un Contraste o Test de Hipótesis es una técnica de Inferencia Estadística que permite comprobar

si la información que proporciona una muestra observada concuerda (o no) con la hipótesis estadística

formulada sobre el modelo de probabilidad en estudio y, por tanto, se puede aceptar (o no) la hipótesis

formulada. Llamaremos hipótesis estadística a una afirmación respecto a una característica de una

población. Contrastar una hipótesis es comparar las predicciones que se deducen de ella con la

realidad que observamos: si hay coincidencia, dentro del margen de error admisible, mantendremos la hipótesis; en caso contrario, la rechazaremos. La hipótesis estadística puede ser:

Paramétrica: es una afirmación sobre los valores de los parámetros poblacionales desconocidos. Las

hipótesis paramétricas se clasifican en:

Simple: si la hipótesis asigna valores únicos a los parámetros

Compuesta: si la hipótesis asigna un rango de valores a los parámetros poblacionales desconocidos

No Paramétrica: es una afirmación sobre alguna característica estadística de la población en estudio.

Por ejemplo, las observaciones son independientes, la distribución de la variable en estudio es normal,

la distribución es simétrica.

La hipótesis que se contrasta se denomina hipótesis nula y, normalmente, se denota por H0. Si se

rechaza la hipótesis nula es porque se asume como correcta una hipótesis complementaria que se

denomina hipótesis alternativa y se denota por H1 o Ha.

Rechazar una hipótesis implica sustituirla por otra capaz de explicar los datos observados.

Las siguientes afirmaciones son hipótesis estadísticas:

1. El tabaco produce cáncer de pulmón.

2. Disminuir la grasa en las comidas evita los infartos.

3. Las mujeres son más disciplinadas que los hombres.

Estas tres hipótesis no se refieren a individuos particulares, sino al conjunto de elementos de una o

varias poblaciones. En estos ejemplos vemos que el contraste de hipótesis requiere, como pasos

previos:

1. Especificar la población de interés

2. Definir la variable a que nos referimos y como medirla.

3. Relacionar la hipótesis con los parámetros de la o las poblaciones.

HIPÓTESIS

"La imaginación, impaciente por remontarse a las causas, se complace en crear hipótesis y a menudo

deforma los hechos para plegarlos a su labor: en tales casos, las hipótesis son peligrosas. Pero cuando

sólo se las considera como medios para conectar entre sí los fenómenos a fin de descubrir sus leyes,

cuando, procurando no atribuirles realidad, se las rectifica continuamente con ayuda de nuevas

observaciones, entonces pueden llevarnos a las causas verdaderas o, por lo menos, ponernos en

condiciones de inferir de los fenómenos observados aquellos que, dadas las circunstancias, han

debido originarlos". Pierre Simon de Laplac Ensayo filosófico sobre las probabilidades

(de las diversas formas de acercarse a la certeza) 1795 .

Page 2: CONTRASTE DE HIPÓTESIS · Compuesta: si la hipótesis asigna un rango de valores a los parámetros poblacionales desconocidos No Paramétrica: es una afirmación sobre alguna característica

2

Es interesante tener en cuenta que la veracidad de una hipótesis no puede ser probada nunca

Lo que se puede hacer es afirmar que tiene tal o cual probabilidad de ser falsa

Si esa probabilidad es muy alta (95% o 99%) por ejemplo, se concluye que la hipótesis es poco creíble

y se califica provisoriamente como falsa. Si no se consigue "falsar" (rechazar) la hipótesis, se acepta

provisionalmente como verdadera. Esta calidad de provisorias de las conclusiones estadísticas no

debería sorprender a nadie: toda la ciencia es un constructo provisorio. La verificación de hipótesis es

el proceso que lleva a juzgar la credibilidad de afirmaciones (hipótesis) relativas a las poblaciones

(habitualmente a sus parámetros) de las que fueron extraídas las muestras.

Ejemplificando

La Hipótesis nula puede ser: un parámetro que tiene un valor k y la Hipótesis alternativa será su

negación. Es decir:

Si se toma una muestra y en ella se calcula un estadístico

cuya distribución en el muestreo en el

caso de que Ho sea verdadera se conoce, se puede determinar qué Probabilidad (P) hay de que si el

verdadero valor del parámetro es k se obtenga un valor observado del estadístico

, tan alejado (o

más) de k. Ver grafica siguiente:

Si P es muy baja la probabilidad de que la muestra no pertenezca a una población con k es muy

alta, por lo tanto se rechaza Ho. Consecuentemente se acepta H1.

Page 3: CONTRASTE DE HIPÓTESIS · Compuesta: si la hipótesis asigna un rango de valores a los parámetros poblacionales desconocidos No Paramétrica: es una afirmación sobre alguna característica

3

Las hipótesis estadísticas más habituales pueden clasificarse en dos grupos, según que:

1. Especifiquen un valor concreto o un intervalo para un parámetro de la distribución

de una variable.

2. Establezcan la igualdad de algún parámetro en las distribuciones de una variable en

dos o más poblaciones.

Un ejemplo del primer tipo es establecer que el tiempo medio diario invertido en bañarse por los

estudiantes de una universidad es de 15 minutos. Del segundo tipo, que el tiempo medio invertido es el

mismo para los estudiantes de mañana y de la tarde.

Aunque la metodología para realizar el contraste es análoga en ambos casos, es importante distinguir

entre ellos porque:

1. El contraste de una hipótesis respecto a un parámetro está muy relacionado con la

construcción de intervalos de confianza, y tiene frecuentemente una respuesta

satisfactoria en términos de estimación.

2. La comparación de dos o más poblaciones requiere en general un diseño

experimental que asegure la homogeneidad de las comparaciones.

Una hipótesis es una afirmación acerca de algo. En estadística, puede ser una suposición acerca del

valor de un parámetro desconocido. Una hipótesis estadística es una afirmación respecto a alguna

característica de una población. Contrastar una hipótesis es comparar las predicciones con la

realidad que observamos. Si dentro del margen de error que nos permitimos admitir, hay coincidencia,

aceptaremos la hipótesis y en caso contrario la rechazaremos.

La prueba de hipótesis comienza con una suposición, llamada hipótesis, que hacemos con respecto a un

parámetro de población. Después recolectamos datos de muestra, producimos estadísticos de muestra y

usamos esta información para decidir qué tan probable es que sea correcto nuestro parámetro de

población acerca del cual hicimos la hipótesis. Debemos establecer el valor supuesto o hipotetizado del

parámetro de población antes de comenzar a tomar la muestra. La suposición que deseamos probar se

conoce como hipótesis nula, y se simboliza H0. Siempre que rechazamos la hipótesis, la conclusión que

sí aceptamos se llama hipótesis alternativa y se simboliza H1.

La hipótesis emitida se suele designar por H0 y se llama Hipótesis nula porque parte del

supuesto que la diferencia entre el valor verdadero del parámetro y su valor hipotético es

debida al azar, es decir no hay diferencia.

La hipótesis contraria se designa por H1 y se llama Hipótesis alternativa.

Los contrastes pueden ser unilaterales o bilaterales (también llamados de una o dos colas) según

establezcamos las hipótesis, si las definimos en términos de igual y distinto estamos ante una hipótesis

unilateral, si suponemos una dirección (en términos de mayor o menor) estamos ante uno bilateral.

Pasos a seguir en una prueba de hipótesis:

Se trata, de extraer conclusiones a partir de una muestra aleatoria y significativa, que permitan aceptar

o rechazar una hipótesis previamente emitida, sobre el valor de un parámetro desconocido de la

población. El método que seguiremos es el siguiente:

1. Definir la hipótesis nula: suponer una hipótesis acerca de una población. Se determina si

es una prueba de una o dos cola.

2. Formular una hipótesis alternativa: es una contra-hipótesis.

3. Elegir un nivel de significación y construir la zona de aceptación, intervalo fuera del

cual sólo se encuentran el 100% de los casos más raros. A la zona de rechazo la

llamaremos Región Crítica, y su área es el nivel de significación o aceptación.

4. Verificar la hipótesis extrayendo una muestra cuyo tamaño se ha decidido en el paso

anterior y obteniendo de ella el correspondiente estadístico (media o proporción en

nuestro caso). Decida que distribución (t o z) es la más apropiada y encuentre los valores

críticos adecuados para el nivel de significancia escogido de la tabla adecuada.

5. Recabar datos de la muestra.

Page 4: CONTRASTE DE HIPÓTESIS · Compuesta: si la hipótesis asigna un rango de valores a los parámetros poblacionales desconocidos No Paramétrica: es una afirmación sobre alguna característica

4

6. Calcule el error estándar del estadístico de la muestra y utilice el error estándar para

convertir el valor observado del estadístico de la muestra a un valor estandarizado.

Determine si el valor calculado en la muestra cae dentro de la zona de aceptación de ser

así se acepta la hipótesis y si no se rechaza.

7. Utilice el estadístico de la muestra para evaluar la hipótesis.

Aquí nos vamos a limitar a estudiar hipótesis sobre la media y sobre la proporción en una población.

En cada caso se trabaja con un contraste bilateral o unilateral. Los contrastes unilaterales son de distinta

dirección en cada ejemplo, pero el método a seguir es análogo para ambos.

Hipótesis nula y alternativa

Llamaremos hipótesis nula, y la representaremos por H0, a la hipótesis que se desea contrastar. La

hipótesis nula es en general un supuesto simple que permite hacer predicciones sin ambigüedad. La

hipótesis alternativa (H1 o H0) da una suposición opuesta a aquella presentada en la hipótesis nula. El

experimento se lleva a cabo para conocer si la hipótesis alternativa puede ser sustentada.

El nombre de nula (H0) representa la hipótesis que mantendremos a no ser que los datos indiquen su

falsedad. “Nula” debe entenderse en el sentido de “neutra“. La hipótesis H0 nunca se considera

probada, aunque puede ser rechazada por los datos. Por ejemplo, la hipótesis de que todos los

elementos de una población tienen el mismo valor de una variable puede ser rechazada encontrando un

elemento que no lo contenga, pero no puede ser “demostrada” más que estudiando todos los elementos

de la población, tarea que puede ser imposible. De igual manera, la hipótesis de que la media de una

población es diez puede ser rechazada fácilmente si la media verdadera está muy lejos de diez

analizando una muestra suficientemente grande. Sin embargo, no puede ser “demostrada” mediante

muestreo, ya que es posible que la media difiera de diez en un valor pequeño imperceptible en el

muestreo). Por esta razón no afirmamos que aceptamos H0, sino que no podemos rechazarla.

La hipótesis H0 se elige normalmente de acuerdo con el principio de simplicidad científica. Este

principio establece que solamente debemos abandonar un modelo simple a favor de otro más complejo

cuando la evidencia a favor de este último sea fuerte. Si rechazamos H0, estamos implícitamente

aceptando la hipótesis alternativa, H1, que puede ser simplemente la negación de H1. En algunos casos

queremos decidir entre dos hipótesis simples y H1 está perfectamente determinada. Desconocemos

antes de realizar el contraste en que dirección puede ser falsa H0. Entonces H1 es simplemente la

negación de 00 : H . Decimos entonces que el contraste es bilateral. Conocemos la dirección en

que H0 puede ser falsa. Es decir, si H0 es falsa, en ese caso forzosamente 0 (o bien 0 ). Por

ejemplo, se introduce una medida en una población que, si tiene efectos, puede mejorar una variable

pero es imposible que pueda empeorarla. Tenemos entonces un contraste unilateral.

Al realizar una prueba de hipótesis, se parte de de un valor supuesto (hipotético) de un parámetro

poblacional. Después de recolectar una muestra aleatoria, se compara el estadístico muestral, así como

la media )( X , con el parámetro hipotético, se compara con una supuesta media poblacional )( .

Después, se acepta o se rechaza el valor hipotético, según proceda. Se rechaza el valor hipotético solo

si el resultado muestral resulta muy poco probable cuando la hipótesis es cierta. Se acepta la hipótesis

alternativa H1 solo si se rechaza la hipótesis nula.

Los tests ( o pruebas) asociados con las hipótesis pueden ser uni o bi laterales, según las hipótesis planteadas

Page 5: CONTRASTE DE HIPÓTESIS · Compuesta: si la hipótesis asigna un rango de valores a los parámetros poblacionales desconocidos No Paramétrica: es una afirmación sobre alguna característica

5

Estadístico de la prueba

Los datos se deben sintetiza en un estadístico de la prueba. Dicho estadístico se calcula para ver si es

razonablemente compatible con la hipótesis nula. Cuando se prueba una proporción el estadístico de la

prueba es muy simple: se cuenta el número de éxitos en la muestra para encontrar el estadístico.

En las pruebas de hipótesis es necesario trazar una línea entre los valores del estadístico de la prueba

que son relativamente probables dada la hipótesis nula y los valores que no lo son. ¿En qué valor del

estadístico de la prueba comenzamos a decir que los datos apoyan a la hipótesis alternativa? Para

contestar a esta pregunta se requiere conocer la distribución muestral del estadístico de la prueba. Los

valores del estadístico de la prueba que son sumamente improbables bajo la hipótesis nula (tal como los

determina la distribución muestral) forman una región de rechazo para la prueba estadística.

Nivel de significación

Para realizar un contraste de hipótesis se define normalmente una medida de discrepancia, entre los

datos muestrales y la hipótesis nula H0. Intuitivamente la discrepancia debe depender de la diferencia

entre el valor del parámetro especificado por H0 y el valor del estimador calculado en la muestra. Para

obtener una medida de discrepancia que no dependa de las unidades de medida de la variable podemos

dividir esta diferencia por su valor promedio, que es el error típico de estimación del parámetro. Por

tanto, la medida de discrepancia más habitual es:

es itmación de coerror típi

parámetroes timadoriadiscrepanc

Hay que decidir que discrepancias consideramos inadmisibles bajo H0, es decir, cual es la máxima

diferencia entre el estimador y el parámetro que estamos dispuestos a considerar compatible con H0.

Esta decisión depende de:

La distribución de la medida de discrepancia cuando es cierta H0. Como veremos, la

medida de discrepancia tiene generalmente una distribución normal, de media cero y

desviación típica uno, cuando H0 es cierta.

Que el contraste sea unilateral o bilateral. Para contrastes unilaterales interesan las

discrepancias en una dirección, mientras que para los bilaterales interesan en ambas.

Interpretación del nivel de significancia.

El propósito de la prueba de hipótesis no es cuestionar el valor calculado del estadístico de la muestra,

sino hacer un juicio respecto a la diferencia entre ese estadístico de muestra y un parámetro de

población hipotetizado. El siguiente paso después de establecer la hipótesis nula y alternativa consiste

en decidir qué criterio utilizar para decidir si aceptar o rechazar la hipótesis nula. Si suponemos que la

hipótesis es correcta, entonces el nivel de significancia indicará el porcentaje de medias de muestra que

está fuera de ciertos límites. Siempre que afirmemos que aceptamos la hipótesis nula, en realidad lo que

queremos decir es que no hay suficiente evidencia estadística para rechazarla. El empleo del

término aceptar, en lugar de rechazar, se ha vuelto de uso común. Significa simplemente que cuando

los datos de la muestra n hacen que rechacemos una hipótesis nula, nos comportamos como si fuera

cierta.

Selección del nivel de significancia.

Nuestra elección del estándar mínimo para una probabilidad aceptable, o el nivel de significancia, es

también el riesgo que asumimos al rechazar una hipótesis nula cuando es cierta. Mientras más alto sea

el nivel de significancia que utilizamos para probar una hipótesis, mayor será la probabilidad de

rechazar una hipótesis nula cuando es cierta.

Error Tipos I y II en un Contraste de Hipótesis

Si rechazamos una hipótesis cuando debiera ser aceptada, cometemos un error de tipo I, mientras que

si la aceptamos debiendo ser rechazada diremos que hemos cometido un error de tipo II. Minimizar

los errores no es una cuestión sencilla, un tipo suele ser más grave que otro y los intentos de disminuir

uno suelen producir el aumento del otro. La única forma de disminuir ambos a la vez es aumentar el

tamaño de la muestra.

Page 6: CONTRASTE DE HIPÓTESIS · Compuesta: si la hipótesis asigna un rango de valores a los parámetros poblacionales desconocidos No Paramétrica: es una afirmación sobre alguna característica

6

La probabilidad de cometer un error de tipo I es el nivel de significación , la probabilidad de

cometer un error de tipo II depende del verdadero valor de µ y del tamaño de la muestra.

Comprueba que la probabilidad de cometer un error de tipo II disminuye al aumentar el tamaño

de la muestra (n). Comprueba también lo que ocurre al variar la diferencia entre la media

hipotética de la población (µo) y la verdadera (µ).

El rechazo de una hipótesis nula cuando es cierta se denomina error de tipo I, y su probabilidad (que es

también el nivel de significancia) se simboliza como .

El hecho de que P sea muy bajo no califica el acontecimiento como imposible. Simplemente que tiene

poca probabilidad de ocurrir al azar. A la probabilidad de cometer error tipo I se la denomina nivel

de significación Habitualmente el investigador fija a priori el nivel de significación crítico para

rechazar Ho (). Si P es menor que , se rechaza. En caso contrario, se acepta Ho.

El hecho de aceptar una hipótesis nula cuando es falsa se denomina error de tipo II, y su probabilidad

se simboliza como . La probabilidad de cometer un tipo de error puede reducirse sólo si deseamos

incrementar la probabilidad de cometer el otro tipo de error. Con el propósito de obtener una baja,

tendremos que tolerar una alta. Los responsables de la toma de decisiones deciden el nivel de

significancia adecuado, al examinar los costos o desventajas vinculadas con ambos tipos de errores.

En realidad, puede asumir infinitos valores distintos de k. Si el verdadero valor de no dista

excesivamente del postulado en Ho, es posible aceptar ésta siendo falsa:

Como el valor observado

cae en el área de aceptación de Ho, no se rechaza la hipótesis. Sin embargo

el valor verdadero del parámetro es distinto de k. La probabilidad de cometer un error de tipo II

es . Al valor (1-) se le llama potencia de un test. El valor depende de y del valor alternativo que

se ponga para Cuanto menor sea , mayor será .La única forma de disminuir ambos errores, es

aumentar el tamaño de la muestra (n).

Las hipótesis nula y alternativa son aseveraciones sobre la población que compiten entre sí. O la

hipótesis nula H0 es verdadera, o lo es la hipótesis alternativa H1, pero no ambas. En el caso ideal, el

procedimiento de prueba de hipótesis debe conducir a la aceptación de H0 cuando sea verdadera y al

rechazo de H0 cuando H1 sea verdadera. Desafortunadamente no siempre son posibles las conclusiones

correctas. Como las pruebas de hipótesis se basan en información de muestra, debemos considerar la

posibilidad de errores.

Page 7: CONTRASTE DE HIPÓTESIS · Compuesta: si la hipótesis asigna un rango de valores a los parámetros poblacionales desconocidos No Paramétrica: es una afirmación sobre alguna característica

7

Situaciones posibles en un contraste de hipótesis

Condición de la población

H0 verdadera H1 verdadera

Aceptar H0 Conclusión correcta Error de tipo II

Rechazar H0 Error de tipo I Conclusión correcta

Esta tabla muestra los dos tipos de errores que se pueden cometer en la prueba de hipótesis. El primer

renglón muestra lo que puede suceder cuando la conclusión es aceptar H0. Si H0 es verdadera, esta

conclusión es correcta. Sin embargo, si H1 es verdadera, hemos cometido un error de tipo II, es decir,

hemos aceptado H0 siendo falsa. El segundo renglón muestra lo que puede suceder cuando la

conclusión es rechazar H0. Si H0 es verdadera, hemos cometido un error de tipo I, es decir, rechazar H0

cuando es verdadera. Sin embargo, si H1 es verdadera, es correcto rechazar H0.

Si bien no se puede eliminar la posibilidad de errores en la prueba de hipótesis, sí podemos considerar

la probabilidad de su ocurrencia. Se usa la siguiente notación estadística normal para indicar las

probabilidades de cometer esos errores:

= probabilidad de cometer un error de tipo I.

= probabilidad de cometer un error de tipo II.

Al realizar un contraste se puede cometer uno de los dos errores siguientes:

Error tipo I, se rechaza la hipótesis nula H0 cuando es cierta.

Error tipo II, se acepta la hipótesis nula H0 cuando es falsa.

Debe tenerse en cuenta que sólo se puede cometer uno de los dos tipos de error y, en la mayoría de las

situaciones, se desea controlar la probabilidad de cometer un error de tipo I. Se denomina nivel de

significación de un contraste a la probabilidad de cometer un error tipo I, se denota por y, por tanto,

).....(Re 00 ciertoesHHchazarP . Fijar el nivel de significación equivale a decidir de antemano la

probabilidad máxima que se está dispuesto a asumir para rechazar la hipótesis nula cuando es cierta. El

nivel de significación lo elige el experimentador y tiene por ello la ventaja de tomarlo tan pequeño

como desee (normalmente se toma = 0.10, 0.05 o 0.01)

Contraste de Hipótesis de Dos Colas (Bilateral) y de una Cola (Unilateral)

01

00

:

:

H

H

Un contraste de hipótesis dos colas, recibe el nombre de bilateral, debido a que rechazará la hipótesis

nula si la media de la muestra es significativamente mayor o menor que la media de la población

hipotetizada. En un contraste de este tipo, la región critica o de rechaza se separa en dos colas, con la

misma probabilidad en cada cola de la distribución del estadístico de contraste. Existen pues, dos

regiones de rechazo.

Hay situaciones en las que no es apropiada una prueba de dos extremos, por lo que debemos usar una

prueba de un extremo, que pueden ser de extremo izquierdo (o inferior) o extremo derecho (o superior).

En contrastes de hipótesis, tales como:

01

00

:

:

H

H o

01

00

:

:

H

H

Si la hipótesis alternativa es 01 : H la región critica o de rechazo debe encontrarse en la cola

superior (derecha) de la distribución del estadístico de contraste, mientras que si la hipótesis alternativa

es 01 : H la región crítica debe encontrarse en la cola inferior (izquierda) de la distribución. En

general, la desigualdad en la hipótesis alternativa apunta en la dirección de la región crítica.

Page 8: CONTRASTE DE HIPÓTESIS · Compuesta: si la hipótesis asigna un rango de valores a los parámetros poblacionales desconocidos No Paramétrica: es una afirmación sobre alguna característica

8

Al construir hipótesis, siempre se plantea la hipótesis nula como una igualdad, en H0 los signos siempre

deben ser: = (igual) o ≤ (menor o igual que) o ≥ (mayor o igual que), de modo que la probabilidad alfa del error tipo I pueda controlarse en valor especifico. La hipótesis alternativa puede ser unilateral

o bilateral, dependiendo de las conclusiones que ha de obtenerse si se rechaza 0H . Si el objetivo es

hacer una afirmación donde aparezcan proposiciones tales como mayor que, menor que, superior a,

excede a, al menos y otras similares, entonces la alternativa unilateral es la que resulta más apropiada.

Si la afirmación no implica ninguna dirección, o si es del tipo no es igual a, entonces debe utilizarse la

alternativa bilateral.

La Hipótesis nula siempre se refiere a un valor especificado del parámetro de la población (μx, σx, p),

no a una muestra estadística ),,( spSX .La declaración de la hipótesis nula siempre contiene una

igualdad (es decir, xH :0 ). La declaración de la hipótesis alternativa nunca contiene una

igualdad (es decir, xH :1 ).

Para decidir con relación a la hipótesis nula, se tiene que determinar primero el valor crítico para la

distribución estadística de interés: El valor critico separa la región de no rechazo de la de rechazo. Si la

prueba estadística cae en la región de no rechazo no se puede rechazar la hipótesis nula y se concluirá

que la cantidad promedio no proporciona evidencias estadística para rechazarla. Si cae en la región

de rechazo, se rechazara la hipótesis nula y la conclusión será que la media de la población no es igual

a la media de la muestra.

Formule la hipótesis en base a los objetivos del estudio, pero siempre antes de extraer la muestra y

calcular el estimador puntual del parámetro desconocido, para no verse influenciado por este resultado.

Tenga en cuenta que si bien la hipótesis nula es la que se pone bajo prueba, eso no significa que deba

ser siempre la suposición que el experimentador desea que se compruebe.

Como en todo proceso de inferencia, existe algún grado de subjetividad en la realización de una prueba,

particularmente en la elección del nivel de significancia y del tamaño de la muestra. Trate de que la

elección de estos valores responda a un análisis cuidadoso del problema en cuestión.

Una vez fijadas las condiciones de la prueba, el resultado de la misma es totalmente objetivo.

Para fijar el nivel de significancia de la prueba, hay que tener en cuenta que cuando la probabilidad del

error tipo I aumenta, la del error tipo II disminuye. La forma de minimizar el error tipo II

independientemente del nivel de significancia, es aumentando el tamaño de la muestra.

Como las probabilidades de los errores tipo I y II están relacionadas entre si, pero el experimentador

puede fijar la primera, antes de elegir el nivel de significancia hay que ver cuál de los dos tipos de

errores resulta más crítico.

OBSERVACIÓN IMPORTANTE

En ocasiones pueden surgir dudas en el planteamiento de cuál debe ser la hipótesis H0 y cuál la

hipótesis H1, en estos casos debemos tener presente las siguientes reglas:

Cuando el problema de manera expresa pide que se contraste una hipótesis con determinado nivel de

significación, la hipótesis que contrastamos es la hipótesis H0.

Cuando el problema pide explícitamente que seamos nosotros quienes planteemos las hipótesis, para

decidir qué poner en H0 y qué en H1, se pueden tener en cuenta las siguientes indicaciones:

En H1 siempre debemos colocar lo que realmente queremos investigar con seguridad, pues el error ,

el que fijamos de antemano, se comete cuando optamos por H1 y nos equivocamos.

En caso de duda, siempre elegir un contraste de hipótesis con dos colas, el cual se utiliza cuando lo que

interesa es una posible desviación en cualquiera dirección, a partir del valor hipotético de la media. La

fórmula que se utiliza para establecer los valores críticos de la media muestral )( VCX

es similar a

los que se utilizan para determinar los límites de confianza para estimar la media de una población,

excepto que el valor hipotético de la media poblacional (μ0, el verdadero valor de la media de la

Page 9: CONTRASTE DE HIPÓTESIS · Compuesta: si la hipótesis asigna un rango de valores a los parámetros poblacionales desconocidos No Paramétrica: es una afirmación sobre alguna característica

9

población) que estudiamos es el punto de referencia, y no la media muestral. Los valores críticos de la

media muestral para una prueba de dos colas, dependiendo de si se conoce , son:

n

SZXZSX

nZXZX

VCXVC

VCXVC

200

200

Cuando el planteamiento es muy claro se elige el contraste de hipótesis de una cola, este se aplica

cuando únicamente interesan las desviaciones de un solo sentido con respecto al valor hipotético de la

media; en las pruebas o contrastes de una sola cola existe una sola región de rechazo. Los valores

críticos para las pruebas de una sola cola son diferentes a los que se utilizan para las pruebas de dos

colas, porque la proporción dada de área total se encuentra en esa cola de la distribución. La fórmula

general para establecer el valor crítico de la media muestral para prueba de una cola. Dependiendo de

si se conoce o no es:

n

SZXZSX

nZXZX

VCXVC

VCXVC

00

00

La única forma de probar una hipótesis nula es conociendo el parámetro de población, y eso no es

posible al tomar una muestra. Por consiguiente, aceptamos la hipótesis nula y nos comportamos como

si fuera cierta, simplemente porque no podemos encontrar evidencia para rechazarla.

Valores Críticos de y Zonas de Rechazo

Los valores que se obtienen de la tabla Z son valores críticos que determinan las zonas de rechazo

en un contraste de hipótesis. Cuando se realiza un contraste o prueba de hipótesis con un nivel de

significancia de 95 % que es el área o Región de Aceptación (ver grafica A y A0), para encontrar la

zona de aceptación se divide por 2 el 95 %, en la tabla Z, el área de aceptación será 0.95/2 = 0.4750

que indica un valor de 96.1Z . El 5 % restante es la zona de rechazo o Región Critica (ver

grafica A y A0), está distribuida entre las dos colas de la distribución, la derecha y la izquierda, con 2.5

% para cada zona de rechazo. Este 5 % es el nivel de significación, o el valor alfa )( de la prueba.

Por lo tanto, si un valor de Z es mayor que 1.96 o menor que menos -1.96, no es probable que

0 , entonces, la hipótesis nula será rechazada.

Esos valores críticos de Z de 96.1 permiten establecer una Regla de Decisión que diga si se

rechaza la hipótesis nula o no. La regla de decisión sería:

Regla de Decisión: “No se rechaza la hipótesis Nula si los valores de Z están entre 96.1 . Se rechazan

si el valor Z es menor que menos -1.96 o mayor que +1.96”.

GRAFICA A

Una vez decidido qué tipo de discrepancias llevan a rechazar H0, (que dependerá sólo de si el contraste

es unilateral o bilateral) hay que determinar cuál es la discrepancia máxima admisible, lo que

dependerá de la distribución de la medida de discrepancia cuando es cierta H0. Llamaremos p-valor

del contraste, a la probabilidad de obtener una discrepancia mayor que la observada. Rechazaremos H0

cuando el p-valor sea pequeño (menor de 0,10, 0,05 o 0,01)

Page 10: CONTRASTE DE HIPÓTESIS · Compuesta: si la hipótesis asigna un rango de valores a los parámetros poblacionales desconocidos No Paramétrica: es una afirmación sobre alguna característica

10

Los valores más comunes para niveles de significación

Nivel de Significación 0,10 (90%) 0,05 (95%) 0,01(99%)

Valores críticos de z para una cola + 1,28 + 1,645 + 2,33

Valores críticos de z para dos colas + 1,65 + 1,96 + 2,58

Región de rechazo y aceptación de una hipótesis

La selección de un nivel de significación conduce a dividir en dos regiones el conjunto de posibles

valores del estadístico de contraste:

La región de Rechazo, con probabilidad

La región de Aceptación, con probabilidad bajo H0.

Si el estadístico de contraste toma un valor perteneciente a la región de aceptación, entonces no existen

evidencias suficientes para rechazar la hipótesis nula con un nivel de significación y el contraste se

dice que estadísticamente no es significativo. Si, por el contrario, el estadístico cae en la región de

rechazo entonces se asume que los datos no son compatibles con la hipótesis nula y se rechaza a un

nivel de significación. En este supuesto se dice que el contraste es estadísticamente significativo.

Según la forma de la región de rechazo, un contraste de hipótesis, paramétrico o no, se denomina:

Contraste unilateral o contraste de una cola es el contraste de hipótesis cuya región de rechazo está

formada por una cola de la distribución del estadístico de contraste, bajo H0, y puede ser por la derecha

o por la izquierda.

Contraste bilateral o contraste de dos colas es el contraste de hipótesis cuya región de rechazo está

formada por las dos colas de la distribución del estadístico de contraste, bajo H0.

GRAFICA B: Contraste unilateral o de una cola,

por la izquierda (H0: μ≥μ0, H1:μ<μ0 )

GRAFICA C: Contraste unilateral o de una cola

por la derecha (H1: μ μ0 o H1: μ < μ0 )

En la resolución de un problema de contraste o test de hipótesis ¿qué parámetro no se controla? El

error de tipo II. Se desconoce la probabilidad de aceptar la hipótesis nula cuando es falsa.

Obviamente existe una relación entre los tres parámetros, conocidos dos de ellos se puede obtener el

tercero:

n, tamaño muestral,

, probabilidad de error de tipo I,

Page 11: CONTRASTE DE HIPÓTESIS · Compuesta: si la hipótesis asigna un rango de valores a los parámetros poblacionales desconocidos No Paramétrica: es una afirmación sobre alguna característica

11

, Probabilidad de error de tipo II.

El contraste de hipótesis no establece la verdad de la hipótesis, sino un criterio que nos permite decidir

si una hipótesis se acepta o se rechaza, o el determinar si las muestras observadas difieren

significativamente de los resultados esperados. En este proceso podemos incurrir en dos tipos de

errores según sea la situación real y la decisión que tomemos.

REGIÓN CRÍTICA DE UN CONTRASTE DE HIPÓTESIS

Pruebas de hipótesis para diferentes Parámetros y Distribuciones

1.-Contraste de la media de una población normal con varianza σ2 conocida

Las suposiciones para esta prueba son mínimas. La población o distribución de interés tiene una media

μ y una varianza σ2, conocida. El estadístico de prueba se basa en la media muestral X , por lo que

también se supondrá que la población está distribuida de manera normal o que se aplican las

condiciones del teorema del límite central. Esto significa que la distribución de X es

aproximadamente normal con una media μ y una varianza σ2/n.

Desarrollo del procedimiento de prueba

Contraste bilateral

Hipótesis nula: 00 : H

Hipótesis alternativa: 01 : H

Donde μ0 es una constante especifica. El Estadístico de contraste es: n

XZc

0 en donde

,.... calculadoZAZc

n

i

iXn

X

1

1, siendo nXX ,...,1 una muestra de la población considerada

normal ),( N , varianza conocida y n = tamaño de la muestra. Puesto que X tiene una distribución

aproximadamente normal con media μ0 y una desviación n si la hipótesis nula es verdadera,

entonces puede conseguirse una región critica con en el valor calculado de la media muestral X . El

procedimiento de prueba para 00 : H utiliza el estadístico de prueba n

XZc

0 , si la

hipótesis nula 01 : H es verdadera, entonces 0)( XE , de donde se desprende que la

distribución Z es la distribución normal estándar. Por lo tanto, si 00 : H es cierta, la probabilidad

de que el estadístico de prueba Zc caiga entre .1........ 22 esZyZ Por lo tanto H0 debe

rechazarse si:

Estas dos desigualdades se conocen como Región Critica o Zonas de

Rechazo (ver grafica B). Siendo 2Z el valor de la abscisa de la normal N(0,1), además es un valor

que se encuentra en la tabla Z que deja a su derecha un área de probabilidad igual a 2/ .

Regla de Decisión: “No se rechaza la hipótesis Nula H0, si los valores de Zc se encuentran en el

intervalo 22 ZZZ c .” El área comprendida en esa desigualdad se le denomina Zona de

Aceptación o Región de Aceptación.

,.... 22 ZZoZZ cc

Page 12: CONTRASTE DE HIPÓTESIS · Compuesta: si la hipótesis asigna un rango de valores a los parámetros poblacionales desconocidos No Paramétrica: es una afirmación sobre alguna característica

12

Luego los valores críticos de la media muestral serán:

nZXVC 20

La fórmula estadística n

XZc

0 es un estadístico en la cual 0 es, por hipótesis, la media de la

población de la cual proviene la muestra. La razón de trabajar con unidades estándar, o valores de Z, es

que permite formular criterios que se pueden aplicar a una amplia variedad de problemas y no solo a

uno. Si se aproxima la distribución de muestreo de la media, con una distribución normal, se pueden

aplicar los criterios de prueba que se muestran en el siguiente cuadro simbolito, según la elección de la

hipótesis unilateral o bilateral. Una vez más, 2.... ZyZ son valores de Z tal que el área situada a

su derecha debajo de la distribución normal estándar es 2.... y .

CUADRO SIMBÓLICO

Hipótesis

alternativa

Rechazar la

hipótesis nula si

Aceptar la hipótesis nula

o reservarse el juicio Si

0 ZZ ZZ

0 ZZ ZZ

0

2

2

ZZ

o

ZZ

22 ZZZ

La prueba que se ha descrito es esencialmente con una muestra grande; esta solo se cumple cuando la

población que se muestrea tiene una distribución normal y N es mayor o igual a 30. De la misma

forma, como se desconoce σ en muchas aplicaciones prácticas, a menudo no se tiene otra opción que

hacer la aproximación adicional de sustituir este valor por la desviación típica S de la muestra.

EJEMPLO1: Se desea determinar, con base a la media X de una muestra aleatoria de tamaño 100, si

el gasto diario promedio en alimentos de familias de tres miembros de cierta escala de ingreso es de

850.0 Bs. A partir de información recolectada en otros estudios pertinentes, suponemos que la

variabilidad de esos gastos están dados por una desviación estándar de .0.122 Bs y se sabe que la

media de la muestra es de 878.0 Bs. El experimento se debe realizar con un nivel de significancia de

= 0.05.y 0.01 ¿A qué conclusiones se debe llegar?

SOLUCIÓN: Lo Primero que se debe realizar es plantearse las hipótesis:

0.850:

0.850:

1

0

H

H

El nivel de significancia de 0.05 por tabla se sabe qué 96.12 Z ; n = 100; 0.878X ;

0.8500 ; 0.122 , ahora se aplica la fórmula:

Regla de Decisión: “ Se rechaza la hipótesis Nula H0, si los valores de 22 .... ZZoZZ cc

es decir, 96.1....96.1 cc ZoZ .”

3.22.12

28

10122

28

100122

8508780

ZZn

XZ cc

Conclusión: Como cZ es mayor que 2Z , es decir, 96.13.2 cZ , se rechaza 0.850:0 H y

se concluye que el gasto en alimentos diario en promedio de las familias en estudio no es igual a 850.0

Bs. Por ser la diferencia entre la media X observada y el valor hipotético de μ es demasiado grande

Page 13: CONTRASTE DE HIPÓTESIS · Compuesta: si la hipótesis asigna un rango de valores a los parámetros poblacionales desconocidos No Paramétrica: es una afirmación sobre alguna característica

13

para atribuirse a la casualidad. Tomando e n cuenta los datos, pareciera que el gasto promedio diario

en alimentación de esas familias es superior a 850.0 Bs. Esto se puede observar en la grafica B1 en

donde Zc = 2.30 cae fuera del área de aceptación por lo tanto no se acepta que 850

¿Qué ocurriría si se hubiese utilizado un nivel de significancia de = 0.01 en vez de 0.05? Esta

interrogante se le deja a los estudiantes para que la realicen y saquen sus conclusiones.

EJEMPLO 2: Los sistemas de escape de emergencia para aviones son impulsados por un combustible

sólido. Una de las características importantes de este producto es la rapidez de combustión. Las

especificaciones requieren que la rapidez promedio de combustión sea de 50 cm/s. Se sabe que la

desviación estándar de esa rapidez es de ./.2 scm El experimentador decide especificar un nivel

de significancia, de = 0.05. Selecciona una muestra aleatoria de n = 25 y obtiene una rapidez

promedio muestral de combustión de ./..3.51 scmX ¿A qué conclusión debe legar?

SOLUCIÓN: El parámetro de interés es μ, la rapidez promedio de combustión.

scmH

scmH

/..50:

/..50:

1

0

Por tabla se sabe qué 96,12 Z ; n = 25; σ = 2 cm/s; scmyscmX /..50...../..3.51 0 .

Regla de Decisión: “ Se rechaza la hipótesis Nula H0, si los valores de 22 .... ZZoZZ cc

es decir, 96.1....96.1 cc ZoZ .”

Ahora se aplica la fórmula para estandarizar los valores así:

25.352

3.1

252

503.510

n

XZc

Conclusión: Como cZ es mayor que 2Z , es decir, 96.125.3 cZ , se rechaza 50:0 H con

un nivel de significancia de 0.05. De hecho, se observa una evidencia fuerte de que la rapidez

promedio de combustión es mayor que 50 cm/s. Esto se puede observar en la gráfica B1 en donde

Zc = 3.25 cae fuera del área de aceptación por lo tanto no se acepta que 50 .

¿Qué ocurriría si se hubiese utilizado un nivel de significancia de = 0.01 en vez de 0.05? Esta

interrogante se les deja a los estudiantes para que la realicen y saquen sus conclusiones.

Si el mismo problema se resuelve ahora desarrollándose un procedimiento para la prueba de

hipótesis μ, donde la hipótesis alternativa sea unilateral por la derecha se tendría lo siguiente:

EJEMPLO 3: Los sistemas de escape de emergencia para aviones son impulsados por un combustible

sólido. Una de las características importantes de este producto es la rapidez de combustión. Las

especificaciones requieren que la rapidez promedio de combustión sea de 50 cm/s. Se sabe que la

desviación estándar de esa rapidez es de ./.2 scm El experimentador decide especificar un nivel

de significancia, de = 0.05. Selecciona una muestra aleatoria de n = 25 y obtiene una rapidez

promedio muestral de combustión de ./..3.51 scmX ¿A qué conclusión debe llegarse?

SOLUCIÓN: El parámetro de interés es μ, la rapidez promedio de combustión.

scmH

scmH

/..50:

/..50:

1

0

Por tabla se sabe que para pruebas de una sola cola 645,1Z ; n = 25; σ = 2 cm/s;

scmyscmX /..50...../..3.51 0 .

Regla de Decisión: “ Se rechaza la hipótesis Nula H0, si el valor de ZZc , es decir, 645,1cZ .”

Ahora se aplica la fórmula para estandarizar los valores así:

Page 14: CONTRASTE DE HIPÓTESIS · Compuesta: si la hipótesis asigna un rango de valores a los parámetros poblacionales desconocidos No Paramétrica: es una afirmación sobre alguna característica

14

25.352

3.1

252

503.510

n

XZ

Conclusión: Como cZ es mayor que Z , es decir, 645,125.3 cZ , se rechaza 50:0 H con

un nivel de significancia de 0.05. De hecho, se observa una evidencia fuerte de que la rapidez

promedio de combustión es mayor que 50 cm/s. Esto se puede observar en la gráfica B1 en donde

Zc = 3.25 cae fuera del área de aceptación por lo tanto no se acepta que 50 .

Se le deja al estudiante que realice el mismo problema pero con una prueba unilateral por la

izquierda, es decir, utilizando las siguientes hipótesis: 0100 :.....,.: HyH .

EJEMPLO 4: La duración media de una muestra de 100 bombillos fluorescentes producidos por la

compañía General Electric resulta ser 1570 horas, con una desviación estándar de 120 horas. Si μ es la

duración media de todos los tubos producidos por la compañía, compruebe la hipótesis 1600:0 H

horas contra la hipótesis 1600:1 H horas con un nivel de significancia de a) 0.01, b) 0.05.

SOLUCIÓN: Como ya están planteadas las hipótesis para un contraste bilateral se determina por tabla

los valores de Z al 0.01, donde 58.22 Z .

Datos: .100;..120,..1570,..16000 nSX

Hipótesis:

horasH

horasH

..1600:

..1600:

1

00

Regla de Decisión o Región Critica: “ Se rechaza la hipótesis Nula H0, si los valores de

22 .... ZZoZZ cc es decir, 58.2....58.2 cc ZoZ .”

Ahora se aplica la fórmula n

XZc

0 para estandarizar los valores:

50.212

30

10120

30

100120

160015700

cc Zn

XZ

Conclusión: Como Zc calculado es mayor que 2Z , es decir, 58.250.2 cZ , se Acepta

horasH ..1600:0 con un nivel de significancia de 0.01. De hecho, se observa que 50.2cZ se

encuentra en el área de aceptación 58.258.2 cZ (ver gráfico D).

Se le deja al estudiante que realice el mismo problema pero utilizando un nivel de significación de

0.05.

Es importante destacar que cuando se desconoce σ en muchas aplicaciones prácticas, a menudo no se

tiene otra opción que hacer la aproximación adicional de sustituir este valor por las desviaciones

estándar S de la muestra siempre y cuando la muestra sea mayor o igual a 30, y luego se procede a

resolver el problema como si se conociera, es decir, σ = S.

1. Contraste de la media de una población normal con varianza σ2 desconocida y

muestra pequeña

Cuando no se conoce el valor de la desviación estándar σ de la población y la muestra es pequeña, es

decir, N<30, se debe suponer que la población a partir de la cual se realiza el muestreo tiene más o

menos una forma de una distribución normal y en este caso se utilizará la distribución t de Student.

La distribución t apropiada tiene n – 1 grado de libertad. En la toma de decisiones el estadístico de

contraste es, nS

Xtc

0 .

Page 15: CONTRASTE DE HIPÓTESIS · Compuesta: si la hipótesis asigna un rango de valores a los parámetros poblacionales desconocidos No Paramétrica: es una afirmación sobre alguna característica

15

Suponga que tiene disponible una muestra aleatoria de tamaño n, x1, x2, ….xn, y sea 2.... SyX la media

y la varianza muestral, respectivamente. Se desea probar la hipótesis alternativa bilateral o de dos colas

(ver grafica A)

Hipótesis:

01

00

:

:

H

H

El estadístico utilizado para el contraste es

nS

Xtc

0 . Donde tc es el valor de t calculado.

Regla de decisión o Región Critica: Se rechaza la Hipótesis nula si: 1,21,2 ...... ncnc ttott .

GRAFICA 1A - Contraste bilateral o de dos colas

.

Cuando el contraste de Hipótesis es de una sola cola por la derecha se tiene (ver

grafica I):

Hipótesis:

oH

H

:

:

1

00

El estadístico utilizado para el contraste es

nS

Xtc

0 .

Regla de decisión o Región Crítica: Se rechaza la Hipótesis nula si: 1, nc tt .

Grafica I: Contraste de una cola, por la derecha

(H1: μ μ0 o H1: μ > μ0)

Page 16: CONTRASTE DE HIPÓTESIS · Compuesta: si la hipótesis asigna un rango de valores a los parámetros poblacionales desconocidos No Paramétrica: es una afirmación sobre alguna característica

16

Cuando el planteamiento es de un contraste de una sola cola por la Izquierda se

tiene: Hipótesis:

oH

H

:

:

1

00

El estadístico utilizado para el contraste es

nS

Xtc

0 .

Regla de decisión o Región Crítica: Se rechaza la Hipótesis nula sí 1, nc tt .

EJEMPLO 1: Supongamos que se desea demostrar, sobre la base de una muestra aleatoria de tamaño

6, si el peso promedio de los caballos de un grupo grande del Hipódromo de la Rinconada es mayor de

500 kg. Sabiendo que el peso promedio de los caballos de la muestra mencionada es de 533 kg con una

desviación típica de 41.6 kg. ¿Qué se puede concluir utilizando un nivel de significancia de : a) 0.05, b)

0.01.

Datos: 6;..6.41;..533,..5000 nSX

Hipótesis:

?500:

500:

1

0

H

H

EJEMPLO 2: Un industrial de la pólvora elabora un nuevo tipo del producto con la finalidad de

conseguir con ese nuevo producto una velocidad de salida de los proyectiles de 3000 m/s. Se tomó una

muestra de ocho proyectiles elaborados con la nueva pólvora y se logró una velocidad promedio de

salida igual a 2958,75 m/s, con una desviación típica S = 39.26 m/s. El industrial desea saber si en

realidad su producto tiene una velocidad de salida promedio igual 3000 m/s, utilizando para ello un

nivel de significancia de a) 0.01, b) 0.05.

SOLUCIÓN: Lo primero que se hace es ordenar los datos y luego plantearse las hipótesis.

Datos: 26.39;...75.2958,...30000 SX . Se utilizará un contraste bilateral, para ello se busca en la

tabla el valor de t con 7 grados de libertad y con un nivel de significancia de 0.01, entonces se tiene que

499,37,2 glt .

Hipótesis:

3000:

3000:

1

0

H

H

Page 17: CONTRASTE DE HIPÓTESIS · Compuesta: si la hipótesis asigna un rango de valores a los parámetros poblacionales desconocidos No Paramétrica: es una afirmación sobre alguna característica

17

Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si: 7,2...,...7,2 glcoglc tttt ,

es decir, 499,3.....499,3 cc tot .

Aplicando la formula siguiente se tiene:

.97.287.13

25.41

83.226.39

25.41

826.39

300075.29580

cc tnS

Xt

Conclusión: Como ct calculado es mayor que 7,2 glt , es decir, 499,397.2 ct , se Acepta

3000:0 H con un nivel de significancia de 0.01. De hecho, se observa que 50.2cZ se

encuentra en el área de aceptación 499,3499,3 cZ (ver gráfico D).

Se le deja al estudiante que realice el mismo problema pero utilizando un nivel de significación de

0.05. Saque sus conclusiones.

EJEMPLO 3: La vida útil promedio de los focos marca general electric especial para vehículos es

cuando menos de 4200 horas. La vida útil promedio para una muestra aleatoria de n = 10 focos es de

4000X horas, con una desviación típica muestral de S = 200 horas. Se supone que la vida útil de

los focos siguen una distribución normal. El fabricante desea hacer un contraste de hipótesis con un

nivel de significancia de: a) 5 % b) 1 %.¿Cuál seria la conclusión?

SOLUCIÓN: Se ordenan los datos: .10,..200,..4200,..4000 0 nSX Para un contraste de

hipótesis de una sola cola por la izquierda con 7 grados de libertad y un nivel de de significancia de

0.05, la tabla de 833,19, glt .

Hipótesis:

4200:

4200:

1

0

H

H

Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si: 9, glc tt , es decir,

833,1ct .

Aplicando la formula siguiente se tiene:

.16.329.63

200

16.3200

200

10200

420040000

cc tnS

Xt

Conclusión: Como ct calculado es menor que 9, g lt , es decir, 833,116.3 ct , se rechaza

4200:0 H con un nivel de significancia de 0.05. De hecho, se observa que 833,116.3 ct

se encuentra en el área de rechaza (ver gráfico C). Se concluye que la vida útil de los focos tiene un

promedio inferior a 4200 horas.

Se le deja al estudiante que realice el mismo problema pero utilizando un nivel de significación de

0.01. Saque sus conclusiones.

PRUEBAS DE LA DIFERENCIA ENTRE DOS MEDIAS UTILIZANDO LA

DISTRIBUCIÓN NORMAL Existen variedades de problemas estadísticos en los que se deben decidir si una diferencia observada

entre dos medias muestrales se pueden atribuir a la casualidad. Por ejemplo, se desea saber si hay en

realidad una diferencia en el consumo de gasolina promedio de dos tipos de automóviles, si datos de

muestras indican que un tipo de auto promedia un consumo de un litro por cada 13 Km., mientas

que, con las mismas condiciones otro tipo de automóvil dio un promedio de un litro cada 15 Km. De la

misma forma, a lo mejor nos interesa saber con base a muestras si hay en realidad una diferencia en la

magnitud de cuentas atrasadas en dos sucursales de una tienda por departamentos, si los hombres

pueden realizar una tarea más rápida que las mujeres, si una marca de televisor es más duradera que

otra, etc.

Page 18: CONTRASTE DE HIPÓTESIS · Compuesta: si la hipótesis asigna un rango de valores a los parámetros poblacionales desconocidos No Paramétrica: es una afirmación sobre alguna característica

18

El método que se utiliza para demostrar si una diferencia observada entre dos medias muestrales se

puede atribuir a la casualidad se basa en la siguiente teoría: si 21 .... XyX son las medias de dos

muestras aleatorias independientes de tamaños 21 .... nyn , la distribución de muestreo de los

estadísticos 21 .... XyX se pueden calcular con bastante aproximación con una curva normal que tenga

media 21 y desviación estándar igual a 2

22

1

21

nn

donde 2121 ....,, y son las medias y

las desviaciones típicas de las dos poblaciones de donde provinieron las dos muestras, entonces el

estadístico para la prueba de hipótesis será

2

22

1

21

21 )(

nn

XXZc

. En la mayoría de los casos prácticos

21 .... y son incógnitas, pero si se utilizan muestras grandes que sean mayores o iguales a 30 se

pueden utilizar las desviaciones estándar 21 .... SyS de las muestras como estimaciones de 21 .... y , y

basar la prueba de hipótesis nula 021 en el estadístico

2

22

1

21

21 )(

n

S

n

S

XXZc

que se aproxima

bastante a la distribución normal estándar.

EJEMPLO 1: El salario promedio semanal para una muestra de 301 n empleados de la empresa

petrolera Lasmo es de 2800001 X Bs., con una desviación típica muestral de 140001 S Bs. En

otra empresa petrolera grande, una muestra aleatoria de 402 n empleados tiene un salario promedio

semanal de 2700002 X Bs., con una desviación estándar muestral de 100002 S Bs. Se prueba la

hipótesis de que no existe diferencia entre los salarios promedio semanal de las dos empresas,

utilizando un nivel de significancia de: a) 5 %, b) 1 %.

SOLUCIÓN: Lo primero que se hará será ordenar los datos y luego determinar el valor 2Z al 5%,

de la tabla.

Datos:

96.1..........

10000..........................................14000

270000......................................280000

40.................................................30

2.............................................1..

2

21

21

21

Zdetablas egunvalorEl

SS

XX

nn

Mues tr aMues tr a

Hipótesis:

211

210

:

:

H

H

Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si 22 ...... ZZoZZ cc , es

decir, 96.1........96.1 cc ZoZ .

Aplicando la formula siguiente se tiene:

2

22

1

21

21 )(

nn

XXZc

33.3

56.3005

10000

40

)10000(

30

)14000(

270000280000)(

22

2

22

1

21

21

cZ

n

S

n

S

XX

Page 19: CONTRASTE DE HIPÓTESIS · Compuesta: si la hipótesis asigna un rango de valores a los parámetros poblacionales desconocidos No Paramétrica: es una afirmación sobre alguna característica

19

Conclusión: Como cZ es mayor que 2Z , es decir, 96.133.3 cZ , se rechaza 210 : H con

un nivel de significancia de 0.05. Esto se puede observar en la gráfica 1B en donde 33.3cZ cae

fuera del área de aceptación, por lo tanto, los salarios promedios semanales de las dos empresas

petroleras son diferentes.

Se le deja al estudiante que realice el mismo problema pero utilizando un nivel de significación de

0.01. Saque sus conclusiones.

EJEMPLO 2: Se realizó una prueba de Estadística II en las secciones 1 y 2 de IUTJAA las cuales

estaban integradas por 40 y 50 estudiantes respectivamente. En la sección 1 los estudiantes obtuvieron

una puntuación promedio de 74 puntos con una desviación estándar de 8, mientras que en la sección 2

los estudiantes alcanzaron una puntuación promedio 78 puntos con una desviación estándar de 7

puntos. Se desea saber si hay una diferencia significativa entre el resultado obtenido por las dos

secciones utilizando para ello un nivel de significación de: a) 1 %, b) 5 %. ¿Cuáles son sus

conclusiones?

SOLUCIÓN: Se supone que las dos poblaciones tienen medias respectivas 21 ..... y . Se organizan

los datos y se determina Z de la tabla para un nivel de significancia de 0.01.

58.2..%..1..............

7...................................................8

78...............................................74

50..................................................40

2...............................................1...

2

21

21

21

ZesalZdetablas egunvalorEl

SS

XX

nn

Mues tr aMues tr a

Hipótesis:

211

210

:

:

H

H

Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si: 22 ...... ZZoZZ cc , es

decir, 58.2........58.2 cc ZoZ .

Aplicando la formula siguiente se tiene:

2

22

1

21

21 )(

nn

XXZc

48.2

61.1

4

98.06.1

4

50

7

40

8

7874)(

22

2

22

1

21

21

cZ

n

S

n

S

XX

Conclusión: Como cZ es mayor que 2Z , es decir, 58.248.2 cZ , se acepta 210 : H con

un nivel de significancia de 0.01. Esto se puede observar en la grafica D en donde 48.2cZ cae

dentro del área de aceptación, por lo tanto, las puntuaciones promedios obtenidos en la prueba de las

dos secciones de Estadística II no hay diferencias significativas entre ambas, por lo tanta 21 .

Se le deja al estudiante que realice el mismo problema pero utilizando un nivel de significación de

0.01. Saque sus conclusiones.

EJEMPLO 3: Las horas extras promedio laboradas en el 2000 por 50 obreros de una petrolera de la

región fue de 68.2 horas con una desviación estándar de 2.5 horas, mientras que 50 obreros de la misma

petrolera en el 2001 tenían un promedio de horas extras laboradas igual a 67.5 horas con una

desviación tipita de 2.8 horas. El Gerente de Recursos Humanos de la empresa mantiene que el

promedio de horas extras laboradas por los obreros de la empresa en el 2000 es más alto que el

promedio de horas extras laboradas por los obreros en el 2001, para ello se utiliza un nivel de

significancia de: a) 0.05, b) 0.01. ¿Cuál es la conclusión?

Page 20: CONTRASTE DE HIPÓTESIS · Compuesta: si la hipótesis asigna un rango de valores a los parámetros poblacionales desconocidos No Paramétrica: es una afirmación sobre alguna característica

20

SOLUCIÓN: Se supone que las dos poblaciones tienen medias respectivas 21 ..... y . Se organizan

los datos y se determina Z de la tabla para un nivel de significancia de 0.05 de una cola por la derecha.

645,1........%..5..............

8.2..................................................5.2

5.67...............................................2.68

50..................................................50

2...............................................1...

21

21

21

Zescolas oladealZdetablas egunvalorEl

SS

XX

nn

Mues tr aMues tr a

Hipótesis:

211

210

:

:

H

H

Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si: ZZc , es decir, 645,1cZ .

Aplicando la formula siguiente se tiene:

2

22

1

21

21 )(

nn

XXZc

32.1

53.0

7.0

50

)8.2(

50

)5.2(

5.672.68)(

22

2

22

1

21

21

cZ

n

S

n

S

XX

Conclusión: Como cZ es menor que Z , es decir, 645,132.1 cZ , se acepta 210 : H con un

nivel de significancia de 0.05. Esto se puede observar en la grafica A en donde 32.1cZ cae

dentro del área de aceptación, por lo tanto, las horas extras promedios laboradas por los obreros en el

2000 no presentan diferencias significativas con respecto a las laboradas en 2001, por lo tanta

21 .

Se le deja al estudiante que realice el mismo problema pero utilizando un nivel de significación de

0.01. Saque sus conclusiones.

EJEMPLO 4: El salario promedio semanal para una muestra de 301 n empleados de la empresa

petrolera SINCOL es de 2800001 X Bs., con una desviación típica muestral de 140001 S Bs..

En otra empresa petrolera grande denominada ROMICA, una muestra aleatoria de 402 n empleados

tiene un salario promedio semanal de 2700002 X Bs., con una desviación estándar muestral de

100002 S Bs. El analista de sueldos de la empresa SINCOL considera que el salario promedio de

los trabajadores de su empresa son mayores que los salarios promedios de la empresa ROMICA y por

tal motivo plantea una hipótesis nula de que el salario promedio de SINCOL es igual o menor que el

de la empresa ROMICA. Para en contrate de hipótesis se utiliza un nivel de significancia de 1 %.

SOLUCIÓN: Lo primero que se hará será ordenar los datos y luego determinar el valor Z al 5% de

una cola por la derecha lo cual se encuentra en la tabla.

Datos:

33.2.................%..1..........

10000..........................................14000

270000......................................280000

40.................................................30

2.............................................1..

21

21

21

Zesder echalaporcolaunadeZdealtablas egunvalorEl

SS

XX

nn

Mues tr aMues tr a

Hipótesis:

211

210

:

:

H

H

Page 21: CONTRASTE DE HIPÓTESIS · Compuesta: si la hipótesis asigna un rango de valores a los parámetros poblacionales desconocidos No Paramétrica: es una afirmación sobre alguna característica

21

Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si ZZc , es decir, 33.2cZ .

Aplicando la formula siguiente se tiene:

2

22

1

21

21 )(

nn

XXZc

33.3

56.3005

10000

40

)10000(

30

)14000(

270000280000)(

22

2

22

1

21

21

cZ

n

S

n

S

XX

Conclusión: Como cZ es mayor que Z , es decir, 33.233.3 cZ , se rechaza 210 : H con un

nivel de significancia de 0.01. Esto se puede observar en la gráfica B1 en donde 33.3cZ cae

fuera del área de aceptación, por lo tanto, los salarios promedios semanales de la empresa petrolera

SINCOL es mayor que los salarios promedios de la empresa ROMICA.

EJEMPLO 5: Se realizó un pesaje en los alumnos del tercer semestre de Administración en las

secciones I y II del IUTJAA los cuales estaban integradas por 40 y 50 estudiantes respectivamente. En

la sección I los estudiantes obtuvieron un pesaje promedio de 74 Kg. con una desviación estándar de 8

Kg., mientras que en la sección II los estudiantes alcanzaron un a pesaje promedio de 78 Kg. con una

desviación estándar de 7 Kg. Se desea saber si hay una diferencia significativa entre el resultado

promedio obtenido del pesaje en las dos secciones, para ello se utilizará un nivel de significación de a)

1 %, b) 5 %. ¿Cuáles son sus conclusiones?

SOLUCIÓN: Se supone que las dos poblaciones tienen medias respectivas 21 ..... y . Se organizan

los datos y se determina Z de la tabla para un nivel de significancia de 0.01.

58.2..%..1..............

7...................................................8

78...............................................74

50..................................................40

2...............................................1...

2

21

21

21

ZesalZdetablas egunvalorEl

SS

XX

nn

Mues tr aMues tr a

Hipótesis:

211

210

:

:

H

H

Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si: 22 ...... ZZoZZ cc es

decir, 58.2........58.2 cc ZoZ .

Aplicando la formula siguiente se tiene:

2

22

1

21

21 )(

nn

XXZc

48.2

61.1

4

98.06.1

4

50

7

40

8

7874)(

22

2

22

1

21

21

cZ

n

S

n

S

XX

Conclusión: Como cZ es mayor que 2Z , es decir, 58.248.2 cZ , se acepta 210 : H con

un nivel de significancia de 0.01. Esto se puede observar en la gráfica D en donde 48.2cZ cae

dentro del área de aceptación, por lo tanto, las pesajes promedios obtenidos en las dos secciones de

Administración indican no hay diferencias significativas entre ambas, por lo tanto 21 .

Se le deja al estudiante que realice el mismo problema pero utilizando un nivel de significación de

0.01. Saque sus conclusiones.

Page 22: CONTRASTE DE HIPÓTESIS · Compuesta: si la hipótesis asigna un rango de valores a los parámetros poblacionales desconocidos No Paramétrica: es una afirmación sobre alguna característica

22

CONTRASTE DE HIPÓTESIS RELACIONADAS CON PROPORCIONES

Las pruebas de hipótesis con proporciones son necesarias en muchas áreas del conocimiento y en

especial en la administración. Se considerará el problema de probar la hipótesis de que la proporción de

éxito en un experimento binomial sea igual a un cierto valor especifico. Es decir, se probará la

hipótesis nula de que p = p0, donde p es el parámetro de la distribución binomial. La información de

que suele disponerse para la estimación de una porción real o verdadera (porcentaje o probabilidad) es

una proporción muestral n

x, donde x es el número de veces que ha ocurrido un evento en n ensayos.

Por ejemplo, si una muestra aleatoria de 600 compras realizadas en una tienda y 300 se realizan con

tarjeta de crédito, entonces 50.0600

300

n

x se puede utilizar esa cifra como estimación de punto de la

proporción real de compras realizadas en ese negocio que se abonaron a tarjetas de crédito. De la

misma forma muchas compañías podrían estimar las proporciones de muchas transacciones. La

hipótesis alterna puede ser una de las alternativas usuales unilateral o bilateral tales

como: 000 ..,.., ppopppp .

El proceso de prueba de hipótesis para la proporción poblacional p es muy similar al de μ. Un valor Zc

calculado a partir de la muestra se compara con un valor crítico de Z dados en las tablas. Zc se obtiene

así:

n

qp

ppZc

.

. O también se puede utilizar:

npq

npxZ

EJEMPLO 1: Se afirma que, de todas las familias que salen de Cumana por lo menos el 30 % se

mudan a Maracaibo. Si una muestra de 600 mudanzas tomada al azar de los registros de la Alcaldía de

Cumana revela que de los permisos de mudanza autorizados 153 fueron para Maracaibo, pruebe la

hipótesis nula p = 0.30 contra la hipótesis alternativa p < 30 con un nivel de significancia del 1 %.

SOLUCIÓN: Para calcular la proporción p lo primero que se ha de hacer es determinar la proporción,

luego se plantea una hipótesis unilateral con un nivel de significancia al 1%.

.153,.33.2,..70.0,..30.0,..255.0600

153,..800 xZqppn

Hipótesis:

30.0:

30.0:

1

0

pH

pH

Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si: ZZ c es decir, 33.2cZ .

Aplicando formula se tiene:

O también Aplicando:

41.20187.0

045.0

00035.0

045.0

600

7.03.0

300.0255.0

.

cc Z

x

n

qp

ppZ

41.2225,11

27

126

180153

)70.0)(30.0(600

)30.0(600153

npq

npxZ

Conclusión: Como cZ es menor que Z , es decir, 33.241.2 cZ , se rechaza 30.0:0 pH con

un nivel de significancia de 0.01. Esto se puede observar en la grafica D en donde 41.2cZ cae

fuera del área de aceptación, por lo tanto, se cumple que 30.0:1 pH , es decir, menos del 30 % de

las familias que salen de Cumana, se mudan a Maracaibo.

Page 23: CONTRASTE DE HIPÓTESIS · Compuesta: si la hipótesis asigna un rango de valores a los parámetros poblacionales desconocidos No Paramétrica: es una afirmación sobre alguna característica

23

EJEMPLO 2: Se sabe que el 10 % de los fumadores prefieren la marca de cigarrillo Malboro. Después

de una campaña publicitaria del cigarrillo Malboro, se entrevistaron a 200 fumadores para determinar

la eficiencia de la campaña publicitaria. El resultado de la muestra realizada detecto un total de 26

personas que fumaban Malboro. ¿Pueden considerarse que esos datos presentan evidencia suficiente

para indicar que hubo un aumento en la aceptación del cigarrillo Malboro. Obtenga las conclusiones

del planteamiento desarrollando un contraste de hipótesis con un nivel de significancia del 5 %.

SOLUCIÓN: Para resolver el problema se plantea una hipótesis altenativa unilateral por la derecha.

Por tabla se sabe que al 5 % por la derecha 645,1Z .

Datos: 200,..13.0200

26......90.0,..10.0 npqp

.

Hipótesis:

10.0:

10.0:

1

0

pH

pH

Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si ZZc ,es decir, 645,1cZ .

Aplicando formula se tiene:

41.102127.0

03.0

00045.0

03.0

200

9.01.0

10.013.0

.

cc Z

x

n

qp

ppZ

Conclusión: Como cZ es menor que Z , es decir, 96.141.1 cZ , se acepta 10.0:0 pH con un

nivel de significancia de 0.05. Esto se puede observar en la gráfica A en donde 41.1cZ cae

dentro del área de aceptación, por lo tanto, el 10 % de los fumadores prefieren Malboro, lo que indica

que la campaña publicitaria no fue efectiva ya que de haberlo sido se hubiese aceptado la hipótesis

.10.0:1 pH

Se recomienda al estudiante que aplique la otra fórmula para solucionar el problema.

EJEMPLO 3: Un fabricante de semiconductores produce controladores que se emplean en el sistema

eléctrico de vehículos. El cliente requiere que la proporción de controladores defectuosos no sea mayor

de 0.05, y que el fabricante demuestre estas características del proceso de fabricación con este nivel de

calidad, con un nivel de significancia del 5 %. El fabricante de semiconductores toma una muestra

aleatoria de 200 dispositivos y encuentra que 4 de ellos son defectuosos. ¿El fabricante puede

demostrar al cliente la calidad exigida? Saque sus conclusiones.

SOLUCIÓN: para resolver el problema hay que plantear una hipótesis alternativa unilateral de una

cola por la izquierda es decir, p< 0.05 y para ello se busca en la tabla el valor de

645,1....,.. ZesqueZ .

Datos: .200,02.02004,95.0,05.0 npqp

Hipótesis:

05.0:

05.0:

1

0

pH

pH

Regla de decisión o Región crítica: Se rechaza la Hipótesis nula sí ZZ c ,es decir, 645,1cZ .

Aplicando formula se tiene:

95.10154.0

03.0

0002375.0

03.0

200

95.005.0

05.002.0

.

cc Z

x

n

qp

ppZ

Page 24: CONTRASTE DE HIPÓTESIS · Compuesta: si la hipótesis asigna un rango de valores a los parámetros poblacionales desconocidos No Paramétrica: es una afirmación sobre alguna característica

24

Conclusión: Como cZ es menor que Z , es decir, 645,195.1 cZ , se rechaza 05.0:0 pH

con un nivel de significancia de 0.05. Esto se puede observar en la gráfica A en donde 95.1cZ

cae fuera del área de aceptación, por lo tanto, 05.0:1 pH se acepta y se concluye que la proporción

de artículos defectuosos es menor del 5 %, como quería el cliente.

Se recomienda al estudiante que aplique la otra fórmula para solucionar el problema.

EJEMPLO 4: Se ha afirmado que por lo menos el 60 % de los alumnos de primero y segundo

semestre de un Tecnológico prefieren estudiar a partir de las dos de la madrugada. Si 4 de una muestra

de alumnos de primero y segundo semestre de n =14 tomadas al azar, afirman estudiar a partir de las

dos de la madrugada, pruebe con un nivel de significancia del 5 % si se debe aceptar la hipótesis nula

60.0p contra la hipótesis alternativa 60.0p .

Datos: .05.0........,..14,..14,..40.0,..60.0 alciasignificandenivelxnqp

SOLUCIÓN: Por tabla al 0.05 de significancia se sabe que la hipótesis alternativa unilateral por la

izquierda es 645,1Z .

Hipótesis:

60.0:

60.0:

1

0

pH

pH

Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si ZZ c ,es decir, 645,1cZ .

Aplicando formula se tiene:

40.2833,1

4.4

36.3

40.84

)40.0)(60.0(14

)60.0(144

npq

npxZ

Conclusión: Como cZ es menor que Z , es decir, 645,140.2 cZ , se rechaza 60.0:0 pH

con un nivel de significancia de 0.05. Esto se puede observar en la grafica A en donde 40.2cZ

cae fuera del área de aceptación, por lo tanto, 60.0:1 pH se acepta y se concluye que la proporción

de estudiantes del primero y segundo semestre que prefieren estudiar a partir de las dos de la

madrugada es menor del 60 %.

Se recomienda al estudiante que aplique la otra fórmula para solucionar el problema.

DIFERENCIA ENTRE PROPORCIONES

Existen variedad de problemas en los que se debe decidir si la diferencia observada entre dos

proporciones muestrales se pueden atribuir a la casualidad o si es indicativo del hecho de que las dos

proporciones de la población correspondientes son desiguales. Por ejemplo, se quisiera decidir,

tomando en cuenta los datos de una muestra, si una publicidad determinada produciría en realidad una

diferencia de respuesta con respecto a otra, ese es una de las muchas interrogantes con que se enfrenta

un administrador hoy en día.

Problemas como el antes mencionado se pueden tratar como un problema de contraste de hipótesis del

tipo:

211

210

:

:

ppH

ppH

En donde 21 .... pyp son las dos proporciones de poblaciones de la característica analizada. Si se

señala con 21 .... NyN el tamaño de las muestras y 21 .... pyp como las proporciones obtenidas de las

muestras, entonces la variable que se debe emplear para resolver este tipo de problemas es la diferencia

de proporciones muestrales. Es decir, 21 pp , este planteamiento al igual que en el caso de la media,

se reduce a conocer si la diferencia de las proporciones de la muestra 21 pp es lo suficientemente

grande como para suponer que en realidad existe una diferencia entre 21 .... pyp . El método que se

Page 25: CONTRASTE DE HIPÓTESIS · Compuesta: si la hipótesis asigna un rango de valores a los parámetros poblacionales desconocidos No Paramétrica: es una afirmación sobre alguna característica

25

aplicara para demostrar si una diferencia observada entre dos proporciones de las muestras se puede

atribuir a la casualidad o si es estadísticamente significativa, se basa en la siguiente teoría: Si 21 .... xyx

son los números de aciertos obtenidos en n1 ensayos de un tipo y n2 de otro, donde todos los ensayos

son independientes, y las probabilidades correspondientes de alcanzar un acierto son

21 .... pyp ,entonces la distribución de muestreo de

2

2

1

1

n

x

n

x tiene una media 21 pp .

Afortunadamente, basándonos en el teorema del límite central que expresa que 21 pp posee una

distribución normal o aproximadamente normal con un promedio igual a la diferencia de proporción

de población, es decir 21 pp y con una desviación estándar, llamada error estándar de la

diferencia entre dos proporciones, igual a 2

22

1

1122

2121 n

qp

n

qppppp se debe expresar

que cuando no se conozca 21 .... pnip , que es lo que por lo general ocurre, se deben estimar sus

valores por medio de los valores de las muestras; aunque los valores poblacionales sean desconocidos,

se supondrán iguales bajo la hipótesis nula planteada, es decir 210 : ppH por consiguiente si el

valor común se indica por p, el error estándar será

21

11

21 nnpqpp donde p suele estimarse

mediante la combinación de los datos; o sea, al sustituir p por las proporciones de la muestra

combinada de

21

21

nn

xx

.

El estadístico para calcular la diferencia entre proporciones es:

ques etieneEntoncespn

xp

n

xy

nn

xxpdonde

nnpp

n

x

n

x

Zc ......,........,..11

)1(

22

21

1

1

21

21

21

2

2

1

1

21

21

11

nnpq

ppZc

EJEMPLO 1: En un proceso de producción de botellas de vidrio se tomó una muestra de 400 de las

cuales 28 estaban defectuosas, en otro proceso se tomaran 300 muestra de botellas de la cuales 15

estaban defectuosas. Demuestre la hipótesis nula 21 pp de que los dos procesos generan

proporciones iguales de unidades defectuosas, contra la hipótesis alternativa 21 pp con un nivel de

significancia de 0.05.

Datos:

96.1...............05.0..........

939.01,......061.0700

43

300400

1528

15....................................................28

05.0300

15.....................................07.0

400

28

300..................................................400

2..Pr.........................................1..Pr

22

21

21

21

Zesbilater alaalter nativhipotes isunapar aalZdevalorEl

pqp

xx

pp

nn

opor cionopor cion

SOLUCIÓN: Para resolver este problema se plantearán las hipótesis y luego se aplica la formula.

Page 26: CONTRASTE DE HIPÓTESIS · Compuesta: si la hipótesis asigna un rango de valores a los parámetros poblacionales desconocidos No Paramétrica: es una afirmación sobre alguna característica

26

Hipótesis:

211

210

:

:

ppH

ppH

Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si 22 .... ZZoZZ cc ,es

decir, 96.1......96.1 cc ZoZ .

Aplicando formula se tiene:

09.1

0183.0

02.0

003334.0

02.0

300

1

400

1)939.0)(061.0(

05.007.0

11

21

21

cc Z

nnpq

ppZ

Conclusión: Como cZ es menor que 2Z , es decir, 96.109.1 cZ , se acepta 210 : ppH con

un nivel de significancia de 0.05. Esto se puede observar en la gráfica A en donde 09.1cZ cae

dentro del área de aceptación, por lo tanto, no se puede concluir que exista diferencias reales entre las

dos proporciones verdaderas de unidades defectuosas.

EJEMPLO 2: Un fabricante de productos medicinales está probando dos nuevos compuestos

destinados a reducir los niveles de presión sanguínea los compuestos son suministrados a dos conjuntos

diferentes de animales de laboratorio. En el grupo A, 71 de 100 animales probados respondieron al

medicamento A con niveles menores de presión arterial. En el grupo B, de 90 animales 58 respondieron

al medicamento B con menores niveles de presión sanguínea. El fabricante desea probar a un nivel de

significancia de 0.05 si existe una diferencia entre la eficiencia de las dos medicinas. ¿De qué manera

se debe proceder en este caso?

SOLUCIÓN: Se plantean las hipótesis, se ordenan los datos y en la tabla se busca el valor de 2Z al

5 % para una hipótesis alternativa bilateral que según la tabla tienen un valor de 96.12 Z . Se

plantean las reglas de decisión y finalmente se aplica la formula para el caso. Datos:

96.1...............05.0..........

3211.01,......6789.0190

129

90100

5871

58....................................................71

644.090

58.....................................71.0

100

71

90..................................................100

..Pr...........................................Pr

22

21

21

21

Zesbilater alaalter nativhipotes isunapar aalZdevalorEl

pqp

xx

pp

nn

Bopor cionAopor cion

Hipótesis:

211

210

:

:

ppH

ppH

Regla de decisión o Región crítica: Se rechaza la Hipótesis nula sí 22 .... ZZoZZ cc ,es

decir, 96.1......96.1 cc ZoZ .

Aplicando fórmula se tiene:

Page 27: CONTRASTE DE HIPÓTESIS · Compuesta: si la hipótesis asigna un rango de valores a los parámetros poblacionales desconocidos No Paramétrica: es una afirmación sobre alguna característica

27

973.00678.0

066.0

0046.0

066.0

90

1

100

1)3211.0(6789.0(

644.071.0

11

21

21

cc Z

nnpq

ppZ

Conclusión: Como cZ es menor que 2Z , es decir, 96.1973.0 cZ , se acepta 210 : ppH con

un nivel de significancia de 0.05. Esto se puede observar en la gráfica A en donde 973.0cZ cae

dentro del área de aceptación, por lo tanto, se puede concluir que no exista diferencias significativas

reales entre las dos medicamentos lo que indica que los dos medicamentos producen efecto en la

presión sanguínea que son significativamente iguales.

EJEMPLO 3: En un sondeo de opinión en el IUTJAA, 60 de 200 estudiantes del sexo masculino han

expresado su disgusto sobre la forma de dirigir el tren directivo la institución, de la misma forma han

opinado 75 de 300 alumnos del sexo femenino. Se quiere saber si existe una diferencia real de

opinión entre los alumnos y las alumnas del IUTJAA. Para realizar el contraste de hipótesis de las

proporciones utilice un nivel de significancia de 0.10.

SOLUCIÓN: Se plantean las hipótesis, se ordenan los datos y en la tabla se busca el valor de 2Z al

5 % para una hipótesis alternativa bilateral que según la tabla tienen un valor de 96.12 Z . Se

plantean las reglas de decisión y finalmente se aplica la fórmula para el caso. Datos:

28.1...............10.0..........

73.01,......27.0500

135

300200

7560

25.0300

75.....................................30.0

200

60

75....................................................60

300..................................................200

2..Pr.........................................1..Pr

22

21

21

21

Zesbilater alaalter nativhipotes isunapar aalZdevalorEl

pqp

pp

xx

nn

opor cionopor cion

Hipótesis:

211

210

:

:

ppH

ppH

Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si 22 .... ZZoZZ cc ,es

decir, 96.1......96.1 cc ZoZ .

Aplicando formula se tiene:

.24.1

04045.0

05.0

001636.0

05.0

300

1

200

1)73.0)(27.0(

25.030.0

11

21

21

cc Z

nnpq

ppZ

Conclusión: Como cZ es menor que 2Z , es decir, 28.124.1 cZ , se acepta 210 : ppH con un

nivel de significancia de 0.10. Esto se puede observar en la gráfica B en donde 24.1cZ cae

dentro del área de aceptación, por lo tanto, se puede concluir que no exista diferencias significativas

reales entre las dos opiniones emitidas por los alumnos y alumnas lo que indica que los dos opiniones

están en concordancia de que los directivos están dirigiendo mal a la institución.

EJEMPLO 4: En el Departamento de Agropecuaria del IUTJAA se investiga si cierto tipo de

fertilizante es efectivo. Para ello se deja sin fertilizar 100 plantas de tomate y de esas, 52 plantas tienen

un crecimiento satisfactorio. De la misma forma se fertilizaron 400 plantas, y se detectó que 275

Page 28: CONTRASTE DE HIPÓTESIS · Compuesta: si la hipótesis asigna un rango de valores a los parámetros poblacionales desconocidos No Paramétrica: es una afirmación sobre alguna característica

28

presentaron un crecimiento satisfactorio. ¿Qué conclusión pueden obtener los investigadores del

Departamento de Agropecuaria si para contrastar la hipótesis utilizan un nivel de significancia de 0.05?

SOLUCIÓN: Se plantean las hipótesis la cual tendría como hipótesis alternativa 211 : ppH ; luego

se ordenan los datos y en la tabla se busca el valor de 2Z al 5 % para una hipótesis alternativa

bilateral. Se plantean las reglas de decisión y finalmente se aplica la fórmula para el caso.

Datos:

96.1...............05.0..........

346.01,......654.0500

327

400100

27552

6875.0400

275....................................52.0

100

52

275....................................................52

400..................................................100

2..Pr.........................................1..Pr

22

21

21

21

Zesbilater alaalter nativhipotes isunapar aalZdevalorEl

pqp

pp

xx

nn

opor cionopor cion

Hipótesis:

211

210

:

:

ppH

ppH

Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si 22 .... ZZoZZ cc ,es

decir, 96.1......96.1 cc ZoZ .

Aplicando formula se tiene:

.19.3

0533.0

17.0

0028.0

1675.0

400

1

100

1)346.0)(654.0(

6875.052.0

11

21

21

cc Z

nnpq

ppZ

Conclusión: Como cZ es menor que 2Z , es decir, 96.119.3 cZ , se recaza 210 : ppH

con un nivel de significancia de 0.05. Esto se puede observar en la gráfica B en donde 19.3cZ

cae fuera del área de aceptación, por lo tanto, 211 : ppH se puede concluir que exista diferencias

significativas reales entre el crecimiento de las plantas, por lo que hay razones para creer que el

fertilizante sea realmente efectivo.