universidad central del ecuador modalidad a …
TRANSCRIPT
UNIVERSIDAD CENTRAL DEL ECUADOR
FACULTAD DE CIENCIAS ADMINISTRATIVAS
MODALIDAD A DISTANCIA
SEMESTRE MARZO - AGOSTO 2017
UNIDAD DIDÁCTICA
ESTADISTICA APLICADA
Nivel: 6
Número de créditos: 5
TUTOR:
Econ. Héctor Cumbal Flores
Quito - Ecuador
pág. 2
INDICE
INTRODUCCIÓN ................................................................................................................................... 4
Caracterización de la materia ............................................................................................................... 4
Competencias a lograr: ......................................................................................................................... 4
Bibliografía básica ................................................................................................................................... 6
Orientaciones generales............................................................................................................................ 7
PRIMERA PARTE DE LA UNIDAD DIDÁCTICA. ......................................................................... 8
I. UNIDAD: Prueba de hipótesis para una muestra ............................................................................. 9
1.1 Conceptos principales .............................................................................................................. 9
1.2 Que es una prueba de hipótesis, procedimiento y tipos de pruebas de hipótesis .................. 10
1.3 Prueba de hipótesis para una media poblacional, con una desviación estándar poblacional
conocida (muestras grandes) .............................................................................................................. 17
1.4 Prueba de hipótesis para una media poblacional, con una desviación estándar poblacional
desconocida (muestras grandes) ......................................................................................................... 19
1.5 Prueba de hipótesis para una media poblacional, con una desviación estándar poblacional
desconocida (muestras pequeñas) ...................................................................................................... 21
1.6 Pruebas de hipótesis para una proporción (muestras grandes) ............................................... 22
II. UNIDAD: Prueba de hipótesis para dos muestras ......................................................................... 25
2.1 Conceptos principales ............................................................................................................ 25
2.2 Prueba de hipótesis: diferencia de dos medias poblacionales (muestras grandes) ................. 26
2.3 Pruebas de hipótesis: diferencia de dos relaciones proporcionales ........................................ 28
2.4 Pruebas de hipótesis: diferencia de dos medias poblacionales (muestras pequeñas) ............. 29
2.5 Prueba de hipótesis con muestras dependientes (muestras pequeñas) ................................... 31
2.6 Comparación de muestras dependientes e independientes ..................................................... 33
SEGUNDA PARTE DE LA UNIDAD DIDACTICA ........................................................................... 34
III. UNIDAD: Análisis de varianza .................................................................................................. 35
3.1 Conceptos principales ............................................................................................................ 35
3.2 Comparación de dos varianzas poblacionales ........................................................................ 36
3.3 Suposiciones Anova ............................................................................................................... 38
3.4 Prueba Anova en una dirección .............................................................................................. 38
3.5 Inferencias acerca de pares de valores medios de tratamiento ............................................... 41
3.6 Análisis de varianza en dos direcciones ................................................................................. 44
IV. UNIDAD: Métodos no paramétricos ......................................................................................... 48
4.1 Introducción. .......................................................................................................................... 48
pág. 3
4.2 Prueba de bondad de ajuste. Frecuencias esperadas iguales. ................................................. 49
4.3 Prueba de bondad de ajuste. Frecuencias esperadas desiguales. ............................................ 51
4.4 Pruebas de independencia (tablas de contingencia) ............................................................... 52
V. UNIDAD: Control estadístico de calidad ....................................................................................... 55
5.1 Conceptos principales ............................................................................................................ 55
5.2 Diagramas de diagnóstico ...................................................................................................... 56
5.3 Diagrama de Pareto ................................................................................................................ 57
5.4 Diagramas de control de calidad ............................................................................................ 58
5.4.1 Diagrama de control para variables ................................................................................ 58
5.4.2 Diagrama de atributos .................................................................................................... 61
pág. 4
INTRODUCCIÓN
Caracterización de la materia.
Continuando con el estudio de la Estadística Inferencial; la asignatura de Estadística
Aplicada se enfoca en el estudio de las diferentes pruebas de hipótesis y finalmente culmina
con el estudio del Control Estadístico de Calidad.
Competencias a lograr:
Competencia genérica:
1. Interpreta y resuelve problemas de la realidad aplicando métodos de la investigación,
métodos propios de las ciencias, herramientas tecnológicas y variadas fuentes de
información científica, técnica y cultural con ética profesional, trabajo equipo y
respeto a la propiedad intelectual.
2. Demuestra en su accionar profesional valores universales y propios de la profesión en
diversos escenarios organizacionales y tecnológicos, fomentando el desarrollo de las
ciencias, las artes, el respeto a la diversidad cultural y equidad de género.
Competencias específicas:
1. Desarrolla el pensamiento lógico, independiente, crítico y creativo en la aplicación de
los conocimientos.
pág. 5
2. Propende a dar respuesta a las necesidades de la vida diaria dentro de la sociedad
actual, aplicando métodos de investigación, herramientas tecnológicas y estadísticas
con diversas fuentes de información; mostrando además liderazgo en el trabajo grupal.
3. Desarrolla habilidades para el análisis e interpretación de los resultados obtenidos con
la ayuda de las herramientas de la estadística descriptiva y la teoría de las
probabilidades.
Resumen de competencias por unidad
Unidades Competencias
UNIDAD No. 1
Prueba de hipótesis
para una muestra
Poder usar las muestras para decidir si una población posee una
característica particular.
UNIDAD No. 2
Prueba de hipótesis
para dos muestras
Presentar un segundo método para obtener inferencias acerca de
parámetros poblacionales, probando hipótesis respecto a sus
valores.
UNIDAD NO. 3
Análisis de Varianza
Ampliar el análisis para la comparación de cualquier número de
medias poblacionales, usando la técnica llamada Análisis de
Varianza.
UNIDAD No. 4
Métodos no
paramétricos.
Aplicaciones de la JI
cuadrada
Usar métodos para probar hipótesis acerca de las probabilidades de
las categorías; y (como aplicación particular) probar la equivalencia
de más de dos proporciones binomiales
pág. 6
UNIDAD No. 5
Control Estadístico de
la Calidad
Conocer algunas técnicas muy útiles que se usan en la industria para
controlar y mejorar la calidad de los productos manufacturados,
además se mostrará cómo pueden utilizarse algunas de estas
técnicas para el mejoramiento de la calidad de sistemas de
administración
Bibliografía básica
NOMBRE: Estadística Aplicada a los Negocios y Economía.
AUTORES: LIND / MARCHAL / WATHEN
EDICIÓN: 15ª Edición. EDITORIAL: McGrawHill. AÑO: 2012
Bibliografía adicional
Kazmier, ESTADISTICA APLICADA A LA ADMINISTRACION Y LA ECONOMIA,
Colección Schaum.
Shao, Stephen, ESTADISTICA PARA ECONOMISTAS Y ADMINISTRADORES DE
EMPRESAS.
Spiegel, Murray, ESTADISTICA, Colección Schaum.
Spiegel, Murray, PROBABILIDAD Y ESTADISTICA, Colección Schaum.
Stevenson, William, ESTADISTICA PARA ADMINISTRACION Y ECONOMICA.
Toranzo, Fausto, ESTADISTICA.
Ya Lung Chou, ANALISIS ESTADISTICO.
Andrango, Carrillo, ESTADISTICA BASICA Y APLICADA, SEGUNDA EDICION, QUITO
ECUADOR
pág. 7
Orientaciones generales
Importancia en la formación profesional
En la mayoría de los trabajos investigativos la parte medular es plantear una hipótesis y
probar si esta se acepta o se rechaza. Usualmente la población es tan grande que no es viable
estudiarla en su totalidad, por lo que se tiene que seleccionar una muestra representativa de
esta para ponerla a prueba y determinar si un enunciado es una afirmación razonable.
El Control Estadístico de la Calidad es un grupo de estrategias, técnicas y acciones de
una organización para asegurar que se está proporcionando un servicio de calidad o
produciendo un producto de calidad.
Relaciones con otras materias del plan
La Estadística Aplicada se relaciona directamente con las disciplinas de Investigación,
Investigación de Mercados, Administración de la Producción y Gestión de la calidad.
pág. 8
PRIMERA PARTE DE LA UNIDAD DIDÁCTICA.
La primera parte de esta unidad didáctica está compuesta por dos unidades: La unidad
uno que inicia el estudio de las pruebas de hipótesis; aquí aprenderemos a realizar pruebas
tanto para muestras grandes como pequeñas.
En la unidad dos, se continúa con el estudio de las pruebas de hipótesis para dos
muestras, tanto para medias como para las proporciones.
Objetivos de la primera parte
Al finalizar el estudio de esta primera parte estará en capacidad de aplicar la prueba de
hipótesis, tanto para una muestra como para dos muestras en los diferentes campos de la
administración.
pág. 9
I. UNIDAD: Prueba de hipótesis para una muestra
Competencias
El estudiante estará en capacidad de:
• Definir qué es una hipótesis y que es una prueba de hipótesis.
• Conocer acerca del procedimiento de 5 pasos para demostrar una Hipótesis.
• Distinguir entre una prueba de hipótesis con una o dos colas.
• Realizar una prueba de hipótesis para una media poblacional
• Utilizar el valor p.
• Definir nivel de significación, error tipo I y tipo II, valores críticos.
Contenidos
1.1 Conceptos principales
1.2 Que es una prueba de hipótesis procedimiento y casos de pruebas de hipótesis
1.3 Prueba de hipótesis para una media poblacional, con una desviación estándar poblacional
conocida (muestras grandes)
1.4 Prueba de hipótesis para una media poblacional, con una desviación estándar poblacional
desconocida (muestras grandes)
1.5 Prueba de hipótesis para una proporción (muestras grandes)
1.1 Conceptos principales
Hipótesis estadística. - es una proposición o supuesto sobre los parámetros de una o más
poblaciones.
Hipótesis nula (Ho). - Afirmación o enunciado acerca del valor de un parámetro (población).
pág. 10
Hipótesis alternativa (H1). - Afirmación que se acepta si los datos muestrales proporcionan
evidencia de que la hipótesis nula es falsa.
Nivel de significancia. - Es la probabilidad de rechazar la hipótesis nula cuando en realidad es
verdadera.
Error tipo I (α). - Rechazar la hipótesis nula (Ho) siendo verdadera.
Error tipo II (β). - Aceptar la hipótesis nula (Ho) siendo esta falsa.
Valor estadístico de prueba. - Valor obtenido a partir de la información muestral, que se
utiliza para determinar si se rechaza la hipótesis nula.
Valor Crítico. - Número que es el punto divisorio entre la región de aceptación y la región de
rechazo, de la hipótesis nula (Ho).
1.2 Que es una prueba de hipótesis, procedimiento y tipos de pruebas de hipótesis
Una prueba de hipótesis empieza con una afirmación, o suposición, sobre un parámetro de la
población, como la media poblacional. Esta afirmación recibe el nombre de hipótesis. Una
hipótesis puede ser que la edad media de los profesores de la Universidad, es de 45 años,
como puede resultar muy oneroso o demorado estudiar a la población de profesores para
asegurarnos su edad real, se procede a probar esta afirmación en base al análisis de una
muestra de la población de profesores, para ello, se determina el valor de la media muestral
(estadístico muestral) y en base a ciertas reglas de decisión se acepta o rechaza la hipótesis.
Una media muestral de 20 años de los profesores causaría con certeza el rechazo de la
hipótesis. Sin embargo, suponga que la media de la muestra es de 44 años ¿Está lo bastante
cerca de 45 para aceptar la suposición de que la media de la población es de 45? ¿La
diferencia de 1 año entre las dos medias se podría atribuir al error de muestreo, o dicha
pág. 11
diferencia resulta estadísticamente significativa? Por tanto, una prueba de hipótesis es un
procedimiento basado en la evidencia muestral y en la teoría de la probabilidad, que se emplea
para determinar si la hipótesis es un enunciado razonable. La decisión a la que se llegue, tanto
si se acepta como si se rechaza la hipótesis puede conllevar a cometer un error. Los errores
que pueden cometerse en una prueba de hipótesis se presentan en los siguientes casos:
Hipótesis nula Se acepta Se rechaza
Verdadera Correcto Error Tipo I
Falsa Error tipo II Correcto
La hipótesis formulada con intención de rechazarla se llama hipótesis nula y se
representa por (H0). Rechazar H0 implica aceptar una hipótesis alternativa (H1).
Esto significa que lo que queremos probar debemos formularlo como hipótesis alternativa H1,
y como hipótesis nula H0 poner su contrario para de esta forma al rechazar la H0, probar la
valides de la hipótesis alternativa.
Para realizar una prueba de hipótesis se sigue un procedimiento de 5 pasos:
a. Plantear la hipótesis nula (Ho) y la hipótesis alternativa (H1)
Es el paso más importante y de este depende el éxito de la prueba. Se pueden presentar tres
casos:
Primer caso
Prueba de dos colas
Segundo caso
Prueba de una cola
Tercer caso
Prueba de una cola
Ho: = x
H1: x
Ho: x
H1: < x
Ho: x
H1: > x
Nota: La condición de igualdad siempre aparece en Ho, nunca en H1
pág. 12
b. Seleccionar el nivel de significancia (α)
Se denota mediante la letra griega alfa (α). Se le llama también “nivel de riesgo”, por el
riesgo de rechazar la Hipótesis Nula cuando en realidad es verdadera. Hay tres niveles de
significancia que son los más utilizados:
α = 0.01 para control de calidad,
α = 0.05 para proyectos de consumo.
α = 0.1 para encuestas.
c. Calcular el valor estadístico de prueba
En muestras grandes (n ≥ 30) se utiliza la “Z” de la distribución Normal.
En muestras pequeñas (n < 30) se utiliza la “t” de la distribución de Student.
d. Formular la Regla de Decisión
Una regla de decisión es el enunciado de las condiciones según las cuales se aceptará o
rechazará la hipótesis nula.
Los valores de Z se encuentran en el Apéndice B1 del texto guía, (Áreas bajo la curva normal.)
Los valores de t se encuentran en el Apéndice B2 del texto guía, (Distribución t de Student,
siendo necesario establecer los grados de libertad n – 1 para una muestra).
Para poder formular la regla de decisión se debe remitir al paso 1 y 2.
pág. 13
A continuación, se revisará cada uno de los casos de una prueba de hipótesis:
Primer caso. - Prueba de dos colas
Ho: µ = x
H1: µ ≠ x
α = 0.01
Es una prueba de dos colas ya que la media muestral puede ser mayor o menor que la media
poblacional en consecuencia hay que encontrar dos valores críticos, a partir de los cuales se
pude rechazar la hipótesis nula; por este motivo, al nivel de significancia hay que dividirlo
para dos: α= 0.01/2 = 0,005
Rechazo Ho Acepto Ho Rechazo Ho
0,005 0,495 0,495 0,005
VC = -2.58 VC = 2,58
El valor crítico se busca en el apéndice B1: el área más próxima a 0,495 corresponde a Z igual
a 2,58
La regla de decisión se plantea de la siguiente manera:
Segundo caso. - Prueba de una cola
Ho: µ ≥ x
Si Z < -2,58 o Z > 2,58 se rechaza la Ho y se acepta la H1
pág. 14
H1: µ < x
α = 0.10
Es una prueba de una cola y la región de rechazo de Ho se ubica en el sentido que indique el
vértice de la desigualdad de H1.
En este caso (H1: µ < x) este vértice apunta a la izquierda por lo que se debe ubicar la región
de rechazo en el lado izquierdo de la distribución.
Rechazo Ho acepto Ho
0,10 0,40 0,50
VC = -1.28
El valor crítico se busca en el apéndice B1: el área más próxima a 0,40 corresponde a Z igual a
1,28 (como el valor está por debajo de la media lo acompañamos con el signo menos)
La regla de decisión se plantea de la siguiente manera:
Tercer caso. - Prueba de una cola
Ho: x
H1: > x
α = 0.05
Si Z < -1,28 se rechaza la Ho y se acepta la H1
pág. 15
Es una prueba de una cola y la región de rechazo de Ho se ubica en el sentido que indique el
vértice de la desigualdad de H1.
En este caso (H1: > x) este vértice apunta a la derecha, por lo que hay que ubicar la región de
rechazo en el lado derecho de la distribución.
Acepto Ho Rechazo Ho
0,50 0,45 0,05
VC = 1,65
El valor crítico se busca en el apéndice B1, el área más próxima a 0,45 corresponde a Z de
1,65.
La regla de decisión se plantea de la siguiente manera:
e. Tomar la decisión
Para tomar la decisión debes comparar el valor obtenido en el paso tres (valor de Z o t
calculado a partir de la muestra) con la regla de decisión formulada en el paso cuatro.
Para el cálculo del valor crítico en una muestra pequeña (n < 30) se sigue el mismo
procedimiento anterior, con la diferencia que el valor crítico no se lo calcula con la
Distribución Normal, sino con la Distribución t de Student, por consiguiente, tiene
que considerar los grados de libertad (n - 1).
Si Z > 1,65 se rechaza Ho y se acepta la H1
pág. 16
Por ejemplo, si:
• En el paso 3, Z = 2,60
• En el paso 4, la regla: Si Z > 1,65 se rechaza Ho y se acepta H1
Entonces la decisión se plantea de la siguiente manera:
Valor de p (Potencia)
Se utiliza el valor p, que es la probabilidad de observar un valor muestral tan extremo o más,
que el valor calculado, dado que la hipótesis nula es verdadera.
Por ejemplo
• La regla de decisión es: Si Z > 2,58 se rechaza Ho y se acepta H1
• El valor calculado de Z es igual a 1.55
• En este caso no se rechazaría Ho.
• Para Z=1.55 el área es 0.439, entonces p = 0.500 – 0.439 = 0.061
• Para el caso de dos colas se considerará p/2, por lo que se deberá duplicar el valor
encontrado para determinar el valor de p.
• Si el valor de p es menor que el nivel de significancia (α), se rechaza Ho, si es mayor
que dicho nivel, no se rechaza Ho.
Para interpretar el valor de p se establece que:
Si el valor de p es menor que:
0.10, se tiene regular evidencia de que Ho no es verdadera.
Como 2,60 > 1,65 se rechaza Ho y se acepta H1
pág. 17
0.05, se tiene fuerte evidencia de que Ho no es verdadera.
0.01, se tiene muy fuerte evidencia de que Ho no es verdadera.
0.001, se tiene evidencia extremadamente fuerte de que Ho no es verdadera
En el caso de t, por ejemplo, si α = 0.02 y tenemos 11 grados de libertad y el valor calculado
es 2.91, entonces según la hilera “11 grados de libertad” del Apéndice B2…
g.l 0.20 0.10 0.05 0.02 0.01 0.001
11 1.363 1.796 2.201 2.718 3.106 4.437
…el valor calculado 2.91 está entre 2.718 para α = 0.02 y 3.106 para α = 0.01
El valor de p se encuentra entre 0.01 y 0.02, por lo que p es menor que 0.02.
1.3 Prueba de hipótesis para una media poblacional, con una desviación estándar
poblacional conocida (muestras grandes)
Para esta prueba se debe seguir los cinco pasos descritos anteriormente y como valor
estadístico de prueba (paso tres) se utiliza la siguiente fórmula:
n
XZ
/
Ejemplo 1
De acuerdo con la asociación de plomeros de Quito, el ingreso medio anual de los plomeros
tiene una distribución normal, con una media de $5000 y una desviación estándar de $420.
pág. 18
Una investigación en una muestra de 100 plomeros encontró que el ingreso medio anual era de
$5100. Al nivel de significancia de 0.10, ¿se puede concluir que el ingreso medio anual no es
igual a $5000? Determine el valor de p
Datos: µ =5000; σ =420; n=100; X = 5100
Primer Paso: Plantear las hipótesis (ver la pregunta del ejercicio y plantear en H1)
Ho: µ = 5000
H1: µ ≠ 5000
Prueba de 2 colas
Segundo Paso: Nivel de significancia 0,10
Tercer Paso: Valor estadístico de prueba
38,2100/420
50005100
Z
Cuarto Paso: Plantear la regla de decisión
α = 0.10/2 = 0,05
Rechazo Ho Acepto Ho Rechazo Ho
0,05 0,4500 0,4500 0,05
VC = -1,65 VC = 1,65
Si Z <- 1,65 o si Z>1,65 se rechaza la Ho y se acepta la H1
pág. 19
Quito Paso: Tomar la decisión
Valor de p
Rechazo Ho Acepto Ho Valor de p
0,4913
VC = -1,65 VC = 1,65 2,38
El área de Z=2,38 es 0,4913
p = 0.5000 - 0,4913 = 0,0087
Como es una prueba de dos colas hay que multiplicar por 2
p = 0,0087 x 2 = 0,0174
1.4 Prueba de hipótesis para una media poblacional, con una desviación estándar
poblacional desconocida (muestras grandes)
Para esta prueba debe seguir los cinco pasos descritos anteriormente y como valor estadístico de
prueba (paso tres) se utiliza la siguiente formula
ns
xZ
/
Ejemplo 2
Una empresa de bienes raíces de Guayaquil, se especializa en la venta de propiedades rurales.
Sus registros indican que el tiempo medio de venta de una granja es de 90 días. Debido a
recientes condiciones de sequía, estima que el tiempo de venta medio será ahora mayor de 90
días.
Como Z (2,38) > 1,65 se rechaza la Ho y se acepta la H1
pág. 20
Un estudio de 100 granjas vendidas recientemente reveló que el tiempo de venta medio era de
94 días, con una desviación estándar de 22 días. Al nivel de significancia de 0.10 ¿Se puede
concluir que el tiempo de venta ha aumentado? Determine el valor de p.
Datos: =90; n=100; X = 94; S=22
Primer Paso: Plantear la hipótesis (ver la pregunta del ejercicio)
Ho: 90
H1: > 90
Prueba de 1 cola
Segundo Paso: Nivel de significancia 0,10
Tercer Paso: Valor estadístico de prueba
82,1100/22
9094
Z
Cuarto Paso: Plantear la regla de decisión
Acepto Ho Rechazo Ho
0,400 0,10
VC = 1,28
Quito Paso: Tomar la decisión
Si Z >1,28 se rechaza la Ho y se acepta la H1
Como Z (1,82) > 1,28 se rechaza la Ho y se acepta la H1
pág. 21
Valor de p
Acepto Ho Valor de p
0,4656
0
VC = 1,28 1,82
El área de Z=1,82 es 0,4656
p = 0.5000 – 0.4656 = 0.0344
1.5 Prueba de hipótesis para una media poblacional, con una desviación estándar
poblacional desconocida (muestras pequeñas)
Para esta prueba se debe seguir los cinco pasos descritos anteriormente y como valor estadístico
de prueba (paso tres) se utiliza la siguiente formula
ns
xt
/
Ejemplo 3
El fabricante de la motocicleta Yamaha anuncia que su vehículo rinde en promedio 87
kilómetros por galón en viajes largos. El recorrido en kilómetros en ocho viajes prolongados
fue:
Al nivel de 0.05, ¿el kilometraje medio es menor que el anunciado?
Datos: = 87; n = 8; X = 83; S = 4.34
Del conjunto de datos debe calcular la media y la desviación estándar.
Primer Paso: Plantear la hipótesis (ver la pregunta del ejercicio)
88 82 81 87 80 78 79 89
pág. 22
Ho: 87
H1: < 87
Prueba de 1 cola
Segundo Paso: Nivel de significancia 0,05
Tercer Paso: Valor estadístico de prueba
61,28/34,4
8783
t
Cuarto Paso: Plantear la regla de decisión. (Apéndice B2)
Α = 0,05 y gl = n-1 = 8-1 = 7
Rechazo Ho Acepto Ho
VC = -1,895
Quito Paso: Tomar la decisión
1.6 Pruebas de hipótesis para una proporción (muestras grandes)
Con alguna frecuencia se desea hacer una estimación de la proporción de sujetos que componen
una población y poseen una característica de interés (variable cualitativa).
Si t < -1,895 se rechaza la Ho y se acepta la H1
Como t (-2,61) < -1,895 se rechaza la Ho y se acepta la H1
pág. 23
Generalmente, no es práctico examinar una población entera para determinar “”, proporción
verdadera que posee la característica de interés.
En lugar de esto, se toma una muestra aleatoria de la población y se utiliza la proporción
muestral “p”, para hacer una estimación de .
La fórmula para calcular una proporción muestral es: p = x / n
Para esta prueba debe seguir los cinco pasos descritos anteriormente y como valor estadístico de
prueba (paso tres) se utiliza la siguiente formula
n
pZ
/)1(
Ejemplo 4
Una empresa informa que el 52% de los automovilistas que usan las autopistas son varones.
Una muestra de 300 autos que viajaron por una autopista, reveló que 170 fueron conducidos por
hombres. Al nivel de significancia de 0.01, ¿se puede concluir que la proporción de varones que
conducen por la autopista es mayor que lo que indica la empresa de investigación?
Datos: =0,52; n=300; X=170
p = 170/300 = 0,57
Primer Paso: Plantear la hipótesis (ver la pregunta del ejercicio)
Ho: π 0,52
H1: π >0,52
Prueba de 1 cola
Segundo Paso: Nivel de significancia 0,01
Tercer Paso: Valor estadístico de prueba
74,1300/)52,01(52,0
52,057,0
Z
Cuarto Paso: Plantear la regla de decisión
pág. 24
Acepto Ho Rechazo Ho
0, 490 0,01
VC = 2,33
Quito Paso: Tomar la decisión
Si Z es > 2,33 se rechaza la Ho y se acepta la H1
Como Z (1,74) es < 2,33 se acepta la Ho
pág. 25
II. UNIDAD: Prueba de hipótesis para dos muestras
Competencias
El estudiante estará en capacidad de:
Probar hipótesis de la diferencia entre dos medias para muestras grandes.
Probar hipótesis de la diferencia entre dos medias para muestras pequeñas.
Probar hipótesis de la diferencia entre dos proporciones.
Entender la diferencia entre muestras dependientes y muestras independientes.
Realizar una prueba de Hipótesis respecto a la diferencia media entre observaciones
pareadas.
Contenidos
2.1 Concepto principales
2.2 Pruebas de hipótesis: diferencia de dos medias poblacionales (muestras grandes)
2.3 Pruebas de hipótesis: diferencia de dos relaciones proporcionales
2.4 Pruebas de hipótesis: diferencia de dos medias poblacionales (muestras pequeñas)
2.5 Prueba de hipótesis con muestras dependientes (muestras pequeñas)
2.6 Comparación de muestras dependientes e independientes
2.1 Conceptos principales
Muestras dependientes. - Se caracterizan porque se hace una medición, después una
intervención, y de nuevo se realiza una medición.
pág. 26
Muestras independientes. - Cuando las muestras tomadas aleatoriamente no están
relacionadas una con otra.
Varianza conjunta. - Promedio ponderado de las dos varianzas que se usa para estimar la
varianza común, cuando se usa muestras pequeñas para probar la diferencia entre dos medias
poblacionales.
2.2 Prueba de hipótesis: diferencia de dos medias poblacionales (muestras grandes)
El siguiente tema, analiza cómo se puede aplicar la prueba de hipótesis para comparar dos
poblaciones. Muchas preguntas importantes pueden resolverse comparando dos poblaciones.
Con frecuencia los datos disponibles para el análisis se obtienen de dos muestras (una de cada
población).
Fórmula para calcular el valor estadístico de prueba:
2
22
1
12
21
nn
XXZ
o
2
22
1
12
21
n
S
n
S
XXZ
Suposiciones necesarias para emplear las fórmulas anteriores
• Las dos poblaciones siguen distribuciones normales.
• Las dos muestras no deben estar relacionadas, es decir, deben ser independientes.
• Debe conocerse la desviación estándar de las dos poblaciones.
Ejemplo 1
pág. 27
Una empresa desea determinar si se producen más unidades en el turno de la tarde que en el
primero. Una muestra de 54 trabajadores del primer turno mostró que el número medio de
unidades producidas fue de 345, con una desviación estándar de 21. Una muestra de 60
trabajadores del turno vespertino indicó que el número medio de unidades producidas fue de
351, con una desviación estándar de 28 unidades. Al nivel de significancia de 0.05, ¿es mayor el
número de unidades elaboradas en el turno de la tarde?
Datos: n1=54; 1X =345; 1S =21
n2=60; 2X =351; 2S =28
Primer Paso: Plantear la hipótesis (ver la pregunta del ejercicio)
Ho: 1 2
H1: 1 < 2
Segundo Paso: Nivel de significancia α = 0,05
Tercer Paso: Valor estadístico de prueba
30,1
60
28
54
21
351345
22
Z
Cuarto Paso: Plantear la regla de decisión.
Rechazo Ho Acepto Ho
0,05 0,4500
VC = -1,65
pág. 28
Quito Paso: Tomar la decisión
2.3 Pruebas de hipótesis: diferencia de dos relaciones proporcionales
A menudo se necesita comparar dos proporciones poblacionales. Un investigador puede estar
interesado en saber la magnitud de la diferencia entre la proporción de dos procesos A y B.
Un estimador puntual de 1 - 2 es la diferencia entre dos proporciones calculadas a partir de
muestras aleatorias independientes tomadas de las dos poblaciones.
Fórmula para calcular el valor estadístico de prueba:
21
21
nn
xxpc
21
21
)1()1(
n
pp
n
pp
ppZ
cccc
Ejemplo 2
Una muestra de 1000 ciudadanos estadounidenses reveló que 198 estaban a favor de la
reanudación de las relaciones diplomáticas con Cuba. De manera semejante, 117 de una muestra
de 500 ciudadanos nacidos en el extranjero estaban a favor de ello. Al nivel de significancia de
0.05 ¿Existe alguna diferencia en la proporción de ciudadanos estadounidenses y los nacidos en
el extranjero, que están a favor de reanudar las relaciones diplomáticas?
Datos: n1=1000; X1=198; p1=198/1000 = 0,20
n2=500; X2=117; p2=117/500=0,23
Si Z<-1,65 se rechaza la Ho y se acepta la H1
Como Z (-1,30) > -1,65 se acepta la Ho
pág. 29
Primer Paso: Plantear la hipótesis (ver la pregunta del ejercicio)
Ho: 1= 2
H1: 1 2
Prueba de 2 colas
Segundo Paso: Nivel de significancia 0,05
Tercer Paso: Valor estadístico de prueba
21,05001000
117198
cp
34,1
500
)21,01(21,0
1000
)21,01(21,0
23,020,0
Z
Cuarto Paso: Plantear la regla de decisión. (Apéndice B1)
α= 0,05 /2=0,025
Rechazo Ho Acepto Ho Rechazo Ho
0,025 0,475 0,475 0,025
VC= -1,96 VC=1,96
Quito Paso: Tomar la decisión
CICIO 7
2.4 Pruebas de hipótesis: diferencia de dos medias poblacionales (muestras pequeñas)
En este tema debes tener en cuenta las siguientes consideraciones:
Si Z <- 1,96 o si Z>1,96 se rechaza la Ho y se acepta la H1
Como Z (-1,34) > -1,96 se acepta la Ho
pág. 30
Las poblaciones muestreadas siguen la distribución normal.
Las dos muestras provienen de poblaciones independientes.
Las desviaciones estándar de las dos poblaciones son iguales.
Fórmula para calcular el valor estadístico de prueba:
2
11
21
2
22
2
112
nn
SnSnS p
Ejemplo 3
Un psicólogo seleccionó una muestra de 12 mujeres y otra de 9 hombres. Luego pidió a cada
individuo que dibujara una figura masculina. El tiempo promedio que gastaron las mujeres fue
de 8 minutos, con varianza de 18. Para los hombres el tiempo fue de 13 minutos, con varianza
de 22,5. Indican estos datos que los hombres en promedio gastan más tiempo que las mujeres
cuando dibujan una figura masculina? Utilizar un nivel de significación 0,05
Datos: 1n =12; 1X =8; 2
1S =18
2n =9; 2X =13; 2
2S =22,5
Primer Paso: Plantear la hipótesis (ver la pregunta del ejercicio)
Ho: 1 2
H1: 1< 2
Prueba de 1 cola
Segundo Paso: Nivel de significancia 0,05
21
2
21
11
nnS
XXt
p
pág. 31
Tercer Paso: Valor estadístico de prueba
89,192912
5,2219181122
pS
(Varianza combinada)
54.2
9
1
12
189,19
138
t
Cuarto Paso: Plantear la regla de decisión. (Apéndice B2)
α= 0,05 y gl= n1+ n2-2 =12+9-2 = 19
Rechazo Ho Acepto Ho
VC = -1,729
Quito Paso: Tomar la decisión
2.5 Prueba de hipótesis con muestras dependientes (muestras pequeñas)
Con frecuencia los datos disponibles para el análisis se obtienen de dos muestras que no son
independientes.
Un procedimiento comúnmente usado que da como resultado dos muestras no independientes es
la denominada prueba “antes y después”.
Las mediciones se hacen sobre la muestra de sujetos tanto antes como después de la
introducción de algún fenómeno.
Si t<-1,729 se rechaza la Ho y se acepta la H1
Como t(-2,54) < -1,729 se rechaza la Ho y se acepta la H1
pág. 32
Los métodos que se acaban de estudiar en las secciones anteriores no se pueden aplicar cuando
las dos muestras que generan los datos están relacionadas, puesto que tales métodos están
sujetos a la condición de que las dos muestras sean independientes.
Fórmula para calcular el valor estadístico de prueba:
n
dd
;
n
S
dt
d
Ejemplo 4
Se ha observado un aumento en el ausentismo en una empresa, y se cree que está relacionado
con la salud general de los empleados. En un intento por mejorar la situación se inició un
programa de acondicionamiento, en el que los empleados realizaban ejercicios físicos durante
su hora de almuerzo. Para evaluar el programa se tomó una muestra de 8 participantes y se
determinó el número de días que cada uno se había ausentado en los seis meses antes de que
comenzara dicho plan y en los últimos seis meses. A continuación, se presentan los resultados.
Al nivel de significancia de 0.05, ¿se puede concluir que el número de ausencias ha disminuido?
Datos: n =8
Antes 6 6 7 7 5 6 7 8
Después 5 2 1 3 3 6 3 7 d
Diferencia(d) 1 4 6 4 2 0 4 1 22
Utilizando las formulas de la media y la desviación estándar calcule: d y Sd
d = 22/8 = 2,75
Sd = 2,05
Primer Paso: Plantear la hipótesis (ver la pregunta del ejercicio)
Ho: d 0
H1: d >0
Prueba de 1 cola
pág. 33
Segundo Paso: Nivel de significancia 0,05
Tercer Paso: Valor estadístico de prueba
79,3
8
05,2
75,2t
Cuarto Paso: Plantear la regla de decisión
α= 0,05
gl=8-1 =7
Acepto Ho Rechazo Ho
VC= 1,895
Quinto Paso: Tomar la decisión
2.6 Comparación de muestras dependientes e independientes
Es muy frecuente la confusión entre las pruebas de muestras independientes con las pruebas de
muestras dependientes. Según Lind, Marchall y otros “hay dos tipos de muestras dependientes:
1) las que se caracterizan por una medición, una intervención de algún tipo y después otra
medición, y 2) una relación o agrupación de las observaciones”. Lo que es importante enfatizar
es que cuando se emplean muestras dependientes, se reduce la variación en la distribución del
muestreo; es decir, las inferencias sobre dos medias poblacionales relacionadas o dependientes,
por lo general, se obtienen mejores resultados que con el método de muestras independientes.
Si t>1,895 se rechaza la Ho y se acepta la H1
Como t(3,79)>1,895 se rechaza la Ho
pág. 34
SEGUNDA PARTE DE LA UNIDAD DIDACTICA
La segunda parte de esta unidad didáctica está compuesta por tres bloques que corresponden a
las unidades tres, cuatro y cinco:
En la unidad tres examinarás todo lo referente al análisis ANOVA, en donde aprenderás a
realizar pruebas de hipótesis de más de dos medias en una y dos direcciones.
En la unidad cuatro estudiaremos los métodos no paramétricos y sus aplicaciones con la
distribución Ji Cuadrada.
Finalmente, en la unidad cinco se analizarán las herramientas del control estadístico de la
calidad.
La importancia del estudio de estas unidades se basa en que en la vida práctica y profesional
es de gran utilidad para la toma de decisiones en el campo administrativo.
Objetivos de la segunda parte de la unidad didáctica
Al finalizar el estudio de esta segunda parte estarás en capacidad de aplicar el análisis de
varianza, la ji cuadrada y el control estadístico de calidad, en los diferentes campos de tu
carrera.
pág. 35
III. UNIDAD: Análisis de varianza
Competencias
El estudiante estará en capacidad de:
Comprender la noción general del análisis de varianza.
Realizar una prueba de hipótesis para determinar si dos varianzas muestrales,
provienen de poblaciones iguales.
Establecer y organizar datos en una tabla de ANOVA de una y dos direcciones
Efectuar una prueba de hipótesis entre tres o más medias muestrales.
Realizar prueba de hipótesis para determinar si hay alguna diferencia entre medias de
bloques.
Contenidos
3.1 Conceptos principales
3.2 Comparaciones de dos varianzas poblacionales
3.3 Suposiciones ANOVA
3.4 Prueba ANOVA en una dirección
3.5 Inferencias acerca de las medias de tratamiento
3.6 Análisis de varianza de dos direcciones
3.1 Conceptos principales
Análisis de varianza. - Es una técnica que se usa para probar simultáneamente si las medias
de varias poblaciones son iguales.
Distribución F.- Se utiliza como estadístico de prueba en el análisis de varianza.
Tratamiento. - Es una fuente de variación.
Bloque. - Es una segunda fuente de variación, además de los tratamientos
pág. 36
Análisis de varianza
En general, el análisis de varianza es un procedimiento que se utiliza para determinar
simultáneamente si varias poblaciones normales e independientes tiene la misma media. Esto se
hace comparando las varianzas de las muestras aleatorias tomadas de estas poblaciones.
Para esto, se debe emplear el procedimiento normal de prueba de hipótesis, pero se usa la
distribución F (apéndice B4) como estadístico de prueba.
3.2 Comparación de dos varianzas poblacionales
Para realizar la prueba de hipótesis debes seguir los cinco pasos y calcular el valor estadístico
de prueba con la siguiente fórmula:
2
2
2
1
S
SF
Ejemplo 1
Una muestra de 16 estudiantes de primer año manifestaron que se iban a especializar en artes y
una muestra de 13 dijeron que se especializarían en Historia, hicieron una prueba de aptitud
musical y la varianza de los puntajes de los que quieren especializarse en artes fue de 7,29 y la
varianza de los puntajes de quienes planean especializarse en historia fue de 39,69.
Proporcionan estos datos evidencia suficiente como para concluir que en el nivel de
significación 0,1, las dos varianzas poblacionales son diferentes?
Datos: n1=13; S21 = 39,69
n2=16; S22 = 7,29
pág. 37
Primer Paso: Plantear la hipótesis (ver la pregunta del ejercicio)
Ho: 12 = 2
2
H1: 12 2
2
Segundo Paso: Nivel de significancia 0,1/2=0,05
Tercer Paso: Valor estadístico de prueba
44,529,7
69,39F
Cuarto Paso: Plantear la regla de decisión. (Apéndice B4)
α= 0,05
gl en el numerador = n1-1 =13-1 = 12
gl en el denominador = n2-1 =16-1 = 15
Acepto Ho rechazo Ho
VC = 2,48
Quinto Paso: Tomar la decisión
Si F>2,48 se rechaza la Ho y se acepta la H1
Como F(5,44) > 2,48 se rechaza la Ho y se acepta la H1
pág. 38
3.3 Suposiciones Anova
Para emplear ANOVA, se supone lo siguiente:
a. Las poblaciones siguen la distribución normal.
b. Las poblaciones tienen desviaciones estándares iguales
c. Las poblaciones son independientes.
3.4 Prueba Anova en una dirección
Cuando estamos interesados en hacer inferencias sobre tres o más poblaciones, las técnicas
estudiadas anteriormente no proporcionan por sí mismas las herramientas necesarias para
manejar el análisis estadístico que se necesita.
El análisis de varianza (ANOVA) nos permite hacer inferencias simultáneas sobre parámetros
de tres o más poblaciones. Para realizar la prueba debes seguir los cinco pasos para probar la
hipótesis y en el paso tres debes realizar la TABLA ANOVA
FUENTE DE
VARIACIÓN
SUMA DE
CUADRADOS
GRADOS DE
LIBERTAD
MEDIA DE
CUADRADOS
F
Tratamientos
Error
SST
SSE
k-1
n-k
SST/(k-1) =MST
SSE/(n-k) =MSE
MST/MSE
Total SSt n-1
n
XXSSt
2
2
pág. 39
n
X
n
TSST
c
c
22
SSE = SSt - SST
Ejemplo 2
ATU fabrica bicicletas de turismo. El ingeniero de control de calidad decide comparar las
velocidades más altas obtenidas, utilizando tres mecanismos de cambios diferentes; 5 ciclistas
son cronometrados cuando corren con cada uno de los tres mecanismos, los resultados aparecen
aquí. ¿Los datos sugieren una diferencia en las velocidades promedio a un nivel del 1%?
CICLISTA
MECANISMO
I II III
1 40 51 37
2 42 49 38
3 37 53 38
4 45 57 41
5 42 42 40
Primer Paso: Plantear la hipótesis (ver la pregunta del ejercicio)
Ho: 1 = 2 = 3
H1: 1 2 3
Segundo Paso: Nivel de significancia 0,01
CICLISTA MECANISMO
TOTAL I II III
X X2 X X2 X X2 X X2
1 40 1.600 51 2.601 37 1.369 128 5.570
2 42 1.764 49 2.401 38 1.444 129 5.609
3 37 1.369 53 2.809 38 1.444 128 5.622
4 45 2.025 57 3.249 41 1.681 143 6.955
5 42 1.764 42 1.764 40 1.600 124 5.128
Tc 206 252 194 652
X2 8.522 12.824 7.538 28.884
pág. 40
Tercer Paso: Valor estadístico de prueba
73,54315
65228884
2
SSt
93,37415
652
5
194
5
252
5
2062222
SST
SSE = 543,73-374,93 = 168,80
TABLA ANOVA
FUENTE DE
VARIACIÓN
SUMA DE
CUADRADOS
GRADOS DE
LIBERTAD
MEDIA DE
CUADRADOS
F
Tratamientos
Error
374,93
168,80
(3-1) =2
(15-3) =12
(374,93/2) =187,47
(168,80/12) =14,07
(187,47/14,07)
=13.32
Total 543,73 (15-1) =14
Cuarto Paso: Plantear la regla de decisión. (Apéndice B4)
α= 0,01
gl en el numerador = k-1 =3-1 =2
gl en el denominador = n-k =15-3 = 12
Acepto Ho rechazo Ho
VC = 6,93
Quinto Paso: Tomar la decisión
Si F>6,93 se rechaza la Ho y se acepta la H1
Como F (13,32) > 6,93 se rechaza la Ho y se acepta la H1
pág. 41
3.5 Inferencias acerca de pares de valores medios de tratamiento
Cuando se rechaza la hipótesis nula al aplicar el procedimiento ANOVA, se concluye que todas
las medias de tratamiento no son iguales. Algunas veces esta conclusión puede considerarse
satisfactoria, pero en otros casos se requiere conocer cuáles medias de tratamiento son
diferentes, para esto debes calcular el intervalo de confianza para la diferencia entre medias de
tratamiento utilizando la siguiente formula:
21
21
11)(
nnMSEtXX
Si el intervalo de confianza incluye al cero no hay diferencia entre las medias de
tratamiento y si tienen el mismo signo es decir no incluye al cero si hay una diferencia
significativa entre las dos medias de tratamiento
Ejemplo 3
La siguiente es información de muestra. Pruebe la hipótesis de que las medias de tratamiento
son iguales al nivel de significancia de 0.05
TRATAMIENTO
I II III
3 9 6
2 6 3
5 5 5
1 6 5
3 8 4
1 5
1
pág. 42
a. Enuncie la hipótesis nula y alternativa.
b. ¿Cuál es la regla de decisión?
c. Elabore una tabla ANOVA.
d. Exprese su decisión respecto a la hipótesis nula.
e. Si se rechaza Ho, ¿se puede concluir que difieren el tratamiento 1 y el tratamiento 2?
Utilice el nivel de confianza del 90%.
Primer Paso: Plantear la hipótesis (ver la pregunta del ejercicio)
Ho: 1 = 2 = 3
H1: 1 2 3
Segundo Paso: Nivel de significancia 0,05
I II III TOTAL
X X2 X X2 X X2 X X2
3 9 9 81 6 36 18 126
2 4 6 36 3 9 11 49
5 25 5 25 5 25 15 75
1 1 6 36 5 25 12 62
3 9 8 64 4 16 15 89
1 1 5 25 6 26
1 1 1 1
Tc 15 40 23 78
X2 49 268 111 428
Tercer Paso: Valor estadístico de prueba
9018
78428
2
SSt
87,3318
78
5
23
7
40
6
152222
SST
pág. 43
SSE = 90-33,87 = 56,13
TABLA ANOVA
FUENTE DE
VARIACIÓN
SUMA DE
CUADRADOS
GRADOS DE
LIBERTAD
MEDIA DE
CUADRADOS
F
Tratamientos
Error
33,87
56,13
(3-1) =2
(18-3) =15
(33,87/2) =16,94
(56,13/15) =3,74
(16,94/3,74) =4,53
Total 90,00 (18-1) =17
Cuarto Paso: Plantear la regla de decisión. (Apéndice B4)
α= 0,05
gl en el numerador = k-1 =3-1 =2
gl en el denominador = n-k =18-3 = 15
Acepto Ho rechazo Ho
VC = 3,68
Quinto Paso: Tomar la decisión
Pregunta f: 1X 2X
Nivel de confianza 90%
Si F>3,68 se rechaza la Ho y se acepta la H1
Como F(4,53) > 3,68 se rechaza la Ho y se acepta la H1
pág. 44
1X = 15/6=2,5 2X =40/7=5,71
n1 = 6 n2=7
t=1,753 del apéndice F con (n-k) =18-3=15 grados l
MSE= 3,74
7
1
6
174,3753,1)71,55,2(
ICS = -3,21+1,89 = -1,32
ICI = -3,21 -1,89 = -5,10
Como los extremos son negativos se concluye que las medias difieren
3.6 Análisis de varianza en dos direcciones
Pasamos ahora a estudiar el tema de la ANOVA bidireccional (análisis de bloques y
tratamientos). Para esto debes seguir el mismo procedimiento anterior y en el paso tres debes
incluir la siguiente formula:
n
X
k
BSSB r
22
La tabla ANOVA queda de la siguiente manera:
FUENTE DE
VARIACIÓN
SUMA DE
CUADRADOS
GRADOS DE
LIBERTAD
MEDIA DE
CUADRADOS
F
Tratamientos
Bloques
Error
SST
SSB
SSE
k-1
b-1
(k-1) (b-1)
SST/(k-1) =MST
SSB/(b-1) =MSB
SSE/(k-1) (b-1)
=MSE
MST/MSE
MSB/MSE
Total SSt n-1
Ejemplo 4
pág. 45
Unos investigadores llevaron a cabo un experimento para evaluar la actitud hacia la reforma
educativa. Los investigadores seleccionaron al azar a obreros, oficinistas y profesionales
según la actitud hacia la reforma educativa. El siguiente cuadro muestra los resultados.
ACTITUD HACIA LA REFORMA EDUCATIVA
A FAVOR (A) NEUTRAL (N) OPUESTO (O)
Obrero (O) 19 16 37
Oficinista (Of) 15 22 46
Profesional (P) 24 11 32
Al nivel de significancia de 0,05 ¿se puede concluir que hay diferencia entre las actitudes hacia
la reforma educativa o la ocupación?
Primer Paso: Plantear la hipótesis (ver la pregunta del ejercicio)
Hipótesis para tratamientos
Ho: A = N = O
H1: A N O
Hipótesis para bloques
Ho: O = Of = P
H1: O Of P
Segundo Paso: Nivel de significancia 0,05
Tercer Paso: Valor estadístico de prueba
OCUPACION
X X2
X X2
X X2
X X2
OBRERO 19 361 16 256 37 1369 72 1986
OFICINISTA 15 225 22 484 46 2116 83 2825
PROFESIONAL 24 576 11 121 32 1024 67 1721
Tc 58 49 115 222
X2
1162 861 4509 6532
Bt
ACTITUD HACIA LA REFORMA
A FAVOR NEUTRAL OPUESTO
pág. 46
1056
9
2226532
2
SSt
8549
222
3
115
3
49
3
582222
SST
67,449
222
3
67
3
83
3
722222
SSB
SSE = 1056-854-44,67 = 157,33
TABLA ANOVA
FUENTE DE
VARIACIÓN
SUMA DE
CUADRADOS
GRADOS DE
LIBERTAD
MEDIA DE
CUADRADOS
F
Tratamientos
Bloque
Error
854
44,67
157,33
(3-1) =2
(3-1) =2
(3-1) (3-1) =4
(854/2) =427
(44,67/2) =22,34
(157,33/4) =39,33
(427/39,33) =10,85
(22,34/39,33)
=0,57
Total 1056 (9-1) =8
Cuarto Paso: Plantear la regla de decisión. (Apéndice B4)
α= 0,05
Para tratamiento
gl en el numerador = k-1 =3-1 =2
gl en el denominador =(k-1) (b-1) = (3-1) (3-1) =4
F=6,94
Para bloque
gl en el numerador = b-1 =3-1 =2
gl en el denominador =(k-1) (b-1) = (3-1) (3-1) =4
F=6,94
pág. 47
Acepto Ho rechazo Ho
VC
6,94
Quinto Paso: Tomar la decisión
Para tratamiento
Para bloque
Si F>6,94 se rechaza la Ho y se acepta la H1
Como F (10,85) > 6,94 se rechaza la Ho y se acepta la H1
Como F (0,57) < 6,94 se acepta la Ho
pág. 48
IV. UNIDAD: Métodos no paramétricos
Competencias
Realizar una prueba de hipótesis comparando un conjunto observado de frecuencias y
una distribución esperada.
Efectuar una prueba de hipótesis de normalidad aplicando la distribución Ji Cuadrada.
Realizar una prueba de hipótesis para determinar si están relacionados dos criterios de
clasificación.
Contenidos
4.1 Introducción.
4.2 Prueba de bondad de ajuste. Frecuencias esperadas iguales.
4.3 Prueba de bondad de ajuste. Frecuencias esperadas desiguales.
4.4 Pruebas de independencia (tablas de contingencia)
4.1 Introducción.
Pruebas no paramétricas. - Pruebas de hipótesis para datos de niveles nominal y ordinal. No se
necesita hacer suposiciones acerca de la forma de la población; esto es, no tiene que suponerse
que la población esté distribuida normalmente.
Prueba de bondad de ajuste de ji cuadrada. - Es una prueba cuyo objetivo es determinar que
tan bien se ajusta un conjunto de frecuencias observadas, a un conjunto de frecuencias
esperadas. Se usa cuando se tiene sólo una variable de nivel de medición nominal.
Las pruebas de hipótesis no paramétricas o libres de distribución usan datos de nivel nominal y
ordinal. Esto implica que estas pruebas están libres de suposiciones con respecto a la
pág. 49
distribución de la población de origen. Es decir, no es necesario que se suponga que la
población sigue la distribución normal.
4.2 Prueba de bondad de ajuste. Frecuencias esperadas iguales.
El objetivo de la prueba de bondad de ajuste es comparar un conjunto de frecuencias observadas
con un conjunto de frecuencias esperadas.
Para realizar la prueba debes seguir los cinco pasos y calcular el valor estadístico de prueba con
la siguiente formula:
fe
fefoX
2
2
Ejemplo 1
RR.HH. reunió la siguiente información acerca del ausentismo del personal por día de la
semana. Al nivel de significancia de 0.05, puede concluir que existe una diferencia en la tasa
de inasistencia por día de la semana.
Día Ausentismo
Lunes 124
Martes 74
Miércoles 104
Jueves 98
Viernes 120
Primer Paso: Plantear la hipótesis (ver la pregunta del ejercicio)
Ho: no hay diferencia en la tasa de inasistencia
pág. 50
H1: hay diferencia en la tasa de inasistencia
Segundo Paso: Nivel de significancia 0,05
Tercer Paso: Valor estadístico de prueba
Donde X2= 15,31
Cuarto Paso: Plantear la regla de decisión. (Apéndice B3)
α= 0,05
Grados de libertad = k-1 =5-1 =4
X2=9,488
Acepto Ho rechazo Ho
VC = 9,488
Quinto Paso: Tomar la decisión
Si X2>9,488 se rechaza la Ho y se acepta la H1
Como X2(15,31) > 9,488 se rechaza la Ho y se acepta la H1
DIA (fo-fe) (fo-fe)2
(fo-fe)2/fe
fo fe
Lunes 124 104 20 400 3,85
Martes 74 104 -30 900 8,65
Miércoles 104 104 0 0 0,00
Jueves 98 104 -6 36 0,35
Viernes 120 104 16 256 2,46
TOTAL 520 520 0 15,31
AUSENTISMO
pág. 51
4.3 Prueba de bondad de ajuste. Frecuencias esperadas desiguales.
Ejemplo 2
Un banco clasifica las cuentas por cobrar como “al día”, “atrasadas” e “incobrables. Las
cifras en el sector muestran que el 60% de las cuentas por cobrar están al día, 30% son
atrasadas y 10% son incobrables. El departamento jurídico del Banco tiene 500 cuentas por
cobrar: 320 están al día, 120 tienen atraso y 60 son incobrables. Estos números concuerdan
con la distribución en el sector. Utilice el nivel de significación de 0.05
Primer Paso: Plantear la hipótesis (ver la pregunta del ejercicio)
Ho: no hay diferencia con la distribución en el sector
H1: hay diferencia con la distribución en el sector
Segundo Paso: Nivel de significancia 0,05
Tercer Paso: Valor estadístico de prueba
Donde X2= 9,33
Cuarto Paso: Plantear la regla de decisión. (Apéndice B3)
α= 0,05
Grados de libertad = K-1 =3-1 =2
X2=5,991
TIPO fe (fo-fe) (fo-fe)2
(fo-fe)2/fe
fo %
Al corriente 320 60 300 20 400 1,33
atrasadas 120 30 150 -30 900 6,00
No cobrables 60 10 50 10 100 2,00
TOTAL 500 100 500 0 9,33
C x C
pág. 52
Acepto Ho rechazo Ho
VC = 5,991
Quinto Paso: Tomar la decisión
4.4 Pruebas de independencia (tablas de contingencia)
La prueba de Ji Cuadrada también puedes aplicar en un proyecto de investigación relacionado
con dos características que se resumen en una tabla de contingencia (tabla de doble entrada). En
este caso debes seguir los pasos anteriores y para el cálculo de la frecuencia esperada para una
celda debes utilizar la siguiente formula.
totalgran
columnaportotalfilaportotalfe
))((
Ejemplo 3
Taco Bell realiza una inspección mensual para comparar los precios registrados con los precios
anunciados. La siguiente tabla resume los resultados de una muestra de 500 artículos en el mes
anterior. La administración de la empresa desearía saber si existe alguna relación entre las tasas
Si X2>5,991 se rechaza la Ho y se acepta la H1
Como X2(9,33) > 5,991 se rechaza la Ho y se acepta la H1
pág. 53
de error en mercancía de precio regular y en los artículos de precio especial. Utilice el nivel de
significancia de 0.01
PRECIO TIPO DE COMBUSTIBLE
REGULAR ESPECIAL
Precio Menor 20 10
Sobreprecio 15 30
Precio correcto 200 225
Primer Paso: Plantear la hipótesis (ver la pregunta del ejercicio)
Ho: no existe relación entre las tasas de error y el tipo de artículo
H1: existe relación entre las tasas de error y el tipo de artículo
Segundo Paso: Nivel de significancia 0,01
Tercer Paso: Valor estadístico de prueba
10,14500
)235)(30(fe
03,825,225
)25,225225(
75,199
)75,199200(
85,23
)85,2330(
15,21
)15,2115(
90,15
)90,1510(
10,14
)10,1420(
222
2222
X
PRECIO
fo fe fo fe fo fe
Precio Menor 20,00 14,10 10,00 15,90 30,00 30,00
Sobreprecio 15,00 21,15 30,00 23,85 45,00 45,00
Precio correcto 200,00 199,75 225,00 225,25 425,00 425,00
TOTAL 235,00 235,00 265,00 265,00 500,00 500,00
REGULAR ESPECIAL TOTAL
pág. 54
Cuarto Paso: Plantear la regla de decisión. (Apéndice B3)
α= 0,01
gl =(filas-1) (columnas-1) = (3-1) (2-1) =2
X2=9,210
Acepto Ho rechazo Ho
VC = 9,210
Quinto Paso: Tomar la decisión
Si X2>9,210 se rechaza la Ho y se acepta la H1
Como X2(8,03) < 9,210 se acepta la Ho
pág. 55
V. UNIDAD: Control estadístico de calidad
Competencias:
El estudiante estará en capacidad de:
Analizar la función del control de calidad en las operaciones de producción y de
servicio.
Elaborar e interpretar un diagrama de Pareto.
Realizar e interpretar un diagrama de causa y efecto.
Realizar e interpretar un diagrama de defectuosos y una gráfica de barras
Elaborar una gráfica característica de operación para diversos planes de muestreo.
Contenidos
5.1 Conceptos principales
5.2 Diagramas de diagnóstico
5.3 Diagrama de Pareto
5.4 Diagrama de control de calidad
5.4.1 Diagramas de control de variables
5.4.2 Diagrama de control de atributos
5.1 Conceptos principales
Diagrama de Pareto. - Es una media aplicada para clasificar el número y tipo de defectos que
se presentan en un producto o servicio.
Diagrama de causa y efecto. - Enfatiza la relación entre una o varias causas posibles de un
problema, las cuales pueden producir un efecto en particular.
pág. 56
Diagramas de control. - Muestran gráficamente la calidad de un producto o servicio.
Variación aleatoria. - Variación que por naturaleza es aleatoria y no puede ser controlada o
eliminada.
Variación asignable. - Variación que no se debe al azar y puede ser eliminada.
5.2 Diagramas de diagnóstico
Los más importantes son:
1. El diagrama de Pareto: el concepto del diagrama es que 80% de la actividad es causada
por el 20% de los factores.
2. El diagrama de causa y efecto: Denominado “espina de pescado”, considera 4 áreas del
problema: métodos, materiales, equipo y personal.
Ejemplo 1
Un fabricante de calzado realizó un estudio acerca de sus nuevos zapatos para trotar. A
continuación, se presenta un listado del tipo y la frecuencia de deficiencias y fracasos
encontrados. Elabore un diagrama de Pareto para mostrar las áreas principales del problema
TIPO DEFICIENCIA FRECUENCIA TIPO
DEFICIENCIA
FRECUENCIA
Separación de la suela 34 Rotura cordones 14
Separación del tacón 98 Rotura ojillos 10
Hundimiento suela 62 Otras 16
pág. 57
Elabore un diagrama de Pareto para mostrar las áreas principales del problema
%= (98/234)100=41,88
% acumulado = 41,88+26,50=68,38
5.3 Diagrama de Pareto
Conclusión: La separación del tacón, el hundimiento de la suela y la separación de la suela
representan el 82,91% de los daños en los zapatos, por lo que el dueño de la fábrica deberá
resolver primero estos problemas
TIPO DEF FREC % % ACUM
Sep. tacón 98 41,88 41,88
Hund. suela 62 26,50 68,38
Sep. suela 34 14,53 82,91
Otras 16 6,84 89,74
Rot.cordones 14 5,98 95,73
Rot ojillos 10 4,27 100,00
TOTAL 234 100,00
pág. 58
5.4 Diagramas de control de calidad
Existen 2 tipos de diagramas de control.
Diagrama de control para variables.
Diagrama de atributos.
5.4.1 Diagrama de control para variables
Se dan como resultado de una medición. Se consideran dos diagramas de control:
a. Diagrama de media (valor medio).- Muestra la media de una variable. Las siguientes
formulas calculan los límites de control para la media.
X (Media global) = X / k
R (media de las amplitudes de variación) = R / k
A2 (se encuentra en el apéndice B8)
b. Diagrama de amplitud de variación. - Indica la extensión de cambio de la variable.
Aquí debes utilizar las siguientes fórmulas para calcular los límites de control para la
amplitud.
LSC (límite superior de control) = X + A2R
LIC (límite inferior de control) = X - A2R
pág. 59
Ejemplo 2
Como parte de su proceso de inspección, una empresa prueba la resistencia de las llantas que
fabrica aplicándoles condiciones simuladas de recorrido. Se selecciona 20 muestras de 3
neumáticos cada una, de diferentes turnos laborales durante un mes de operación.
El desgaste de las llantas se indica a continuación, en centésimas de pulgada
MUESTRA DESGASTE DE LLANTAS MUESTRA DESGASTE DE LLANTAS
1 44 41 19 11 11 33 34
2 39 31 21 12 51 34 39
3 38 16 25 13 30 16 30
4 20 33 26 14 22 21 35
5 34 33 36 15 11 28 38
6 28 23 39 16 49 25 36
7 40 15 34 17 20 31 33
8 36 36 34 18 26 18 36
9 32 29 30 19 26 47 26
10 29 38 34 20 34 29 32
Determine los límites de control para la media y la amplitud de variación.
Trace los límites de control para la media y para la amplitud de variación.
Hay algunos puntos que estén fuera de control.
LSC (límite superior de control) = D4R
LIC (límite inferior de control) = D3R
NOTA: D4, D3 (se encuentra en el apéndice B8)
pág. 60
X = 611,33/20 =30,57
R = 312/20 = 15,60
Límites de control para la media
LSC =30,57 + 1,023(15,60) = 46,53
LIC =30,57 - 1,023(15,60) = 14,61
MUESTRA MEDIA AMPLITUD
I II III X AV
1 44 41 19 34,67 25,00
2 39 31 21 30,33 18,00
3 38 16 25 26,33 22,00
4 20 33 26 26,33 13,00
5 34 33 36 34,33 3,00
6 28 23 39 30,00 16,00
7 40 15 34 29,67 25,00
8 36 36 34 35,33 2,00
9 32 29 30 30,33 3,00
10 29 38 34 33,67 9,00
11 11 33 34 26,00 23,00
12 51 34 39 41,33 17,00
13 30 16 30 25,33 14,00
14 22 21 35 26,00 14,00
15 11 28 38 25,67 27,00
16 49 25 36 36,67 24,00
17 20 31 33 28,00 13,00
18 26 18 36 26,67 18,00
19 26 47 26 33,00 21,00
20 34 29 32 31,67 5,00
SUMA 611,33 312,00
DESGASTE DE LLANTAS
DIAGRAMA DE CONTROL PARA LA MEDIA
0
5
10
15
20
25
30
35
40
45
50
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
MUESTRAS
DE
SG
AS
TE
LIC
X
LSC
pág. 61
Límites de control para la amplitud de variación
LSC = 2,575(15,60) = 40,17
LIC = 0(15,60) = 0
El proceso se encuentra bajo control tanto para la media como para la amplitud de
variación como puedes ver en los diagramas anteriores
RCICIO 8
5.4.2 Diagrama de atributos
Muestra si el producto o servicio es aceptable o no lo es. Se consideran dos diagramas.
a. Diagrama de porcentaje de elementos defectuosos. - Es una gráfica de atributos que
muestra la proporción del producto o servicio que no sigue el estándar. Aquí debes utilizar
las siguientes fórmulas para calcular los límites de control para proporciones.
DIAGRAMA DE CONTROL PARA LA AMPLITUD
0
5
10
15
20
25
30
35
40
45
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
MUESTRAS
DE
SG
AS
TE
LIC
R
LSC
LSC (límite superior de control) n
ppp
)1(3
LIC (límite inferior de control) n
ppp
)1(3
p = total de defectuosos / total de muestreados
pág. 62
Ejemplo 3
Un fabricante de bicicletas selecciona diariamente 10 armazones y determina la cantidad de
defectos. El número de armazones defectuosos encontrado en los últimos 14 días es: 3, 2, 1, 3,
2, 2, 8, 2, 0, 3, 5, 2, 0, 4.
Elabore un diagrama de control y determine si está bajo control
p de defectuosos = 3/10 = 0,30
p = 37/140 = 0,26
LSC 68,010
)26,01(26,0326,0
LIC 016,010
)26,01(26,0326,0
DÍA NÚMERO DEFECTOS PROPORCIÓN
INSPECCION DEFECTOS
1 10 3 0,30
2 10 2 0,20
3 10 1 0,10
4 10 3 0,30
5 10 2 0,20
6 10 2 0,20
7 10 8 0,80
8 10 2 0,20
9 10 0 0,00
10 10 3 0,30
11 10 5 0,50
12 10 2 0,20
13 10 0 0,00
14 10 4 0,40
TOTAL 140 37
DIAGRAMA DE CONTROL PARA LA PROPORCIÓN
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1 2 3 4 5 6 7 8 9 10 11 12 13 14
DÍAS
PR
OP
OR
CIÓ
N
LIC
P
LSC
pág. 63
Conclusión: El proceso está fuera de control en el séptimo día.
b. Diagrama c con raya. - Se refiere al número de defectos por unidad. Aquí debes utilizar las
siguientes fórmulas para calcular los límites de control para el número de defectos por
unidad.
Ejemplo 4
Al final de cada turno, el departamento de calidad selecciona una muestra de baterías para
probarlas. El número de unidades defectuosas durante los últimos 12 turnos es 2, 1, 0, 2, 1, 1, 7,
1, 1, 2, 6 y 1.
Elabore un diagrama de control del proceso y comente si está bajo control.
083,212
162117112012
n
Xc
083.23083.2 LSC = 6.413
083.23083.2 LIC = -2.247
Como LCI es negativo, se establece LCI = 0.
LSC (límite superior de control) cc 3
LIC (límite inferior de control) cc 3
pág. 64
El turno con 7 defectos está fuera de control
FIN
c
LSC
LIC