Download - Inferencia Estadística SEPARATA 2
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 1/42
UNIVERSIDAD NACIONAL
JOSE FAUSTINO SANCHEZ CARRION
F CULT D DE INGENIERÍ
Prácticas de
DE INFERENCIA ESTADÍSTICA
( ) 1.0n
i
f x
MOISES E. ARMAS
Huacho, Noviembre del 2009
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 2/42
Sección 3Frases para meditar:
La teoría es asesinada tarde o
temprano por la experiencia
La belleza es una carta de
presentación a corto plazo
La protesta y la queja son el
refugio de la gente que desconfía
en sí mismo
El trabajo arduo embrutece la
mente y lleva a cometer errores
Independientemente de su grado de
brillantez, nunca es conveniente
apostar con un perdedor.
Otras pruebas de hipótesis
Con las pruebas de hipótesis podemos estimar un parámetro poblacional, para ello tomamos muestras estadísticas, y según la naturalezadel problema, podemos estimar su media o varianza poblacional; también podemos estimar las diferencias de las medias poblacionales, las proporciones poblacionales, o las razones de dos varianzas; en esta seccióntambién estudiaremos otras pruebas que pueden hacerse con las hipótesisestadísticas; estas son básicamente las pruebas de bondad de ajuste y las pruebas de contingencia.
3.1 Pruebas de Bondad de Ajuste
Cuando se construye un histograma de frecuencias de unasituación observada y es necesario conocer su curva de tendencia, paradescribir su comportamiento teórico y es preciso saber si ésta curva de
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 3/42
tendencia podrá ser considerada como válida para estimaciones futuras, seutiliza la prueba de la chi-cuadrado para validar la curva de tendencia, lo
cual nos permitirá aceptar o desechar la curva estimada.En temas precedentes, buscamos curvas de tendencia teóricas o
modelos de comportamiento teóricos que podrían ajustarse a lasobservaciones empíricas; estos modelos teóricos más conocidos son: ladistribución triangular, la rectangular, la trapezoidal, la binomial, laPoisson, la normal, etc. Para ver si las observaciones reales que hemosobservado pueden ser explicadas dentro de una de estas curvas teóricas, ocualquier otra curva teórica, se concibe la hipótesis nula de que la curva
de frecuencias observadas con la curva de frecuencias teóricas, coincidenfrente a la hipótesis alternativa de que la curva de frecuencias teóricas esmayor que la curva de frecuencias reales; en el mejor de los casos, lasfrecuencias observadas deberán de coincidir con las frecuencias teóricas,esto es que cada oi = ei; sin embargo, en la vida real, es muy difícil que estosuceda, porque siempre habrá un oi ≠ ei, de donde la diferencia en valorabsoluto, entre ei - oi será mayor de cero. En el mejor de los casosdesearíamos que la suma de los valores absolutos de esta diferencia sea lomás próximo a cero, ya que cuanto más grande sea esta suma, habrá mayordesconfianza de que las frecuencias teóricas coincidan con las frecuenciasobservadas, por lo que deberemos buscar otras ecuaciones que permitandescribir el comportamiento de las observaciones.
Para poder aceptar o rechazar el modelo encontrado se formula elcontraste de hipótesis en los siguientes términos:
H0: oi = ei (las frecuencias observadas coinciden con las teóricas)
H1: ei > oi (las frecuencias teóricas no coinciden con las observadas)Situación que deberá aceptarse o rechazarse de acuerdo a un α.
El estadístico 2r =
n
i
ii
e
eo
1 i
2)( define una distribución chi-
cuadrado con = n – p – 1 grados de libertad, donde n representa elnúmero de clases y p el número de parámetros utilizados para calcular lafunción teórica; es obvio que si la suma de las diferencias: o
i - e
i se hagan
iguales a cero, la curva de frecuencias reales con la curva de frecuenciasteóricas serán exactamente iguales, lo cual es difícil de creer que esosucederá, porque no hay fenómenos sociales que pueden describirseexactamente por modelos matemáticos; en la práctica sucederá que siempre
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 4/42
habrá una pequeña diferencia entre lo estimado y lo observado, el cual será
cuantificado para determinar el 2r .
Para aceptar o rechazar la curva de tendencia con la curva defrecuencias reales, el 2
r debe confrontarse con una expresión teórica, 2
(α, ), que se obtiene de la tabla de la chi-cuadrado para un determinado
nivel de significancia α y grados de libertad; si el valor de 2r es mayor
que el 2(α, ), deberá rechazarse la hipótesis nula en el sentido que la curva
de tendencia teórica no se aproxima a la real, dado que es obvio cuanto másgrande sea esta diferencia, significará que entre el ajuste esperado y la
realidad hay mucho trecho, de otro modo se podrá aceptarlo.En el caso de que las frecuencias esperadas ei sean menores oiguales a cinco, se combinan con la frecuencia teórica de la clase anterior, o posterior, según sea el caso, debiendo en consecuencia, disminuir n en unnúmero igual a los ajustes.
El gráfico ilustra lo manifestado; la línea quebrada indica lasfrecuencias reales observadas, y la línea continua, las frecuencias teóricas.
Fig. 3.1 Frecuencias reales y frecuencias teóricas.
Ejemplo 3.1 Un estudio desarrollado con respecto a la distribución de
edades de un grupo de alumnas de un instituto superior de belleza mostrólas siguientes cifras:
0
5000
10000
15000
20000
25000
30000
35000
1 2 3 4 5 6 7 8
Años observados
C a
n t i d a d d e p l a t o s d e m a n d a d o s
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 5/42
79
Tabla de distribución de edades# Edad de las
alumnasCantidadesobservadas
1 [14 – 17[ 322 [17 – 20[ 40
3 [20 – 23[ 45
4 [23 – 26[ 38
5 [26 – 29[ 39
6 [29 – 32[ 31
¿Podría considerarse que las distribuciones de edades de las alumnas seajusta a una distribución rectangular, considerando un nivel designificancia del 5%?
Solución : Decir que la distribución de edad de las alumnas es una funciónconstante es lo mismo que decir que sigue una distribución uniforme orectangular; por lo tanto para cada valor observado de oi, existe un valoresperado ei único; en la siguiente tabla se muestra las columnas
correspondientes a ei y las expresiones individuales de las sumatorias; losei se obtienen totalizando los oi y dividiéndoles entre n.
Distribución de edades para la prueba de bondad de ajuste
#
I
Edad de las
alumnas en
años
Cantidad
observada
oi
Cantidad
esperada
ei
(oi - ei )2/ ei
1 [14 – 17[ 32 38 0,9474
2 [17 – 20[ 41 38 0,23683 [20 – 23[ 47 38 2,1316
4 [23 – 26[ 38 38 0,0000
5 [26 – 29[ 39 38 0,0263
6 [29 – 32[ 31 38 1,2895
La hipótesis nula es que el comportamiento de las edades de lasalumnas están distribuidas rectangularmente, frente a la alternativa de que
estas no siguen esa distribución.Haciendo cálculos de la tabla, obtenemos que el 2
r es igual a
4,6316, este valor se contrasta 2α, con = n-0-1 = 5 grados de libertad,
donde p = 0, dado que no hay ningún parámetro en una distribución
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 6/42
80
rectangular, y α = 0,05; de una tabla del chi-cuadrado, se obtiene que2
(0,05; 5), = 11,07: por lo tanto, debería aceptarse la hipótesis nula, elsentido que el comportamiento de la edad de las alumnas se pueden
aproximar a una distribución rectangular.
Ejemplo 3.2 Los niveles de ingreso, en miles de soles, obtenidos por unaempresa dedicada a la comercialización de software están en función a losniveles de gastos en publicidad según se muestra en la siguiente tabla:
Gastos Publicidad. S/ 15 18 20 17 25 22 26 28 30 19
Ingresos en miles S/ 50 56 60 52 65 62 60 85 90 61
A fin de conocer el comportamiento teórico de esta relación, un analistaformula una ecuación que permite explicar una relación entre estas dosvariables del siguiente modo:
Ingreso = 13,1524 + 2,3158*Gasto, donde Gasto es la variable
independiente e ingreso la variable dependiente; ¿podría afirmarse que esta
ecuación es confiable para fines de estimación, considerando un probableerror de equivocación de en un 5%?
Solución: Este es un problema que consiste en aproximar elcomportamiento de las observaciones reales a un comportamientoteórico o esperado; en este caso, el comportamiento teórico es unafunción lineal de la forma Y = a + b*X; con la finalidad de estarseguros si la ecuación es aceptable o no, debe validarse haciendo la
prueba del Chi-cuadrado, con un nivel de significancia del 5%. Paraello formulamos la hipótesis nula de que el ajuste es correcto frente ala alternativa de que este no es el más indicado. En la tabla secompara las frecuencias reales con las frecuencias teóricas, de acuerdoa la ecuación indicada.
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 7/42
81
Observ. Gastos Ingreso real Ingreso Teórico
I oi ei 1 15 50 48
2 18 56 553 20 60 594 17 52 525 25 65 716 22 62 647 26 60 738 28 85 789 30 90 83
10 19 61 57
El chi-cuadrado se obtiene aplicando la relación2
r
=n
i
ii
e
eo
1 i
2)( =
4,50; este valor se confronta con lo proporcionado en la tabla del chi para
= n – p – 1 grados de libertad, donde p = 2 y al 5% de nivel designificancia, correspondiéndole al nivel de significancia del 5% un chi-
crítico: χ 2(0,05; 7)= 14,07. Como el valor real es menor que éste, entonces
podemos decir que o existen suficientes evidencias para rechazar lahipótesis nula, por lo que debería aceptarse el ajuste.
Ejemplo 3.3 En horas de mayor afluencia de llegada de cliente a un cajeroautomático de un banco, se registran sus llegadas cada, en un intervalo decada tres minutos. El número de llegadas se contabilizan durante un
determinado número de veces, obteniéndose los siguientes resultados:Tabla: Llegada de clientes al cajero automático de un banco:# clientes que llegan
al cajero
Número de veces
registrado
0 5
1 15
2 32
3 20
4 105 7
Formule un modelo de llegada de clientes a este cajero; validándole al1%.
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 8/42
82
Solución . Este problema puede estar asociado a una distribución dePoisson, dado que se trata del número de eventos ocurridos en un intervalode tiempo; la hipótesis nula tendrá las siguientes características: Las
llegadas de los clientes al cajero automático de un banco se ajustan a unadistribución de Poisson, frente a la alternativa, que estas llegadas no seajustan a esta distribución.
Con los datos de la tabla determinamos el promedio de llegadas de
clientes al cajero automático, esto es: = E(x) = 214/89 = 2,404 clientesllegan en promedio cada tres minutos; la función de probabilidad asociado
a este comportamiento será: P(x) = 2,404xe
-2,404/x!, siendo x la variable
aleatoria, llegada de clientes; con estos datos se obtiene los ei:
X 0 1 2 3 4 5
oi 5 15 32 20 10 7
ei 8,0 19,3 23,2 18,6 11,2 5,3
Deberá contrastarse el chi cuadrado real frente al chi cuadrado teórico yformular la respuesta.
Ejemplo 3.4 Una empresa dedicada a la venta de equipos de cómputo,
lleva el registro de los clientes que acuden a su local, y anota el número deveces que compró un artículo durante un cierto período de tiempo; de estemodo los registros históricos le permiten configurar la siguiente tabla:
Número de veces que el
cliente compra artículos de
cómputo
Cantidad de
clientes que
compran
0 20
1 92
2 1503 134
4 73
5 24
6 5
7 2
Los directivos de la empresa están interesados en formular un
modelo de distribución de probabilidad del comportamiento de compra deestos clientes, con la finalidad de conocer su comportamiento teórico y prever en el futuro; proponga un modelo de distribución adecuado a estascaracterísticas, y valídelo con un nivel de significancia del 5%.
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 9/42
83
Solución. La hipótesis nula es que las frecuencias observadas con lasfrecuencias teóricas deberían coincidir, frente a la alternativa, de que lateórica no concuerda con la empírica proporcionando un alto margen de
error. La situación observada hace intuir que el comportamiento del modelode distribución de probabilidad debería ajustarse a una binomial, ya que elcliente puede comprar o no los artículos de cómputo. El promedio de vecesen que un cliente compra es E(x) = (0*20 + … + 7*2)/500 = 2,50 donde xes la variable aleatoria número de veces que compra; como estamosinteresados en ajustarlo a una binomial, = E(x) = np; donde n es igual a 7,de esta ecuación extraemos que la probabilidad de que el cliente puede
comprar es p = n
)x(E = 0,3571, y de que no puede comprar es q = 0,6429.
La función de probabilidad de la binomial está definido por:
f(x) = 7Cx 0,3571x0,6429
7-x, con x = 0, 1, 2..,7 clientes. Con estos
resultados se obtiene los valores esperados de clientes que acudirán acomprar al local comercial; la siguiente tabla proporciona esta información:
x 0 1 2 3 4 5 6 7
oi 20 92 150 134 73 24 5 2
ei 22,7 88,2 147,1 136,1 75,6 25,2 4,7 0,4
Las columnas 6 y 7 se integran en una sola, dado que lafrecuencia esperada de la última es menor de 5; los grados de libertad
se determinan: = 6-1-1 = 4.
El chi cuadrado real es:2r
=n
i
ii
e
eo
1i
2)( = 2,59, el cual
contrastado con el proporcionado por tabla a un nivel de significancia del
5% se obtiene: χ 2(0,05; 4) = 9,49; con estas confrontaciones podemos extraer
la conclusión de que la curva de tendencia del comportamiento de comprade estos clientes se puede ajustar a una distribución binomial, por lo tantono deberíamos rechazar la hipótesis nula.
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 10/42
84
3.2 Pruebas de Contingencia
Cuando queremos saber si dos variables con diferentes categorías,
están asociadas o son independientes, se utiliza la prueba de contingencia;se dice que una variable tiene diferentes categorías, cuando tiene unconjunto de componentes; así la variable color, puede tener los siguientescomponentes: rojo, verde, blanco, amarillo, etc.; la variable gusto puedetener las siguientes categorías: aceptable, no aceptable, desagradable,insípido, etc. Los siguientes casos ilustran la necesidad de desarrollar estetipo de pruebas:a) Un determinado candidato presidencial, podría estar interesado en
saber si los diferentes grados de aceptación, están relacionados entrelos diferentes grupos socioeconómicos de la sociedad.
b) Nos interesaría saber, si los diferentes incentivos ofrecidos a lostrabajadores de una empresa, como vacaciones pagadas, remuneraciónextra, promoción a nuevas plazas o reconocimiento especial, en losdiferentes turnos de trabajo, tienen relación directa con los niveles de productividad lograda dentro de un período de tiempo observado.
c) Podríamos estar interesados en saber si la asistencia a los conciertos periódicamente en los teatros están asociados a los grupos de edad delos asistentes y su formación académica.
d) Podríamos estar interesados en saber si el rendimiento académico delos alumnos está relacionado con el horario de los cursos ofrecidos, seamañana, tarde o noche.
e) Podríamos estar interesados en saber si la compra de un determinado producto, está relacionado con la forma de su presentación y el grupo
ocupacional del cliente, etc.
En cada uno de estos casos se trata de saber si ambas variables sonindependientes o son dependientes; si son independientes, diremos que unono tienen nada que ver con el otro; sin embargo en el caso de serdependientes, entonces diremos que hay una relación entre ellas; el conoceresta relación nos permitirá tomar las decisiones respectivas.
Para resolver esta duda se construyen dos matrices rectangulares,
una para los valores observados y otra para los valores esperados; en lafila se representa a una variable con sus respectivas categorías y en lacolumna a la otra variable con sus respectivas categorías, también; en lasceldas de cada una de las matrices se contabilizan los valores observados ylos valores esperados. La siguiente tabla proporciona la matriz planteada.
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 11/42
85
Tabla: Matriz de contingencia, observada, para evaluar la
relación de dependencia entre dos variables.
Variable A
Variable B↓ Elem 1 Elem 2 Elem 3 …… Elem kValor 1 O11 O12 O13 ….. O1k
Valor 2 O21 O22 O23 ….. O2k
.. . . . ….. .
Valor c Oi1 Oi2 Oi3 ….. Oik
Los Oij, donde j = 1, 2, …, k; i = 1, 2, ….r, representan los valores
observados para cada categoría de las variables; en el caso de esta tabla, lavariable A tiene como categorías hasta los Elem k, y la variable B, tienecomo categorías hasta Valor c.
Para hacer la prueba de independencia de las dos variables, seconcibe el contraste de hipótesis en los siguientes términos: H0 = Ambasvariables son independientes, frente a H1 = Ambas variables no sonindependientes; la matriz de valores esperados tendrá las mismasconfiguraciones, con las siguientes características:
Tabla: Matriz de contingencia, esperada, para evaluar larelación de dependencia entre dos variables.
Variable A
Variable B Elem 1 Elem 2 Elem 3 …… Elem k
Valor 1 e11 e12 e13 ….. E1k
Valor 2 e21 e22 e23 ….. e2k
.. . . . ….. .
Valor c ei1 ei2 ei3 ….. eik
Donde cada elemento esperado eij se determina del siguientemodo:
eij =total Gran
jcolumnaTotal i FilaTotal
_
_ _ * _ _ ; se entiende que estos
totales, para filas y columnas, corresponden a los valores observados;
además, Gran_total =
c
i
k
j
ijo1 1
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 12/42
86
El estadístico 2r =
c
i
k
j ij
ijij
e
eo
1 1
2)( sigue una distribución chi
cuadrado con = (k-1)*(c-1) grados de libertad; este valor deberá sercontrastado con lo proporcionado de una tabla del Chi cuadrado, 2
c( , ) a
un nivel de significancia α y grados de libertad. La relación dedependencia de ambas variables deberá ser aceptada si el estadístico esmayor que el obtenido de la tabla; de otro modo, es de prever que las dosvariables son independientes; es decir que los valores obtenidos nada tienenque ver con las categorías de ambas variables.
Ejemplo 3.5 Un grupo de inversionistas están interesados en saber siexiste una relación entre los platos típicos ofrecidos en un restaurantecampestre, con el grupo ocupacional de las personas, de modo que ello le permitirá ampliar o no sus instalaciones actuales; para ello toma unamuestra de un grupo de clientes, y anota los platos seleccionados según enconcordancia a su grupo ocupacional; encontrándose los siguientesresultados:
Número de personas, clasificados en su grupo ocupacional, queconsumieron los platos típicos en el restaurante campestre
Platos típicos consumidosGrupoOcupacional
Pachamanca Cevichede pato
SopaHuachana
Cuypicante
Comerciante 10 6 15 17Empresario 8 12 11 10Profesional 14 18 4 9
Estudiante 3 13 8 5¿Podría asegurarse que los platos típicos consumidos por los clientes,están relacionados con su grupo ocupacional?, asumiendo un riesgo deequivocarse del 5%, y del 1%.
Solución: El contraste de hipótesis deberá hacerse en los siguientestérminos:Hipótesis Nula: La preferencia por los platos típicos de los clientes, nada
tiene que ver con su grupo ocupacional (Ambas variables sonindependientes).Hipótesis Alternativa: La preferencia por los platos típicos de los clientesestá relacionada con su grupo ocupacional.
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 13/42
87
Para rechazar o aceptar la hipótesis nula, deberá calcularse el2r para ello
se necesita primeramente obtener su matriz esperada:
Matriz esperada de clientes que consumieron los platos típicos,
clasificados según su grupo ocupacional, en el restaurante
campestre.
Platos típicos consumidosGrupo
Ocupacional
Pachamanca Ceviche
de pato
Sopa
Huachana
Cuy
picante
Comerciante 10,3 14,4 11,2 12,1Empresario 8,8 12,3 9,6 10,3Profesional 9,7 13,5 10,5 11,3
Estudiante 6,2 8,7 6,8 7,3
Donde cada elemento eij de la celda se obtuvo aplicando la relación eij =
total Gran
jcolumnaTotal i FilaTotal
_
_ _ * _ _ ; con el conjunto de los datos de
ambas matrices, desarrollando la sumatoria2
r
=c
i
k
j ij
ijij
e
eo
1 1
2)( se
obtiene que es igual a:2r = 21,09.
Al contrastar α con = 5%,2
c(0,95,9)
= 16,92; significa que deberíamos
aceptar la hipótesis nula, de que el consumo de los platos típicos nodepende del grupo ocupacional de la persona.
Al contrastar α con = 1%,2c(0,99,9)
= 21,67; en este caso, observamos que
el2r
está dentro de la zona de rechazo de la hipótesis nula, por lo que
deberíamos rechazarlo, en el sentido que deberíamos aceptar la hipótesisalternativa de que el consumo de los platos típicos, está asociado al grupoocupacional del cliente. Explique las razones de estas dos aparentescontradicciones.
PPrroobblleemmaass ddee aa j juusstteess ddee ccuurrvvaass yy pprruueebbaass ddee ccoonnttiinnggeenncciiaa
3.1 ¿De qué manera pueden aproximarse observaciones empíricas acomportamientos teóricos?
3.2 ¿Puede considerarse que una observación real, coincide exactamentecon una distribución teórica; sustente su respuesta?
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 14/42
88
3.3 Suponiendo que una serie de observaciones sean ajustadas a unadistribución normal, ¿cuántos parámetros deberán utilizarse paradicho ajuste?
3.4 Una empresa cuenta con una plana heterogénea de personal encuanto a su experiencia laboral; de este modo ha clasificado lasiguiente tabla experiencia laboral en años, dentro y fuera de lainstitución:
Ex. Años 0 – 5 5 – 10 10 – 15 15 – 20 20 – 25 25 – 30 30 – 35
# Traba. 50 40 32 24 16 12 7
Ajuste estas observaciones a una distribución triangular validándoloal 5%.
3.5 El servicio de emergencia de un hospital presenta un resumen dellegada de personas accidentadas por causas de tránsito según semuestra en la tabla:
Número de personas ingresados
por emergencia0 1 2 3 4 5
Número de veces observado 6 25 36 21 15 7
a) Determine el número promedio de pacientes ingresados por
día, así como su desviación estándar. b) Encuentre una curva de tendencia del comportamiento dellegada de pacientes, y valídelo al 5%
3.6 Con la finalidad de conocer la distribución de edad de los alumnosde un centro educativo de nivel superior se confecciona la siguientetabla:Cuadro de distribución de edad de los alumnos del CE
Edad de los alumnos en
años
N° de alumnos
14 – 17 35
17 – 20 39
20 – 23 50
23 – 26 42
26 – 29 38
29 – 32 30
¿Existe suficiente evidencia como para decir que la edad de estos
alumnos sigue una distribución uniforme? R: χ 20,05; 5 = 11,07
χ 2 r = 5,8462
3.7 Un alumno está tratando de construir un modelo de distribución de probabilidades del comportamiento de llegada de clientes al cajero
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 15/42
89
automático de un banco de la localidad; para ello se pone a observarla llegada de estos al cajero cada cinco minutos, lo cual le permiteconfeccionar el siguiente cuadro de llegadas:
Llegadas de clientes al cajero automático del Banco XXXLlegan clientes cada
cinco minutos
Cantidad de clientes que
llegaron
0 12
1 45
2 34
3 21
4 13
5 8
Ayude a construir al alumno un modelo de distribución de probabilidad de llegadas, validándole respectivamente; consideraun nivel de significancia del 5%.
3.8 El promedio de notas de los alumnos de ingeniería, obtenidos en elcurso de Lenguaje de Programación durante el ciclo pasado, estántabulados en la siguiente tabla:Notas obtenidas
por los alumnos
Número de alumnos
observados
[ 0 – 4[ 8[ 4 – 8[ 13[ 8 – 12[ 20[12 – 16[ 10[16 – 20[ 4
Encuentre una curva de comportamiento teórico del comportamientode estas notas, y valídelo al 1%.
3.9 ¿Para qué se desarrolla una prueba de contingencia?3.10 ¿Qué significa decir que las variables son independientes, en una
prueba de contingencia?3.11 ¿De qué manera se puede validar una prueba de contingencia?3.12 Explique el significado de que dos variables son dependientes, luego
de desarrollar la prueba de contingencia.3.13 Una compañía de seguros tiene que optar por escoger dentro de cuatro
planes de seguros de vida que actualmente ofrece a sus clientes; paraello desea conocer si la preferencia por algún plan de seguros de susclientes está asociada al nivel ocupacional en ejercicio. Se toma unamuestra aleatoria de un grupo de clientes usuarios de este plan,obteniéndose los siguientes resultados:
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 16/42
90
Plan de seguros optados por los clientes
Nivel ocupacional A B C D
Obreros 30 45 35 70
Comerciantes 48 39 47 65Profesionales 59 46 52 60Independientes 20 15 10 22
a) ¿Podría asegurarse que el plan de seguros optado por los clientesnada tiene que ver con los tipos de clientes?, considere un riesgode equivocarse del 1%.
b) ¿Qué debería pasar para decir que el plan de seguros optados porlos clientes, está asociado a su nivel ocupacional, considerando un
riesgo de equivocarse del 5%?3.14 Un canal de televisión está interesado en saber si los programas que
transmite día a día influyen en el grado de conducta de su teleaudiencia; para tales fines selecciona una muestra aleatoria de ungrupo de televidentes de diferentes grupos de edades, y los somete auna prueba psicológica, después de un período de observación,encontrándose los siguientes resultados:Nivel de conducta observada en una muestra de televidentes, como
resultado de sus programaciones, de la Empresa Televisiva XXXX
Grupo de
personas
Muy
agresivo
Agresivo Normal Hiperactivo
Niños 15 28 22 20Jóvenes 24 14 20 17Adultos 10 12 24 14Tercera edad 6 16 14 9
¿Podría asegurarse que existe una relación entre el nivel de conductade los grupos de edades de las personas y la programación emitida porla empresa televisiva, asumiendo un riesgo de equivocarse del 5%?
3.15 Una empresa textil trabaja a tres turnos, en razón de que debesatisfacer fuertes pedidos de sus clientes provenientes del exterior; sinembargo el departamento de control de calidad alega que este sistemade trabajos no es conveniente dado que frecuentemente encuentranfallas de calidad en las prendas confeccionadas por sus trabajadores, lo
cual puede perjudicar la imagen de la empresa ante sus clientes. A finde determinar si realmente existe este tipo de problemas como lo alegacontrol de calidad, se toman muestras aleatorias de un grupo detrabajadores de loa diferentes turnos y se les evalúa sus respectivos
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 17/42
91
trabajos, y determinar el número de fallas encontradas en las prendas producidas; los resultados de estos se encuentran en la siguiente tabla:Resultados del muestreo hecho a una muestra de trabajadores, para
determinar el número de fallas encontrados en las prendasconfeccionadas
Estado de las prendas
confeccionadas
Mañana Tarde Noche
Mal 5 3 11Regular 4 12 6Aceptable 16 9 7Ninguna 7 5 3
¿Podría asegurarse que lo manifestado por el departamento de controlde calidad es válido y no trabajarse con este sistema de turnos, o esque estos problemas pueden deberse a otros factores?; considere unriesgo de equivocarse del 5%.
3.16 Ante el advenimiento de las próximas elecciones para elegir al nuevo presidente de la república, los tres partidos políticos más voceados porlas empresas encuestadoras, deciden implementar un nuevos spot publicitario a través de la TV, con la finalidad de influir en el ánimo de
la población electoral que aún se mantienen indecisos o no les interesael proceso electoral. Después de una semana de lanzado este spot seencarga a una encuestadora desarrollar un estudio sobre los efectos deéste en el ánimo de los electores; la empresa selecciona una muestra deelectores y recoge sus opiniones acerca del spot, obteniendo lossiguientes resultados:Estado de ánimo de los electores, respecto a los partidos políticos A, B, y
C, como resultado del lanzamiento del nuevo spot publicitario .PARTIDOS
ESTADO DE
ANIMO
A B C
Muy a gusto 10 12 9Gustoso 7 8 12No le gusta 6 9 6No le interesa 13 10 12
¿Podría asegurarse que el spot publicitario, influyó en el estado deánimo de los electores, o es que esto nada tiene que ver con ese estadode cosas? Sustente su respuesta considerando una probabilidad deequivocarse con el 5%.
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 18/42
92
3.17 Se quiere establecer si existe una relación entre la duración de losdiscos duros y los distintos lugares donde son utilizados, dado que por parte de los clientes que los utilizan, sobre todo en la sierra,
donde hace mucho frío, dicen que estos discos, después de un período corto de vida, empiezan a tener problemas en sus pistas,debiéndose hacer continuas reparaciones, con el Scan Disk; paradescartar las afirmaciones de los clientes quejosos, se decide hacer pruebas de confiabilidad de los discos duros de las marcasQuantum, Maxtor, Fireball o Seagate, en diferentes lugares que presentan climas propios, como climas fríos, muy fríos, templados,cálidos, y muy calurosos; estos discos duros, después de un tiempode uso, deberá registrarse el número de veces que fue reparado conel Scan Disk. Los resultados de este ensayo se muestran en lasiguiente tabla:Número de veces que fueron sometidos a un proceso de Scan Disk los
discos duros, en concordancia al clima donde fueron expuestos:
Tipo de clima Quantum Maxtor Fireball Seagate
Frío 12 10 8 13Muy frío 15 9 13 10Templado 9 11 12 12Cálido 11 9 9 13Muy cálido 13 13 12 8
¿Con estos resultados, podría darse la razón a los clientes quejosos, o esque estos casos solo son problemas provenientes de la casualidad?Considere un nivel de significancia del 1%
3.18 Analizando el problema de la contaminación del medio ambiente,realizado por las personas en la provincia de Huaura, los alumnos delV ciclo de Ing. Informática de la Universidad se abocan a averiguar sila manera cómo las personas que contaminaban el medio ambienteestaban relacionados con su nivel cultural; para ello muestrearon a ungrupo de personas, de diferentes grados de instrucción y losrelacionaron con las diversas modalidades de contaminar el medioambiente, contabilizando el número de veces que contaminaban, en un
determinado período de tiempo; los resultados de esta investigación semuestran en la siguiente tabla:Tabla. Número de veces que contaminaban el medio ambiente deacuerdo a sus diferentes niveles culturales.
Diversas modalidades de contaminar
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 19/42
93
Nivel
Cultural
Escupe Tira
papeles u
otros
Orina en
la calle
Fuma
Primaria 13 8 7 5Secundaria 15 10 3 11
Superior
Incompleta
9 15 4 10
Profesional
Universitario
5 12 2 16
A la luz de estos resultados, formúlese una teoría y generalícese para
la población de la provincia, asumiendo un riesgo de equivocarse del5%.3.19 ldll
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 20/42
94
Sección 4Frases para meditar:
Nunca soplarán vientos favorables
para el que no sabe a dónde va.
La esencia de su problema es el
reconocimiento exterior. Dedique
gran parte de su tiempo a buscar
un experto externo que pueda
certificar su creatividad.
Si uno quiere salir adelante en una
sociedad grande, tiene que ser
político, tiene que hacer amistades,
pero nunca olas.
Hay que cuidar del mañana por
todos los medios, meditando,
proyectando, y preparándose pero
sin ansiedades.
Análisis de Varianza
Diseños experimentales.
Consideremos el siguiente caso: Por lo general, en el sistema
educativo de nuestro medio, tenemos problemas de bajo rendimientoacadémico de los alumnos, al margen de que en algunas instituciones se lasmaquille con otros tipos de formalidades, esto es una constante que año trasaño agobia a nuestra educación nacional, cuyos resultados de la malaeducación peruana son manifestadas negativamente el contextointernacional; se podría ensayar una serie de respuestas que expliquen elcomportamiento de estas actitudes, así como también proponer una seriede medidas con la finalidad de elevar el bajo rendimiento académico de los
alumnos; ahora vayámonos a un lugar más específico, una universidad,supongamos que las autoridades universitarias son conscientes de esta problemática y desean elevar el nivel académico de sus alumnos, para ello proponen otorgarles una serie de premios de modo que les estimule a sercada vez mejor y lograr los premios establecidos; se plantean lo siguientes
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 21/42
95
premios estímulos a los estudiantes: Comedor universitario, Estipendioeconómico, Viajes promocionales, R econocimiento público, Bolsas detrabajo; como no se sabe si éstos premios tendrán efecto positivo en la
elevación del rendimiento académico, se desea probar durante un ciclo, primero con una muestra seleccionada al azar de una población estudiantil,y sin que éstos sepan la naturaleza de la investigación, a cada alumno se leasigna un número entre uno y treinta, y se le otorga un solo premio de loofrecido; finalizado el ciclo se evalúan estos resultados, que deberánreflejarse en el rendimiento académico de cada uno de ellos y el promediogeneral por cada premio ofrecido; la evaluación y contraste de estosresultados permitirán confirmar o desechar las suposiciones de lasautoridades universitarias; los resultados de la investigación, podríanmostrarse como en la siguiente tabla:
Tabla 4.1 Promedio del rendimiento académico de la muestra de
alumnos, de acuerdo a los premios ofrecidos por la universidad XXX.
Comedor Estipendio Viajes Reconoc. Bolsa t.
A12 A7 A22 A1 A18
A29 A11 A3 A14 A2 A15 A25 A6 A10 A17
A8 A13 A12 A27 A4
A5 A24 A19 A28 A30
A26 A23 A9
A21 A20
µ1 µ2 µ3 µ4 µ5
Los sub índices de la variable A, indican los promedios de notas por cada alumno seleccionado al azar y asignado también al azar a cada unode los premios ofrecidos; es preciso indicar que cada alumno es beneficiario de un solo premio, así como que tampoco interesa que cadauno de los premios ofrecidos contengan iguales cantidades de alumnos. Alfinal de cada columna se tienen los promedios generales µi por el grupo de premios ofrecidos.
Este ejemplo constituye un tipo de experimento donde intervienen
una serie de variables independientes que pueden ser controlados ymanipulados por el investigador, en este caso diferentes premios ofrecidos por la universidad, el cual, cuyos resultados finales nos interesará conocer
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 22/42
96
para decidir por una opción; para seguir adelante, es necesario conocer laterminología utilizada en este tipo de diseños experimentales.
Un experimento consiste de una serie de actividades que se
desarrolla con la finalidad de producir un conocimiento u obtener algunainformación; para ello se utilizan variables independientes que elinvestigador puede manipular a su antojo, a cada uno de ellos se les llama tratamiento ; para nuestro caso, las variables independientes estánconstituidos por los diferentes premios que la universidad ofrece comoestímulo para elevar el rendimiento académico; una variable dependiente es el resultado del manejo de la variable independiente, y es lo que se buscaconocer; una unidad experimental es el elemento individual al que se leaplica al tratamiento; en este caso la unidad experimental viene a constituirel alumno, cuyo resultado o valor dependiente será expresada en una ciertaunidad de medida ; si continuamos con el ejemplo, entonces podemosmanifestar que el resultado de la medición, se expresará en una nota.
A continuación veremos algunos modelos de diseñosexperimentales más conocidos; éstos son el diseño completamentealeatorizado, diseño de bloques al azar, diseño factorial, y cuadrado latino.
Diseño completamente aleatorizado
En un diseño de este tipo, las unidades experimentales sondistribuidas al azar a solo un tratamiento, y lo que se busca es saber si losresultados del tratamiento permitieron mejorar el estado actual de las cosas;si nos referimos al ejemplo del caso anterior, es evidente que nos interesarásaber, si como efecto de los diferentes premios estímulos ofrecidos a los
alumnos, al finalizar el período de evaluación, por lo menos, con uno de lostratamientos, el promedio de notas será mayor que con las de los otrostratamientos; si así lo fuese, entonces diremos que el experimento valió la pena, por lo que debería implementarse el premio que permitió que con ellose mejorara el rendimiento académico de los alumnos; en términos decontraste de hipótesis, esto se puede plantear del siguiente modo:
H0: Todos los promedios seguirán siendo iguales, por lo tanto esindiferente ofrecer uno u otro premio, dado que el rendimiento
académico de los alumnos seguirá siendo el mismo.H1: Por lo menos uno de los promedios será mayor que los otros, lo
cual significará que es conveniente ofrecer este tipo de premios para mejorar el rendimiento académico de los alumnos.
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 23/42
97
Para construir un modelo matemático, consideremos el caso generalde tener k tratamientos, donde se eligen al azar las unidades experimentalesy son distribuidas, también, al azar a cada uno de los tratamientos; estas
unidades experimentales generarán un resultado yij, tal como el que semuestra a continuación:
Tabla 4.2 Diseño completamente aleatorizado para un
experimento consistentes de k tratamientos.Tratamientos:
1 2 3 . . . j . . . k
y11 y12 y13 . . . y1j . . . y1k
y21 y22 y21 . . . y2j . . . y2k
. . . . . . . . . . .
. . . . . . . . . . .
yi1 yi2 yi3 . . . yij . . . yik
. . . . . . . . . . .
yn1 yn2 yn3 . . . ynj . . . ynk
Total T.1 T.2 T.3 . . . T.J . ..
T.K
Media y.1 y.2. y.3 . . . y. j y.k Varianza S.1
2 S.22 S.3
2 . . . S. j
2 . . . S.k 2
Donde: yij es la medida iésima para el tratamiento ji = 1, 2, 3, . . . , n. j = 1, 2, 3, . . . , k.T. j = suma de todas las medidas del tratamiento j.Ῡ. j = Promedio de las medidas del tratamiento j.
S. j2
= Varianza de las medidas del tratamiento j.T.. = total de las medidas de los y ij.Ῡ.. = promedio de todas las medidas de los yij.S2 = varianza de todas las medidas de los yij.
Por cada tratamiento obtenemos su total, su promedio y surespectiva varianza, así como también obtenemos por el conjunto el grantotal T.., la media general Ῡ.., y la varianza general S
2.Si continuamos analizando estos datos, podríamos darnos cuenta
que la variabilidad total de los datos, dependerá de la variación de datosentre los tratamientos y la variación de datos dentro de cada tratamiento; dehecho, cuanto mayor sean los tratamientos, y dependiendo cómo estosdatos se distribuyen dentro de los tratamientos, la variación general estaráinfluenciada por estos comportamientos.
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 24/42
98
La variabilidad entre los tratamientos determina la forma cómo lasmedias de las muestras de estos tratamientos difieren entre sí, y lavariabilidad dentro de los tratamientos, determina la manera en que las
observaciones varían respecto a las medias de cada tratamiento; estasexpresiones se demuestran analíticamente del siguiente modo:yij – y.. = desviación de los datos respecto a la media total.yij – y.j = desviación de los datos respecto a la media del tratamiento j.Restando las dos expresiones:(yij – Ῡ..) – (yij – y.j); el resultado de esta resta será:(yij – Ῡ..) – (yij – y.j) = (y.j – Ῡ ..), o sea:(y.j – Ῡ..) = (yij – Ῡ..) + (yij – y.j)
Elevando al cuadrado ambos miembros:(y.j – Ῡ..)2 = ((yij – Ῡ..) + (yij – Ῡ.j))
2 , desarrollando los cuadrados:
SCT = SCTR + SCF + SCEDonde:
SCT = – C; siendo C =SCTR = - C
SCF = - C
SCE = SCT – (SCTR + SCF)Su tabla ANVA, contará con la siguiente información:
Fuente SC g.l CM Fr
Tratamiento SCTR k-1 CMTRError SCE n-k CME Fr =
TOTAL SCT n-1
Donde CMTR =
CME =
Este Fr calculado deberá contrastarse con un Fc(α, c-1, (k-1)*(c-1)); dondeα es el nivel de significancia, y de acuerdo a ello, tomar la decisión
respectiva.
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 25/42
99
Ejemplo 4.1 Consideremos que el rendimiento académico de los alumnosen el curso de Matemática es bajo; las autoridades académicas consideranque ese bajo rendimiento se debe a que el dictado del curso se hace en un
horario inadecuado, y para mejorarlo se hace un nuevo planteamientoreplanteando el horario; para ello se propone cinco nuevos horarios, comolos siguientes: 08:00 – 11:00, 10:00 – 13:00, 14:00 – 17:00, 16:00 – 19:00,y 18:00 – 21:00; para ver la efectividad de esta nueva reprogramación, seselecciona una muestra de alumnos que llevarán el curso, a los cuales se lesasigna aleatoriamente uno de los horarios establecidos; finalizado el dictadodel curso se evalúan las notas obtenidas, encontrándose los siguientesresultados.
08:00 – 11:00
10:00 –
13:00
14:00 –
17:00
16:00 –
19:00
18:00 –
21:00
Problemas de Análisis de Varianza: diseño completamentealeatorizado.4.1 Nombre y explique las tres fuentes principales de datos de que
puede disponer un investigador.4.2 Describa un proyecto de investigación dentro del campo de su
carrera profesional, de modo que pueda utilizar los datos generados por las actividades de la organización, en un diseño experimental.
4.3 Describa un proyecto de investigación en el área de la informática,donde requiera el diseño de un experimento completamentealeatorizado y determine el objetivo de este tratamiento.
4.4 ¿En qué consiste un diseño completamente aleatorizado?
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 26/42
100
4.5 Defina los siguientes términos: a) Experimento b) Variableindependiente c) Variable dependiente d) Tratamiento e)Unidad experimental.
4.6 Describa un diseño completamente aleatorizado en los siguientescampos del desarrollo social: a) Educativo b) Social c)Agronómico d) Nutricional e) Ing. informática
4.7 El gerente de producción de una empresa está preocupado por el bajo rendimiento de sus trabajadores; con la finalidad de elevarlos, propone introducir algunas medidas correctivas tendientes aincentivar el mejor desempeño laboral, y por ende, mejorar la producción; estas medidas correctivas son sometidas a un grupo detrabajadores seleccionadas aleatoriamente, y sin que éstos sepan lanaturaleza de la investigación, son también distribuidos al azar asolo uno de los incentivos ofrecidos; después de un tiempodeterminado evalúa los resultados y en base a ello adopta lasrespectivas medidas. Formule un modelo matemático para esteexperimento, considerando las medidas correctivas necesarias aintroducirse e indicando los pasos a desarrollar para obtener laconclusión.
4.8 Una nueva empresa vinculada al negocio informático estáinteresada en abrir nuevas sucursales en los diferentes ámbitos del país, con la finalidad de impartir enseñanza en ciencias de lacomputación; los posibles lugares donde se abrirían estos negociosson: Arequipa, Trujillo, Cajamarca, Chiclayo, Cusco y Huancayo;en vista de que carece de información sociocultural de cada uno delos lugares, selecciona muestras aleatorias de posibles candidatos de
cada lugar a fin de someterlos a una prueba de percepción deconocimientos, los cuales son cuantificados en notas que van de ceroa veinte, cuyos resultados se muestran en la siguiente tabla:Tabla: Calificativos obtenidos por los candidatos seleccionados poruna Prueba de percepción, desarrollada durante el período….. LugaresArequipa 12,6 08,5 12,4 13,2 07,2Trujillo 11,5 12,2 10,2 07,7 11,5 10,7 13,6 11,6 08,7
Cajamarca 09,2 13,1 13,2 09,8 11,7Chiclayo 14,2 11,6 10,1 10,2 14,4 13,4Cusco 15,1 12,3 12,5 11,8 16,2 05,5 12,2 10,3Huancayo 13,3 10,7 11,2 10,9 12,8 11,5 07,5
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 27/42
101
¿Podría asegurarse, que los potenciales candidatos, mantienendiferentes percepciones de conocimientos, asumiendo un riesgo deequivocarse del 5%?
4.9 Con la finalidad de reducir los niveles de colesterol en la sangre delas personas mayores de los treinta años, se diseñan cinco tipos dedietas con diferentes formulaciones, los cuales son sometidas a ungrupo de personas que tenían altos niveles de colesterol, durante un período de cuatro meses; pasado este tiempo se les vuelve a medir yse encuentra los siguientes resultados:
Niveles de colesterol en la sangre de una muestra personas, seleccionadas al
azar, sometidos a base de las principales dietas:
Verduras Pescado Carne Granos203 217 205 200
263 220 231 204
205 198 233 245
222 234 198 210
299 250 210 216
201 200 216 205
242 201 208 205238 242 212
240 217
¿Constituyen estos resultados, suficiente evidencia como paramanifestar que los niveles de colesterol en la sangre de las personasson iguales, pese a la diversidad de dietas; considere un nivel designificancia del 5%?
4.10 Se quiere verificar la eficiencia de tres tipos de abonos químicos
como la úrea, el nitrato y el fosfato, en el rendimiento del cultivo dela papa; para ello se selecciona diferentes tipos de parcelas con lasmismas dimensiones, y se les somete a un tipo de tratamiento, acada parcela con un solo abono de los mencionados; al finalizar lacosecha, los rendimientos de papa en kilos obtenidos por cada parcela fueron:
Abono Rendimiento de papa por parcelas en Kilos
Urea 100 120 116 98 95
Nitrato 120 98 103 100 107 118Fosfato 97 100 94 121 110
Use un nivel de significancia del 1% para poner a prueba si haydiferencia entre los rendimientos de parcela según los tipos defertilizantes utilizados en la cosecha.
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 28/42
102
4.11 Un profesor de Inferencia Estadística enseña el mismo curso en lasescuelas académicas profesionales de Ing. de Sistemas, Ing.Informática e Ing. Industrial. El decano de la facultad cree que el
profesor tiene diferentes criterios de evaluación a los alumnos deestas escuelas ya que manifiesta que en unas de estas se observamayores calificativos que en las otras; el mencionado profesor en sudefensa manifiesta que las diferencias de notas se deben al interés delos alumnos por el curso.Con la finalidad de desvirtuar malos entendidos, se muestrea a ungrupo de alumnos que llevaron el curso obteniéndose los siguientescalificativos:Ing. Sistemas 13 11 09 10 14 12Ing. Informática 10 14 15 08 12 10Ing. Industrial 11 09 13 12 12 13Refútese la opinión del decano, o en su defecto, confírmelo;considere un riesgo de equivocarse del 5%.
4.12 Una empresa educativa seleccionará un tipo de chisguete de tinta para sus impresoras de inyección de tinta, para ello recibe unacotización de cuatro casas comercializadoras que distribuyendiferentes marcas (Epson, Canon, LexMark, y HP); a la empresa leinteresa aquella marca que le proporciona mayor durabilidad en lasimpresiones; para ello selecciona una muestra aleatoria de un grupode chisguetes y los prueba hasta que se agoten las tintas, para elloestablece como parámetro de referencia la cantidad de hojasimpresas, encontrándose los siguientes resultados:Cantidad de hojas impresas con las mismas características de la
muestra de chisguetes obtenidaHP 206 200 184 199 230EPSON 187 198 208 217 205LEXMARK 230 185 198 200 199CANON 195 215 215 207 195
Con los actuales conocimientos que posee, ¿qué sugerencias proporcionaría a los directivos de la empresa a la luz de estos
resultados?; considere un nivel de significación del 1%.4.13 Se está tratando de averiguar si los efectos de la altitud influyen en
la presión sanguínea de un grupo de personas que gustan viajar a las partes más altas de la sierra de Lima. Los resultados en muestras en
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 29/42
103
un grupo de personas, según grupos de edades, indicaron lassiguientes presiones:Presión sistólica de una muestra de personas, que viajan a la sierra,
según grupo de edades:Jóvenes Adultos Adultos mayores
90 123 90110 100 104105 115 118108 110 100120 90 105115 95
Demuestre si las presiones sistólicas logradas por estas personas, pueden estar influenciadas por la altitud.
4.14 Generalmente en la época de los exámenes, los alumnos de unauniversidad afrontan ciertos comportamientos fuera de lo común; para poder estudiar si este tipo de actitud les afecta su presiónarterial, se decide hacer un estudio; previo a ello el departamento de bienestar universitario determina que hay cuatro categorías deconducta de los alumnos, como: los relajados, los tensos, los muytensos, y los normales; los resultados obtenidos se muestran acontinuación:Nivel de presión arterial de los alumnos de la universidad YYY, dentro
de la semana de exámenes, de acuerdo al tipo de conducta mostrado.
Conducta
Relajado 110 118 120 125Normal 120 120 115 130 121 120Tenso 125 130 125 135 140Muy tenso 130 140 140 125Explique las conclusiones que podrían obtenerse como resultado deeste trabajo, considerando un riesgo de equivocarse del 2,5%
4.15 Una entidad financiera está interesado en determinar si el nivelacadémico de los postulantes, que anualmente se presentan alconcurso de prácticas pre profesionales que la entidad ofrece comoun paso previo a la incorporación de los futuros profesionales a su
staff, depende de la procedencia de la universidad. Para ello,selecciona una muestra de postulantes que se presentaron a la últimaconvocatoria, procedentes de las universidades: La Católica, UNI,San Martín de Porres, y San Marcos; a dichos postulantes se les
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 30/42
104
somete a una prueba de conocimientos con calificativos de 0 a 100,obteniendo los siguientes resultados:Calificativo de los postulantes según procedencia de la universidad.
PUC 87 54 66 78 50UNI 67 65 89 58 80UNMSM 45 56 85 92 64SMP 78 70 85 76 74
¿Es posible afirmar que estos puntajes, están asociados a launiversidad de donde provienen? Considere un nivel designificación del 5%.
4.16 Una empresa multinacional desea contar con nuevo “pool” de
ingenieros en las especialidades de industriales, informáticos y desistemas, a fin de entrenarlos y enviarlos a sus diferentes filiales; sinembargo el Administrador de Personal considera que estos profesionales no tienen el mismo grado de responsabilidad y puntualidad en el desempeño de sus funciones, debido a que cuentacon una base de datos que permite sustentar su posición. La gerenciadecide averiguar si es correcto lo que manifiesta el Administrador, para ello extrae aleatoriamente de la base de datos, el historial de ungrupo de ingenieros correspondientes a estas especialidades,encontrándose los siguientes resultados:Número de faltas y observaciones en el desempeño de sus funciones de
los ingenieros asignados a la empresa XXX, entre los años …… a ……
Industriales Informáticos De Sistemas
3 11 26 3 85 4 6
10 5 54 2 33
a) Determine el número total de ingenieros seleccionados de la base dedatos.
b) ¿Tiene razón en manifestar el Administrador que la formación delingeniero, influye en el buen desempeño de sus funciones, dentro dela organización?, considere un nivel de significancia del 5%.
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 31/42
105
Diseño de bloques aleatorizados
En el diseño completamente aleatorizado, los sujetos observadosson seleccionados al azar, y al azar son asignados a un solo tratamiento, pudiendo tener cada tratamiento un número diferente de observaciones; eneste caso no se toma en cuenta la heterogenidad de los individuosobservados; en el diseño de bloques al azar, se toma en cuenta estaheterogenidad, y para reducir los efectos que podrían ocasionar en el diseñoexperimental, se los agrupa en grupos homogéneos; de este modo siqueremos evaluar el rendimiento de los trabajadores cuando ensayamos con
diferentes métodos de trabajo, nos podría interesar agruparlos según sugrado de instrucción, o su estado civil, o su procedencia, etc.; de este modoestaríamos tratando de reducir un factor que podría perturbar los resultadosdel diseño experimental; a este factor se le denomina BLOQUE, y unaforma de representarlo, es el modelo siguiente:
Tratamiento
Bloque 1 2 3 . j . . c TotalFila
1 y11 Y12 y13 . . . . y1c T1. 2 Y21 y22 Y23 . . . . Y2c T2.
.i.
. . . .
. yij .
. . . .
.
Ti.
.
kTotalColumna
T.1 T.2 T.3 . T. j . T.c T..
Donde:Tratamiento: j = 1, 2, 3, …. Tiene c elementos Bloques : i = 1, 2, 3, …. Tiene k elementos Número total de observaciones: n = k*rEl contraste de hipótesis será en los siguientes términos:H0 = Los rendimientos seguirán siendo los mismos, pese a haberlosagrupados a los elementos observados, en una característica común.H1 = Por lo menos, uno de los rendimientos será superior a los demás.
Agrupándoles a las observaciones, según una de sus característicascomunes.
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 32/42
106
Para aceptar o rechazar la hipótesis nula, deberá, construirse su tabla deanálisis de varianza, para ello, la suma de los cuadrados del total delexperimento estará conformado por:
SCT = SCTR + SCF + SCEDonde:
SCT = – C; siendo C =
SCTR = - C
SCF = - C
SCE = SCT – (SCTR + SCF)
Su tabla ANVA, contará con la siguiente información:
Fuente SC g.l CM Fr
Tratamiento SCTR c-1 CMTR
Fila SCF k-1 Fr =
Error SCE (k-1)*(c-1) CME
TOTAL SCT ck-1
Este Fr calculado deberá contrastarse con un Fc(α, c-1, (k-1)*(c-1)); dondeα es el nivel de significancia, y de acuerdo a ello, tomar la decisión
respectiva.
Ejemplo. La provincia de Huaura se está convirtiendo en un destinoturístico, dado que se está observando que mes a mes, la afluencia deturistas viene incrementándose; dado que los grupos ocupacionales de losturistas son diferentes, estos también buscan desarrollar diferentes prácticas
turísticas (aventura, gastronomía, arqueológico, playa). Después de que elturista decide retornar a su destino, se decide entrevistarlo a fin de conocerel grado de satisfacción percibida de acuerdo a la práctica realizada; estegrado de satisfacción se califica por medio de un puntaje como lo indica lasiguiente tabla:
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 33/42
107
Grado de satisfacción del turista, por la práctica
desarrollada en Lima provincias, sector norte
Grupo
Ocupacional
Aventura Gastronomía Arqueológico Playa
Comerciante 18 26 35 16
Empresario 8 42 20 19
Profesional 25 18 40 28
Estudiante 44 10 48 35
¿Considerando estos resultados, podría asegurarse que el grupo ocupacionaldel turista, es determinante para desarrollar una práctica turística,
asumiendo un riesgo de equivocarse del 5%?
Ejemplo. El gerente de crédito de un banco supone que una referencia para proporcionar crédito a una persona, es la de ser poseedor o no una cuentade ahorro, o ser buen cliente de otro banco; de acuerdo a ello seleccionauna muestra de 200 clientes registrados en INFOCOR y los clasifica deacuerdo a los atrasos en los pagos:
Sin Atrasos Con atrasos
Tienen cuenta de ahorro 63 12 No tienen cuenta de ahorro 36 15
Es buen cliente de otro banco 41 33
Basándose en esta afirmación, ¿es correcta la afirmación del gerente decrédito?; considere un riesgo de equivocarse del 5%.
Problemas de Análisis de Varianza: diseño de bloques
aleatorizado.
4.17 Describa un experimento donde se utilice el diseño de bloquesaleatorizado.
4.18 Demuestre que: = - C;
donde C =4.19 Se está estudiando la resistencia a la comprensión de un tipo de
concreto para ser empelado en la futura ciudadela de “Mi techo
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 34/42
108
propio”; para ello se utiliza cuatro tipos diferentes de técnicas de
mezclado, obteniéndose los siguientes resultados:Resistencia a la comprensión del concreto
Técnicas de Mezclado Kg/cm2
I 102 114 107 95II 116 106 120 115III 108 113 106 121IV 110 100 98 106
Pruebe la hipótesis de que las técnicas de mezclado no afectan laresistencia del concreto, usando α = 5%.
4.20 Se hace un estudio para saber si el nivel de gasto por día que
desarrollan los turistas extranjeros en el Perú, provenientes de USA,Inglaterra, Alemania y Francia, depende de su procedencia; para ellose toman muestras aleatorias de nueve turistas de cada país, con lafinalidad de conocer el promedio de gasto por día en US$,encontrándose los siguientes resultados:Promedio de gasto por día en el país, en US$, de los turistas
extranjeros
País 1 2 3 4 5 6 7 8 9
USA 120 90 110 99 105 129 118 130 100Alemania 133 110 95 95 100 110 100 125 130Inglaterra 100 130 130 127 105 95 97 99 102Francia 102 118 115 112 100 100 106 118 115
Encuentre la respuesta para este caso, asumiendo un nivel designificancia del 5%.
4.21 La siguiente tabla proporciona las notas promocionales deEstadística y Matemática, de un grupo de estudiantes de ingenieríacursados el ciclo anterior.
Calificativo en Estadística
Calificativo
Matemática
00 – 05 05 – 10 10 - 15 15 – 20
00 – 05 23 15 24 805 – 10 17 14 19 1610 – 15 12 8 26 515 – 20 6 4 5 2
¿Podría asegurarse que las notas obtenidas por los alumnos, tanto enEstadística como en Matemática, guardan una relación entre sí, o esque son totalmente independientes? Sea α = 5%.
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 35/42
109
4.22 Un casa comercial, especializada en el ensamblaje de equipos decómputo, está por potar qué tipo de marca de discos duros (HD) delas marcas Quantum, Maxtor, Fireball o Seagate, deberá adoptarse, a
fin de incorporar a los nuevos modelos de PC, que piensa lanzar almercado; para ello es preciso conocer el promedio de vida de estosHD, que se cree, mucho dependerá del lugar donde sea llevado laPC. Como los productos de la empresa son comercializados en todoel Perú, en cuatro regiones del país, se le somete a un proceso desimulación del período de vida en años, encontrándose los siguientesresultados:Duración simulada, en años, de los discos duros en las cuatro regiones
del país:Quantum Maxtor Fireball Seagate
Lima 5,2 5,1 4,8 4,9Arequipa 5,3 5,8 5,2 5,4Huancavelica 4,7 5,2 5,1 5,3Cerro de Pasco 4,4 4,6 4,7 4,9Puno 4,8 5,0 4,8 4,9
Los técnicos que hicieron la prueba de duración de estos HD,
manifiestan que el promedio de vida de estos discos duros, es elmismo, pese a que trabajan en diferentes lugares del país, ¿usted,con los conocimientos que posee al presente, podría darles la razón?Considere un riesgo de equivocarse del 5%.
4.23 La Municipalidad de Huaura está investigando acerca del período de pago trimestral en el cumplimiento de pagos por concepto delimpuesto predial, en todos sus clientes, conformados porcontribuyentes de los siguientes tipos: Rural, Residencial, Comerciale Industrial. Para ello toma una muestra aleatoria entre todos losclientes que pagaron oportunamente sus impuestos el pasado año,obteniendo la siguiente información:
Número total de clientes que pagaron sus respectivos impuestos prediales en
los trimestres correspondientes
Tipo de cliente I II III IV
Rural 21 16 19 21Residencial 32 21 27 30
Comercial 16 12 17 21Industrial 5 7 8 6
Después de eliminar los efectos, pagos por tipo de cliente, ¿podríanlas autoridades municipales, concluir que los trimestres del año,
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 36/42
110
tienen diferentes efectos en el pago del impuesto predial?; considereα = 0,025.
4.24 Se está estudiando el peso logrado en los cerdos que la granja “Mis
Porcinos” cría, para ser introducidos a los mercados de Huaura,Barranca y Paramonga; para ello se elabora cuatro tipo de racionesalimenticias en base a harina de pescado, melaza, afrecho y maízamarillo; los pesos en kilos recabados en un muestra de estos cerdos,después de un período de observación de dos meses son lossiguientes:Tabla .
Tipos de raciones
alimenticias
Pesos obtenidos en kg.
1 150,5 148,5 167,2 154,2
2 147,6 153,2 140,2 153,9
3 152,3 144,1 141,5 140,7
4 160,2 140,2 144,4 140,5
¿Podría asegurarse que las diferentes raciones alimenticias proporcionados a estos animales, influyeron en los pesos obtenidos?
Considere α = 5%. 4.25 El departamento de ventas de una casa comercial dedicada a la ventade ropas exclusivas de hombres, está interesado en conocer si existediferencias en las comisiones de ventas que perciben sus cincovendedores en los días de atención al público; los resultados de estosingresos en S/ se indican en la siguiente tabla:Tabla. Ingreso de los vendedores por comisión de ventas en los
días de la semana.
A B C D ELunes 20 12 11 45 18
Martes 21 17 30 12 17
Miércoles 15 20 12 10 23
Jueves 10 12 15 10 23
Viernes 23 17 15 12 28
Sábado 30 18 30 15 16
¿Podría asegurarse que existe diferencia en las comisiones de los
vendedores, o es que esta diferencia solo se debe al azar?, asuma unnivel de significancia del 5%.
4.26 Se hace un estudio para saber si la estatura de las personas estabaligado al lugar de donde provenían; para ello, en la ciudad de
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 37/42
111
Huacho se toman muestras aleatorias de un grupo poblacional, dediferentes edades, quienes provenían de Huaraz, Oyón, Huánuco,Celendín y Sihuas, a quienes se les toma sus respectivas medidas en
metros, encontrándose los siguientes resultados:Estatura promedio, en metros, de las personas según procedencia de
origen y rango de edades
Rango
edad, años
Huaráz Oyón Huánuco Celendín Sihuas
8 – 11 1,34 1,28 1,36 1,42 1,4511 – 14 1,42 1,41 1,43 1,44 1,4614 – 17 1,67 1,70 1,58 1,65 1,73
17 – 20 1,70 1,69 1,62 1,72 1,7120 – 23 1,68 1,69 1,66 1,70 1,72
A raíz de estos datos, formule su contraste de hipótesis y expliquesus conclusiones, asumiendo un riesgo de equivocarse del 5%.
4.27 En un centro de experimentación agrícola se va estudiar los efectosde cuatro tipo de fertilizantes en el rendimiento de un tipo detomate; para ello se dividen cinco parcelas de igual tamaño y forma,se los codifica y se les asigna al azar un tipo de fertilizante, de talmanera que esto se hace una sola vez. La siguiente tabla muestra losresultados de la cosecha según parcela y fertilizante empleado:Rendimiento de tomate en kilos por parcela, según tipo de fertilizante
utilizado
Tipo de fertilizante
Parcela A B C D
1 50 45 44 512 55 56 44 523 45 45 56 414 48 43 58 405 40 41 47 44
¿Proporcionan estos datos, suficiente evidencia como para concluirque el rendimiento de tomate, está asociado al tipo de fertilizante y l parcela utilizada, considerando un nivel de significancia del 1%
4.28 Se sospecha que la elección por una carrera universitaria por parte
de los postulantes a la UNJFSC está en función a los niveles deingresos familiares; para salir de especulaciones se toman muestras aun grupo de postulantes de diferentes grupos socioeconómicos,quienes optaban por postular a las carreras de Medicina, Ingeniería,
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 38/42
112
Derecho, Economía y Enfermería, encontrándose los siguientesresultados:
Cantidad de postulantes que eligieron las carreras de:
Grupossocioeconó.
Medicina Ingeniería Derecho Economía Enferm.
A 23 11 8 10 6
B 15 13 12 23 13
C 7 20 16 7 10
D 6 8 17 6 9
E 5 11 9 11 15
¿Los grupos socioeconómicos de los alumnos influyeron en lacarrera elegida?
4.29 Un ingeniero informático está probando diferentes formatos de presentación en pantalla de un nuevo tipo de software,recientemente desarrollado en su empresa; la efectividad debeanalizarse en función a las compras desarrolladas por los clientes;como tal durante un período de observación, se obtuvo los siguientes
resultados:Tipo de
presentación
Cantidad de software comprados
A 23 14 24 11
B 21 23 20 9
C 16 15 16 25
D 28 16 11 21
E 12 18 16 16
¿Existe alguna diferencia en la cantidad de software compradodebido al formato de presentación desarrollado? Considere un nivelde significancia del 5%.
4.30 Se está tratando de averiguar si los turistas que vienen a Huachotienen tendencia a hacer gastos de acuerdo a la época del año en quenos visitan; para ver ello se averigua en los lugares donde más lofrecuentan, siendo estos: La Campiña, o visitando los diferentesrestos arqueológicos, o simplemente pernoctando en la ciudad, para
ello se muestran a estos visitantes, y se les pregunta el promedio degasto que desarrolla durante en cada uno de estos lugares,encontrándose los siguientes:
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 39/42
113
Promedio de gasto en S/ del turista en los lugares visitados.
Estación
del año
Campiña
de Huacho
Restos
arqueológicos
Pernoctando
la ciudad
Verano 65 41 60Otoño 43 39 40Invierno 52 55 45Primavera 60 48 50¿Podría asegurarse que los niveles de gasto de los turistas estáninfluenciados por las estaciones del año?
4.31 Para mejorar el rendimiento académico de los alumnos, en el cursode Inferencia estadística, el dictado del curso, se ofrece en diferenteshorarios: 08:00, 11:00, 14:00, 17:00, y 20:00 horas; pero comotambién se cree que este rendimiento puede estar influenciado por elnivel socioeconómico de sus padres, se los agrupa en los cincogrupos ocupacionales A, B, C, D, y E, y se los somete a unaevaluación durante un cierto período de tiempo; los resultadosobtenidos, con una muestra de estudiantes se presentan en lasiguiente tabla:Tabla. Nota de los alumnos obtenidos en el curso de Inferencia
Estadística, según horario dictado, y clasificados por su grupo
económico. Grupo socioeconómico al que pertenecen los alumnos
Horario delcurso
A B C D E
08:00 -> 14,2 10,8 11,4 14.1 08,3
11:00 -> 11,6 12,4 10,7 12,2 14,1
14:00 -> 13,8 10,7 12,7 14,1 10,817:00 -> 12,3 10,2 10,3 09,6 13,7
20:00 -> 10,5 14,2 07,8 13,6 10,8
Analice las características de este experimento, y presente susconclusiones finales, asumiendo un riesgo de equivocarse del 5% ensus conclusiones.
4.32 Sobre la conducta social de las personas de nuestra sociedad, es
frecuente observar que por lo general, la gran mayoría andaescupiendo o ensuciando en las calles de la ciudad; con la finalidadde introducir medidas correctivas tendientes a superar este malvicio, se diseña cuatro programas incentivadores con la finalidad de
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 40/42
114
que las personas que andan escupiendo en las calles, dejen dehacerlo; para ello se selecciona cinco personas por programa aquienes se les agrupa en grupos homogéneos, eliminando el efecto
de su procedencia, y se les somete a observación para ver si latendencia a seguir escupiendo sigue con la misma, o a aumentado;los resultados de estas observaciones se muestra en la siguientetabla:Número de escupitajos de las personas observadas durante un
tiempo observado, de acuerdo a programas incentivadores y
procedencia.
Programas incentivadores
Procedencia A B C D
Huaura 4 5 8 7
Barranca 4 8 5 2
Lima 3 4 5 3
Huaral 7 3 7 6
Paramonga 7 6 2 4
¿Podría concluirse que los programas incentivadores tienen efectos
diferentes en este experimento?; asuma un riesgo de equivocarse del5%.
4.33 Una compañía está interesado en probar con cuatro métodos de promoción, el grado aceptación de un software de inventarios;dichos métodos son: a) Publicidad en el lugar de venta, b)Publicidad a través de los diarios, c) Publicidad a través de unademostración en tienda, d) Publicidad a través de la TV. Paraevaluar la efectividad de estos cuatro métodos, también se prueba en
cuatro establecimientos comerciales, asegurándose si estos métodos publicitarios estarán influenciados por las formas de presentacióndel software; esto es: 1) En forma interactiva, dirigida, y avanzada;los resultados de este experimento se reflejan en la cantidad desoftware vendida, según se muestra en la siguiente tabla:Ventas de software en cuatro tiendas según métodos depromoción y formas de presentación.
Métodos de promoción para el consumo del producto
Publicidadlugar deventa
Publicidadenperiódicos
Demostraciónen tienda
Publicidaden la TV
Interactiva 20 11 22 8
Dirigida 4 13 25 7
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 41/42
115
Avanzada 10 9 17 5
Evalúese los efectos de la promoción del producto en estas tiendas,con α = 5%.
4.34 Se hace un estudio para saber si el nivel de gasto diario de US$, quedesarrollan los turistas extranjeros que arriban a un destino turísticodel Perú, está asociado con su procedencia; para ello se los clasificade acuerdo a su procedencia, y de acuerdo al nivel de gasto logrado por día, se va configurando la información proporcionada en lasiguiente tabla:Nivel de gasto en US $ registrado por día
Procedencia 20 – 50 50 - 80 80 -110 110 - 140
Europa 5 12 6 5
Africa 10 6 4 3
Asia 7 13 15 16
Oceanía 8 15 10 3
NorteAmérica
13 15 7 10
¿Podría asegurarse que los gastos obtenidos por los turistas,
dependen del lugar de donde provienen? Considere un riesgo deequivocarse del 5%.
4.35 Una gran empresa desea contar con nuevo “pool” de ingenieros en
las especialidades de industriales, informáticos y de sistemas, a finde entrenarlos y enviarlos a sus diferentes filiales; sin embargo elAdministrador de Personal considera que debería tenerse cuidadocon la selección de los profesionales, porque dependiendo de su procedencia, estos tres tipos de profesionales no muestran el mismo
grado de responsabilidad e interés en el desempeño de susfunciones; esta afirmación se basa en los registros históricos de los profesionales que tuvieron la oportunidad de participar en esos programas de capacitación, quienes fueron observados y anotados enlos respectivos registros. Con la finalidad de tomar una posición alrespecto, la gerencia decide averiguar si es correcto lo quemanifiesta el Administrador, para ello extrae aleatoriamente de la base de datos, el historial de un grupo de ingenieros que participaron
en los programas de capacitación y entrenamiento, anotándose lascantidades de fallos y observaciones, según se muestra en elsiguiente:
7/23/2019 Inferencia Estadística SEPARATA 2
http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 42/42
116
Número de faltas y observaciones en el desempeño de sus
funciones de los ingenieros que participaron en el programa de
capacitación
IngenierosUniversidad
procedencia
Industriales Informáticos De Sistemas
UNJFSC 3 11 2UNI 6 3 8
UNFV 5 4 6UNMSM 10 5 5
UNASAM 4 2 3
¿Debería darse la razón al Administrador, en el sentido que no todoslos ingenieros tienen el mismo sentido de responsabilidad en el programa de entrenamiento; considere un nivel de significancia del5%?
4.36 Un ingeniero estaba interesado en determinar el efecto de utilizarcuatro marcas de aceites, para conocer el rendimiento en kilómetrosde los nuevos vehículos que hacían viajes interprovinciales. Asignóal azar los aceites a diez lotes de vehículos seleccionados también alazar, cuyos resultados se muestran en la tabla:Aceite Rendimiento en kilómetros
A 50 56 53 48 55 55 53 59 55 57B 54 51 54 49 48 46 47 51 46 48C 56 49 45 53 47 56 47 47 55 53D 52 54 48 50 51 57 56 49 51 52
El ingeniero desea saber si los datos indicaban que los aceites teníanefectos diferentes sobre el rendimiento de los vehículos.