inferencia estadística separata 2

43
 UNIVERSIDAD NACIONAL JOSE FAUSTINO SANCHEZ CARRION F CULT D DE INGENIERÍ Prácticas de DE INFERENCIA ESTADÍSTICA ( ) 1.0 n i  f x  MOISES E. ARMAS < [email protected] > Huacho, Noviembre del 2009

Upload: oswaldo-castro

Post on 17-Feb-2018

227 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 1/42

 

UNIVERSIDAD NACIONAL

JOSE FAUSTINO SANCHEZ CARRION

F CULT D DE INGENIERÍ

Prácticas de

DE INFERENCIA ESTADÍSTICA 

( ) 1.0n

i

 f x

 

MOISES E. ARMAS

< [email protected] >

Huacho, Noviembre del 2009

Page 2: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 2/42

 

Sección 3Frases para meditar:

 La teoría es asesinada tarde o

temprano por la experiencia

 La belleza es una carta de

 presentación a corto plazo

 La protesta y la queja son el

refugio de la gente que desconfía

en sí mismo

 El trabajo arduo embrutece la

mente y lleva a cometer errores 

 Independientemente de su grado de

brillantez, nunca es conveniente

apostar con un perdedor.

Otras pruebas de hipótesis

Con las pruebas de hipótesis podemos estimar un parámetro poblacional, para ello tomamos muestras estadísticas, y según la naturalezadel problema, podemos estimar su media o varianza poblacional; también podemos estimar las diferencias de las medias poblacionales, las proporciones poblacionales, o las razones de dos varianzas; en esta seccióntambién estudiaremos otras pruebas que pueden hacerse con las hipótesisestadísticas; estas son básicamente las pruebas de bondad de ajuste y las pruebas de contingencia.

3.1 Pruebas de Bondad de Ajuste 

Cuando se construye un histograma de frecuencias de unasituación observada y es necesario conocer su curva de tendencia, paradescribir su comportamiento teórico y es preciso saber si ésta curva de

Page 3: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 3/42

tendencia podrá ser considerada como válida para estimaciones futuras, seutiliza la prueba de la chi-cuadrado para validar la curva de tendencia, lo

cual nos permitirá aceptar o desechar la curva estimada.En temas precedentes, buscamos curvas de tendencia teóricas o

modelos de comportamiento teóricos que podrían ajustarse a lasobservaciones empíricas; estos modelos teóricos más conocidos son: ladistribución triangular, la rectangular, la trapezoidal, la binomial, laPoisson, la normal, etc. Para ver si las observaciones reales que hemosobservado pueden ser explicadas dentro de una de estas curvas teóricas, ocualquier otra curva teórica, se concibe la hipótesis nula de que la curva

de frecuencias observadas con la curva de frecuencias teóricas, coincidenfrente a la hipótesis alternativa de que la curva de frecuencias teóricas esmayor que la curva de frecuencias reales; en el mejor de los casos, lasfrecuencias observadas deberán de coincidir con las frecuencias teóricas,esto es que cada oi = ei; sin embargo, en la vida real, es muy difícil que estosuceda, porque siempre habrá un oi  ≠ ei, de donde la diferencia en valorabsoluto, entre ei - oi  será mayor de cero. En el mejor de los casosdesearíamos que la suma de los valores absolutos de esta diferencia sea lomás próximo a cero, ya que cuanto más grande sea esta suma, habrá mayordesconfianza de que las frecuencias teóricas coincidan con las frecuenciasobservadas, por lo que deberemos buscar otras ecuaciones que permitandescribir el comportamiento de las observaciones.

Para poder aceptar o rechazar el modelo encontrado se formula elcontraste de hipótesis en los siguientes términos:

H0: oi = ei (las frecuencias observadas coinciden con las teóricas)

H1: ei > oi (las frecuencias teóricas no coinciden con las observadas)Situación que deberá aceptarse o rechazarse de acuerdo a un α.

El estadístico 2r =

n

i

ii

e

eo

1 i

2)(  define una distribución chi-

cuadrado con = n  –   p  –   1  grados de libertad, donde n  representa elnúmero de clases y p  el número de parámetros utilizados para calcular lafunción teórica; es obvio que si la suma de las diferencias: o

i - e

i  se hagan

iguales a cero, la curva de frecuencias reales con la curva de frecuenciasteóricas serán exactamente iguales, lo cual es difícil de creer que esosucederá, porque no hay fenómenos sociales que pueden describirseexactamente por modelos matemáticos; en la práctica sucederá que siempre

Page 4: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 4/42

habrá una pequeña diferencia entre lo estimado y lo observado, el cual será

cuantificado para determinar el 2r .

Para aceptar o rechazar la curva de tendencia con la curva defrecuencias reales, el 2

r debe confrontarse con una expresión teórica, 2

(α, ), que se obtiene de la tabla de la chi-cuadrado para un determinado

nivel de significancia α y grados de libertad; si el valor de 2r   es mayor

que el 2(α, ), deberá rechazarse la hipótesis nula en el sentido que la curva

de tendencia teórica no se aproxima a la real, dado que es obvio cuanto másgrande sea esta diferencia, significará que entre el ajuste esperado y la

realidad hay mucho trecho, de otro modo se podrá aceptarlo.En el caso de que las frecuencias esperadas ei  sean menores oiguales a cinco, se combinan con la frecuencia teórica de la clase anterior, o posterior, según sea el caso, debiendo en consecuencia, disminuir n en unnúmero igual a los ajustes.

El gráfico ilustra lo manifestado; la línea quebrada indica lasfrecuencias reales observadas, y la línea continua, las frecuencias teóricas.

Fig. 3.1 Frecuencias reales y frecuencias teóricas.

Ejemplo 3.1 Un estudio desarrollado con respecto a la distribución de

edades de un grupo de alumnas de un instituto superior de belleza mostrólas siguientes cifras:

0

5000

10000

15000

20000

25000

30000

35000

1 2 3 4 5 6 7 8

Años observados

   C  a

  n   t   i   d  a   d   d  e  p   l  a   t  o  s   d  e  m  a  n   d  a   d  o  s

Page 5: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 5/42

  79

Tabla de distribución de edades# Edad de las

alumnasCantidadesobservadas

1 [14 –  17[ 322 [17 –  20[ 40

3 [20 –  23[ 45

4 [23 –  26[ 38

5 [26 –  29[ 39

6 [29 –  32[ 31

¿Podría considerarse que las distribuciones de edades de las alumnas seajusta a una distribución rectangular, considerando un nivel designificancia del 5%?

Solución : Decir que la distribución de edad de las alumnas es una funciónconstante es lo mismo que decir que sigue una distribución uniforme orectangular; por lo tanto para cada valor observado de oi, existe un valoresperado ei  único; en la siguiente tabla se muestra las columnas

correspondientes a ei  y las expresiones individuales de las sumatorias; losei se obtienen totalizando los oi y dividiéndoles entre n.

Distribución de edades para la prueba de bondad de ajuste

#

I

Edad de las

alumnas en

años

Cantidad

observada

oi 

Cantidad

esperada

ei 

(oi - ei )2/ ei 

1 [14 –  17[ 32 38 0,9474

2 [17 –  20[ 41 38 0,23683 [20 –  23[ 47 38 2,1316

4 [23 –  26[ 38 38 0,0000

5 [26 –  29[ 39 38 0,0263

6 [29 –  32[ 31 38 1,2895

La hipótesis nula es que el comportamiento de las edades de lasalumnas están distribuidas rectangularmente, frente a la alternativa de que

estas no siguen esa distribución.Haciendo cálculos de la tabla, obtenemos que el 2

r es igual a

4,6316, este valor se contrasta 2α,  con = n-0-1 = 5 grados de libertad,

donde p = 0, dado que no hay ningún parámetro en una distribución

Page 6: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 6/42

  80

rectangular, y α = 0,05; de una tabla del chi-cuadrado, se obtiene que2

(0,05; 5), = 11,07: por lo tanto, debería aceptarse la hipótesis nula, elsentido que el comportamiento de la edad de las alumnas se pueden

aproximar a una distribución rectangular.

Ejemplo 3.2 Los niveles de ingreso, en miles de soles, obtenidos por unaempresa dedicada a la comercialización de software están en función a losniveles de gastos en publicidad según se muestra en la siguiente tabla:

Gastos Publicidad. S/ 15 18 20 17 25 22 26 28 30 19

Ingresos en miles S/ 50 56 60 52 65 62 60 85 90 61

A fin de conocer el comportamiento teórico de esta relación, un analistaformula una ecuación que permite explicar una relación entre estas dosvariables del siguiente modo:

Ingreso = 13,1524 + 2,3158*Gasto, donde Gasto es la variable

independiente e ingreso la variable dependiente; ¿podría afirmarse que esta

ecuación es confiable para fines de estimación, considerando un probableerror de equivocación de en un 5%?

Solución:  Este es un problema que consiste en aproximar elcomportamiento de las observaciones reales a un comportamientoteórico o esperado; en este caso, el comportamiento teórico es unafunción lineal de la forma Y = a + b*X; con la finalidad de estarseguros si la ecuación es aceptable o no, debe validarse haciendo la

 prueba del Chi-cuadrado, con un nivel de significancia del 5%. Paraello formulamos la hipótesis nula de que el ajuste es correcto frente ala alternativa de que este no es el más indicado. En la tabla secompara las frecuencias reales con las frecuencias teóricas, de acuerdoa la ecuación indicada.

Page 7: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 7/42

  81

Observ. Gastos Ingreso real Ingreso Teórico

I oi  ei 1 15 50 48

2 18 56 553 20 60 594 17 52 525 25 65 716 22 62 647 26 60 738 28 85 789 30 90 83

10 19 61 57

El chi-cuadrado se obtiene aplicando la relación2

r  

=n

i

ii

e

eo

1 i

2)(  =

4,50; este valor se confronta con lo proporcionado en la tabla del chi para

= n  –   p  –   1 grados de libertad, donde p = 2 y al 5% de nivel designificancia, correspondiéndole al nivel de significancia del 5% un chi-

crítico: χ 2(0,05; 7)= 14,07. Como el valor real es menor que éste, entonces

 podemos decir que o existen suficientes evidencias para rechazar lahipótesis nula, por lo que debería aceptarse el ajuste.

Ejemplo 3.3 En horas de mayor afluencia de llegada de cliente a un cajeroautomático de un banco, se registran sus llegadas cada, en un intervalo decada tres minutos. El número de llegadas se contabilizan durante un

determinado número de veces, obteniéndose los siguientes resultados:Tabla: Llegada de clientes al cajero automático de un banco:# clientes que llegan

al cajero

Número de veces

registrado

0 5

1 15

2 32

3 20

4 105 7

Formule un modelo de llegada de clientes a este cajero; validándole al1%.

Page 8: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 8/42

  82

Solución . Este problema puede estar asociado a una distribución dePoisson, dado que se trata del número de eventos ocurridos en un intervalode tiempo; la hipótesis nula tendrá las siguientes características: Las

llegadas de los clientes al cajero automático de un banco se ajustan a unadistribución de Poisson, frente a la alternativa, que estas llegadas no seajustan a esta distribución.

Con los datos de la tabla determinamos el promedio de llegadas de

clientes al cajero automático, esto es: = E(x) = 214/89 = 2,404 clientesllegan en promedio cada tres minutos; la función de probabilidad asociado

a este comportamiento será: P(x) = 2,404xe

-2,404/x!, siendo x la variable

aleatoria, llegada de clientes; con estos datos se obtiene los ei:

X 0 1 2 3 4 5

oi  5 15 32 20 10 7

ei  8,0 19,3 23,2 18,6 11,2 5,3

Deberá contrastarse el chi cuadrado real frente al chi cuadrado teórico yformular la respuesta.

Ejemplo 3.4  Una empresa dedicada a la venta de equipos de cómputo,

lleva el registro de los clientes que acuden a su local, y anota el número deveces que compró un artículo durante un cierto período de tiempo; de estemodo los registros históricos le permiten configurar la siguiente tabla:

Número de veces que el

cliente compra artículos de

cómputo

Cantidad de

clientes que

compran

0 20

1 92

2 1503 134

4 73

5 24

6 5

7 2

Los directivos de la empresa están interesados en formular un

modelo de distribución de probabilidad del comportamiento de compra deestos clientes, con la finalidad de conocer su comportamiento teórico y prever en el futuro; proponga un modelo de distribución adecuado a estascaracterísticas, y valídelo con un nivel de significancia del 5%.

Page 9: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 9/42

  83

Solución.  La hipótesis nula es que las frecuencias observadas con lasfrecuencias teóricas deberían coincidir, frente a la alternativa, de que lateórica no concuerda con la empírica proporcionando un alto margen de

error. La situación observada hace intuir que el comportamiento del modelode distribución de probabilidad debería ajustarse a una binomial, ya que elcliente puede comprar o no los artículos de cómputo. El promedio de vecesen que un cliente compra es E(x) = (0*20 + … + 7*2)/500 = 2,50 donde xes la variable aleatoria número de veces que compra; como estamosinteresados en ajustarlo a una binomial, = E(x) = np; donde n es igual a 7,de esta ecuación extraemos que la probabilidad de que el cliente puede

comprar es p = n

)x(E = 0,3571, y de que no puede comprar es q = 0,6429.

La función de probabilidad de la binomial está definido por:

f(x) = 7Cx  0,3571x0,6429

7-x, con x = 0, 1, 2..,7 clientes. Con estos

resultados se obtiene los valores esperados de clientes que acudirán acomprar al local comercial; la siguiente tabla proporciona esta información:

x 0 1 2 3 4 5 6 7

oi  20 92 150 134 73 24 5 2

ei  22,7 88,2 147,1 136,1 75,6 25,2 4,7 0,4

Las columnas 6 y 7 se integran en una sola, dado que lafrecuencia esperada de la última es menor de 5; los grados de libertad

se determinan: = 6-1-1 = 4.

El chi cuadrado real es:2r  

=n

i

ii

e

eo

1i

2)(  = 2,59, el cual

contrastado con el proporcionado por tabla a un nivel de significancia del

5% se obtiene: χ 2(0,05; 4) = 9,49; con estas confrontaciones podemos extraer

la conclusión de que la curva de tendencia del comportamiento de comprade estos clientes se puede ajustar a una distribución binomial, por lo tantono deberíamos rechazar la hipótesis nula. 

Page 10: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 10/42

  84

3.2 Pruebas de Contingencia

Cuando queremos saber si dos variables con diferentes categorías,

están asociadas o son independientes, se utiliza la prueba de contingencia;se dice que una variable tiene diferentes categorías, cuando tiene unconjunto de componentes; así la variable color, puede tener los siguientescomponentes: rojo, verde, blanco, amarillo, etc.; la variable gusto puedetener las siguientes categorías: aceptable, no aceptable, desagradable,insípido, etc. Los siguientes casos ilustran la necesidad de desarrollar estetipo de pruebas:a)  Un determinado candidato presidencial, podría estar interesado en

saber si los diferentes grados de aceptación, están relacionados entrelos diferentes grupos socioeconómicos de la sociedad.

 b)   Nos interesaría saber, si los diferentes incentivos ofrecidos a lostrabajadores de una empresa, como vacaciones pagadas, remuneraciónextra, promoción a nuevas plazas o reconocimiento especial, en losdiferentes turnos de trabajo, tienen relación directa con los niveles de productividad lograda dentro de un período de tiempo observado.

c)  Podríamos estar interesados en saber si la asistencia a los conciertos periódicamente en los teatros están asociados a los grupos de edad delos asistentes y su formación académica.

d)  Podríamos estar interesados en saber si el rendimiento académico delos alumnos está relacionado con el horario de los cursos ofrecidos, seamañana, tarde o noche.

e)  Podríamos estar interesados en saber si la compra de un determinado producto, está relacionado con la forma de su presentación y el grupo

ocupacional del cliente, etc.

En cada uno de estos casos se trata de saber si ambas variables sonindependientes o son dependientes; si son independientes, diremos que unono tienen nada que ver con el otro; sin embargo en el caso de serdependientes, entonces diremos que hay una relación entre ellas; el conoceresta relación nos permitirá tomar las decisiones respectivas.

Para resolver esta duda se construyen dos matrices rectangulares,

una para los valores observados y otra para los valores esperados; en lafila se representa a una variable con sus respectivas categorías y en lacolumna a la otra variable con sus respectivas categorías, también; en lasceldas de cada una de las matrices se contabilizan los valores observados ylos valores esperados. La siguiente tabla proporciona la matriz planteada.

Page 11: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 11/42

  85

Tabla: Matriz de contingencia, observada, para evaluar la

relación de dependencia entre dos variables.

Variable A

Variable B↓  Elem 1 Elem 2 Elem 3 ……  Elem kValor 1 O11  O12  O13  …..  O1k  

Valor 2 O21  O22  O23  …..  O2k  

.. . . . …..  .

Valor c Oi1  Oi2  Oi3  …..  Oik  

Los Oij, donde j = 1, 2, …, k; i = 1, 2, ….r, representan los valores

observados para cada categoría de las variables; en el caso de esta tabla, lavariable A tiene como categorías hasta los Elem k, y la variable B, tienecomo categorías hasta Valor c.

Para hacer la prueba de independencia de las dos variables, seconcibe el contraste de hipótesis en los siguientes términos: H0 = Ambasvariables son independientes, frente a H1  = Ambas variables no sonindependientes; la matriz de valores esperados tendrá las mismasconfiguraciones, con las siguientes características:

Tabla: Matriz de contingencia, esperada, para evaluar larelación de dependencia entre dos variables.

Variable A

Variable B Elem 1 Elem 2 Elem 3 ……  Elem k

Valor 1 e11  e12  e13  …..  E1k  

Valor 2 e21  e22  e23  …..  e2k  

.. . . . …..  .

Valor c ei1  ei2  ei3  …..  eik  

Donde cada elemento esperado eij  se determina del siguientemodo:

eij =total Gran

 jcolumnaTotal i FilaTotal 

 _ 

 _  _ * _  _ ; se entiende que estos

totales, para filas y columnas, corresponden a los valores observados;

además, Gran_total =

c

i

 j

ijo1 1

 

Page 12: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 12/42

  86

El estadístico 2r   =

c

i

 j   ij

ijij

e

eo

1 1

2)(  sigue una distribución chi

cuadrado con = (k-1)*(c-1) grados de libertad; este valor deberá sercontrastado con lo proporcionado de una tabla del Chi cuadrado, 2

c( , )  a

un nivel de significancia α y grados de libertad. La relación dedependencia de ambas variables deberá ser aceptada si el estadístico esmayor que el obtenido de la tabla; de otro modo, es de prever que las dosvariables son independientes; es decir que los valores obtenidos nada tienenque ver con las categorías de ambas variables.

Ejemplo 3.5 Un grupo de inversionistas están interesados en saber siexiste una relación entre los platos típicos ofrecidos en un restaurantecampestre, con el grupo ocupacional de las personas, de modo que ello le permitirá ampliar o no sus instalaciones actuales; para ello toma unamuestra de un grupo de clientes, y anota los platos seleccionados según enconcordancia a su grupo ocupacional; encontrándose los siguientesresultados: 

Número de personas, clasificados en su grupo ocupacional, queconsumieron los platos típicos en el restaurante campestre

Platos típicos consumidosGrupoOcupacional

Pachamanca Cevichede pato

SopaHuachana

Cuypicante

Comerciante 10 6 15 17Empresario 8 12 11 10Profesional 14 18 4 9

Estudiante 3 13 8 5¿Podría asegurarse que los platos típicos consumidos por los clientes,están relacionados con su grupo ocupacional?, asumiendo un riesgo deequivocarse del 5%, y del 1%.

Solución:   El contraste de hipótesis deberá hacerse en los siguientestérminos:Hipótesis Nula: La preferencia por los platos típicos de los clientes, nada

tiene que ver con su grupo ocupacional (Ambas variables sonindependientes).Hipótesis Alternativa: La preferencia por los platos típicos de los clientesestá relacionada con su grupo ocupacional.

Page 13: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 13/42

  87

Para rechazar o aceptar la hipótesis nula, deberá calcularse el2r  para ello

se necesita primeramente obtener su matriz esperada:

Matriz esperada de clientes que consumieron los platos típicos,

clasificados según su grupo ocupacional, en el restaurante

campestre.

Platos típicos consumidosGrupo

Ocupacional

Pachamanca Ceviche

de pato

Sopa

Huachana

Cuy

picante

Comerciante 10,3 14,4 11,2 12,1Empresario 8,8 12,3 9,6 10,3Profesional 9,7 13,5 10,5 11,3

Estudiante 6,2 8,7 6,8 7,3

Donde cada elemento eij  de la celda se obtuvo aplicando la relación eij  =

total Gran

 jcolumnaTotal i FilaTotal 

 _ 

 _  _ * _  _ ; con el conjunto de los datos de

ambas matrices, desarrollando la sumatoria2

r  

=c

i

 j   ij

ijij

e

eo

1 1

2)(  se

obtiene que es igual a:2r  = 21,09.

Al contrastar α con = 5%,2

c(0,95,9) 

= 16,92; significa que deberíamos

aceptar la hipótesis nula, de que el consumo de los platos típicos nodepende del grupo ocupacional de la persona.

Al contrastar α con = 1%,2c(0,99,9)

 = 21,67; en este caso, observamos que

el2r  

está dentro de la zona de rechazo de la hipótesis nula, por lo que

deberíamos rechazarlo, en el sentido que deberíamos aceptar la hipótesisalternativa de que el consumo de los platos típicos, está asociado al grupoocupacional del cliente. Explique las razones de estas dos aparentescontradicciones.

PPrroobblleemmaass ddee aa j juusstteess ddee ccuurrvvaass yy pprruueebbaass ddee ccoonnttiinnggeenncciiaa 

3.1  ¿De qué manera pueden aproximarse observaciones empíricas acomportamientos teóricos?

3.2  ¿Puede considerarse que una observación real, coincide exactamentecon una distribución teórica; sustente su respuesta?

Page 14: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 14/42

  88

3.3  Suponiendo que una serie de observaciones sean ajustadas a unadistribución normal, ¿cuántos parámetros deberán utilizarse paradicho ajuste?

3.4  Una empresa cuenta con una plana heterogénea de personal encuanto a su experiencia laboral; de este modo ha clasificado lasiguiente tabla experiencia laboral en años, dentro y fuera de lainstitución:

Ex. Años 0 –  5 5 –  10 10 –  15 15 –  20 20 –  25 25 –  30 30 –  35

# Traba. 50 40 32 24 16 12 7

Ajuste estas observaciones a una distribución triangular validándoloal 5%.

3.5  El servicio de emergencia de un hospital presenta un resumen dellegada de personas accidentadas por causas de tránsito según semuestra en la tabla:

Número de personas ingresados

por emergencia0 1 2 3 4 5

Número de veces observado 6 25 36 21 15 7

a)  Determine el número promedio de pacientes ingresados por

día, así como su desviación estándar. b)  Encuentre una curva de tendencia del comportamiento dellegada de pacientes, y valídelo al 5%

3.6  Con la finalidad de conocer la distribución de edad de los alumnosde un centro educativo de nivel superior se confecciona la siguientetabla:Cuadro de distribución de edad de los alumnos del CE

Edad de los alumnos en

años

N° de alumnos

14 –  17 35

17 –  20 39

20 –  23 50

23 –  26 42

26 –  29 38

29 –  32 30

¿Existe suficiente evidencia como para decir que la edad de estos

alumnos sigue una distribución uniforme?  R:  χ 20,05; 5 = 11,07

 χ 2 r  = 5,8462

3.7  Un alumno está tratando de construir un modelo de distribución de probabilidades del comportamiento de llegada de clientes al cajero

Page 15: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 15/42

  89

automático de un banco de la localidad; para ello se pone a observarla llegada de estos al cajero cada cinco minutos, lo cual le permiteconfeccionar el siguiente cuadro de llegadas:

Llegadas de clientes al cajero automático del Banco XXXLlegan clientes cada

cinco minutos

Cantidad de clientes que

llegaron

0 12

1 45

2 34

3 21

4 13

5 8

Ayude a construir al alumno un modelo de distribución de probabilidad de llegadas, validándole respectivamente; consideraun nivel de significancia del 5%.

3.8  El promedio de notas de los alumnos de ingeniería, obtenidos en elcurso de Lenguaje de Programación durante el ciclo pasado, estántabulados en la siguiente tabla:Notas obtenidas

por los alumnos

Número de alumnos

observados

[ 0 –  4[ 8[ 4 –  8[ 13[ 8 –  12[ 20[12 –  16[ 10[16 –  20[ 4

Encuentre una curva de comportamiento teórico del comportamientode estas notas, y valídelo al 1%.

3.9  ¿Para qué se desarrolla una prueba de contingencia?3.10 ¿Qué significa decir que las variables son independientes, en una

 prueba de contingencia?3.11 ¿De qué manera se puede validar una prueba de contingencia?3.12 Explique el significado de que dos variables son dependientes, luego

de desarrollar la prueba de contingencia.3.13 Una compañía de seguros tiene que optar por escoger dentro de cuatro

 planes de seguros de vida que actualmente ofrece a sus clientes; paraello desea conocer si la preferencia por algún plan de seguros de susclientes está asociada al nivel ocupacional en ejercicio. Se toma unamuestra aleatoria de un grupo de clientes usuarios de este plan,obteniéndose los siguientes resultados:

Page 16: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 16/42

  90

Plan de seguros optados por los clientes

Nivel ocupacional A B C D

Obreros 30 45 35 70

Comerciantes 48 39 47 65Profesionales 59 46 52 60Independientes 20 15 10 22

a)  ¿Podría asegurarse que el plan de seguros optado por los clientesnada tiene que ver con los tipos de clientes?, considere un riesgode equivocarse del 1%.

 b)  ¿Qué debería pasar para decir que el plan de seguros optados porlos clientes, está asociado a su nivel ocupacional, considerando un

riesgo de equivocarse del 5%?3.14 Un canal de televisión está interesado en saber si los programas que

transmite día a día influyen en el grado de conducta de su teleaudiencia; para tales fines selecciona una muestra aleatoria de ungrupo de televidentes de diferentes grupos de edades, y los somete auna prueba psicológica, después de un período de observación,encontrándose los siguientes resultados:Nivel de conducta observada en una muestra de televidentes, como

resultado de sus programaciones, de la Empresa Televisiva XXXX

Grupo de

personas

Muy

agresivo

Agresivo Normal Hiperactivo

Niños 15 28 22 20Jóvenes 24 14 20 17Adultos 10 12 24 14Tercera edad 6 16 14 9

¿Podría asegurarse que existe una relación entre el nivel de conductade los grupos de edades de las personas y la programación emitida porla empresa televisiva, asumiendo un riesgo de equivocarse del 5%?

3.15 Una empresa textil trabaja a tres turnos, en razón de que debesatisfacer fuertes pedidos de sus clientes provenientes del exterior; sinembargo el departamento de control de calidad alega que este sistemade trabajos no es conveniente dado que frecuentemente encuentranfallas de calidad en las prendas confeccionadas por sus trabajadores, lo

cual puede perjudicar la imagen de la empresa ante sus clientes. A finde determinar si realmente existe este tipo de problemas como lo alegacontrol de calidad, se toman muestras aleatorias de un grupo detrabajadores de loa diferentes turnos y se les evalúa sus respectivos

Page 17: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 17/42

  91

trabajos, y determinar el número de fallas encontradas en las prendas producidas; los resultados de estos se encuentran en la siguiente tabla:Resultados del muestreo hecho a una muestra de trabajadores, para

determinar el número de fallas encontrados en las prendasconfeccionadas

Estado de las prendas

confeccionadas

Mañana Tarde Noche

Mal 5 3 11Regular 4 12 6Aceptable 16 9 7Ninguna 7 5 3

¿Podría asegurarse que lo manifestado por el departamento de controlde calidad es válido y no trabajarse con este sistema de turnos, o esque estos problemas pueden deberse a otros factores?; considere unriesgo de equivocarse del 5%.

3.16 Ante el advenimiento de las próximas elecciones para elegir al nuevo presidente de la república, los tres partidos políticos más voceados porlas empresas encuestadoras, deciden implementar un nuevos spot publicitario a través de la TV, con la finalidad de influir en el ánimo de

la población electoral que aún se mantienen indecisos o no les interesael proceso electoral. Después de una semana de lanzado este spot seencarga a una encuestadora desarrollar un estudio sobre los efectos deéste en el ánimo de los electores; la empresa selecciona una muestra deelectores y recoge sus opiniones acerca del spot, obteniendo lossiguientes resultados:Estado de ánimo de los electores, respecto a los partidos políticos A, B, y

C, como resultado del lanzamiento del nuevo spot publicitario .PARTIDOS

ESTADO DE

ANIMO

A B C

Muy a gusto 10 12 9Gustoso 7 8 12No le gusta 6 9 6No le interesa 13 10 12

¿Podría asegurarse que el spot publicitario, influyó en el estado deánimo de los electores, o es que esto nada tiene que ver con ese estadode cosas? Sustente su respuesta considerando una probabilidad deequivocarse con el 5%.

Page 18: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 18/42

  92

3.17  Se quiere establecer si existe una relación entre la duración de losdiscos duros y los distintos lugares donde son utilizados, dado que por parte de los clientes que los utilizan, sobre todo en la sierra,

donde hace mucho frío, dicen que estos discos, después de un período corto de vida, empiezan a tener problemas en sus pistas,debiéndose hacer continuas reparaciones, con el Scan Disk; paradescartar las afirmaciones de los clientes quejosos, se decide hacer pruebas de confiabilidad de los discos duros de las marcasQuantum, Maxtor, Fireball o Seagate, en diferentes lugares que presentan climas propios, como climas fríos, muy fríos, templados,cálidos, y muy calurosos; estos discos duros, después de un tiempode uso, deberá registrarse el número de veces que fue reparado conel Scan Disk. Los resultados de este ensayo se muestran en lasiguiente tabla:Número de veces que fueron sometidos a un proceso de Scan Disk los

discos duros, en concordancia al clima donde fueron expuestos:

Tipo de clima Quantum Maxtor Fireball Seagate

Frío 12 10 8 13Muy frío 15 9 13 10Templado 9 11 12 12Cálido 11 9 9 13Muy cálido 13 13 12 8

¿Con estos resultados, podría darse la razón a los clientes quejosos, o esque estos casos solo son problemas provenientes de la casualidad?Considere un nivel de significancia del 1%

3.18  Analizando el problema de la contaminación del medio ambiente,realizado por las personas en la provincia de Huaura, los alumnos delV ciclo de Ing. Informática de la Universidad se abocan a averiguar sila manera cómo las personas que contaminaban el medio ambienteestaban relacionados con su nivel cultural; para ello muestrearon a ungrupo de personas, de diferentes grados de instrucción y losrelacionaron con las diversas modalidades de contaminar el medioambiente, contabilizando el número de veces que contaminaban, en un

determinado período de tiempo; los resultados de esta investigación semuestran en la siguiente tabla:Tabla.  Número de veces que contaminaban el medio ambiente deacuerdo a sus diferentes niveles culturales.

Diversas modalidades de contaminar

Page 19: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 19/42

  93

Nivel

Cultural

Escupe Tira

papeles u

otros

Orina en

la calle

Fuma

Primaria 13 8 7 5Secundaria 15 10 3 11

Superior

Incompleta

9 15 4 10

Profesional

Universitario

5 12 2 16

A la luz de estos resultados, formúlese una teoría y generalícese para

la población de la provincia, asumiendo un riesgo de equivocarse del5%.3.19 ldll

Page 20: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 20/42

  94

Sección 4Frases para meditar:

 Nunca soplarán vientos favorables

 para el que no sabe a dónde va. 

 La esencia de su problema es el

reconocimiento exterior. Dedique

 gran parte de su tiempo a buscar

un experto externo que pueda

certificar su creatividad.

Si uno quiere salir adelante en una

 sociedad grande, tiene que ser

 político, tiene que hacer amistades,

 pero nunca olas.

 Hay que cuidar del mañana por

todos los medios, meditando,

 proyectando, y preparándose pero

 sin ansiedades.

Análisis de Varianza

Diseños experimentales.

Consideremos el siguiente caso: Por lo general, en el sistema

educativo de nuestro medio, tenemos problemas de bajo rendimientoacadémico de los alumnos, al margen de que en algunas instituciones se lasmaquille con otros tipos de formalidades, esto es una constante que año trasaño agobia a nuestra educación nacional, cuyos resultados de la malaeducación peruana son manifestadas negativamente el contextointernacional; se podría ensayar una serie de respuestas que expliquen elcomportamiento de estas actitudes, así como también proponer una seriede medidas con la finalidad de elevar el bajo rendimiento académico de los

alumnos; ahora vayámonos a un lugar más específico, una universidad,supongamos que las autoridades universitarias son conscientes de esta problemática y desean elevar el nivel académico de sus alumnos, para ello proponen otorgarles una serie de premios de modo que les estimule a sercada vez mejor y lograr los premios establecidos; se plantean lo siguientes

Page 21: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 21/42

  95

 premios estímulos a los estudiantes: Comedor universitario, Estipendioeconómico, Viajes promocionales, R econocimiento público, Bolsas detrabajo; como no se sabe si éstos premios tendrán efecto positivo en la

elevación del rendimiento académico, se desea probar durante un ciclo, primero con una muestra seleccionada al azar de una población estudiantil,y sin que éstos sepan la naturaleza de la investigación, a cada alumno se leasigna un número entre uno y treinta, y se le otorga un solo premio de loofrecido; finalizado el ciclo se evalúan estos resultados, que deberánreflejarse en el rendimiento académico de cada uno de ellos y el promediogeneral por cada premio ofrecido; la evaluación y contraste de estosresultados permitirán confirmar o desechar las suposiciones de lasautoridades universitarias; los resultados de la investigación, podríanmostrarse como en la siguiente tabla:

Tabla 4.1 Promedio del rendimiento académico de la muestra de

alumnos, de acuerdo a los premios ofrecidos por la universidad XXX.

Comedor Estipendio Viajes Reconoc. Bolsa t.

A12  A7  A22  A1  A18 

A29  A11  A3  A14  A2 A15  A25  A6  A10  A17 

A8  A13  A12  A27  A4 

A5  A24  A19  A28  A30 

A26  A23  A9 

A21  A20 

µ1  µ2  µ3  µ4  µ5 

Los sub índices de la variable A, indican los promedios de notas por cada alumno seleccionado al azar y asignado también al azar a cada unode los premios ofrecidos; es preciso indicar que cada alumno es beneficiario de un solo premio, así como que tampoco interesa que cadauno de los premios ofrecidos contengan iguales cantidades de alumnos. Alfinal de cada columna se tienen los promedios generales µi  por el grupo de premios ofrecidos.

Este ejemplo constituye un tipo de experimento donde intervienen

una serie de variables independientes que pueden ser controlados ymanipulados por el investigador, en este caso diferentes premios ofrecidos por la universidad, el cual, cuyos resultados finales nos interesará conocer

Page 22: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 22/42

  96

 para decidir por una opción; para seguir adelante, es necesario conocer laterminología utilizada en este tipo de diseños experimentales.

Un experimento   consiste de una serie de actividades que se

desarrolla con la finalidad de producir un conocimiento u obtener algunainformación; para ello se utilizan variables independientes que elinvestigador puede manipular a su antojo, a cada uno de ellos se les llama tratamiento ; para nuestro caso, las variables independientes estánconstituidos por los diferentes premios que la universidad ofrece comoestímulo para elevar el rendimiento académico; una variable dependiente  es el resultado del manejo de la variable independiente, y es lo que se buscaconocer; una unidad experimental es el elemento individual al que se leaplica al tratamiento; en este caso la unidad experimental viene a constituirel alumno, cuyo resultado  o valor dependiente  será expresada en una ciertaunidad de medida ; si continuamos con el ejemplo, entonces podemosmanifestar que el resultado de la medición, se expresará en una nota.

A continuación veremos algunos modelos de diseñosexperimentales más conocidos; éstos son el diseño completamentealeatorizado, diseño de bloques al azar, diseño factorial, y cuadrado latino.

Diseño completamente aleatorizado 

En un diseño de este tipo, las unidades experimentales sondistribuidas al azar a solo un tratamiento, y lo que se busca es saber si losresultados del tratamiento permitieron mejorar el estado actual de las cosas;si nos referimos al ejemplo del caso anterior, es evidente que nos interesarásaber, si como efecto de los diferentes premios estímulos ofrecidos a los

alumnos, al finalizar el período de evaluación, por lo menos, con uno de lostratamientos, el promedio de notas será mayor que con las de los otrostratamientos; si así lo fuese, entonces diremos que el experimento valió la pena, por lo que debería implementarse el premio que permitió que con ellose mejorara el rendimiento académico de los alumnos; en términos decontraste de hipótesis, esto se puede plantear del siguiente modo:

H0: Todos los promedios seguirán siendo iguales, por lo tanto esindiferente ofrecer uno u otro premio, dado que el rendimiento

académico de los alumnos seguirá siendo el mismo.H1: Por lo menos uno de los promedios será mayor que los otros, lo

cual significará que es conveniente ofrecer este tipo de premios para mejorar el rendimiento académico de los alumnos.

Page 23: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 23/42

  97

Para construir un modelo matemático, consideremos el caso generalde tener k tratamientos, donde se eligen al azar las unidades experimentalesy son distribuidas, también, al azar a cada uno de los tratamientos; estas

unidades experimentales generarán un resultado yij, tal como el que semuestra a continuación:

Tabla 4.2 Diseño completamente aleatorizado para un

experimento consistentes de k tratamientos.Tratamientos:

1 2 3 . . . j . . . k

y11  y12  y13  . . . y1j  . . . y1k  

y21  y22  y21  . . . y2j  . . . y2k  

. . . . . . . . . . .

. . . . . . . . . . .

yi1  yi2  yi3  . . . yij  . . . yik  

. . . . . . . . . . .

yn1  yn2  yn3  . . . ynj  . . . ynk  

Total T.1  T.2  T.3  . . . T.J  . ..

T.K  

Media y.1  y.2.  y.3  . . . y. j  y.k  Varianza S.1

2  S.22  S.3

2  . . . S. j

2  . . . S.k 2 

Donde: yij es la medida iésima para el tratamiento ji = 1, 2, 3, . . . , n. j = 1, 2, 3, . . . , k.T. j = suma de todas las medidas del tratamiento j.Ῡ. j  = Promedio de las medidas del tratamiento j.

S. j2

 = Varianza de las medidas del tratamiento j.T.. = total de las medidas de los y ij.Ῡ.. = promedio de todas las medidas de los yij.S2 = varianza de todas las medidas de los yij.

Por cada tratamiento obtenemos su total, su promedio y surespectiva varianza, así como también obtenemos por el conjunto el grantotal T.., la media general Ῡ.., y la varianza general S

2.Si continuamos analizando estos datos, podríamos darnos cuenta

que la variabilidad total de los datos, dependerá de la variación de datosentre los tratamientos y la variación de datos dentro de cada tratamiento; dehecho, cuanto mayor sean los tratamientos, y dependiendo cómo estosdatos se distribuyen dentro de los tratamientos, la variación general estaráinfluenciada por estos comportamientos.

Page 24: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 24/42

  98

La variabilidad entre los tratamientos determina la forma cómo lasmedias de las muestras de estos tratamientos difieren entre sí, y lavariabilidad dentro de los tratamientos, determina la manera en que las

observaciones varían respecto a las medias de cada tratamiento; estasexpresiones se demuestran analíticamente del siguiente modo:yij  –  y.. = desviación de los datos respecto a la media total.yij  –  y.j = desviación de los datos respecto a la media del tratamiento j.Restando las dos expresiones:(yij  –  Ῡ..) –  (yij  –  y.j); el resultado de esta resta será:(yij  –  Ῡ..) –  (yij  –  y.j) = (y.j  –  Ῡ ..), o sea:(y.j  –  Ῡ..) = (yij  –  Ῡ..) + (yij  –  y.j)

Elevando al cuadrado ambos miembros:(y.j  –  Ῡ..)2 = ((yij  –  Ῡ..) + (yij  –  Ῡ.j))

2 , desarrollando los cuadrados:

SCT = SCTR + SCF + SCEDonde:

SCT =  –  C; siendo C =SCTR = - C

SCF = - C

SCE = SCT –  (SCTR + SCF)Su tabla ANVA, contará con la siguiente información:

Fuente SC g.l CM Fr

Tratamiento SCTR k-1 CMTRError SCE n-k   CME Fr =

TOTAL SCT n-1

Donde CMTR =

CME =

Este Fr  calculado deberá contrastarse con un Fc(α, c-1, (k-1)*(c-1)); dondeα es el nivel de significancia, y de acuerdo a ello, tomar la decisión

respectiva.

Page 25: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 25/42

  99

Ejemplo 4.1 Consideremos que el rendimiento académico de los alumnosen el curso de Matemática es bajo; las autoridades académicas consideranque ese bajo rendimiento se debe a que el dictado del curso se hace en un

horario inadecuado, y para mejorarlo se hace un nuevo planteamientoreplanteando el horario; para ello se propone cinco nuevos horarios, comolos siguientes: 08:00 –  11:00, 10:00 –  13:00, 14:00 –  17:00, 16:00 –  19:00,y 18:00  –  21:00; para ver la efectividad de esta nueva reprogramación, seselecciona una muestra de alumnos que llevarán el curso, a los cuales se lesasigna aleatoriamente uno de los horarios establecidos; finalizado el dictadodel curso se evalúan las notas obtenidas, encontrándose los siguientesresultados.

08:00  –  11:00

10:00 –  

13:00 

14:00 –  

17:00 

16:00 –  

19:00 

18:00 –  

21:00 

Problemas de Análisis de Varianza: diseño completamentealeatorizado.4.1   Nombre y explique las tres fuentes principales de datos de que

 puede disponer un investigador.4.2  Describa un proyecto de investigación dentro del campo de su

carrera profesional, de modo que pueda utilizar los datos generados por las actividades de la organización, en un diseño experimental.

4.3  Describa un proyecto de investigación en el área de la informática,donde requiera el diseño de un experimento completamentealeatorizado y determine el objetivo de este tratamiento.

4.4  ¿En qué consiste un diseño completamente aleatorizado?

Page 26: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 26/42

  100

4.5  Defina los siguientes términos: a) Experimento b) Variableindependiente c) Variable dependiente d) Tratamiento e)Unidad experimental.

4.6  Describa un diseño completamente aleatorizado en los siguientescampos del desarrollo social: a) Educativo b) Social c)Agronómico d) Nutricional e) Ing. informática

4.7  El gerente de producción de una empresa está preocupado por el bajo rendimiento de sus trabajadores; con la finalidad de elevarlos, propone introducir algunas medidas correctivas tendientes aincentivar el mejor desempeño laboral, y por ende, mejorar la producción; estas medidas correctivas son sometidas a un grupo detrabajadores seleccionadas aleatoriamente, y sin que éstos sepan lanaturaleza de la investigación, son también distribuidos al azar asolo uno de los incentivos ofrecidos; después de un tiempodeterminado evalúa los resultados y en base a ello adopta lasrespectivas medidas. Formule un modelo matemático para esteexperimento, considerando las medidas correctivas necesarias aintroducirse e indicando los pasos a desarrollar para obtener laconclusión.

4.8  Una nueva empresa vinculada al negocio informático estáinteresada en abrir nuevas sucursales en los diferentes ámbitos del país, con la finalidad de impartir enseñanza en ciencias de lacomputación; los posibles lugares donde se abrirían estos negociosson: Arequipa, Trujillo, Cajamarca, Chiclayo, Cusco y Huancayo;en vista de que carece de información sociocultural de cada uno delos lugares, selecciona muestras aleatorias de posibles candidatos de

cada lugar a fin de someterlos a una prueba de percepción deconocimientos, los cuales son cuantificados en notas que van de ceroa veinte, cuyos resultados se muestran en la siguiente tabla:Tabla: Calificativos obtenidos por los candidatos seleccionados poruna Prueba de percepción, desarrollada durante el período….. LugaresArequipa 12,6 08,5 12,4 13,2 07,2Trujillo 11,5 12,2 10,2 07,7 11,5 10,7 13,6 11,6 08,7

Cajamarca 09,2 13,1 13,2 09,8 11,7Chiclayo 14,2 11,6 10,1 10,2 14,4 13,4Cusco 15,1 12,3 12,5 11,8 16,2 05,5 12,2 10,3Huancayo 13,3 10,7 11,2 10,9 12,8 11,5 07,5

Page 27: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 27/42

  101

¿Podría asegurarse, que los potenciales candidatos, mantienendiferentes percepciones de conocimientos, asumiendo un riesgo deequivocarse del 5%?

4.9  Con la finalidad de reducir los niveles de colesterol en la sangre delas personas mayores de los treinta años, se diseñan cinco tipos dedietas con diferentes formulaciones, los cuales son sometidas a ungrupo de personas que tenían altos niveles de colesterol, durante un período de cuatro meses; pasado este tiempo se les vuelve a medir yse encuentra los siguientes resultados:

Niveles de colesterol en la sangre de una muestra personas, seleccionadas al

azar, sometidos a base de las principales dietas:

Verduras Pescado Carne Granos203 217 205 200

263 220 231 204

205 198 233 245

222 234 198 210

299 250 210 216

201 200 216 205

242 201 208 205238 242 212

240 217

¿Constituyen estos resultados, suficiente evidencia como paramanifestar que los niveles de colesterol en la sangre de las personasson iguales, pese a la diversidad de dietas; considere un nivel designificancia del 5%?

4.10  Se quiere verificar la eficiencia de tres tipos de abonos químicos

como la úrea, el nitrato y el fosfato, en el rendimiento del cultivo dela papa; para ello se selecciona diferentes tipos de parcelas con lasmismas dimensiones, y se les somete a un tipo de tratamiento, acada parcela con un solo abono de los mencionados; al finalizar lacosecha, los rendimientos de papa en kilos obtenidos por cada parcela fueron:

Abono Rendimiento de papa por parcelas en Kilos

Urea 100 120 116 98 95

Nitrato 120 98 103 100 107 118Fosfato 97 100 94 121 110

Use un nivel de significancia del 1% para poner a prueba si haydiferencia entre los rendimientos de parcela según los tipos defertilizantes utilizados en la cosecha.

Page 28: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 28/42

  102

4.11  Un profesor de Inferencia Estadística enseña el mismo curso en lasescuelas académicas profesionales de Ing. de Sistemas, Ing.Informática e Ing. Industrial. El decano de la facultad cree que el

 profesor tiene diferentes criterios de evaluación a los alumnos deestas escuelas ya que manifiesta que en unas de estas se observamayores calificativos que en las otras; el mencionado profesor en sudefensa manifiesta que las diferencias de notas se deben al interés delos alumnos por el curso.Con la finalidad de desvirtuar malos entendidos, se muestrea a ungrupo de alumnos que llevaron el curso obteniéndose los siguientescalificativos:Ing. Sistemas 13 11 09 10 14 12Ing. Informática 10 14 15 08 12 10Ing. Industrial 11 09 13 12 12 13Refútese la opinión del decano, o en su defecto, confírmelo;considere un riesgo de equivocarse del 5%.

4.12  Una empresa educativa seleccionará un tipo de chisguete de tinta para sus impresoras de inyección de tinta, para ello recibe unacotización de cuatro casas comercializadoras que distribuyendiferentes marcas (Epson, Canon, LexMark, y HP); a la empresa leinteresa aquella marca que le proporciona mayor durabilidad en lasimpresiones; para ello selecciona una muestra aleatoria de un grupode chisguetes y los prueba hasta que se agoten las tintas, para elloestablece como parámetro de referencia la cantidad de hojasimpresas, encontrándose los siguientes resultados:Cantidad de hojas impresas con las mismas características de la

muestra de chisguetes obtenidaHP 206 200 184 199 230EPSON 187 198 208 217 205LEXMARK 230 185 198 200 199CANON 195 215 215 207 195

Con los actuales conocimientos que posee, ¿qué sugerencias proporcionaría a los directivos de la empresa a la luz de estos

resultados?; considere un nivel de significación del 1%.4.13  Se está tratando de averiguar si los efectos de la altitud influyen en

la presión sanguínea de un grupo de personas que gustan viajar a las partes más altas de la sierra de Lima. Los resultados en muestras en

Page 29: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 29/42

  103

un grupo de personas, según grupos de edades, indicaron lassiguientes presiones:Presión sistólica de una muestra de personas, que viajan a la sierra,

según grupo de edades:Jóvenes Adultos Adultos mayores

90 123 90110 100 104105 115 118108 110 100120 90 105115 95

Demuestre si las presiones sistólicas logradas por estas personas, pueden estar influenciadas por la altitud.

4.14  Generalmente en la época de los exámenes, los alumnos de unauniversidad afrontan ciertos comportamientos fuera de lo común; para poder estudiar si este tipo de actitud les afecta su presiónarterial, se decide hacer un estudio; previo a ello el departamento de bienestar universitario determina que hay cuatro categorías deconducta de los alumnos, como: los relajados, los tensos, los muytensos, y los normales; los resultados obtenidos se muestran acontinuación:Nivel de presión arterial de los alumnos de la universidad YYY, dentro

de la semana de exámenes, de acuerdo al tipo de conducta mostrado.

Conducta

Relajado 110 118 120 125Normal 120 120 115 130 121 120Tenso 125 130 125 135 140Muy tenso 130 140 140 125Explique las conclusiones que podrían obtenerse como resultado deeste trabajo, considerando un riesgo de equivocarse del 2,5%

4.15  Una entidad financiera está interesado en determinar si el nivelacadémico de los postulantes, que anualmente se presentan alconcurso de prácticas pre profesionales que la entidad ofrece comoun paso previo a la incorporación de los futuros profesionales a su

staff, depende de la procedencia de la universidad. Para ello,selecciona una muestra de postulantes que se presentaron a la últimaconvocatoria, procedentes de las universidades: La Católica, UNI,San Martín de Porres, y San Marcos; a dichos postulantes se les

Page 30: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 30/42

  104

somete a una prueba de conocimientos con calificativos de 0 a 100,obteniendo los siguientes resultados:Calificativo de los postulantes según procedencia de la universidad.

PUC 87 54 66 78 50UNI 67 65 89 58 80UNMSM 45 56 85 92 64SMP 78 70 85 76 74

¿Es posible afirmar que estos puntajes, están asociados a launiversidad de donde provienen? Considere un nivel designificación del 5%.

4.16  Una empresa multinacional desea contar con nuevo “pool” de

ingenieros en las especialidades de industriales, informáticos y desistemas, a fin de entrenarlos y enviarlos a sus diferentes filiales; sinembargo el Administrador de Personal considera que estos profesionales no tienen el mismo grado de responsabilidad y puntualidad en el desempeño de sus funciones, debido a que cuentacon una base de datos que permite sustentar su posición. La gerenciadecide averiguar si es correcto lo que manifiesta el Administrador, para ello extrae aleatoriamente de la base de datos, el historial de ungrupo de ingenieros correspondientes a estas especialidades,encontrándose los siguientes resultados:Número de faltas y observaciones en el desempeño de sus funciones de

los ingenieros asignados a la empresa XXX, entre los años …… a …… 

Industriales Informáticos De Sistemas

3 11 26 3 85 4 6

10 5 54 2 33

a)  Determine el número total de ingenieros seleccionados de la base dedatos.

 b)  ¿Tiene razón en manifestar el Administrador que la formación delingeniero, influye en el buen desempeño de sus funciones, dentro dela organización?, considere un nivel de significancia del 5%.

Page 31: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 31/42

  105

Diseño de bloques aleatorizados 

En el diseño completamente aleatorizado, los sujetos observadosson seleccionados al azar, y al azar son asignados a un solo tratamiento, pudiendo tener cada tratamiento un número diferente de observaciones; eneste caso no se toma en cuenta la heterogenidad de los individuosobservados; en el diseño de bloques al azar, se toma en cuenta estaheterogenidad, y para reducir los efectos que podrían ocasionar en el diseñoexperimental, se los agrupa en grupos homogéneos; de este modo siqueremos evaluar el rendimiento de los trabajadores cuando ensayamos con

diferentes métodos de trabajo, nos podría interesar agruparlos según sugrado de instrucción, o su estado civil, o su procedencia, etc.; de este modoestaríamos tratando de reducir un factor que podría perturbar los resultadosdel diseño experimental; a este factor se le denomina BLOQUE, y unaforma de representarlo, es el modelo siguiente:

Tratamiento

Bloque 1 2 3 . j . . c TotalFila

1 y11  Y12  y13  . . . . y1c  T1. 2 Y21  y22  Y23  . . . . Y2c  T2.

.i.

. . . .

. yij .

. . . .

.

Ti.

.

kTotalColumna

T.1  T.2  T.3  . T. j . T.c  T..

Donde:Tratamiento: j = 1, 2, 3, …. Tiene c elementos Bloques : i = 1, 2, 3, …. Tiene k elementos  Número total de observaciones: n = k*rEl contraste de hipótesis será en los siguientes términos:H0  = Los rendimientos seguirán siendo los mismos, pese a haberlosagrupados a los elementos observados, en una característica común.H1  = Por lo menos, uno de los rendimientos será superior a los demás.

Agrupándoles a las observaciones, según una de sus característicascomunes.

Page 32: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 32/42

  106

Para aceptar o rechazar la hipótesis nula, deberá, construirse su tabla deanálisis de varianza, para ello, la suma de los cuadrados del total delexperimento estará conformado por:

SCT = SCTR + SCF + SCEDonde:

SCT =  –  C; siendo C =

SCTR = - C

SCF = - C

SCE = SCT –  (SCTR + SCF)

Su tabla ANVA, contará con la siguiente información:

Fuente SC g.l CM Fr

Tratamiento SCTR c-1 CMTR

Fila SCF k-1  Fr =

Error SCE (k-1)*(c-1) CME

TOTAL SCT ck-1

Este Fr  calculado deberá contrastarse con un Fc(α, c-1, (k-1)*(c-1)); dondeα es el nivel de significancia, y de acuerdo a ello, tomar la decisión

respectiva.

Ejemplo. La provincia de Huaura se está convirtiendo en un destinoturístico, dado que se está observando que mes a mes, la afluencia deturistas viene incrementándose; dado que los grupos ocupacionales de losturistas son diferentes, estos también buscan desarrollar diferentes prácticas

turísticas (aventura, gastronomía, arqueológico, playa). Después de que elturista decide retornar a su destino, se decide entrevistarlo a fin de conocerel grado de satisfacción percibida de acuerdo a la práctica realizada; estegrado de satisfacción se califica por medio de un puntaje como lo indica lasiguiente tabla:

Page 33: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 33/42

  107

Grado de satisfacción del turista, por la práctica

desarrollada en Lima provincias, sector norte

Grupo

Ocupacional

Aventura Gastronomía Arqueológico Playa

Comerciante 18 26 35 16

Empresario 8 42 20 19

Profesional 25 18 40 28

Estudiante 44 10 48 35

¿Considerando estos resultados, podría asegurarse que el grupo ocupacionaldel turista, es determinante para desarrollar una práctica turística,

asumiendo un riesgo de equivocarse del 5%?

Ejemplo. El gerente de crédito de un banco supone que una referencia para proporcionar crédito a una persona, es la de ser poseedor o no una cuentade ahorro, o ser buen cliente de otro banco; de acuerdo a ello seleccionauna muestra de 200 clientes registrados en INFOCOR y los clasifica deacuerdo a los atrasos en los pagos:

Sin Atrasos Con atrasos

Tienen cuenta de ahorro 63 12 No tienen cuenta de ahorro 36 15

Es buen cliente de otro banco 41 33

Basándose en esta afirmación, ¿es correcta la afirmación del gerente decrédito?; considere un riesgo de equivocarse del 5%.

Problemas de Análisis de Varianza: diseño de bloques

aleatorizado.

4.17  Describa un experimento donde se utilice el diseño de bloquesaleatorizado.

4.18  Demuestre que: = - C;

donde C =4.19  Se está estudiando la resistencia a la comprensión de un tipo de

concreto para ser empelado en la futura ciudadela de “Mi techo

Page 34: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 34/42

  108

 propio”; para ello se utiliza cuatro tipos diferentes de técnicas de

mezclado, obteniéndose los siguientes resultados:Resistencia a la comprensión del concreto

Técnicas de Mezclado Kg/cm2

 I 102 114 107 95II 116 106 120 115III 108 113 106 121IV 110 100 98 106

Pruebe la hipótesis de que las técnicas de mezclado no afectan laresistencia del concreto, usando α = 5%. 

4.20  Se hace un estudio para saber si el nivel de gasto por día que

desarrollan los turistas extranjeros en el Perú, provenientes de USA,Inglaterra, Alemania y Francia, depende de su procedencia; para ellose toman muestras aleatorias de nueve turistas de cada país, con lafinalidad de conocer el promedio de gasto por día en US$,encontrándose los siguientes resultados:Promedio de gasto por día en el país, en US$, de los turistas

extranjeros

País 1 2 3 4 5 6 7 8 9

USA 120 90 110 99 105 129 118 130 100Alemania 133 110 95 95 100 110 100 125 130Inglaterra 100 130 130 127 105 95 97 99 102Francia 102 118 115 112 100 100 106 118 115

Encuentre la respuesta para este caso, asumiendo un nivel designificancia del 5%.

4.21  La siguiente tabla proporciona las notas promocionales deEstadística y Matemática, de un grupo de estudiantes de ingenieríacursados el ciclo anterior.

Calificativo en Estadística

Calificativo

Matemática

00 –  05 05 –  10 10 - 15 15 –  20

00 –  05 23 15 24 805 –  10 17 14 19 1610 –  15 12 8 26 515 –  20 6 4 5 2

¿Podría asegurarse que las notas obtenidas por los alumnos, tanto enEstadística como en Matemática, guardan una relación entre sí, o esque son totalmente independientes? Sea α = 5%. 

Page 35: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 35/42

  109

4.22  Un casa comercial, especializada en el ensamblaje de equipos decómputo, está por potar qué tipo de marca de discos duros (HD) delas marcas Quantum, Maxtor, Fireball o Seagate, deberá adoptarse, a

fin de incorporar a los nuevos modelos de PC, que piensa lanzar almercado; para ello es preciso conocer el promedio de vida de estosHD, que se cree, mucho dependerá del lugar donde sea llevado laPC. Como los productos de la empresa son comercializados en todoel Perú, en cuatro regiones del país, se le somete a un proceso desimulación del período de vida en años, encontrándose los siguientesresultados:Duración simulada, en años, de los discos duros en las cuatro regiones

del país:Quantum Maxtor Fireball Seagate

Lima 5,2 5,1 4,8 4,9Arequipa 5,3 5,8 5,2 5,4Huancavelica 4,7 5,2 5,1 5,3Cerro de Pasco 4,4 4,6 4,7 4,9Puno 4,8 5,0 4,8 4,9

Los técnicos que hicieron la prueba de duración de estos HD,

manifiestan que el promedio de vida de estos discos duros, es elmismo, pese a que trabajan en diferentes lugares del país, ¿usted,con los conocimientos que posee al presente, podría darles la razón?Considere un riesgo de equivocarse del 5%.

4.23  La Municipalidad de Huaura está investigando acerca del período de pago trimestral en el cumplimiento de pagos por concepto delimpuesto predial, en todos sus clientes, conformados porcontribuyentes de los siguientes tipos: Rural, Residencial, Comerciale Industrial. Para ello toma una muestra aleatoria entre todos losclientes que pagaron oportunamente sus impuestos el pasado año,obteniendo la siguiente información:

Número total de clientes que pagaron sus respectivos impuestos prediales en

los trimestres correspondientes

Tipo de cliente I II III IV

Rural 21 16 19 21Residencial 32 21 27 30

Comercial 16 12 17 21Industrial 5 7 8 6

Después de eliminar los efectos, pagos por tipo de cliente, ¿podríanlas autoridades municipales, concluir que los trimestres del año,

Page 36: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 36/42

  110

tienen diferentes efectos en el pago del impuesto predial?; considereα = 0,025.

4.24  Se está estudiando el peso logrado en los cerdos que la granja “Mis

Porcinos” cría, para ser introducidos a los mercados de Huaura,Barranca y Paramonga; para ello se elabora cuatro tipo de racionesalimenticias en base a harina de pescado, melaza, afrecho y maízamarillo; los pesos en kilos recabados en un muestra de estos cerdos,después de un período de observación de dos meses son lossiguientes:Tabla .

Tipos de raciones

alimenticias

Pesos obtenidos en kg.

1 150,5 148,5 167,2 154,2

2 147,6 153,2 140,2 153,9

3 152,3 144,1 141,5 140,7

4 160,2 140,2 144,4 140,5

¿Podría asegurarse que las diferentes raciones alimenticias proporcionados a estos animales, influyeron en los pesos obtenidos?

Considere α = 5%. 4.25  El departamento de ventas de una casa comercial dedicada a la ventade ropas exclusivas de hombres, está interesado en conocer si existediferencias en las comisiones de ventas que perciben sus cincovendedores en los días de atención al público; los resultados de estosingresos en S/ se indican en la siguiente tabla:Tabla. Ingreso de los vendedores por comisión de ventas en los

días de la semana.

A B C D ELunes 20 12 11 45 18

Martes 21 17 30 12 17

Miércoles 15 20 12 10 23

Jueves 10 12 15 10 23

Viernes 23 17 15 12 28

Sábado 30 18 30 15 16

¿Podría asegurarse que existe diferencia en las comisiones de los

vendedores, o es que esta diferencia solo se debe al azar?, asuma unnivel de significancia del 5%.

4.26  Se hace un estudio para saber si la estatura de las personas estabaligado al lugar de donde provenían; para ello, en la ciudad de

Page 37: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 37/42

  111

Huacho se toman muestras aleatorias de un grupo poblacional, dediferentes edades, quienes provenían de Huaraz, Oyón, Huánuco,Celendín y Sihuas, a quienes se les toma sus respectivas medidas en

metros, encontrándose los siguientes resultados:Estatura promedio, en metros, de las personas según procedencia de

origen y rango de edades

Rango

edad, años

Huaráz Oyón Huánuco Celendín Sihuas

8 –  11 1,34 1,28 1,36 1,42 1,4511 –  14 1,42 1,41 1,43 1,44 1,4614 –  17 1,67 1,70 1,58 1,65 1,73

17 –  20 1,70 1,69 1,62 1,72 1,7120 –  23 1,68 1,69 1,66 1,70 1,72

A raíz de estos datos, formule su contraste de hipótesis y expliquesus conclusiones, asumiendo un riesgo de equivocarse del 5%.

4.27  En un centro de experimentación agrícola se va estudiar los efectosde cuatro tipo de fertilizantes en el rendimiento de un tipo detomate; para ello se dividen cinco parcelas de igual tamaño y forma,se los codifica y se les asigna al azar un tipo de fertilizante, de talmanera que esto se hace una sola vez. La siguiente tabla muestra losresultados de la cosecha según parcela y fertilizante empleado:Rendimiento de tomate en kilos por parcela, según tipo de fertilizante

utilizado

Tipo de fertilizante

Parcela A B C D

1 50 45 44 512 55 56 44 523 45 45 56 414 48 43 58 405 40 41 47 44

¿Proporcionan estos datos, suficiente evidencia como para concluirque el rendimiento de tomate, está asociado al tipo de fertilizante y l parcela utilizada, considerando un nivel de significancia del 1%

4.28  Se sospecha que la elección por una carrera universitaria por parte

de los postulantes a la UNJFSC está en función a los niveles deingresos familiares; para salir de especulaciones se toman muestras aun grupo de postulantes de diferentes grupos socioeconómicos,quienes optaban por postular a las carreras de Medicina, Ingeniería,

Page 38: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 38/42

  112

Derecho, Economía y Enfermería, encontrándose los siguientesresultados:

Cantidad de postulantes que eligieron las carreras de:

Grupossocioeconó.

Medicina Ingeniería Derecho Economía Enferm.

A 23 11 8 10 6

B 15 13 12 23 13

C 7 20 16 7 10

D 6 8 17 6 9

E 5 11 9 11 15

¿Los grupos socioeconómicos de los alumnos influyeron en lacarrera elegida?

4.29  Un ingeniero informático está probando diferentes formatos de presentación en pantalla de un nuevo tipo de software,recientemente desarrollado en su empresa; la efectividad debeanalizarse en función a las compras desarrolladas por los clientes;como tal durante un período de observación, se obtuvo los siguientes

resultados:Tipo de

presentación

Cantidad de software comprados

A 23 14 24 11

B 21 23 20 9

C 16 15 16 25

D 28 16 11 21

E 12 18 16 16

¿Existe alguna diferencia en la cantidad de software compradodebido al formato de presentación desarrollado? Considere un nivelde significancia del 5%.

4.30  Se está tratando de averiguar si los turistas que vienen a Huachotienen tendencia a hacer gastos de acuerdo a la época del año en quenos visitan; para ver ello se averigua en los lugares donde más lofrecuentan, siendo estos: La Campiña, o visitando los diferentesrestos arqueológicos, o simplemente pernoctando en la ciudad, para

ello se muestran a estos visitantes, y se les pregunta el promedio degasto que desarrolla durante en cada uno de estos lugares,encontrándose los siguientes:

Page 39: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 39/42

  113

Promedio de gasto en S/ del turista en los lugares visitados.

Estación

del año

Campiña

de Huacho

Restos

arqueológicos

Pernoctando

la ciudad

Verano 65 41 60Otoño 43 39 40Invierno 52 55 45Primavera 60 48 50¿Podría asegurarse que los niveles de gasto de los turistas estáninfluenciados por las estaciones del año?

4.31  Para mejorar el rendimiento académico de los alumnos, en el cursode Inferencia estadística, el dictado del curso, se ofrece en diferenteshorarios: 08:00, 11:00, 14:00, 17:00, y 20:00 horas; pero comotambién se cree que este rendimiento puede estar influenciado por elnivel socioeconómico de sus padres, se los agrupa en los cincogrupos ocupacionales A, B, C, D, y E, y se los somete a unaevaluación durante un cierto período de tiempo; los resultadosobtenidos, con una muestra de estudiantes se presentan en lasiguiente tabla:Tabla. Nota de los alumnos obtenidos en el curso de Inferencia

Estadística, según horario dictado, y clasificados por su grupo

económico. Grupo socioeconómico al que pertenecen los alumnos

Horario delcurso

A B C D E

08:00 -> 14,2 10,8 11,4 14.1 08,3

11:00 -> 11,6 12,4 10,7 12,2 14,1

14:00 -> 13,8 10,7 12,7 14,1 10,817:00 -> 12,3 10,2 10,3 09,6 13,7

20:00 -> 10,5 14,2 07,8 13,6 10,8

Analice las características de este experimento, y presente susconclusiones finales, asumiendo un riesgo de equivocarse del 5% ensus conclusiones.

4.32  Sobre la conducta social de las personas de nuestra sociedad, es

frecuente observar que por lo general, la gran mayoría andaescupiendo o ensuciando en las calles de la ciudad; con la finalidadde introducir medidas correctivas tendientes a superar este malvicio, se diseña cuatro programas incentivadores con la finalidad de

Page 40: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 40/42

  114

que las personas que andan escupiendo en las calles, dejen dehacerlo; para ello se selecciona cinco personas por programa aquienes se les agrupa en grupos homogéneos, eliminando el efecto

de su procedencia, y se les somete a observación para ver si latendencia a seguir escupiendo sigue con la misma, o a aumentado;los resultados de estas observaciones se muestra en la siguientetabla:Número de escupitajos de las personas observadas durante un

tiempo observado, de acuerdo a programas incentivadores y

procedencia.

Programas incentivadores

Procedencia A B C D

Huaura 4 5 8 7

Barranca 4 8 5 2

Lima 3 4 5 3

Huaral 7 3 7 6

Paramonga 7 6 2 4

¿Podría concluirse que los programas incentivadores tienen efectos

diferentes en este experimento?; asuma un riesgo de equivocarse del5%.

4.33  Una compañía está interesado en probar con cuatro métodos de promoción, el grado aceptación de un software de inventarios;dichos métodos son: a) Publicidad en el lugar de venta, b)Publicidad a través de los diarios, c) Publicidad a través de unademostración en tienda, d) Publicidad a través de la TV. Paraevaluar la efectividad de estos cuatro métodos, también se prueba en

cuatro establecimientos comerciales, asegurándose si estos métodos publicitarios estarán influenciados por las formas de presentacióndel software; esto es: 1) En forma interactiva, dirigida, y avanzada;los resultados de este experimento se reflejan en la cantidad desoftware vendida, según se muestra en la siguiente tabla:Ventas de software en cuatro tiendas según métodos depromoción y formas de presentación.

Métodos de promoción para el consumo del producto

Publicidadlugar deventa

Publicidadenperiódicos

Demostraciónen tienda

Publicidaden la TV

Interactiva 20 11 22 8

Dirigida 4 13 25 7

Page 41: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 41/42

  115

Avanzada 10 9 17 5

Evalúese los efectos de la promoción del producto en estas tiendas,con α = 5%. 

4.34  Se hace un estudio para saber si el nivel de gasto diario de US$, quedesarrollan los turistas extranjeros que arriban a un destino turísticodel Perú, está asociado con su procedencia; para ello se los clasificade acuerdo a su procedencia, y de acuerdo al nivel de gasto logrado por día, se va configurando la información proporcionada en lasiguiente tabla:Nivel de gasto en US $ registrado por día

Procedencia 20 –  50 50 - 80 80 -110 110 - 140

Europa 5 12 6 5

Africa 10 6 4 3

Asia 7 13 15 16

Oceanía 8 15 10 3

 NorteAmérica

13 15 7 10

¿Podría asegurarse que los gastos obtenidos por los turistas,

dependen del lugar de donde provienen? Considere un riesgo deequivocarse del 5%.

4.35  Una gran empresa desea contar con nuevo “pool” de ingenieros en

las especialidades de industriales, informáticos y de sistemas, a finde entrenarlos y enviarlos a sus diferentes filiales; sin embargo elAdministrador de Personal considera que debería tenerse cuidadocon la selección de los profesionales, porque dependiendo de su procedencia, estos tres tipos de profesionales no muestran el mismo

grado de responsabilidad e interés en el desempeño de susfunciones; esta afirmación se basa en los registros históricos de los profesionales que tuvieron la oportunidad de participar en esos programas de capacitación, quienes fueron observados y anotados enlos respectivos registros. Con la finalidad de tomar una posición alrespecto, la gerencia decide averiguar si es correcto lo quemanifiesta el Administrador, para ello extrae aleatoriamente de la base de datos, el historial de un grupo de ingenieros que participaron

en los programas de capacitación y entrenamiento, anotándose lascantidades de fallos y observaciones, según se muestra en elsiguiente:

Page 42: Inferencia Estadística SEPARATA 2

7/23/2019 Inferencia Estadística SEPARATA 2

http://slidepdf.com/reader/full/inferencia-estadistica-separata-2 42/42

  116

Número de faltas y observaciones en el desempeño de sus

funciones de los ingenieros que participaron en el programa de

capacitación

IngenierosUniversidad

procedencia

Industriales Informáticos De Sistemas

UNJFSC 3 11 2UNI 6 3 8

UNFV 5 4 6UNMSM 10 5 5

UNASAM 4 2 3

¿Debería darse la razón al Administrador, en el sentido que no todoslos ingenieros tienen el mismo sentido de responsabilidad en el programa de entrenamiento; considere un nivel de significancia del5%?

4.36  Un ingeniero estaba interesado en determinar el efecto de utilizarcuatro marcas de aceites, para conocer el rendimiento en kilómetrosde los nuevos vehículos que hacían viajes interprovinciales. Asignóal azar los aceites a diez lotes de vehículos seleccionados también alazar, cuyos resultados se muestran en la tabla:Aceite Rendimiento en kilómetros

A 50 56 53 48 55 55 53 59 55 57B 54 51 54 49 48 46 47 51 46 48C 56 49 45 53 47 56 47 47 55 53D 52 54 48 50 51 57 56 49 51 52

El ingeniero desea saber si los datos indicaban que los aceites teníanefectos diferentes sobre el rendimiento de los vehículos.