ejercicios de estadistica ii

1

UNIVERSIDAD NACIONAL DEL CALLAO

VICERECTORADO DE INVESTIGACIÓN

FACULTAD DE CIENCIAS ECONÓMICAS

TEXTO DE PROBLEMAS DE

INFERENCIA ESTADÍSTICA

AUTOR:

JUAN FRANCISCO BAZÁN BACA

(Resolución Rectoral 940-2011-R del 22-9-11)

01-09-11 al 31-08-13

CALLAO – PERÚ

2013

2

ÍNDICE

Pág.

INDICE 2

INTRODUCCIÓN 5

Capítulo 1. LA DISTRIBUCIÓN NORMAL Y EL TEOREMA DEL LÍMITE

CENTRAL 6

1.1 Distribución normal 6

1.2 Distribución normal estándar 7

1.3 Propiedad reproductiva de la distribución normal 9

1.4 Teorema del límite central 10

1.5 Ejercicios resueltos 13

1.6 Ejercicios propuestos 29

Capítulo 2. DISTRIBUCIONES MUESTRALES 33

2.1 Distribución muestral de la media 37

2.2 Distribución muestral del total (conocida la media) 39

2.3 Distribución de la diferencia de medias muestrales 40

2.4 Distribución muestral de la proporción 43

2.5 Distribución muestral del total (conocida la proporción) 47

2.6 Distribución muestral de la diferencia de proporciones 48



Capítulo 3. DISTRIBUCIONES ESPECIALES 77

3.1 Distribución Chi-cuadrado 77

3.2 Distribución t de student 86

3.3 Distribución muestral de la media (n < 30) 92

3.4 Distribución de la diferencia de medias muestrales con varianzas

desconocidas pero iguales 93

3.5 Distribución F de Snedecor 94

3.6 Distribución de la razón de dos varianzas muestrales 98


3


Capítulo 4. ESTIMACIÓN PUNTUAL 122

4.1 Estimadores. Propiedades 123

4.2 Métodos de Estimación Puntual 130

4.3 Método de Máxima Verosimilitud 130

4.4 Método de los Momentos 132

4.5 Método de los mínimos cuadrados 133



Capítulo 5. ESTIMACIÓN POR INTERVALOS DE CONFIANZA 155

5.1 Intervalo de confianza para la media y tamaño de muestra 160

5.2 Intervalo de confianza para el total (conocida la media) 162

5.3 Intervalo de confianza para la proporción y tamaño de muestra 164

5.4 Intervalo de confianza para el total (conocida la proporción) 167

5.5 Intervalo de confianza para la diferencia de medias 168

5.6 Intervalo de confianza para la diferencia de proporciones 170

5.7 Intervalo de confianza para la media (n < 30) 173

5.8 Intervalo de confianza para la varianza 175

5.9 Intervalo de confianza para la razón de varianzas 177

5.10 Intervalo de confianza para la diferencia de medias (n y m <30) 179



Capítulo 6. CONTRASTE DE HIPÓTESIS ESTADÍSTICAS PARAMÉTRICAS 245

6.1 Prueba de hipótesis para la media (con varianza conocida) 251

6.2 Prueba de hipótesis para la media (con varianza desconocida) 258

6.3 Prueba de hipótesis acerca de una varianza 263

6.4 Prueba de hipótesis para la razón de varianzas 270

6.5 Prueba de hipótesis acerca de dos medias (varianzas conocidas) 276

6.6 Prueba de hipótesis acerca de dos medias (varianzas desconocidas) 281

6.7 Prueba de hipótesis para la proporción 290

4

6.8 Prueba de hipótesis para la diferencia de proporciones 293



Capítulo 7. PRUEBA DE HIPÓTESIS NO PARAMÉTRICAS 355

7.1 Uso de la distribución Chi-cuadrado. Test de independencia 356

7.2 Test de bondad de ajuste 362

7.3 Test de Wilcoxon 364

7.4 Test de signos 367

7.5 Test de la mediana 374



REFERENCIAS BIBLIOGRÁFICAS 398

Apéndice 400

Tabla 1. Distribción acumulativa normal estándar 401

Tabla 2. Distribución acumulativa chi-cuadrado 403

Tabla 3. Distribución acumulativa T de student 407

Tabla 4. Distribución acumulativa F 408

Tabla 5. De Wilcoxon para n ≤ 40 y = 0.05 o 0.01 409

Tabla 6. Valores críticos para la prueba del signo S 409

5

INTRODUCCIÓN

La ciencia económica para poder realizar las mediciones económicas recurre

permanentemente a la inferencia estadística, ya que las deducciones y conjeturas

económicas acerca de los parámetros están basadas en muestras aleatorias tratadas

por esta disciplina.

Con el propósito de poder contribuir al proceso de enseñanza aprendizaje de la

estadística para economistas en la Universidad Nacional del Callao (UNAC),

hemos creído conveniente elaborar un “Texto de problemas de inferencia

estadística” que de manera sencilla ayude a estudiantes de la especialidad a

desarrollar competencias conceptuales y procedimentales, mediante la asimilación

de la terminología propia de la estadística, así como las correspondientes

aplicaciones a la economía.

El texto consta de siete capítulos. En el primero, se desarrolla la distribución

normal y el teorema del límite central; el capítulo dos, presenta las distribuciones

muestrales para muestras grandes (n ≥ 30) y en el capítulo tres, se desarrollan las

distribuciones muestrales especiales ligadas a muestras pequeñas (n < 30) como la

chi-cuadrado, t de student y F.

En los capítulos cuatro y cinco se desarrollan los temas relacionados a la

estimación puntual y la estimación por intervalos de confianza respectivamente.

En el capítulo seis, se desarrollan los contrastes de hipótesis estadísticas

paramétricas, poniendo especial énfasis en la determinación del valor-P

(probabilidad mínima para rechazar la hipótesis nula) usado en los cálculos

computacionales modernos. Finalmente, en el capítulo siete se presentan las

pruebas de hipótesis no paramétricas.

Gratitud eterna a nuestra querida UNAC, por el continuo apoyo ofrecido para

alcanzar estos logros que permiten sistematizar conocimientos e incorporar temas

para la discusión en clases. El reconocimiento especial a los estudiantes de

economía de la FCE-UNAC, ya que gracias a su esfuerzo y comprensión en los

últimos años se han puesto en práctica los resultados de este modesto trabajo.

6

Capítulo 1. LA DISTRIBUCIÓN NORMAL Y EL TEOREMA

CENTRAL DEL LÍMITE

“Sólo cabe progresar cuando se piensa en grande, sólo es posible avanzar

cuando se mira lejos”. José Ortega y Gasset

CONTENIDO

1.1 Distribución normal.

1.2 Distribución normal estándar.

1.3 Propiedad reproductiva de la distribución normal.

1.4 Teorema del límite central.

1.5 Ejercicios resueltos.

1.6 Ejercicios propuestos.

1.1 DISTRIBUCIÓN NORMAL

La teoría de probabilidades nos ofrece la distribución normal como una de las

distribuciones más importantes, junto al teorema central del límite, con múltiples

aplicaciones para la inferencia estadística, sobre todo en lo concerniente a las

distribuciones muestrales. Por ello a continuación hacemos un breve repaso de la

distribución normal y la presentación del teorema central del límite.

Definición.- una variable aleatoria continua X tiene distribución normal con media

μ y varianza σ2 , si su función de densidad de probabilidad esta dada por:

2

2

( )

2

2

1( )

2

X

f x e

- ∞ < x < ∞

donde: π = 3.14159265.... y e = 2.71828184 (la base de los logaritmos

neperianos).

Notación.- una notación muy común para la distribución normal es: X ~ N(μ , σ2 )

Que se lee “la variable aleatoria X se distribuye normalmente con media μ y

varianza σ2 ”.

Características geométricas.-

La gráfica tiene forma acampanada, con centro en μ.

7

Es una función creciente en el intervalo (- ∞ , μ).

Es una función decreciente en el intervalo (μ , ∞).

Tiene sus puntos de inflexión en μ – σ y μ + σ.

Características estadísticas.-

Media: E (X) = μ

Varianza: V (X) = σ2

Si X ~ N(μ , σ2 ). Entonces, la variable aleatoria Y = a + b X también se

distribuye normalmente con media: E(Y) = a + bμ y varianza: V(Y) = b2 σ

2

. Es decir: Y ~ N(a + bμ , b2 σ

2 )

Si X ~ N(μ , σ2 ) el cálculo de probabilidades se efectúa realizando el

proceso de estandarización siguiente:

Z = (X - μ ) / σ ~ N(0, 1) y decimos que la v.a. Z tiene distribución

normal estándar.

1.2 DISTRIBUCIÓN NORMAL ESTÁNDAR

Definición.- Se dice que una variable aleatoria Z, es una variable aleatoria normal

estándar, si tiene distribución normal con media cero (μ = 0) y varianza uno (σ2 =

1) y su función de densidad de probabilidades es:

2/2

2

1)( zezf

- ∞ < z < ∞

La función de distribución acumulativa de Z se denota por Φ (z) o F(z) y se calcula

así:

0

5

10

15

20

25

30

35

40

μ - 3σ μ - 2σ μ - σ μ μ + σ μ + 2σ μ + 3σ

X

DISTRIBUCIÓN NORMAL

8

Φ (z) = F(z) = P [Z z] =

z

t dte 2/2

2

1

Esta probabilidad nos da el área bajo la curva normal desde - ∞ hasta el valor z.

Entonces, conocidos los valores de la media μ y la varianza σ2 de una variable aleatoria

X ~ N(μ , σ2 ) utilizando el proceso de estandarización Z = (X - μ ) / σ , se puede

efectuar el cálculo de probabilidades tales como:

P[a X b] = P[ (a - μ ) / σ (X - μ ) / σ (b - μ ) / σ ]

= P[ (a - μ ) / σ Z (b - μ ) / σ ]

= Φ [(b - μ ) / σ ] - Φ [(a - μ ) / σ ]

P[X a] = P[(X - μ ) / σ (a - μ ) / σ ] = P[Z (a - μ ) / σ ] = Φ [(a - μ ) / σ ]

P[X > a] = 1 – P[X a] = 1 - Φ [(a - μ ) / σ ]

Los valores de la función de distribución acumulativa normal estándar, Φ (z) o F(z),

han sido reproducidos en la Tabla 1 del Anexo utilizando la hoja de cálculo Excel.

Uso de la Tabla de la distribución normal estándar

a) Para calcular probabilidades.- en la tabla 1, conocido el valor de z, hallar Φ

(z) = F(z) = P [Z z]. Por ejemplo, para z = 1.96, tenemos que:

Φ (1.96) = F (1.96) = P [Z 1.96] = 0.97500.

b) Para hallar valores de z.- es un proceso inverso al anterior, ya que conocida la

probabilidad Φ (z) = F (z) = P [Z z] = α , en la tabla 1, se debe hallar el valor

de z que acumule en probabilidad α y que denotaremos como z = Zα .

Para el mismo ejemplo, sí Φ (z) = F (z) = P [Z z] = 0.97500, esto implica

que, en la tabla 1, a la probabilidad 0.97500, le corresponde z = Z0.97500 1.96 .

Una característica importante de la distribución normal es que:

Entre μ – σ y μ + σ se encuentra el 68.27% de las observaciones. Es decir que :

P(μ – σ X μ + σ) =

11 ZP

XP

= Φ (1) - Φ (-1) = 0.84134 –0.15866 = 0.68268

9

Entre μ – 2σ y μ + 2σ se encuentra el 95.45% de las observaciones, puesto que:

P(μ – 2σ X μ + 2σ) =

22

22ZPZP

= Φ (2) - Φ (-2) = 0.97725 –0.02275 = 0.9545

Entre μ – 3σ y μ + 3σ se encuentra el 99.73% de las observaciones. Es decir que:

P(μ – 3σ X μ + 3σ) =

33

33ZPZP

= Φ (3) - Φ (-3) = 0.99865 – 0.00135 = 0.9973

Entre μ – 4σ y μ + 4σ se encuentra el 99.9937% de las observaciones. Es decir

que:

P(μ – 4σ X μ + 4σ) = 4 4

4 4P Z P Z

= Φ (4) - Φ (-4) = 0.999968 – 0.000031 = 0.999937

Entre μ – 5σ y μ + 5σ se encuentra el 99.999942% de las observaciones. Es decir

que:

P(μ – 5σ X μ + 5σ) = 5 5

5 5P Z P Z

= Φ (5) - Φ (-5) = 0.99999971 – 0.00000029 = 0.99999942

Entre μ – 6σ y μ + 6σ se encuentra el 99.9999998% de las observaciones. Es

decir que:

P(μ – 6σ X μ + 6σ) = 6 6

6 6P Z P Z

= Φ (6) - Φ (-6) = 0.999999999 – 0.000000001 = 0.999999998

1.3 PROPIEDAD REPRODUCTIVA DE LA DISTRIBUCIÓN NORMAL

Sean X1 , X2 , .... , Xn , n variables aleatorias independientes distribuidas

normalmente con media μi y varianza σi2 . Es decir: Xi ~ N(μi , σi

2 ) i = 1, 2, 3,

.... , n . Si Y es una combinación lineal de las v.a. Xi : Y = a0 + a1 X1 + a2 X2 + .... +

an Xn . Entonces, la variable aleatoria Y ~ N [a0 +

n

i

iia1

,

n

i

iia1

22 ]

10

Puesto que:

μY = E(Y) = E (a0 + a1 X1 + a2 X2 + .... + an Xn ) =

= E(a0 ) + E (a1 X1 ) + E (a2 X2 ) + .... + E (an Xn ) =

= a0 + a1 E(X1 ) + a2 E(X2 ) + .... + an E(Xn ) =

= a0 + a1 μ1 + a2 μ2 + .... + an μn = a0 +

n

i

iia1

2

Y = V(Y) = V (a0 + a1 X1 + a2 X2 + .... + an Xn ) =

= V(a0 ) + V(a1 X1 ) + V(a2 X2 ) + .... + V(an Xn ) =

= 0 + a12 V(X1 ) + a2

2 V(X2 ) + .... + an

2 V(Xn ) =

= a12 σ1

2 + a2

2 σ2

2 + .... + a

2n σn

2 =

n

i

iia1

22

1.4 TEOREMA DEL LÍMITE CENTRAL

Sean X1 , X2 , .... , Xn , n variables aleatorias independientes con media y varianza finitas

dadas por: E(Xi) = μi y V(Xi ) = σi2 .

Si: Yn = X1 + X2 + .... + Xn =

n

i

iX1

, entonces bajo ciertas condiciones generales,

la variable aleatoria Zn definida por:

n

i

i

n

i

n

i

ii

n

nnn

X

YV

YEYZ

1

2

1 1

)(

)(

tiene aproximadamente una distribución normal estándar N(0, 1).

Nota.-

E(Yn ) = E (X1 + X2 + .... + Xn ) = E (X1 ) + E (X2 ) + .... + E (Xn ) =

11

= μ1 + μ2 + .... + μn =

n

i

i

1

.

V(Yn ) = V (X1 + X2 + .... + Xn ) = V(X1 ) + V(X2 ) + .... + V(Xn ) =

= σ12 + σ2

2 + .... + σn

2 =

n

i

i

1

2 .

Observaciones.-

1. La variable aleatoria Yn =

n

i

iX1

(suma de v.a. independientes) puede ser

aproximada por una v.a. distribuida normalmente, cualquiera que sea la distribución

de las Xi .

2. Las condiciones generales indicadas en el teorema están referidas a que los términos

Xi tomados individualmente, contribuyen con una cantidad despreciable a la

variación de la suma, y no es probable que un simple término tenga una gran

contribución a la suma.

Una aplicación importante de estas condiciones generales del teorema central del

límite, se da en los modelos de regresión: Yi = β0 + β1 X1i + β2 X2i + .... + βk Xki + ei

Donde la variable explicada o dependiente Y es función de un conjunto de variables

explicativas o independientes (X1 , X2 , .... , Xk ) más un error e. La aplicación del

teorema central del límite se da cuando se asume que los errores ei se distribuyen

normalmente, debido a que estos errores recogen la suma de las contribuciones

despreciables de todas las variables dejadas de considerar en el modelo.

Por ejemplo, en los modelos de demanda Qi = a – b Pi + ei , se asume que las

cantidades demandadas (Q) de un bien o servicio dependen fundamentalmente del

precio (P) del bien. Efectivamente, pero existen otras variables independientes

(gastos de publicidad, precio del bien sustituto, gustos y preferencias, etc.) que

también podrían explicar dicha demanda, sin embargo, sus contribuciones a explicar

la demanda son despreciables, por lo que la suma de sus contribuciones, reflejadas en

los errores ei se aproximan a la distribución normal.

12

3. Una situación especial del teorema central del límite se presenta cuando cada Xi

tiene la misma distribución (que es el caso de la definición de muestra aleatoria,

como veremos más adelante) y que permita encontrar la distribución de una media

muestral. La propuesta es la siguiente:

Sean X1 , X2 , .... , Xn , n variables aleatorias independientes, idénticamente

distribuidas con media y varianza común y finitas dadas por: E(Xi) = μ y V(Xi ) = σ2.

Si: Yn = X1 + X2 + .... + Xn =

n

i

iX1

, entonces la variable aleatoria Zn dada

por : n

X

n

nX

YV

YEYZ n

n

i

i

n

nnn

/)(

)( 1

tiene aproximadamente distribución normal estándar N(0 , 1). Donde

n

i

in Xn

X1

1

es la media muestral de las Xi .

Nota.-

E(Yn ) = E (X1 + X2 + .... + Xn ) = E (X1 ) + E (X2 ) + .... + E (Xn ) =

= μ + μ + .... + μ = n μ .

V(Yn ) = V (X1 + X2 + .... + Xn ) = V(X1 ) + V(X2 ) + .... + V(Xn ) =

= σ2 + σ

2 + .... + σ

2 = n σ

2

13

1.5 EJERCICIOS RESUELTOS

1. Sea Z una variable aleatoria con distribución normal estándar [Z ~ N(0, 1)]. Hallar

las probabilidades siguientes: a) P(Z > 1.13) ; b) P(1.00 < Z < 1.42) c) P(-1.5 < Z <

0.50) ; d) P(-1.65 < Z < -1.00) ; e) P(Z < -1.52) ; f) P(0 < Z < 1.25) y g)

P(-1.63 < Z < 0).

Solución.-Usando la tabla 1 del anexo se tiene:

a) P(Z > 1.13) = 1 - P(Z ≤ 1.13) = 1 – Φ(1.13) = 1 – 0.8708 = 0.1292

b) P(1.00 < Z < 1.42) = Φ(1.42) - Φ(1.00) = 0.9222 – 0.8413 = 0.0809

Para obtener los gráficos en Minitab ver Bazán, Juan (2010)

0.4

0.3

0.2

0.1

0.0

Z

De

nsid

ad

1

0.0809

1.420

En Minitab: P(1.00 < Z < 1.42)

0.4

0.3

0.2

0.1

0.0

Z

De

nsid

ad

-1.5

0.6247

0.50

P(-1.5 Z < 0.5)

c) P(-1.5 Z < 0.5) = Φ(0.50) - Φ(-1.5) = 0.6915 – 0.0668 = 0.6247

d) P(-1.65 Z -1.00) = Φ(-1.00) - Φ(-1.65) = 0.1587 – 0.0495 = 0.1092

e) P(Z < -1.52) = Φ(-1.52) = 1 - Φ(1.52) = 1 – 0.9357 = 0.0643

f) P(0 Z 1.25) = Φ(1.25) - Φ(0) = 0.8944 – 0.5000 = 0.3944

g) P(-1.63 < Z 0) = Φ(0) - Φ(-1.63) = 0.5000 – 0.0516 = 0.4484

2. Sea Z una variable aleatoria normal estándar [Z ~ N(0, 1)]. Hallar el valor de z

para los casos siguientes: a) Φ(z) = 0.9500; b) Φ(z) = 0.9772; c) Φ(z) =

0.9987; d) el área entre –z y z es 0.95; e) el área a la izquierda de z es 0.01; y

f) el área a la derecha de z es 0.05.

14

Solución

a) Sí Φ (z) = F (z) = P [Z z] = 0.9500, esto implica que, en la tabla 1, a la

probabilidad 0.9500, le corresponde z = Z0.9500 = 1.645 aproximadamente.

b) Sí Φ (z) = F (z) = P [Z z] = 0.9772, esto implica que, en la tabla 1, a la

probabilidad 0.9772, le corresponde z = Z0.9772 = 2.00 aproximadamente.

c) Sí Φ (z) = F (z) = P [Z z] = 0.9987, esto implica que, en la tabla 1, a la

probabilidad 0.9987, le corresponde z = Z0.9987 = 3.00aproximadamente.

d) Si 0.95 = P [-z Z z] = Φ (z) - Φ (-z) = Φ (z) – [1 - Φ (z)] = 2 Φ (z) – 1.

Entonces, Φ (z) = 0.9750 y en la tabla le corresponde a z = Z0.9750 = 1.96.

e) Si 0.01 = Φ (z) = P [Z z], esto implica que, en la tabla 1, a la probabilidad

0.01, le corresponde z = Z0.01 = -2.33 aproximadamente.

f) Si 0.05 = P [Z ≥ z] = 1 - Φ (z), entonces Φ (z) = 0.9500 y de acuerdo a lo

visto en la parte a) de este problema le corresponde a z = Z0.9500 = 1.645.

3. El monto de las solicitudes de préstamo de los comerciantes que recibe un

Banco, está distribuido aproximadamente en forma normal con μ = S/. 10,000 y

σ = S/. 1,000. Calcule e interprete la probabilidad de que el monto del préstamo

solicitado: a) Esté entre S/. 8,500 y 12,000; b) Sea menor que S/. 8,000; c)

Mayores de que cantidad será el 20 % de los préstamos?

Solución

Sea X = monto de las solicitudes de préstamo.

Se sabe que X ~ N(10000 , 10002), entonces Z = (X – 10000)/ 1000 ~ N(0,

1). Luego, las probabilidades solicitadas son:

a) P(8500 ≤ X ≤ 12000) = 8500 10000 10000 12000 10000

1000 1000 1000

XP

=

= P(-1.5 ≤ Z ≤ 2.0) = Φ(2.00) - Φ(-1.50) = 0.97725 – 0.06681 = 0.91044

Rpta.

Interpretación: el 91.04% de los montos de préstamo solicitados por los

comerciantes fluctúa entre S/. 8,500 y 12,000.

15

b) P(X ≤ 8000) = 10000 8000 10000

1000 1000

XP

=

= P(Z ≤ -2.0) = Φ(-2.00) = 0.02275 Rpta.

Interpretación: el 2.28% (ó en 228 de cada 10000 solicitudes) de los montos

de préstamo solicitados por los comerciantes es menor a S/. 8,000.

0.0004

0.0003

0.0002

0.0001

0.0000

X = monto del préstamo

De

nsid

ad

8000

0.0228

10000

Normal, Media=10000, Desv.Est.=1000Distribución del monto de préstamo

Resultado gráfico en Minitab

c) Sea C la cantidad de préstamo buscada, entonces:

0.20 = P(X > C) = 1 - 10000

1000

CP Z

0.80 = 10000

1000

C

0 . 8 0

100000.84

1000

CZ

C = S/. 10840

Rpta.

Interpretación: el 20% de los montos de préstamo solicitados por los

comerciantes es mayor a S/. 10,840.

16

0.0004

0.0003

0.0002

0.0001

0.0000

X = monto del préstamo

De

nsid

ad

10840

0.20

10000

Normal, Media=10000, Desv.Est.=1000Distribución del monto de préstamo

4. Para cierto examen la calificación vigesimal tiene distribución normal con media

11 y desviación estándar 2. Se desea desaprobar al 40% de los examinados.

¿Cuál debe ser la calificación máxima desaprobatoria? Interprete el resultado.

Solución

Sea X = calificación vigesimal de los examinados.

Se sabe que X ~ N(11 , 22), entonces Z = (X – 11)/ 2 ~ N(0, 1).

Sea M la máxima nota desaprobatoria buscada, entonces:

0.40 = P(X < M) = 11

2

MP Z

=

11

2

M

0.40

110.25

2

MZ

M = 10.5 Rpta.

Interpretación: el 40% de los examinados desaprobados tiene nota menor a 10.5.

5. Los ingresos de los trabajadores tiene distribución normal con media µ= S/.

1000 y desviación estándar σ = S/. 200. Si se selecciona a 2000 de estos

trabajadores, calcule e interprete:

a) ¿Cuántos trabajadores tienen ingreso menor a S/. 600?

b) ¿Cuántos trabajadores tienen ingreso entre S/. 850 y 1300?

Solución

17

Si X = ingreso de los trabajadores ~ N(1000, 2002), Z = (X – 1000)/ 200 ~ N(0,

1).

Para determinar cuántos de los n = 2000 trabajadores tienen ingresos en los

intervalos dados, primero se determina la probabilidad P y después multiplica

por n. Se pide:

a) P = P(X < 600) = 1000 600 1000

200 200

XP

= P(Z < -2.0) = Φ(-2.0) =

0.02275

Luego nP = 0.02275 x 2000 = 45.5 trabajadores Rpta.

Interpretación: 46 trabajadores (2.28%) tienen ingreso menor a S/. 600.

b) P = P(850 ≤ X ≤ 1300) = 850 1000 1000 1300 1000

200 200 200

XP

=

= P(-0.75 ≤ Z ≤ 1.5) = Φ(1.5) - Φ(-0.75) = 0.93319 – 0.22663 = 0.70656

0.0020

0.0015

0.0010

0.0005

0.0000

X = ingreso

De

nsid

ad

850

0.7066

13001000

Normal, Media=1000, Desv.Est.=200Distribución del ingreso

Luego nP = 0.70656 x 2000 = 1413.12 trabajadores Rpta.

Interpretación: alrededor de 1413 trabajadores (70.66%) tienen ingreso entre

S/. 850 y 1300.

6. El volumen de negociaciones diarias (en millones de nuevos soles) para las

acciones comercializadas en la bolsa de Lima tiene distribución normal con

media µ= 800 y desviación estándar σ = 100. En un período de 60 días, calcule e

interprete:

a) ¿En cuántos días el volumen de negociaciones es de 600 o menos millones?

b) ¿En cuántos días el volumen de negociaciones es mayor de 900 millones?

18

Solución

Si X = volumen diario de negociaciones en millones de S/. ~ N(800, 1002)

Z = (X – 800)/ 100 ~ N(0, 1).

Para determinar en cuántos de los n = 60 días el volumen de las negociaciones

está en los intervalos dados, primero se determina la probabilidad P y después

multiplica por n. Se pide:

a) P = P(X ≤ 600) = 800 600 800

100 100

XP

= P(Z < -2.0) = Φ(-2.0) =

0.02275

Luego nP = 0.02275 x 60 = 1.4 días Rpta.

Interpretación: en alrededor de 1.4 días (2.28%) el volumen de

negociaciones es de 600 o menos millones de nuevos soles.

b) P = P(X > 900) = 800 900 800

100 100

XP

= P(Z > 1.0) = 1 - Φ(1.0) =

= 1 – 0.84134 = 0.15866. Luego nP = 0.15866 x 60 = 9.5días Rpta.

Interpretación: en alrededor de 9.5 días (15.87%) el volumen de

negociaciones es mayor de 900 millones de nuevos soles.

7. El peso de los pernos fabricados se distribuye normalmente con media µ= 80 gr.

y desviación estándar σ = 5 gr. Si se almacenan 2000 pernos, calcule e interprete

¿qué cantidad de pernos pesan: a) menos de 70 gramos? y b) entre 75 y 90

gramos?

Solución

Si X = peso de los pernos ~ N(80, 52) Z = (X – 80)/ 5 ~ N(0, 1).

Para determinar cuántos de los n = 2000 pernos tienen un peso en los intervalos

dados, primero se determina la probabilidad P y después multiplica por n. Se

pide:

a) P = P(X < 70) = 80 70 80

5 5

XP

= P(Z < -2.0) = Φ(-2.0) = 0.02275

Luego nP = 0.02275 x 2000 = 46 pernos Rpta.

Interpretación: alrededor de 46 pernos (2.28%) pesan menos de 70 gramos.

b) P = P(75 ≤ X ≤ 90) = 75 80 80 90 80

5 5 5

XP

= P(-1 ≤ Z ≤ 2) =

19

= Φ(2.0) - Φ(-1.0) = 0.97725 – 0.15866 = 0.81859.

0.09

0.08

0.07

0.06

0.05

0.04

0.03

0.02

0.01

0.00

X = peso

De

nsid

ad

75

0.8186

9080

Normal, Media=80, Desv.Est.=5Distribución del peso de los pernos


Luego nP = 0.81859 x 2000 = 1637 pernos Rpta.

Interpretación: alrededor de 1637 pernos (81.86%) pesan entre 75 y 90

gramos.

8. El tiempo necesario para terminar un examen se distribuye normalmente con

media µ= 80 minutos y desviación estándar σ = 10 minutos. En un curso de 60

alumnos, calcule e interprete cuántos alumnos terminan el examen:

a) ¿en una hora o menos?

b) ¿en más de 60 minutos, pero en menos de 75 minutos?

c) ¿Cuántos alumnos no terminan el examen, si éste dura 90 minutos?

Solución

Si X = tiempo para terminar un examen ~ N(80, 102)

Z = (X – 80)/ 10 ~ N(0, 1).

Para determinar cuántos de los n = 60 alumnos terminan el examen en los

intervalos dados, primero se determina la probabilidad P y después multiplica

por n. Se pide:

a) P = P(X ≤ 60) = 80 60 80

10 10

XP

= P(Z ≤ -2.0) = Φ(-2.0) = 0.02275.

Luego nP = 0.02275 x 60 = 1.4 alumnos Rpta.

20

Interpretación: alrededor de 1.4 alumnos (2.28%) terminan el examen en una

hora o menos.

b) P = P(60 ≤ X ≤ 75) = 60 80 80 75 80

10 10 10

XP

= P(-2 ≤ Z ≤ -0.5) =

= Φ(-0.50) - Φ(-2.0) = 0.30854 – 0.02275 = 0.28579.


0.04

0.03

0.02

0.01

0.00

X = tiempo duración examen

De

nsid

ad

60

0.286

75 80

Normal, Media=80, Desv.Est.=10Distribución tiempo duración examen

Luego nP = 0.28579 x 60 = 17 alumnos Rpta.

Interpretación: alrededor de 17 alumnos (28.6%) terminan el examen en más

de 60 minutos, pero en menos de 75 minutos.

c) P = P(X > 90) = 80 90 80

10 10

XP

= P(Z > 1.0) = 1 - Φ(1.0) =

= 1 – 0.84134 = 0.15866.

Luego nP = 0.15866 x 60 = 9.5 alumnos Rpta.

Interpretación: alrededor de 10 alumnos (15.87%) no terminan el examen, si

éste dura 90 minutos.

9. Suponga que el ingreso familiar mensual (X) en una comunidad tiene

distribución normal con media $400 y desviación estándar $50. Si los gastos de

consumo familiar (C) están dados por la relación C = 0.80 X + 50, ¿calcule e

interprete la probabilidad de que los gastos de consumo familiar sean inferiores a

$320?

Solución

21

Si X = ingreso familiar mensual ~ N(400, 502), Z = (X – 400)/ 50 ~ N(0, 1).

Se pide:

P(C < 320) = P(0.80 X + 50 < 320) = P(X < 337.5) =

= 400 337.5 400

50 50

XP

= P(Z < -1.25)

= Φ(-1.25) = 0.10565 Rpta.

Otra forma de resolver es usando la propiedad reproductiva de la distribución

normal. Sí C = 0.80 X + 50, entonces la media y la varianza de C son:

( ) 0.8 ( ) 50 0.8(400) 50 370C E C E X

22 2(0.8 50) 0.8 ( ) 0.64(2500) 1600 40C Var X Var X

Luego C ~ N(370, 402), Z = (C – 370)/ 40 ~ N(0, 1). Entonces:

P(C < 320) = 370 320 370

40 40

CP

= P(Z < -1.25) = Φ(-1.25) = 0.10565

Rpta.

Interpretación: el 10.6% de (ó en 1057 de cada 10000 familias) los gastos de

consumo familiar en la comunidad son menores a S/. 320.

10. Sean Xl , X2 y X3 variables a1eatorias independientes tales que: X1 ~ N (10 , 3 )

; X2 ~ N (12 , 4 ) y X3 ~ N (14 , 6). Si Y = X1 - 2 X2 + X3 . Se pide:

a) Hallar la media y la varianza de Y ; b) Ca1cule e interprete 8 10P Y

Solución

X1 ~ N (10 , 3 ) 1 10 ; 32

1

X2 ~ N (12 , 4 ) 2 12 ; 42

2

X3 ~ N (14 , 6 ) 3 14 ; 2

3 6

a) Cálculo de la media y la varianza de Y

1 2 3 1 2 32 ( ) 2 ( ) ( )Y E Y E X X X E X E X E X =

1 2 32 10 2(12) 14 0Y Rpta.

2

1 2 3 1 2 3( ) ( 2 ) ( ) 4 ( ) ( )Y V Y V X X X V X V X V X

2 2 2 2

1 2 34 3 4(4) 6 25Y Rpta.

22

b) Cálculo de la 8 10P Y

Sabemos que 0Y y 252 Y 5Y .

Además Y ~ N [0, 25] Z = (Y – 0)/ 5 ~ N(0, 1). Luego:

8 0 0 10 0

8 10 1.6 25 5 5

YP Y P P Z

= Φ(2.0) - Φ(-1.60) = 0.97725 – 0.05480 = 0.92245 Rpta.

Interpretación: alrededor del 92.25% de los valores observados de Y se

encuentran entre -8 y 10.

11. Sean X1, X2, X3 y X4 variables aleatorias normales independientes con μ1

30; μ2 = 25 ; μ3 = 12 ; μ4 = 8 ; 2

1 = 8 ; 2

2 = 6 ; 2

3 = 6 ; 2

4 = 2. Sí:

Y =

4

2 21 XX - 3 4

2

X X

Calcule e interprete: a) 8 14P Y y b) P 12Y

Solución:

Y =

4

2 21 XX - 3 4

2

X X

= 31 2 4

4 2 2 2

XX X X

μY = E(Y) = 1 2 3 4

1 1 1 1

4 2 2 2E X E X E X E X

= 1 1 1 1

(30) (25) (12) (8) 104 2 2 2

2

Y = V (y) = 1 2 3 4

1 1 1 1( ) ( ) ( ) ( )

16 4 4 4V X V X V X V X

= 1 1 1 1

(8) (6) (6) (2) 416 4 4 4

Siendo Y una combinación lineal de las variables independientes Xi cada una

con distribución normal, entonces por la propiedad reproductiva de la

distribución normal se cumple que Y ~ N [10, 4] Z = (Y – 10)/ 2 ~ N(0, 1).

Luego:

a) 8 14P Y = 8 10 10 14 10

2 2 2

YP

= P (-1.0 ≤ Z ≤ 2.0) =

= Φ(2.0) - Φ(-1.0) = 0.97725 – 0.15866 = 0.81859 Rpta.

23

Interpretación: el 81.86% de los valores de Y se encuentran entre 8 y 14.

b) P 12Y = 12 12P Y = 12 10 10 12 10

2 2 2

YP

=

= P (-11.0 ≤ Z ≤ 2.0) = Φ(2.0) - Φ(-11.0) =

= 0.97725 – 0.00000 = 0.0.97725 Rpta.

Interpretación: alrededor del 97.73% de los valores absolutos de Y son

menores o iguales a 12.

12. En el proceso de fabricación de condensadores, varias pruebas han demostrado

que la temperatura más alta (en °C) que pueden soportar es N(125, 9). En los

sistemas en que se utilizan, la temperatura máxima (en °C) a que se sujeta un

condensador individual es N(116, 16). ¿Qué proporción de condensadores fallará

por sobre calentamiento? Interprete el resultado.

Solución

Sean: F = temperatura más alta de fabricación ~ N(125, 9) y

U = temperatura máxima de uso ~ N(116, 16)

Habrá falla por sobrecalentamiento (S) cuando S = F < U = F – U < 0.

Para hallar la proporción solicitada mediante P(S) = P(F < U) = P(F – U < 0)

determinamos la distribución de F – U usando la propiedad reproductiva de la

distribución normal, así:

F – U ~ N(9, 25) Z = ( F – U – 9)/ 5 ~ N(0, 1).

Entonces:

P(S) = P(F < U) = P(F – U < 0) = 80 0 9

5 5

F UP

=

= P(Z ≤ -1.8) = Φ(-1.8) = 0.03593 Rpta.

Interpretación: alrededor del 3.59% de los (ó 359 de cada 10000) condensadores

fabricados falla por sobrecalentamiento en los sistemas en que se utilizan.

13. En una de las etapas de un proceso de ensamble un tapón cilíndrico tiene que

ajustarse a una abertura circular seleccionando cada elemento al azar en un

suministro continuo. Los diámetros del tapón y de los casquillos en mm, son

N(24.9, 0.032 ) y N(25, 0.04

2 ) respectivamente. Si para que el ajuste sea

24

satisfactorio se requiere un claro de diámetro de cuando menos 0.02 mm, ¿en

qué proporción de los casos el ajuste no será satisfactorio? Interprete el

resultado. (claro del diámetro = diámetro del casquillo – diámetro del tapón)

Solución

Sean: T = diámetro del tapón ~ N(24.9, 0.032) y

C = diámetro del casquillo ~ N(25, 0.042)

Si X = claro del diámetro = C – T, usando la propiedad reproductiva de la

distribución normal se tiene que:

µX = E(X) = E(C – T) = E(C) – E(T) = 25.0 – 24.9 = 0.10

σ2

X = V(X) = V(C – T) = V(C) + V(T) = 0.0009 +0.0016 = 0.0025 = 0.052.

Luego: X = claro del diámetro = C – T ~ N(0.10, 0.052)

Z = (X – 0.10)/ 0.05 ~ N(0, 1).

Que el ajuste no sea satisfactorio implica que X < 0.02. Entonces:

P(X < 0.02) = 0.10 0.02 0.10

0.05 0.05

XP

= P(Z ≤ -1.8) = Φ(-1.6) = 0.0548

Rpta.

Interpretación: en alrededor del 5.48% de los (ó en 548 de cada 10000)

ensambles el tapón no se ajusta al casquillo.

14. Las pastillas metálicas cilíndricas que se utilizan en un reactor se fabrican en

serie y puede suponerse que sus longitudes siguen una distribución normal con

media 0.290 cm. y desviación estándar 0.016cm. Nueve de estas pastillas deben

ajustarse, extremo con extremo, en un recipiente que ocupa una longitud no

mayor de 2.670 cm. Si las nueve pastillas se ensamblan al azar, ¿qué proporción

de estos no se ajustará en el espacio requerido? Interprete el resultado.

Solución

Sean: Xi = diámetro de las pastillas ~ N(0.29, 0.0162) y

L = longitud del recipiente con 9 pastillas = 9

1

i

i

X

.

Por la propiedad reproductiva de la distribución normal, se tiene que:

E(L) = E(9

1

i

i

X

) = 9

1

( )i

i

E X

= 9

1

0.29i

= 9 x 0.29 = 2.61 cm.

25

V(L) = V(9

1

i

i

X

) = 9

1

( )i

i

V X

= 9

2

1

0.016i

= 9 x 0.0162 = 0.002304 cm

2.

Luego:

L = longitud del recipiente con 9 pastillas = 9

1

i

i

X

~ N(2.61, 0.0002304)

Z = (L – 2.61)/ 0.048 ~ N(0, 1).

Las 9 pastillas no se ajustan al espacio requerido si L > 2.67. Por lo tanto:

P(L > 2.67) = 1 – P(L ≤ 2.67) = 1 - 2.61 2.67 2.61

0.048 0.048

LP

=

= 1 - P(Z ≤ 1.25) = 1 - Φ(1.25) = 1 - 0.89435 = 0.10565 Rpta.


recipientes con 9 pastillas, éstas no se ajustan en el espacio requerido.

15. Suponga que las variables aleatorias X1 , X2 , .... , X50 representan la vida útil de

50 tubos electrónicos; los mismos que se usan de la siguiente manera: tan pronto

como falla el primer tubo, empieza a funcionar el segundo y cuando falla el

segundo empieza a funcionar el tercero, etc. Suponga que los Xi, i = 1, 2, …., 50

tienen distribución exponencial con parámetro λ = 1/500. ¿Cuál es la

probabilidad que el tiempo de funcionamiento de los 50 tubos esté comprendido

entre 20 000 y 30 000 horas? Interprete el resultado.

Solución

Sea Xi = tiempo de funcionamiento del tubo i ~ Exponencial (λ = 1/500)

Entonces µ = E(Xi) = 1/ λ = 500 , σ2 = 1/ λ

2 = 500

2] i = 1, 2, …., 50.

Sea Y50 = tiempo de funcionamiento de los 50 tubos =

= 50

1 2 50

1

............ i

i

X X X X

Entonces, por el teorema del límite central la probabilidad solicitada es:

P(20 000 ≤ Y50 ≤ 30 000) =

=

50

1

50 50020000 50 500 30000 50 500

500 50) 500 50) 500 50)

i

i

X xx x

Px x x

= P(-1.41 ≤ Z ≤

1.41)

26

= Φ(1.41) - Φ(-1.41) = 0.92073 – 0.07927 = 0.84146 Rpta.


tiempos de funcionamiento de 50 tubos estará comprendido entre 20 000 y 30

000 horas.

16. Las botellas de aceite vegetal “Primor” tienen un contenido medio de 1 litro y

una desviación estándar de 0.04. Para la distribución se acomodan en cajas de 36

botellas, Calcule e interprete la probabilidad que una caja contenga más de 36.6

litros.

Solución

Sea Xi = contenido de las botellas de aceite ~ [µ = 1, σ = 0.04 lts.]

Sea Y36 = contenido por caja de las 36 botellas =

= 36

1 2 36

1

............ i

i

X X X X


P(Y36 > 36.6) = 1 - P(Y36 ≤ 36.6) = 1 -

36

1

36 136.6 36 1

0.04 36 0.04 36

i

i

X xx

P

=

= 1 – P(Z ≤ 2.5) = 1- Φ(2.5) = 1 – 0.99379 = 0.00621 Rpta.

Interpretación: alrededor del 0.62% de las (ó en 62 de cada 10000) cajas con 36

botellas de aceite el contenido es de más de 36.6 litros.

17. En una ciudad grande el 20% de los hogares no tiene desagüe. Si se eligen 100

hogares al azar, calcule e interprete la probabilidad de que más de 30 hogares no

tengan desagüe.

Solución

Sea Xi = 1, si el hogar no tiene desagüe ~ Bernoulli [p = 0.20]

Sea Y100 = el total de hogares sin desagüe, entre los 100 elegidos =

= 100

1 2 100

1

............ i

i

X X X X

~ B[n = 100, p = 0.20] ó N[np = 20, npq =

16]


27

P(Y100 > 30) = 1 - P(Y100 ≤ 30) = 1 -

100

1

100 0.2030 100 0.20

0.20 0.80 100 0.20 0.80 100

i

i

X xx

Px x

=

= 1 – P(Z ≤ 2.5) = 1- Φ(2.5) = 1 – 0.99379 = 0.00621 Rpta.

Interpretación: en alrededor del 0.62% de los (ó en 62 de cada 10000) grupos de

100 hogares escogidos, más de 30 hogares no tienen desagüe.

18. Un lote de 10 000 pavos tiene un peso medio de 7 Kg. y una desviación

estándar de 0.15 Kg. Este lote debe ser entregado a los vendedores minoristas a

razón de 100 cada uno. ¿Cuál es la probabilidad de que un vendedor cualquiera

de estos tomados al azar, reciba un peso total de menos de 697 kilos? Interprete

su resultado.

Solución

Sea Xi = peso de los pavos ~ [µ = 7, σ = 0.15 Kg.]

Sea Y100 = peso total de los 100 pavos = 100

1 2 100

1

............ i

i

X X X X


P(Y100 < 697) =

100

1

100 7697 100 7

0.15 100 0.15 100

i

i

X xx

P

=

= P(Z < -2.0) = Φ(-2.0) = 0.02275 Rpta.

Interpretación: alrededor del 2.28% de los (ó 228 de cada 10000) vendedores

minoristas recibe un peso total menor a 697 Kg.

19. La Constructora “Techito” estima que el peso promedio de las personas que

vivirán en un edificio de apartamentos es de 68 Kg., con una desviación estándar

de 15 Kg. De acuerdo con la estimación, instala en el edificio un ascensor para

36 personas con capacidad máxima de 2700 Kg. Si la estimación es correcta,

calcule e interprete la probabilidad de que un cupo completo exceda la capacidad

del ascensor.

Solución

28

Sea Xi = peso de las personas ~ [µ = 68, σ = 15 Kg.]

Sea Y36 = peso total de las 36 personas = 36

1 2 36

1

............ i

i

X X X X


P(Y36 > 2700) = 1 - P(Y36 ≤ 2700) = 1 -

36

1

36 682700 36 68

15 36 15 36

i

i

X xx

P

=

= 1 – P(Z ≤ 2.8) = 1- Φ(2.8) = 1 – 0.99744 = 0.00256 Rpta.

Interpretación: alrededor del 0.26% de los (ó en 256 de cada 10000) cupos

completos del ascensor con 36 personas exceden su capacidad máxima de 2700

Kg.

20. Las botellas de ron “Pepito” tienen un contenido medio de 2 litros y una

desviación estándar de 0.018. Para la distribución se acomodan en cajas de 36

botellas, Calcule e interprete la probabilidad que una caja contenga más de 72.36

litros.

Solución

Sea Xi = contenido de las botellas de ron ~ [µ = 2, σ = 0.018 lts.]

Sea Y36 = contenido por caja de las 36 botellas =

36

1 2 36

1

............ i

i

X X X X


P(Y36 > 72.36) = 1 - P(Y36 ≤ 72.36) = 1 -

36

1

36 272.36 36 2

0.018 36 0.018 36

i

i

X xx

P

=

= 1 – P(Z ≤ 3.33) = 1- Φ(3.33) = 1 – 0.99957 = 0.00043 Rpta.

Interpretación: alrededor del 0.04% de las (ó en 4 de cada 10000) cajas con 36

botellas de ron contienen más de 72.36 litros.

29

EJERCICIOS PROPUESTOS

1. Sea Z una variable aleatoria con distribución normal estándar [Z ~ N(0, 1)].

Hallar las probabilidades siguientes:

a) P(Z ≤ 2.15)

b) P(0.80 < Z < 1.96)

c) P(-2.45 < Z ≤ 1.65)

d) P(-2.75 ≤ Z ≤ -0.65)

e) P(Z ≥ -1.38)

f) P(-2.57 ≤ Z < 0)

g) P(0 ≤ Z < 2.33).

2. Sea Z una variable aleatoria normal estándar [Z ~ N(0, 1)]. Hallar el valor de z

para los casos siguientes:

a) Φ(z) = 0.8665

b) Φ(z) = 0.9222

c) Φ(z) = 0.9972

d) el área entre –z y z es 0.99

e) el área a la izquierda de z es 0.05

f) el área a la derecha de z es 0.025

3. El contenido en las botellas de cierta gaseosa tiene distribución normal con

media µ= 1000 ml. y desviación estándar σ = 5 ml. Calcule e interprete la

probabilidad de que una botella de gaseosa tenga:

a) Entre 990 y 1005 ml.

b) Menos de 985 ml.

4. El precio que pagan los hogares por el kilo de pescado en una gran ciudad tiene

distribución normal con media µ= S/. 12 y desviación estándar σ = S/. 0.80.

Calcule e interprete la probabilidad de que el precio pagado por el kilo de

pescado:

a) Sea menor de S/. 10.

b) Se encuentre entre S/. 10.50 y 13.50.

c) Por arriba de que precio paga el 10% superior de los consumidores.

30

5. El tiempo que dura la atención a los clientes de un negocio se distribuye

normalmente con media µ= 30 minutos y desviación estándar σ = 4 minutos.

Calcule e interprete la probabilidad de que el tiempo de atención a los clientes:

a) dure entre 25 y 40 minutos.

b) Entre que límites simétricos alrededor de µ dura el 95% de las atenciones.

6. El peso de las cajas de mango se distribuye normalmente con media µ= 20 Kg. y

desviación estándar σ = 0.5 Kg. Si se almacenan 2000 cajas, calcule e interprete

¿qué cantidad de cajas pesan:

a) menos de 19 kilos?

b) entre 19.5 y 21 kilos?

7. El peso de los huevos de gallina producidos por una avícola se distribuye

normalmente con media µ= 65 gr. y desviación estándar σ = 5 gr. Si se

almacenan 2000 huevos, calcule e interprete ¿qué cantidad de huevos pesan:

a) Menos de 70 gramos?

b) Entre 55 y 60 gramos?

8. La duración de ciertos focos eléctricos tiene distribución normal con media µ=

1000 horas y desviación estándar σ = 200 horas. Si compra 2000 de estos focos,

calcule e interprete:

a) ¿Cuántos focos durarán menos de 600 horas?

b) ¿Cuántos focos durarán entre 850 y 1300 horas?

9. El volumen de ventas diarias de bolsas de azúcar de la comercializadora

“Yapatera” tiene distribución normal con media µ= 800 bolsas y desviación

estándar σ = 100. En un período de 60 días, calcule e interprete:

a) ¿En cuántos días el volumen de ventas es de 600 o menos bolsas de azúcar?

b) ¿En cuántos días el volumen de ventas es mayor de 900 bolsas de azúcar?

10. Sean X1 y X2 variables aleatorias independientes distribuidas normalmente con

μ1 50; μ2 = 35; 2

1 = 10; 2

2 = 6. Si: Y = X1 - X2. Calcule e interprete:

a) La media y la varianza de Y

b) 10 25P Y

31

11. Sean X1, X2 y X3 variables aleatorias independientes distribuidas normalmente

con μ1 10; μ2 = 15; μ3 = 12; 2

1 = 3; 2

2 = 4; 2

3 = 6. Sí: Y = X1 + 2 X2 -

X3

Calcule e interprete:

a) 20 40P Y

b) P 18Y

12. Los teléfonos celulares A y B tienen una duración (en días) que son N(2190,

2002 ) y N(2878, 250

2 ) respectivamente. Si se prueba la vida de cada uno de los

teléfonos correspondientes a cada una de las marcas, ¿cuál es la probabilidad que

los A duren un año o más que los B? Interprete su resultado.

13. En una ciudad grande el 20% de hogares no tiene agua. Si se escogen 100

hogares, calcule e interprete la probabilidad que más de 30 no tengan agua.

14. Al lanzar una moneda 100 veces, calcule e interprete la probabilidad de obtener

entre 40 y 60 caras.

15. Las cajas con limón tienen un peso medio de 20 Kg. y una desviación estándar

de 750 gr. Calcule e interprete la probabilidad de que el peso de 410 cajas

recibidas al azar y cargadas en un camión, supere su capacidad máxima que es

de 8,250 kg.

16. Los pesos de los sacos de algodón Pima cosechados tienen una media de 50

kilos y una desviación estándar de 1.4 kilos. Calcule e interprete la probabilidad

de que el peso de 100 paquetes seleccionados al azar sea menor de 4975 kilos.

17. Las cajas con naranja tienen un peso medio de 15 Kg. y una desviación estándar

de 0.5 kilos. Calcule e interprete la probabilidad de que el peso de 400 cajas

tomadas al azar sea menor de 5,980 kg.

18. Un lote de 10 000 pollos para parrilla tiene un peso medio de 1 Kg. y una

desviación estándar de 0.05 Kg. Este lote debe ser entregado a las pollerías a

razón de 100 cada una. ¿Cuál es la probabilidad de que una pollería, cualquiera

32

de estas tomada al azar, reciba un peso total de menos de 98.5 kilos? Interprete

su resultado.

19. Los pesos de los paquetes recibidos en las tiendas Ripley tienen una media de

580 libras y una desviación estándar de 80 libras. Calcule e interprete la

probabilidad de que el peso de 49 paquetes recibidos al azar y cargados en un

montacargas, supere su capacidad de 30 000 libras.

20. Un lote muy grande de cajas con palta tiene un peso medio μ = 20 Kg. y una

desviación estándar σ = 0.5 Kg. Este lote debe ser entregado a los

supermercados a razón de 100 cajas cada uno. Calcule e interprete ¿la

probabilidad de que un supermercado cualquiera, reciba un peso total de

menos de 1 990.2 Kg.?

33

Capítulo 2. DISTRIBUCIONES MUESTRALES

“¿Hace falta remarcar que un país que no conoce su demografía,

tampoco conoce su economía? No se puede saber lo que un país

produce y ahorra si se ignora esta cosa fundamental: la población. ....

En un país donde no se puede contar a los hombres, menos aún se

puede contar la producción. Se desconoce el primero de sus factores:

el factor humano, el factor trabajo..”

José Carlos Mariátegui

CONTENIDO

2.1 Distribuciones muestral de la media.

2.2 Distribución muestral del total (conocida la media)

2.3 Distribución de la diferencia de medias muestrales.

2.4 Distribución muestral de la proporción.

2.5 Distribución muestral del total (conocida la proporción)

2.6 Distribución muestral de la diferencia de proporciones.



La estadística es una ciencia importante porque permite el conocimiento de la

población basándose en muestras aleatorias representativas. El principal problema de

la estadística es estudiar una población con función de cuantía o función de densidad,

f(x, θ) conocida o supuestamente conocida, con parámetro θ desconocido. Si se

conoce θ, la distribución de probabilidad queda determinada. Para ello, se toma una

muestra aleatoria de tamaño n (X1 , X2 , .... , Xn ) de una población de tamaño N y se

busca alguna función de esta muestra que estime el parámetro desconocido θ,

problema que será abordado con mayor detalle en el capítulo de estimación.

En este capítulo se desarrollan las distribuciones muestrales para muestras grandes (n

≥ 30 ) referidas a la media, a la diferencia de medias, a la proporción, a la diferencia

de proporciones y a los totales (conocida la distribución de la media y la proporción).

Cabe resaltar que el conocimiento de estas distribuciones muestrales es el soporte

fundamental para poder comprender el desarrollo de la estimación por intervalos y la

docimasia de hipótesis a tratar capítulos más adelante. A continuación se desarrolla

cada uno de los conceptos importantes de las distribuciones muestrales.

34

Población.- es el conjunto de todas las unidades de análisis (individuos u objetos) a

ser observadas y que poseen una característica común. Es decir, es el conjunto de

todas las observaciones posibles que puede tomar una variable aleatoria X. Por

ejemplo, en todas las empresas podemos estudiar: el número de trabajadores, las

ventas, etc.; en todos los hogares podemos estudiar: los ingresos, los gastos, etc.

Muestra.- es una parte representativa de la población. La representatividad implica

adecuado: método de muestreo, tamaño de muestra, selección de la muestra y

propuesta de estimadores (fórmulas). Relacionado al ejemplo anterior, la muestra

vendría dada por una parte representativa de empresas u hogares.

Muestra Aleatoria.- Sea X una variable aleatoria con distribución de probabilidad

f(x) (función de cuantía o función de densidad) con media μ y varianza σ2. Una

muestra aleatoria (m.a.) de tamaño n de X, es un conjunto de n variables aleatorias

(X1 , X2 , .... , Xn ) que cumplen:

1. Cada Xi (i = 1, 2, .... , n) tiene la misma distribución que X. Es decir, tienen la

misma distribución de probabilidades )()( xfxf XX i , la misma función de

distribución acumulativa )()( xFxF XX i , la misma media

iX = E(Xi) = E(X)

= μ conN

XN

i

i 1 y la misma varianza 2

IX = V(Xi ) = V(X) =

N

XN

i

i

1

2

2

)(

.

2. Las variables aleatorias Xi (i = 1, 2, .... , n) son independientes. Por lo tanto la

función de probabilidad conjunta de la muestra aleatoria X1 , X2 , .... , Xn está

dada por:

n

i

iXnXXXnXXX XfXfXfXfXXXfn

1

2121,....,, )()()....()(),....,,(21

.

Esta probabilidad de ocurrencia de la muestra observada, es importante en

estimación puntual, ya que allí representa la función de verosimilitud a

maximizar.

Nota:

35

La definición de m.a. se cumple cuando la muestra proviene de una población

infinita (discreta o continua) y cuando la muestra se extrae con reemplazo de

una población finita.

La definición de m.a. no se cumple cuando el muestreo es sin reemplazo de una

población finita, ya que las v.a. X1 , X2 , .... , Xn no son independientes. Sin

embargo, si el tamaño n de la muestra es muy pequeño en comparación con el

tamaño N de la población (n < 5% N ) se cumple aproximadamente la

definición.

Ejemplo 1.-

Si se toma una m.a. de tamaño n, de una población X con distribución de Poisson,

con parámetro λ, hallar la función de probabilidad conjunta (función de

verosimilitud) para dicha muestra.

Solución:

Como la v.a. X ~ Poisson (λ), entonces Xi ~ Poisson (λ) y su función de

probabilidad es: niX

eXf

i

X

iX

i

,....,2,1,!

)(

; Xi = 0, 1, 2, 3, ......

Luego la función de probabilidad conjunta (función de verosimilitud) será:

)()....()(),....,,( 2121,....,, 21 nXXXnXXX XfXfXfXXXfn

=

n

i i

X

X

ei

1 !

=

!1

1

X

eX

!2

2

X

eX ....

!n

X

X

en =

=

n

i

i

nX

X

e

n

i

i

1

!

1 , Xi = 0, 1, 2, 3, ...... ; i = 1, 2, .... , n .

Rpta.

Ejemplo 2.-

Si se toma una m.a. de tamaño n, de una población X con distribución N(μ , σ2 ),

hallar la función de probabilidad conjunta (función de verosimilitud) para dicha

muestra.

Solución:

36

Como la v.a. X ~ N(μ , σ2 ), entonces Xi ~ N(μ , σ

2 ) y su función de probabilidad

está dada por: ,;2

1)(

22 2/)(

2 i

X

iX XeXf i

i = 1, 2, 3, .... , n.

Luego la función de densidad conjunta (función de verosimilitud) será:

)()....()(),....,,( 2121,....,, 21 nXXXnXXX XfXfXfXXXfn

=

=

221 2/)(

22

1

Xe

222 2/)(

22

1

Xe ....

22 2/)(

22

1

nXe

=

=

,;2

11

22 2/)(2

2 i

Xn

xe

n

i

i

i = 1, 2, 3, .... , n. Rpta.

Estadístico.- es una variable aleatoria que depende sólo de la muestra observada.

Así, si X1 , X2 , .... , Xn es una m.a. de una población X, entonces la media muestral

( X ) y la varianza muestral (s2 ) son estadísticos. Donde:

n

X

X

n

i

i 1 y

1

)(1

2

2

n

XX

s

n

i

i

Distribución muestral.- es la distribución de probabilidad de un estadístico.

Error estándar de un estadístico.- es la desviación estándar de la distribución

muestral de un estadístico.

Error relativo de un estadístico.- es el coeficiente de variación de la distribución

muestral de un estadístico.

Teorema 1.- Sea X1 , X2 , .... , Xn una muestra aleatoria de tamaño n de una

población X, con media E(X) = μ y varianza Var (X) = σ2. Sea

n

X

X

n

i

i 1 la

media muestral, entonces: )(XE y n

XVarX

22 )(

.

Teorema 2.- Sea X1 , X2 , .... , Xn una muestra aleatoria sin reemplazo de tamaño n

de una población X de tamaño N, con media E(X) = E(Xi ) = μ y varianza Var (X)

= Var (Xi) = σ2.

Entonces: )(XE y

N

nN

n

S

N

nN

nXVar

X

222

1)(

.

37

Donde: 1

)(1

2

2

N

X

S

N

i

i

, representa la cuasivarianza poblacional y el factor

1

N

nN se llama factor de corrección para poblaciones finitas (f.c.p.f.) el mismo que

es descartado cuando la fracción de muestreo (f )

11

97.005.0

N

nN

N

nf .

A continuación presentamos las distribuciones muestrales de la media, del total

(conocida la media), de la diferencia de medias muestrales, de la proporción, del total

(conocida la proporción) y de la diferencia de proporciones. Todas ellas de suma

importancia en el diario quehacer de muchos campos de la investigación científica,

ya que como estudiaremos más adelante, van a permitir la determinación de

intervalos de confianza y la verificación de hipótesis para los parámetros

poblacionales.

2.1 DISTRIBUCIÓN MUESTRAL DE LA MEDIA

Teorema 3.- Si X1 , X2 , .... , Xn es una muestra aleatoria de tamaño n de una

población X, con media E(X) = μ y varianza Var (X) = σ2. Entonces, por el

teorema central del límite, la media muestral n

X

X

n

i

i 1 tiene aproximadamente

distribución normal con media μ y varianza σ2/n. )/,( 2 nNX . Y la variable

aleatoria n

XZ

/

)(

tiene aproximadamente distribución N(0, 1).

Este teorema es válido para cualquier población finita o infinita, discreta o continua,

cuando el tamaño de la muestra n ≥ 30. Si la población es normal, se cumple

cualquiera sea el tamaño n de la muestra.

Cuando la población es finita de N elementos y el muestreo es sin reemplazo, la

variables aleatorias Xi no son independientes, entonces la distribución de X es

hipergeométrica, con:

)(XE y

1)(

22

N

nN

nXVar

X

. Luego:

38

Teorema 4.- Si X1 , X2 , .... , Xn es una muestra aleatoria de tamaño n extraida sin

reemplazo de una población X finita de tamaño N, con media E(X) = μ y varianza

Var (X) = σ2. Entonces, la media muestral

n

X

X

n

i

i 1 tiene aproximadamente

distribución normal con media μ y varianza

1)(

22

N

nN

nXVar

X

. Y la

variable aleatoria

1

)(

N

nN

n

XZ

tiene aproximadamente distribución N(0, 1).

Ejemplo 3.-

En Lima Metropolitana la botella de aceite “primor” de un litro tiene un precio

promedio de S/. 5.00 y una desviación estándar de S/. 0.40. Si se toman muestras

aleatorias de 50 precios, se pide calcular e interpretar: a) la probabilidad que el precio

promedio muestral se encuentre entre S/. 4.85 y 5.10; b) la probabilidad que el

precio medio muestral sea inferior a S/. 4.80; y c) dentro de que límites simétricos

alrededor del precio promedio verdadero se encontrará el 95 % de los precios

promedios muestrales.

Solución.-

Como datos del problema se tiene que: μ = S/. 5.00 , σ = S/. 0.40 y n = 50.

nXVar

X

22 )(

= (0.40)

2 / 50 = 0.0032 .057.0

X S/.

Luego: )0032.0;00.5(NX y )1,0(057.0

)00.5(N

XZ

. Nos piden:

a) P(4.85 X 5.10) =

057.0

00.510.5

057.0

00.5

057.

00.585.4 XP =

= P(-2.63 Z 1.75) = (1.75) - (-2.63) =

= 0.95994 – 0.00427 = 0.95567 Rpta.

Interpretación.- el 95.567% de los precios promedios muestrales de las botellas de

aceite “primor” de un litro, se encuentran entre S/. 4.85 y 5.10, para muestras de

50 precios.

b) P( X < 4.80) = 00022.0)51.3()057.0

00.580.4

057.0

00.5(

ZP

XP

39

Interpretación.- el 0.022% de los precios promedios muestrales de las botellas de

aceite “primor” de un litro, será inferior a S/. 4.80, para muestras de 50 precios.

c) Sean 5.00 – E y 5.00 + E los límites simétricos alrededor de la media μ = S/.

5.00, dentro de los cuales estará el 95 % de las X . Entonces:

0.95 = P(5.00 – E X 5.00 + E) =

)057.0057.0

(E

ZE

P

=

975.0

057.01

057.02

057.0057.0

EEEE

11.0)057.0(96.196.1057.0

975.0 EZE

. Luego los límites serán:

5.00 – E= 5.00 – 0.11 = S/. 4.89 y 5.00 + 0.11 = S/. 5.11. Es decir:

0.95 = P(4.89 X 5.11)

Interpretación.- el 95 % de los precios promedios muestrales de las botellas de

aceite “primor” de un litro, se encuentran entre S/. 4.89 y 5.11 alrededor de μ =

S/. 5.00, para muestras de 50 precios.

2.2 DISTRIBUCIÓN MUESTRAL DEL TOTAL (conocida la media)

En muchas situaciones vamos a estar interesados en efectuar estimaciones de un

total poblacional, conocida la media muestral, para lo cual se tiene que tener presente

lo siguiente:

Sí el promedio poblacional es: N

XN

i

i 1

El total de la población se define como: NXXn

i

i 1

el cual es estimado por: XNNX ˆ

Utilizando la propiedad reproductiva de la distribución normal, el teorema

central del límite y los operadores esperanza y varianza para el estimador de

total, llegamos al resultado siguiente:

22,ˆˆX

NNNXNNX y X

N

NXNZ

~ N(0, 1)

Donde la varianza del estimador del total está dada por:

40

n

NNXVarNXNVarNVarXVarX

22222 )()()ˆ()ˆ(

, si la

fracción de muestreo f = n / N 0.05 , o

1

)()()ˆ()ˆ(2

2222

N

nN

nNNXVarNXNVarNVarXVar

X

, si

la fracción de muestreo f = n / N > 0.05.

2.3 DISTRIBUCIÓN DE LA DIFERENCIA DE MEDIAS MUESTRALES

Esta distribución va a surgir cuando estemos interesados en efectuar la comparación

de las medias de dos poblaciones. Por ejemplo: comparar el precio promedio

poblacional de un bien o servicio en la ciudad X (μX ) y el precio promedio

poblacional del mismo bien o servicio en la ciudad Y (μY ). O comparar los ingresos

promedios, ventas promedios, los rendimientos promedios, etc. no sólo entre

ciudades, sino también entre grupos.

Esta comparación se formula así: ¿Serán iguales los precios promedios de un bien o

servicio en las ciudades X e Y (o en las ciudades 1 y 2)? Que es idéntico a

plantearse ¿μX = μY o μX – μY = 0? o también ¿μ1 = μ2 o μ1 – μ2 = 0?

Es decir, que esta comparación se reduce a conocer la diferencia de medias

poblacionales, la misma que va a requerir tomar muestras aleatorias de ambas

poblaciones y estudiar el comportamiento de la media muestral en cada una de ellas,

de la siguiente manera:

Sea X1 , X2 , .... , Xn es una muestra aleatoria de tamaño n, de una población X de

tamaño N, con media E(X) = μX y varianza Var (X) = 2

X . Sabemos que la

media muestral n

X

X

n

i

i 1 tiene aproximadamente distribución normal:

),( 2

XXNX . Donde: n

XX

22

o

1)(

22

N

nN

nXVar X

X

..... (1)

Sea Y1 , Y2 , .... , Ym una muestra aleatoria de tamaño m, de una población Y de

tamaño M, con media E(Y) = μY y varianza Var (Y) = 2

Y . Sabemos que la

media muestral m

Y

Y

m

i

i 1 tiene aproximadamente distribución normal:

41

),( 2

YYNY . Donde: m

YY

22

o

1)(

22

M

mM

mYVar Y

Y

..... (2)

De (1) y (2) tenemos que X - Y es una variable aleatoria con media:

YXYXYXYEXEYXE

y varianza:

222

YXYXYVarXVarYXVar

2

YX =

n

X

2+

m

Y

2 o

1

2

N

nN

n

X +

1

2

M

mM

m

Y .............. (3)

Además, por la propiedad reproductiva de la distribución normal, de (1) y (2) se tiene

que:

X - Y ~ N( YX , 2

YX ) y

YX

YXYXZ

)( ) ~ N(0 , 1)

donde YX se obtiene a partir de (3).

Sintetizamos lo expuesto hasta aquí en el teorema 5.

Teorema 5.- Si X y Y son las medias de dos muestras aleatorias (de tamaños n y

m) de dos poblaciones X e Y, con medias μX y μY , y varianzas Var (X) = 2

X y

Var (Y) = 2

Y , respectivamente, entonces la distribución muestral de la diferencia de

medias es aproximadamente normal N( YX , 2

YX ) y la variable aleatoria

mn

YXZ

YX

YX

22

) )(

o

11

)(

22

)

M

mM

mN

nN

n

YXZ

YX

YX

tiene

aproximadamente distribución normal estándar N(0 , 1).

Si n y m son mayores o iguales que 30, la aproximación a la normal para la

diferencia de medias muestrales es óptima.

Si las poblaciones X e Y son normales, el teorema se cumple para cualesquier

tamaño de muestra.

Ejemplo 4.-

Ciertas bolsas de café tienen un peso medio de 500 gr. y una desviación estándar de

20 gr. Cierto día de producción se toman independientemente dos muestras al azar

sin reposición, con n = 500 y m = 800. ¿Cuál es la probabilidad que los pesos medios

42

de las dos muestras difieran a) en más de 2 gr.? y b) en menos de 1gr.? Interpretar

los resultados.

Solución.-

Sea X la muestra de tamaño n = 500 bolsas de café, con μX = 500 gr. y X = 20 gr.

Sea Y la muestra de tamaño m = 800 bolsas de café, con μY = 500 gr. y Y = 20 gr.

Luego: YX

= YX = 500 – 500 = 0, 2

YX =

n

X

2+

m

Y

2 =

800

20

500

20 22

=

1.3 y YX

= 1.14 gr.

Además, X - Y ~ N(0, 1.3) y 14.1

0

YXZ ~ N(0 , 1). Nos piden:

a) P ( X - Y > 2 ) = 1 - P ( X - Y 2 ) = 1 - P(-2 X - Y 2) =

= 1 -

14.1

02

14.1

0

14.1

02 YXP = 1 - P(-1.75 Z

1.75) =

= 1 – [ (1.75) - (-1.75)] = 1 - [ (1.75) – 1 + (1.75)] =

= 2 – 2 (1.75) = 2 – 2 (0.95994) = 0.08012 Rpta.

Interpretación.- en el 8.01% de las comparaciones, para muestras de 500 y 800

bolsas de café respectivamente, las diferencias de pesos medios serán mayores a 2

gramos.

b) P ( X - Y < 1 ) = P( -1 < X - Y < 1) =

=

14.1

01

14.1

0

14.1

01 YXP = P(-0.88 Z 0.88) =

= (0.88) - (-0.88) = 0.81057 – 0.18943 = 0.62114 Rpta.

Interpretación.- en el 62.11% de las comparaciones, para muestras de 500 y 800

bolsas de café respectivamente, las diferencias de pesos medios serán menores de

1 gramo.

43

2.4 DISTRIBUCIÓN MUESTRAL DE LA PROPORCIÓN

En muchos estudios vamos a estar interesados en clasificar los datos cualitativos o

cuantitativos de la población en dos clases distintas (población dicotómica o

binomial) tales como: éxitos y fracasos; hombres y mujeres; a favor y en contra;

aprueba y desaprueba; jóvenes (menores de x años) y adultos (de x años y más);

caras y sellos; empleados y desempleados; etc.

En este caso, se desea estimar la proporción de unidades (P) o el número total de

unidades (A) en la población que poseen una cierta característica o atributo que

cae dentro de una clase definida. Por ejemplo, se desea estimar:

- El porcentaje (o número) de personas que consumen un cierto producto.

- El porcentaje (o número) de clientes que compran más de 10 000 dólares

mensuales.

- El porcentaje (o número) de ciudadanos que está a favor de un personaje.

Notación: Además de la notación usada anteriormente, si se define la v.a.

Bernoulli:

Xi = 1, si la unidad estadística observada posee la característica de interés

(éxito).

Xi = 0, si la unidad estadística no posee la característica de interés (fracaso).

Entonces:

N

X

PyXA

N

i

iN

i

i

1

1

representan el número total de unidades (A) y la

proporción (P) de unidades en la población que poseen una cierta característica.

Suponga que se extrae una muestra aleatoria simple de tamaño n de la población

binomial, entonces la proporción muestral p definida como:

.,1 Paestiman

X

n

X

p

n

i

i

44

X =

n

i

iX1

= número de éxitos en la muestra es una v.a. Binomial (n, P). La

proporción muestral p, es una media muestral de v.a. Bernoulli con E(Xi ) = P y

V(Xi ) = P Q; representa la proporción de éxitos en la muestra y estima a la

proporción de éxitos en la población P. Es decir, que p tiene el mismo

comportamiento de una media muestral X . Por lo tanto:

PnPn

Pn

XEnn

X

EpEn

i

n

i

i

n

i

i

)(11

)(1

)(11

1

2

11

)(

)(n

XVar

n

X

VarpVar

n

i

i

n

i

i

(propiedad de la varianza)

2

22

1

2

1

)(

p

n

i

n

i

i

n

PQ

n

nPQ

n

PQ

n

XVar

Luego:

n

PQPN

n

X

n

X

p

n

i

i

,1

y

n

PQ

PpZ

~ N(0, 1)

Si el muestreo se efectúa sin reemplazo de una población binomial finita, la

distribución muestral de p sigue la distribución hipergeométrica y su varianza

requiere el factor de corrección para poblaciones finitas (salvo que la fracción de

muestreo f = n/N sea menor del 5%, donde no se utiliza). Entonces:

1,1

N

nN

n

PQPN

n

X

n

X

p

n

i

i

45

y

1N

nN

n

PQ

PpZ ~ N(0, 1)

Ejemplo 5.-

Según el Censo Nacional de Talla en Escolares de 19991 la desnutrición crónica en el

Perú era del 27.9%. Si se toma una muestra al azar sin reposición, de n = 1500 niños

y niñas. Calcule e interprete la probabilidad que: a) la desnutrición crónica muestral

se encuentre entre 26 y 30%? y b) dentro de que límites simétricos alrededor de la

proporción verdadera de desnutridos crónicos se encontrará el 95% de las

proporciones muestrales.

Solución.-

El mencionado Censo tiene los siguientes datos:

N = 2 059 426 niños y niñas censados como casos válidos = tamaño de la población.

X =

N

i

iX1

= 574 314 niños y niñas desnutridos crónicos.

426,059'2

314,5741

N

X

N

X

P

N

i

i

= 0.279 = proporción censal de niños y niñas con

desnutrición crónica.

Q = 0.721 = proporción censal de niños y niñas sin desnutrición crónica.

n = 1500 niños y niñas = tamaño de la muestra.

Como la fracción de muestreo n/N es menor de 0.05, entonces, la proporción

muestral:

1 Ministerio de Educación. Nutrición y Retardo en el Crecimiento. Resultados del II Censo Nacional de Talla en Escolares 1999.

Lima, Perú, Noviembre de 2000.

46

0001341.0;279.0,1 Nn

PQPN

n

X

n

X

p

n

i

i

y 0116.0

279.0

0001341.0

279.0

pp

n

PQ

PpZ ~ N(0, 1)

Se pide calcular:

a) P ( 0.26 p 0.30 ) =

0116.0

279.030.0

0116.0

279.0

0116.0

279.026.0 pP

= P( -1.64 Z 1.81 ) = (1.81) - (-1.64) =

= 0.96485 – 0.05050 = 0.91435 Rpta.

Interpretación.- en el 91.44 % de las muestras de 1500 niños y niñas a nivel

nacional, el porcentaje de desnutridos crónicos, se encuentra entre el 26 y 30 %.

b) Sean 0.279 – E y 0.279 + E los límites simétricos alrededor de la proporción

verdadera P = 0.279 , dentro de los cuales estará el 95 % de las p. Entonces:

0.95 = P(0.279 – E p 0.279 + E) =

)0116.00116.0

(E

ZE

P

=

975.0

0116.01

0116.02

0116.00116.0

EEEE

023.0)0116.0(96.196.10116.0

975.0 EZE

. Luego los límites serán:

0.279 – E = 0.279 – 0.023 = 0.256 y 0.279 + 0.023 = 0.302 . Es decir:

0.95 = P(0.256 p 0.302 ) Rpta.

Interpretación.- en el 95 % de las muestras de 1500 niños y niñas a nivel nacional,

la proporción de desnutridos crónicos se encontrará entre 0.256 y 0.302 alrededor

de la proporción verdadera P = 0.279.

47

2.5 DISTRIBUCIÓN MUESTRAL DEL TOTAL (conocida la proporción)

En muchas situaciones vamos a estar interesados en efectuar estimaciones de un

total poblacional, conocida la proporción muestral, para lo cual se tiene que tener

presente lo siguiente:

Sí N

X

P

N

i

i 1 representa la proporción (P) de unidades en la población que

poseen una cierta característica y

N

i

iXA1

el número total (A) de unidades que

poseen dicha característica. Entonces:

El total de la población se define como: NPXAN

i

i 1

el cual es estimado por: NpPNA ˆˆ

Utilizando la propiedad reproductiva de la distribución normal, el teorema

central del límite y los operadores esperanza y varianza para el estimador de

total, llegamos al resultado siguiente:

22,ˆˆpNNPNNpPNA y

pN

NPNpZ

~ N(0, 1)

Donde la varianza del estimador del total está dada por:

n

PQNNpVarNNpVarPNVarAVar p

2222 )()()ˆ()ˆ( , si la

fracción de muestreo f = n / N 0.05 , o

1)()()ˆ()ˆ( 2222

N

nN

n

PQNNpVarNNpVarPNVarAVar p , si

la fracción de muestreo f = n / N > 0.05.

48

2.6 DISTRIBUCIÓN MUESTRAL DE LA DIFERENCIA DE

PROPORCIONES

Esta distribución surge cuando estemos interesados en efectuar la comparación de las

proporciones de dos poblaciones. Por ejemplo: comparar la proporción poblacional

de individuos que prefiere un bien o servicio en la ciudad 1 (P1 ) y la proporción

poblacional de individuos que prefiere el mismo bien o servicio en la ciudad 2 (P2 ).

Comparar las proporciones de aceptación no sólo entre ciudades, sino también entre

grupos.

Esta comparación se formula así: ¿Serán iguales las proporciones poblacionales de

individuos que prefieren un bien o servicio en las ciudades 1 y 2? Que es idéntico a

plantearse ¿ P1 = P2 o P1 – P2 = 0 ?

Es decir, que esta comparación se reduce a conocer la diferencia de proporciones

poblacionales, la misma que va a requerir tomar muestras aleatorias de ambas

poblaciones y estudiar el comportamiento de la proporción muestral en cada una de

ellas y de la diferencia p1 – p2 de la siguiente manera:

Suponga que se extrae una muestra aleatoria simple de tamaño n1 de la población

binomial 1, de tamaño N1 con una proporción de éxitos igual a P1. Sea X1 el

número de éxitos en la muestra de tamaño n1 , entonces la proporción muestral de

éxitos p1 , definida como 1

11

n

Xp estima a P1 y para n1 suficientemente

grande tiene aproximadamente distribución normal:

),( 2

11 1pPNp . Donde: 1

112

1 n

QPp o

11

11

1

112

1 N

nN

n

QPp ..... (1)





22

n

Xp estima a P2 y para n2 suficientemente

grande tiene aproximadamente distribución normal:

49

),( 2

22 2pPNp . Donde: 2

222

2 n

QPp o

12

22

2

222

2 N

nN

n

QPp .....

(2)

Siendo p1 y p2 variables aleatorias independientes, cuyas distribuciones están

dadas en (1) y (2) tenemos que p1 – p2 es una variable aleatoria con media:

212121 2121PPpEpEppE pppp

y varianza:

22

2121

2

2121 pppp pVarpVarppVar

2

21 pp = 1

11

n

QP+

2

22

n

QP o

11

11

1

11

N

nN

n

QP +

12

22

2

22

N

nN

n

QP ............. (3)

Además, por la propiedad reproductiva de la distribución normal, de (1) y (2) se

tiene que:

p1 – p2 ~ N(P1 – P2 , 2

21 pp ) y

21

)( 2121

pp

PPppZ

~ N(0 , 1)

donde 21 pp se obtiene a partir de (3).

Sintetizamos lo expuesto hasta aquí en el teorema 6.

Teorema 6.- Si p1 y p2 son las proporciones de dos muestras aleatorias (de tamaños

n1 y n2 ) de las poblaciones binomiales 1 y 2, respectivamente, entonces la

distribución muestral de la diferencia de proporciones p1 - p2 ~ N(P1 – P2 , 2

21 pp )

y la variable aleatoria

2

22

1

11

2121 )(

n

QP

n

QP

PPppZ

o

11

)(

2

22

2

22

1

11

1

11

2121

N

nN

n

QP

N

nN

n

QP

PPppZ tiene aproximadamente distribución

normal estándar N(0 , 1).

50

Si n1 y n2 son mayores o iguales que 30, la aproximación a la normal para la

diferencia de proporciones muestrales es óptima.

Ejemplo 6.-

Una empresa que trabaja en ciudades grandes, considera que el nivel de aceptación

de su producto en los hogares de la ciudad 1 es de un 35% y en la ciudad 2 de un

30%. Si se toma una muestra aleatoria de 400 hogares de cada ciudad. ¿Cuál es la

probabilidad que la diferencia de proporciones muestrales de hogares que prefieren el

producto en ambas ciudades sea menor al 8%? Interpretar el resultado.

Solución.-

P1 = 0.35 = proporción de hogares que prefiere el producto en la ciudad 1.

Q1 = 1 – P1 = 0.65 = proporción de hogares que no prefiere el producto en la ciudad

1.

P2 = 0.30 = proporción de hogares que prefiere el producto en la ciudad 2.

Q2 = 1 – P2 = 0.70 = proporción de hogares que no prefiere el producto en la ciudad

2.

n1 = n2 = 400 hogares (tamaño de la muestra en ambas ciudades)

Considerando que ambas ciudades son grandes y que las correspondientes fracciones

de muestreo son menores al 5% (f = n / N < 0.05) se tiene que:

p1 – p2 ~ N(P1 – P2 , 2

21 pp )

Con media: 2121PPpp = 0.35 – 0.30 = 0.05

Y varianza: 2

21 pp = 1

11

n

QP+

2

22

n

QP =

400

)65.0)(35.0(

400

)65.0)(35.0( = 0.0011 .

Luego:

p1 – p2 ~ N(0.05 ; 0.0011) y 0331.0

05.0)( 212121

21

ppPPppZ

pp ~ N(0 , 1)

51

Se pide calcular:

P (p1 – p2 0.08 ) = P(-0.08 p1 – p2 0.08) =

=

0331.0

05.008.0

0331.0

05.0

0331.0

05.008.0 21 ppP =

= P(-3.93 Z 0.91) = (0.91) - (-3.93) =

= 0.81859 – 0.00004 = 0.81855 Rpta.

Interpretación.- en el 81.86% de las comparaciones, para muestras de 400 hogares

de cada ciudad, las diferencias de proporciones muestrales de hogares que

prefieren el producto en ambas ciudades será menor al 8%.

52


1. Si se toma una muestra aleatoria de tamaño n, de una población X con

distribución Bernoulli, con parámetro p, hallar la función de probabilidad conjunta

(o de verosimilitud) para dicha muestra.

Solución

Si la variable aleatoria. X ~ Bernoulli (p), entonces cada Xi ~ Bernoulli (p) y su

función de probabilidad es: 1( ) , 1,2,....,i ix x

X if x p q i n ; xi = 0 y 1.

Luego la función de probabilidad conjunta o de verosimilitud será:

1 2 1 2( , ,...., ) ( ) ( ).... ( )n X X X nf x x x f x f x f x 1 1x xp q 2 2x xp q .... n nx xp q

= 1 1

n n

i i

i i

x n x

p q

, xi = 0 y 1; i = 1, 2, .... , n . Rpta.

2. Si se toma una muestra aleatoria de tamaño m, de una población X con

distribución binomial, con parámetros n y p, hallar la función de probabilidad

conjunta (o de verosimilitud) para dicha muestra.

Solución

Como la variable aleatoria X ~ B(n, p), entonces cada Xi ~ B(n, p) y su función

de probabilidad es: ( ) , 1,2,....,i i

xi

x n x

X i nf x C p q i m ; xi = 0, 1, 2, 3, .... , n


1 2 1 2( , ,...., ) ( ) ( ).... ( )n X X X nf x x x f x f x f x

= 1 1

1

x n x

n xC p q

2 2

2

x n x

n xC p q .... m m

m

x n x

n xC p q

= 1 1

1

m m

i i

i i

i

m x m x

n x

i

C p q

, xi = 0, 1, 2,....,n; i = 1, 2, ..., m .

Rpta.


distribución de Pareto, con parámetro B, hallar la función de probabilidad


53

Solución

Si la variable aleatoria. X ~ Pareto (B), entonces cada Xi ~ Pareto (B) y su función de

probabilidad es: 0

01( ) , , 1,2,....,

B

X i iB

i

BXf x X X i n

X . Donde:

B = Coeficiente de Pareto > 0.

Xo = Ingreso mínimo.


1 2 1 2( , ,...., ) ( ) ( ).... ( )n X X X nf x x x f x f x f x 0

1

1

B

B

BX

X

0

1

1

B

B

BX

X

....0

1

1

B

B

BX

X

00

1

1

; , 1,2,....,n nB

inB

i

i

B XX X i n

X

, Rpta.

4. Si se toma una muestra aleatoria de tamaño n, de una población X con distribución

log-normal, con parámetros μ y σ2, hallar la función de probabilidad conjunta (o de

verosimilitud) para dicha muestra.

Solución

Como la variable aleatoria X ~ LN (μ , σ2 ), entonces cada Xi ~ LN (μ , σ

2 ) y su

función de probabilidad esta dada por: 2 2(ln ) / 2

2

1( ) ; 0,

2

ix

X i i

i

f x e xx

i =

1, 2, ...., n.

Luego la función de densidad conjunta o de verosimilitud será:

1 2 1 2( , ,...., ) ( ) ( ).... ( )n X X X nf x x x f x f x f x

=

2 21(ln ) / 2

2

1

1

2

xex

2 22(ln ) / 2

2

2

1

2

xex

....2 2(ln ) / 2

2

1

2

nx

n

ex

=

=

2 2

1

(ln ) / 22

2

1

1 1; 0,

2

n

i

i

nx

in

i

i

e x

x

i = 1, 2, 3, .... , n. Rpta.

54

5. Las botellas de aceite para motor de carros tienen un contenido medio de 2.0 litros

y una desviación estándar de 0.12 litros. Si se toma una muestra aleatoria de 36

botellas, Calcule e interprete la probabilidad que:

a) Las botellas tengan una media de llenado entre 1.96 y 2.03 litros.

b) ¿Dentro de qué límites simétricos caerá el 95 % de las medias muestrales

alrededor de la media poblacional?

Solución

Los datos del problema son: μ = 2.0 lts., σ = 0.12 lts. y n = 36 botellas.

nXVar

X

22 )(

= (0.12)

2 / 36 = 0.0004

X 0.02 lts.

Luego: 2( , )X

X N = N(2.00, 0.0004) y ( 2.00)

(0,1)0.02

XZ N

. Nos piden:

a) P(1.96 X 2.03) = 1.96 2.00 2.00 2.03 2.00

0.02 0.02 0.02

XP

= P(-2.0 Z

1.5)

= (1.5) - (-2.0) =

= 0.93319 – 0.02275 = 0.91044 Rpta.

20

15

10

5

0

X = media muestral

De

nsid

ad

1.96

0.9104

2.032.00

Distribución contenido medio de aceiteNormal, Media=2, Desv.Est.=0.02 lts.


55

Interpretación.- en el 91.04% de las (ó en 9104 de cada 10000) muestras de 36

botellas de aceite para motor de carro de dos litros, el contenido medio está entre

1.96 y 2.03 litros.

b) Sean 2.00 – E y 2.00 + E los límites simétricos alrededor de la media μ = 2.0 lts.,

dentro de los cuales estará el 95 % de las X . Entonces:

0.95 = P(2.00 – E X 2.00 + E) = ( )0.02 0.02

E EP Z

= 2 1 0.9750.02 0.02 0.02 0.02

E E E E

0.9750.02

EZ = 1.96 → E = 1.96 x 0.02 = 0.039 lts. Luego los límites serán:

2.00 – E = 2.00 – 0.039 = 1.961 lts. y 2.00 + 0.039 = 2.039 lts. Es decir:

0.95 = P(1.961 X 2.039) Rpta.

Interpretación.- en el 95% de las (ó en 9500 de cada 10000) muestras de 36

botellas de aceite para motor de carro de dos litros, el contenido medio está entre

1.961 y 2.039 lts. alrededor de μ = 2.0 lts.

6. Una estación de servicio de una ciudad grande ha encontrado que sus ventas

semanales de petróleo tienen un promedio de 15 galones por cliente con una

desviación estándar de 2.8. Para una muestra aleatoria de 49 clientes, calcule e

interprete:

a) La probabilidad de que la compra promedio semanal de petróleo sea menor de

14 galones;

b) ¿Dentro de qué límites simétricos caerá el 99% de las medias muestrales


Solución

Los datos del problema son: μ = 15 glns., σ = 2.8 glns. y n = 49 clientes.

nXVar

X

22 )(

= (2.8)

2 / 49 = 0.16

X 0.4 glns.

56

Entonces: 2( , )X

X N = N(15, 0.16) y ( 15)

0.4

XZ

N(0, 1). Nos piden:

a) P( X < 14) = 15 14 15

0.4 0.4

XP

= P(Z < -2.5) = (-2.5) = 0.00621 Rpta.


clientes de petróleo, la compra media es menor a 14 galones.

b) Sean 15 – E y 15 + E los límites simétricos alrededor de la media μ = 15

glns., dentro de los cuales caerá el 99 % de las X . Entonces:

0.99 = P(15 – E X 15 + E) = ( )0.4 0.4

E EP Z

= 2 1 0.9950.4 0.4 0.4 0.4

E E E E

0.9950.4

EZ = 2.575 → E = 2.575 x 0.4 = 1.03 glns. Luego los límites serán:

15 – E = 15 – 1.03 = 13.97 glns. y 15 + 1.03 = 16.03 glns. Es decir:

0.99 = P(13.97 X 16.03) Rpta.

1.0

0.8

0.6

0.4

0.2

0.0

X = media muestral

De

nsid

ad

13.97

0.99

16.0315

Normal, Media=15, Desv.Est.=0.4Distribución compra media de petróleo


57


clientes de petróleo, la venta media se encuentra entre 13.97 y 16.03 glns.

alrededor de μ = 15 glns.

7. La compañía “Yapatera” vende bolsas de azúcar con un contenido medio de 5

kilos y una desviación estándar de 0.2 kilos. Si se toma muestras al azar de 36

bolsas. Calcule e interprete:

a) La probabilidad de que el peso medio de la muestra supere los 5.1 kilos.

b) ¿Dentro de que límites simétricos alrededor de la media poblacional caerá el

90% de los pesos medios muestrales?

Solución

Los datos del problema son: μ = 5 Kg., σ = 0.2 Kg. y n = 36 bolsas.

nXVar

X

22 )(

= (0.2)

2 / 36 = 0.0011

X 0.033 Kg.

Entonces: 2( , )X

X N = N(5, 0.0011) y ( 5)

0.033

XZ

N(0, 1). Se pide:

a) P( X > 5.1) = 5 5.1 5

0.033 0.033

XP

= P(Z > 3.03) = 1 - (3.03) =

= 1 - 0.99878 = 0.00122 Rpta.

Interpretación.- en el 0.12% de las (ó en 12 de cada 10000) muestras de 36 bolsas

de azúcar, el peso medio supera los 5.1 kilos.

b) Sean 5 – E y 5 + E los límites simétricos alrededor de la media μ = 5 Kg.,

dentro de los cuales caerá el 90 % de las X . Entonces:

0.90 = P(5 – E X 5 + E) = ( )0.033 0.033

E EP Z

= 2 1 0.950.033 0.033 0.033 0.033

E E E E

0.950.033

EZ = 1.645 → E = 1.645 x 0.033 = 0.054 Kg. Luego los límites serán:

58

5 – E = 5 – 0.054 = 4.946 Kg. y 5 + 0.054 = 5.054 Kg. Es decir:

0.90 = P(4.946 X 5.054) Rpta.


bolsas de azúcar, el contenido medio se encuentra entre 4.946 y 5.054 Kg.

alrededor de μ = 5 Kg.

8. En Lima el precio promedio al consumidor del kilo de arroz es μ = S/. 3.20 con

una desviación estándar σ = S/. 0.25. Si se selecciona una muestra aleatoria de 100

consumidores de arroz, calcule e interprete:

a) La probabilidad que el precio medio muestral del arroz sea mayor a S/. 3.25 el

kilo.

b) ¿Dentro de que límites simétricos caerá el 95% de los precios medios

muestrales alrededor de la media poblacional?

Solución

Los datos del problema son: μ = S/. 3.20, σ = S/. 0.25. y n = 100 consumidores.

nXVar

X

22 )(

= (0.25)

2 / 100 = 0.000625

X S/. 0.025

Entonces: 2( , )X

X N = N(3.20, 0.000625) y ( 3.20)

0.025

XZ

N(0, 1). Se

pide:

a) P( X > 3.25) = 3.20 3.25 3.20

0.025 0.025

XP

= P(Z > 2.0) = 1 - (2.00) =

= 1 - 0.97725 = 0.02275 Rpta.


consumidores de arroz, el precio medio del kilo es mayor a S/. 3.25.

b) Sean 3.20 – E y 3.20 + E los límites simétricos alrededor de la media μ = S/.

3.20, dentro de los cuales caerá el 95 % de las X . Entonces:

0.95 = P(3.20 – E X 3.20 + E) = ( )0.025 0.025

E EP Z

59

= 2 1 0.9750.025 0.025 0.025 0.025

E E E E

0.9750.025

EZ = 1.96 → E = 1.96 x 0.025 = S/. 0.05. Luego los límites serán:

3.20 – E = 3.20 – 0.05 = S/. 3.15 y 3.20 + 0.05 = S/. 3.25. Es decir:

0.95 = P(3.15 X 3.25) Rpta.


consumidores de arroz, el precio medio del kilo se encuentra entre 3.15 y 3.25

nuevos soles alrededor de μ = S/. 3.20.

9. La compañía “La negrita” vende latas de café con un contenido medio de 195

gramos y una desviación estándar de 6 gramos. Si se toman muestras al azar de 25

latas. Calcule e interprete:

a) La probabilidad de que el peso medio de la muestra sea menor de 192

gramos.

b) ¿Dentro de que límites simétricos alrededor de la media poblacional caerá el

99.73% de los pesos medios muestrales?

Solución

Los datos del problema son: μ = 195 gr., σ = 6 gr. y n = 25 latas.

nXVar

X

22 )(

= (6)

2 / 25 = 1.44

X 1.2 gr.

Entonces: 2( , )X

X N = N(195, 1.44) y ( 195)

1.2

XZ

N(0, 1). Se pide:

a) P( X < 192) = 195 192 195

1.2 1.2

XP

= P(Z < -2.5) = (-2.50) = 0.00621


latas de café, el peso medio es menor 192 gr.

b) Sean 195 – E y 195 + E los límites simétricos alrededor de la media μ = 195

gr, dentro de los cuales caerá el 99.73 % de las X . Entonces:

60

0.9973 = P(195 – E X 195 + E) = ( )1.2 1.2

E EP Z

= 2 1 0.998651.2 1.2 1.2 1.2

E E E E

0.998651.2

EZ = 3.0 → E = 3 x 1.2 = 3.6 gr. Luego los límites serán:

195 – E = 3.6 – 0.05 = 191.4 gr. y 195 + 3.6 = 198.6 gr. Es decir:

0.9973 = P(191.4 X 198.6) Rpta.


latas de café, el peso medio se encuentra entre 191.4 y 198.6 gr. alrededor de μ =

195 gr.

10. Se sabe que en la ciudad A el gasto medio mensual en arbitrios es de S/. 250, con

una desviación típica de S/. 60; mientras que en la ciudad B dicho gasto medio

mensual es de S/. 235, con una desviación típica de S/. 50. En una auditoría para

determinar el gasto medio mensual en arbitrios en las ciudades A y B, se toma una

muestra al azar de 300 hogares de cada ciudad. Calcule e interprete la

probabilidad de que:

a) El gasto medio mensual en arbitrios en la ciudad B sea mayor que en la ciudad

A.

b) El gasto medio mensual en arbitrios en la ciudad A sea al menos S/. 25 más

que el gasto medio mensual en arbitrios en la ciudad B.

Solución

Los datos del problema son: μA = S/. 250, σA = S/. 35 y nA = 300 hogares.

μB = S/. 235, σA = S/. 20 y nB = 300 hogares. Luego:

2 22 (60)

( )300A

AAX

A

Var Xn

= 12.00 y

2 22 (50)

( )300B

BBX

B

Var Xn

= 8.33

61

A BA BX X

= 250 - 235 = 15, 2 2 2

A BA Bx xX X

= 12 + 8.33 = 20.33 y

A BX X

= 4.51. Luego:

2( , )A B

A B A B X XX X N

= N(15, 20.33) y

( 15)

4.51A BX X

Z

N(0, 1).

Se pide:

a) P( BX > AX ) = P( AX < BX ) = P( AX - BX < 0) =

( 15) 0 15

4.51 4.51A BX X

P

=

= P(Z < -3.33) = (-3.33) = 0.00043 Rpta.


hogares de cada ciudad, el gasto medio mensual en arbitrios en la ciudad B será

mayor que en la ciudad A.

b) 25A BP X X = 1 - 25A BP X X = 1 - 15 25 15

4.51 4.51A BX X

P

=

= 1 – P(Z < 2.22) = 1 - (2.22) =

= 1 – 0.98679 = 0.01321 Rpta.


hogares de cada ciudad, el gasto medio mensual en arbitrios en la ciudad A

será al menos S/. 25 más que el gasto medio mensual en arbitrios en la ciudad

B.

11. Dos fábricas A y B productoras de bombillas afirman que el promedio de

duración de ellas es de 1980 y 1950 horas, respectivamente, con desviaciones

típicas de 90 y 100 horas. Si se seleccionan 100 bombillas al azar de cada fábrica,

calcule e interprete la probabilidad de que:

a) Las bombillas B tengan una duración media menor de 1930 horas.

b) Las bombillas B tengan una duración media mayor que la duración media de

las bombillas A.

62

Solución

Los datos del problema son: μA = 1980 horas, σA = 90 horas y nA = 100 bombillas.

μB = 1950 horas, σB = 100 horas y nB = 100 bombillas. Luego:

22 ( )

A

AAX

A

Var Xn

= (90)

2 / 100 = 81 y

22 ( )

B

BBX

B

Var Xn

= (100)

2 / 100 =

100

a) 2( , )B

B B XX N = N(1950, 81) y

( 1950)

9BX

Z

N(0, 1). Se pide:

P( BX < 1930) = 1950 1930 1950

9 9BX

P

= P(Z < -2.22) =

= (-2.22) = 0.01321 Rpta.


bombillas B, la duración media menor de 1930 horas.

b) A B

A BX X

= 1980 - 1950 = 30, 2 2 2

A BA Bx xX X

= 81 + 100 = 181 y

A BX X

= 13.45. Luego:

2( , )A B

A B A B X XX X N

= N(30, 181) y

( 30)

13.45A BX X

Z

N(0,

1). Se pide:

P( BX > AX ) = P( AX < BX ) = P( AX - BX < 0) = ( 30) 0 30

13.45 13.45A BX X

P

=

= P(Z < -2.23) = (-2.23) = 0.01287 Rpta.


bombillas A y 100 bombillas B, la duración media de las bombillas B es mayor

que la duración media de las bombillas A.

12. Un proceso automático es realizado por dos máquinas que empaquetan un

producto en bolsas de 500 gramos. La máquina 1 llena con una desviación

estándar de 15 gramos y la máquina 2 de 20 gramos. Si se seleccionan muestras

de 100 bolsas de cada máquina, calcule e interprete la probabilidad de que:

a) El llenado medio de la máquina 1 sea menor que el llenado medio de la máq.

2.

63

b) Las medias muestrales difieran en menos de 2 gramos.

Solución

Los datos del problema son: μ1 = 500 gr., σ1 = 15 gr. y n1 = 100 bolsas.

μ2 = 500 gr., σ2 = 20 gr. y n2 = 100 bolsas. Luego:

1

22 1

1

1

( )X

Var Xn

= (15)

2 / 100 = 2.25 y

2

22 2

2

2

( )X

Var Xn

= (20)

2 / 100 = 4.

1 21 2X X

= 500 - 500 = 0, 1 21 2

2 2 2

x xX X

= 2.25 + 4 = 6.25 y

A BX X

= 2.5. Luego:

1 2

2

1 2 1 2( , )X X

X X N

= N(0, 6.25) y 1 2( 0)

2.5

X XZ

N(0, 1). Se pide:

a) P( 1X < 2X ) = P( 1X - 2X < 0) = 1 2( 0) 0 0

2.5 2.5

X XP

=

= P(Z < 0) = (0) = 0.5000 Rpta.


bolsas de la máquina 1 y 100 bolsas de la máquina 2, el llenado medio de la

máquina 1 es menor que el llenado medio de la máquina 2.

b) 1 2 2P X X = 1 22 2P X X = 1 2 02 0 2 0

2.5 2.5 2.5

X XP

=

= P(-0.80 < Z < 0.80) = 2 (0.80) - 1 =

= 2 (0.78814) – 1 = 0.57628 Rpta.

Interpretación.- en el 57.63% de las (ó en 5763 de cada 10000) muestras de

100 bolsas de cada máquina, las medias muestrales difieren en 2 gramos.

13. Según un estudio del Ministerio de Salud,2 en el Perú los varones de 9 años de

edad tienen un peso promedio de 26.8 Kg. y una desviación estándar de 2.5 Kg.,

mientras que las mujeres tienen un peso promedio de 26.7 Kg. y una desviación

estándar de 3.8 Kg. Si se toman independientemente dos muestras al azar sin

reposición, de n = 300 niños y m = 300 niñas. Calcule e interprete la probabilidad

de que:

2 Ministerio de Salud. Informe del estado nutricional en el Perú. Componente nutricional ENAHO-CENAN Julio 2009 – Junio 2010,

CENAN – INEI,.. Lima, Perú, 2011.

64

a) El peso promedio de los niños sea menor que el peso promedio de las niñas.

b) El peso promedio de los niños sea al menos 0.6 kg. más que el peso promedio

de las niñas.

Solución

Los datos del problema son: μv = 26.8 Kg., σv = 2.5 Kg. y nv = 300 niños.

μm = 26.7 Kg., σm = 3.8 Kg. y nm = 300 niñas. Luego:

22 ( )

v

vvX

v

Var Xn

= (2.5)

2 / 300 = 0.02083 y

22 ( )

m

mmX

m

Var Xn

= (3.8)

2 / 300 = 0.04813.

v mv mX X

= 26.8 – 26.7 = 0.1, 2 2 2

v mv mx xX X

= 0.06896 y

v mX X

= 0.2626. Luego:

2( , )v m

v m v m X XX X N

= N(0.1, 0.2626) y

( 0.1)

0.2626

v mX XZ

N(0,

1). Se pide:

a) P( vX < mX ) = P( vX - mX < 0) = ( 0.1) 0 0.1

0.2626 0.2626v mX X

P

=

= P(Z < -0.38) = (-0.38) = 0.35197 Rpta.


niños y 300 niñas peruanos de 9 años de edad, el peso promedio de los niños

es menor que el peso promedio de las niñas.

b) 0.6v mP X X = 1 - 0.6v mP X X = 1 -

0.1 0.6 0.1

0.2626 0.2626v mX X

P

=

= 1 – P(Z < 1.90) = 1 - (1.90) =

= 1 – 0.97128 = 0.02872 Rpta.


niños y 300 niñas peruanos de 9 años de edad, el peso promedio de los niños

será al menos 0.6 kg. más que el peso promedio de las niñas.

14. Una empresa azucarera embolsa azúcar con un contenido medio de 50 kg. y

desviación estándar de 0.5 kg. Para el control de calidad se toman muestras

65

aleatorias de 25 bolsas de la producción diurna y 50 de la producción nocturna.

Calcule e interprete la probabilidad de que la producción media de las bolsas de

ambos turnos difieran en menos de 0.2 kg.

Solución

Los datos del problema son: μ1 = 50 Kg., σ1 = 0.5 Kg. y n1 = 25 bolsas.

μ2 = 50 Kg., σ2 = 0.5 Kg. y n2 = 50 bolsas. Luego:

1

22 1

1

1

( )X

Var Xn

= (0.5)

2 / 25 = 0.01 y

2

22 2

2

2

( )X

Var Xn

= (0.5)

2 / 50 =

0.005

1 21 2X X

= 50 - 50 = 0, 1 21 2

2 2 2

x xX X

= 0.010 + 0.005 = 0.015 y

A BX X

= 0.1225. Luego:

1 2

2

1 2 1 2( , )X X

X X N

= N(0, 0.015) y 1 2( 0)

0.1225

X XZ

N(0, 1). Se

pide:

1 2 0.2P X X = 1 20.2 0.2P X X =

= 1 2 00.2 0 0.2 0

0.1225 0.1225 0.1225

X XP

=

= P(-1.63 < Z < 1.63) = 2 (1.63) - 1 =

= 2 (0.94845) – 1 = 0.8969 Rpta.


bolsas de la producción diurna y 50 de la producción nocturna, la producción

media de las bolsas de ambos turnos difieren en menos de 0.2 kg.

15. En las tiendas Metro el 70 % de las compras es en alimentos y bebidas. Si se

seleccionan muestras aleatorias de 200 compras. Calcule e interprete:

a) La probabilidad de que el porcentaje de compras en alimentos y bebidas sea

mayor al 80%.

b) ¿entre que límites simétricos alrededor del verdadero porcentaje de compras

en alimentos y bebidas caerá el 99% de los porcentajes muestrales?

Solución

Los datos del problema son: P = 0.70 = proporción de las compras en alimentos y

bebidas en las tiendas Metro, Q = 0.30, n = 200 compras = tamaño de la muestra.

66

Asumiendo un número muy grande de compradores, entonces, la proporción muestral:

1 ,

n

i

i

XX PQ

p N Pn n n

= N(0.70; 0.00105) y

0.70 0.70

0.03240.00105

p P p pZ

PQ

n

~ N(0, 1). Se pide calcular:

a) P (p > 0.80 ) = 1 - P (p ≤ 0.80 ) = 1 - 0.70 0.80 0.70

0.0324 0.0324

pP

= 1 - P(Z 3.09) = 1 - (3.09) = 1- 0.9990 = 0.0010 Rpta.

Interpretación.- en el 0.10 % de las (ó en 10 de cada 10000) muestras de 200

compras en las tiendas Metro, el porcentaje de compras en alimentos y bebidas es

mayor al 80%.


verdadera P = 0.70, dentro de los cuales estará el 99 % de las p (proporciones

muestrales). Entonces:

0.99 = P(0.70 – E p 0.70 + E) = ( )0.0324 0.0324

E EP Z

=

= 2 1 0.9950.0324 0.0324 0.0324 0.0324

E E E E

0.995 2.575 2.575(0.0324) 0.0830.0324

EZ E . Luego los límites serán:

0.70 – E = 0.70 – 0.083 = 0.617 y 0.70 + 0.083 = 0.783. Es decir:

0.99 = P(0.617 p 0.783) Rpta.


compras en las tiendas Metro, el porcentaje de compras en alimentos y

bebidas se encuentra entre 61.7% y 78.3% alrededor de la proporción

verdadera P = 0.70.

16. El 40% de los clientes de las tiendas Saga son varones. Si se toma una muestra

aleatoria de 200 clientes. Calcule e interprete:

a) La probabilidad que el porcentaje de clientes varones esté entre 36% y 45%.

67

b) ¿dentro de que límites simétricos del porcentaje de mujeres en la población

caerá el 95% de los porcentajes de la muestra?

Solución

Los datos del problema son: P = 0.40 = proporción de clientes varones en las tiendas

Saga, Q = 0.60 y n = 500 clientes.

Asumiendo un número muy grande de clientes en las tiendas Saga, la distribución

de la proporción muestral de hombres p es:

1 ,

n

i

i

XX PQ

p N Pn n n

= N(0.40; 0.0012) y

0.40 0.40

0.03460.0012

p P p pZ

PQ

n


a) P ( 0.36 p 0.45 ) = 0.36 0.40 0.40 0.45 0.40

0.0346 0.0346 0.0346

pP

=

= P(-1.16 Z 1.45) = (1.45) - (-1.16) =

= 0.92647 – 0.12302 = 0.80345 Rpta.


clientes de las tiendas Saga, el porcentaje de clientes varones está entre 36% y

45%.

b) La distribución de la proporción muestral de mujeres q es:

1 ,

n

i

i

XX PQ

q N Qn n n

= N(0.60; 0.0012) y

0.60

0.0346

qZ

~ N(0, 1). Se pide calcular límites simétricos.

Sean 0.60 – E y 0.60 + E los límites simétricos alrededor de la proporción

verdadera Q = 0.60, dentro de los cuales estará el 95 % de las proporciones

muestrales de mujeres q. Entonces:

0.95 = P(0.60 – E q 0.60 + E) = ( )0.0346 0.0346

E EP Z

=

= 2 1 0.9750.0346 0.0346 0.0346 0.0346

E E E E

68

0.975 1.96 1.96(0.0346) 0.0680.0346


0.60 – E = 0.60 – 0.068 = 0.532 y 0.60 + 0.068 = 0.668. Es decir:

0.95 = P(0.532 q 0.668) Rpta.


clientes de las tiendas Saga, el porcentaje de clientes mujeres está entre 53.2% y

66.8% alrededor de la proporción verdadera Q = 0.60.

17. En Lima el 60% de los hogares consume mantequilla. Si se toma una muestra

aleatoria de 1000 hogares. Calcule e interprete:

a) La probabilidad que menos del 57% de los hogares consuma mantequilla.

b) Dentro de que límites simétricos, alrededor de la verdadera proporción de

hogares que consume mantequilla, estará el 99% de las proporciones

muestrales.

Solución

Los datos del problema son: P = 0.60 = proporción de hogares que consume

mantequilla, Q = 0.40 y n = 1000 hogares.

Asumiendo un número muy grande de hogares en Lima, la distribución de la

proporción muestral de hogares que consume mantequilla p es:

1 ,

n

i

i

XX PQ

p N Pn n n

= N(0.60; 0.00024) y

0.60 0.60

0.01550.0155

p P p pZ

PQ

n


a) P (p < 0.57 ) = 0.60 0.57 0.60

0.0155 0.0155

pP

=

= P(Z < - 1.94) = (-1.94) = 0.02619 Rpta.


hogares, menos del 57% de los hogares consume mantequilla.


verdadera P = 0.60, dentro de los cuales cae el 99 % de las proporciones

muestrales de hogares que consume mantequilla p. Entonces:

69

0.99 = P(0.60 – E p 0.60 + E) = ( )0.0155 0.0155

E EP Z

=

= 2 1 0.9950.0155 0.0155 0.0155 0.0155

E E E E

0.995 2.575 2.575(0.0155) 0.040.0155


0.60 – E = 0.60 – 0.04 = 0.56 y 0.60 + 0.04 = 0.64. Es decir:

0.99 = P(0.56 p 0.64) Rpta.


hogares de Lima, el porcentaje de hogares que consume mantequilla está entre

56% y 4% alrededor de la proporción verdadera P = 0.60.

18. Dos empresas producen cierto artículo, la empresa A produce por término medio

20% de defectuosos, mientras que la empresa B produce un 30% de defectuosos.

Si se extrae una muestra aleatoria de 300 y 150 artículos respectivamente, calcule

e interprete la probabilidad de que el porcentaje de artículos defectuosos

producidos por la empresa B difiere de los defectuosos producidos por la empresa

A en 2% o menos.

Solución

Los datos del problema son:

PA = 0.20 = proporción de artículos defectuosos producidos por la empresa A.

QA = 0.80 = proporción de artículos buenos producidos por la empresa A.

PB = 0.30 = proporción de artículos defectuosos producidos por la empresa B.

QB = 0.70 = proporción de artículos buenos producidos por la empresa B.

nA = 300 y nB = 150 artículos.

Considerando que ambas empresas producen gran número de artículos y que las

correspondientes fracciones de muestreo son menores al 5% (f = n / N < 0.05) se tiene

que:

pB - pA ~ N(PB – PA ; 2

B Ap p )

Con media: A Bp p = PB – PA = 0.30 – 0.20 = 0.10

Y varianza: 2

B Ap p = A A

A

P Q

n+ B B

B

P Q

n =

(0.2)(0.8) (0.3)(0.7)

300 150 = 0.0019. Luego:

70

pB – pA ~ N(0.10 ; 0.0019) y ( ) 0.10

0.044B A

B A B A B A

p p

p p P P p pZ

~ N(0 ,

1)

Se pide calcular:

P (pB – pA 0.02) = 0.10 0.02 0.10

0.044 0.044B Ap p

P

=

= PZ -1.82) = (-1.82) = 0.03438 Rpta.

Interpretación.- en el 3.44% de las (ó en 344 de cada 10000) comparaciones, para

muestras de 300 artículos de la empresa A y 150 de la empresa B, el porcentaje de

artículos defectuosos producidos por la empresa B difiere de los defectuosos

producidos por la empresa A en 2% o menos.

19. En una ciudad se sabe que la preferencia de las mujeres por un diario es del 20% y

para los hombres de un 25%. Si se toma una muestra aleatoria de 200 mujeres y

100 hombres, calcule e interprete la probabilidad de que el porcentaje de mujeres

que prefiere el diario difiera del porcentaje de hombres que lo prefiere en 8% o

más.

Solución


PM = 0.20 = proporción de mujeres que prefiere el diario.

QM = 0.80 = proporción de mujeres que no prefiere el diario.

PH = 0.25 = proporción de hombres que prefiere el diario.

QH = 0.75 = proporción de hombres que prefiere el diario.

nM = 200 mujeres y nH = 100 hombres.

Considerando que el número de mujeres y hombres en la ciudad es grande y que las


que:

PM – pH ~ N(PM – PH ; 2

M Hp p )

Con media: A Bp p = PM – PH = 0.20 – 0.25 = -0.05

Y varianza: 2

M Hp p = M M

M

P Q

n+ H H

H

P Q

n =

(0.2)(0.8) (0.25)(0.75)

200 100 = 0.0027. Luego:

71

pM – pH ~ N(-0.05 ; 0.0027) y ( ) 0.05

0.052M H

M H M H M H

p p

p p P P p pZ

~ N(0 ,

1)

Se pide calcular:

P (pM – pH ≥ 0.08) = 0.05 0.08 0.05

0.052 0.052M Hp p

P

= P(Z ≥ 2.50) =

= 1 - (2.50) = 1 - 0.99379 = 0.00621 Rpta.

Interpretación.- en el 0.62% de las (ó en 62 de cada 10000) muestras de 200 mujeres y

100 hombres, el porcentaje de mujeres que prefiere el diario difiere del porcentaje de

hombres que lo prefiere en 8% o más.

20. Considere que los niveles de preferencia de un determinado artículo en la ciudad

A es de un 30% de hogares y en la ciudad B de un 35%; si se seleccionan

muestras aleatorias de 250 hogares de la ciudad A y 150 hogares de la B, calcule e

interprete la probabilidad de que el % de hogares que prefiere el artículo en la

ciudad A difiere de los que lo prefieren en la ciudad B en 7% o más.

Solución


PA = 0.30 = proporción de hogares que prefiere el artículo en la ciudad A.

QA = 0.70 = proporción de hogares que no prefiere el artículo en la ciudad A.

PB = 0.35 = proporción de hogares que prefiere el artículo en la ciudad B.

QB = 0.65 = proporción de hogares que no prefiere el artículo en la ciudad B.

nA = 250 y nB = 150 hogares.

Considerando que en ambas ciudades hay un gran número de hogares y que las


que:

pA – pB ~ N(PA – PB ; 2

A Bp p )

Con media: A Bp p = PA – PB = 0.30 – 0.35 = -0.05

Y varianza: 2

A Bp p = A A

A

P Q

n+ B B

B

P Q

n =

(0.3)(0.7) (0.35)(0.65)

250 150 = 0.0024. Luego:

72

pA – pB ~ N(-0.05 ; 0.0024) y ( ) 0.05

0.049A B

A B A B A B

p p

p p P P p pZ

~ N(0 ,

1)

Se pide calcular:

P (pA – pB ≥ 0.07) = 0.05 0.07 0.05

0.049 0.049A Bp p

P

= P(Z ≥ 2.45) =

= 1 - (2.45) = 1 - 0.99286 = 0.00714 Rpta.

Interpretación.- en el 0.71% de las (ó en 71 de cada 10000) muestras de 250 hogares

de la ciudad A y 150 hogares de la ciudad B, el % de hogares que prefiere el artículo

en la ciudad A difiere de los que lo prefieren en la ciudad B en 7% o más.

73

2.8 EJERCICIOS PRPUESTOS


distribución geométrica, con parámetro p, hallar la función de probabilidad



distribución binomial negativa, con parámetros r y p, hallar la función de

probabilidad conjunta (o de verosimilitud) para dicha muestra.


distribución exponencial, con parámetro λ, hallar la función de probabilidad


4. Las botellas de la bebida “Rica Kola” familiar tienen un contenido medio de 2.5

litros y una desviación estándar de 0.1 litros. Si se toma una muestra aleatoria de

36 botellas, Calcule e interprete la probabilidad que:

a) Las botellas tengan una media de llenado entre 2.46 y 2.53 litros.

b) ¿dentro de qué límites simétricos caerá el 99 % de las medias muestrales


5. En Lima el precio promedio al consumidor del kilo de mango es μ = S/. 2.20 con

una desviación estándar σ = S/. 0.20. Si se selecciona una muestra aleatoria de 100

consumidores de mango, calcule e interprete la probabilidad:

a) que el precio medio muestral sea mayor a S/. 2.25 el kilo.

b) ¿Dentro de que límites simétricos caerá el 95% de las medias muestrales


6. Las cajas con mango tienen un peso medio de 20 Kg. y una desviación estándar de

0.75 Kg. Si se cargan 400 cajas al azar en un camión, calcule e interprete la


a) El peso total de las cajas supere la capacidad máxima del camión que es de

8,040 Kg.

b) El peso medio de las cajas sea menor a 19.92 Kg.

c) ¿Dentro de que límites simétricos alrededor de la media poblacional caerá el

95% de las medias muestrales?

74

7. En una gran ciudad el promedio de empleados para establecimientos pequeños es

de 10 y la desviación estándar de 5 empleados. Para una muestra aleatoria de 36

establecimientos pequeños extraídos sin reemplazo, calcule e interprete:

a) La probabilidad que el promedio muestral de empleados sea menor que 8.

b) ¿Dentro de que límites simétricos del promedio poblacional caerá el 95% de

las medias muestrales de empleados por establecimientos pequeños?

8. Una empresa eléctrica fabrica focos cuya duración tiene distribución normal con

media de 1500 horas y desviación estándar de 50 horas. En una muestra aleatoria

de 16 focos, calcule e interprete la probabilidad que:

a) La duración promedio de los focos menor de 1475 horas.

b) ¿Dentro de que límites simétricos de la duración media poblacional caerá el

95% de las duraciones medias muestrales?

9. Dos fábricas A y B que embolsan café, afirman que el promedio en las bolsas es

de 495 y 490 gramos, respectivamente, con desviaciones típicas de 5 y 6 gramos.

Si se seleccionan 36 bolsas al azar de cada fábrica, calcule e interprete la


a) El contenido medio de las bolsas A sea mayor de 497 gramos.

b) El contenido medio de las bolsas A sea menor que el contenido medio de las

bolsas B.

10. Uno de los principales fabricantes de tv compra cables a dos compañías. Los

cables de la compañía A tienen una vida media de 7.2 años con una desviación

estándar de 0.8 años, mientras que los de la B tienen una vida media de 6.7 años

con una desviación estándar de 0.7 años. Si se toman m.a. de 34 cabless de A y 40

de B, calcule e interprete la probabilidad de que la vida media de los cables A sea

de al menos un año más que la vida media de los B.

11. En una empresa de gaseosas la producción media de los varones es de 52 lts. Con

una desviación estándar de 7 lts. y la producción media de las mujeres es de 48 lts.

con una desviación estándar de 5 lts. Si se toma una muestra aleatoria de 40

trabajadores hombres y 40 mujeres. Calcule e interprete la probabilidad que la

producción media de los varones resulte menor que la producción media de las

mujeres.

75

12. En una universidad la edad promedio de los alumnos del turno de la mañana es de

22 años con una desviación estándar de 3 años, mientras que los del turno de la

noche tienen una edad media de 28 años con una desviación estándar de 5 años. Si

se toma una muestra aleatoria de 50 alumnos de cada turno, calcule e interprete la

probabilidad de que la edad promedio de los alumnos de la mañana es superior a

la edad media de los de la noche.

13. El 60% de los ciudadanos esta de acuerdo con la gestión presidencial. Si se toma

una muestra aleatoria de 500 ciudadanos, calcule e interprete:

a) La probabilidad de que más del 65% esté de acuerdo con la gestión

presidencial.


ciudadanos esta de acuerdo con la gestión presidencial, esta el 95% de las

proporciones muestrales.

14. En Lima el 60% de los hogares usa gas como combustible para cocinar. Si se

toma una muestra aleatoria de 1000 hogares. Calcule e interprete:

a) La probabilidad que más del 65% de los hogares use gas.


hogares que usa gas, estará el 99% de las proporciones muestrales.

15. En Lima el 30% de los hogares compra periódicos y/o revistas. Si se toma una

muestra aleatoria de 1000 hogares. Calcule e interprete:

a) La probabilidad de que más del 34% de hogares compre periódicos y/o

revistas.

b) ¿Dentro de que límites simétricos alrededor de la proporción verdadera caerá

el 99.73% de las proporciones muestrales de hogares que compra periódicos

y/o revistas?

16. El 70% de empleados públicos es casado. Si se toma una muestra aleatoria de 64

empleados, calcule e interprete:

a) La probabilidad de que más del 85% esté casado.


empleados públicos casados, estará el 95% de las proporciones muestrales.

76

17. El 70 % de las compras con tarjeta de crédito en tiendas Ripley son superiores a

$200. Si se seleccionan muestras aleatorias de 100 compras; Calcule e interprete:

a) La probabilidad que las muestras tengan entre 65% y 80 % de compras

mayores que $200?

b) ¿Entre que límites simétricos del porcentaje de compras mayores de $200 en

la población caerá el 99% de los porcentajes muestrales?

18. Dos empresas producen equipos de sonido, la empresa A produce por término

medio 10% de defectuosos, mientras que la empresa B produce un 20%. Si se

extrae una muestra aleatoria de 400 y 200 unidades respectivamente, calcule e

interprete la probabilidad de que el porcentaje de equipos defectuosos producidos

por la empresa A difiere de los defectuosos producidos por la empresa B en 7% o

menos.

19. En un estudio pasado se determinó que el porcentaje de hombres que está de

desacuerdo con la construcción de un gimnasio era del 12%, mientras que el

porcentaje de mujeres en desacuerdo era del 10%. Si se toma una muestra

aleatoria de 100 hombres y 100 mujeres, calcule e interprete la probabilidad de

que el porcentaje de hombres en desacuerdo sea al menos 3% mayor que el de las

mujeres.

20. En cierta ciudad se sabe que el 25% de los hombres y el 30% de las mujeres están

familiarizados con un producto. Si se toma una muestra aleatoria de 200 hombres

y 200 mujeres, calcule e interprete la probabilidad de que el porcentaje de

hombres familiarizados con el producto sea mayor que el de mujeres.

77

Capítulo 3. DISTRIBUCIONES ESPECIALES

“El informar mal, utilizando material estadístico, podría llamarse

manipulación estadística, y resumiéndolo en una sola palabra (aunque

no sea muy buena), estadisticulación”

Darrell Huff

CONTENIDO

3.1 Distribución Chi-cuadrado.

3.2 Distribución t de student.

3.3 Distribución muestral de la media (n < 30).

3.4 Distribución de la diferencia de medias muestrales con varianzas

desconocidas pero iguales.

3.5 Distribución F de Snedecor

3.6 Distribución de la razón de dos varianzas muestrales.



En este capítulo, se presentan las distribuciones muestrales especiales, las mismas

que han sido desarrolladas fundamentalmente para muestras pequeñas (menores de

30 observaciones).

Entre las principales distribuciones tenemos: la distribución chi – cuadrado de

Pearson, la distribución t – student de Gosset y la distribución F de Snedecor. A

continuación veremos sus principales características y propiedades de cada una de

ellas.

3.1 DISTRIBUCIÓN CHI-CUADRADO

Esta distribución fue descubierta por Helmert el año 1875 y redescubierta por Karl

Pearson el año 1900.

Definición.- Sean Z1, Z2, ..., Zr, variables aleatorias independientes, cada una

con distribución normal estándar, Zi ~ N(0 , 1) . Entonces, la variable aleatoria

22

2

2

1 ...² rZZZx

78

tiene una distribución chi-cuadrado (o Ji-cuadrado) con r grados de libertad, si

su función de densidad de probabilidades está dada por:

)(2 xfX

= 2/1

2

2

22

1 x

r

rex

r

, 0 < x <

= 0 , en otros casos

Donde:

Γ representa el gamma de un número,

0

1)( dxeXn xn , n > 0. Si n

es entero positivo )(n = (n – 1)! . Además,

2

1 .

r = grados de libertad (g.l.) representa el número de v.a. independientes

que se suman o el número de variables que pueden variar libremente. En

regresión y econometría es el rango de una matriz (máximo número de

columnas linealmente independientes) asociado a formas cuadráticas delas

sumas de cuadrados.

Observación: la distribución chi – cuadrado es un caso particular de la

distribución de probabilidades Gamma con n = r / 2 y λ = 1 / 2.

Si X ~ Gamma con parámetros n > 0 y λ > 0, entonces su función de densidad

de probabilidades está dada por:

xnn

exn

xf

1

)()( , x > 0

= 0 , en otros casos.

La esperanza y la varianza de la distribución gamma son:

E(X) = n / λ y Var (X) = n / λ2

Notación: decir que la variable aleatoria X tiene distribución chi-cuadrado con

r grados de libertad, la denotaremos como X ~ 2

rX .

Media y Varianza:

La media y la varianza de la v. a. chi-cuadrado con r grados de libertad son:

79

= E(x²) = r y ² = Var(x²) = 2r

Es decir, la media es igual a los grados de libertad y la varianza es igual a dos

veces los grados de libertad. La fig. 1 muestra la forma de la función de

densidad de la variable aleatoria chi-cuadrado, para distintos grados de libertad.

Función de Distribución Acumulativa de Probabilidades.-

Las probabilidades para v.a. chi-cuadrado, se calculan utilizando los valores de

la función de distribución acumulativa menor o igual que, los que han sido

reproducidos en la Tabla 2 del Anexo, utilizando la hoja de cálculo Excel.

Así tenemos que, la probabilidad que la variable aleatoria X con distribución

3012 rxr sea menor o igual a un valor constante 2

x , representada por:

2XXP , 0 < < 1, está dada por:

dxexr

dxxfxXP

xrx

r

x

X

21

2

02

0

222

2

22

1

y representada en la figura 2.

80

Note que 12xxP

Puesto que existe una distribución chi-cuadrado diferente para cada valor de r,

resulta impráctico proporcionar tablas de áreas completas. En lugar de esto, la

tabla 2 de la distribución acumulativa chi-cuadrado, presenta un resumen de la

información más esencial acerca de la distribución. En el encabezado de la

columna de la izquierda, dice grados de libertad (G.L.) y cada fila de esta tabla

corresponde a una distribución chi-cuadrado particular, con sus probabilidades

(p) en la parte superior de esta tabla.

En la hoja de cálculo Excel se determina las probabilidades y los valores de

chi-cuadrado así:

a) DISTR.CHI: devuelve la probabilidad de una variable aleatoria continua

siguiendo una distribución chi cuadrado de una sola cola. La distribución

chi cuadrado está asociada con la prueba chi cuadrado.

Sintaxis: DISTR.CHI(x;grados_de_libertad)

X es el valor al que desea evaluar la distribución.

Grados_de_libertad es el número de grados de libertad = r.

Observaciones :

Si uno de los argumentos no es numérico, DISTR.CHI devuelve el

valor de error #¡VALOR!.

Si el argumento x es negativo, DISTR.CHI devuelve el valor de error

#¡NUM!.

Si el argumento grados_de_libertad no es un entero, se trunca.

Si el argumento grados_de_libertad < 1 o grados_de_libertad ≥ 10^10,

DISTR.CHI devuelve el valor de error #¡NUM!

DISTR.CHI se calcula como DISTR.CHI = P(X>x), donde X es una

variable aleatoria chi cuadrado. El cálculo es el complemento de la

mayoría de tablas.

Ejemplo:

DISTR.CHI(18,307;10) es igual a 0,050001

81

b) PRUEBA.CHI.INV: devuelve para una probabilidad dada, de una sola

cola, el valor x de la variable aleatoria siguiendo una distribución chi

cuadrado.

Si el argumento probabilidad = p = DISTR.CHI(x;...), entonces

PRUEBA.CHI.INV(probabilidad,...) = x.

Sintaxis: PRUEBA.CHI.INV(probabilidad;grados_de_libertad)

Probabilidad es una probabilidad asociada con la distribución chi

cuadrado.

Grados_de_libertad es el número de grados de libertad.

Observaciones

Si uno de los argumentos no es numérico, PRUEBA.CHI.INV devuelve

el valor de error #¡VALOR!.

Si el argumento probabilidad < 0 o probabilidad > 1,

PRUEBA.CHI.INV devuelve el valor de error #¡NUM!.

Si el argumento grados_de_libertad no es un entero, se trunca.

Si el argumento grados_de_libertad < 1 o grados_de_libertad ≥ 10^10,

PRUEBA.CHI.INV devuelve el valor de error #¡NUM!.

PRUEBA.CHI.INV usa una técnica iterativa para calcular la función.

Dado un valor de probabilidad, PRUEBA.CHI.INV reitera hasta que el

resultado tenga una exactitud de ± 3x10^-7. Si PRUEBA.CHI.INV no

converge después de 100 iteraciones, la función devuelve el valor de error

#N/A.

Ejemplo:

PRUEBA.CHI.INV(0,05;10) es igual a 18,3070290368475

Ejemplo 1.-

Si X ~ 2

rX . Usando la tabla 2, de Ji-cuadrado, hallar el 2

x correspondiente

para:

82

a) P(X < 2

x ) = 0.05, si r = 15 g.l.

Se busca en la tabla 2, 15 g.l. en el margen izquierdo y se intercepta con la

probabilidad 0.05 de las columnas y se obtiene 2

x = 2

15,05.0x = 7.26 Rpta.

b) P(X < 2

x ) = 0.99, si r = 21 g.l.

Procediendo como en a) se obtiene entonces 2

x = 2

21,99.0x = 38.9 Rpta.

Ejemplo 2.-

Si X es una variable aleatoria 2

20x . Calcular:

a) P[X < 10.9]; b) P[ X > 31.4 ]; c) P[ 10.9 < X 31.4 ]

Solución

Para obtener las probabilidades solicitadas, en la fila de 20 g.l de la tabla 2 se

buscan los valores dados para X y se leen las probabilidades (acumuladas

menores que) correspondientes en el encabezamiento de las columnas así:

a) P[X < 10.9] = 2

05.0xXP = 0.05 Rpta.

b) P[ X > 31.4 ] = 2

95.014.311 xXPXP = 1 – 0.95 = 0. 05

Rpta.

c) P[ 10.9 < X 31.4 ] = P[X 31.4 ] - P[X 10.9 ] =

= 2

01.0

2

95.0 xXPxXP

= 0.95 – 0.01 = 0.94 Rpta.

Ejemplo 3.-

Si X es 2

13X . Hallar P(X 20).

Solución

P(X 20) = 1 – P(X < 20) = 1 – p

Como en la tabla 2, de chi cuadrado, para 13 grados de libertad, no se

encuentra el valor 20, pero éste se encuentra entre los valores 19.8 (con

probabilidad 0.90) y 22.4 (con probabilidad 0.95) para hallar p interpolamos


83

2

x P

19.8 0.90

20 p 90.0

8.1920

90.095.0

8.194.22

p

22.4 0.95

2.08.465290.0

2.052

p

p 9038.0p

P(X 20) = 1 – 0.9038 = 0.0962 Rpta.

Ejemplo 4.-

Si X es una variable aleatoria con distribución 2

25x . Hallar a y b tal que:

P[a ≤ X ≤ b] = 0.95 y P[ X ≤ a ] = 0.025

Solución

Para r = 25 g.l., a = 2

25,025.0x = 13.1 Rpta.

0.95 = P[a ≤ X ≤ b] = P[X b] – P[X a] = P[X b] - 0.025

Luego: P[X b] = 0.975 b = 2

25,975.0x = 40.6 Rpta.

Veamos a continuación algunos teoremas importantes relacionados con la

distribución chi-cuadrado y de mucha importancia para la construcción de

intervalos de confianza y pruebas de hipótesis.

Teorema 1.- Si la variable aleatoria X ~ N(, ²), entonces la variable

aleatoria, Y = Z² = (X - )²/² es una 2

1x .

Sabemos que n

X

X

n

i

I 1 ~ N ( ,

n

²) y por lo tanto

nXZ

es

N(0,1) entonces,

²

²2

nXZ

~

2

1x .

Ejemplo 5.-

Si X ~ N(12, 5). Calcule e interprete P[13.55 (X – 12)² < 19.20 ]

84

Solución

Como X ~ N (12, 5) entonces la variable aleatoria

5

²12

XY ~ 2

1x .

Luego:

P[13.55 (X – 12)² < 19.20 ] =

5

20.19

5

²12

5

55.13 XP =

= P[2.71 2

1x < 3.84 ] = P[ 2

1x 3.84 ] - P[ 2

1x 2.71 ] =

= 0.95 - 0.90 = 0.04 Rpta.

Interpretación: el 4% de las desviaciones al cuadrado, de los valores

observados de X ~ N (12, 5) con respecto a su media 12, estarán

comprendidos entre 13.55 y 19.20.

Teorema 2.- (Propiedad Reproductiva de la Chi-Cuadrado)

Sean 22

2

2

1 ,...,, pXXX variables aleatoria chi-cuadrados dependientes con

grados de libertad r1, r2, ..., rp respectivamente, entonces la variable aleatoria:

22

2

2

1 ...² pXXXX

Sigue una distribución chi-cuadrado con grado de libertad igual a

p

i

irr1

Teorema 3.- Sea X1, X2, ..., Xn, una muestra aleatoria de una variable

aleatoria X ~ N (, ²). Entonces, la variable aleatoria:

n

i

ixY1

2²/ ~ 2

nx

Distribución de la Varianza Muestral

Teorema 4.- Sea X1, X2, ... , Xn una muestra aleatoria de tamaño n de una

población normal con media y varianza ². Sea X y S² la media muestral y

varianza muestral respectivamente, entonces:

a) Las variables aleatorias X y S² son independientes.

b) La función de la varianza muestral

²

²

²

²1 12

n

i

i XxSn

x ~ 2

1nx .

85

Demostración.- Demostraremos sólo la parte b)

Sabemos que la variable aleatoria

²

²1

n

i

ix

tiene una distribución ,2

nx

puesto que cada término (xi - )/ son variables aleatorias normales estándar

e independientes (teorema 3).

Consideremos:

n

i

n

i

ii XXXX1 1

²²

n

i

n

i

n

i

ii XXXXXX1 1 1

2²²

=

n

i

i XnXX1

²²

Dividiendo entre ² y ordenando tenemos:

n

XXXX

n

i

i

n

i

i

/²

²

²

²

²

²11

=

n

XSn

/²

²

²

²1

Dado que ( X - )²/(²/n) tiene una distribución 2

1X . Además, como X y S²

son independientes, y

n

i

iX1

²/² tiene una distribución 2

nx , por la

propiedad aditiva de la chi-cuadrado, concluimos que la distribución de

²

²1

Sn es

2

1nx .

Ejemplo 6.-

Suponga que X1, X2, …......,X10 es una muestra aleatoria de una variable

aleatoria normal estándar. Calcule e interprete:

a)

3.1856.210

101

2

iXP y b) P(S2 < 1.88)

Solución

a) Como las v.a Xi ~ N(0, 1), entonces X2 i ~ 2

1X y por lo tanto

10

1

2

i

iX ~ 2

10X

86

3.1856.210

101

2

iXP = 3.1856.2 2

10 XP =

= P( 2

10X 18.3) – P( 2

10X 2.56) =

= 0.95 – 0.01 = 0.94 Rpta.

Interpretación: En el 94% de las muestras de 10 observaciones de la

distribución normal estándar, la

10

1

2

i

iX estará entre 2.56 y 18.3.

b) P(S2 < 1.88) = )

1

88.199(

2

2 xSP

= )92.16( 2

9 XP = 0.95 Rpta.

Interpretación: En el 95% de las muestras de 10 observaciones de la

distribución normal estándar, la varianza muestral es menor que 1.88.

3.2 DISTRIBUCIÓN T DE STUDENT

Esta distribución fue descrita en 1908 por el estadístico inglés William S. Gosset,

quien, al estar prohibido de publicar artículos científicos por la empresa cervecera

Guinness donde laboraba en Dublin, tuvo que presentarla con el pseudónimo de

“Student” y es comúnmente conocida como la “distribución t”.

“Es Ronald A. Fisher quien aprecia la importancia de los trabajos de Gosset sobre

muestras pequeñas, tras recibir correspondencia de Gosset en la que le decía le

envío una copia de las Tablas de Student, ¡ya que es la única persona que

probablemente las use jamás.” 3

Definición.- Sea Z una variable aleatoria normal estándar N(0, 1). Sea X2 ~ 2

rX

una variable aleatoria que tiene una distribución chi-cuadrado con r grados de

libertad, y si Z y X2 son independientes, entonces la variable aleatoria

Y

rZ

r

X

ZT

2 ~ tr

tiene una distribución t, con r grados de libertad, y su función de densidad de

probabilidades está dada por:

3 http://es.wikipedia.org/wiki/William_Sealy_Gosset; revisado en agosto de 2012.

http://es.wikipedia.org/wiki/William_Sealy_Gosset

87

2

1

²1

2

2

1r

r

t

rr

r

tf

, - < t <

Notación: decir que la variable aleatoria T, tiene distribución t con r grados de

libertad, se denota como T ~ tr.

Media y Varianza:

La media y la varianza de la v. a. T con r grados de libertad son:

E(T) = T = 0 , r > 1

Var(T) = 2

2

r

rT , r > 2

Observe que la distribución de la variable aleatoria T, queda completamente

determinada sólo por el parámetro r. Por lo tanto, hay una distribución t

correspondiente a cada grado de libertad. En la figura 3 se presenta la función

de densidad de la variable aleatoria T, para diferentes grados de libertad. En la

misma figura se da, la gráfica de la normal estándar.

La distribución t es simétrica alrededor de la media T = 0 y varía de menos

infinito a más infinito. Es muy similar a la distribución normal estándar, ya que

ambas varían de - a , son simétricas y centradas alrededor de = 0, es decir

su media es cero, pero la distribución t tiene mayor dispersión que la

88

distribución normal estándar, esto se observa de la varianza 2

2

r

rT , que

se aproxima a 1 cuando el grado de libertad r es grande (r → ∞).

Por lo tanto, la distribución t, se aproxima a la distribución normal estándar

cuando el grado de libertad r es suficientemente grande. En la práctica se trata

a la distribución t, como N(0,1) cuando r > 30.

Función de Distribución Acumulativa de Probabilidades.-

El cálculo de probabilidades para la v.a. t, se efectúa utilizando los valores de

la función de distribución acumulativa menor o igual que, los que han sido

reproducidos en la Tabla 3 del Anexo, utilizando la hoja de cálculo Excel.

Así tenemos que, la probabilidad que la variable aleatoria T con distribución tr

(con 1 r < 30) sea menor o igual a un valor constante t , representada por:

tTP , 0 < < 1

Está dada por:

dt

r

t

rr

r

dttftTP

rt

t 2

1

²1

2

2

1

cuya representación gráfica la podemos ver en la fig. 4.

Estas probabilidades están determinadas en la Tabla 3, de la distribución

acumulativa t de student. En el encabezado de la columna de la izquierda, dice

grados de libertad (G.L.) y cada fila de esta tabla corresponde a una

distribución t particular, con sus probabilidades (p) en la parte superior de esta

tabla.

En la hoja de cálculo Excel, las probabilidades y los valores de T se determinan

así:

89

a) DISTR.T: devuelve la probabilidad (los puntos porcentuales) de la

distribución t de Student, donde un valor numérico (x) es un valor calculado

de t para el que deben calcularse los puntos porcentuales. La distribución t

de Student se utiliza para la comprobación de pruebas de hipótesis cuando el

tamaño de la muestra es pequeño (n < 30). Se puede utilizar esta función en

lugar de una tabla de valores críticos para la distribución t.

Sintaxis: DISTR.T(x; grados_de_libertad; colas)

X es el valor numérico al que se ha de evaluar la distribución.

Grados_de_libertad es un entero que indica el número de grados de

libertad.

Colas especifica el número de colas de la distribución que se ha de

devolver. Si colas = 1, DISTR.T devuelve la distribución de una cola. Si

colas = 2, DISTR.T devuelve la distribución de dos colas.

Observaciones:

Si uno de los argumentos no es numérico, DISTR.T devuelve el valor de

error #¡VALOR!

Si grados_de_libertad < 1, DISTR.T devuelve el valor de error #¡NUM!

Los argumentos grados_de_libertad y colas se truncan a enteros.

Si el argumento colas es un número distinto de 1 ó 2, DISTR.T devuelve

el valor de error #¡NUM!

DISTR.T se calcula como DISTR.T = P( x < X ), donde X es una variable

aleatoria que sigue la distribución t.

Ejemplo:

DISTR.T(1,96;60;2) es igual a 0,054645 ó 5,46%

b) DIST.T.INV : Devuelve el valor t de la distribución t de Student como

función de la probabilidad y los grados de libertad.

Sintaxis: DISTR.T.INV(probabilidad;grados_de_libertad)

Probabilidad: es la probabilidad asociada con la distribución t de

Student dos colas.

90

Grados_de_libertad: es el número de grados de libertad para diferenciar

la distribución.

Observaciones:

Si uno de los argumentos no es numérico, DISTR.T.INV devuelve el

valor de error #¡VALOR!

Si el argumento probabilidad < 0 o si probabilidad > 1, DISTR.T.INV

devuelve el valor de error #¡NUM!

Si el argumento grados_de_libertad no es un entero ≥ 1, se trunca.

DISTR.T.INV se calcula como DISTR.T.INV = P (X > t ), donde X es

una variable aleatoria que sigue la distribución t.

Puede devolverse un valor t de una cola reemplazando probabilidad por

2*probabilidad. Para una probabilidad de 0,05 y grados de libertad de 10,

el valor de dos colas se calcula con DISTR.T.INV(0,05;10), que

devuelve 2,28139. El valor de una cola para la misma probabilidad y los

mismos grados de libertad puede calcularse con

DISTR.T.INV(2*0,05;10), que devuelve 1,812462.

Nota.- En algunas tablas, la probabilidad se describe como (1-p).

DISTR.T.INV se calcula utilizando una técnica iterativa. Dado un valor

del argumento probabilidad, DISTR.T.INV reitera hasta obtener un

resultado con una exactitud de ± 3x10-7. Si DISTR.T.INV no converge

después de 100 iteraciones, la función devuelve el valor de error #N/A.

Ejemplo:

DISTR.T.INV(0,054645;60) es igual a 1,96

Ejemplo7.-

Si la variable aleatoria T ~ t20 (r = 20). Usando la tabla 3, de T de student,

hallar: P[T 1.725 ]

Solución

Para obtener las probabilidad solicitada, buscar en la tabla 3 el valor T =

1.725 en la fila de 20 g.l y su probabilidad correspondiente se lee en la parte

superior de esa columna, cuyo valor es 0.95. Es decir:

91

P[T 1.725 ] = P[T t 0.95 ] = 0.95 Rpta.

Nota.- Por la simetría de la distribución t, se tiene que:

Para < 0.5, los valores t son: t = - t1- , . (ver fig. 5).

0Tα = - T(1 - α)

α

T(1 - α)

α

0

Fig. 5 Obtención de valores Tα para α < 0.05

P[ T -a ] = 1 - P[ T a ]

Ejemplo 8.-

Sea T una variable aleatoria que tiene una distribución t con varianza ² = 3

5.

Calcular: P[-2.015 T 2.571]

Solución

Como 2 5

2 3T

r

r

, entonces r = 5 y T ~ t5 . Luego:

P [- 2.015 T 2.571] = P[T 2. 571] – P[T - 2. 015 ] =

= P[T 2. 571] – [1 – P[T 2. 015 ] =

Buscando las probabilidades en la tabla 3 y reemplazando se tiene:

= P [T t0.975 ] – {1 - P[T t0.95 ]} =

= 0.975 – [ 1 - 0.95 ] =

= 0.975 - 0.05 = 0.925 Rpta.

Ejemplo 9.-

Sea T una variable aleatoria que tiene una distribución t con 23 grados de

libertad. Hallar el valor de a tal que: P[T a ] = 0.95

92

Solución

0.95 = P [T a ] = P[-a T a ] =

= P[T a] – P[T - a]

= P[ T a ] – [ 1 – P[T a ]

= 2 P [ T a ] – 1

P[ T a ] = 0.975 En la tabla 3, a = t0.975 , 23 = 2.069 Rpta.

3.3 DISTRIBUCIÓN MUESTRAL DE LA MEDIA (n < 30)

En el acápite 2.1 vimos la distribución muestral para la media, con muestras

grandes (n ≥ 30), la misma que se aproximaba a la distribución normal. Sin

embargo, cuando las muestra son pequeñas (n < 30) la aproximación es hacia la

distribución t de student, tal como veremos a continuación.

Sea X1, X2, ..., Xn una muestra aleatoria de tamaño n, de una variable aleatoria

X con distribución N(, ²), en acápites anteriores hemos visto que:

1. La variable aleatoria n

XZ

/

~ N(0,1).

2. La variable aleatoria 2

22 )1(

Snx

~

2

1nx (teorema 4).

3. X y S² son variables aleatorias independientes (teorema 4).

Usando la definición de la variable aleatoria T, tenemos que:

S

nX

nSn

nX

lg

x

ZT

1/²

²1

..

2 ~ tn-1

tiene distribución t con n – 1 grados de libertad y se usa para estimar cuando no

se conoce la desviación estándar .

Ejemplo 9.-

Si 2SyX son la media y la varianza de una muestra aleatoria de tamaño 17 de

una distribución N(, o2). Hallar la constante C tal que:

93

95.0

4

C

S

XCP

Solución

En el problema propuesto, S

X

S

nXT

17)()(

~ t 16. Entonces:

0.95 =

C

S

XCP

4 =

4

1717

4

17 C

S

XCP

=

=

4

17

4

1716

Ct

CP =

4

1716

CtP -

4

1716

CtP =

=

4

1716

CtP -

4

171 16

CtP

0.95 = 2

4

1716

CtP - 1

4

1716

CtP = 0.975

12.24

17975.0,16 t

C C = 2. 0567 Rpta.

3.4 DISTRIBUCIÓN DE LA DIFERENCIA DE MEDIAS MUESTRALES,

CON VARIANZAS DESCONOCIDAS PERO IGUALES

Si se toma dos muestras aleatorias independientes de dos poblaciones normales

X e Y, con varianzas desconocidas pero iguales ²X = ² Y = ², así:


X con distribución N(X, ²). Sea también Y1, Y2, ..., Ym una muestra aleatoria

de tamaño m de una variable aleatoria Y, con distribución N(Y, ²). De

acuerdo a lo estudiado en acápites anteriores se tiene que:

1. La distribución de la variable aleatoria

mn

YX

mn

YXZ YXYX

11²²

~ N (0 , 1 )

2. La variable aleatoria:

²

²

²

1 1

2

n

i

i

X

XXSn

U ~ 2

1nx

94

U es independiente de X e Y .

3. La variable aleatoria:

²

²

²

1 1

2

n

i

i

Y

YYSm

V ~ 2

1mx

V es independiente de ,X Y y 2

XS .

4. Por la propiedad reproductiva de la distribución chi-cuadrado, la v.a. :

U + V =

²

1 2

XSn

+

²

1 2

YSm

~ 2

2 mnx

Con los resultados encontrados en (1) y (4); siendo las variables Z normal

estándar y U + V chi-cuadrado e independientes; usando la definición de la

variable aleatoria T se obtiene la distribución de la diferencia de medias

muestrales X - Y siguiente:

2

/)1()1(

11

2

222

mn

SmSn

mn

YX

mn

VU

ZT

YX

YX

Simplificando:

mnmn

SmSn

YXT

YX

YX

11

2

11 22

~ t n + m - 2

tiene distribución t con n + m – 2 grados de libertad. Observe que esta variable

aleatoria depende de las medias y las varianzas muestrales.

3.5 DISTRIBUCIÓN F DE SNEDECOR

Esta distribución fue descubierta por Fisher, de allí la denominación F y

redescubierta por Snedecor. Es muy utilizada para comparar las varianzas de

dos variables aleatorias independientes distribuidas normalmente.

95

Definición.- Sea U y V dos variables aleatorias independientes que tienen

distribuciones chi-cuadrado, con r1 y r2 grados de libertad, respectivamente.

Entonces, la variable aleatoria: 2

1

/

/

rV

rUF

tiene una distribución F con r 1 y r 2 grados de libertad y su función de

densidad de probabilidades está dada por:

fF (x) =

221

12

21

22

21

21

21

1

21

.

22

2rr

r

rr

rrx

x

rr

rrrr

, 0 < x <

= 0 , en otros casos

La distribución F depende de los parámetros r1 y r2 en ese orden.

r1 = grados de libertad en el numerador, y

r2 = grados de libertad en el denominador.

En la figura 6 se muestra la función de densidad de probabilidades de la

variable aleatoria F para tres pares diferentes de grados de libertad.

Fig. 6

Las distribuciones F son una familia de distribuciones asimétricas hacia la

derecha. Existe una distribución F separada para cada par de valores de sus

parámetros r1 y r2.

96

Notación: decir que la variable aleatoria F tiene distribución F con r1 y r2

grados de libertad, se denota como F ~ 21 , rrF .

Media y Varianza.-

La media y la varianza de la v. a. F con r1 y r2 grados de libertad son:

22

2

r

rFEF , r2 > 2

4²2

22

221

21

2

22

rrr

rrrFVarF , r2 > 4

Función de Distribución Acumulativa de Probabilidades

El cálculo de probabilidades para v.a. F, se efectúa utilizando la Tabla 4 de

distribución acumulativa F, las mismas que han sido elaboradas utilizando la

función de distribución acumulativa de probabilidades que en la mayoría de los

casos son del tipo de acumulación menor o igual que.

La probabilidad que la variable aleatoria F ~ 21 , rrF sea menor o igual que una

constante f está dada por:

f

F dxxffFP0

dx

rrx

x

rr

rrrr

fFPrr

r

rr

f

221

12

21

22

21

21

021

1

21

.

22

2

97

Estas probabilidades se presentan en tablas de F. Como la distribución depende

de los dos parámetros r1, y r2, se necesita una tabla con tres entradas para

tabular el valor de F que corresponde a diferentes probabilidades y valores de

r1 y r2.

Para valores de < 0.50 , se obtiene usando la siguiente igualdad

21

21

,,1

2,,

2

1 1

/

/

/

/

rr

rrfrU

rVPF

rV

rUP

=

21 ,,1

2 1

/

/1

rrfrU

rVP

1

1

/

/

21 ,,1

2

rrfrU

rVP ................ (1)

Pero, 1

2

/

/1

rU

rV

F ~

12 , rrF tiene distribución F con r2 y r1 g.l.

1

/

/12 ,,1

1

2rrf

rU

rVP ............... (2)

Igualando (1) y (2), se tiene que:

21

12

,,

,,1

1

rr

rrf

f

12

21

,,1

,,

1

rr

rrf

f

, para < 0.50

Ejemplo 10.-

Sea F una variable aleatoria que tiene una distribución F con r1 y r2 grados de

libertad. Hallar :

a) 0.15FP , con r1 = 7, r2 = 4

b) 69.3FP , con r1 = 5, r2 = 8

c) P[F 0.0358 ], con r1 = 3, r2 = 6

d) Hallar los valores a y b tales que:

98

P[ F b ] = 0.975 y P[a F b] = 0.95 . Con r1 = 7, r2 = 5

Solución

Usando la tabla F:

a) P[F 15.0 ] = 1 – P[F 15.0 ] = 1 – P[F f0.99, 7, 4 ] =1 – 0.99 = 0.01

Rpta.

b) P[F 3.69 ] = P[F f0.95, 5, 8 ] = 0.95 Rpta.

c) P[F 0.0358] =

9.27

11

0358.0

11

FP

FP

=

3,6,99.0

11 f

FP = 1 – 0.99 = 0.01 Rpta.

d) P[F b] = 0.975 b = f0.975, 7, 5 = 6.85 Rpta.

0.95 = P[a F b] = P[F b] - P[F a] = 0.975 - P[F a]

P[F a] = 0.025

P[F a] = P 025.011

111

aFP

aF

975.011

aFP , 1/F ~ F 5, 7

Luego: 29.51

7,5,0975. fa

, de donde a = 0.189 Rpta.

3.6 DISTRIBUCIÓN DE LA RAZÓN DE DOS VARIANZAS MUESTRALES

Si se toman dos muestras aleatorias independiente de las poblaciones normales

X e Y, encontraremos la distribución de probabilidades para la razón de

varianzas muestrales de la siguiente manera.

Sea X1, X2, ..., Xn una muestra aleatoria de tamaño n de una variable aleatoria

X ~ N(X, 2

X ). Sea Y1, Y2, ..., Ym una muestra aleatoria de tamaño m de una

variable aleatoria Y con distribución N 2, YY . Entonces, la variable

aleatoria,

99

2

1

2

2 ²1

X

n

i

i

X

X

XXSn

U

~ 2

1nx

De modo similar, la variable aleatoria,

2

1

2

2 ²1

Y

m

i

i

Y

Y

YYSm

V

~ 2

1mx

Además, las dos variables aleatorias chi-cuadrado U y V son independientes

por que X e Y son independientes. Entonces, usando la definición de la

variable aleatoria F, tenemos que la variable aleatoria:

2

2

2

2

22

22

2

2

2

2

/

/

1/1

1/1

)1(/

)1(/

X

Y

Y

X

YY

XX

Y

Y

X

X

S

S

S

S

mSm

nSn

mV

nUF

~ F n – 1 , m - 1

100


1. Si X ~ X2 con 15 grados de libertad, hallar:

a) P(X > 27.5).

b) P(7.26 ≤ X ≤ 25.0).

c) P(X ≤ 23.5).

d) Hallar a y b tal que P(X ≤ a) = 0.025 y P(a ≤ X ≤ b) = 0.95.

Solución


buscan los valores dados para X y se leen las probabilidades (acumuladas


a) P[X > 27.5] = 1 - P(X ≤ 27.5) = 1- 2

0.975P X x = 1 – 0.975 = 0.025 Rpta.

b) P[7.26 ≤ X ≤ 25.0] = P[X 25.0 ] - P[X 7.26] =

= 2 2

0.95 0.05P X x P X x =

= 0.95 – 0.05 = 0.90 Rpta.

0

X

7.26

0.900

25.00

Distribución chi-cuadrado con 15 g.l.


c) P(X ≤ 23.5) = p

Como en la tabla 2, de chi cuadrado, para 15 grados de libertad, no se

encuentra el valor 23.5, pero éste se encuentra entre los valores 22.3 (con

probabilidad 0.90) y 25.0 (con probabilidad 0.95) para hallar p interpolamos


101

2

x P

22.3 0.90

23.5 p 25.0 22.3 23.5 22.3

0.95 0.90 0.90p

25.0 0.95 1.2

54 54 48.6 1.20.90

pp

p = 0.9222

Luego: P(X ≤ 23.5) = 0.9222 Rpta.

d) P(X ≤ a) = 0.025

Para r = 15 g.l., a = 2

0.025 , 15x = 6.26 Rpta.

0.95 = P[a ≤ X ≤ b] = P[X b] – P[X a] = P[X b] - 0.025

Luego: P[X b] = 0.975 b = 2

0.975, 15x = 27.5 Rpta.

0

X

a = 6.26

0.95

b = 27.50

Distribución chi-cuadrado con 15 g.l.

2. De una población X: N(u, 18 ), se extrae una muestra aleatoria de tamaño n =

21. Calcule e interprete:

a) P [ 3.291 < ( x - µ )2 < 5.683 ]

b) ¿Entre que valores se encontrará el 90 % central de las varianzas muestrales?

Solución

102

a) Se sabe que n

X

X

n

i

I 1 ~ N ( ,

n

²) y por lo tanto

nXZ

es

N(0,1) entonces, 2

² ² 21

² 18

X n X xZ

~ 2

1 .

Para obtener la probabilidad solicitada se multiplica dentro de la desigualdad

por 21/18 y se construye una 2

1 así:

P [3.291 < ( x - µ )2 < 5.683] =

23.291 21 ( ) 21 5.683 21

18 18 18

x x x xP

=

= P [3.84 < 2

1 < 6.63] = P[ 2

1 6.63] - P[ 2

1 3.84] = 0.99 – 0.95 = 0.04.

Interpretación.- en el 4% de las muestras de tamaño 21, de una población X

N(u, 18 ), las desviaciones al cuadrado, de las medias muestrales x con

respecto a la media poblacional µ, se encuentran entre 3.291 y 5.683.

b) Sean a y b los valores centrales dentro de los cuales se encuentra el 90% de

las varianzas muestrales (S2), con el 5% hasta a y 95% hasta b, es decir:

0.90 = P (a ≤ S2 ≤ b), con P (S

2 ≤ a) = 0.05 y P (S

2 ≤ b) = 0.95

Se sabe que: 2

2

12

( 1)n

n S

entonces,

2 22

20

(21 1) 20

18 18

S S

Multiplicando en la probabilidad anterior por 20/18 se tiene una 2

20 así:

0.05 = 2

2

20

20 20 20

18 18 18

S a aP P

2

20, 0.05

2010.9

18

a .

Luego: a = 9.81. Además:

0.95 = 2

2

20

20 20 20

18 18 18

S b bP P

2

2 0 , 0 . 9 5

2031.4

18

b .

Luego: b = 28.26. Entonces: 0.90 = P (9.81 ≤ S2 ≤ 28.26) Rpta.

Interpretación.- en las muestras de tamaño 21, de una población X N(u, 18 ),

el 90% central de las varianzas muestrales (S2) se encuentra entre 9.81 y

28.26.

3. De una población X: N(u, 18), se extrae una muestra aleatoria de tamaño n = 21.


a) P [208.7 <

21

1i

(X i - µ)2 < 638.7]

103

b) P (9.77 < S2 < 30.78)

Solución

a) Se sabe que para muestras de una población normal se cumple que:

212 2

2 21 1212

( ) ( )

18

n

i i

i in

X X

.

Para obtener la probabilidad solicitada se divide dentro de la desigualdad por

18 y se construye una 2

21 así:

P [208.7 <

21

1i

(X i - µ)2 < 638.7] =

212

1

( )208.7 638.17

18 18 18

i

i

X

P

=

= P [11.6 < 2

21 < 35.5] = P[ 2

21 35.5] - P[ 2

21 11.6] = 0.975 – 0.05 =

0.925.

Interpretación.- en el 92.5% de las muestras de tamaño 21, de una población

X N(u, 18 ), las sumas de desviaciones al cuadrado, de los valores

observados con respecto a la media poblacional µ, se encuentran entre 208.7

y 638.7.

b) Se sabe que: 2

2

12

( 1)n

n S

entonces,

2 22

20

(21 1) 20

18 18

S S

Multiplicando en la probabilidad solicitada por 20/18 se tiene una 2

20 así:

P (9.77 < S2 < 30.78) =

220 9.77 20 20 30.78

18 18 18

x S xP

=

= P[10.9 < 2

21 < 34.2] = P[ 2

20 34.2] - P[ 2

20 10.9] = 0.975 – 0.05 =

0.925.

Interpretación.- en el 92.5% de las muestras de tamaño 21, de una población

X N(u, 18 ), las varianzas muestrales (S2) se encuentra entre 9.77 y 30.78.

4. Suponga que el número de horas semanales que las amas de casa ven TV tiene

distribución normal con una varianza de 3. Al escoger una muestra de 17 amas

de casa y registrar el número de horas a la semana que ven TV, calcule e

104

interprete la probabilidad de que la varianza muestral de los tiempos obtenidos

sea mayor que 5.4 (horas)2.

Solución

Sean X = número de horas semanales que las amas de casa ven TV, n = 17 y σ2

= 3.

Se sabe que: 2

2

12

( 1)n

n S

entonces,

2 22

16

(17 1) 16

3 3

S S

Multiplicando en la probabilidad solicitada por 16/3 se tiene una 2

16 así:

P (S2 > 5.4) = 1 - P (S

2 ≤ 5.4) = 1 -

216 16 5.4

3 3

S xP

=

= 1 - P[ 2

16 < 28.8] = 1 - 0.975 = 0.025 Rpta.

Interpretación.- en el 92.5% de las muestras de 17 amas de casa, las varianzas

muestrales (S2) del número de horas semanales que ven TV es mayor que 5.4

(horas)2.

5. La duración de los transistores fabricados por una compañía tienen una media de

2000 horas y una desviación típica de 60 horas. Se selecciona 10 transistores al

azar, calcule e interprete la probabilidad que la desviación típica muestral se

encuentre entre 50 y 70 horas.

Solución

Sean X = duración de los transistores, µ = 2000, σ2 = (60)

2 = 3600 y n = 10.

Se sabe que: 2

2

12

( 1)n

n S

entonces,

2 22

9

(10 1)

3600 400

S S

Dividiendo en la probabilidad solicitada entre 400 se tiene una 2

9 así:

P(50 ≤ S ≤ 70) = P (2500 ≤ S2 ≤ 4900) =

22500 4900

400 400 3600

SP

=

= P[6.25 ≤ 2

9 ≤ 12.25] = P[ 2

9 ≤ 12.25] – P[ 2

9 ≤ 6.25] = 0.80 - p

Como en la tabla 2, de chi-cuadrado, para 9 grados de libertad, no está el valor

6.25, pero éste se encuentra entre los valores 5.38 (con probabilidad 0.20) y 6.39

(con probabilidad 0.30) para hallar p interpolamos así:

105

2

x P

5.38 0.20

6.25 p 6.39 5.38 6.25 5.38

0.30 0.20 0.20p

6.39 0.30 0.87

10.1 10.1 2.02 0.870.20

pp

p = 0.2861

Reemplazando p = 0.2861 en la última expresión se tiene que:

P(50 ≤ S ≤ 70) = 0.80 - 0.0.2861 = 0.5139 Rpta.

Interpretación.- en el 51.4% de las muestras de 10 transistores, la desviación

estándar muestral de la duración de dichos transistores se encuentra entre 50 y

70 horas.

6. De una población X: N(0, 1) se extrae una muestra aleatoria de tamaño n = 15.


a) 15

2

1

7.26 27.5i

i

P X

b) P(0.4693 < S² < 1.864)

Solución

a) Se sabe que las observaciones muestrales tienen la misma distribución que la

población, luego Xi ~ N(0, 1), entonces 2

iX ~ 2

1 y por tanto 15

2

1

i

i

X

~ 2

15X .

La probabilidad solicitada es:

152

1

7.26 27.5i

i

P X

= 2

157.26 27.5P =

= P[ 2

15 ≤ 27.5] – P[ 2

15 ≤ 7.26] = 0.975 – 0.05 = 0.925 Rpta.

Interpretación.- en el 92.5% de las muestras de 15 observaciones de la

distribución normal estándar, la suma de los valores observados al cuadrado

se encuentra entre 7.26 y 27.5.

b) Dado que: 2

2

12

( 1)n

n S

entonces,

22 2

14

(15 1)14

1

SS

Para obtener la probabilidad solicitada se multiplica dentro de la desigualdad

por 14 y se construye una 2

14 así:

106

P(0.4693 < S² < 1.864) = 214 0.4693 14 14 1.864P x S x =

= P[6.57 ≤ 2

14 ≤ 26.1] = P[ 2

14 ≤ 26.1] – P[ 2

14 ≤ 6.57] = 0.975 – 0.05 =

0.925.


distribución normal estándar, la varianza muestral se encuentra entre 0.4693

y 1.964.

7. De una población X: N(μ, 10) se extrae una muestra aleatoria. de tamaño n = 9 y

de una población Y: N(μ, 12) se extrae una muestra aleatoria de tamaño m = 4.


a) 9

2

1

21.8 ( ) 175i

i

P X X

y b)

42

1

5.81 ( ) 133.2i

i

P Y

Solución

a) Si

2 211

²1 ²

² ²

n

i

in

x Xn S

entonces

9

218

²

10

i

i

x X

.

Para obtener la probabilidad solicitada se divide dentro de la desigualdad

entre 10 y se construye una 2

8 así:

92

1

21.8 ( ) 175i

i

P X X

=

92

1

( )21.8 175

10 10 10

i

i

X X

P

=

= P(2.18 ≤ 2

8 ≤ 17.5) = P[2

8 ≤ 17.5] – P[2

8 ≤ 2.18] =

= 0.975 – 0.025 = 0.955 Rpta.


población X: N(μ, 10), la suma de de las desviaciones al cuadrado de los

valores observados respecto a la media muestral, se encuentra entre 21.8 y

175.

107

b) Para una muestra de una población normal, se sabe que:

21

²

²

m

i

im

Y

entonces

4

214

²

12

i

i

Y

. Para obtener la probabilidad solicitada se divide

dentro de la desigualdad por 12 y se construye una 2

4 así:

42

1

5.81 ( ) 133.2i

i

P Y

=

42

1

( )5.81 133.2

12 12 12

i

i

Y

P

=

= P[0.484 ≤ 2

4 ≤ 11.1] = P[ 2

4 ≤ 11.1] – P[ 2

4 ≤ 0.484] =

= 0.975 – 0.025 = 0.95. Rpta.


distribución normal Y: N(μ, 12), la suma de de las desviaciones al cuadrado

de los valores observados respecto a la media poblacional μ, se encuentra

entre 5.81 y 133.2.

8. Si T ~ t con 18 grados de libertad (T18), hallar:

a) P(T > 2.101)

b) P(-1.734 ≤ T ≤ 2.552)

c) P(T ≤ 1.53)

d) Hallar t0 tal que P(-t0 ≤ T ≤ t0) = 0.95.

Solución


buscan los valores dados para T y se leen las probabilidades (acumuladas


a) P(T > 2.101) = 1 - P(T ≤ 2.101) = 1- P(T ≤ T18, 0.975) = 1 – 0.975 = 0.025

Rpta.

b) P(-1.734 ≤ T ≤ 2.552) = P(T 2.552) – P(T -1.734) =

= P(T ≤ T18, 0.99) – [1 - P(T 1.734)] =

= 0.99 – [1 – 0.95] = 0.99 - 0.05 = 0.94 Rpta.

108

0

T

-1.734

0.940

2.5520

Gráfica de distribución T con 18 G.L.


c) P(T ≤ 1.53) = p

Solución

Como en la tabla 3, T de student, para 18 grados de libertad, no se encuentra

el valor 1.53, pero éste se encuentra entre los valores 1.33 (con probabilidad

0.90) y 1.734 (con probabilidad 0.95) para hallar p interpolamos de la

siguiente manera:

Tα P

1.33 0.90

1.53 p 1.734 1.33 1.53 1.33

0.95 0.90 0.90p

1.734 0.95 0.2

8.08 8.08 7.272 0.20.90

pp

p = 0.9248

Luego: P(T ≤ 1.53) = 0.9248 Rpta.

d) 0.95 = P(-t0 ≤ T ≤ t0) = P(T18 ≤ t0 ) – P(T18 ≤ -t0) =

= P(T18 ≤ t0 ) – [1 - P(T18 ≤ t0)] = 2 P(T18 ≤ t0 ) – 1

P(T18 ≤ t0 ) = 0.975 to = T18, 0.975 = 2.101 Rpta.


109

0

T

-2.101

0.025

2.101

0.025

0

Gráfica de distribución T con 18 G.L.

0.95

9. Un inspector investiga las acusaciones contra la fábrica de ron “Pepito” porque

no llena bien sus envases. Una muestra de 25 botellas de ron indica una

desviación típica S = 0.18 litros. Calcule e interprete la probabilidad de que el

promedio muestral difiera de su media poblacional µ en menos de 0.085 litros.

Solución

Datos: n = 25, S = 0.18 lts. Se pide hallar 0.085P X

Se sabe que: 1/

n

XT t

S n

, entonces: 24

0.0360.18/ 25

X XT t

Para obtener la probabilidad solicitada se divide dentro de la desigualdad por

0.036 y se construye una T24 así:

0.085P X = 24

0.085( 2.361)

0.036 0.036

XP P T

=

= P(-2.131 ≤ T24 ≤ 2.131) = P(T24 ≤ 2.131) – P(T24 ≤ -2.131) =

= P(T24 ≤ 2.131) – [1 - P(T24 ≤ 2.131)] =

= 2 P(T24 ≤ 2.131) – 1 = 2p – 1 …. (1)

Como en la tabla 3, T de student, para 24 grados de libertad, no está el valor

2.131, pero éste se encuentra entre los valores 2.064 (con probabilidad 0.975) y

2.492 (con probabilidad 0.99) para hallar p interpolamos de la siguiente manera:

110

Tα P

2.064 0.975

2.131 p 2.492 2.064 2.131 2.064

0.990 0.975 0.975p

28.53 =

0.067

0.975p

2.492 0.990 28.53p - 27.817 = 0.067 p = 0.9774

Reemplazando p = 0.9774 en (1) se tiene que:

0.085P X = 2 (0.9774) – 1 = 0.9548 Rpta.

Interpretación.- en el 95.48% de las muestras de 25 botellas de ron “Pepito”, el

promedio muestral difiere de su media poblacional µ en menos de 0.085 litros.

10. De una población X ~ N(10, 100) se extrae una muestra aleatoria de tamaño 10 y

de una población Y ~ N(20, 40) se extrae una m.a. de tamaño 10. Determine el

valor de la constante a tal que: P (a SY < X - 10) = 0.95. Donde X es la media

muestral de las X y SY es la desviación estándar muestral de las Y.

Solución

Para resolver el problema es necesario construir una distribución T de student.

Con la muestra de tamaño 10 de la población X, se tiene que: X N(10, 10).

Entonces: 10

(0, 1)10

XZ N

.

Con la muestra de la población Y se tiene que: 2

2 2

9

(10 1)

40YS

Con los resultados anteriores construimos una variable T así:

2

.

ZT

G L

se distribuye como una T con los grados de libertad de la chi-

cuadrado. Reemplazando Z y la 2

9 en la expresión anterior se obtiene:

92

10

2( 10)10

9 / 40

9

YY

X

XT t

SS

111

Para hallar el valor de la constante a solicitada, la probabilidad dada se adecúa a

la distribución t de student antes construida, así:

0.95 = P(a SY < X - 10) = P ( X - 10 ≥ a SY ) = 1 - P ( X - 10 ≤ a SY )

0.05 = P ( X - 10 ≤ a SY) = 2( 10)

2Y

XP a

S

= P(T9 ≤ 2a)

Luego: 2a = T9, 0.05 = - T9, 0.95 = -1.833 a = -0.9165 Rpta.

11. Para analizar el tiempo de atención por clienta en las tiendas de pantalones

“Ricas y apretaditas”, se tomó una muestra aleatoria sin reemplazo de 25

atenciones con lo cual se obtiene S2 = 2.25 minutos

2. Calcule e interprete la

probabilidad de que el tiempo promedio muestral de atención a las clientas

difiera de su media poblacional µ en menos de 0.57 minutos.

Solución

Datos: n = 25, S2 = 2.25 minutos

2. Se pide hallar 0.57P X

Se sabe que: 1/

n

XT t

S n

, entonces: 24

0.31.5/ 25

X XT t

Para obtener la probabilidad solicitada se divide dentro de la desigualdad por 0.3

y se construye una T24 así:

0.57P X = 24

0.57( 1.9)

0.3 0.3

XP P T

=

= P(-1.9 ≤ T24 ≤ 1.9) = P(T24 ≤ 1.9) – P(T24 ≤ -1.9) =

= P(T24 ≤ 1.9) – [1 - P(T24 ≤ 1.9)] = 2 P(T24 ≤ 1.9) – 1 = 2p – 1 …. (2)

Como en la tabla 3, T de student, para 24 grados de libertad, no tiene el valor

1.9, pero éste se encuentra entre los valores 1.711 (con probabilidad 0.95) y

2.064 (con probabilidad 0.975) para hallar p interpolamos así:

Tα P

1.711 0.95

1.9 p 2.064 1.711 1.9 1.711

0.975 0.95 0.95p

14.12 =

0.189

0.95p

2.064 0.975 14.12p - 13.414 = 0.189 p = 0.9634

112

Reemplazando p = 0.9634 en (2) se tiene que:

0.57P X = 2 (0.9634) – 1 = 0.9268 Rpta.

Interpretación.- en el 92.68% de las muestras de 25 atenciones en las tiendas de

pantalones “Ricas y apretaditas”, el tiempo promedio muestral de atención a las

clientas difiere de su media poblacional µ en menos de 0.57 minutos.

12. De una población X: N(0, ¼) se extrae una m.a. de tamaño 7 y de una población

Y: N(0, 1/3) se extrae una m.a. de tamaño 9. Determine el valor de la constante a

tal que: P (a x > SY) = 0.01. Donde x es la media muestral de las X y SY es la

desviación estándar de las Y.

Solución

Para resolver el problema es necesario construir una distribución T de student.

Con la muestra de tamaño 7 de la población X, se tiene que: X N(0, 1/28).

Entonces: 0

2 7 (0, 1)1/ 28

XZ X N

.

Con la muestra de la población Y se tiene que: 2

2 2 2

8

(9 1)24

1/3Y

Y

SS


2

.

ZT

G L



8 en la expresión anterior se obtiene:

82

2 7 3.055

24

8

YY

X XT t

SS

Para hallar el valor de la constante a solicitada, la probabilidad dada se adecúa a

la reciente distribución t de student construida, así:

0.01 = P (a x > SY) = 1 - P ( X /SY ≤ 1/a)

0.99 = P ( X /SY ≤ 1/a) = 3.055 3.055

Y

XP

S a

= P(T8 ≤ 3.055/a)

Luego: 3.055/a = T8, 0.99 = 2.896 a = 1.055 Rpta.

113

13. Para analizar el Nº de libros encuadernados diariamente por una máquina

automática, se seleccionó una muestra aleatoria de 25 días con lo cual se obtiene

S = 8 libros. Calcule e interprete la probabilidad de que el número medio

muestral de libros encuadernados difiera de su media poblacional µ en a lo más

4 libros.

Solución

Datos: n = 25 días, S = 8 libros. Se pide hallar 4P X

Se sabe que: 1/

n

XT t

S n

, entonces: 24

1.68/ 25

X XT t

Para obtener la probabilidad solicitada se divide dentro de la desigualdad entre

1.6 y se construye una T24 así:

4P X = 24

4( 2.5)

1.6 1.6

XP P T

=

= P(-2.5 ≤ T24 ≤ 2.5) = P(T24 ≤ 2.5) – P(T24 ≤ -2.5) =

= P(T24 ≤ 2.5) – [1 - P(T24 ≤ 2.5)] = 2 P(T24 ≤ 2.5) – 1 = 2(0.99) – 1 = 0.98

Rpta.

Interpretación.- en el 98% de las muestras de 25 días de encuadernación cada

una, el número medio muestral de libros encuadernados difiere de su media

poblacional µ en a lo más 4 libros.

14. De una población X: N(μ, σ²), se extrae una m.a. de n+1 observaciones.

Encontrar c tal que el estadístico c( X – Xn+1)/S tenga distribución t. Donde X y

S es la media y la desviación estándar muestral obtenidas con las n + 1

observaciones.

Solución

Para hallar la constante c es necesario construir una distribución T de student.

Con la muestra dada se tiene que: X → N(μ, 2

1n

) y Xn+1 → N(μ, σ²).

Por la propiedad reproductiva de la distribución normal, se tiene que:

X - Xn+1 → N[0, σ²(n +2)/(n + 1)]. Puesto que las correspondientes medias se

restan y las varianzas se suman.

114

Entonces: 1 1

2

0 1(0, 1)

2( 2) /( 1)

n nX X X XnZ N

nn n

.

Como S la desviación estándar muestral obtenidas con las n + 1 observaciones,

entonces la chi-cuadrado es: 2

2 2

12 n

nS


2

.

ZT

G L



1n en la expresión anterior se obtiene:

1

11

2

2

1

2 1

( 2)

n

nn

X Xn

n X XnT t

n n SnS

Comparando el resultado anterior con la expresión dada, se tiene que:

c = 1

( 2)

n

n n

Rpta.

15. Si F ~ f con 7 y 8 grados de libertad, hallar:

a) P(F7,8 > 3.50)

b) P(F7,8 ≤ 0.268)

c) P(0.1462 ≤ F7,8 ≤ 4.53)

d) Hallar c y d tal que P(F7,8 ≤ c) = 0.025 y P(c ≤ F7,8 ≤ d) = 0.95

Solución

Para obtener las probabilidades solicitadas en la tabla 4, ubicarse en la gran

casilla formada por la intercepción de la columna 7 (G.L. numerador) y la fila 8

(G.L. denominador) se busca el valor dado de F y se leen las probabilidades

acumuladas menores que correspondientes, en la intercepción de la línea del

valor dado de F (en la fila 8) con la columna P así:

a) P(F7,8 > 3.50) = 1 - P(F7,8 ≤ 3.50) = 1 – 0.95 Rpta.

b) P(F7,8 ≤ 0.268) =

268.0

11

8,7FP P(F8,7 > 3.73) = 1 - P(F8,7 ≤ 3.73) =

= 1 – 0.95 = 0.05 Rpta.

115

Para valores de 0 < F < 1 les corresponde probabilidades P = < 0.50 y se

usa la relación:

12

21

,,1

,,

1

rr

rrf

f

Como el valor de F7,8 = 0.268 no se encuentra en la intercepción de la

columna 7 y la fila 8 de la Tabla 4, se toma el inverso de F7,8 que es otra

distribución F8,7 (con los grados de libertad permutados). En la intercepción

de la columna 8 y la fila 7 de la Tabla 4 se busca el valor 3.73 y le

corresponde la probabilidad 0.95.

c) P(0.1462≤ F7,8 ≤ 4.53) = P(F7,8 ≤ 4.53) - P(F7,8 ≤ 0.1462)

= P(F7,8 ≤ 4.53) -

268.0

11

8,7FP

= P(F7,8 ≤ 4.53) - P(F8,7 > 3.73)

= P(F7,8 ≤ 4.53) - [1 - P(F8,7 ≤ 3.73)]

= 0.975 - [1 – 0.95] = 0.925 Rpta.

d) Hallar c y d tal que P(F7,8 ≤ c) = 0.025 y P(c ≤ F7,8 ≤ d) = 0.95

Si P(F7,8 ≤ c) = 0.025 entonces c = 90.4

11

975.0,7,8

025.0,8,7 f

f = 0.204

Rpta.

Si 0.95 = P(c ≤ F7,8 ≤ d) = P(F7,8 ≤ d) - P(F7,8 ≤ c) = P(F7,8 ≤ d) – 0.025

Luego: P(F7,8 ≤ d) = 0.975 entonces d = F7,8,0.975 = 4.53 Rpta.

16. Si muestras aleatorias independientes de tamaño n1 = n2 = 8 provienen de

poblaciones normales con la misma varianza. Calcule e interprete la

probabilidad que la varianza de la primera muestra sea al menos 4 veces más

grande que la otra.

Solución

Dado que las varianzas son iguales, para obtener la probabilidad solicitada se

emplea la distribución siguiente: 1,12

2

2

1

2

1

2

2

2

2

2

1

21 nnfS

S

S

SF

= F7,7

55

2

2

2

12

2

2

1S

SPSSP = P(F7,7 > 5) = 1 - P(F7,7 ≤ 5) =

= 1 – 0.975 = 0.025 Rpta.

116

Interpretación.- en el 2.5% de las (ó en 25 de cada 1000) muestras de tamaño 8

de cada población, la varianza de la primera muestra es al menos 4 veces más

grande que la segunda.

17. Si muestras aleatorias independientes de tamaño n1 = 6 y n2 = 8 provienen de

poblaciones normales con la misma varianza. Calcule e interprete la

probabilidad que la varianza de la primera muestra sea menor que seis veces la

segunda.

Solución

Para hallar la probabilidad solicitada se emplea la propuesta del problema 16.

66

2

2

2

12

2

2

1S

SPSSP = P(F5,7 < 6) = p = 0.984 Rpta.

Como en la tabla 4 de la distribución F, para 5 y 7 grados de libertad, no se tiene

el valor 6, pero éste se encuentra entre los valores 5.29 (con probabilidad 0.975)

y 7.46 (con probabilidad 0.99) para hallar p interpolamos de la siguiente manera:

Fα P

5.29 0.975

6.0 p 7.46 5.29 6.0 5.29

0.99 0.975 0.975p

144.67 =

1.29

0.975p

7.46 0.99 144.67 p – 141.05 = 1.29 p = 0.984

Interpretación.- en el 98.4% de las (ó en 984 de cada 1000) muestras de tamaño

6 de la población 1 y 8 de la población 2, la varianza de la primera muestra es

menor que seis veces la segunda.

18. De una población X: N(0, ¼) se extrae una muestra aleatoria de tamaño 7 y de

una población Y: N(0, 1/3) se extrae una muestra aleatoria de tamaño 9 Calcule

e interprete:

7

1

9

1

22 94i j

ji YXP .

Solución

Para hallar la probabilidad solicitada se construye una F como el cociente de dos

chi-cuadrados entre sus respectivos grados de libertad.

117

Si X: N(0, ¼) entonces cada Xi: N(0, ¼) → )1,0(22/1

0NX

XZ i

ii

.

Luego: 2

1

22 4 ii XZ y 2

7

7

1

27

1

2 4 i

i

i

i XZ .

Si Y: N(0, 1/3) entonces cada Yj: N(0, 1/3) → )1,0(33/1

0NY

YZ j

j

j

.

Luego: 2

1

22 3 jj YZ y 2

9

9

1

29

1

2 3 j

j

j

j YZ .

Con las dos chi-cuadrado anteriores se construye la distribución F siguiente:

9,79

1

2

7

1

2

9

1

2

7

1

2

9/37

7/49

9/3

7/4

F

Yx

Xx

Y

X

F

j

j

i

i

j

j

i

i

Acondicionando la probabilidad solicitada a la distribución anterior se tiene:

7

39

37

49

3

3

4

949

1

2

7

1

2

9

1

2

7

1

2

7

1

9

1

22 x

Yx

Xx

P

Y

X

PYXP

j

j

i

i

j

j

i

i

i j

ji =

= P(F7,9 > 3.86) = 1 - P(F7,9 ≤ 3.86) = 1 – p = 1 – 0.991 = 0.009 Rpta.

Como en la tabla 4 de la distribución F, para 7 y 9 grados de libertad, no está el

valor 3.86, pero éste se encuentra entre los valores 5.61 (con probabilidad 0.99)

y 6.88 (con probabilidad 0.995) para hallar p interpolamos así:

Fα P

5.61 0.99

5.86 p 6.88 5.61 5.86 5.61

0.995 0.99 0.99p

254 =

0.25

0.99p

6.88 0.995 254 p – 251.46 = 0.25 p = 0.991

Interpretación.- en el 0.9% de las (ó en 9 de cada 1000) muestras de tamaño 7

de la población X y 9 de la población Y,

7

1

9

1

22 94i j

ji YX .

19. Dos compañías A y B fabrican transistores. La duración para los fabricados por

A tienen una desviación estándar de 40 horas, en tanto que los B tienen una

desviación estándar de 50 horas. Se toma una muestra de 8 transistores de A y

118

16 de B. Calcule e interprete la probabilidad que la varianza de la primera

muestra sea mayor 4.23 veces que la segunda.

Solución

Datos: σA = 40 horas, σB = 50, nA = 8 transistores y nB = 16.

Para obtener la probabilidad solicitada se emplea la distribución F siguiente:

1,12

2

2

2

2

2

2

2

2

2

64.050

40

BA nn

B

A

B

A

A

B

B

A fS

S

S

S

S

SF

= F7,15

Adecuando la probabilidad solicitada al resultado anterior se obtiene:

64.023.464.023.423.4

2

2

2

222 x

S

SP

S

SPSSP

B

A

B

ABA = P(F7,15 > 2.71) =

= 1 - P(F7,15 ≤ 2.71) = 1 – 0.95 = 0.05 Rpta.

Interpretación.- en el 5% de las (ó en 50 de cada 1000) muestras de tamaño 8 de

la población A y 16 de la población B, la varianza de la duración de los

transistores de la primera muestra es mayor 4.23 veces que la varianza muestral

de la segunda.

20. De una población X ~ N(μ, 100) se extrae una muestra aleatoria de tamaño 12

y de una población Y ~ N(μ, 225) se extrae una muestra aleatoria de tamaño 8.

Calcule e interprete: 2 2( 1.6 )X YP S S .

Solución

Datos: σ2

X = 100 horas, σ2

Y = 225, nX = 12 transistores y nY = 8.

Para obtener la probabilidad solicitada se emplea la distribución F siguiente:

1,12

2

2

2

2

2

2

2

25.2100

225

YX nn

Y

X

Y

X

X

Y

Y

X fS

S

S

S

S

SF

= F11,7

Adecuando la probabilidad solicitada al resultado anterior se obtiene:

6.125.225.26.16.1

2

2

2

222 x

S

SP

S

SPSSP

Y

X

Y

XYX =

= P(F11,7 ≤ 3.6) = 0.95 Rpta.

Interpretación.- en el 95% de las (ó en 950 de cada 1000) muestras de tamaño

12 de la población X y 8 de la población Y, la varianza muestral de las X es

menor o igual que 1.6 veces que la varianza muestral de las Y.

119

3.7 EJERCICIOS PROPUESTOS

1. Si X ~ X2 con 25 grados de libertad, hallar:

a) P(X ≤ 46.9).

b) P(11.5 ≤ X ≤ 44.3).

c) P(X > 37.7).

d) Hallar a y b tal que P(X ≤ a) = 0.05 y P(a ≤ X ≤ b) = 0.90.

2. De una población X N(u, 18 ), se extrae una muestra aleatoria de tamaño n = 25.


a) P [ 0.011 < ( x - µ )2 < 3.614 ]

b) ¿Entre que valores se encontrará el 95 % central de las varianzas muestrales?

3. De una población X → N(µ , 20 ), se extrae una muestra aleatoria de tamaño n =

30. Calcule e interprete:

a) P [354 ≤

30

1

2)(i

iX ≤ 876 ]

b) P ( 11.04 ≤ S2 ≤ 31.52 )

4. Se sabe que los pesos de ciertas latas de atún se distribuyen normalmente con una

desviación estándar de 2 gramos. Si se toma una muestra de 12 latas, calcule e

interprete la probabilidad de que la varianza de la muestra sea menor que 8.5

(gr.)2.

5. La duración de los focos producidos por una compañía tienen una media de 1500

horas y una desviación típica de 80 horas. Se seleccionan 23 focos al azar, calcule

e interprete la probabilidad de que la desviación estándar muestral se encuentre

entre 60 y 100 horas.

6. La duración de transistores fabricados por una compañía tienen distribución

normal con una media de 2000 horas y una desviación típica de 60 horas. Se

selecciona 10 transistores al azar, calcule e interprete la probabilidad que la

varianza muestral se encuentre entre 2500 y 4900 (horas)2.

7. De una población X: N(u, 18), se extrae una muestra aleatoria de tamaño n = 25.


a) P [327.5 <

25

1i

(X i - µ)2 < 978.8 ]

120

b) P (8.18 < S2 < 32.25).

8. De una población X → N(μ, 10) se extrae una m.a. de tamaño n = 10 y de una

población Y → N(μ, 15) se extrae una m.a. de tamaño m = 8. Calcule e interprete:

a) 10

2

1

30.1 ( ) 190.0i

i

P X X

b) 8

2

1

32.7 ( ) 201.0i

i

P Y

9. Si T ~ t con 23 grados de libertad, hallar:

a) P(T ≤ -1.714)

b) P(-1.319 ≤ T ≤ 2.5)

c) P(T > 1.319)

d) Hallar a y b tal que P(T ≤ -t0) = 0.05 y P(-t0 ≤ T ≤ t0) = 0.90.

10. Un inspector investiga las acusaciones contra una fábrica de gaseosas porque no

llena bien sus envases. Una muestra de 16 botellas de gaseosa indica una

desviación típica S = 0.18 litros. Calcule e interprete la probabilidad de que el

promedio muestral difiera de su media poblacional µ en menos de 0.096 litros.

11. De una población X: N(0, ¼) se extrae una muestra aleatoria de tamaño 10.

Determine el valor de la constante k tal que: P (k x > SX) = 0.05. Donde x es la

media muestral de las X y SX es la desviación estándar muestral de las X.

12. Para analizar el tiempo de atención por cliente en un establecimiento grande, se

tomó una muestra aleatoria sin reemplazo de 25 atenciones con lo cual se obtiene

un tiempo promedio de 7.5 minutos y una varianza S2 = 2.25 minutos

2. Calcule e

interprete la probabilidad de que el promedio muestral difiera de su media

poblacional en menos de 0.513 minutos.

13. De una población X: N(μ, σ²), se extrae una muestra aleatoria de n+1

observaciones. Encontrar c tal que el estadístico c( x – Xn+1 )/S tenga

distribución t. Donde x y S es la media y la desviación estándar muestral

obtenidas con las n primeras observaciones.

14. Una inspectora de calidad investiga las acusaciones contra una fábrica de cerveza

porque no llena bien sus envases. Una muestra de 25 latas de cerveza indica un

contenido medio x = 33.2 onzas y S = 2.25 onzas. Calcule e interprete la

probabilidad de que el promedio muestral difiera de su media poblacional en

menos de 0.929 onzas.

121

15. Si F ~ f con 10 y 12 grados de libertad, hallar:

a) P(F ≤ 0.212)

b) P(0.276 ≤ F ≤ 4.30)

c) P(F > 3.37)

d) Hallar c y d tal que P(F ≤ c) = 0.05 y P(c ≤ T ≤ d) = 0.90.

16. Si muestras aleatorias independientes de tamaños n1 = n2 = 8 provienen de

poblaciones normales con la misma varianza. Calcule e interprete la probabilidad

que la varianza de la primera muestra sea mayor que 5 veces la segunda.

17. Si muestras aleatorias independientes de tamaño n1 = 6 y n2 = 8 provienen de

poblaciones normales con la misma varianza. Calcule e interprete la probabilidad

que la varianza de la primera muestra sea 5 veces más grande que la segunda

18. Sea X1 , X2 , …. , X7 e Y1 , Y2 , …. , Y9 muestras aleatorias independientes de

distribuciones normales, ambas con media cero y varianza uno. Calcule e

interprete:

9

1

27

1

2 72j

j

i

i YXP

19. Dos compañías A y B fabrican transistores. La duración para los fabricados por A

tiene una desviación estándar de 40 horas, en tanto que los B tienen una

desviación estándar de 50 horas. Se toma una muestra de 10 transistores de A y 10

de B. Calcule e interprete la probabilidad que la varianza de la muestra A sea al

menos dos veces más grande que la B.

20. Dos compañías A y B fabrican focos. La duración de los fabricados por A tiene

una desviación típica de 40 horas, en tanto que los B tienen una desviación

estándar de 50 horas. Se toma una muestra aleatoria de 10 focos de A y 10 de B.

Calcule e interprete la probabilidad que la varianza de la muestra A sea mayor que

tres veces la varianza de la muestra B.

122

Capítulo 4. ESTIMACIÓN PUNTUAL

“Lo que escucho lo olvido, lo que veo lo recuerdo, pero lo que hago lo

entiendo” Confucio

CONTENIDO

4.1 Estimadores. Propiedades.

4.2 Métodos de estimación puntual.

4.3 Método de máxima verosimilitud.

4.4 Método de los momentos.

4.5 Método de los mínimos cuadrados.



En este capítulo, se presenta los aspectos fundamentales de la estimación puntual, es

decir la aproximación al valor del parámetro a través de un solo valor, buscando de

observar las propiedades que deben reunir los estimadores de los parámetros, así

como el uso de los métodos de estimación puntual.

La estadística provee técnicas que permiten obtener conclusiones generales a partir

de una muestra (un conjunto limitado, pero representativo de datos). Cuando

inferimos no tenemos garantía de que la conclusión que obtenemos sea exactamente

correcta. Sin embargo, la estadística permite cuantificar el error asociado a la

estimación.

La mayoría de las distribuciones de probabilidad dependen de cierto número de

parámetros. Por ejemplo: P(λ), N(µ, σ2 ), B(n, p), etc. Salvo que estos parámetros se

conozcan, deben estimarse a partir de los datos muestrales.

El objetivo de la estimación puntual es usar una muestra para obtener números que,

en algún sentido, sean los que mejor representan a los verdaderos valores de los

parámetros de interés.

Supongamos que se selecciona una muestra de tamaño n de una población. Antes de

obtener la muestra no sabemos cuál será el valor de cada observación. Así, la primera

observación puede ser considerada una variable aleatoria X1, la segunda una v.a. X2,

etc. Por lo tanto, antes de obtener la muestra denotaremos X1 , X2 , .... , Xn a las

observaciones y, una vez obtenida la muestra los valores observados los denotaremos

x1, x2, .... , xn.

123

4.1 ESTIMADORES. PROPIEDADES

Estimador y estimación

Definición: Un estimador puntual del parámetro θ es un estadístico, una

fórmula, obtenido como una función de la muestra, es decir = F(X1 , X2 , ....

, Xn).

Definición: Una estimación puntual de un parámetro θ es un valor que puede

ser considerado representativo de θ y se indicará . Se obtiene una vez

determinada la muestra de valores observados x1 , x2 , .... , xn , es decir =

F(x1 , x2 , .... , xn ).

Ejemplo 1.- Con el fin de estudiar si un dado es o no equilibrado, se arroja el dado

100 veces en forma independiente, obteniéndose 21 ases. ¿Qué valor podría

utilizarse, en base a esa información, como estimación de la probabilidad de as?

Parece razonable utilizar la frecuencia relativa de ases.

En este caso, si llamamos p a la probabilidad que queremos estimar,

p = 21 / 100 = 0.21.

Propiedades de los estimadores

Observemos que dada una m.a. X1 , X2 , .... , Xn un estimador puntual del

parámetro θ obtenido en base a ella, es una v.a. . La diferencia - θ es el

error de estimación y una estimación será más precisa cuanto menor sea este

error.

Este error es también una v.a. dado que depende de la muestra obtenida. Para

algunas muestras será positivo, para otras negativo. Una propiedad deseable es

que la esperanza del error sea 0, es decir que “en promedio” el error obtenido al

estimar a partir de diferentes muestras sea cero.

a) Insesgamiento.- un estimador puntual del parámetro θ es insesgado si:

E( ) = θ .

Si no es insesgado, a la diferencia E( ) – θ = b ( ) se le denomina sesgo de

.

124

Por lo tanto, se dice que un estimador es insesgado si su distribución tiene como

valor esperado al parámetro que se desea estimar.

Ejemplo 2.- sea X1 , X2 , .... , Xn una m.a. de una población X con media μ y

varianza σ2. Hemos visto en las distribuciones muestrales que un estimador de la

media poblacional μ es la media muestral, es decir que n

X

X

n

i

i 1 , y

hemos probado que:

)(11

)(1

)(11

1 nnn

XEnn

X

EXEn

i

n

i

i

n

i

i

Es decir que la media muestral X es un estimador insesgado de la media

poblacional μ.

Ejemplo 3.- Si X1 , X2 , .... , Xn una m.a. de una población X ~ N(μ , σ2 ) .

Veremos más adelante, en estimación máximo verosímil, que un estimador de la

varianza poblacional σ2 es

n

XXn

i

i

1

2

2

)(

, cuya esperanza está dada por:

2

1

22

1

21

2

2 11)(

)ˆ( XEXEn

XnXEnn

XX

EEn

i

i

n

i

i

n

I

I

= 2222 )()()()( XEXVXEXVXEXEn

niii

= 222

22 1

n

n

n

Es decir que: 22 1

)ˆ( n

nE

Luego n

XXn

i

i

1

2

2

)(

no es estimador insesgado de la varianza poblacional

σ2.

b) Insesgamiento asintótico.- Un estimador puntual del parámetro θ, basado en

una muestra aleatoria X1 , X2 , .... , Xn , es insesgado asintóticamente si:

125

n

lím )ˆ(E

En el ejemplo 3, si bien n

XXn

i

i

1

2

2

)(

no es un estimador insesgado,

pero es asintóticamente insesgado ya que su esperanza tiende a σ2 cuando el

tamaño de la muestra tiende a infinito.

Ejercicio.- verificar que la varianza muestral 1

)(1

2

2

n

XX

s

n

i

i

es un

estimador insesgado de la varianza poblacional σ2 cualquiera sea la

distribución.

c) Consistencia.- Sea X1, X2, .... , Xn una m.a. de una distribución que

depende de un parámetro θ, y sea n un estimador puntual de θ basado en

esa muestra. Diremos que n es un estimador consistente de θ, si

0 , n

lím 1ˆ nP

Ejemplo 4.- Demuestre que la media muestral n

X

X

n

i

i 1 es un estimador

consistente de la media poblacional μ.

Solución.-

Como la media muestral )/,( 2 nNX . Y la variable aleatoria

n

XZ

/

)(

tiene aproximadamente distribución N(0, 1) ; tenemos que:

12

nnZ

nPXPXP

Luego: n

lím XP =

n

lím12

n= 2 (1) – 1 = 1

126

Por lo tanto, la media muestral n

X

X

n

i

i 1 es un estimador consistente de la

media poblacional μ, cualquiera que sea el tipo de distribución de la población,

siempre que tenga media y varianza.

d) Error Cuadrático Medio (ECM) de un Estimador .- Sea un estimador

puntual del parámetro θ, su error cuadrático medio es:

2ˆ)ˆ( EECM

Proposición.- 22)ˆ()ˆ(ˆ)ˆ( bVarEECM

Siendo b ( ) = E( ) – θ el sesgo del estimador .

Demostración.-

])ˆ()ˆ(ˆ[])ˆ[()ˆ(22 EEEEECM =

= ])ˆ(ˆ(ˆ2)ˆ(ˆ(ˆ[22

EEEEE

=

)ˆ(ˆ(ˆ2])ˆ([]ˆ(ˆ[22

EEEEEEE

Utilizando las propiedades del operador esperanza, se tiene que:

0)]ˆ([)ˆ(

)ˆ(ˆ(ˆ2])ˆ([]ˆ(ˆ[)ˆ(

2

22

bV

EEEEEEECM

y, por lo tanto, ECM ( ) = Var ( ) + [ b( ) ]2, como queríamos probar.

Nota.- Si el estimador es insesgado, el error cuadrático medio es igual a la

varianza del estimador. Es decir, ECM ( ) = Var ( ).

e) Eficiencia Relativa (Principio de estimación de menor error cuadrático

medio).- Dados dos o más estimadores del parámetro θ, se debe elegir al que

tiene menor ECM.

En el caso de que los estimadores sean insesgados, se escoge al que tenga

menor varianza. Entre un estimador insesgado y otro que no lo es, si el

127

estimador sesgado tiene una varianza mucho menor que el insesgado, podría ser

preferible su uso.

Ejemplo 5.-

Suponga que 1 y

2 son dos estimadores de con E (1 ) = , E(

2 )

= /3, Var (1 ) = 6 , Var (

2 ) = 2. ¿Cuál es mejor estimador de ? ¿por

qué?

Solución.-

El estimador 1 es insesgado, por lo tanto: ECM ( 1 ) = Var ( 1 ) = 6 ........

(1)

El estimador 2 es sesgado, por lo tanto:

ECM ( 2 ) = Var( 2 ) + [ E ( 2 ) - ]2 = 2 + [/3 - ]

2 = (18 + 4

2) / 9 ...

(2)

1 será mejor estimador que 2 si:

ECM (1 ) < ECM ( 2 )

Reemplazando (1) y (2): 6 < (18 + 4 2) / 9

Cuya solución es: > 3.

Es decir que 1 será mejor estimador que 2 si > 3, porque tiene menor

ECM; en caso contrario, si < 3, 2 será mejor estimador que 1 .

Rpta.

Ejemplo 6.-

Sea X1 , X2 , .... , Xn una m.a. de una población X ~ N(μ , σ2 ) . Se puede

verificar inmediatamente que los siguientes estimadores, son estimadores

insesgados de μ.

X1 , 2

ˆ 212

XX y 13ˆ X

Mientras que, la varianza de estos estimadores es:

128

nV

2

1)ˆ(

, 2

)ˆ(2

2

V y 2

3 )ˆ( V

Por lo tanto, el mejor estimador de μ será X1 por tener menor varianza.

f) Eficiencia.- Se dice que un estimador puntual es un estimador eficiente del

parámetro θ si es insesgado y de varianza mínima.

Para todos los estimadores insesgados de θ, Cramer y Rao establecieron una

cota inferior de las varianzas, de la siguiente manera:

La cota inferior de Cramer – Rao [ B(θ) ]

Sea un estimador insesgado del parámetro θ, basado en una m.a. de n

observaciones y sea f(x; θ) la distribución de probabilidades de la v.a X.

Entonces, la cota inferior de la varianza de es:

2

;(ln

1)()ˆ(

xfd

dnE

BVar

Si la varianza de un estimador insesgado satisface la desigualdad de Cramer

y Rao como una igualdad, este es un estimador insesgado de varianza mínima o

eficiente.

Ejemplo 7.-

Demostrar que la proporción muestral p es un estimador insesgado de varianza

mínima de la proporción poblacional P, de una variable aleatoria X con

distribución de Bernoulli.

Solución.-

Suponga que se extrae una muestra aleatoria simple de tamaño n de la población X

con distribución de Bernoulli., entonces:

.,1 Paestiman

X

p

n

i

i

La proporción muestral p, es una media muestral de v.a. Bernoulli con E(Xi ) =

P y V(Xi ) = PQ; representa la proporción de éxitos en la muestra y estima a la

proporción de éxitos en la población P. Luego:

129

PnPn

Pn

XEnn

X

EpEn

i

n

i

i

n

i

i

)(11

)(1

)(11

1

Es decir que la proporción muestral p es un estimador insesgado de la

proporción poblacional P. Veamos si es de varianza mínima.

2

11

)(

)(n

XVar

n

X

VarpVar

n

i

i

n

i

i

(propiedad de la varianza)

n

PQ

n

nPQ

n

PQ

n

XVarn

i

n

i

i

22

1

2

1

)(

Hallemos la cota inferior de Cramer – Rao, B(P):

i) f(x; P) = P x (1 – P)

1 - x , x = 0 , 1

ii) ln f(x; P) = x ln P + (1 – x) ln (1 – P)

iii) )1(1

1);(ln

PP

Px

P

x

P

xPxf

dP

d

iv) PQQP

PQ

QP

XVar

PP

PxEPxf

dP

dE

1)(

)1(

)();(ln

222222

22

v) n

PQ

PQnPxf

dP

dnE

PB

1

1

);(ln

1)(

2 = Var (p)

Dado que la Var (p) es igual a la cota inferior de Cramer-Rao B(P), p es

un estimador de varianza mínima para P.

Como la proporción muestral p es un estimador insesgado y de varianza

mínima para P, es un estimador eficiente.

130

4.2 MÉTODOS DE ESTIMACIÓN PUNTUAL

Entre los principales métodos de estimación puntual se tiene:

El método de máxima verosimilitud (que busca maximizar la probabilidad de que

ocurra la muestra observada)

El método de los momentos (en el que se iguala los correspondientes momentos

poblacionales y muestrales).

El método de los mínimos cuadrados ordinarios (que busca minimizar la varianza

de los errores en el modelo de regresión lineal).

A continuación presentamos cada uno de estos métodos de estimación.

4.3 MÉTODO DE MÁXIMA VEROSIMILITUD

El método consiste en seleccionar como Estimador Máximo Verosímil4 (EMV)

puntual del parámetro θ, al estimador que maximiza la probabilidad de

obtener la muestra realmente observada. Dicha probabilidad está representada

por la función de probabilidad conjunta de la muestra y recibe la denominación

de función de verosimilitud.

Procedimiento.-

Sea X1, X2, .... , Xn una m. a. de X, una variable aleatoria con función de

probabilidad f(x; θ) que depende del parámetro θ, y sean x1 , x2 , .... , xn , los

valores observados. Para hallar el EMV del parámetro desconocido θ se

procede de la siguiente manera:

1) Hallar la función de verosimilitud, que representa la probabilidad de

obtener la muestra observada, y se define así:

V(θ) = f (x1 , x2 , .... , xn ; θ) = f (x1 ; θ) f (x2 ; θ) .... f (xn ; θ) =

n

i

ixf1

);(

2) El método de máxima verosimilitud consiste en tomar como estimación el

valor que hace máxima la función de verosimilitud V(θ). Sabemos que si

4 http://buscon.rae.es/drae/ Real Academia Española © Todos los derechos reservados. Vigésima segunda edición (2001).

Verosímil: 1. Adj. Que tiene apariencia de verdadero. 2. Adj. Creíble por no ofrecer carácter alguno de falsedad.

http://buscon.rae.es/drae/

131

hace máxima a V(θ), también hace máxima a su logaritmo ln V(θ). Para

convertir el producto en suma, se toma la función:

L = ln V(θ) =

n

i

ixf1

);(ln

3) Se toma derivadas parciales de L con respecto a θ, se iguala a cero y se

obtiene . Es decir:

0);(ln

1

n

i

ixfL

= F (x1 , x2 , .... , xn )

Si la distribución tiene r parámetros desconocidos θ1 , θ2 , .... , θr ; se toma

derivadas parciales con respecto a cada parámetro y en lugar de una

ecuación tendremos las r ecuaciones:

01

L , 0

2

L , .... , 0

r

L

a partir de las cuales se obtiene los estimadores 1 , 2 , .... , r .

Ejemplo 8.-

Hallar el estimador de máxima verosimilitud para el parámetro P (proporción o

probabilidad de éxito) de la distribución X de Bernoulli.

Solución.-

i) La función de probabilidad de la v.a. X Bernoulli es:

f (x; P) = P x (1 – P)

1 - x , x = 0 , 1 ; 0 < P < 1

ii) Sea X1 , X2 , .... , Xn una m. a. de X, cuyos valores observados son x1 , x2 ,

.... , xn. Entonces:

ii xx

i PPPxf 1)1();( , xi = 0 , 1 ; i = 1, 2, …. , n

iii) La función de verosimilitud V(P) está dada por:

V(P) = f (x1 , x2 , .... , xn ; P) = f (x1 ; P) f (x2 ; P) .... f (xn ; P) =

=

n

i

i Pxf1

);( =

n

i

xx ii PP1

1)1( = ii XnXPP )1(

iv) L = ln V(P) = )1ln(ln11

PxnPxn

i

i

n

i

i

132

v)

n

i

i

n

i

i

n

i

i

n

i

i

x

xn

P

P

P

xn

P

x

P

L

1

111 10

1

Luego: Xn

x

pP

n

i

i

1ˆ Rpta.

Estimador muestral que sabemos es un estimador eficiente de la proporción

poblacional P.

4.4 MÉTODO DE LOS MOMENTOS

La idea básica de este método consiste en igualar los momentos muestrales con

los correspondientes momentos poblacionales. Recordemos la siguiente

definición.

Definición.-

Sea X una v.a. con función de probabilidad puntual p(x) en el caso discreto o

función de densidad f(x) en el caso continuo. Se denomina momento de orden

k (k N) o momento poblacional de orden k a E(Xk

), es decir:

x

kk xpxXE )()( en el caso discreto, y

dxxfxXE kk )()( en el caso continuo.

si esas esperanzas existen.

Dada una muestra aleatoria X1 , X2 , .... , Xn , el momento muestral de orden k

alrededor del origen denotado por M’k , es: n

X

M

n

i

k

i

k

1'

Definición.-

Sea X1 , X2 , .... , Xn , una m.a. de una distribución con función de probabilidad

o función de densidad que depende de m parámetros Ө1, Ө2, ...., Өm. Los

estimadores de momentos de Ө1, Ө2, ...., Өm son los valores 1, 2, .... , m

que se obtienen igualando m momentos poblacionales con los correspondientes

momentos muestrales. En general, se obtienen resolviendo el siguiente sistema

de ecuaciones:

133

n

X

MXE

n

i

k

i

k

k 1')( , k = 1, 2, .... , m

Ejemplo 9.-

Sea X1, X2, .... , Xn, una m.a. de una distribución exponencial de parámetro λ.

Como hay un solo parámetro a estimar, basta plantear una ecuación basada en

el primer momento.

Es decir, M1’ = E (X).

Sabemos que para la distribución exponencial

1)( XE Entonces:

XX

nXE

n

X

Mn

i

i

n

i

i1

ˆ1

)(

1

1'

1

4.5 MÉTODO DE LOS MÍNIMOS CUADRADOS

Conocido también como el método de los mínimos cuadrados ordinarios, es

utilizado para estimar los parámetros del modelo de regresión lineal simple y

múltiple. Se parte del hecho de que no todos los puntos caen sobre la recta

postulada, a la cual se le agrega la variable aleatoria error y lo que se busca es

minimizar la varianza de los errores representada por

n

i

ie1

2 .

Si Yi = a + b Xi + ei entonces ei = Yi - a - b Xi y por tanto se busca minimizar:

n

i

ii

n

i

i bXaYe1

2

1

2 )(

Se toman derivadas parciales con respecto a a y con respecto a b, se igualan a cero

así:

n

i

ii

n

i

i bXaYeda

d

11

2 0)1)((2

134

n

i

iii

n

i

i XbXaYedb

d

11

2 0))((2

Luego de igualarlas a cero se obtiene las denominadas ecuaciones normales:

n

i

i

n

i

i YXbna11

….. (1)

n

i

n

i

ii

n

i

ii YXXbXa1 11

2….. (2)

Cuya solución proporciona los siguientes estimadores: de b y a:

n

i

i

n

i

ii

XnX

YXnYX

b

1

22

1ˆ y XbYa ˆˆ

Cuando se reemplaza los resultados muestrales se obtiene: iXbaY ˆˆˆ

135

4.6 PROBLEMAS RESUELTOS

1. Demostrar que la varianza muestral 1

)(

ˆ1

2

22

n

XX

s

n

i

i

es un estimador

insesgado de la varianza poblacional σ2.

Solución

Sabemos que:

n

i

i

n

i

i XnXXX1

22

1

2)(

Hallando la esperanza de la varianza muestral se tiene:

111

)(

)()ˆ(

2

1

22

1

2

1

2

22

n

XnEXE

n

XnXE

n

XX

EsEE

n

i

i

n

i

i

n

i

I

=

1

)()()()(

1

2222

n

XEXVXEXVn

n

XnEXnE iii

= 11

22

22

22

n

n

n

nn

Es decir que: 22

22 )1()()ˆ(

n

nsEE

Luego 1

)(

ˆ1

2

22

n

XX

s

n

i

i

es estimador insesgado de la varianza poblacional

σ2.

2. La primera observación de una muestra aleatoria de tamaño n, podría utilizarse

como un estimador de la media poblacional. ¿Es éste un estimador: a)

insesgado? y b) eficiente?

Solución

Por definición de muestra aleatoria se sabe que: X1, X2 , …., Xn son n variables

aleatorias independientes con: E(Xi) = µ, V(Xi) = σ2.

Si 1ˆ X , entonces:

a) 1ˆ( ) ( )E E X = µ, luego 1

ˆ X es un estimador insegado de µ.

136

b) Como X1 es un estimador insesgado, entonces ECM (X1) = V(X1) = σ2.

Pero, 1

n

i

i

X

Xn

también es un estimador insesgado de µ, con

2

( ) ( )ECM X V Xn

.

Comparando los errores cuadráticos medios de ambos estimadores, se tiene

que:

ECM (X1) > ( )ECM X luego X1 no es un estimador eficiente de µ, ya que

X es un estimador más eficiente.

3. Las cajas de un cereal producido por una fábrica deben tener un contenido de 16

onzas (una libra). Un inspector toma una muestra aleatoria simple que arroja los

siguientes pesos en onzas: 15.7, 15.7, 16.3, 15.8, 16.1, 15.9, 16.2, 15.9, 15.8,

15.6.

a) ¿Cuál es la estimación puntual del peso medio poblacional de las cajas de

cereal?

b) ¿Cuál es la estimación puntual de la varianza poblacional del peso de las

cajas?

Solución

a) El estimador puntual de la media poblacional es la media muestral y su

estimación es la siguiente:

10

159

10

6.15....7.157.15

10

10

11

i

i

n

i

i X

n

X

X = 15.9 onzas.

b) El estimador puntual de la varianza poblacional es la varianza muestral y su

estimación es:

110

10

11

)(

ˆ

10

1

22

1

22

1

2

22 i

i

n

i

i

n

i

i XX

n

XnX

n

XX

S

22210

1

2

1

2 6.15....7.157.15 i

i

n

i

i XX = 2528.58.

Reemplazando en la expresion de la varianza muestral se obtiene:

137

9

)9.15(1058.2528

110

10

ˆ

2

10

1

22

22 xXX

S i

i

= 0.0533 (onzas)

2.

4. En una encuesta de opinión a 1000 adultos para conocer su opinión acerca de la

economía. Las respuestas fueron las siguientes:

OPINIÓN: ADULTOS

La economía se está contrayendo 300

La economía permanece igual 400

La economía está creciendo 200

No sabe/No opina 100

Determine la estimación puntual de los siguientes parámetros de la población:

a) La proporción de adultos que opinan que la economía se está contrayendo.

b) La proporción de adultos que opinan que la economía permanece igual.

c) La proporción de adultos que opinan que la economía está creciendo.

d) La proporción de adultos que No sabe/No opina.

Solución

El estimador puntual de la proporción poblacional es la proporción muestral

siguiente:

n

éxitosdeN

n

X

n

X

pp

n

i

i

1

a) La estimación de la proporción de adultos que opinan que la economía se está

contrayendo es:

1000

300

1000

ocontrayend está se economía la queopinan que adultos

n

Xp =

0.30.

b) La estimación de la proporción de adultos que opinan que la economía

permanece igual es:

1000

400

1000

igual sige economía la queopinan que adultos

n

Xp = 0.40

c) La estimación de la proporción de adultos que opinan que la economía está

creciendo es:

138

1000

200

1000

creciendo está economía la queopinan que adultos

n

Xp = 0.20.

d) La estimación de la proporción de adultos que No sabe/No opina es:

1000

100

1000

opina sabe/No No que adultos

n

Xp = 0.10.

Estimaciones que casi siempre son presentadas como porcentajes de la siguiente

manera:

NÚMERO Y PORCENTAJE DE ADULTOS, SEGÚN SU OPINIÓN SOBRE LA

SITUACIÓN DE LA ECONOMÍA

OPINIÓN: ADULTOS %

La economía se está contrayendo 300 30

La economía permanece igual 400 40

La economía está creciendo 200 20

No sabe/No opina 100 10

Total 1000 100

5. Asumiendo que X1 y X2 son variables aleatorias independientes con: E(X1) = 3,

V(X1) = 4, E(X2) = 4, V(X2) = 8. Si 1 = 3X1 – X2 y 2 = 3X2 – X1 son dos

estimadores de ϴ, ¿Cuál de los estimadores es más eficiente?

Solución

Para determinar cuál de los estimadores es más eficiente hay que hallar sus errores

cuadráticos medios y compararlos.

2ˆ ˆ ˆ( ) ( ) ( )i i iECM V E

1ˆ( )E = E[3X1 – X2] = 3 E(X1) - E(X2) = 3(3) – 4 = 5

1ˆ( )V = V[3X1 – X2] = 3

2 V(X1) + V(X2) = 9(4) + 8 = 44. Luego:

2

1 1 1ˆ ˆ ˆ( ) ( ) ( )ECM V E

=

= 44 + [ϴ - 5]2 = 44 + [ϴ

2 – 10 ϴ + 25] = ϴ

2 – 10 ϴ + 69

2ˆ( )E = E[3X2 – X1] = 3 E(X2) – E(X1) = 3(4) – 3 = 9

2ˆ( )V = V[3X2 – X1] = 3

2 V(X2) + V(X1) = 9(8) + 4 = 76. Luego:

139

2

2 2 2ˆ ˆ ˆ( ) ( ) ( )ECM V E

=

= 76 + [ϴ - 9]2 = 68 + [ϴ

2 - 18ϴ + 81] = ϴ

2 - 18ϴ + 157

El estimador 1 es un estimador más eficiente para ϴ que 2 si se cumple que:

1 2ˆ ˆ( ) ( )ECM ECM → ϴ

2 – 10 ϴ + 69 < ϴ

2 - 18ϴ + 157 →

→ 8ϴ < 88 → ϴ < 11.

Si ϴ > 11, el estimador 2 es un estimador más eficiente para ϴ que 1 Rpta.

6. Suponga que tiene una muestra de tamaño 2n de una población X con E(X) = µ

y Var(X) = σ2. Sean

n

X

X

n

i

i

2

2

11

y

n

X

X

n

i

i 1

2 dos estimadores de µ, ¿cuál

es el mejor estimador de µ?

Solución

Ambos estimadores de µ propuestos, n

X

X

n

i

i

2

2

11

y

n

X

X

n

i

i 1

2 , son

estimadores insesgados, ya que son medias muestrales con 2n y n observaciones

muestrales respectivamente. Luego, será mejor estimador el que tenga menor

varianza.

Teniendo en cuenta que E(Xi) = µ y Var(Xi) = σ2, por definición de muestra

aleatoria, hay que hallar sus varianzas y compararlas.

nn

n

nn

XV

n

X

VXV

n

i

n

i

i

n

i

i

2)2(

2

)2()2(

)(

2)(

2

2

2

2

2

1

2

2

2

1

2

11

nn

n

nn

XV

n

X

VXV

n

i

n

i

i

n

i

i 2

2

2

2

1

2

2

112

)(

)(

Se observa que )()( 21 XVXV . Por lo tanto, 1X es el mejor estimador de µ.

Rpta.

140

7. Sea X1, X2,…..,Xn, una muestra aleatoria de una variable aleatoria X con

distribución uniforme en el intervalo [α, α + 1].

a) Demuestre que la media muestral x = es un estimador sesgado de α.

b) Calcule el error cuadrático medio del estimador x .

Solución

a) Como la variable aleatoria X tiene distribución uniforme en el intervalo [α, α + 1],

entonces 11

1)(

xf , α ≤ X ≤ α + 1. Así mismo,

2

12

2

1)(

iXEXE y

12

1

12

)1()(

2

iXVXV

Si x , entonces:

2

1

2

122

12)(

)()ˆ( 111

nn

XE

n

X

ExEE

n

i

n

i

i

n

i

i

Luego: = x es un estimador sesgado de α. Rpta.

b) El error cuadrático medio del estimador x esta dado por:

2

ˆ ˆ ˆ( ) ( ) ( )ECM V E ….. (b)

nn

n

nn

XV

n

X

VXVV

n

i

n

i

i

n

i

i

12

1

12

12

1)(

)()ˆ(22

1

2

11

Reemplazando la varianza de y la esperanza de en (b) se tiene:

n

n

nnECM

12

31

4

1

12

1

2

1

12

1)ˆ(

2

Rpta.

8. Sea X1 , X2 , …. , X7 una muestra aleatoria de una población con media µ y

varianza 2. Considere los siguientes estimadores de µ:

1 = (X1 + X2 + …. + X7 ) / 7 ; 2 = ( 2 X1 - X6 + X4 ) / 2

a) ¿Son estimadores insesgados? y b) ¿Cuál es mejor estimador de µ?

Solución

a) Por definición de muestra aleatoria E(Xi) = µ y Var(Xi) = σ2. Luego:

141

7

7

7

....

7

)(....)()(ˆ 7211

XEXEXEE

2

2

2

2

2

)(.)()(2ˆ 4612

XEXEXEE

Por lo tanto 1 como 2 son estimadores insesgados de µ. Rpta.

b) Por ser insesgados, es mejor estimador de µ el que tiene menor varianza.

Luego:

49

7

49

....

7

)(....)()(ˆ

2222

2

7211

XVXVXVV = 0.14 σ

2.

4

6

4

4

2

)(.)()(2ˆ

2222

2

461

2

2

XVXVXVV = 1.5 σ

2.

Por lo tanto 1 es mejor estimador de µ que 2 . Rpta.

9. Suponga que 1 y 2 son estimadores de con E( 1) = , E( 2) = 2

, Var ( 1

) = 6 , Var ( 2 ) = 2. ¿Cuál es mejor estimador de ? ¿por qué?

Solución

De los dos estimadores, es mejor el que tiene menor error cuadrático medio.

Sabemos que: 2

ˆ ˆ ˆ( ) ( ) ( )i i iECM V E .

Como 1 es estimador insesgado de , entonces: 1 1ˆ ˆ( ) ( ) 6ECM V

2 22

2 2 2

8ˆ ˆ ˆ( ) ( ) ( ) 22 4

ECM V E

El estimador 1 es mejor estimador de ϴ que 2 si se cumple que:

1 2ˆ ˆ( ) ( )ECM ECM →

286

4

→ 24 < 8 + 2 →

2 > 16 → 4 .

Si 4 , el estimador 2 es mejor estimador de ϴ que 1 . Rpta.

10. Suponga que 1 y 2 son 2 estimadores de β con: E ( 1 ) = β /2, E ( 2 ) = β

/3, Var ( 1 ) = 7 y Var ( 2 ) = 6. ¿Cuál es mejor estimador de β? ¿Por

qué?

Solución

142

De los dos estimadores, es mejor el que tiene menor error cuadrático medio.

2 22

1 1 1

28ˆ ˆ ˆ( ) ( ) ( ) 72 4

ECM V E

2 22

2 2 2

54 4ˆ ˆ ˆ( ) ( ) ( ) 63 9

ECM V E

El estimador 1 es mejor estimador de β que 2 si se cumple que:

1 2ˆ ˆ( ) ( )ECM ECM →

2 228 54 4

4 9

→ 252 + 9 β2 < 216 + 16 β

2

→

36 < 7 β2 → 7 β

2 > 36 →

6 7

7

.

Si 6 7

7

, el estimador 2 es mejor estimador de β que 1 . Rpta.

11. Si 1 y 2 son estimadores independientes insesgados de un parámetro

desconocido , con varianzas conocidas 2

1 y 2

2 respectivamente:

a) Demostrar que = a 1 + (1 – a) 2 también es un estimador insesgado de

, para cualquier valor de a.

b) Encontrar el valor de a que minimiza la varianza de .

Solución

a) Si 1 y 2 son estimadores independientes insesgados del parámetro

desconocido , entonces: E( 1 ) = y E( 2 ) = . Luego:

E( ) = E[a 1 + (1 – a ) 2 ] = a E( 1 ) + (1 – a) E( 2 ) =

= a + (1 – a ) = .

Por lo tanto es un estimador insesgado de , para cualquier valor de a.

b) Se tiene como datos: V( 1 ) = 2

1 y V( 2 ) = 2

2 . Luego, la varianza del

estimador es:

V( ) = V[a 1 + (1 – a ) 2 ] = a2 V( 1 ) + (1 – a)

2 V( 2 )

Reemplazando la varianza de los estimadores se obtiene:

V( ) = a2 2

1 + (1 – a)2 2

2 = f(a)

143

Para hallar el valor de a que minimiza la varianza del estimador , se toma la

derivada parcial de V( ) con respecto a a y se iguala a cero. Así:

f’(a) = da

dV )ˆ( = 2a 2

1 + 2(1 – a) 2

2 (-1) = 0

Para resolver la ecuación anterior se divide entre 2 en ambos miembros y se

tiene:

a 2

1 - (1 – a ) 2

2 = 0 → a 2

1 + a 2

2 = 2

2 → a = 2

2

2

1

2

2

, punto

crítico.

f’’(a) = 2

2 )ˆ(

da

Vd = 2 2

1 + 2 2

2 .

Reemplazando el punto crítico encontrado en f’’(a) se tiene que:

f’’(a) = 2 2

1 + 2 2

2 > 0 → a es un mínimo para la V( ).

Por lo tanto el valor a = 2

2

2

1

2

2

minimiza la varianza de . Rpta.

12. Sea X una variable aleatoria con media y varianza σ2. Dadas dos muestras

aleatorias de tamaños n1 y n2 con medias muestrales 1X y 2X respectivamente.

a) Demostrar que: 1 2(1 )X aX a X , 0 ≤ a ≤ 1, es un estimador insesgado de

.

b) Asumiendo que 1X y 2X son independientes, hallar el valor de a que

minimiza la varianza de X .

Solución

Se sabe que la media muestral es un estimador insesgado de la media

poblacional. Entonces: E( 1X ) = y E( 2X ) = .

Además, la varianza de la media muestral es igual a la varianza poblacional

entre el tamaño de la muestra. Luego: 1

2

1)(n

XV

y 2

2

2 )(n

XV

.

a) E( X ) = E[ 1 2(1 )aX a X ] = a E( 1X ) + (1 – a) E( 2X ) =

= a + (1 – a) = .

Entonces, X es un estimador insesgado de . L.Q.Q.D.

144

b) V( X ) = V[ 1 2(1 )aX a X ] = a2 V( 1X ) + (1 – a)

2 V( 2X ) =

Reemplazando la varianza de las medias muestrales se obtiene:

V( X ) = a2

1

2

n

+ (1 – a)

2

2

2

n

= f(a)

Para hallar el valor de a que minimiza la varianza del estimador X , se toma

la derivada parcial de V( X ) con respecto a a y se iguala a cero. Así:

f’(a) = da

XdV )( = 2a

1

2

n

+ 2(1 – a)

2

2

n

(-1) = 0

Para resolver la ecuación anterior se divide entre 2σ2 en ambos miembros y se

tiene:

1n

a -

2

1

n

a = 0 → an2 + an1 = n1 → a =

21

1

nn

n

, punto crítico.

f’’(a) = 2

2 )(

da

XVd = 2

1

2

n

+ 2

2

2

n

.

Reemplazando el punto crítico encontrado en f’’(a) se tiene que:

f’’(a) = 21

2

n

+ 2

2

2

n

> 0 → a es un mínimo para la V( X ).

Por lo tanto el valor a = 21

1

nn

n

minimiza la varianza de X . Rpta.

13. En base a una muestra aleatoria de tamaño n de una distribución Poisson con

parámetro , se pide:

a) Determinar el estimador máximo verosímil del parámetro .

b) Es eficiente el estimador obtenido para el parámetro ?

Solución

Sea X1, X2, .... , Xn, una m.a. de una distribución X ~ Poisson( ). Entonces:

f (Xi, ) = !i

X

X

ei

, Xi = 0, 1, 2, …… Además: E(Xi) = = Var (Xi).

La función de verosimilitud es:

V() = f(X1, X2, X3 ,…, Xn) =

!!

1

1i

n

i

nXin

i i

X

X

e

X

ei

145

L = Ln V() = Ln

!1

1

i

n

i

nX

X

e

n

ii

L = !ln1

1

i

n

i

n

i

i XeLnnLnX

=

n

i

i

n

i

i XnLnX11

!ln

a) Determinación del estimador de :

01

n

XL

n

i

i

→

n

Xn

i

i

1 = x Rpta.

b) ¿Es eficiente el estimador de ?

Será eficiente si es insesgado y de varianza mínima.

E

n

n

nXE

n

n

i

n

i

i

11

1)(

1)(

Por lo tanto

= x es un estimador insesgado para .

Es de varianza mínima si: V(

) = B()

Vn

λ)λ(

, 2

),(ln

1)(

xfnE

B

f(X, ) = !X

eX

ln f(X, ) = X ln - ln e – ln X ! = X ln - - ln X !

)(1),(ln

XXXf

²

)²(),(ln

2

XXf

1)(

²

1)²(

²

1),(ln

2

2

XVXEXfE

Luego:

n

Vn

n

B

)(

.1

1)( .

Por lo tanto

= x es un estimador de varianza mínima.

146

Como

= x es un estimador insesgado y de varianza mínima, es un

estimador eficiente para .

14. En base a una muestra aleatoria de tamaño n de la distribución geométrica

determine el estimador máximo verosímil del parámetro p.

Solución

Sea X1, X2, .... , Xn, una m.a. de una variable X ~ Geométrica (p). Entonces:

1( ) (1 ) ; 1,2,3,.... 1,2,3,....,X

X i if X p p X i n

Luego la función de verosimilitud será:

11

1 2

1

( ) ( , ,...., ) (1 ) (1 )

n

i

i i

n X nX n

n

i

V p f X X X p p p p

L = Ln V(p) = Ln

n

i

i nXn pp 1)1( = )1(

1

pLnnXpLnnn

i

i

01

1

p

nX

p

n

p

L

n

i

i

→ X

X

np

n

i

i

1ˆ

1

Rpta.

15. En base a una muestra aleatoria de tamaño n de una distribución normal N(µ, σ2

) se pide:

a) Determinar el estimador máximo verosímil de µ y σ2.

b) Es eficiente el estimador del parámetro µ?

Solución

Sea X1, X2, .... , Xn, una m.a. de una distribución X ~ N(μ , σ2 ) . Entonces:

niXeXf i

X

i

i

,....,2,1;;2

1)(

2

2)(

2

1

2


V(,²) = f(X1, X2, X3 ,…, Xn) =

n

i

X i

e1

)(2

1

2

2

2

2

1

=

n

i

iXn

e 1

2

2)(

2

12

22

1

L = Ln V(,²) = Ln

n

i

iXn

e 1

2

2)(

2

12

22

1

147

= eLnXLnLnn

i )²(²2

1)2²(1

2

L =

n

i

iXLnn

Lnn

1

)²(²2

12

2²

2

a) Determinación del estimador de μ

0)()1()2(²2

1

1

n

i

iXL

Luego: 0)(1

n

i

iX ó 01

n

i

i nX

Por lo tanto:

μ = Xn

Xn

i

i

1 Rpta.

Determinación del estimador de σ2

n

i

iXnL

12

)²(²)²(2

1

²2

= 0 →

²2

)²(²)²(2

1

1

nXi

n

i

→ ²2

²)²(2)²(

1

n

Xn

i

i

→ n

Xin

i

1

2)(

²

Rpta.

b) ¿Es eficiente el estimador de μ?

Será eficiente si es insesgado y de varianza mínima.

n

nXE

nXE

nn

X

XEn

i

i

n

i

i

n

i

i

)(11

)(11

1

Por lo tanto

μ = X es un estimador insesgado para μ.

Es de varianza mínima si: n

XV

xfnE

B2

2)(

),(ln

1)(

f(X, ) =

2

2

1

2 2

1

X

e

Ln f(X,) = Ln1-Ln eLnX

2

2

2

12

148

= - Ln

2

2

2

12

X

)1)(()2(²2

1),(ln

XXf =

²

)(

X

B2

²

)(

1)(

XEn

= nnX

En

²

²)(²)²(

1

²)²(

)²(

1

=

)(XV

Por lo tanto

μ = X es un estimador de varianza mínima.

Como

μ = X es un estimador insesgado y de varianza mínima, es un

estimador eficiente para μ. Rpta.

16. En base a una muestra aleatoria de tamaño n de la distribución de Pareto

determine el estimador máximo verosímil del parámetro B.

Solución

Sea X1, X2, .... , Xn, una m.a. de una variable X ~ Pareto (B) . Entonces:

001

( ) , , 1,2,....,B

X i iB

i

BXf X X X i n

X . Donde: B = Coeficiente de Pareto > 0 y

Xo = Ingreso mínimo.


0 01 2 n 1

11

1

V(B) = f(X , X , ....,X ) = B n nBn

nBBi ii

i

BX B X

XX

00

1 1

1

L = Ln V(B) = ( 1)n nB n

inB ii

i

B XLn n LnB nB LnX B Ln X

X

0

11

0 0 XLnnXLnB

nXLnXLnn

B

n

B

L n

i

i

n

i

i

)/( 0

11

0

1

XXLnXLnXLnB

n n

i

i

n

i

n

i

i

149

)/(

ˆ

0

1

XXLn

nB

n

i

i

Rpta.

17. En base a una muestra aleatoria de tamaño n de una distribución Lognormal con

parámetros (µ, σ2). Se pide:

a) Determinar el estimador máximo verosímil de los parámetros µ y σ2.

b) Se sabe que el ingreso familiar anual (en miles de soles) tiene

aproximadamente distribución Lognormal. Determine una estimación de µ

con los ingresos de 20 familias escogidas al azar siguientes:

10 50 40 8 12 15 10 25 14 32

18 61 16 9 11 19 21 27 25 30

Solución

Sea X1, X2, .... , Xn, una m.a. de una variable X ~ Lognormal (µ, σ2). Entonces:

2 2( n ) / 2

2

1( ) ; 0,

2

iL X

X i i

i

f X e XX

i = 1, 2, ...., n.

Luego la función de verosimilitud será:

V(µ, σ2) = 1 2( , ,...., )nf X X X

2 2( n ) / 2

21

1

2

i

nL X

ii

eX

=

=

2 2

1

( n ) / 22

2

1

1 1; 0,

2

n

i

i

nL X

in

i

i

e X

X

i = 1, 2, 3, .... , n.

L = Ln V(,²) = Ln

2 2

1

( n ) / 22

2

1

1 1

2

n

i

i

nL X

n

i

i

e

X

=

eLnXLnLnLnn

XLnLn i

n

i

i )²(²2

1)2²(1

21

1

L =

n

i

i

n

i

i XLnLnn

Lnn

XLn11

)²(²2

12

2²

2

a) Determinación del estimador de μ

0)()1()2(²2

1

1

n

i

iXLnL

150

Luego: 0)(1

n

i

iXLn ó 01

n

i

i nXLn

Por lo tanto:

μ =n

XLnn

i

i1 Rpta.

Determinación del estimador de σ2

n

i

iXLnnL

12

)²(²)²(2

1

²2

= 0 →

→ ²2

)²(²)²(2

1

1

nXiLn

n

i

→ ²2

²)²(2)²(

1

n

XLnn

i

i

Por lo tanto: n

XiLnn

i

1

2)(

²

Rpta.

b) Estimación de µ con los ingresos de las 20 familias:

μ =20

3025....4050101 LnLnLnLnLn

n

XLnn

i

i

= 2.9538 Rpta.

18. Basados en una muestra aleatoria de tamaño n, hallar el estimador de momentos

para el parámetro , de la distribución de Poisson.

Solución

Sea X1, X2, .... , Xn, una muestra aleatoria de una variable X ~ Poissón ()

Como hay un solo parámetro a estimar, basta plantear una ecuación basada en el

primer momento.


Sabemos que para la distribución Poisson E(X) = . Entonces:

Xn

X

XEn

X

M

n

i

i

n

i

i

11'

1ˆ)( Rpta.

19. Sea X una variable aleatoria con distribución uniforme en el intervalo [-a , 3a].

Hallar el estimador de a por el método de los momentos, basado en una muestra

aleatoria de tamaño n de X.

Solución

151

Sea X1, X2, .... , Xn, una muestra aleatoria de una variable X ~ uniforme en el

intervalo [ -a , 3a ]. Como el único parámetro es a, basta plantear una ecuación

basada en el primer momento.


Sabemos que para la distribución uniforme en el intervalo [a, b], E(X) = (a +

b)/2. Luego: en el intervalo [ -a , 3a ], E(X) = a. Por lo tanto:

Xn

X

aaXEn

X

M

n

i

i

n

i

i

11'

1 ˆ)( Rpta.


para los parámetros y σ2 de la distribución de normal.

Solución

Sea X1, X2, .... , Xn, una muestra aleatoria de una variable X ~ N(, σ2). Como

la distribución tiene dos parámetros, es necesario igualar los dos momentos

muestrales y poblacionales correspondientes. Es decir:

M1’ = E (X) ….. (1)

M2’ = E (X2) …. (2)

En la distribución normal E (X) = y E (X2) = σ

2 +

2. Reemplazando en las

ecuaciones anteriores se tiene:

En (1): Xn

X

XEn

X

M

n

i

i

n

i

i

11'

1 ˆ)( Rpta.

En (2): 2221

2

'

2 )( XE

n

X

M

n

i

i

Como la media muestral es un estimador de la media poblacional , la

reemplazamos en la expresión anterior para hallar el estimador de σ2.

n

X

X

n

i

i 1

2

2222

n

XX

n

XnX

Xn

Xn

i

i

n

i

i

n

i

i

1

2

1

22

21

2

2

)(

Rpta.

152

4.7 PROBLEMAS PROPUESTOS

1. Si X1, y X2 son variables aleatorias independientes con: E(X1) = 4, E(X2) = 2,

V(X1) = 8 y V(X2) = 4. Siendo 1 = 2X1 – 3 X2 y 2 = 3 X2 - X1 dos

estimadores de ϴ, ¿cuál de los estimadores es más eficiente?

2. Suponga que tiene una muestra de tamaño n de una población X con E(X) = µ y

Var(X) = σ2. Sean

2

11

2

n

i

i

X

Xn

y 1

2

n

i

i

X

Xn

dos estimadores de µ, ¿cuál es

el mejor estimador de µ?

3. Los pesos netos (grs.) en una muestra aleatoria simple de diez latas de conserva

fueron los siguientes: 159, 162, 159, 158, 156,157, 157, 163, 158, 161

a) ¿Cuál es la estimación puntual del peso neto medio poblacional de las latas de

conserva?

b) ¿Cuál es la estimación puntual de la desviación estándar poblacional del peso

neto de las latas de conserva?

4. Realizada una encuesta de opinión, a una muestra aleatoria simple de 800

ciudadanos, en la pregunta, ¿Está usted de acuerdo con la gestión del Alcalde de

la ciudad? 260 responden que Sí, 440 que No y el resto No sabe/No opina.

a) ¿Cuál es la estimación puntual de la proporción de la población que Si está de

acuerdo con la gestión del Alcalde de la ciudad?

b) ¿Cuál es la estimación puntual de la proporción de la población que No está de

acuerdo con la gestión del Alcalde de la ciudad?

5. Sea X1, X2, …. , X10 una muestra aleatoria de una población con media µ y

varianza 2. Considere los siguientes estimadores de µ:

1 = (X1 + X2 + …. + X10 ) / 10 ; 2 = ( X1 + 3 X5 - X10 ) / 3

a) ¿Son estimadores insesgados? y b) ¿Cuál es mejor estimador de µ?

6. Sean 1 y 2 dos estimadores de con E ( 1) = , E ( 2) = /3, Var ( 1 ) = 8,

Var ( 2 ) = 2. ¿Cuál es mejor estimador de ? ¿por qué?

153

7. Suponga que 1 y 2 son 2 estimadores de β con: E ( 1 ) = β /2, E ( 2 ) = β

/3, Var ( 1 ) = 4 y Var ( 2 ) = 3. ¿Cuál es mejor estimador de β? ¿Por

qué?

8. Si 1 y 2 son estimadores independientes insesgados de un parámetro

desconocido β, con varianzas conocidas 2

1 y 2

2 respectivamente:

a) Demostrar que = k 2 + (1 – k ) 1 también es un estimador insesgado de

β, para cualquier valor de k;

b) Encontrar el valor de k que minimiza la varianza de .

9. Sea Y una variable aleatoria con media y varianza σ2. Dadas dos muestras

aleatorias de tamaños n1 y n2 con medias muestrales 1 2y y y respectivamente.

a) Demostrar que: 2 1(1 )Y b y b y , 0 ≤ b ≤ 1, es estimador insesgado de .

b) Asumiendo que 1 2y y y son independientes, hallar el valor de b que

minimiza la varianza de Y .

10. En base a una muestra aleatoria de tamaño m de la distribución binomial con

parámetros n y p, determine el estimador máximo verosímil de dichos

parámetros.

11. En base a una muestra aleatoria de tamaño n de la distribución de Pascal o

binomial negativa, determine el estimador máximo verosímil del parámetro p.

12. En base a una muestra aleatoria de tamaño n de la distribución gamma con

parámetros α = 2 y β, determine el estimador máximo verosímil del parámetro β.

13. En base a una muestra aleatoria de tamaño n de la distribución exponencial con

parámetro λ, se pide:

a) Determinar el estimador máximo verosímil del parámetro λ.

b) Es eficiente el estimador obtenido para el parámetro ?


para el parámetro p, de la distribución Bernoulli.


para el parámetro p, de la distribución Geométrica.

16. Basados en una muestra aleaatoria de tamaño m, hallar el estimador de

momentos para el parámetro p, de la distribución binomial.

154


para el parámetro p, de la distribución Pascal o binomial negativa.

18. Sea X una variable aleatoria con distribución uniforme en el intervalo [-2, 2a].

Basado en una muestra aleatoria de tamaño n, halle el estimador de a por el

método de los momentos.

19. En base a una muestra aleatoria de tamaño n de la distribución gamma con

parámetros α = 2 y β, determine el estimador de momentos del parámetro β.

20. En base a una muestra aleatoria de tamaño n de la distribución de Pareto

determine el estimador de momentos del parámetro B.

155

Capítulo 5. ESTIMACIÓN POR INTERVALOS DE

CONFIANZA

“Quien hace que las cosas difíciles parezcan fáciles, es el educador”

Emerson

CONTENIDO

5.1 Intervalo de confianza para la media y tamaño de muestra.

5.2 Intervalo de confianza para el total (conocida la media).

5.3 Intervalo de confianza para la proporción y tamaño de muestra.

5.4 Intervalo de confianza para el total (conocida la proporción).

5.5 Intervalo de confianza para la diferencia de medias.

5.6 Intervalo de confianza para la diferencia de proporciones.

5.7 Intervalo de confianza para la media (n < 30).

5.8 Intervalo de confianza para la varianza.

5.9 Intervalo de confianza para la razón de varianzas.

5.10 Intervalo de confianza para la diferencia de medias (n y m <30).



En el capítulo anterior se establecieron una serie de procedimientos para determinar

estimadores y estimaciones de los parámetros a través de un solo valor, buscando

también algunas bondades para dichos estimadores.

En este capítulo, se presenta los aspectos fundamentales de la estimación por

intervalos de confianza, es decir la aproximación al valor del parámetro a través de

un rango de valores, como un complemento de la estimación puntual.

Cuando inferimos usando muestras, no tenemos garantía de que la conclusión

obtenida sea exactamente correcta. Sin embargo, la estadística permite cuantificar el

grado de confiabilidad y el error asociado a la estimación (la precisión de la

estimación).

El objetivo de la estimación por intervalos de confianza es usar una muestra para

obtener un rango de posibles valores para el parámetro y sean los que mejor lo

representan.

156

Definición.- El procedimiento de determinar un intervalo [a, b] que comprenda un

parámetro poblacional θ con cierta probabilidad 1 - α, se llama estimación por

intervalos. En general, para cualquier parámetro θ y su estimador , el intervalo de

confianza será:

21

ˆˆ

ˆˆ)ˆˆ()(1

kkPkkPbaP

Donde:

a = Límite inferior del intervalo de confianza.

b = Límite superior del intervalo de confianza.

k = una constante positiva que corresponde al valor de la distribución del estimador

para una probabilidad 1 – α.

1 - α = Nivel de confianza (probabilidad de que el parámetro poblacional este

comprendido en el intervalo) cuyo valor se toma de 0.90, 0.95 o 0.99.

Ejemplo 1.-

Sí 1 – α = 0.95 se dice que se tiene un intervalo de confianza del 95% y que la

probabilidad de que el intervalo contenga el verdadero valor del parámetro es del

95%. Es decir, que si para muestras distintas y bajo el mismo procedimiento se

construye el intervalo repetidamente, 95 de cada 100 de estos intervalos, contendrá el

parámetro y 5 de ellos no.

Se puede pensar que 1 significa certeza, seguridad y α significa riesgo. La seguridad

menos el riesgo, es decir 1 - α da, por lo tanto, el coeficiente de confianza de nuestras

afirmaciones.

En el caso anterior, se tiene una confianza de que 95 de cada 100 intervalos que se

extraigan como muestra, contendrán el verdadero valor del parámetro. Pero una vez

determinado el intervalo, es decir, una vez calculados numéricamente los extremos,

ya no debe hablarse en términos de confiabilidad ni en términos probabilísticos, pues

la situación pasa a ser completamente determinística. De tal manera, asociado a un

intervalo de confianza ya calculado, se tiene una probabilidad 0 ó 1 de que contenga

al parámetro a estimar y no hay otra opción, ya que lo contiene o no lo contiene.

157

Resumiendo, los extremos del intervalo son variables aleatorias, mientras que el

parámetro a determinar es constante.

Los pasos a seguir para construir intervalos de confianza para un parámetro, son:

1. Fijar el nivel de confianza 1 – α que se desea en la estimación.

2. Extraer la muestra y calcular el o los estadísticos necesarios.

3. Determinar la distribución muestral (normal estándar Z, t, chi cuadrado, F, etc.)

que tiene el estadístico empleado, el mismo que debe ser una función del

estimador y del parámetro, es decir f ( , θ).

4. Conocida la distribución del estadístico y el nivel de confianza, se establece la

relación: 1 – α = P[ d1 f ( , θ) d2 ]. Donde d1 y d2 son valores obtenidos de

acuerdo a la distribución muestral.

5. Dentro de la probabilidad se trabaja las desigualdades de modo tal que al centro

quede el parámetro θ y en los extremos los límites inferior y superior de confianza

buscados, dependiendo del estimador y de los valores d1 y d2.

Se verán los casos paramétricos, es decir aquellos en los que se tiene conocimiento

del tipo de distribución de la población o del estimador (Bernoulli, Binomial,

Poisson, Normal, t, chi-cuadrado, F, etc.) los mismos que estudiamos en los capítulos

2 y 3.

Trabajaremos primero un Caso General con muestras grandes (n ≥ 30) los intervalos

de confianza para la media , la proporción P, la diferencia de medias X - Y, la

diferencia de proporciones P1 – P2, los totales conocida la media y la proporción, ya

que sus estimadores tienen distribución normal y la determinación de los intervalos

de confianza para cada uno de ellos es similar.

Es decir, que sí ~ N[θ, 2

] entonces:

ˆ

ˆ Z ~ N ( 0, 1 ). Así tenemos:

Media: )/,( 2 nNX y n

XZ

/

)(

~ N(0,

1).

Total: 22,ˆˆX

NNNXNNX y X

N

NXNZ

~ N(0, 1)

158

Dif. Medias: X - Y ~ N( YX , 2

YX ) y

YX

YXYXZ

)( ) ~ N(0 , 1)

Proporción:

n

PQPN

n

X

n

X

p

n

i

i

,1 y

n

PQ

PpZ ~ N(0, 1)

Total: 22,ˆˆpNNPNNpPNA y

pN

NPNpZ

~ N(0, 1)

Dif. Proporc.: p1 – p2 ~ N(P1 – P2 , 2

21 pp ) y

21

)( 2121

pp

PPppZ

~ N(0 ,

1)

Para todos ellos, dado un nivel de confianza 1 – α es posible hallar:

1 – α = P [ - Z0 Z Z0 ] ..................... (1)

Donde los valores Z0 son simétricos, de modo tal que centralizan la probabilidad 1 -

α y se determinan como Z0 =

21

Z , cuyos valores son ubicados en la tabla de la

distribución normal estándar. Así tenemos:

1 - α 1 – α/2 Z0 =

21

Z

0.90 0.95 Z0 = Z0.95 = 1.645

0.95 0.975 Z0 = Z0.975 = 1.96

0.99 0.995 Z0 = Z0.995 = 2.575

Reemplazando la v.a.

ˆ

ˆ Z en (1) y trabajando con la desigualdad buscando

dejar al centro el parámetro θ, la probabilidad queda como:

1 – α = P [ - Z0 Z Z0 ] = P [ - 2

1

Z

ˆ

ˆ

21

Z ]

Multiplicando por el error estándar del estimador

ˆ en la desigualdad:

159

1 – α = P [ -

21

Z

ˆ - θ

21

Z

ˆ ]

Restando el estimador en la desigualdad

1 – α = P [- -

21

Z

ˆ - θ - +

21

Z

ˆ ]

Multiplicando por (-1) y manteniendo el sentido de la desigualdad, se tiene:

1 – α = P [ -

21

Z

ˆ θ +

21

Z

ˆ ]

A partir del cual se obtiene el intervalo de confianza para el parámetro θ, cuyo

estimador ~ N[θ, 2

], siguiente:

El parámetro θ [ - Z0 ˆ , + Z0

ˆ ] con el 100 (1 – α) % de confianza.

Donde el error de estimación es E = ± Z0 ˆ .

Resumimos el Caso General, señalando que para obtener intervalos del 100 (1 - α)%

de confianza para parámetros θ, cuyo estimador sigue distribución normal ~ N[θ,

2

], al valor del estimador se le debe restar o sumar el error de estimación E = ±

Z0 ˆ .

Utilizando este resultado veamos rápidamente la determinación de intervalos de

confianza para los parámetros poblacionales: la media, la diferencia de medias, la

proporción, la diferencia de proporciones y los totales.

Media :

XX

ZXZX

21

21

,

Total :

XX

ZNXNZNXNN

21

21

,

Proporción :

pp ZpZpP

21

21

,

Total :

pp ZNpNZNpNPN

21

21

,

160

Dif. Medias :

YXYXYX ZYXZYX

21

21

)(,)(

Dif. Proporc. :

2121

21

21

21

2121 )(,)( pppp ZppZppPP

5.1 INTERVALO DE CONFIANZA PARA LA MEDIA Y TAMAÑO DE

MUESTRA

Sea X1, X2, .............., Xn una muestra aleatoria de tamaño n de una población X

distribuida con media desconocida y varianza 2 conocida.

Sabemos que el estimador de la media poblacional , es la media muestral , y

que para n suficientemente grande (n ≥ 30) por el teorema central del límite:

)/,( 2 nNX y n

XZ

/

)(

~ N(0, 1).

Entonces, para un nivel de confianza 1 – α, se tiene que:

1 – α = P [ - z0 Z z0 ] =

2

12

1 /

Z

n

XZP

Trabajando como en el caso general y dejando al centro de la desigualdad el

parámetro poblacional , se obtiene:

1 – α =

nZX

nZXP

21

21

A partir del cual se deduce el intervalo de confianza para la media poblacional

siguiente:

nZX

nZX

21

21

, con el 100 (1 – α ) % de confianza.

Si las muestras se toman sin reposición de una población finita de tamaño N,

debe emplearse el factor de corrección por finitud y el intervalo será:

1,

12

12

1 N

nN

nZX

N

nN

nZX

al 100(1 – α ) % de

confianza.

161

Donde el error de estimación E para la media es:

12

12

1

N

nN

nZEó

nZE

La longitud del intervalo de confianza para la media es 2E.

Ejemplo 2

Se hace un estudio de mercado, para determinar la venta promedio de una

nueva marca de gaseosas, durante un mes en una cadena de tiendas. Los

resultados para una muestra de 36 tiendas indicaron ventas promedio de S/1000

con una desviación estándar de S/120. Calcule e interprete un intervalo de

confianza del 95% para la verdadera venta promedio en la cadena de tiendas.

Solución

= 1000, S = 120, n = 36. En la tabla de la distribución normal

estándar, al 95% de confianza: Z0 = Z0. 975 = 1.96

Entonces:

Є [ ± Z0 n/ ] = [1000 ± 1.96x 120/6] = [1000 ± 39.20]

Luego: Є [960.80, 1039.20] S/. con el 95% de confianza. Rpta.

Interpretación: la verdadera venta media mensual de gaseosas, en la cadena de

tiendas, se encuentra entre S/ 960.80 y S/ 1039.20 con el 95% de confianza.

TAMAÑO DE MUESTRA PARA ESTIMAR LA MEDIA µ

Se sabe que: )/,( 2 nNX → n

E

n

XZ

//

)(

Elevando al cuadrado y despejando n se obtiene el tamaño inicial de muestra

siguiente:

2

22

0E

Zn

Donde:

Z = valor de la abscisa de la distribución normal estándar para un nivel de

confianza (1 – α) dado.

σ2 = varianza de la variable en estudio. Si se desconoce se estima con una

muestra pasada o reciente (S2).

162

E = | - µ| = error máximo permisible.

Si la fracción inicial de muestreo f = n0 / N ≤ 0.05 ó n0 ≤ 0.05N → n = n0.

Si f = n0 / N > 0.05 es necesario el factor de corrección para poblaciones

finitas y se ajusta el tamaño de muestra así:

N

n

nn

0

0

1

Ejemplo 3

En el estudio de mercado del ejemplo 2, para estimar la venta promedio

mensual de una nueva marca de gaseosas, ¿Qué tamaño de muestra debe

tomarse, si se desea que difiera de µ en menos de S/. 30, con el 95 % de

confianza?

Solución

Datos: S = 120, E = | - µ| = S/. 30 y según la tabla de la distribución normal

estándar, al 95% de confianza: Z = Z0. 975 = 1.96

Entonces:

2

22

2

22

030

12096.1 x

E

Zn

61 tiendas. Rpta.

5.2 INTERVALO DE CONFIANZA PARA EL TOTAL (conocida la media)

Sea X1, X2, .............., Xn una muestra aleatoria de tamañazo n de una población X

de tamaño N, distribuida con media desconocida y varianza 2 conocida.

Sabemos que el estimador del total poblacional X = N , es N , y que para n

suficientemente grande (n ≥ 30) por el teorema central del límite:

22,ˆˆX

NNNXNNX y X

N

NXNZ

~ N(0, 1)


163

1 – α = P [ - z0 Z z0 ] =

2

12

1 /

Z

nN

NXNZP

Trabajando como en el caso general y dejando al centro de la desigualdad el total

poblacional N , se obtiene:

1 – α =

nNZXNN

nNZXNP

21

21

A partir del cual se deduce el intervalo de confianza para el total poblacional N

siguiente:

nNZXN

nNZXNN

21

21

, con el 100 (1 – α ) % de

confianza.



1,

12

12

1 N

nN

nNZXN

N

nN

nNZXNN

al 100(1 – α ) % de confianza.

Observe que si se quiere construir intervalos de confianza para el total

poblacional, basta con multiplicar por N los límites encontrados para la media

poblacional; y viceversa, si se conoce el intervalo de confianza para el total

poblacional, entonces dividirlo entre N para determinar los intervalos para la

media poblacional.

Ejemplo 4

En el ejemplo 2, si el número de tiendas de la cadena es 1000, calcule e

interprete un intervalo de confianza del 95% para determinar el monto total

mensual de las ventas de la nueva marca de gaseosas en la cadena de tiendas.

Solución

164

En el ejemplo 2, se ha determinado que la verdadera venta media mensual de

gaseosas en la cadena de tiendas es: Є [960.80, 1039.20] S/. con el 95% de

confianza.

Entonces, para hallar los límites de confianza para la real venta total mensual

de gaseosas, se multiplica a los límites anteriores por 1000. Es decir,

T = N Є [(1 000x 960.8) , (1 000x1039.2)]

T = N Є [960 800, 1 039 200] S/. con el 95% de confianza.

Interpretación: el monto total mensual por la venta de gaseosas se encuentran

entre S/. 960 800 y 1 039 200 con el 95% de confianza.

5.3 INTERVALO DE CONFIANZA PARA LA PROPORCIÓN Y TAMAÑO

DE MUESTRA

Sea X1, X2, ..............,Xn una muestra aleatoria de tamañazo n de una población

binomial X con parámetro P.

Sabemos que el estimador de la proporción poblacional P , es la proporción

muestral p, y que para n suficientemente grande (n ≥ 30) por el teorema central del

límite:

n

PQPN

n

X

n

X

p

n

i

i

,1 y

n

PQ

PpZ ~ N(0, 1)


1 – α = P [ - Z0 Z Z0 ] =

21

21

Z

n

PQ

PpZP

Trabajando como en el caso general y dejando al centro de la desigualdad la

proporción poblacional P, se obtiene:

1 – α =

n

PQZpP

n

PQZpP

21

21

Luego el intervalo de confianza para la proporción poblacional P es:

165

n

PQZp

n

PQZpP

21

21


Como los valores poblacionales P y Q = 1 - P se desconocen, se estiman mediante

p y q = 1 - p, resulta entonces el intervalo de confianza para la proporción

poblacional P siguiente:

n

pqZp

n

pqZpP

21

21




1,

12

12

1 N

nN

n

pqZp

N

nN

n

pqZpP al 100 (1 – α ) % de conf.

TAMAÑO DE MUESTRA PARA ESTIMAR LA PROPORCIÓN P

Se sabe que:

n

PQPN

n

X

n

X

p

n

i

i

,1 →

n

PQ

E

n

PQ

PpZ

Elevando al cuadrado y despejando n se obtiene el tamaño inicial de muestra

siguiente:

2

2

0E

PQZn

Donde:

Z = valor de la abscisa de la distribución normal estándar para un nivel de

confianza (1 – α) dado.

P = proporción de éxitos para la variable en estudio. Si se desconoce se estima

con una muestra pasada o reciente (p). Q = 1 – P.

E = |p - P| = error máximo permisible.

Si la fracción inicial de muestreo f = n0 / N ≤ 0.05 ó n0 ≤ 0.05N → n = n0.

Si f = n0 / N > 0.05 es necesario el factor de corrección para poblaciones

finitas y se ajusta el tamaño de muestra así:

N

n

nn

0

0

1

166

Ejemplo 5

El auditor de una dependencia gubernamental de protección del consumidor,

quiere determinar la proporción de reclamos sobre pólizas de enfermedades

que paga el seguro, en un plazo de dos meses de haber recibido el reclamo. Se

selecciona una muestra aleatoria de 200 reclamos y se determina que 80 fueron

pagados en un plazo de 2 meses después de recibidos. a) Calcule e interprete

un intervalo del 99 % de confianza para la proporción real de reclamos pagados

dentro de ese plazo de dos meses; y b) Con un 95% de confianza, ¿qué tamaño

de muestra (reclamos) será necesario si desea cometer un error máximo del

5%?

Solución

a) n = 200, X = 80, 1 – α = 0.99, Z0 = Z 0.995 = 2.575

p = proporción muestral de reclamos pagados en el plazo de dos meses.

4.0200

80

n

Xp , q = 1 – p = 0.6

El intervalo de confianza para la verdadera proporción poblacional P de

reclamos pagados en plazo de dos meses, es:

n

pqZp

n

pqZpP

21

21

,

Reemplazando valores se tiene:

P ϵ [ 0.40 – 2.575 200

60.040.0 x; 0.40 + 2.575

200

60.040.0 x ]

P ϵ [ 0.40 – 0.089 ; 0.40 + 0.089 ]

Por lo tanto: P ϵ [ 0.311 ; 0.489 ] con el 99% de confianza. Rpta.

Interpretación.- la verdadera proporción (porcentaje) de reclamos, sobre pólizas

pagadas dentro del plazo de dos meses de haber recibido el reclamo, se encuentra

entre 0.311 y 0.489 (31.1% y 48.9%) con el 99% de confianza.

b) Datos: p = 0.40, q = 0.60, E = |p - P| = 0.05 y según la Tabla 1 de la

distribución normal estándar, al 95% de confianza: Z = Z0. 975 = 1.96

Entonces:

2

2

2

2

0)05.0(

60.040.096.1 xx

E

pqZn 369 reclamos. Rpta.

167

5.4 INTERVALO DE CONFIANZA PARA EL TOTAL (conocida la

proporción)

Sea X1, X2, ..............,Xn una muestra aleatoria de tamañazo n de una población

binomial X con parámetro P.

Sabemos que el estimador del total poblacional A = NP, es Np, y que para n

suficientemente grande (n ≥ 30) por el teorema central del límite:

22,ˆˆpNNPNNpPNA y

pN

NPNpZ

~ N(0, 1)


1 – α = P [ - Z0 Z Z0 ] =

21

21

Z

n

PQN

NPNpZP

Trabajando como en el caso general y dejando al centro de la desigualdad el total

poblacional NP, se obtiene:

1 – α =

n

PQZNpNPN

n

PQZNpNP

21

21

A partir del cual se deduce el intervalo de confianza para el total poblacional NP

siguiente:

n

PQZNpN

n

PQZNpNNP

21

21

, con el 100 (1 – α ) % de

confianza.

Como los valores poblacionales P y Q se desconocen, se estiman por p y q, resulta

entonces el intervalo de confianza para el total poblacional NP siguiente:

n

pqZNpN

n

pqZNpNNP

21

21

, con el 100 (1 – α ) % de

confianza.



1,

12

12

1 N

nN

n

pqNZNp

N

nN

n

pqNZNpNP al 100 (1 – α ) % de

confianza.

168

Observe que si se quiere construir intervalos de confianza para el total poblacional,

basta con multiplicar por N los límites encontrados para la proporción poblacional; y

viceversa, si se conoce el intervalo de confianza para el total poblacional, entonces

dividirlo entre N para determinar los intervalos para la proporción poblacional.

Ejemplo 6

En el problema 6, si en la dependencia gubernamental de protección del

consumidor hay 5 000 reclamos sobre pólizas de enfermedades que paga el

seguro, en un plazo de dos meses de haber recibido el reclamo. Calcule e

interprete un intervalo del 99% de confianza para el total verdadero de

reclamos pagados dentro de ese plazo de dos meses.

Solución

En el ejemplo 6, se ha determinado que la verdadera proporción de reclamos,

sobre pólizas pagadas dentro del plazo de dos meses de haber recibido el

reclamo, se encuentra entre 0.311 y 0.489 con el 99% de confianza. Entonces,

para hallar los límites de confianza para el total de reclamos pagados dentro del

plazo de dos meses, se multiplica a los límites anteriores por 5 000. Es decir,

A = N P Є [(5 000 x 0.311), (5 000 x 0.489)]

A = N P Є [1 555, 2 445 ] con el 99% de confianza. Rpta.

Interpretación: el verdadero total de reclamos, sobre pólizas pagadas dentro del plazo

de dos meses de haber recibido el reclamo, se encuentra entre 1 555 y 2 445 reclamos

con el 99% de confianza.

5.5 INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS

Sea X1, X2, ..............,Xn una muestra aleatoria de tamañazo n de una población X de

tamaño N, distribuida con media X desconocida y varianza 2

X conocida.

Sea también Y1, Y2, ..............,Ym una muestra aleatoria de tamañazo m de una

población X de tamaño M, distribuida con media Y desconocida y varianza

2

Y conocida.

Sabemos que el estimador de la diferencia de medias poblacionales X - Y es la

diferencia de medias muestrales X - Y , y que para n y m suficientemente grandes

(n y m ≥ 30) por el teorema central del límite:

169

X - Y ~ N( YX , 2

YX ) y

YX

YXYXZ

)( ) ~ N(0 , 1)


1 – α = P [- Z0 Z Z0] =

2

12

1

)(

Z

YXZP

YX

YX

Trabajando como en el caso general y dejando al centro de la desigualdad el

parámetro poblacional X - Y, se obtiene:

1 – α =

YXYXYX ZYXZYXP

21

21

)()(

A partir del cual se deduce el intervalo de confianza para la diferencia de medias

poblacionales X - Y siguiente:

µX - µY

YXYX ZYXZYX

21

21

)(,)( al 100 (1- α)% de conf.

Donde, el error estándar de la diferencia de medias muestrales YX

= XY es:

mn

YXYX

22

o

11

22

M

mM

mN

nN

n

YXYX

Si se desconoce las varianzas poblacionales, se estiman con las varianzas

muestrales y el error estándar de la diferencia de medias muestrales YX es:

m

S

n

S YXYX

22

o

11

22

M

mM

m

S

N

nN

n

S YXYX

Ejemplo 7

Muestras del pago por hora a los choferes de camiones, en las ciudades X e Y,

proporcionan los siguientes datos:

X = $ 5.40, n = 30, SX = $ 0.16 y Y = $ 5.30, m = 30, SY = $

0.15.

a) Calcule e interprete un intervalo del 95 % de confianza para la diferencia

entre los pagos medios por hora a los choferes de camiones de las dos

ciudades.

b) ¿Son iguales los pagos medios por hora en ambas ciudades?

Solución

170

a) Un intervalo de confianza para la diferencia de pagos medios por hora a los

choferes de ambas ciudades viene dado por:

YXYXYX ZYXZYX

21

21

)(,)( ................ (1)

Si 1 – α = 0.95, entonces: Z0 = Z 0.975 = 1.96

30

)15.0(

30

)16.0( 2222

m

S

n

S YXYX

= $ 0.04

Reemplazando valores en (1):

X - Y Є [(5.40 – 5.30) – 1.96 (0.04) , (5.40 – 5.30) + 1.96 (0.04)]

Luego: X - Y Є [0.02, 0.18] $ con el 95% de confianza. Rpta.

Interpretación: la diferencia entre los pagos medios por hora a los choferes de

camiones de las dos ciudades se encuentra entre $ 0.02 y 0.18 con el 95% de

confianza.

b) Responder a la pregunta ¿Son iguales los pagos medios por hora en ambas

ciudades? implica responder si ¿ X = Y? o también ¿ X - Y = 0?

Si apreciamos el intervalo de confianza construido en a) X - Y no puede ser

cero, es decir X - Y ≠ 0 o X ≠ Y.

Por lo tanto, los pagos medios por hora en ambas ciudades son diferentes.

Rpta.

5.6 INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE

PROPORCIONES





11

n

Xp estima a P1 .

Suponga también que se extrae una muestra aleatoria simple de tamaño n2 de la

población binomial 2, de tamaño N2 con una proporción de éxitos igual a P2. Sea

X2 el número de éxitos en la muestra de tamaño n2 , entonces la proporción

muestral de éxitos p2 , definida como 2

22

n

Xp estima a P2 .

171

Para n1 y n2 suficientemente grande (n1 y n2 ≥ 30) por el teorema central del

límite:

p1 – p2 ~ N(P1 – P2 , 2

21 pp ) y

21

)( 2121

pp

PPppZ

~ N(0 , 1)


1 – α = P [ - z0 Z z0 ] =

2

1

2121

21

21

)(

Z

PPppZP

pp

Trabajando como en el caso general y dejando al centro de la desigualdad la

proporción poblacional P1 - P2 se obtiene:

1 – α =

2121

21

2121

21

21 )()( pppp ZppPPZppP

A partir del cual se deduce el intervalo de confianza para la diferencia de

proporciones poblacionales P1 - P2 siguiente:

P1 – P2

2121

21

21

21

21 )(,)( pppp ZppZpp al 100 (1 – α ) % de

conf.

Donde 21 pp =

12 pp se obtiene a partir de:

21 pp = 2

22

1

11

n

QP

n

QP ó

21 pp =

11 2

22

2

22

1

11

1

11

N

nN

n

QP

N

nN

n

QP

Como los proporciones poblacionales P1 , Q1 , P2 y Q2 se desconocen, se

estiman con las proporciones muestrales 1

11

n

Xp , q1 = 1 – p1 ,

2

22

n

Xp y q2

= 1 – p2 , resultando entonces:

21 pp =

2

22

1

11

n

qp

n

qp o

21 pp =

11 2

22

2

22

1

11

1

11

N

nN

n

qp

N

nN

n

qp

172

Ejemplo 8

Una empresa de estudios de mercado quiere estimar las proporciones de

hombres y mujeres que conocen un producto promocionado a escala nacional.

en una muestra aleatoria de 100 hombres y 200 mujeres se determina que 20

hombres y 60 mujeres están familiarizados con el artículo indicado. a)

Calcular el intervalo de confianza de 95 % para la diferencia de proporciones

de hombres y mujeres que conocen el producto. b) ¿Son iguales las

proporciones de hombres y mujeres que conocen el producto?

Solución

Sea el grupo 1, el referido a los hombres y el grupo 2, a las mujeres.

a) El intervalo de confianza para la diferencia de proporciones de hombres

(P1 ) y de mujeres (P2 ) que conocen el producto, P1 - P2 está dado por:

2121

21

21

21

2121 )(,)( pppp ZppZppPP ............... (1)

Si 1 – α = 0.95, entonces Z0 = 1.96

Como: n1 = 100, X1 = 20, n2 = 200 y X2 = 60

Entonces: 100

20

1

11

n

Xp = 0.20 y

200

60

2

22

n

Xp = 0.30

21 pp = 200

)70.0)(30.0(

100

80.0)(20.0(

2

22

1

11 n

qp

n

qp = 0.0515

Z021 pp = 1.96 (0.0515) = 0.1009

Reemplazando valores en (1) se tiene que:

P1 - P2 [(0.20 – 0.30) – 0.1009 ; (0.20 – 0.30) + 0.1009] = [0.10 ±

0.1009]

P1 - P2 [-0.2009 ; 0.0009] con el 95% de confianza. Rpta.

Interpretación: la diferencia de proporciones de hombres (P1) y de

mujeres (P2) que conocen el producto, está entre -0.2009 y 0.0009 con el

95% de confianza.

b) La pregunta ¿Son iguales las proporciones de hombres y mujeres que

conocen el producto? implica preguntar ¿P1 = P2? o también ¿P1 - P2 = 0?

173

La diferencia P1 - P2 = 0 está incluida en el intervalo de confianza construido

en a), puede ser cero, es decir P1 - P2 = 0 o P1 = P2.

Por lo tanto, las proporciones de hombres y mujeres que conocen el producto

son iguales. Rpta.

Veamos a continuación la construcción de intervalos de confianza para la

media poblacional y la diferencia de medias poblacionales, cuando se trabaja

con muestras pequeñas (n < 30), donde es necesario utilizar la distribución t

de student. El proceso de construcción es idéntico a los determinados

anteriormente.

5.7 INTERVALO DE CONFIANZA PARA LA MEDIA (n < 30)


X con distribución N(, ²), con varianza desconocida, al estudiar la

distribución t de student vimos que para muestras pequeñas, n < 30, la variable

aleatoria:

nS

XT

/

~ tn-1

Esta variable aleatoria depende de valores conocidos con la información

muestral, entonces, dado un nivel de confianza 1 – α es posible hallar:

1 – α = P [ - t0 T t0 ] ..................... (1)

Donde los valores t0 son simétricos, de modo que centralizan la probabilidad 1

- α y se determinan como t0 = 1,

21 nt , cuyos valores son ubicados en la tabla

de la distribución t de student.

Reemplazando la variable aleatoria nS

XT

/

en (1) y trabajando con la

desigualdad buscando dejar al centro el parámetro , la probabilidad queda

como:

1 – α = P [- t0 T t0 ] = P [ - t0 nS

X

/

t0]

Multiplicando por el error estándar del estimador nS / en la desigualdad:

174

1 – α = P [- t0 nS / X t0 nS / ]

Restando el estimador X en la desigualdad

1 – α = P [- X - t0 nS / - - X + t0 nS / ]

Multiplicando por (-1) y manteniendo el sentido de la desigualdad, se tiene:

1 – α = P [ X - t0 nS / X + t0 nS / ]

A partir del cual se obtiene el intervalo de confianza para el parámetro ,

[ X - t0 nS / , X + t0 nS / ] con el 100 (1 - α )% de confianza.

El intervalo de confianza para el total N se determina multiplicando el intervalo

de confianza para la media por el tamaño de la población N, obteniéndose:

N [N X - Nt0 nS / ; N X + Nt0 nS / ] con el 100 (1 - α )% de

confianza.

Ejemplo 9

Una Universidad grande (12 000 alumnos) quiere estimar el número

promedio de días de enfermedad de los estudiantes durante un año

académico; una muestra de 25 estudiantes indica que x = 5.2 días y S = 3.1

días.

Calcule e interprete intervalos de confianza del 95% Para: a) el verdadero número

medio de días de enfermedad de los estudiantes, y b) el verdadero número total

de días que los estudiantes se enferman en un año.

Solución

N = 12 000 alumnos, n = 25, x = 5.2 días y S = 3.1 días

Para 1 – α = 0.95 , t0 = t24 , 0.975 = 2.064

a) El intervalo de confianza para la media está dado por:

[ X - t0 nS / , X + t0 nS / ]

Reemplazando valores tenemos:

[5.2 – 2.064 x 25

1.3 , 5.2 + 2.064 x

25

1.3] = [5.2 ± 1.28]

Por lo tanto: [3.92 ; 6.48] días con el 95% de confianza.

Rpta.

175

Interpretación: en la Universidad el verdadero número medio de días de

enfermedad de los estudiantes en el año, se encuentra entre 3.92 y 6.48 días

con el 95% de confianza.

b) Para hallar el intervalo de confianza para el total se multiplica por N = 12 000

el intervalo de confianza para la media encontrado en a) y se obtiene:

Total = N [12 000 (3.92) , 12 000 (6.48) ]

Por lo tanto:

Total = N [47,040 ; 77,760 ] días con el 95% de confianza.

Rpta.

Interpretación: el verdadero número total de días que los estudiantes se

enferman en un año, se encuentra entre 47,040 y 77,760 días con el 95% de

confianza.

5.8 INTERVALO DE CONFIANZA PARA LA VARIANZA

Al estudiar la distribución chi-cuadrado determinamos que si X1, X2, ... , Xn es una

muestra aleatoria de tamaño n de una población normal con media y varianza ²,

entonces:

La función de la varianza muestral

²

²12

Snx

~ 2

1nx .



1 – α = P [ a 2x b ] ..................... (2)

Los valores a y b son valores chi-cuadrados, obtenidos en la tabla 2, con n – 1

grados de libertad, centralizando la probabilidad 1 - α y se determinan como:

a = 2

2,1

nx y b =

2

21,1

n

x ,

los mismos que son ubicados en la tabla 2, de la distribución chi – cuadrado.

Reemplazando la v.a.

²

²12

Snx

en (2) y trabajando con la desigualdad

buscando dejar al centro el parámetro ², la probabilidad queda como:

1 – α = P [ a 2x b ] = P [ a

²

²1

Sn b ]

176

Dividiendo entre (n – 1) S2 tenemos:

1 – α =

222 )1(

1

)1( Sn

b

Sn

aP

Tomando el inverso dentro de la probabilidad y buscando mantener el sentido

de la desigualdad, se tiene que:

1 – α =

a

Sn

b

SnP

22

2 )1()1(

Luego se tiene que el intervalo de confianza para la varianza ², está dado por:

²

a

Sn

b

Sn 22 )1(,

)1( =

2

2/,1

2

2

2/1,1

2 )1(,

)1(

nn x

Sn

x

Sn al 100 (1 – α)% de

confianza.

Un intervalo de confianza para la desviación estándar se obtiene sacando raíz

cuadrada a cada uno de los límites del intervalo anterior, entonces:

a

Sn

b

Sn 22 )1(,

)1( =

2

2/,1

2

2

2/1,1

2 )1(,

)1(

nn x

Sn

x

Sn al 100(1 – α)% de

confianza

Ejemplo 10

Para el ejemplo 9, en la Universidad grande se estudia el número de días que

los estudiantes se enferman durante el año académico, una muestra de 25

estudiantes indica que x = 5.2 días y S = 3.1 días.

Calcule e interprete intervalos de confianza del 95% para la varianza y la

desviación estándar del número de días que los estudiantes se enferman.

Solución

El intervalo de confianza para la varianza está dado por:

²

a

Sn

b

Sn 22 )1(,

)1(

Como n = 25 y 1 – α = 0.95, entonces:

a = 2

025.0,24x = 12.4 y b = 2

975.0,24x = 39.4

Se tiene además la desviación estándar muestral S = 3.1

177

Reemplazando valores en el intervalo de confianza para la varianza, se tiene que:

²

4.12

)1.3)(125(,

4.39

)1.3)(125( 22

Por lo tanto:

² [5.85 , 18.60 ] (días)² con el 95% de confianza. Rpta.

[ 2.42 , 4.31 ] (días) con el 95% de confianza. Rpta.

Interpretación: la varianza del número de días que los estudiantes enferman en la

Universidad durante el año académico, se encuentra entre 5.85 y 18.60 (días)² con

el 95% de confianza. Mientras que la desviación estándar esta entre 2.42 , 4.31

(días) con el 95% de confianza.

5.9 INTERVALO DE CONFIANZA PARA LA RAZÓN DE VARIANZAS

Cuando estudiamos la distribución F, encontramos que si se toman dos muestras

aleatorias independientes de tamaños n y m, de las poblaciones X ~ N (X ,

2

X ) e Y ~ N 2, YY , la distribución de probabilidades para la razón de

varianzas muestrales estaba dada por:

2

2

2

2

X

Y

Y

X

S

SF

~ F n – 1 , m - 1



1 – α = P [ c F d ] ..................... (3)

Los valores c y d son valores de la variable aleatoria F, de modo tal que

centralizan la probabilidad 1 - α y se determinan como:

c = 2

,1,1

mnF y d =

21,1,1

mn

F ,

los mismos que son ubicados en la tabla 4 de la distribución F.

Reemplazando la variable aleatoria 2

2

2

2

X

Y

Y

X

S

SF

en (3) y trabajando con la

desigualdad buscando dejar al centro el parámetro razón de varianzas

poblacionales 2

X / 2

Y , la probabilidad queda como:

1 – α = P [ c F d ] = P [ c 2

2

2

2

X

Y

Y

X

S

S

d ]

178

Multiplicando en la desigualdad por 2

2

X

Y

S

Sse tiene que:

1 – α = P [ c 2

2

X

Y

S

S

2

2

X

Y

d

2

2

X

Y

S

S ]

Tomando el inverso dentro de la probabilidad y buscando mantener el sentido de la

desigualdad, obtenemos:

1 – α = P [ 2

21

Y

X

S

S

d

2

2

Y

X

2

21

Y

X

S

S

c ]

1 – α = P [ 2

2

21,1,1

1

Y

X

mnS

S

F

2

2

Y

X

2

2

2,1,1

1

Y

X

mnS

S

F

]

Entonces, el intervalo de confianza para la razón de varianzas 2

X / 2

Y , está dado

por:

2

2

Y

X

c

SS

d

SS YXYX

2222 /;

/ =

2

,1,1

22

21,1,1

22 /;

/

mn

YX

mn

YX

F

SS

F

SS al 100 (1 – α)% de

conf.

Ejemplo 11

Se hacen 16 ensayos para cada uno de los tratamientos X e Y, con las siguientes

varianzas maestrales 2

XS = 35 y 2

YS = 10. a) Calcule e interprete un intervalo del

95% de confianza para 2

X / 2

Y b) ¿Son iguales las varianzas poblacionales de X

e Y?

Solución

a) El intervalo de confianza solicitado es: 2

2

Y

X

c

SS

d

SS YXYX

2222 /;

/

Datos: n = m = 16, 2

XS = 10, 2

YS = 35. Como 1 – α = 0.95,

entonces d = F15 , 15 , 0.975 = 2.86 y c = F15 , 15 , 0.025 = 1/ F15 , 15 , 0.975 = 1/ 2.86 =

0.349.

Reemplazando valores en el intervalo se tiene que:

179

2

2

Y

X

349.0

10/35;

86.2

10/35 = [1.22; 10.03] con el 95% de confianza. Rpta.

Interpretación: la razón de varianzas de las poblaciones X e Y se encuentra entre

1.22 y 10.03 con el 95% de confianza.

b) Preguntar si ¿Son iguales las varianzas poblacionales de X e Y? es similar a

preguntar si ¿ 2

X = 2

Y ? o también si ¿2

2

Y

X

= 1?

Para responder a esto último, basta con observar si el valor 1 se encuentra en el

intervalo construido. Como el valor 1 no pertenece al intervalo de confianza,

entonces: 2

2

Y

X

≠ 1 2

X ≠ 2

Y .

Por lo tanto, las varianzas poblacionales de X e Y no son iguales.

Rpta.

Si en el intervalo de confianza para la razón de varianzas 2

2

Y

X

= 1, las varianzas

son iguales (homogéneas) caso contrario, son diferentes (heterogéneas)

5.10 INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS

(n y m <30)

Cuando se quiere determinar intervalos de confianza para la diferencia de

medias con muestras aleatorias independientes pequeñas (n y m < 30) se tiene

que tomar en cuenta si las varianzas de las poblaciones normales de donde se

extraen son homogéneas o heterogéneas, usando el intervalo de confianza

para la razón de varianzas propuesto en el acápite anterior.

A) Caso de varianzas homogéneas (2

X = 2

Y = ²)

Sea X1, X2, ..., Xn una muestra aleatoria de tamaño n, de una variable

aleatoria X con distribución N(X, ²). Sea también Y1, Y2, ..., Ym una

muestra aleatoria de tamaño m de una variable aleatoria Y, con distribución

N(Y, ²). De acuerdo a lo estudiado en la distribución t de student vimos que

para muestras pequeñas, n < 30 y m < 30, la variable aleatoria:

180

mnmn

SmSn

YXT

YX

YX

11

2

11 22

~ t n + m - 2

El estimador de la varianza común ² es: 2

)1()1(

21

2

2

2

122

nn

SnSnSS YX

pc

representa la varianza combinada (o ponderada) de las varianzas muestrales.



1 – α = P [ - t0 T t0 ] ..................... (4)

Los valores t0 son simétricos, de modo tal que centralizan la probabilidad 1 -

α y se determinan como t0 = 2,

21 mnt , cuyos valores son ubicados en la

tabla de la distribución t de student.

Reemplazando la variable aleatoria

mnS

YXT

c

YX

11

en (4)

tenemos:

1 – α = P [- t0 T t0] = P [- t0

mnS

YX

c

YX

11

t0]

Trabajando con la desigualdad buscando dejar al centro el parámetro X - Y,

de manera similar a los intervalos anteriores, la probabilidad queda como:

1 – α = P [ ( X - Y ) - t0 mn

Sc

11 X - Y ( X - Y ) + t0

mnSc

11 ]

A partir del cual se tiene que el intervalo de confianza para la diferencia de

medias poblacionales X - Y está dado por:

X - Y [( X - Y ) t0 mn

Sc

11 ] al 100(1- α )% de confianza.

Ejemplo 12

Se compararon dos marcas de cigarrillos, X e Y, respecto a su contenido

medio de nicotina en miligramos; dos muestras aleatorias de 21 cigarrillos de

cada marca, dieron estos resultados:

X = 14.3, n = 21, SX = 2.9 y Y = 15.7, m = 21, SY = 3.8.

181


entre los contenidos medios de nicotina para las dos marcas de cigarrillos. b)

¿Son iguales los contenidos medios de nicotina?

Solución

a) Primero determinamos si las varianzas son iguales con el intervalo de confianza

para la razón de varianzas: 2

2

Y

X

c

SS

d

SS YXYX

2222 /;

/

Datos: n = m = 21, 2

XS = 2.92 = 8.41, 2

YS = 3.82 = 14.44. Como 1 – α = 0.95,

entonces d = F20 , 20 , 0.975 = 2.46 y c = F20 , 20 , 0.025 = 1/ F20 , 20 , 0.975 = 1/ 2.46 =

0.407.


2

2

Y

X

407.0

44.14/41.8;

46.2

44.14/41.8 = [0.24; 1.43] con el 95% de confianza.

Dado que el intervalo toma el valor 1, es decir 2

2

Y

X

= 1, entonces 2

X = 2

Y .

Considerando que las muestras son pequeñas y que las varianzas del contenido de

nicotina son iguales, el intervalo de confianza para la diferencia entre los

contenidos medios de nicotina para las dos marcas de cigarrillos está dado por:

X - Y [ ( X - Y ) t0 mnmn

SmSn YX 11

2

)1()1( 22

]

Datos del problema:

X = 14.3, n = 21, SX = 2.9 y Y = 15.7, m = 21, SY = 3.8.

Como n = m = 21, los grados de libertad de la t son n + m – 2 = 21 + 21 – 2 =

40

Si 1 – α = 0.95, t0 = t40 , 0.975 = 2.021.

Reemplazando valores en la fórmula para el intervalo de confianza, tenemos que:

X - Y [(14.3 – 15.7) 2.021 21

1

21

1

22121

)8.3)(121()9.2)(121( 22

]

X - Y [ (14.3 – 15.7) 2.021(1.0431) ] X - Y [ -1.40

2.11 ]

Por lo tanto:

X - Y [-3.51 , 0.71] mg. de nicotina con el 95% de confianza. Rpta.

182

Interpretación: la diferencia entre los contenidos medios de nicotina para las

marcas de cigarrillos X e Y se encuentra comprendida entre -3.51 , 0.71 mg. con

el 95% de confianza.

b) Responder a la pregunta ¿Son iguales los contenidos medios de nicotina en los

cigarrillos X e Y? implica preguntar ¿ X = Y? o también ¿ X - Y = 0?

La diferencia X - Y = 0 está incluida en el intervalo de confianza construido en

a), es decir X - Y = 0 o X = Y. Por lo tanto, los contenidos medios de

nicotina en los cigarrillos X e Y son iguales. Rpta.

B) Caso de varianzas heterogéneas (2

X ≠ 2

Y )

Sea X1, X2, ..., Xn una muestra aleatoria de tamaño n, de una variable

aleatoria X con distribución N(X, 2

X ). Sea también Y1, Y2, ..., Ym una

muestra aleatoria de tamaño m de una variable aleatoria Y, con distribución

N(Y, 2

Y ). Si las varianzas son diferentes, se cumple que:

m

S

n

S

YXT

YX

YX

22

~ tH

Donde:

11 2

2

2

2

2

1

2

1

2

1

2

2

2

2

1

2

1

n

n

S

n

n

S

n

S

n

S

H (valor entero) representa los grados de libertad.



1 – α = P [ - t0 T t0 ] ..................... (5)

Los valores t0 son simétricos, de modo tal que centralizan la probabilidad 1 -

α y se determinan como t0 = H

t,

21

, cuyos valores son ubicados en la tabla 3

de la distribución t de student.

Reemplazando la variable aleatoria

m

S

n

S

YXT

YX

YX

22

en (5)

tenemos:

183

1 – α = P [- t0 T t0] = P [- t0

m

S

n

S

YX

YX

YX

22

t0]

Trabajando con la desigualdad buscando dejar al centro el parámetro X - Y,

de manera similar a los intervalos anteriores, la probabilidad queda como:

1 – α = P [ ( X - Y ) - t0 m

S

n

S YX

22

X - Y ( X - Y ) + t0m

S

n

S YX

22

]

A partir del cual se tiene que el intervalo de confianza para la diferencia de

medias poblacionales X - Y está dado por:

X - Y [( X - Y ) t0 m

S

n

S YX

22

] al 100(1- α )% de confianza.

Ejemplo 12

En un estudio para determinar si hay diferencia en el salario semanal de los

hombres y las mujeres de una gran empresa, se toma una muestra de 18

hombres encontrándose un promedio de S/. 420 y una desviación estándar de

S/. 50, mientras que en una muestra de 15 mujeres se encontró un promedio

de S/. 360 y una desviación estándar de S/. 90. Se pide:


entre los salarios medios semanales de hombres y mujeres.

b) ¿Son iguales los salarios medios semanales de hombres y mujeres?

Solución

a) Primero determinamos si las varianzas de los salarios son iguales con el

intervalo de confianza para las varianzas: 2

2

M

H

c

SS

d

SS MHMH

2222 /;

/

Datos: nH = 18, HX = S/. 420, 2

HS = 502 = 2500, nM = 15,

MX = S/. 360, 2

MS = 902 = 8100. Como 1 – α = 0.95,

entonces d = F17 , 14 , 0.975 = 2.90 y c = F17 , 14 , 0.025 = 1/ F14 , 17 , 0.975 = 1/ 2.75 =

0.364.


184

2

2

M

H

364.0

8100/2500;

90.2

8100/2500 = [0.11; 0.85] con el 95% de

confianza.

Dado que el intervalo no toma el valor 1, es decir 2

2

M

H

≠ 1, entonces 2

H ≠

2

M .

Considerando que las muestras son pequeñas y que las varianzas de los

salarios semanales de hombres y mujeres son diferentes, el intervalo de

confianza del 95% para la diferencia de los salarios medios de hombres y

mujeres está dado por:

H - M [( HX - MX ) t0 M

M

H

H

n

S

n

S 22

]

Donde t0 = tH, 0.975 = t20, 0.975 = 2.086.

Donde: H =

11

22

22

222

M

M

M

H

H

H

M

M

H

H

n

n

S

n

n

S

n

S

n

S

=

115

15

8100

118

18

2500

15

8100

18

2500

22

2

= 20.98 ≡ 20

Reemplazando valores en el intervalo de confianza propuesto, se tiene:

H - M [(420 - 360) 2.086 x 15

8100

18

2500 ] = [60 54.35]

Por lo tanto: H - M [5.65 ; 114.35] S/. con el 95 % de confianza.

Rpta.

Interpretación: la diferencia entre los salarios medios semanales de hombres y

mujeres se encuentra comprendido entre S/. 5.65 y S/. 114.35 con el 95% de

confianza.

b) Responder a la pregunta ¿Son iguales los salarios medios semanales de

hombres y mujeres? implica responder si ¿ H = M? o también ¿ H - M =

0?

La diferencia H - M = 0 no está incluida en el intervalo de confianza

construido en a), es decir H - M ≠ 0 o H ≠ M. Por lo tanto, los salarios

medios semanales de hombres y mujeres son diferentes. Rpta.

185

INTERVALOS DE CONFIANZA PARA UN SOLO PARÁMETRO

I.C. PARA LA MEDIA POBLACIONAL: μ

Caso Intervalo

1. Cuando la muestra es aleatoria de X ~

N (μ, σ2) con σ

2 conocida o n ≥ 30.

)(2

1 nZX

2. Cuando la muestra es aleatoria de X ~

N (μ, σ2) con σ

2 desconocida, n < 30. )(

)1,2

1( n

StX

n

I.C. PARA EL TOTAL POBLACIONAL: Nμ

A los I.C. para la media μ multiplicarlos por el tamaño de la población N.

I.C. PARA LA VARIANZA POBLACIONAL: σ2

Caso Intervalo

La muestra es aleatoria de una población

normal. σ

2 ϵ

2

)1,2

(

2

2

)1,2

1(

2 )1(,

)1(

nn

SnSn

I.C. PARA LA PROPORCIÓN POBLACIONAL: p

Caso Intervalo

La muestra es aleatoria y su tamaño es

grande (n ≥ 30) n

qpZp

ˆˆˆ

21

I.C. PARA EL TOTAL POBLACIONAL: Np

Al I.C. para la proporción p multiplicarlo por el tamaño de la población N.

Tamaño de muestra para µ Tamaño de muestra para p

2 2

00 2

Zn

E

→ 0

01

nn

n

N

2

00 2

ˆ ˆZ pqn

E → 0

0 11

nn

n

N

186

INTERVALOS DE CONFIANZA PARA DOS PARÁMETROS

I.C. PARA LA RAZÓN DE VARIANCIAS: 2

2

2

1 /

Caso Intervalo

Dos muestras aleatorias independientes de

poblaciones normales. 2

2

2

1

ϵ

1,1,2

2

2

2

1

1,1,2

1

2

2

2

1 /,

/

mnmnF

SS

F

SS

I.C. PARA LA DIFERENCIA DE MEDIAS POBLACIONALES: μ1 – μ2

Caso Intervalo

1. Dos muestras aleatorias independientes,

de poblaciones normales con σ12 y σ2

2

conocidas y n1 y n 2 ≥ 30. 2

2

2

1

2

1

21

21nn

ZXX

2. Dos muestras aleatorias independientes


2

desconocidas pero iguales (varianzas

homogéneas) y n1 y n 2 < 30.

21

2

2,2

121

11

21 nnStXX c

nn

Con 2

)1()1(

21

2

22

2

112

nn

SnSnSc

3. Dos muestras aleatorias independientes


2

desconocidas pero diferentes

(varianzas heterogéneas) y n1 y n 2 <

30,

2

2

21

1

2

1

,2

121

n

S

n

StXX

H

Con:

11 2

2

2

2

2

1

2

1

2

1

2

2

2

2

1

2

1

n

n

S

n

n

S

n

S

n

S

H , valor entero.

I.C. PARA LA DIFERENCIA DE PROPORCIONES POBLACIONALES: p1 – p2

Caso Intervalo

Dos muestras aleatorias independientes

con n1 y n2 ≥ 30 2

221

1

11

21

21

ˆˆˆˆˆˆ

n

qp

n

qpZpp

187


1. Demostrar que:

a) Las desigualdades µ - E ≤ x ≤ µ + E, son equivalentes a | x - µ | ≤ E

b) Si )(1 2/12/1 ZZZP y n

XZ

/

entonces:

nZX

nZXP

21

21

1

Solución

a) En la desigualdad: µ - E ≤ x ≤ µ + E se resta µ en cada miembro y se

obtiene:

- E ≤ x - µ ≤ E → | x - µ | ≤ E

b) En la expresión )(1 2/12/1 ZZZP se reemplaza Z por:

n

XZ

/

y se obtiene:

1 – α = )/

( 2/12/1

Z

n

XZP

Multiplicando en la desigualdad anterior por n/ queda:

1 – α =

nZX

nZP

21

21

Restando X en la desigualdad:

1 – α =

nZX

nZXP

21

21

Multiplicando por -1 y manteniendo el sentido de la desigualdad se tiene:

1 – α =

nZX

nZXP

21

21

2. Se desea estimar el peso total de una partida de 10,000 naranjas. Para ello se

selecciona una muestra aleatoria de 41 naranjas, la cual da una media de 200

gramos y una desviación estándar de 25 gramos. Calcule e interprete intervalos

de confianza del 95 % para:

188

a) El verdadero peso promedio (μ), el peso total (Nμ) y la varianza verdadera

(σ2) de los pesos de las naranjas.

b) ¿Qué tamaño de muestra debe tomarse, si se desea que x difiera de µ en

menos de 13 gr. con el 99 % de confianza?

Solución

Datos: N = 10000 naranjas, n = 41, X = 200 gr. S = 25 gr. 1 – α = 0.95

a) Para hallar el intervalo de confianza para la media y el total, si 1 – α = 0.95

→ en la Tabla 1, Zo = Z0.975 = 1.96.

El intervalo de confianza para la media se obtiene con la expresión:

1,

12

12

1 N

nN

nZX

N

nN

nZX

…………. (1)

Donde el error de estimación para la media es:

E = 110000

4110000

41

2596.1

12

1

N

nN

nZ

= 7.64 gr.

Reemplazando en (1) se tiene:

µ ϵ [200 – 7.64 ; 200 + 7.64] = [192.36 ; 207.64] gr. con el 95% de

confianza. Rpta.

Interpretación.- con el 95% de confianza, el verdadero peso medio de las

naranjas se encuentra entre 192.36 y 207.64 gr.

Para hallar el intervalo de confianza para el Total (Nμ) se multiplica los

límites de la media por N = 10000, así:

Total = Nµ ϵ 10000 [192.36 ; 207.64] = [1’923600 ; 2’076400] gr. con el

95% de confianza. Rpta.

Interpretación.- con el 95% de confianza, el verdadero peso total de las

naranjas se encuentra entre 1’923600 y 2’076400 gr.

El intervalo de confianza para la varianza está dado por:

²

a

Sn

b

Sn 22 )1(,

)1(

Como n = 41 y 1 – α = 0.95, entonces en la Tabla 2:

a = 2

025.0,40x = 24.4 y b = 2

975.0,40x = 59.3

Se tiene además la desviación estándar muestral S = 25

189

Reemplazando valores en el intervalo de confianza para la varianza, se tiene

que:

²

4.24

)25)(141(,

3.59

)25)(141( 22

Por lo tanto:

² [421.59 ; 1024.59 ] (gr.)² con el 95% de confianza. Rpta.

Interpretación: la varianza del peso de las naranjas se encuentra entre 421.59 y

1024.59 (gr.)² con el 95% de confianza.

b) El tamaño de muestra está dado por: 2

22

0E

Zn

Donde: | x - µ | = E = 13, 1 – α = 0.99 → en la Tabla 1, Z = Z0.995 = 2.575

y S = 25. Reemplazando en la fórmula para n se tiene:

2

22

013

25575.2n = 24.5 ≡ 25 naranjas. Rpta.

Interpretación.- para estimar el peso medio de las naranjas con el 99% de

confianza y un error máximo de 13 gramos se requiere de 25 naranjas.

3. Un proceso está programado para embotellar la cantidad media de 750 mililitros

de gaseosa. Se toma una muestra aleatoria de 41 botellas, resultando una media

de 745 ml. y una desviación típica de 12 ml. Calcule e interprete intervalos de

confianza del 99 % para:

a) El verdadero contenido promedio (μ) de gaseosa en las botellas.

b) La varianza verdadera (σ2) del contenido de gaseosa en las botellas.

Solución

Datos: n = 41 botellas, X = 745 ml. S = 12 ml. 1 – α = 0.99

a) Para hallar el intervalo de confianza para la media, si 1 – α = 0.99 → En la

Tabla 1, Zo = Z0.995 = 2.575.


nZX

nZX

21

21

, …………. (1)


190

E = 41

12575.2

21

n

Z

= 4.83 ml.


µ ϵ [745 – 4.83 ; 745 + 4.83] = [740.17 ; 749.83] ml. con el 99% de

confianza. Rpta.

Interpretación.- con el 99% de confianza, el verdadero contenido medio de

las botellas de gaseosa se encuentra entre 740.17 y 749.83 ml.

b) El intervalo de confianza para la varianza está dado por:

²

a

Sn

b

Sn 22 )1(,

)1(


a = 2

005.0,40x = 20.7 y b = 2

995.0,40x = 66.8

Se tiene además la desviación estándar muestral S = 12


que:

²

7.20

)12)(141(,

8.66

)12)(141( 22

Por lo tanto:

² [86.23 ; 278.26] (ml.)² con el 99% de confianza. Rpta.

Interpretación: con el 99% de confianza, la varianza del contenido de las botellas

de gaseosa se encuentra entre 421.59 y 1024.59 (ml.)².

4. Una muestra de 75 clientes de cierta gasolinera indica que el número medio de

galones comprados es de X = 14.3 y la desviación estándar de S = 2.7 galones.

a) Encuentre E tal que tengamos un 95 % de confianza de que el error de

estimación es menor que E al usar X para estimar μ.

b) Construya un intervalo de confianza del 95 % para el número medio de

galones de gasolina comprados.

c) Construya un intervalo de confianza del 95 % para σ2.

d) Encuentre el tamaño de muestra necesario para lograr un 95 % de confianza

de que el error máximo de estimación sea menor que 0.5 galones.

Solución

191

Datos: n = 75 clientes, X = 14.3 galones, S = 2.7 galones, 1 – α = 0.95 → En

la Tabla 1, Zo = Z0.975 = 1.96.

a) El error de estimación para la media E es:

E = 75

7.296.1

21

n

Z

= 0.61 galones.

b) El intervalo de confianza para la media se obtiene con la expresión:

nZX

nZX

21

21

, …………. (1)


µ ϵ [14.3 – 0.61 ; 14.3 + 0.61] = [13.69 ; 14.91] galones con el 95% de

confianza. Rpta.

Interpretación.- en la gasolinera, el verdadero consumo medio de gasolina se

encuentra entre 13.69 y 14.91 galones con el 95% de confianza.

c) El intervalo de confianza para la varianza está dado por:

²

a

Sn

b

Sn 22 )1(,

)1(


a = 2

025.0,74x = 52.1 y b = 2

975.0,74x = 99.7

Se tiene además la desviación estándar muestral S = 2.7


que:

²

1.52

)7.2)(175(,

7.99

)7.2)(175( 22

Por lo tanto:

² [5.41 ; 10.35] (galones)² con el 95% de confianza. Rpta.

Interpretación: con el 95% de confianza, la varianza de la gasolina comprada

se encuentra entre 5.41 y 10.35 (galones)².

d) El tamaño de muestra está dado por: 2

22

0E

Zn

Donde: | x - µ | = E = 0.5 galones, 1 – α = 0.95 → en la Tabla 1, Z =

Z0.975 = 1.96 y S = 2.7. Reemplazando en la fórmula para n se tiene:

192

2

22

05.0

7.296.1n = 112 clientes. Rpta.

Interpretación.- para estimar el consumo medio de gasolina con el 95% de

confianza y un error máximo de 0.5 galones se requiere una muestra de 112

clientes.

5. Un proceso está programado para embolsar la cantidad media de 250 gramos de

café. Se toma una muestra aleatoria de 36 bolsas, resultando una media de 246.5

gramos y una desviación típica de 12 gramos.

a) Construya un intervalo de confianza del 95% para el verdadero peso medio de

las bolsas con café.

b) ¿Se puede afirmar que no se está cumpliendo con el contenido medio en las

bolsas?

c) Construya un intervalo de confianza del 95% para la verdadera varianza de

los pesos de las bolsas con café. ¿aceptaría usted que σ2 = 250 gr

2 por bolsa?

Solución

Datos: µ = 250 gr., n = 36 bolsas, X = 246.5 gr., S = 12 gr., 1 – α = 0.95


Tabla 1, Zo = Z0.975 = 1.96.


nZX

nZX

21

21

, …………. (1)


E = 36

1296.1

21

n

Z

= 3.92 gr.


µ ϵ [246.5 – 3.92 ; 246.5 + 3.92] = [242.58 ; 250.42] gr. con el 95% de

confianza. Rpta.

Interpretación.- con el 95% de confianza, el verdadero contenido medio de

las bolsas con café se encuentra entre 242.58 y 250.42 gr.

b) No se puede afirmar que no se está cumpliendo con el contenido medio en las

bolsas de café, puesto que µ = 250 gr., está en el intervalo de confianza

obtenido en a).

193


²

a

Sn

b

Sn 22 )1(,

)1(


a = 2

025.0,35x = 20.6 y b = 2

975.0,35x = 53.2

Se tiene además la desviación estándar muestral S = 12.


que:

²

6.20

)12)(136(,

2.53

)12)(136( 22

Por lo tanto:

² [94.74 ; 244.66] (gr.)² con el 95% de confianza. Rpta.

Interpretación: con el 95% de confianza, la varianza de los pesos de las

bolsas con café se encuentra entre 94.74 y 244.66 (gr.)².

Nota: No aceptaría que σ2 = 250 gr

2 por bolsa, ya que el resultado anterior

indica que es menor de 250 gr2.

6. Para estimar la cantidad total de depósitos a la vista en dólares, un banco

comercial selecciona una muestra aleatoria de 36 cuentas. La muestra da una

media de $ 5,000 y una desviación estándar de $ 1,000. Suponiendo que el banco

tiene 12,000 cuentas a la vista. Calcule e interprete intervalos de confianza del

95 % para:

a) El verdadero depósito promedio en las cuentas a la vista.

b) La cantidad total en depósitos.

c) La desviación estándar verdadera de los depósitos en las cuentas a la vista.

d) ¿Qué tamaño de muestra debe tomarse, si se desea que x difiera de µ en

menos de $ 150 con el 95 % de confianza?

Solución

Datos: N = 12,000 cuentas, n = 36, X = $ 5,000, S = $ 1,000, 1 – α = 0.95


Tabla 1, Zo = Z0.975 = 1.96.


194

nZX

nZX

21

21

, …………. (1)


E = 36

100096.1

21

n

Z

= $ 326.67. Reemplazando en (1) se tiene:

µ ϵ [5,000 – 326.67 ; 5,000 + 326.67] = [4,673.33 ; 5,326.67] $ con el 95%

de confianza. Rpta.

Interpretación.- con el 95% de confianza, el verdadero depósito medio a la

vista en las cuentas se encuentra entre 4,673.33 y 5,326.67 dólares.

b) Para hallar el intervalo de confianza para el Total (Nμ) se multiplica los

límites de la media por N = 12,000, así:

Total = Nµ ϵ 12,000 [4,673.33 ; 5,326.67] = [56’079,960 ; 63’920,040] $

con el 95% de confianza. Rpta.

Interpretación.- con el 95% de confianza, el verdadero total de depósitos a la

vista en las cuentas en dólares se encuentra entre $ 56’079,960 y 63’920,040.


²

a

Sn

b

Sn 22 )1(,

)1(


a = 2

025.0,35x = 20.6 y b = 2

975.0,35x = 53.2

Se tiene además la desviación estándar muestral S = 1,000.


que:

²

6.20

)1000)(136(,

2.53

)1000)(136( 22

Por lo tanto:

² [657,894.74 ; 1’699,029.13] ($)² con el 95% de confianza. Entonces:

[811.11 ; 1,303.47] $ con el 95% de confianza. Rpta.

195

Interpretación: con el 95% de confianza, la desviación estándar de los

depósitos a la vista en las cuentas se encuentra entre 811.11 y 1,303.47

dólares.


22

0E

Zn

Donde: | x - µ | = E = $ 150, 1 – α = 0.95 → en la Tabla 1, Z = Z0.975 =

1.96 y S = 1,000. Reemplazando en la fórmula para n se tiene:

2

22

0)150(

)000,1()96.1(n = 171 cuentas. Rpta.

Interpretación.- para estimar el depósito medio a la vista, con el 95% de

confianza y un error máximo de $ 150 se requiere una muestra de 171

cuentas.

7. De un área de la ciudad en la que habitan 500 familias se extrae una muestra

aleatoria de 50 familias, obteniéndose los siguientes datos sobre el número de

hijos por familia:

Hijos por familia (Xi) 0 1 2 3 4 5

Familias (ni) 20 10 7 6 4 3

Calcule e interprete intervalos de confianza del 95 % para estimar:

a) El número medio de hijos por familia en la ciudad.

b) El número total de hijos por familia en el área de la ciudad.

c) La proporción de familias con menos de 2 hijos en el área.

d) El total de familias con menos de 2 hijos en el área.

Solución

Con la información en la tabla se determina el promedio y la varianza muestral de

los hijos por familia así:

50

73

50

35446372101200

6

1

xxxxxx

n

nX

X i

ii

= 1.46 hijos.

196

150

)46.1(50231

11

)(2

6

1

226

1

2

2

n

XnnX

n

nXX

S i

ii

i

ii

= 2.54 hijos2 y S =

1.594.

35446372101200 2222226

1

2 xxxxxxnXi

ii

= 231

Otros datos: N = 500, n = 50, 1 – α = 0.95.

a) Para hallar el intervalo de confianza para la media y el total, si 1 – α = 0.95

→ en la Tabla 1, Zo = Z0.975 = 1.96.


1,

12

12

1 N

nN

nZX

N

nN

nZX

…………. (1)


E = 1500

50500

50

594.196.1

12

1

N

nN

nZ

= 0.42 hijos.


µ ϵ [1.46 – 0.42 ; 1.46 + 0.42] = [1.04 ; 1.88] hijos / familia con el 95% de

confianza. Rpta.

Interpretación.- con el 95% de confianza, el verdadero número medio de

hijos por familia se encuentra entre 1.04 y 1.88 hijos.

b) Para hallar el intervalo de confianza para el Total (Nμ) de hijos se multiplica

los límites de la media por N = 500 familias, así:

Total = Nµ ϵ 500 [1.04 ; 1.88] = [520 ; 940] hijos al 95% de confianza.

Rpta.

Interpretación.- el verdadero total de hijos en el área de la ciudad, se

encuentra entre 520 y 940 hijos, con el 95% de confianza.

c) Para determinar el intervalo de confianza para la proporción de familias con

menos de 2 hijos en el área, del enunciado y la tabla tomemos los datos:

N = 500, n = 50, X = 30 familias con menos de 2 hijos, Si 1 – α = 0.95

→ en la Tabla 1, Z0 = Z 0.975 = 1.96.

Si p = proporción muestral de familias con menos de 2 hijos, entonces:

197

50

30

n

Xp = 0.6, q = 1 – p = 0.4. El intervalo de confianza para la

verdadera proporción poblacional P de familias con menos de 2 hijos, es:

1,

12

12

1 N

nN

n

pqZp

N

nN

n

pqZpP


P ϵ [0.60 – 1.961500

50500

50

40.060.0

x ; 0.60 +

1.961500

50500

50

40.060.0

x]

P ϵ [0.60 – 0.129 ; 0.60 + 0.129 ]

Por lo tanto: P ϵ [ 0.471 ; 0.729 ] con el 99% de confianza. Rpta.

Interpretación.- la verdadera proporción de familias con menos de 2 hijos en

el área de la ciudad, se encuentra entre 0.311 y 0.489 con el 95% de

confianza.

d) Para hallar el intervalo de confianza para el Total (NP) de familias con menos

de 2 hijos, se multiplica los límites de la proporción por N = 500 familias,

así:

Tot. = NP ϵ 500 [0.471; 0.729] = [236; 365] familias al 95% de confianza.

Rpta.

Interpretación.- el total de familias con menos de 2 hijos en el área de la

ciudad, se encuentra entre 236 y 365 familias, con el 95% de confianza.

8. En una muestra aleatoria de 1000 hogares de Lima Metropolitana (con 800 mil

consumidores de gas doméstico) se encontró que 650 están a favor de la reducción

del precio del gas doméstico.

a) Calcule e interprete un intervalo del 90% de confianza para la proporción y

otro para el total verdadero de hogares que están a favor de la reducción del

precio del gas doméstico.

b) Con un 95% de confianza, ¿qué tamaño de muestra será necesario si desea

cometer un error máximo del 5%?

Solución

198

Datos: N = 800,000 consumidores de gas, n = 1,000, X = 650 a favor de la

reducción del precio del gas, 1 – α = 0.90.

a) Para determinar el intervalo de confianza para la proporción de hogares que

están a favor de la reducción del precio del gas doméstico, si 1 – α = 0.90 →

En la Tabla 1, Zo = Z0.95 = 1.645.

Si p = proporción muestral de hogares que están a favor de la reducción del

precio del gas doméstico, entonces: 1000

650

n

Xp = 0.65, q = 1 – p = 0.35.


hogares que están a favor de la reducción del precio del gas doméstico, es:

n

pqZp

n

pqZpP

21

21

,

Se desecha el factor de corrección para poblaciones finitas porque la fracción

de muestreo n/N < 0.05.


P ϵ [0.65 – 1.6451000

35.065.0 x ; 0.65 + 1.645

1000

35.065.0 x]

P ϵ [0.65 – 0.025 ; 0.65 + 0.025]

Por lo tanto: P ϵ [0.625 ; 0.675] con el 90% de confianza. Rpta.

Interpretación.- la verdadera proporción (porcentaje) de hogares que están a

favor de la reducción del precio del gas doméstico, se encuentra entre 0.625 y

0.675 (62.5% y 67.5%) con el 90% de confianza.

Para hallar el intervalo de confianza para el Total (NP) de hogares que están a

favor de la reducción del precio del gas doméstico, se multiplica los límites de

la proporción por N = 800,000 hogares, así:

Total = NP ϵ 800,000 [0.575 ; 0.625] = [460,000 ; 500,000] hogares con el


Interpretación.- el total de hogares que están a favor de la reducción del precio

del gas doméstico en Lima Metropolitana, se encuentra entre 460,000 y

500,000 hogares, con el 90% de confianza.


distribución normal estándar, al 95% de confianza: Z = Z0. 975 = 1.96.

199

Reemplazando en la fórmula para el tamaño de muestra se tiene:

2

2

2

2

0)05.0(

35.065.096.1 xx

E

pqZn 350 hogares. Rpta.

Interpretación.- para estimar la proporción de hogares que están a favor de la

reducción del precio del gas doméstico, con el 95% de confianza y un error

máximo del 5% se requiere una muestra de 350 hogares consumidores de gas.

9. Una “Encuesta de Opinión” realizada en 1000 hogares de Lima Metropolitana

(con 1’400 000 hogares) indica que el 30.5 % de los hogares compra periódicos y

revistas.

a) Determine un intervalo de confianza del 95 % para la proporción y otro para el

total de hogares limeños que compra periódicos y revistas.

b) ¿Aceptaría Ud. que menos del 25 % de hogares limeños compra periódicos y

revistas?

c) Con un error del 2.5 % y una confianza del 95 %. ¿Qué tamaño de muestra es

necesario para estimar la proporción de hogares que compran periódicos y

revistas?

Solución

Datos: N = 1’400,000 hogares, n = 1,000, p = 0.305, q = 1 – p = 0.695.

a) Para determinar el intervalo de confianza para la proporción de hogares que

compra periódicos y revistas, si 1 – α = 0.95 → En la Tabla 1, Zo = Z0.975 =

1.96.

Si p = 0.305 es la proporción muestral de hogares que compra periódicos y

revistas, entonces el intervalo de confianza para la verdadera proporción

poblacional P de hogares que compra periódicos y revistas, es:

n

pqZp

n

pqZpP

21

21

,


de muestreo n/N < 0.05. Reemplazando valores se tiene:

P ϵ [0.305 – 1.961000

695.0305.0 x ; 0.305 + 1.96

1000

695.0305.0 x]

P ϵ [0.305 – 0.029 ; 0.305 + 0.029]


200

Interpretación.- la verdadera proporción (porcentaje) de hogares que compra

periódicos y revistas en Lima Metropolitana, se encuentra entre 0.276 y 0.334

(27.6% y 33.4%) con el 95% de confianza.

Para hallar el intervalo de confianza para el Total (NP) de hogares que compra

periódicos y revistas, se multiplica los límites de la proporción por N =

1’400,000 hogares, así:

Total = NP ϵ 1’400,000 [0.276 ; 0.334] = [386,400 ; 467,600] hogares con el


Interpretación.- el total de hogares que compra periódicos y revistas en Lima

Metropolitana, se encuentra entre 386,400 y 467,600 hogares, con el 95% de

confianza.

b) No aceptaría que menos del 25 % de hogares limeños compra periódicos y

revistas, puesto que se encuentra entre 27.6% y 33.4% (ver la parte a).

c) Datos: p = 0.305, q = 0.695, E = |p - P| = 0.025 y según la Tabla 1 de la



2

2

2

2

0)025.0(

695.0305.096.1 xx

E

pqZn 1,303 hogares. Rpta.

Interpretación.- para estimar la proporción de hogares que compra periódicos

y revistas, con el 95% de confianza y un error máximo del 2.5% se requiere

una muestra de 1,303 hogares.

10. Una muestra aleatoria de 500 compradores de un centro comercial se encontró que

300 compran alimentos y bebidas.

a) Calcule e interprete un intervalo del 99% de confianza para la proporción

verdadera de compradores que adquieren alimentos y bebidas.



Solución

Datos: n = 500 compradores, X = 300 compran alimentos y bebidas.

201

a) Para hallar los límites de confianza para la proporción de compradores que

adquieren alimentos y bebidas, si 1 – α = 0.99 → En la Tabla 1, Zo = Z0.995 =

2.575.

Si p = proporción muestral de compradores que adquieren alimentos y bebidas,

entonces: 500

300

n

Xp = 0.60, q = 1 – p = 0.40.


compradores que adquieren alimentos y bebidas, es:

n

pqZp

n

pqZpP

21

21

,

Se desecha el factor de corrección para poblaciones finitas, asumiendo un

número grande de compradores, tal que la fracción de muestreo n/N < 0.05.


P ϵ [0.60 – 2.575500

40.060.0 x ; 0.60 + 2.575

1000

35.065.0 x]

P ϵ [0.60 – 0.056 ; 0.60 + 0.056]


Interpretación.- con el 99% de confianza, la verdadera proporción (porcentaje)

de compradores que adquieren alimentos y bebidas en el centro comercial, se

encuentra entre 0.544 y 0.656 (54.4% y 65.6%).




2

2

2

2

0)04.0(

40.060.0575.2 xx

E

pqZn 995 compradores. Rpta.

Interpretación.- para estimar la proporción de compradores que adquieren

alimentos y bebidas en el centro comercial, con el 99% de confianza y un error

máximo del 4% se requiere una muestra de 995 compradores.

11. Se tomó una muestra aleatoria de 800 mujeres casadas en Lima y se encontró que

560 están a favor del uso de la píldora del día siguiente.

202

a) Calcule e interprete un intervalo del 95% de confianza para la verdadera

proporción de mujeres casadas que están a favor del uso de la píldora del día

siguiente.

b) Con el 95 % de confianza, ¿Qué tamaño de muestra debe tomarse, si se desea

un error máximo del 3%?

Solución

Datos: n = 800 mujeres casadas, X = 560 a favor del uso de la píldora del día

siguiente.

a) Para hallar los límites de confianza para la proporción de mujeres casadas que

están a favor del uso de la píldora del día siguiente, si 1 – α = 0.95 → En la

Tabla 1, Zo = Z0.975 = 1.96.

Si p = proporción muestral de mujeres casadas que están a favor del uso de la

píldora del día siguiente, entonces: 800

560

n

Xp = 0.70, q = 1 – p = 0.30.


mujeres casadas que están a favor del uso de la píldora del día siguiente, es:

n

pqZp

n

pqZpP

21

21

,

Se desecha el factor de corrección para poblaciones finitas, asumiendo un

número grande de mujeres casadas en Lima, tal que la fracción de muestreo

n/N < 0.05.


P ϵ [0.70 – 1.96800

30.070.0 x ; 0.70 + 1.96

800

30.070.0 x]

P ϵ [0.70 – 0.032 ; 0.70 + 0.032]


Interpretación.- la verdadera proporción (porcentaje) de mujeres casadas que

están a favor del uso de la píldora del día siguiente en Lima, se encuentra entre

0.668 y 0.732 (66.8% y 73.2%) con el 95% de confianza.

b) Datos: p = 0.70, q = 0.30, E = |p - P| = 0.03 y según la Tabla 1 al 95% de

confianza: Z = Z0. 975 = 1.96.


203

2

2

2

2

0)03.0(

30.070.096.1 xx

E

pqZn 896 mujeres casadas. Rpta.

Interpretación.- con el 95% de confianza y un error máximo del 3% para

estimar la proporción de mujeres casadas que están a favor del uso de la píldora

del día siguiente, se requiere una muestra de 896 mujeres casadas.

12. Una “Encuesta de Opinión” realizada a 1000 ciudadanos de Lima Metropolitana

(con 5.5 millones de ciudadanos) indica que el 19.5 % de los ciudadanos juega la

tinka.

a) Determine un intervalo de confianza del 95 % para la proporción y otro para el

total de ciudadanos limeños que juegan la tinka.

b) Con un error del 3.5 % y una confianza del 95 %. ¿Cuál sería el tamaño de

muestra necesario para estimar la proporción de ciudadanos que juega la

tinka?

Solución

Datos: N = 5’500,000 ciudadanos, n = 1,000, p = 0.195, q = 1 – p = 0.805.

a) Para determinar el intervalo de confianza para la proporción de ciudadanos

limeños que juegan la tinka, si 1 – α = 0.95 → En la Tabla 1, Zo = Z0.975 =

1.96.

Si p = 0.195 es la proporción muestral de ciudadanos limeños que juegan la

tinka, entonces el intervalo de confianza para la verdadera proporción

poblacional P de ciudadanos limeños que juegan la tinka, es:

n

pqZp

n

pqZpP

21

21

,


de muestreo n/N < 0.05. Reemplazando valores se tiene:

P ϵ [0.195 – 1.961000

805.0195.0 x ; 0.195 + 1.96

1000

695.0305.0 x]

P ϵ [0.195 – 0.025 ; 0.195 + 0.025]


Interpretación.- con el 95% de confianza la verdadera proporción (porcentaje)

de ciudadanos limeños que juegan la tinka, se encuentra entre 0.17 y 0.22 (17%

y 22%).

204

Para hallar el intervalo de confianza para el Total (NP) de ciudadanos limeños

que juegan la tinka, se multiplica los límites de la proporción por N =

5’500,000 ciudadanos, así:

Total = NP ϵ 5’500,000 [0.17 ; 0.22] = [935,000 ; 1’210,000] ciudadanos con

el 95% de confianza. Rpta.

Interpretación.- el total de ciudadanos limeños que juegan la tinka, se encuentra

entre 935,000 y 1’210,000 ciudadanos, con el 95% de confianza.




2

2

2

2

0)035.0(

805.0195.096.1 xx

E

pqZn 492 ciudadanos. Rpta.

Interpretación.- para estimar la proporción de ciudadanos limeños que juegan

la tinka, con el 95% de confianza y un error máximo del 3.5% se requiere una

muestra de 492 ciudadanos.

13. En una muestra aleatoria de 600 compradores de un centro comercial se encontró

que 360 están a favor de un horario más amplio para las compras.


verdadera de compradores que están a favor de un horario más amplio para

las compras.

b) ¿Esta evidencia es suficiente para concluir que menos de 2/3 de los

compradores están a favor de un horario más extenso? Explique.

c) Con un 95% de confianza, ¿qué tamaño de muestra será necesario si desea

cometer un error máximo del 4.5%?

Solución

Datos: n = 600 compradores, X = 360 están a favor de un horario más amplio

para las compras.

a) Para hallar los límites de confianza para la proporción de compradores que

están a favor de un horario más amplio para las compras, si 1 – α = 0.95 → En

la Tabla 1, Zo = Z0.975 = 1.96.

205

Si p = proporción muestral de compradores que están a favor de un horario más

amplio para las compras, entonces: 600

360

n

Xp = 0.60, q = 1 – p = 0.40.


compradores que están a favor de un horario más amplio para las compras, es:

n

pqZp

n

pqZpP

21

21

,

No se considera el factor de corrección para poblaciones finitas, asumiendo un

número grande de compradores en el centro comercial, tal que la fracción de

muestreo n/N < 0.05.


P ϵ [0.60 – 1.96600

40.060.0 x ; 0.60 + 1.96

600

40.060.0 x]

P ϵ [0.60 – 0.039 ; 0.60 + 0.039]


Interpretación.- la verdadera proporción (porcentaje) de compradores que están

a favor de un horario más amplio para las compras en el centro comercial, se

encuentra entre 0.561 y 0.639 (56.1% y 63.9%) con el 95% de confianza.

b) Se puede concluir que menos de 2/3 de los compradores están a favor de un

horario más extenso, puesto que P se encuentra entre 0.561 y 0.639 (ver parte

a).

c) Datos: p = 0.60, q = 0.40, E = |p - P| = 0.045 y según la Tabla 1 al 95% de

confianza: Z = Z0. 975 = 1.96.


2

2

2

2

0)045.0(

40.060.096.1 xx

E

pqZn 455 compradores. Rpta.

Interpretación.- con el 95% de confianza y un error máximo del 4.5% para

estimar la proporción de compradores que están a favor de un horario más

amplio para las compras en el centro comercial, se requiere una muestra de 455

compradores.

206

14. En un estudio para determinar el gasto medio mensual en arbitrios en las

ciudades A y B, se toma una muestra al azar de 200 hogares de A arrojando un

gasto medio de S/. 250 y una desviación estándar de 15. Una muestra al azar de

180 hogares de la ciudad B da una gasto medio de 235 y una desviación estándar

de 10.

a) Determine un intervalo de confianza del 99 % para la diferencia del gasto

medio en las ciudades A y B.

b) ¿Es diferente el gasto medio mensual en arbitrios en las ciudades A y B?

Solución

Datos: nA = 200, X A = 250, SA = 15, nB = 180, X B = 235, SB = 10.

a) Un intervalo de confianza para la diferencia del gasto medio mensual en arbitrios

en las ciudades A y B viene dado por:

BABA XXBAXXBABA ZXXZXX

21

21

)(,)( ...........

(1)

Si 1 – α = 0.99, entonces: Z0 = Z 0.995 = 2.575

180

)10(

200

)15( 2222

B

B

A

AXXXX

n

S

n

SABBA

= S/. 1.30


A - B ϵ [(250 – 235) – 2.575 (1.30) ; (250 – 235) + 2.575 (1.30)] = [15 ± 3.34]

Luego: A - B ϵ [11.66; 18.34] S/. con el 95% de confianza. Rpta.

Interpretación: con el 99% de confianza, la diferencia del gasto medio mensual

en arbitrios en las ciudades A y B se encuentra entre S/. 11.66 y 18.34.

b) Responder a la pregunta ¿Es diferente el gasto medio mensual en arbitrios en las

ciudades A y B? implica responder si ¿ A ≠ B? o también ¿A - B ≠ 0?

Si apreciamos el intervalo de confianza construido en a) A - B no puede ser

cero, es decir A - B ≠ 0 o A ≠ B. Por lo tanto, el gasto medio mensual en

arbitrios en ambas ciudades es diferente. Rpta.

15. Un departamento de producción desea determinar si hay diferencia en el

rendimiento entre el turno diurno (A) y el nocturno (B). Una muestra aleatoria

de 80 obreros del turno diurno alcanza una producción media de 94.3 partes por

207

hora, con una desviación estándar de 14 partes por hora, mientras que otra

muestra de 60 obreros de la noche alcanza un promedio de 89.7 partes por hora,

con una desviación estándar de 17. Se pide:

a) Calcule e interprete un intervalo de confianza del 95% para la verdadera

diferencia de rendimientos medios de ambos turnos.

b) ¿Son diferentes los rendimientos medios de ambos turnos? ¿µA ≠ µB?

Explique

Solución

Datos: nA = 80, X A = 94.3 partes por hora, SA = 14, nB = 60, X B = 89.7, SB =

17.

a) Un intervalo de confianza para la diferencia de rendimientos medios viene dado

por:


21

21

)(,)( ...........

(1)

Si 1 – α = 0.95, entonces: Z0 = Z 0.975 = 1.96

60

)17(

80

)14( 2222

B

B

A

AXX

n

S

n

SBA

= 2.7 partes por hora.


A - B ϵ [(94.3 – 89.7) – 1.96 (2.7) ; (94.3 – 89.7) + 1.96 (2.7)] = [4.6 ± 5.3]

Luego: A - B ϵ [-0.7; 9.9] partes por hora con el 95% de confianza. Rpta.

Interpretación: con el 95% de confianza, la diferencia de rendimientos medios del

turno diurno y nocturno se encuentra entre -0.7 y 9.9 partes por hora.

b) Responder a la pregunta ¿Son diferentes los rendimientos medios de ambos

turnos? Es responder si ¿ A ≠ B? o también ¿A - B ≠ 0?

Si apreciamos el intervalo de confianza construido en a) A - B toma el valor

cero, es decir A - B = 0 o A = B. Por lo tanto, los rendimientos medios de

ambos turnos no son diferentes. Rpta.

16. El departamento de marketing desea determinar si hay diferencia entre las ventas

mensuales realizadas por hombres y mujeres. Una muestra aleatoria de 60

hombres alcanza un promedio de 78 artefactos mensuales, con una desviación

208

estándar de 15; mientras que otra muestra de 50 mujeres arroja una venta media

de 85 artefactos mensuales, con una desviación estándar de 10 artefactos. Se

pide:

a) Construya un intervalo del 95% de confianza para la verdadera diferencia de

las ventas medias realizadas por hombres y mujeres.

b) ¿Son diferentes las ventas medias realizadas por hombres y mujeres? ¿µh ≠

µm?

Solución

Datos: nh = 60, X h = 78 artefactos, Sh = 15, nm = 50, X m = 85, Sm = 10.

a) Un intervalo de confianza para la diferencia de las ventas medias realizadas por

hombres y mujeres viene dado por:

mhmh XXmhXXmhmh ZXXZXX

21

21

)(,)( ...........

(1)

Si 1 – α = 0.95, entonces: Z0 = Z 0.975 = 1.96

50

)10(

60

)15( 2222

m

m

h

hXX

n

S

n

Smh

= 2.4 partes por hora.


h - m ϵ [(78 – 85) – 1.96 (2.4) ; (78 – 85) + 1.96 (2.4)] = [-7 ± 4.7]

Luego: h - m ϵ [-11.7; -2.3] artefactos con el 95% de confianza. Rpta.

Interpretación: con el 95% de confianza, la diferencia de las ventas medias

mensuales de hombres y mujeres se encuentra entre -11.7 y -2.3 artefactos.

b) Responder a la pregunta ¿Son diferentes las ventas medias realizadas por hombres

y mujeres? implica responder si ¿h ≠ m? o también ¿h - m ≠ 0?

Si apreciamos el intervalo de confianza construido en a) h - m no puede ser

cero, es decir h - m ≠ 0 o h ≠ m. Por lo tanto, si es diferente la venta medias

mensual de artefactos entre hombres y mujeres. Rpta.

17. Para determinar el precio medio del kilo de pollo en las ciudades A y B, se toma

una muestra al azar de 120 hogares de A arrojando un precio medio de S/. 6.50 y

una desviación estándar de S/ 0.70. Una muestra al azar de 100 hogares de la

ciudad B da una precio medio de S/. 6.75 y una desviación estándar de S/. 0.90.

209

a) Calcule e interprete un intervalo de confianza del 95 % para la diferencia del

precio medio del pollo en las ciudades A y B.

b) ¿Es diferente el precio medio del pollo en las ciudades A y B?

Solución

Datos: nA = 120 hog., X A = S/. 6.50, SA = 0.70, nB = 100, X B = 6.75, SB =

0.90.

a) Un intervalo de confianza para la diferencia de rendimientos medios viene dado

por:


21

21

)(,)( ...........

(1)

Si 1 – α = 0.95, entonces: Z0 = Z 0.975 = 1.96

100

)9.0(

120

)7.0( 2222

B

B

A

AXX

n

S

n

SBA

= S/. 0.11


A - B ϵ [(6.50 – 6.75) – 1.96 (0.11) ; (6.50 – 6.75) – 1.96 (0.11)] = [-0.25 ±

0.22]

Luego: A - B ϵ [-0.47; -0.03] S/. con el 95% de confianza. Rpta.

Interpretación: con el 95% de confianza, la diferencia del precio medio del pollo

en las ciudades A y B se encuentra entre S/. -0.47 y -0.03.

b) Responder a la pregunta ¿Es diferente el precio medio del pollo en las ciudades A

y B? es responder si ¿ A ≠ B? o también ¿A - B ≠ 0?

Si apreciamos el intervalo de confianza construido en a) A - B no toma el valor

cero, es decir A - B ≠ 0 o A ≠ B. Por lo tanto, el precio medio del pollo en

ambas ciudades es diferente. Rpta.

18. Muestras del pago mensual a los obreros en las ciudades 1 y 2 proporcionan los

siguientes datos:

n1 = 35, 1X = $ 540, S1 = $ 25, y n2 = 35, 2X = $ 530, S2 = $ 20.

a) Construya un intervalo del 95 % de confianza para la diferencia entre los

pagos medios a los obreros de las dos ciudades.

210

b) ¿Difieren los pagos medios a los obreros en las dos ciudades? Explique.

Solución

Datos: n1 = 35, 1X = $ 540, S1 = $ 25, y n2 = 35, 2X = $ 530, S2 = $

20.

a) Un intervalo de confianza para la diferencia de pagos medios viene dado por:

2121

21

21

21

2121 )(,)( XXXX ZXXZXX ........... (1)

Si 1 – α = 0.95, entonces: Z0 = Z 0.975 = 1.96

35

)20(

35

)25( 22

2

2

2

1

2

1

21

n

S

n

SXX = $ 5.41


1 - 2 ϵ [(540 – 530) – 1.96 (5.41) ; (540 – 530) – 1.96 (5.41)] = [10 ± 10.60]

Luego: 1 - 2 ϵ [-0.60; 20.60] $ con el 95% de confianza. Rpta.

Interpretación: la diferencia entre los pagos medios a los obreros de las dos

ciudades se encuentra entre $ -0.60 y 20.60 con el 95% de confianza.

b) Responder a la pregunta ¿Difieren los pagos medios a los obreros en las dos

ciudades? implica responder si ¿1 ≠ 2? o también ¿1 - 2 ≠ 0?

Si apreciamos el intervalo de confianza construido en a) 1 - 2 toma el valor

cero, es decir 1 - 2 = 0 o 1 = 2. Por lo tanto, los pagos medios a los obreros

en las dos ciudades no difieren. Rpta.

19. Se compararon dos marcas de cigarrillos, 1 y 2, respecto a su contenido de

nicotina en miligramos; dos muestras aleatorias de 40 cigarrillos de la marca 1 y

50 de la marca 2, dieron estos resultados:

n1 = 40 cigarros, 1X = 14.3 mg., S1 = 2.9 y n2 = 50, 2X = 15.7, S2 = 3.8.

a) Construya un intervalo del 99 % de confianza para la diferencia entre las

medias del contenido de nicotina para las dos marcas de cigarrillos.

b) ¿Difieren las dos marcas en su contenido medio de nicotina? Explique.

Solución

Datos: n1 = 40, 1X = 14.3 mg., S1 = 2.9 y n2 = 50, 2X = 15.7, S2 = 3.8.

211

a) Un intervalo de confianza para la diferencia de contenido medio viene dado por:

2121

21

21

21

2121 )(,)( XXXX ZXXZXX ........... (1)

Si 1 – α = 0.99, entonces: Z0 = Z 0.995 = 2.575

50

)8.3(

40

)9.2( 22

2

2

2

1

2

1

21

n

S

n

SXX = 0.71mg.


1 - 2 ϵ [(14.3 – 15.7) – 2.575 (0.71) ; (14.3 – 15.7) + 2.575 (0.71)] = [-1.4 ±

1.83]

Luego: 1 - 2 ϵ [-3.23; 0.43] mg. con el 99% de confianza. Rpta.

Interpretación: con el 99% de confianza, la diferencia entre las medias del

contenido de nicotina para las dos marcas de cigarrillos se encuentra entre -3.23 y

0.43 mg.

b) Responder a la pregunta ¿Difieren las dos marcas en su contenido medio de

nicotina? es responder si ¿1 ≠ 2? o también ¿1 - 2 ≠ 0?

El intervalo de confianza construido en a) 1 - 2 toma el valor cero, es decir 1 -

2 = 0 o 1 = 2. Por lo tanto, el contenido medio de nicotina para las dos marcas

no difiere. Rpta.

20. Se entrevistaron dos grupos de mujeres respecto a su interés por la compra de

botas de cuero. De una muestra de 300 mujeres menores de 40 años, sólo 60

estuvieron interesadas, mientras que de 200 mujeres 40 años a más, 54

mostraron interés.


entre las verdaderas proporciones de mujeres menores de 40 años y las de 40

años a más que mostraron interés por la compra de botas de cuero.

b) ¿Es diferente la proporción de mujeres menores de 40 años y las de 40 años a

más que mostraron interés por la compra de botas de cuero? Explique.

Solución

Sean: grupo 1 = mujeres menores de 40 años y grupo 2 = mujeres de 40 años a

más.

Datos: n1 = 300, X1 = 60, n2 = 200 y X2 = 54

212

a) El intervalo de confianza para la diferencia de proporciones de mujeres

menores de 40 años (P1) y las de 40 años a más (P2) que mostraron interés por

la compra de botas de cuero, P1 - P2 está dado por:

2121

21

21

21

2121 )(,)( pppp ZppZppPP ............... (1)

Si 1 – α = 0.99, entonces Z0 = Z 0.995 = 2.575. Además:

300

60

1

11

n

Xp = 0.20 → q1 = 0.80 y

200

54

2

22

n

Xp = 0.27 → q2 =

0.73

21 pp = 200

)73.0)(27.0(

300

)80.0)(20.0(

2

22

1

11 n

qp

n

qp = 0.039

Z021 pp = 2.575 (0.039) = 0.1004


P1 - P2 [(0.20 – 0.27) – 0.1004 ; (0.20 – 0.27) + 0.1004] = [-0.07 ± 0.1004]

P1 - P2 [-0.1704 ; 0.0304] con el 95% de confianza. Rpta.

Interpretación: la diferencia de proporciones de mujeres menores de 40 años

(P1) y las de 40 años a más (P2) que mostraron interés por la compra de botas

de cuero, está entre -0.1704 y 0.0304 con el 99% de confianza.

b) La pregunta ¿Es diferente la proporción de mujeres menores de 40 años y las

de 40 años a más que mostraron interés por la compra de botas de cuero?

implica preguntar si ¿P1 ≠ P2? o también ¿P1 - P2 ≠ 0?

La diferencia P1 - P2 = 0 está incluida en el intervalo de confianza construido en

a), puede ser cero, es decir P1 - P2 = 0 o P1 = P2. Por lo tanto, no es diferente la

proporción de mujeres menores de 40 años y las de 40 años a más que mostraron

interés por la compra de botas de cuero. Rpta.

21. A fin de determinar el nivel de aceptación de la gestión presidencial (X), se

entrevistaron dos grupos de ciudadanos: de Lima Metropolitana (1) y del Resto

del País (2), se obtuvieron los siguientes resultados:

Lima M. (1): n1 = 800, X1 = 280; Resto del País (2): n2 = 1200, X2 =

300

213


entre las verdaderas proporciones de “limeños” y “no limeños” que están de

acuerdo con la gestión presidencial.

b) ¿Son diferentes las verdaderas proporciones de “limeños” y “no limeños” que

están de acuerdo con la gestión presidencial?

Solución

Datos: Lima M. (1): n1 = 800, X1 = 280; Resto del País (2): n2 = 1200, X2 =

300.

a) El intervalo de confianza para la diferencia de proporciones de “limeños” (P1)

y “no limeños” (P2) que están de acuerdo con la gestión presidencial es:

2121

21

21

21

2121 )(,)( pppp ZppZppPP ............... (1)


800

280

1

11

n

Xp = 0.35 → q1 = 0.65 y

1200

300

2

22

n

Xp = 0.25 → q2 =

0.75

21 pp = 1200

)75.0)(25.0(

800

)65.0)(35.0(

2

22

1

11 n

qp

n

qp = 0.021

Z021 pp = 1.96 (0.039) = 0.041


P1 - P2 [(0.35 – 0.25) – 0.041 ; (0.35 – 0.25) + 0.041] = [0.10 ± 0.041]

P1 - P2 [0.059; 0.141] con el 95% de confianza. Rpta.

Interpretación: con el 95% de confianza, la diferencia de proporciones de

“limeños” y “no limeños” que están de acuerdo con la gestión presidencial,

está entre 0.059 y 0.141.

b) La pregunta ¿Son diferentes las verdaderas proporciones de “limeños” y “no

limeños” que están de acuerdo con la gestión presidencial? implica preguntar

si ¿P1 ≠ P2? o también ¿P1 - P2 ≠ 0?

La diferencia P1 - P2 = 0 no está incluida en el intervalo de confianza construido

en a), es diferente de cero, es decir P1 - P2 ≠ 0 o P1 ≠ P2. Por lo tanto, si son

diferentes las verdaderas proporciones de “limeños” y “no limeños” que están de

acuerdo con la gestión presidencial. Rpta.

214

22. En una muestra aleatoria de 400 hombres y 600 mujeres que ven cierto programa

de TV, 220 hombres y 300 mujeres dijeron que les gustaba.


entre las verdaderas proporciones de hombres y mujeres que les gusta el

programa.

b) ¿Se puede afirmar que son diferentes las verdaderas proporciones de hombres

y mujeres que les gusta el programa?

Solución

Sean: grupo 1 = hombres y grupo 2 = mujeres.

Datos: n1 = 400, X1 = 220, n2 = 600 y X2 = 300

a) El intervalo de confianza para la diferencia de proporciones de hombres (P1)

y de mujeres (P2) que les gusta el programa de TV, P1 - P2 está dado por:

2121

21

21

21

2121 )(,)( pppp ZppZppPP ............... (1)


400

220

1

11

n

Xp = 0.55 → q1 = 0.45 y

600

300

2

22

n

Xp = 0.50 → q2 =

0.50

21 pp = 600

)50.0)(50.0(

400

)45.0)(55.0(

2

22

1

11 n

qp

n

qp = 0.032

Z021 pp = 2.575 (0.032) = 0.083


P1 - P2 [(0.55 – 0.50) – 0.083 ; (0.55 – 0.50) + 0.083] = [0.05 ± 0.083]

P1 - P2 [-0.033; 0.133] con el 99% de confianza. Rpta.

Interpretación: la diferencia de proporciones de hombres (P1) y de mujeres

(P2) que les gusta el programa de TV, está entre -0.033 y 0.133 con el 99% de

confianza.

b) La pregunta ¿Se puede afirmar que son diferentes las verdaderas proporciones

de hombres y mujeres que les gusta el programa? implica preguntar si ¿P1 ≠

P2? o también ¿P1 - P2 ≠ 0?

La diferencia P1 - P2 = 0 está incluida en el intervalo de confianza construido

en a), puede ser cero, es decir P1 - P2 = 0 o P1 = P2. Por lo tanto, no son

215

diferentes las proporciones de hombres y mujeres que les gusta el programa.

Rpta.

23. De los alumn@s de la UNAC se toma una muestra aleatoria de 600 mujeres,

300 de las cuales están a favor de la titulación con tesis. En una muestra de 400

hombres, 240 indican que están a favor de lo mismo.

a) Halle un intervalo de confianza del 95% para la verdadera diferencia de

proporciones de alumnos y alumnas que están a favor de la titulación con

tesis.

b) ¿Se puede afirmar que son diferentes las verdaderas proporciones de alumnos

y alumnas que están a favor de la titulación con tesis?

Solución

Sean: grupo 1 = alumnos (hombres) y grupo 2 = alumnas (mujeres).

Datos: n1 = 400, X1 = 240, n2 = 600 y X2 = 300

a) El intervalo de confianza para la diferencia de proporciones de alumnos (P1) y

de alumnas (P2) que están a favor de la titulación con tesis, P1 - P2 está dado

por:

2121

21

21

21

2121 )(,)( pppp ZppZppPP ............... (1)


400

240

1

11

n

Xp = 0.60 → q1 = 0.40 y

600

300

2

22

n

Xp = 0.50 → q2 =

0.50

21 pp = 600

)50.0)(50.0(

400

)40.0)(60.0(

2

22

1

11 n

qp

n

qp = 0.032

Z021 pp = 1.96 (0.032) = 0.063


P1 - P2 [(0.60 – 0.50) – 0.063 ; (0.60 – 0.50) + 0.063] = [0.10 ± 0.063]


Interpretación: la diferencia de proporciones de alumnos (P1) y de alumnas

(P2) que están a favor de la titulación con tesis en la UNAC, está entre 0.037

y 0.163 con el 95% de confianza.

216

b) La pregunta ¿Se puede afirmar que son diferentes las verdaderas proporciones

de alumnos y alumnas que están a favor de la titulación con tesis? implica

preguntar si ¿P1 ≠ P2? o también ¿P1 - P2 ≠ 0?

La diferencia P1 - P2 = 0 no está incluida en el intervalo de confianza

construido en a), no puede ser cero, es decir P1 - P2 ≠ 0 o P1 ≠ P2. Por lo

tanto, son diferentes las proporciones de alumnos y alumnas de la UNAC que

están a favor de la titulación con tesis. Rpta.

24. Se entrevistaron a hombres y mujeres respecto a su interés por una nueva marca

de perfume. En una muestra aleatoria de 500 hombres y 500 mujeres, 200

hombres y 160 mujeres dijeron que les gustaba el nuevo perfume.


entre las proporciones de hombres y mujeres que les gusta el nuevo perfume.

b) ¿Son diferentes las verdaderas proporciones de hombres y mujeres que

dijeron que les gustaba el nuevo perfume? Explique.

Solución


Datos: n1 = 500, X1 = 200, n2 = 500 y X2 = 160

a) El intervalo de confianza para la diferencia de proporciones de hombres (P1)

y de mujeres (P2) que les gusta el el nuevo perfume, P1 - P2 está dado por:

2121

21

21

21

2121 )(,)( pppp ZppZppPP ............... (1)


500

200

1

11

n

Xp = 0.40 → q1 = 0.60 y

500

160

2

22

n

Xp = 0.32 → q2 =

0.68

21 pp = 500

)68.0)(32.0(

500

)60.0)(40.0(

2

22

1

11 n

qp

n

qp = 0.030

Z021 pp = 1.96 (0.030) = 0.059


P1 - P2 [(0.40 – 0.32) – 0.059 ; (0.40 – 0.32) + 0.059] = [0.08 ± 0.059]


217

Interpretación: la diferencia de proporciones de hombres (P1) y de mujeres

(P2) que les gusta el nuevo perfume, está entre 0.021 y 0.139 con el 95% de

confianza.

b) La pregunta ¿Son diferentes las verdaderas proporciones de hombres y

mujeres que dijeron que les gustaba el nuevo perfume? implica preguntar si

¿P1 ≠ P2? o también ¿P1 - P2 ≠ 0?

La diferencia P1 - P2 = 0 no está incluida en el intervalo de confianza

construido en a), no puede ser cero, es decir P1 - P2 ≠ 0 o P1 ≠ P2. Por lo

tanto, si son diferentes las proporciones de hombres y mujeres que les gusta el

nuevo perfume. Rpta.

25. Es ampliamente conocido que no cualquiera coopera respondiendo a

cuestionarios de los entrevistadores puerta por puerta. En un experimento para

determinar si las mujeres son más cooperadoras que los hombres, se obtuvieron

los siguientes resultados: Hombres: n1 = 175, X1 = 85; Mujeres: n2 =

250, X2 = 150.

a) Determine un intervalo de confianza del 99 % para la diferencia de mujeres y

hombres cooperadores.

b) ¿Es diferente la proporción de mujeres y hombres cooperadores?

Solución


Datos: n1 = 175, X1 = 84, n2 = 250 y X2 = 150

a) El intervalo de confianza para la diferencia de proporciones de mujeres (P2) y

de hombres (P1) que coopera respondiendo a cuestionarios de los

entrevistadores puerta por puerta, P2 – P1 está dado por:

1212

21

12

21

1212 )(,)( pppp ZppZppPP ............... (1)


175

84

1

11

n

Xp = 0.48 → q1 = 0.52 y

250

150

2

22

n

Xp = 0.60 → q2 =

0.40

218

12 pp =21 pp =

250

)40.0)(60.0(

175

)52.0)(48.0(

2

22

1

11 n

qp

n

qp = 0.049

Z021 pp = 2.575 (0.049) = 0.126


P1 - P2 [(0.60 – 0.48) – 0.126; (0.60 – 0.48) + 0.126] = [0.12 ± 0.126]

P1 - P2 [-0.006; 0.246] con el 99% de confianza. Rpta.

Interpretación: con el 99% de confianza, la diferencia de proporciones de

mujeres (P2) y de hombres (P1) que coopera respondiendo a cuestionarios de

los entrevistadores puerta por puerta, está entre -0.006 y 0.246.

b) La pregunta ¿Es diferente la proporción de mujeres y hombres cooperadores?

implica preguntar si ¿P2 ≠ P1? o también ¿P2 – P1 ≠ 0?

La diferencia P2 – P1 = 0 está incluida en el intervalo de confianza construido

en a), puede ser cero, es decir P2 – P1 = 0 o P2 = P1. Por lo tanto, no es

diferente la proporción de mujeres y hombres que cooperan respondiendo a

cuestionarios de los entrevistadores puerta por puerta. Rpta.

26. Se entrevistaron dos grupos de mujeres respecto a su interés por los polos de

verano “Burberry”. De una muestra de 250 mujeres menores de 40 años, 150

estuvieron interesados, mientras que de 250 mujeres de 40 años a más, sólo 120

mostraron interés.



años a más que mostraron interés por los polos de verano “Burberry”.

b) ¿Existe diferencia entre la proporción de mujeres menores de 40 años y las de

40 años a más que mostraron interés por los polos de verano “Burberry”?

Explique.

Solución

Sean: grupo 1 = mujeres menores de 40 años y grupo 2 = mujeres de 40 años a

más.

Datos: n1 = 250, X1 = 150, n2 = 250 y X2 = 120

a) El intervalo de confianza para la diferencia de proporciones de mujeres

menores de 40 años (P1) y las de 40 años a más (P2) que mostraron interés por

los polos de verano “Burberry”, P1 - P2 está dado por:

219

2121

21

21

21

2121 )(,)( pppp ZppZppPP ............... (1)


250

150

1

11

n

Xp = 0.60 → q1 = 0.40 y

250

120

2

22

n

Xp = 0.48 → q2 =

0.52

21 pp = 250

)52.0)(48.0(

250

)40.0)(60.0(

2

22

1

11 n

qp

n

qp = 0.0443

Z021 pp = 1.96 (0.0443) = 0.087


P1 - P2 [(0.60 – 0.48) – 0.087; (0.60 – 0.48) + 0.087] = [0.12 ± 0.087]


Interpretación: la diferencia de proporciones de mujeres menores de 40 años

(P1) y las de 40 años a más (P2) que mostraron interés por los polos de verano

“Burberry”, está entre 0.033 y 0.207 con el 99% de confianza.

b) La pregunta ¿Es diferente la proporción de mujeres menores de 40 años y las

de 40 años a más que mostraron interés por los polos de verano “Burberry”?

implica preguntar si ¿P1 ≠ P2? o también ¿P1 - P2 ≠ 0?

La diferencia P1 - P2 = 0 no está incluida en el intervalo de confianza construido

en a), no puede ser cero, es decir P1 - P2 ≠ 0 o P1 ≠ P2. Por lo tanto, no es

diferente la proporción de mujeres menores de 40 años y las de 40 años a más que

mostraron interés por los polos de verano “Burberry”. Rpta.

27. De los 2000 establecimientos pequeños de una ciudad se extrae una muestra

aleatoria de 25 establecimientos y se recolecta información sobre el número de

personas empleadas (X) por establecimiento, obteniéndose la siguiente

información: 13825

1

i

iX y 76.114525

1

2 i

iX .

Calcule e interprete intervalos de confianza del 95 % para:

a) El número medio de empleados por establecimiento en la ciudad.

b) La varianza del número de empleados por establecimiento.

220

c) Para estimar en el futuro el número medio de empleados por establecimiento,

con un margen de error máximo de 0.9 empleados y una confianza del 95 %

¿qué tamaño mínimo de muestra será necesario?

Solución

Con la información dada se determina el promedio y la varianza muestral de los

empleados por establecimiento así:

25

138

25

1

n

X

X i

i

= 5.52 empleados por establecimiento.

125

)52.5(2576.1145

11

)(2

25

1

2225

1

2

2

n

XnX

n

XX

S i

i

i

i

= 16 (empleados)2

S = 4 empleados. Otros datos: N = 2000 establecimientos, n = 25, 1 – α = 0.95.

a) Para hallar el intervalo de confianza para la media se usa la distribución Tn-1

de student (n < 30), si 1 – α = 0.95 → en la Tabla 3, t0 = t24 , 0.975 = 2.064.


[ X - t0 nS / , X + t0 nS / ]


[5.52 – 2.064 x 25

4 , 5.52 + 2.064 x

25

4] = [5.52 ± 1.65]

Por lo tanto: [3.87 ; 7.17] empleados con el 95% de confianza.

Rpta.

Interpretación: en la ciudad el verdadero número medio de empleados por

establecimiento pequeño, se encuentra entre 3.87 y 7.17 con el 95% de confianza.


²

a

Sn

b

Sn 22 )1(,

)1(

Como n = 25, S = 4 y 1 – α = 0.95, entonces en la Tabla 2:

a = 2

025.0,24x = 12.4 y b = 2

975.0,24x = 39.4


que:

221

²

4.12

)4)(125(,

4.39

)4)(125( 22

Por lo tanto: ² [9.75 ; 30.97 ] (emp.)² con el 95% de confianza.

Rpta.

Interpretación: la varianza del número de empleados por establecimiento

pequeño 9.75 y 30.97 (empleados)² con el 95% de confianza.

c) El tamaño de muestra está dado por: 2

22

0E

Zn

Donde: | x - µ | = E = 0.9, 1 – α = 0.95 → en la Tabla 1, Z = Z0.975 = 1.96

y S = 4. Reemplazando en la fórmula para n se tiene:

2

22

09.0

496.1n = 76 establecimientos. Rpta.

Interpretación.- para estimar el número medio de empleados por

establecimiento, con el 95% de confianza y un error máximo de 0.9

empleados, se requiere de 76 establecimientos.

28. Las cajas de un cereal producido por una fábrica deben tener un contenido de 16

onzas. Un inspector tomó una muestra que arrojó los siguientes pesos en onzas:

15.7, 15.7, 16.3, 15.8, 16.1, 15.9, 16.2, 15.9, 15.8, 15.6

Calcule e interprete intervalos de confianza del 90 % para la media poblacional y

la varianza poblacional de los pesos de las cajas de cereal.

Solución



10

159

10

1

n

X

X i

i

= 15.9 onzas por caja.

110

)9.15(1058.2528

11

)(2

10

1

2210

1

2

2

n

XnX

n

XX

S i

i

i

i

= 0.0533 (onzas)2

S = 0.231 onzas. Otros datos: n = 10 cajas, 1 – α = 0.90.


de student (n < 30), si 1 – α = 0.90 → en la Tabla 3, t0 = t9, 0.95 = 1.833.

222


[ X - t0 nS / , X + t0 nS / ]


[15.9 – 1.833 x 10

231.0 , 15.9 + 1.833 x

10

231.0] = [15.9 ± 0.134]

Por lo tanto: [15.766 ; 16.034] onzas con el 90% de confianza.

Rpta.

Interpretación: el verdadero peso medio de las cajas de cereal, se encuentra entre

15.766 y 16.034 onzas, con el 95% de confianza.


²

a

Sn

b

Sn 22 )1(,

)1(

Como n = 10, S = 0.231 y 1 – α = 0.90, entonces en la Tabla 2:

a = 2

05.0,9x = 3.33 y b = 2

95.0,9x = 16.9


que:

²

33.3

)231.0)(110(,

9.16

)231.0)(110( 22

Por lo tanto: ² [0.0284; 0.1442] (onzas)² con el 90% de confianza.

Rpta.

Interpretación: con el 90% de confianza, la varianza del peso de las cajas de

cereal se encuentra entre 0.0284 y 0.1442 (onzas)².

29. Los pesos netos (grs.) de una muestra aleatoria de 10 latas de leche fueron los

siguientes:

259, 262, 259, 258, 256, 257, 257, 263, 258, 261


la varianza poblacional de los pesos netos.

Solución

El promedio y la varianza muestral de los empleados por establecimiento es:

223

10

2590

10

1

n

X

X i

i

= 259 gr. por lata.

110

)259(10670858

11

)(2

10

1

2210

1

2

2

n

XnX

n

XX

S i

i

i

i

= 5.3333 (gr.)2

S = 2.31 gr. Otros datos: n = 10 cajas, 1 – α = 0.95.




[ X - t0 nS / , X + t0 nS / ]


[259 – 2.262 x 10

31.2 , 259 + 2.262 x

10

31.2] = [259 ± 1.65]

Por lo tanto: [257.35; 260.65] gr. con el 95% de confianza.

Rpta.

Interpretación: el verdadero peso medio de las de leche, se encuentra entre 257.35

y 260.65 gramos, con el 95% de confianza.


²

a

Sn

b

Sn 22 )1(,

)1(


a = 2

025.0,9x = 2.70 y b = 2

975.0,9x = 19.0


que:

²

70.2

)31.2)(110(,

0.19

)31.2)(110( 22

Por lo tanto: ² [2.53; 17.79] (gramos)² con el 95% de confianza.

Rpta.

Interpretación: con el 95% de confianza, la varianza del peso de las latas de

leche se encuentra entre 2.53 y 17.79] (gramos)².

224

30. De un área de la ciudad en la que habitan 1000 familias se extrae una muestra

aleatoria de 20 familias y se recolecta información sobre el número de personas

(X) por familia, obteniéndose la siguiente información:

10520

1

i

iX 76320

1

2 i

iX

Calcule e interprete intervalos de confianza del 99 % para el(la) verdadero(a):

a) Número medio de personas por familia. ¿Aceptaría usted que el tamaño

medio de las familias es de 6 personas?

b) Número total de personas en el área.

c) La varianza del número de personas por familia en el área.

d) Para estimar en el futuro el número medio de personas por familia, con un

margen de error máximo de 0.6 personas y una confianza del 99 % ¿qué

tamaño mínimo de muestra será necesario?

Solución



20

105

20

1

n

X

X i

i

= 5.25 persona por familia.

120

)25.5(20763

11

)(2

20

1

2220

1

2

2

n

XnX

n

XX

S i

i

i

i

= 11.145 (personas)2

S = 3.34 personas. Otros datos: N = 1000 familias, n = 20, 1 – α = 0.99.




[ X - t0 nS / , X + t0 nS / ]


[5.25 – 2.861 x 20

34.3 , 5.25 + 2.861 x

20

34.3] = [5.25 ± 2.14]

Por lo tanto: [3.11 ; 7.39] personas con el 99% de confianza.

Rpta.

225

Interpretación: en el área de la ciudad el verdadero número medio de personas por

familia, se encuentra entre 3.11 y 7.39 con el 99% de confianza.

b) Para hallar el intervalo de confianza para el total (Nμ) se multiplica los

límites de la media por N = 1000, así:

Total = Nµ ϵ 1000 [3.11 ; 7.39] = [3110 ; 7390] personas con el 99% de

confianza. Rpta.

Interpretación.- con el 99% de confianza, el verdadero total de personas en el

área de la ciudad se encuentra entre 3110 y 7390 personas.


²

a

Sn

b

Sn 22 )1(,

)1(


a = 2

005.0,19x = 6.84 y b = 2

995.0,19x = 38.6


que:

²

84.6

)34.3)(120(,

6.38

)34.3)(120( 22

Luego: ² [5.49 ; 30.99 ] (personas)² con el 99% de confianza.

Rpta.

Interpretación: la varianza del número de personas por familia se encuentra entre

5.49 y 30.99 (personas)² con el 99% de confianza.


22

0E

Zn

Donde: E = | x - µ | = 0.6, 1 – α = 0.99 → en la Tabla 1, Z = Z0.995 =

2.575 y S = 3.34. Reemplazando en la fórmula para n se tiene:

2

22

0)6.0(

)34.3()575.2(n = 205.

Como f = n0 / N = 205 / 1000 = 0.205 > 0.05 es necesario ajustar el tamaño

de muestra así:

226

1000

2051

205

1 0

0

N

n

nn = 170 familias Rpta.

Interpretación.- para estimar el número medio de personas por familia, con

el 99% de confianza y un error máximo de 0.6 personas, se requiere de 170

familias.

31. Muestras del pago semanal a los obreros (1) y obreras (2) proporcionan los

siguientes datos: n1 = 15, 1x = $ 135, S1 = $ 25 y n2 = 15, 2x = $ 125,

S2 = $ 15. Calcule e interprete intervalos de confianza del 95% para:

a) La razón de varianzas de los pagos semanales a obreros y obreras. ¿Son

iguales las varianzas de los pagos semanales a obreros y obreras?

b) La diferencia entre los pagos medios semanales a obreros y obreras. ¿Son

diferentes los pagos medios semanales a obreros y obreras? Explique.

Solución

a) Intervalo de confianza para la razón de varianzas: 2

2

2

1

ϵ

c

SS

d

SS 2

2

2

1

2

2

2

1 /;

/

Datos: n1 = n2 = 15, 2

1S = 252 = 625, 2

2S = 152 = 225. Como 1 – α = 0.95,

entonces en la tabla 4: d = F14, 14, 0.975 = 2.98 y c = F14, 14, 0.025 = 1/ F14, 14, 0.975 = 1/

2.98 = 0.336.


2

2

2

1

ϵ

336.0

225/625;

98.2

225/625 = [0.93; 8.27] con el 95% de confianza.

Interpretación.- con el 95% de confianza, la razón de varianzas de los pagos

semanales a obreros y obreras, se encuentra entre 0.93 y 8.27.

Preguntar sí: ¿Son iguales las varianzas de los pagos semanales a obreros y

obreras? Es similar a preguntar sí: ¿ 2

1 = 2

2 o 2

2

2

1

= 1? La respuesta es sí, ya

que el intervalo para la razón de varianzas toma el valor 1, es decir 2

2

2

1

= 1,

entonces 2

1 = 2

2 (las varianzas de los pagos semanales a obreros y obreras son

iguales)

227

b) Considerando que las muestras son pequeñas y que las varianzas de los pagos

semanales a obreros y obreras son iguales, el intervalo de confianza para la

diferencia entre los de los pagos semanales a obreros y obreras está dado por:

1 - 2 ϵ [( 1x - 2x ) t0 2121

2

22

2

11 11

2

)1()1(

nnnn

SnSn

]

Datos del problema:

n1 = 15, 1x = $ 135, S1 = $ 25 y n2 = 15, 2x = $ 125, S2 = $ 15.

Los grados de libertad de la t son n1 + n2 – 2 = 15 + 15 – 2 = 28.

Si 1 – α = 0.95, En la tabla 3, t0 = t28, 0.975 = 2.048.


1 - 2 ϵ [(135 – 125) 2.048 15

1

15

1

21515

)15)(115()25)(115( 22

]

1 - 2 ϵ [10 2.048(7.53) ] 1 - 2 ϵ [10 15.42 ]

Por lo tanto:

1 - 2 ϵ [-5.42 ; 25.42] $ con el 95% de confianza. Rpta.

Interpretación: la diferencia entre los pagos semanales a obreros y obreras, se

encuentra comprendida entre $ -5.42 y 25.42 con el 95% de confianza.

Preguntar sí, ¿Son diferentes los pagos medios semanales a obreros y

obreras? Es similar a preguntar sí: ¿1 ≠ 2 o 1 - 2 ≠ 0? La respuesta es no,

ya que el intervalo para su diferencia de medias toma el valor cero, es decir,

1 - 2 = 0 o 1 = 2. Entonces, los pagos medios semanales a obreros y

obreras son iguales.

32. Dos grupos (de 16 alumnas cada uno) escogidos al azar de una escuela para

secretarias, aprenden taquigrafía por dos métodos diferentes y luego se les

somete a pruebas de dictado. Se encuentra que el grupo 1 obtiene en promedio

123 palabras por minuto con una desviación estándar de 15 palabras, mientras

que el grupo 2 promedia 110 palabras por minuto con una desviación estándar de

10 palabras. Calcule e interprete intervalos de confianza del 99 % para:

a) La verdadera razón de varianzas de los 2 grupos. ¿Son heterogéneas las

varianzas de ambos grupos?

b) La diferencia de medias de palabras por minuto de ambos métodos. ¿Es

diferente el promedio de palabras por minuto para los dos métodos?

228

Solución

Datos: n1 = 16, 1x = 123, S1 = 15 y n2 = 16, 2x = 110, S2 = 10.


2

2

1

ϵ

c

SS

d

SS 2

2

2

1

2

2

2

1 /;

/

Si: n1 = n2 = 16, 2

1S = 152 = 225, 2

2S = 102 = 100. Como 1 – α = 0.99, entonces

en la tabla 4: d = F15, 15, 0.995 = 4.07 y c = F15, 15, 0.005 = 1/ F15, 15, 0.995 = 1/ 4.07 =

0.246.


2

2

2

1

ϵ

246.0

100/225;

07.4


Interpretación.- con el 99% de confianza, la razón de varianzas de las palabras por

minuto de ambos grupos, se encuentra entre 0.55 y 9.15.

Preguntar sí: ¿Son heterogéneas las varianzas de ambos grupos? Es similar a

preguntar sí: ¿ 2

1 ≠ 2

2 o 2

2

2

1

≠ 1?

La respuesta es no, ya que el intervalo para la razón de varianzas toma el valor 1,

es decir 2

2

2

1

= 1, entonces 2

1 = 2

2 (las varianzas son homogéneas o iguales)

b) Considerando que las muestras son pequeñas y que las varianzas de las palabras

por minuto de ambos grupos son iguales, el intervalo de confianza para la

diferencia de medias de palabras por minuto de los dos métodos está dado por:

1 - 2 ϵ [( 1x - 2x ) t0 2121

2

22

2

11 11

2

)1()1(

nnnn

SnSn

]

Datos del problema:

n1 = 16, 1x = 123, S1 = 15 y n2 = 16, 2x = 110, S2 = 10.


Si 1 – α = 0.99, En la tabla 3, t0 = t30, 0.995 = 2.75.


1 - 2 ϵ [(123 – 110) 2.75 16

1

16

1

21616

)10)(116()15)(116( 22

]

1 - 2 ϵ [13 2.75(4.51) ] 1 - 2 ϵ [13 12.4]

229

Por lo tanto:

1 - 2 ϵ [0.6 ; 25.4] palabras por minuto con el 95% de confianza. Rpta.

Interpretación: la diferencia de medias de los dos métodos, se encuentra

comprendida entre 0.6 y 25.4 palabras por minuto con el 95% de confianza.

Preguntar sí, ¿Es diferente el promedio de palabras por minuto para los 2

métodos? Es similar a preguntar sí: ¿1 ≠ 2 o 1 - 2 ≠ 0? La respuesta es

sí, ya que el intervalo para su diferencia de medias no toma el valor cero, es

decir, 1 - 2 ≠ 0 o 1 ≠ 2. Entonces, el promedio de palabras por minuto

para ambos métodos sí es diferente.

33. Para determinar el costo medio de la enseñanza en las universidades 1 y 2, se

toma una muestra al azar de 21 alumnos de la universidad 1 arrojando un costo

medio de S/. 675 y una desviación estándar de S/ 90. Una muestra al azar de 21

alumnos de la universidad 2 da una costo medio de S/. 650 y una desviación

estándar de S/. 50. Calcule e interprete intervalos de confianza del 95% para:

a) La razón de varianzas de los costos de enseñanza en las universidades 1 y 2.

¿Son diferentes las varianzas de los costos de enseñanza en las 2

universidades?

b) La diferencia del costo medio de la enseñanza en las 2 universidades. ¿Son

diferentes los costos medios de la enseñanza en las universidades 1 y 2?

Solución

Datos: n1 = 21, 1x = S/. 675, S1 = 90 y n2 = 21, 2x = 650, S2 = 50.


2

2

1

ϵ

c

SS

d

SS 2

2

2

1

2

2

2

1 /;

/

Si: n1 = n2 = 21, 2

1S = 902 = 8100, 2

2S = 502 = 2500. Como 1 – α = 0.95,


2.46 = 0.407.


2

2

2

1

ϵ

407.0

2500/8100;

46.2


230

Interpretación.- con el 95% de confianza, la razón de varianzas de los costos de

enseñanza en las universidades 1 y 2, se encuentra entre 1.32 y 7.96.

Preguntar sí: ¿Son diferentes las varianzas de los costos de enseñanza en las 2

universidades? Es similar a preguntar sí: ¿ 2

1 ≠ 2

2 o 2

2

2

1

≠ 1?

La respuesta es sí, ya que el intervalo para la razón de varianzas no toma el valor

1, es decir 2

2

2

1

≠ 1, entonces 2

1 ≠ 2

2 (las varianzas de los costos de enseñanza

en las 2 universidades son diferentes o heterogéneas)

b) Considerando que las muestras son pequeñas y que las varianzas de los costos de

enseñanza en las 2 universidades son diferentes, el intervalo de confianza para la

diferencia de medias de los costos de enseñanza en las 2 universidades está dado

por:

1 - 2 ϵ [( 1x - 2x ) t0 2

2

2

1

2

1

n

S

n

S ]

Datos del problema:

n1 = 21, 1x = S/. 675, 2

1S = 8100 y n2 = 21, 2x = 650, 2

2S = 2500.

Si 1 – α = 0.95, en la tabla 3: t0 = tH, 0.975 = t31, 0.975 = 2.04.

Donde: H =

11 2

2

2

2

2

1

2

1

2

1

2

2

2

2

1

2

1

n

n

S

n

n

S

n

S

n

S

=

121

21

2500

121

21

8100

21

2500

21

8100

22

2

= 31.27 ≡ 31


1 - 2 ϵ [(675 - 650) 2.04 x 21

2500

21

8100 ] = [25 45.83]

Por lo tanto: 1 - 2 ϵ [-20.83 ; 70.83] S/. con el 95 % de confianza. Rpta.

Interpretación: con el 95% de confianza, la diferencia de los costos medios de

enseñanza en las universidades 1 y 2 se encuentra comprendido entre S/. -20.83

y S/. 70.83.

Preguntar sí: ¿Son diferentes los costos medios de la enseñanza en las

universidades 1 y 2? Es similar a preguntar sí: ¿1 ≠ 2 o 1 - 2 ≠ 0? La

231

respuesta es no, ya que el intervalo para su diferencia de medias toma el valor

cero, es decir, 1 - 2 = 0 o 1 = 2. Entonces, los costos medios de la

enseñanza en las universidades 1 y 2 no son diferentes, son iguales.

34. Dos máquinas embolsan diariamente detergente de manera independiente.

Mediante muestras aleatorias sin reemplazo de 12 bolsas de cada máquina se han

obtenido los siguientes resultados sobre el peso de las bolsas (en gramos):

n1 = 12, 1x = 505, S1 = 10 y n2 = 12, 2x = 495, S2 = 4.

Calcule e interprete intervalos de confianza del 99% para:

a) La razón de varianzas de los pesos de las bolsas con detergente de ambas

máquinas. ¿Son diferentes las varianzas de los pesos de las bolsas con

detergente de ambas máquinas?

b) La diferencia de los pesos medios de las bolsas con detergente de ambas

máquinas. ¿Son diferentes los pesos medios de las bolsas con detergente de

ambas máquinas?

Solución

Datos: n1 = 12, 1x = 505, S1 = 10 y n2 = 12, 2x = 495, S2 = 4.


2

2

1

ϵ

c

SS

d

SS 2

2

2

1

2

2

2

1 /;

/

Si: n1 = n2 = 12, 2

1S = 102 = 100, 2

2S = 42 = 16. Como 1 – α = 0.99, entonces en

la tabla 4: d = F11, 11, 0.995 = 5.32 y c = F11, 11, 0.005 = 1/ F11, 11, 0.995 = 1/ 5.32 = 0.188.


2

2

2

1

ϵ

188.0

16/100;

32.5


Interpretación.- con el 99% de confianza, la razón de varianzas de los pesos de las

bolsas con detergente de ambas máquinas, se encuentra entre 1.17 y 33.24.

Preguntar sí: ¿Son diferentes las varianzas de los pesos de las bolsas con

detergente de ambas máquinas? Es similar a preguntar sí: ¿ 2

1 ≠ 2

2 o 2

2

2

1

≠

1?

232

La respuesta es sí, ya que el intervalo para la razón de varianzas no toma el valor

1, es decir 2

2

2

1

≠ 1, entonces 2

1 ≠ 2

2 (las varianzas de los pesos de las bolsas

con detergente de ambas máquinas son diferentes o heterogéneas)

b) Considerando que las muestras son pequeñas y que las varianzas de los pesos de

las bolsas con detergente de ambas máquinas son diferentes, el intervalo de

confianza para la diferencia de medias de los pesos de las bolsas con detergente

de ambas máquinas está dado por:

1 - 2 ϵ [( 1x - 2x ) t0 2

2

2

1

2

1

n

S

n

S ]

Datos del problema:

n1 = 12, 1x = 505, 2

1S = 100 y n2 = 12, 2x = 495, 2

2S = 16.

Si 1 – α = 0.99, en la tabla 3: t0 = tH, 0.995 = t14, 0.995 = 2.977.

Donde: H =

11 2

2

2

2

2

1

2

1

2

1

2

2

2

2

1

2

1

n

n

S

n

n

S

n

S

n

S

=

112

12

16

112

12

100

12

16

12

100

22

2

= 14.43 ≡ 14


1 - 2 ϵ [(505 - 495) 2.977 x 12

16

12

100 ] = [10 9.26]

Por lo tanto: 1 - 2 ϵ [0.74 ; 19.26] gr. con el 99 % de confianza. Rpta.

Interpretación: con el 99% de confianza, la diferencia de los pesos medios de las

bolsas con detergente de ambas máquinas se encuentra comprendido entre 0.74 y

19.26 gramos.

Preguntar sí: ¿Son diferentes los pesos medios de las bolsas con detergente de

ambas máquinas? Es similar a preguntar sí: ¿1 ≠ 2 o 1 - 2 ≠ 0? La

respuesta es sí, ya que el intervalo para su diferencia de medias no toma el

valor cero, es decir, 1 - 2 ≠ 0 o 1 ≠ 2. Entonces, los pesos medios de las

bolsas con detergente de ambas máquinas sí son diferentes.

233

35. Se compararon dos marcas de llantas de automóvil, 1 y 2, respecto a su duración

en Km; dos muestras aleatorias de 16 llantas de cada marca, dieron estos

resultados:

n1 = 16, 1x = 49,658, S1 = 2,150 y n2 = 16, 2x = 48,125, S2 =

1,875.


a) La razón de varianzas de la duración de las llantas de ambas marcas. ¿Son

diferentes las varianzas de la duración de las llantas de ambas marcas?

b) La diferencia de las duraciones medias de las llantas de ambas marcas. ¿Son

diferentes las duraciones medias de las llantas de ambas marcas?

Solución

Datos: n1 = 16, 1x = 49,658, S1 = 2,150 y n2 = 16, 2x =

48,125, S2 = 1875.


2

2

1

ϵ

c

SS

d

SS 2

2

2

1

2

2

2

1 /;

/

Si: n1 = n2 = 16, 2

1S = 4’622,500, 2

2S = 3’515,625. Como 1 – α = 0.99,


4.07 = 0.246.


2

2

2

1

ϵ

246.0

3515625/4622500;

07.4

3515625/4622500 = [0.32; 5.34] con el

99% de confianza.

Interpretación.- con el 99% de confianza, la razón de varianzas de la duración de

las llantas de ambas marcas, se encuentra entre 0.32 y 5.34.

Preguntar sí: ¿Son diferentes las varianzas de la duración de las llantas de ambas

marcas? Es similar a preguntar sí: ¿ 2

1 ≠ 2

2 o 2

2

2

1

≠ 1?

La respuesta es no, ya que el intervalo para la razón de varianzas toma el valor 1,

es decir 2

2

2

1

= 1, entonces 2

1 = 2

2 (las varianzas de la duración de las llantas

de ambas marcas son homogéneas o iguales).

234

b) Considerando que las muestras son pequeñas y que las varianzas de la duración de

las llantas de ambas marcas son iguales, el intervalo de confianza para la

diferencia de medias de la duración de las llantas de ambas marcas está dado por:

1 - 2 ϵ [( 1x - 2x ) t0 2121

2

22

2

11 11

2

)1()1(

nnnn

SnSn

]

Datos del problema:

n1 = 16, 1x = 49,658, S1 = 2,150 y n2 = 16, 2x = 48,125, S2 = 1,875.


Si 1 – α = 0.99, En la tabla 3, t0 = t30, 0.995 = 2.75.


1 - 2 ϵ [(49,658 – 48,125) 2.75

16

1

16

1

21616

)1875)(116()2150)(116( 22

]

1 - 2 ϵ [1533 2.75(713.18) ] 1 - 2 ϵ [1533 1961.25]

Por lo tanto:

1 - 2 ϵ [-428.25 ; 3594.25] Km. con el 99% de confianza. Rpta.

Interpretación: con el 99% de confianza, la diferencia de duraciones medias de las

llantas de las marcas 1 y 2, se encuentra comprendida entre -428.25 ; 3594.25

Km.

Preguntar sí, ¿Son diferentes las duraciones medias de las llantas de ambas

marcas? Es similar a preguntar sí: ¿1 ≠ 2 o 1 - 2 ≠ 0?

La respuesta es no, ya que el intervalo para su diferencia de medias toma el

valor cero, es decir, 1 - 2 = 0 o 1 = 2. Entonces, las duraciones medias de

las llantas de ambas marcas no son diferentes, son iguales.

235


1. Demuestre que:

a) Las desigualdades µ - E < x < µ + E, son equivalentes a | x - µ | < E

b) Si )(1 2/12/1 tTtP y snxT /)( entonces:

)(1 2/12/1n

stx

n

stxP

2. Se desea estimar el peso total de una partida de 10,000 manzanas. Para ello se

selecciona una muestra aleatoria de 50 manzanas, la cual da una media de 300

gramos y una desviación estándar de 25 gramos. Calcule e interprete intervalos

de confianza del 95 % para:

a) El verdadero peso medio de las manzanas y el peso total (Nμ).

b) La verdadera varianza (σ2) de los pesos de las manzanas.

c) ¿Qué tamaño de muestra debe tomarse, si se desea que x difiera de µ en

menos de 8 gramos con el 95 %

3. Se toma una muestra al azar de 45 alumnos, sin reposición de una clase de

estadística de 221 alumnos que dan una calificación final media de 70 puntos y

una desviación típica de 9 puntos. Determine el intervalo de confianza del 95 %

para la media y la varianza de las calificaciones.


frejol. Se toma una muestra aleatoria de 36 bolsas, resultando una media de

496.5 gramos y una desviación típica de 12 gramos.

a) Construya un intervalo de confianza del 95% para el verdadero peso medio

de las bolsas de frejol. ¿Se puede afirmar que no se está cumpliendo con el

contenido medio en las bolsas de frejol?

b) ¿Qué tamaño de muestra debe tomarse, si se desea que X difiera de µ en

menos de 3 gramos con el 95 % de confianza?

c) Construya un intervalo de confianza del 95% para la verdadera varianza de

los pesos de las bolsas con frejol.

5. Una universidad grande quiere estimar el número medio de días de enfermedad

de los estudiantes durante un año; una muestra de 50 estudiantes indica que

236

x = 3.2 días y S = 5.2 días. Calcule e interprete intervalos de confianza del 95%

para:

a) La media μ y la varianza σ2.



6. Una muestra de 50 animales experimentales reciben una cierta clase de ración

por un período de 2 semanas. Sus aumentos de pesos arrojan los valores x =

480 gr. y S = 30 gr. Calcule e interprete intervalos de confianza del 99% para:

a) La media μ y la varianza σ2.



7. Se acaba de lanzar al mercado una nueva marca de cigarrillos; un estudio en 35

cigarros, para determinar su contenido medio de nicotina dio x = 25.4 mg. y S =

1.9 mg. Calcule e interprete intervalos de confianza del 95% para:

a) El verdadero contenido medio μ de nicotina y la verdadera varianza (σ2) del

contenido de nicotina.


menos de 13 mg. con el 95 % de confianza?

8. De los 500 establecimientos pequeños de una ciudad, se ha tomado una muestra

aleatoria de 50, obteniéndose los siguientes datos sobre el número de empleados

por establecimiento:

Empleados por establecimiento (Xi) 0 1 2 3 4 5

Establecimientos (ni) 10 15 12 6 4 3


a) El número medio de empleados por establecimiento en la ciudad.

b) El total de empleados en los establecimientos pequeños de la ciudad.

c) La proporción de establecimientos pequeños con 2 ó más empleados.

d) El total de establecimientos pequeños que emplean a 2 ó más personas.

237


(con 1.4 millones de hogares) indica que el 35 % de los hogares tiene acceso a

internet. Calcule e interprete un intervalo de confianza del 95 % para:

a) La proporción de hogares limeños que tiene acceso a internet;

b) El total de hogares limeños que tiene acceso a internet;

c) Con un error del 2.5 % y una confianza del 95 %. ¿Cuál sería el tamaño de

muestra necesario para estimar la proporción de hogares que tiene acceso a

internet?

10. En una muestra aleatoria de 400 hinchas del fútbol peruano (de un total de 15

millones) se encontró que 140 opinan que Perú clasifica al mundial de fútbol.


verdadera y el total de hinchas que opinan que Perú clasifica al mundial de

fútbol.

b) Con un 99% de confianza y un error máximo del 3%, ¿qué tamaño de muestra

será necesario para estimar la proporción de hinchas que opinan que Perú

clasifica al mundial de fútbol?

11. De una población de 4.5 millones de ciudadanos, se selecciona una muestra

aleatoria de 2,000 y se halla que 520 están de acuerdo con la gestión del actual

presidente. Calcule e interprete intervalos de confianza del 95 % para:

a) La fracción de la población de ciudadanos que están de acuerdo con la gestión

del actual presidente.

b) El total de votantes que están de acuerdo con la gestión del presidente.

c) Con un 95% de confianza y un error máximo del 4%, ¿qué tamaño de muestra

será necesario para estimar la proporción de ciudadanos que están de acuerdo

con la gestión del actual presidente?

12. De una población de 100,000 fumadores, se selecciona una muestra aleatoria de

1,000 fumadores y se encuentra que 350 tienen preferencia por la marca A.


a) La proporción de la población de fumadores que prefieren la marca A.

b) El total de fumadores que prefieren la marca A.

238

c) Con el 95 % de confianza, ¿Qué tamaño de muestra debe tomarse, si se desea

un error máximo del 5%?


(con 1.4 millones de hogares) indica que el 16.3 % de los hogares usa tele cable.

a) Determine un intervalo de confianza del 95 % para la proporción y otro para

el total de hogares limeños que usan tele cable.

b) Con un error del 2.5 % y una confianza del 95 %. ¿Cuál sería el tamaño de

muestra necesario para estimar la proporción de hogares que usa tele cable?

14. De una población de 1’500000 ciudadanos de una región, se selecciona una

muestra aleatoria de 2,000 ciudadanos y se halla que 1,140 están contentos con

el actual presidente regional.

a) Calcule e interprete intervalos de confianza del 90 % para la fracción de la

población de ciudadanos y otro para el total que están a favor del actual

presidente regional.



15. En un estudio para determinar el gasto medio mensual en luz en las ciudades A y

B, se toma una muestra al azar de 250 hogares de A arrojando un gasto medio de

S/. 120 y una desviación estándar de 15. Una muestra al azar de 200 hogares de

la ciudad B da una gasto medio de 105 y una desviación estándar de 10.

a) Determine un intervalo de confianza del 99 % para la diferencia del gasto

medio mensual en luz en las ciudades A y B.

b) ¿Será diferente el gasto medio mensual en luz en las ciudades A y B?

16. Para determinar el costo medio de la enseñanza en las universidades A y B, se

toma una muestra al azar de 121 alumnos de la universidad A arrojando un costo

medio de S/. 650 y una desviación estándar de S/ 70. Una muestra al azar de 121

alumnos de la universidad B da una costo medio de S/. 675 y una desviación

estándar de S/. 90.

a) Calcule e interprete intervalos de confianza del 95% para la diferencia del

costo medio de la enseñanza en las universidades A y B.

b) ¿Será diferente el costo medio de la enseñanza en las universidades A y B?

239

17. Una muestra al azar de 200 pilas para calculadoras de la marca A muestra una

vida media de 240 horas y una desviación estándar de 10 horas. Una muestra al

azar de 120 pilas de la marca B da una vida media de 225 horas y una desviación

estándar de 9 horas.

a) Determine un intervalo de confianza del 99 % para la diferencia de la vida

media de las pilas A y B.

b) ¿Será diferente la duración media de las pilas A y B? Explique.

18. Dos grupos escogidos al azar, cada uno de 40 alumnas, de una escuela para

secretarias, aprenden taquigrafía por dos sistemas diferentes y luego se les

somete a pruebas de dictado. Se encuentra que el primer grupo obtiene en

promedio 120 palabras por minuto con una desviación estándar de 11 palabras,

mientras que el segundo grupo promedia 115 palabras por minuto con una

desviación estándar de 10 palabras.

a) Determine un intervalo de confianza del 95 % para la diferencia de medias de

palabras por minuto con los dos métodos.

b) ¿Serán diferentes las medias de palabras por minuto con los 2 métodos?

Explique.

19. En un estudio para determinar el gasto medio semanal en alimentos en las

ciudades 1 y 2, se toma una muestra al azar de 200 hogares de la ciudad 1

arrojando un gasto medio de S/. 150 y una desviación estándar de 15. Una

muestra al azar de 180 hogares de la ciudad 2 da una gasto medio de 135 y una

desviación estándar de 10.

a) Calcule e interprete un intervalo de confianza del 95 % para la diferencia del

gasto medio en las ciudades 1 y 2.

b) ¿Será igual el gasto medio semanal en alimentos en las ciudades 1 y 2?

20. Se compararon los gastos mensuales (S/.) en educación en las ciudades 1 y 2;

muestras aleatorias de 200 familias de la ciudad 1 y 150 de la ciudad 2, dieron

estos resultados: 1X = 160, n1 = 200, S1 = 60 y 2X = 150, n2 = 150,

S2 = 50.

240

a) Calcule e interprete un intervalo del 95 % de confianza para la verdadera

diferencia entre los gastos medios mensuales en educación de las familias de

las dos ciudades;

b) ¿Difieren los gastos medios en educación de ambas ciudades? Explique

21. En una muestra aleatoria de 400 adultos, 220 están de acuerdo con la gestión

presidencial. Mientras que en una muestra de 600 jóvenes, 300 están de acuerdo

con la gestión presidencial.


entre las verdaderas proporciones de adultos y jóvenes que están de acuerdo

con la gestión presidencial.

b) ¿Se puede afirmar que hay una diferencia entre las verdaderas proporciones

de adultos y jóvenes que están de acuerdo con la gestión presidencial?


casacas de cuero. De una muestra de 300 mujeres de 40 años a más, 75

estuvieron interesadas, mientras que de 200 mujeres menores 40 años, 80

mostraron interés.



años a más que mostraron interés por la compra de casacas de cuero.


40 años a más que mostraron interés por la compra de casacas de cuero.

Explique.

23. De los alumn@s de la UNAC se toma una muestra aleatoria de 600 hombres,

300 de las cuales están a favor del cambio curricular. En una muestra de 400

mujeres, 240 indican que están a favor de lo mismo.

a) Determine un intervalo de confianza del 99 % para la proporción de alumnas

que están a favor del cambio curricular.

b) ¿Se puede afirmar que hay diferencia entre las verdaderas proporciones de

alumnos y alumnas que están a favor del cambio curricular?

24. Se entrevistaron dos grupos de hombres respecto a su interés en una nueva

rasuradora eléctrica que tiene cuatro navajas. De una muestra de 60 hombres

241

menores de 40 años, sólo 12 estuvieron interesados, mientras que de 40 hombres

mayores 40 años, sólo 5 mostraron interés.


entre las verdaderas proporciones de hombres menores de 40 años y mayores

de 40 años que mostraron interés.

b) ¿Existe diferencia entre las verdaderas proporciones de hombres menores de

40 años y mayores de 40 años que mostraron interés? Explique.

25. Se entrevistaron dos grupos de mujeres respecto a su interés por la transmisión

de encuentros de voleibol por TV. De una muestra de 120 mujeres de 40 años a

más, sólo 30 estuvieron interesadas, mientras que de 100 mujeres menores 40

años, sólo 40 mostraron interés.



años a más que mostraron interés.


40 años a más que mostraron interés. Explique.

26. Es ampliamente conocido que no cualquiera coopera respondiendo a los

cuestionarios de los entrevistadores puerta por puerta. En un experimento para

determinar si las personas mayores (1) son más cooperadoras que los jóvenes

(2), se obtuvieron los siguientes resultados:

Mayores (1): n1 = 250, X1 = 150; Jóvenes (2): n2 = 200, X2 = 110


entre las verdaderas proporciones de personas mayores y de jóvenes que

cooperaron con los entrevistadores.

b) ¿Existe diferencia entre las proporciones de mayores y de jóvenes que

cooperan? Explique.

27. Se entrevistaron a un grupo de hombres en las ciudades de Cusco y Puno

respecto a su interés por la compra de abrigos de lana. De una muestra de 400

cusqueños, sólo 160 estuvieron interesados, mientras que de 300 puneños, sólo

90 mostraron interés.

242


entre las verdaderas proporciones de cusqueños y puneños que mostraron

interés por la compra de abrigos de lana.

b) ¿Existe diferencia entre la proporción de cusqueños y puneños que mostraron

interés por la compra de abrigos de lana? Explique.

28. Las cajas de un cereal producido por una fábrica deben tener un contenido de

160 gramos. Un inspector tomó una muestra que arrojó los siguientes pesos en

gramos:

157, 157, 163, 158, 161, 159, 162, 159, 158, 156


la varianza poblacional de los pesos.

29. Los pesos netos (grs.) de diez latas de conserva fueron los siguientes:

159, 162, 159, 158, 156,157, 157, 163, 158, 161


la varianza poblacional de los pesos netos.

30. De las 1500 micro empresas de una ciudad se extrae una muestra aleatoria de 20

y se recolecta información sobre el número de personas empleadas (X) por

empresa, obteniéndose la siguiente información:

20

1

210i

i

X

20

2

1

1526i

i

X

Calcule e interprete intervalos de confianza del 95 % para el(la) verdadero(a):

a) Número medio de empleados por micro empresa en la ciudad. ¿Aceptaría

usted que el tamaño medio de las microempresas es de 7 empleados?

b) Número total de empleados en las micro empresas.

c) La varianza del número de empleados por micro empresa.

d) Para estimar en el futuro el número medio de empleados por establecimiento,

con un margen de error máximo de 0.8 empleados y una confianza del 95 %

¿qué tamaño mínimo de muestra será necesario?

31. Los contenidos netos (ml.) de una muestra aleatoria de 10 frascos de yogurt

fueron los siguientes: 248, 254, 249, 252, 250, 253, 250, 249, 247, 248

Calcule e interprete intervalos de confianza del 99 %

243

a) Para la media poblacional de los contenidos netos en los frascos.

b) La varianza poblacional de los contenidos netos en los frascos.

c) ¿Qué tamaño de muestra debe tomarse, si se desea que x difiera de µ en

menos de 1.5 ml. con el 99 % de confianza?

32. La producción de 13 obreros de la jornada diurna, dio un promedio de 82 piezas

con una desviación estándar de 10, mientras que para 11 obreros de la jornada

nocturna, dio un promedio de 74 con una desviación estándar de 7. Calcule e

interprete intervalos de confianza del 95% para:

a) La razón de varianzas de la producción de ambas jornadas. ¿Serán

heterogéneas las varianzas de ambos grupos?

b) La diferencia de la producción media de ambos grupos. ¿Son diferentes las

producciones medias de ambas jornadas?

33. En un colegio de secundaria, el cociente de inteligencia de 15 alumnos del turno

diurno, dio un promedio de 112 con una desviación estándar de 6; mientras que

para 15 estudiantes del turno nocturno, dio un promedio de 105 con una

desviación estándar de 15. Calcule e interprete intervalos de confianza del 99 %

para:

a) La verdadera razón de varianzas de los cocientes de inteligencia de los

alumnos de ambos turnos. ¿Son heterogéneas las varianzas de los 2 turnos?

b) La verdadera diferencia de las medias de los cocientes de inteligencia de los

alumnos de ambos turnos. ¿Son diferentes los cocientes medios de

inteligencia de los 2 grupos?

34. Dos máquinas producen diariamente mil latas de conservas cada una

independientemente. Mediante muestra aleatoria sin reemplazo de 16 latas

tomadas de cada máquina se han obtenido los siguientes resultados sobre el peso

de las latas (en gramos): n1 = 16, 1x = 495, S1 = 5 y n2 = 16, 2x =

505, S2 = 7.


a) La razón de varianzas de los pesos de las latas de conservas de ambas

máquinas. ¿Son diferentes las varianzas de los pesos de las latas de conservas

de ambas máquinas?

244

b) La diferencia de los pesos medios de las latas de conservas de ambas

máquinas. ¿Son diferentes los pesos medios de las latas de conservas de

ambas máquinas?

35. Se ha llevado a cabo un estudio para analizar los gastos mensuales en seguridad

particular realizada por las empresas de dos ciudades. Mediante muestras

aleatorias de 20 empresas tomadas en cada ciudad se han obtenido los siguientes

resultados:

n1 = 20, 1x = 458, S1 = 25 y n2 = 20, 2x = 385, S2 = 15.


a) La razón de varianzas de los gastos mensuales en seguridad particular

realizada por las empresas de ambas ciudades. ¿Son diferentes las varianzas

de los gastos mensuales en seguridad particular realizada por las empresas de

ambas ciudades?

b) La diferencia de los gastos medios mensuales en seguridad particular

realizada por las empresas de ambas ciudades. ¿Son diferentes los gastos

medios mensuales en seguridad particular realizada por las empresas de

ambas ciudades?

245

Capítulo 6. CONTRASTE DE HIPÓTESIS ESTADÍSTICAS

PARAMÉTRICAS

“El pensamiento estadístico será un día tan necesario para el

ciudadano eficiente como la capacidad de leer y escribir.” H.G. Wells

CONTENIDO

6.1 Prueba de hipótesis para la media (con varianza conocida).

6.2 Prueba de hipótesis para la media (con varianza desconocida).

6.3 Prueba de hipótesis acerca de una varianza.

6.4 Prueba de hipótesis para la razón de varianzas.

6.5 Prueba de hipótesis acerca de dos medias (varianzas conocidas).

6.6 Prueba de hipótesis acerca de dos medias (varianzas desconocidas).

6.7 Prueba de hipótesis para la proporción.

6.8 Prueba de hipótesis para la diferencia de proporciones.



En el capítulo anterior se ha desarrollado los diferentes aspectos relacionados con la

estimación, que han permitido establecer las bases para de una manera sencilla hacer el

contraste, prueba o docimasia de hipótesis. Prueba que es fundamental en la investigación

científica cuando se usa el modelo hipotético-deductivo, ya que frente a un problema de la

realidad tiene que formularse una hipótesis, cuyo contraste pasa muchas veces por el uso

de la estadística.

En este capítulo, se presenta los aspectos fundamentales de las pruebas de hipótesis, así

como la propuesta de contrastes de hipótesis estadísticas referidas a parámetros como: la

media, la varianza, la razón de varianzas, la diferencia de medias, la proporción y la

diferencia de proporciones.

Hipótesis Estadística

Es una aseveración que se hace acerca del valor del parámetro o los valores de los

parámetros de una población.

Ejemplo 1.-

El contenido medio de las bolsas de arroz es de = 1 000 gr., la tasa de desempleo es del

12% (P = 0.12), las notas tienen distribución normal con = 12 y = 2.1 etc.

246

Planteamiento del Problema

Contrastar una hipótesis estadística es juzgar si cierta propiedad supuesta para una

población es compatible con lo observado en una muestra de ella. Es decir que:

La prueba estadística de una hipótesis es una regla que cuando los valores muestrales

son observados nos conducen a aceptar o rechazar la hipótesis bajo consideración.

Ejemplo 2.-

La “Compañía Agrícola Yapatera S.A.” embolsa arroz con un contenido medio de 1 000

gr. El proceso de llenado tiene distribución N ( = 1 000 gr. , = 3 gr.). Por razones

imprevisibles el proceso de llenado se desajusta a veces produciendo un aumento o

disminución del llenado medio sin variar la desviación estándar. Para contrastar si en

cierto momento el proceso se ha desajustado, se toma una muestra al azar de n = 5 bolsas

con arroz. Se pesan las bolsas obteniendo los siguientes datos:

1 005, 1 006, 1 004, 1 005 y 1 006 gr.

¿Podemos decir que el proceso de llenado se ha desajustado?

Si el proceso no se ha desajustado al ser X ~ N (1 000 , 9)

X ~ N (1 000, 9 / 5) = N (1 000 , 1.8 ).

Calculando X = (1 005 + 1 006 + 1 004 + 1 005 + 1 006) / 5 = 1 005.2 gr.

El valor X = 1 005.2 gr. está muy alejado del valor central = 1 000 gr. Para verlo

formalmente, estandaricemos la variable.

342.1

10002.1005

X

XZ

= 3.87. Es decir, se aleja más de 3.8 veces la desviación

estándar de la media. Por todo ello debemos pensar que el proceso se ha desajustado ya

que de ser correcto, la probabilidad de que una muestra de tamaño 5 tome como media 1

005.2 gr. es muy pequeña. Esta probabilidad es:

P( X ≥ 1 005.2) = P(Z ≥ 3.87) = 1 – P(Z 3.87) = 1 – 0.99995 = 0.00005 . Sumamente

menor al 0.005%.

Estos son los elementos fundamentales a tener en cuenta para el contraste de hipótesis, así

como su relación con los intervalos de confianza.

Para el ejemplo anterior [1 001.5 , 1 008.9] gr. con el 95% de confianza.

247

Como = 1 000 no pertenece al intervalo de confianza, entonces nos lleva a confirmar la

hipótesis de que es diferente de 1 000 gr. y que se ha producido un desajuste en el

proceso de llenado de las bolsas con arroz.

Tipos de Hipótesis

Para efectuar el contraste de hipótesis se formula dos tipos de hipótesis: la nula y la

alternativa.

Hipótesis Nula .- se denota por H0 y es la hipótesis que se contrasta. Generalmente se

establece en forma exacta. Es la hipótesis que mantendremos hasta que los datos

demuestren su falsedad. Ejemplo: H0 : θ = θ0 .

La hipótesis nula refleja el valor que ha tenido el parámetro en un momento determinado,

pero pueda que haya cambiado dando lugar a la hipótesis alternativa.

Hipótesis Alternativa .- se denota por H1 o Ha y generalmente es especificada con menos

precisión. Es la suposición contraria a la que se quiere contrastar, que se acepta en caso la

hipótesis nula se rechace. Ejemplo: H1 : θ < θ0 , θ > θ0 o θ ≠ θ0 .

Al efectuar el contraste, hablamos de probar la hipótesis nula contra la hipótesis

alternativa, bajo el supuesto tentativo que la hipótesis nula es cierta. Ello porque la

hipótesis nula refleja el comportamiento que ha tenido (tiene o seguirá teniendo) el

parámetro, hasta que los datos demuestren su falsedad.

Tipos de Pruebas

Hay dos tipos principales de pruebas: las pruebas unilaterales y la prueba bilateral.

Cada una se identifica por la forma en que se formula H1.

1. Pruebas Unilaterales o de una Cola

Prueba de la cola inferior o prueba del lado izquierdo (cola izquierda)

Ho : θ = θ0 H1 : θ < θ0

Se emplea cuando se tiene alguna evidencia de que el valor del parámetro ha

disminuido.

248

Prueba de la cola superior o prueba del lado derecho (cola derecha)

Ho : θ = θ0 H1 : θ > θ0

Se emplea cuando se tiene alguna evidencia de que el valor del parámetro ha

aumentado.

2. Prueba Bilateral o de dos Colas

Ho : θ = θ0 H1 : θ ≠ θ0

Este tipo de prueba se emplea, en caso de que el valor que se prueba no sea

verdadero, entonces, todos los demás valores son posibles.

Tipo de Errores

Error tipo I: se comete al rechazar la hipótesis nula Ho cuando ésta es verdadera.

= Nivel de significación = P (Error Tipo I) = P [Rechazar Ho / Ho es verdadera

Los valores más comunes de son 0.05 y 0.01; porque el error debe ser bajo. Si

tuviéramos un nivel de confianza del 95% entonces, el nivel de significación sería

del 5%. Significaría que en 5 de cada 100 pruebas nos estaríamos equivocando al

rechazar Ho cuando esta es cierta.

Error de tipo II: se comete cuando se acepta una hipótesis Ho siendo esta falsa.

La probabilidad de cometer este error la denotamos con la letra β.

β = P [Aceptar Ho / Ho es falsa ]

249

Decisión

(muestral) Ho es verdadera Ho es falsa

Aceptar Ho No hay error Error tipo II

Rechazar Ho Error tipo I No hay error

Los errores tipo I y tipo II se relacionan. Una disminución en la probabilidad de uno,

por lo general tiene como resultado un aumento en la probabilidad del otro.

La decisión de aceptar o rechazar la hipótesis bajo consideración H0 se hace

basándose en pruebas de muestras, por ello escogemos una función de las n

observaciones, = G(X1, X2, …. , Xn ) como estadística de prueba, cuya

distribución por muestreo sea conocida en el supuesto (tentativo) que la hipótesis

nula H0 : = 0 es cierta.

Las reglas de decisión sobre la aceptación o rechazo de H0 , se hace respecto al rango

de y un resultado particular de la muestra. Esto se hace hallando un valor C

llamado valor crítico de la estadística de prueba (a veces hay más de un valor

crítico) la cual divide al rango de en dos regiones: la región crítica o de rechazo

(R,C) y la región de aceptación (R.A). Si R.C. rechazamos H0. Si R.A.

aceptamos H0.

Región Crítica o de Rechazo

Es la región que contiene lo valores para los cuales se rechaza la hipótesis H0 bajo

consideración. Es la región del rango de que de acuerdo con una prueba prescrita,

conduce al rechazo de la hipótesis bajo consideración.

250

Región de Aceptación

Es la región que contiene lo valores para los cuales se acepta la hipótesis H0 bajo

consideración.

Pasos para el Contraste de Hipótesis

1. Formular las hipótesis de acuerdo al problema.

H0 : θ = θ0

H1 : θ ≠ θ0 o θ < θ0 o θ > θ0

2. Escoger el nivel de significación .

3. Escoger la prueba estadística apropiada (Z, t, chi-cuadrado, F, etc.) cuya distribución

por muestreo sea conocida en el supuesto tentativo de que H0 es cierta. Esta prueba

estadística, debe ser función del estimador y del parámetro, al igual que en la

construcción de intervalos de confianza.

4. Establecer la región crítica. Para ello tomar en cuenta la distribución de la prueba

estadística escogida.

5. Calcular el valor de la prueba estadística, con la información de una muestra aleatoria

de tamaño n y bajo el supuesto que H0 es cierta.

6. Conclusión: Si el valor calculado de la prueba estadística pertenece a la región

crítica, entonces rechazamos H0 y aceptamos H1. En caso contrario, si el valor

calculado de la prueba estadística pertenece a la región de aceptación, entonces

aceptamos H0 y rechazamos H1.

A continuación, utilizando los resultados de las distribuciones muestrales y de los

intervalos de confianza, veremos la aplicación de las pruebas de hipótesis para los

parámetros poblacionales como la media, diferencia de medias, la varianza, la

igualdad de varianzas, la proporción y la diferencia de proporciones. Cuyas

estadísticas de prueba van a estar referidas a distribuciones como la normal estándar,

t de student, chi cuadrado y F respectivamente.

Veamos cada una de ellas.

251

6.1 PRUEBA DE HIPÓTESIS PARA LA MEDIA (con varianza conocida)

Sea

X la media de una muestra aleatoria de tamaño n seleccionada de una

población con media y con varianza 2

supuestamente conocida.

Si la población es normal N(, 2), entonces, la distribución de la estadística

X es exactamente normal N(, 2/n). Si la población no es normal, para

cualquier valor de n 30, la distribución de

X es aproximadamente normal

N(, 2/n). Si se necesita el factor de corrección para poblaciones finitas se usa

(N –n) / (n-1)

Entonces, la estadística para la prueba acerca de con varianza 2 conocida es:

n

XZ

/

, cuya distribución es exacta o aproximadamente normal estándar

N(0,1), según sea la población normal o no.

Si se supone verdadera la hipótesis nula: Ho: = o, la estadística especificada

por esta hipótesis es entonces: n

XZ

/

0

A. Prueba bilateral o de dos colas

1. Hipótesis: Ho: = o , H1: 0

2. Escoger el nivel de significación:

3. Estadística de prueba: n

XZ

/

, cuya distribución es normal N(0,1).

4. Región crítica: determinar el valor Z1-/2 tal que la probabilidad de rechazar H0

cuando se supone verdadera sea:

2/2/ 2/12/1 ZZPoZZP

En consecuencia, la región crítica en el rango de variación de Z es:

2/12/1.. ZZoZZCR

Por otro lado, la probabilidad de aceptar H0 cuando se supone verdadera es:

12/12/1 ZZZP

Resultando la región de aceptación: 2/12/1.. ZZZAR

252

5. Hallar n

xZcalc

/

0

con la información muestral y suponiendo que Ho es

cierta.

6. Decisión: se rechaza H0 con riesgo igual a , si ..CRZcalc (o si ..ARZcalc ).

No se rechaza H0 en caso contrario. Si se rechaza Ho se dice que la prueba es

significativa con riesgo cuyo valor es .

Nota (Región crítica en

X )

Si

X es estimador de , se cumple H1: 0 cuando

X < a o

X > b

bXoaXCR .

Si se sustituye )//()( 0 nXZ

en RC resulta la región crítica en el rango

de variación

X con: )/(2/10 nZa , y )/(2/10 nZb

La región de aceptación es el intervalo en

X :

][.. bXaAR

La regla de decisión es: Si

x es el valor de

X obtenido a partir de una muestra

aleatoria, se rechazará H0 con un riesgo , si .).(.. ARxsioCRx

No se rechazará H0 en caso contrario.

B. Prueba unilateral de la cola derecha

1. Hipótesis: Ho: = o , H1: > 0



XZ

/


4. Región crítica: determinar el valor 1Z tal que la probabilidad de rechazar H0


verdaderaHZZP 001 :|


}{.. 1 ZZCR

253

La región de aceptación es: }{.. 1 ZZAR .

5. Hallar n

xZcalc

/

0


cierta.


No se rechaza H0 en caso contrario.

Nota: (Región Crítica en

X )

Si

X es estimador de , se cumple H1: > 0 cuando

X > b1

}{.. 1bXCR

donde: )/(101 nzb

La región de aceptación es el intervalo: }{.. 1bXAR

La regla de decisión es: Siendo

x el valor de


aleatoria de tamaño n, se rechazará H0 con un riesgo , si ..CRx

(o si ..ARx

).


C. Prueba unilateral de la cola izquierda

1. Hipótesis: Ho: = o , H1: < 0



XZ

/


4. Región crítica: determinar el valor 1Z tal que la probabilidad de rechazar H0


verdaderaHoZZP 01 :/


1.. ZZCR

La región de aceptación es: 1.. ZZAR

5. Hallar n

xZcalc

/

0

con la muestra y bajo el supuesto que Ho es cierta.


254


Nota: (Región crítica en

X )

Si

X es estimador de , se cumple H1: < 0 cuando

X < a1

}{ 1aXRC

donde: a1 = )/(10 nZ

Región de aceptación: }{ 1aXRA

Regla de decisión es: Si

X es un valor de


aleatoria de tamaño n, rechazará H0 con un riesgo si ..CRx

. (o si ..ARx

).


Nota: Regla de decisión con el Intervalo de Confianza

La prueba de la hipótesis nula Ho: = 0 contra H1: 0 a un nivel de

significación dado , equivale al calcular el intervalo de confianza (I.C.) del 100(1 -

)% para el parámetro y luego rechazar la hipótesis nula Ho: = 0 si es que 0

..CI

En efecto, si

x es un valor de

X , no se rechaza Ho: = 0 si el valor

Zcalc ϵ R.A. = [-Z1-α/2, Z1-α/2] donde )//()( 0 nxZcalc

o, si 2/10

2/1

Z

n

xZ

Esto es, no se rechaza Ho: = 0 si

nz

nzARx

2/102/10 ,..

o equivalentemente si 0 se encuentra en el intervalo de confianza (I.C.) del 100(1 -

) % para :

nZx

nZxCI

2/12/10 ,..

Por tanto, se rechaza H0 con riesgo , si .... 0 CIsioARx

Nota: Método del valor P (o P-valor o sig o Probab, etc.)

Otra forma de establecer la regla de decisión, es calculando el valor P (probabilidad

mínima para rechazar Ho), a partir del valor Zcalc, de manera que:

255

Para dos colas: P = P[|Z| > |Zcalc|] = P[Z < -|Zcalc|] + P[Z > |Zcalc|] = 2 P[Z < -|Zcalc|]

Para cola a la derecha: P = P[Z > Zcalc]

Para cola a la izquierda: P = P[Z < Zcalc]

Si el valor de P < , entonces, se rechaza H0. Se acepta H0, en caso contrario.

Ejemplo 3.-

Un proceso de empaquetar un producto está controlado, si el peso medio del

producto empaquetado es 400 gr. Si en una muestra aleatoria de 100 paquetes del

producto se ha encontrado que el peso medio es de 395 gramos. Suponga que el peso

de los productos empaquetados se distribuye normalmente con desviación estándar

de 20 gramos.

a) ¿Se podría concluir que el proceso está fuera de control al 5% de significación?

Halle P-valor.

b) Construya un intervalo de confianza del 95% para el peso medio del producto

empaquetado. ¿Aceptaría usted que = 400 gr. (proceso controlado)?

Solución

a) Sea X la variable aleatoria definida como el peso de los paquetes del producto.

Se supone que la distribución de X es N(, (20)2).

1. Hipótesis: H0: = 400 (proceso controlado) H1: 400 (proceso fuera de

control).

2. Nivel de significación: = 0.05.

3. Estadística de prueba: Población normal con varianza conocida, la estadística es

n

XZ

/

cuya distribución es normal N(0,1).

4. Región crítica: Si la hipótesis nula H0 es cierta, para = 0.05 y la alternativa

bilateral, en la distribución de )100/20/()400(

XZ , se encuentra el valor

crítico: Z1-/2 = Z0.975 = 1.96

Luego, la región crítica en la variable Z está dada por:

96.196.1 calccalc ZoZRC

5. Cálculos, de los datos se tiene: n = 100, 20,395

x

Entonces:

256

5.22

400395

/

0

n

xZcalc

6. Decisión: Puesto que Zcalc = -2.5 ..CR , debemos rechazar H0 y concluir con

un 5% de significación que el proceso de empaquetado no está controlado.

P-valor = P[|Z| > |-2.5|] = P[|Z| > 2.5] = 2 P[Z < -2.5] = 2(0.00621) = 0.01242.

Como el valor-P = 0.01242 < = 0.05 se rechaza Ho y se acepta H1: 400 y se

concluye también con un 5% de significación que el proceso de empaquetado no

está controlado.

Nota: En el rango de variación de

X , la región crítica es:

}92.40308.396{}296.1400296.1400{..

XoXxXoxXCR

Por el hecho que ..395 CRx

, se debe rechazar H0 y concluir con un riesgo de 5

% que el proceso de empaquetado no está controlado.

Cálculos utilizando Minitab (versión 15.0 en español)

Del menú escoger Estadísticas → Estadísticas básicas → 1Z Z de 1 muestra y

aparece la Ventana Z de 1 muestra (prueba e intervalo de confianza) siguiente:

257

Habilitar la opción Datos resumidos y escribir el Tamaño de muestra: 100 y en

Media: 395 (la media muestral). Escribir la Desviación estándar: 20.

Nota: Si los datos muestrales aparecen en una columna, se escoge Muestras en

columnas: y se ingresa dicha columna. Lo que sigue es igual para ambos casos.

Seleccionar Realizar prueba de hipótesis y escribir en Media hipotética: 400.

Escoger Opciones… → Nivel de confianza: 95.0. Escoger en Hipótesis alterna:

no es igual a. Luego escoger Aceptar y Aceptar

En la hoja de Sesión aparecen los resultados siguientes:

Z de una muestra Prueba de mu = 400 vs. no = 400

La desviación estándar supuesta = 20

Media del

Error

N Media estándar IC de 95% Z P

100 395.00 2.00 (391.08, 398.92) -2.50 0.012

Aparecen los resultados antes obtenidos: Zcalc = -2.5, el valor-P = 0.012 y el

intervalo de confianza del 95% para la media µ obtenido a continuación en b).

b) El intervalo de confianza del 95% para el peso medio del producto empaquetado

viene dado por:

nZX

nZX

21

21

, …………. (1)

Datos: n = 100, X = 395, σ = 20, 1 – α = 0.95 → En la Tabla 1, Zo = Z0.975 =

1.96.

El error de estimación para la media es:

E = 100

2096.1

21

n

Z

= 3.92 gr.


µ ϵ [395 – 3.92 ; 395 + 3.92] = [391.08 ; 398.92] gr. con el 95% de confianza.

No se acepta que = 400 gr. porque no pertenece al intervalo de confianza, por lo

tanto, se debe rechazar H0 y concluir con un 95 % de confianza que el proceso de

empaquetado no está controlado.

258

6.2 PRUEBA DE HIPÓTESIS PARA LA MEDIA (con varianza

desconocida)

Población no normal

Si la población no tiene distribución normal y si la varianza es desconocida, para

probar hipótesis acerca de la media , sólo si, el tamaño de la muestra es grande

(n 30), se suele utilizar la estadística: n

XZ

/

0

N(0,1)

Luego, las regiones críticas de las pruebas de Ho: = 0 contra cualquiera de las

tres alternativas H1: > 0 o H1: < 0 o H1: 0 son las mismas

(aproximadamente) de la sección anterior.

Población normal

Si la población tiene distribución normal N(,2), donde y

2 son parámetros

desconocidas, para 2 ≤ n < 30 la estadística de la prueba acerca de la media es:

1/

ntnS

xT

Si se supone verdadera la hipótesis nula, Ho: = o , la estadística

especificada por esta hipótesis es: nS

xT

/

0

Nota: La estructura de la prueba es idéntica que en el caso de conocida ,

salvo que el valor de se estima por S y la distribución normal estándar se

sustituye por la distribución t de Student con n-1 grados de libertad.


1. Hipótesis: Ho: = o, H1: 0


3. Estadística de prueba: 1/

ntnS

xT

4. Región crítica: determinar los valores 1,2/1 nt , tales que la probabilidad de

rechazar Ho cuando se supone verdadera sea:

259

2/)( 1,2/1 ntTP o 2/)( 1,2/1 ntTP.

En consecuencia, la región crítica en el rango de variación de T es:

}{.. 1,2/11,2/1 nn tTotTCR

La región de aceptación es: }{.. 1,2/11,2/1 nn tTtAR

5. Hallar nS

xTcalc

/

0


cierta.

6. Decisión: se rechaza H0 con riesgo igual a , si ..CRTcalc (o si ..ARTcalc ).


Si se rechaza Ho se dice que la prueba es significativa con riesgo igual .


1. Hipótesis: Ho: = o, H1: > 0



ntnS

xT

4. Región crítica: determinar el valor 1,1 nt tal que la probabilidad de rechazar

H0 cuando se supone verdadera sea:

]:|[ 001,1 verdaderaHtTP n


}{.. 1,1 ntTCR

La región de aceptación es: }{.. 1,1 ntTAR .

5. Hallar nS

xTcalc

/

0


cierta.




1. Hipótesis: Ho: = o , H1: < 0

260



ntnS

xT

4. Región crítica: determinar el valor - 1,1 nt tal que la probabilidad de rechazar

H0 cuando se supone verdadera sea:

]:|[ 001,1 verdaderaHtTP n


R.C. = {T < -t1 - α, n -1}

La región de aceptación es: R.A. = {T > -t1 - α, n -1}

5. Hallar nS

xTcalc

/

0


cierta.




La prueba de la hipótesis nula Ho: = 0 contra H1: 0 a un nivel de


)% para el parámetro y luego rechazar la hipótesis nula Ho: = 0 si es que 0

..CI



mínima para rechazar Ho), a partir del valor Tcalc, de manera que:

Para dos colas: P = P[|Tn-1| > |Tcalc|] = P[Tn-1 < -|Tcalc|] + P[Tn-1 > |Tcalc|] =

= 2 P[Tn-1 < -|Tcalc|] = 2 P[Tn-1 > |Tcalc|]

Para cola a la derecha: P = P[Tn-1 > Tcalc]

Para cola a la izquierda: P = P[Tn-1 < Tcalc]


261

Ejemplo 4.-

Un fabricante produce un cable de alambre de cierto tipo, que tiene una resistencia a la

ruptura no mayor de 300 kg. Se descubre un proceso nuevo y más barato que desea

emplearse, siempre que el cable así producido tenga una resistencia media a la ruptura

mayor de 300 kg. Si una muestra aleatoria de 25 cables producidos con el nuevo proceso

ha dado una media 304.5 kg. y una desviación estándar S = 10 kg. ¿Debería el fabricante

adoptar el nuevo proceso, si está dispuesto a asumir un error tipo I del 5%? Hallar el P-

valor.

Solución

1. Hipótesis: H0: ≤ 300 (proceso antiguo) H1: > 300 (proceso nuevo).


3. Estadística de prueba:

24/

tnS

xT

4. Región crítica: para = 0.05 y la alternativa unilateral derecha, se encuentra el

valor crítico en la Tabla 3: t1-, n-1 = t0.95, 24 = 1.711

Luego, la región crítica en la variable T está dada por: R.C = {T > 1.711}

5. Cálculos, de los datos se tiene: n = 25,

x = 304.5 Kg. S = 10 y = 300

Entonces: 25/10

3005.304

/

nS

xTcalc

= 2.25

6. Decisión: puesto que Tcalc = 2.25 ϵ R.C., debemos rechazar H0 y concluir con un

5% de significación que conviene adoptar el nuevo proceso.

P-valor = P[T24 > 2.25] = 1 - P[T24 ≤ 2.25] = 1 – x ………… (1)

Como en la tabla 3, T de student, para 24 grados de libertad, no está el valor 2.25,

pero éste se encuentra entre los valores 2.064 (con probabilidad 0.975) y 2.492 (con

probabilidad 0.99) se determina x interpolando de la siguiente manera:

Tα P

2.064 0.975

2.25 x 2.492 2.064 2.25 2.064

0.990 0.975 0.975x

28.53 =

0.186

0.975x

2.492 0.990 28.53x - 27.82 = 0.186 x = 0.982

262

Reemplazando x = 0.982 en (1) se obtiene: P-valor = 1 – 0.982 = 0.018 Rpta.

Como el valor-P = 0.018 < = 0.05 se rechaza Ho y se acepta H1: > 300. Por lo

tanto, se concluye también con un 5% de significación que es conveniente adoptar el

nuevo proceso.

Cálculos utilizando Minitab

Del menú escoger Estadísticas → Estadísticas básicas → 1t t de 1 muestra y

aparece la Ventana t de 1 muestra (prueba e intervalo de confianza) siguiente:

Habilitar la opción Datos resumidos y escribir el Tamaño de muestra: 25 y en

Media: 304.5 (la media muestral). Escribir la Desviación estándar: 10 (desviación

estándar muestral).

Nota: Si los datos muestrales aparecen en una columna, se escoge Muestras en

columnas: y se ingresa dicha columna. Lo que sigue es igual para ambos casos.

Seleccionar Realizar prueba de hipótesis y escribir en Media hipotética: 300.

Escoger Opciones… → Nivel de confianza: 95.0. Escoger en Hipótesis alterna:

mayor que. Luego escoger Aceptar y Aceptar


263

T de una muestra Prueba de mu = 300 vs. > 300

Media del

Error 95% Límite

N Media Desv.Est. estándar inferior T P

25 304.50 10.00 2.00 301.08 2.25 0.017

Para prueba bilateral:

N Media Desv.Est. Errorestándar IC de 95%

25 304.50 10.00 2.00 (300.37, 308.63)

Aparecen los resultados antes obtenidos: Tcalc = 2.25, el valor-P = 0.017 (ligeramente

diferente al 0.018 encontrado con aproximación usando la Tabla 3) y el intervalo de

confianza del 95% para la media µ obtenido a continuación.

Nota.-

Si se construye el intervalo de confianza del 95% para la media , con 1 – α = 0.95

→ en la Tabla 3, t0 = t24 , 0.975 = 2.064. Además: n = 25, X = 304.5 Kg. y S = 10.

El intervalo de confianza para la media es: [ X - t0 nS / , X + t0 nS / ]

Luego: [304.5 – 2.064 x 25

10 , 304.5 + 2.064 x

25

10] = [304.5 ± 4.128]

Por lo tanto: [300.37 ; 308.63] Kg. con el 95% de confianza.

En consecuencia, se rechaza H0: = 300 kilos porque no pertenece al intervalo de

confianza y se acepta H1: > 300 Kg. siendo conveniente adoptar el nuevo proceso

con un 95% de confianza.

6.3 PRUEBA DE HIPÓTESIS ACERCA DE UNA VARIANZA

Sea Xk, X2, ...., Xn una muestra aleatoria de tamaño n, seleccionada de una

población normal con media y varianza 2, parámetros desconocidos, y sea la

varianza muestral, 1

)(1

2

2

n

XX

S

n

i

i

Entonces, la variable aleatoria, 2

12

22 )1(

n

Sn

264

Esta estadística se utiliza para probar hipótesis acerca de una varianza. Si se supone

verdadera la hipótesis nula Ho: σ2 = 2

0 , la estadística es:

2

12

0

22 )1(

n

Sn

El valor 2

0

22 )1(

Sncalc

que resulta de la muestra aleatoria, se usa para la prueba

de H0, contra una alternativa unilateral o bilateral.


1. Hipótesis: Ho: σ2 = 2

0 , H1: σ2 2

0


3. Estadística de prueba: 2

12

22 )1(

n

Sn

4. Región crítica: determinar los valores 2

1,2/1

2

1,2/ nn XyX , tales que la

probabilidad de rechazar la hipótesis nula H0 cuando se supone verdadera sea:

2/][2/][ 2

1,2/

22

1,2/

2 nn PoP

La Región crítica de la prueba es: R.C. = {X2 < 2

1,2/ n o X2 > 2

1,2/1 n }

La región de aceptación es: R.A. = { 2

1,2/ n ≤ X2 ≤ 2

1,2/1 n }

5. Hallar 2

0

22 )1(

Sncalc


cierta.

6. Decisión: se rechaza H0 con riesgo igual a , si ..2 CRcalc (o si ..2 ARcalc ).


Si se rechaza Ho se dice que la prueba es significativa con riesgo cuyo valor es

.

265


1. Hipótesis: Ho: σ2 = 2

0 , H1: σ2 > 2

0



12

22 )1(

n

Sn

4. Región crítica: determinar el valor 2

1,1 nX tal que la probabilidad de rechazar

H0 cuando se supone verdadera sea: ][ 2

1,1

2

nP

La Región crítica de la prueba es: R.C. = {X2 > 2

1,1 n }

2

1,1 n

La región de aceptación es: R.A. = {X2 < 2

1,1 n }

5. Hallar 2

0

22 )1(

Sncalc

con la muestra y suponiendo que Ho es cierta.

6. Decisión: se rechaza H0 con riesgo igual a , ..2 CRcalc (o si ..2 ARcalc ).



1. Hipótesis: Ho: σ2 =

2

0 , H1: σ2 <

2

0



12

22 )1(

n

Sn

4. Región crítica: determinar el valor 2

1, n tal que la probabilidad de rechazar H0


266

][ 2

1,

2

nP

La Región crítica de la prueba es: R.C. = {X2 < 2

1, n }

La región de aceptación es: R.A. = {X2 > 2

1, n }

5. Hallar 2

0

22 )1(

Sncalc

con la muestra y suponiendo que Ho es cierta.

6. Decisión: se rechaza H0 con riesgo igual a , ..2 CRcalc (o si ..2 ARcalc ).



La prueba de la hipótesis nula Ho: σ2 = 2

0 contra H1: σ2 ≠ 2

0 a un nivel de


)% para el parámetro σ2 y luego rechazar la hipótesis nula Ho: σ

2 = 2

0 si es que 2

0

..CI Caso contrario, si 2

0 ϵ I.C. se “acepta” la hipótesis nula Ho: σ2 = 2

0 .



mínima para rechazar Ho), a partir del valor 2

calc , de manera que:

Para dos colas:

Si 2

calc < n – 1 → P = 2 P[ 2

1n < 2

calc ]

Si 2

calc > n – 1 → P = 2 P[ 2

1n > 2

calc ] = 2 {1 - P[ 2

1n < 2

calc ]}

Para cola a la derecha: P = P[ 2

1n > 2

calc ]

Para cola a la izquierda: P = P[ 2

1n < 2

calc ]


267

Ejemplo 5.-

En un proceso de fabricación, se plantea la hipótesis que la desviación estándar de las

longitudes de cierto tipo de tornillo es 2.0 mm. En una muestra de diez tornillos

elegidos al azar del proceso de producción se han encontrado las siguientes

longitudes en milímetros: 71, 66, 64, 72, 69, 67, 70, 68, 65, 69

Con estos datos, ¿se justifica la suposición que la desviación estándar verdadera es

2.00 mm? Use el nivel de significación = 0.05, y suponga que la distribución de las

longitudes es normal. Halle el valor-P.

Solución:

1. Hipótesis : 4:,4: 2

1

2

0 HH

2. Nivel de significación: = 0.05

3. Estadística de prueba: población normal, con n = 10, y suponiendo verdadera la

hipótesis 4: 2

0 H , la estadística de prueba: 2

9

22

4

)1(

Sn

4. Región crítica: Para = 0.05 y para un contraste bilateral, en la tabla 2 de chi-

cuadrado se encuentran los siguientes valores críticos:

70.22

9,025.0

2

1,2/ n y 02.192

9.975.0

2

1,2/1 n

Luego, la región crítica es: R.C. {X2 < 2.70 o X

2 > 19.02}

5. Cálculos: De los datos de la muestra resulta S2 = 6.77, entonces,

23.154

)77.6(9

4

9

4

)1( 222

SSncalc

6. Decisión: Como 2

calc = 15.23 R.A. se acepta 4: 2

0 H y concluimos que la

desviación estándar es de 2 mm. con el 5% de significación. Rpta.

Como la prueba es bilateral y 2

calc = 15.23 > n – 1 = 9 el valor-P se obtiene así:

P = 2 {1 - P[ 2

1n < 2

calc ]} = 2 {1 - P[ 2

9 < 15.23]} = 2 {1 - x} ……. (1)

Como en la tabla 2, de chi-cuadrado, para 9 grados de libertad, no está el valor 15.23,

pero éste se encuentra entre los valores 14.7 (con probabilidad 0.90) y 16.9 (con

probabilidad 0.95) se determina p interpolando de la siguiente manera:

268

X2α P

14.7 0.90

15.23 x 16.9 14.7 15.23 14.7

0.95 0.90 0.90x

44 =

0.53

0.90x

16.9 0.95 44x – 39.6 = 0.53 x = 0.912

Reemplazando x = 0.9815 en (1) se obtiene:

P = P-valor = 2{1 – 0.912} = 0.176 Rpta.

Como el valor-P = 0.176 > = 0.05 se acepta 4: 2

0 H . Por lo tanto, se concluye

también con un 5% de significación que la desviación estándar es de 2 mm.


En la Ventana de Datos (Hoja de trabajo), columna C1 definir la variable Longitud

(de los tornillos) e ingresar los 10 valores de la muestra.

Del menú escoger Estadísticas → Estadísticas básicas → σ2 1 varianza y aparece

la Ventana 1 varianza siguiente:

En vez de ingresar desviación estándar, escoger ingresar varianza.

Como los datos muestrales aparecen en la columna C1 Longitud, se escoge

Muestras en columnas: y se selecciona en dicho recuadro la columna C1 Longitud.

269

Nota: si ya se tienen los cálculos muestrales, habilitar la opción Datos resumidos y

escribir el Tamaño de muestra: y la Varianza de la muestra: correspondientes.

Lo que sigue es igual para ambos casos.

Seleccionar Realizar prueba de hipótesis y escribir en Varianza hipotética: 4.

Escoger Opciones… → Nivel de confianza: 95.0. Escoger en Hipótesis alterna: no

es igual a. Luego escoger Aceptar y Aceptar


Prueba e IC para una varianza: Longitud Método

Hipótesis nula Sigma-cuadrado = 4

Hipótesis alterna Sigma cuadrado no = 4

El método estándar se utiliza sólo para la distribución normal.

El método ajustado se utiliza para cualquier distribución continua.

Estadísticas

Variable N Desv.Est. Varianza

Longitud 10 2.60 6.77

Intervalos de confianza de 95%

IC para IC para

Variable Método Desv.Est. varianza

Longitud Estándar (1.79, 4.75) (3.20, 22.55)

Ajustado (1.93, 3.98) (3.73, 15.85)

Pruebas

Variable Método Chicuadrada GL Valor P

Longitud Estándar 15.23 9.00 0.170

Ajustado 26.47 15.65 0.084

Aparecen los resultados antes obtenidos: 2

calc = 15.23, el valor-P = 0.17

(ligeramente diferente al 0.176 encontrado con aproximación usando la Tabla 2) y el

intervalo de confianza del 95% para la varianza analizado a continuación.

Nota.-

Si se construye el intervalo de confianza del 95% para la varianza σ2, éste resultará

ser: σ2 ϵ [3.20; 22.55] mm

2 con el 95% de confianza.

En consecuencia, se acepta 4: 2

0 H porque pertenece al intervalo de confianza.

Por lo tanto, se concluye también que la desviación estándar es de 2 mm. con un 95%

de confianza.

270

6.4 PRUEBA DE HIPÓTESIS PARA LA RAZÓN DE VARIANZAS

Sean 2

2

2

1 SyS las varianzas de dos muestras aleatorias independientes de

tamaños respectivos n1 y n2, escogidas de dos poblaciones normales con

varianzas respectivas 2

2

2

1 y . Entonces, la estadística,

1,12

2

2

2

2

1

2

1

21/

/ nnf

S

SF

tiene distribución de probabilidad F con grados de libertad n1 – 1 y n2 – 1. Esta

estadística se utiliza para probar igualdad de varianzas.

Si se supone verdadera la hipótesis nula Ho: 2

2

2

1 o 2

2

2

1 / = 1, la

estadística de la prueba es: 1,12

2

2

1

21 nnfS

SF

Su valor 2

2

2

1

S

SFcalc que resulta de dos muestras aleatorias, se utiliza para

probar la hipótesis nula Ho contra cualquiera alternativa unilateral o bilateral.


1. Hipótesis: Ho : 2

2

2

1 , 2

2

2

11 : H


3. Estadística de prueba: 1,12

2

2

2

2

1

2

1

21/

/ nnf

S

SF

4. Región crítica: determinar los valores 2

1,1,2/11,1,2/ 2121 nnnn Xyf , tales que la

probabilidad de rechazar la hipótesis nula H0 cuando se supone verdadera sea:

2/][2/][ 1,1,2/11,1,2/ 2121 nnnn fFPofFP

La Región crítica es: R.C. = {F < 1,1,2/ 21 nnf o F > 1,1,2/1 21 nnf }

La región de aceptación es: R.A. = { 1,1,2/ 21 nnf ≤ F ≤ 1,1,2/1 21 nnf }

5. Hallar 2

2

2

1

S

SFcalc con la información muestral y suponiendo que Ho es cierta.

6. Decisión: se rechaza H0 con riesgo igual a , si ..CRFcalc (o si ..ARFcalc ).

No se rechaza H0 en caso contrario. Si se rechaza Ho se dice que la prueba es


271


1. Hipótesis: Ho: 2

2

2

1 , 2

2

2

11 : H



2

2

2

2

1

2

1

21/

/ nnf

S

SF

4. Región crítica: determinar el valor 1,1,1 21 nnf tal que la probabilidad de

rechazar H0 cuando se supone verdadera sea:

][ 1,1,1 21 nnfFP

La Región crítica de la prueba es: R.C. = {F > 1,1,1 21 nnf }

1,1,1 21 nnf

La región de aceptación es: R.A. = {F < 1,1,1 21 nnf }

5. Hallar 2

2

2

1

S

SFcalc con la muestra y suponiendo que Ho es cierta.

6. Decisión: se rechaza H0 con riesgo igual a , ..CRFcalc (o si ..ARFcalc ).



1. Hipótesis: Ho : 2

2

2

1 , 2

2

2

11 : H



2

2

2

2

1

2

1

21/

/ nnf

S

SF

272

4. Región crítica: determinar el valor 1,1, 21 nnf tal que la probabilidad de

rechazar H0 cuando se supone verdadera sea:

][ 1,1, 21 nnfFP

La Región crítica de la prueba es: R.C. = {F < 1,1, 21 nnf }

La región de aceptación es: R.A. = {F > 1,1, 21 nnf }

5. Hallar 2

2

2

1

S

SFcalc con la muestra y suponiendo que Ho es cierta.

6. Decisión: se rechaza H0 con riesgo igual a , ..CRFcalc (o si ..ARFcalc ).



La prueba de la hipótesis nula Ho: 2

2

2

1 o 2

2

2

1 / = 1 contra 2

2

2

11 : H o

2

2

2

1 / ≠ 1 a un nivel de significación dado , equivale a determinar el intervalo

de confianza (I.C.) del 100(1 - )% para la razón de varianzas 2

2

2

1 / y luego

rechazar la hipótesis nula Ho: 2

2

2

1 si es que 2

2

2

1 / = 1 ..CI Por el

contrario, si 2

2

2

1 / = 1 ϵ I.C. se “acepta” la hipótesis nula Ho: 2

2

2

1 .



mínima para rechazar Ho), a partir del valor calcF , de manera que:

Para dos colas:

Si calcF < 1 → P = 2 P[ 1,1 21 nnf < calcF ]

Si calcF > 1 → P = 2 P[ 1,1 21 nnf > calcF ] = 2 {1 - P[ 1,1 21 nnf < calcF ]}

Para cola a la derecha: P = P[ 1,1 21 nnf > calcF ]

Para cola a la izquierda: P = P[ 1,1 21 nnf < calcF ]


Ejemplo 6.-

Una compañía diseña un nuevo proceso de moldeo para reducir la variabilidad en el

diámetro de las piezas producidas. Se cree que la varianza del nuevo proceso es

menor que la varianza del proceso antiguo. Para una muestra de 8 piezas del proceso

273

antiguo y una muestra de 6 piezas del proceso nuevo se obtienen los siguientes

diámetros en milímetros:

Antiguo (1): 17, 23, 21, 18, 22, 20, 21, 19

Nuevo (2): 13, 16, 14, 12, 15, 14

¿Confirman estos datos que la varianza de los diámetros con el nuevo proceso es

menor que con el proceso antiguo? Suponga poblaciones normales y use = 0.05

Solución

Sean X1 y X2 las variables que representan los diámetros de las piezas con el proceso

antiguo y nuevo respectivamente. Las dos poblaciones se distribuyen normalmente

con varianzas desconocidas.

1. Hipótesis: H0: 2

1 = 2

2 H1: 2

1 > 2

2


3. Estadística de prueba: siendo las poblaciones normales y suponiendo verdadera

la hipótesis nula Ho, para n1 = 8 y n2 = 6, la estadística de prueba es:

5,72

2

2

1 fS

SF

4. Región crítica: para = 0.05 y la prueba unilateral derecha, f7,5, 0.95 = 4.88 es:

R.C. = {F > 4.88}

5. Cálculos: con los datos de la muestra se obtiene:

2

1S = 4.125, 2

2S = 2 y 2

125.42

2

2

1 S

SFcalc = 2.0625

6. Decisión. Como calcF = 2.0625 R.A. se acepta Ho y concluimos que la

varianza de los diámetros con el nuevo proceso no es menor que con el proceso

antiguo, sino las dos varianzas son iguales con el 5% de significación.

Nota.-

Si se construye el intervalo de confianza del 95% para la razón de varianzas, éste

resultará ser: 2

2

2

1 / ϵ [0.301; 10.91] con el 95% de confianza.

Entonces, se acepta que 2

2

2

1 / = 1, porque pertenece al intervalo de confianza.

Por lo tanto, se concluye que 2

2

2

1 con el 95% de confianza, es decir que la

varianza de los diámetros con el nuevo proceso es igual a la del proceso antiguo.

Para hallar el valor-P, como calcF = 2.0625 > 1 se obtiene así:

274

P = 2 P[f7,5 > 2.0625] = 2{1 - P[f7,5 ≤ 2.0625]} > 0.10 (en Excel = 0.4428).

Rpta.

Ya que en la Tabla 4, de la distribución F, para 7 y 5 grados de libertad la

probabilidad acumulada hasta 2.0625 es menor a 0.95 (en Excel es 0.7786).

Como P = 0.4428 > = 0.05, se acepta la hipótesis nula y se concluye también

con el 5% de significación, que la varianza de los diámetros con el nuevo proceso

no es menor que con el proceso antiguo, sino las varianzas son iguales.


En la Ventana de Datos (Hoja de trabajo), en la columna C1 definir la variable

diámetro Antiguo-1 e ingresar los 8 valores de la muestra y en la columna C2

definir la variable diámetro Nuevo-2 e ingresar los 6 valores de la muestra.

Del menú escoger Estadísticas → Estadísticas básicas → σ2

1 σ2

2 2 varianzas y

aparece la Ventana 2 varianzas siguiente:

Como los datos muestrales aparecen en las columnas C1 y C2, se escoge Muestras

en diferentes columnas y se selecciona en el recuadro de Primera: la columna C1

Antiguo-1 y en el recuadro de Segunda: la columna C2 Nuevo-2.

Nota: si ya se tienen los cálculos muestrales, habilitar la opción Datos resumidos y

escribir el Tamaño de muestra: y la Varianza: (de la muestra) correspondiente a la

Primera: y Segunda: muestra. Lo que sigue es igual para ambos casos.

275

Escoger Opciones… → Nivel de confianza: 95.0. Colocar un Título: (del gráfico)

Varianza antigua vs Varianza nueva. Luego escoger Aceptar y Aceptar


Prueba de varianzas iguales: Antiguo-1, Nuevo-2 Intervalos de confianza de Bonferroni de 95% para desviaciones

estándares

N Inferior Desv.Est. Superior

Antiguo-1 8 1.27062 2.03101 4.65199

Nuevo-2 6 0.82920 1.41421 4.04599

Prueba F (distribución normal)

Estadística de prueba = 2.06, valor p = 0.443

Prueba de Levene (cualquier distribución continua)


Aparecen los resultados antes obtenidos: calcF = 2.0625 y el valor-P = 0.4428. Si se

observan los intervalos de confianza de Bonferroni, en la gráfica de Varianza antigua

vs Varianza nueva, se puede apreciar que estos se entre cruzan, indicando que las

varianzas (y desviaciones estándar) son iguales.

Nuevo-2

Antiguo-1

54321

Intervalos de confianza de Bonferroni de 95% para Desv.Est.

Nuevo-2

Antiguo-1

24222018161412

Datos

Estadística de prueba 2.06

Valor P 0.443

Estadística de prueba 1.25

Valor P 0.286

Prueba F

Prueba de Levene

Varianza antigua vs Varianza Nueva

276

6.5 PRUEBA DE HIPÓTESIS ACERCA DE DOS MEDIAS (con varianzas

conocidas)

Sean X 1 y X 2 las medias de dos muestras aleatorias independientes de

tamaños n1 y n2 seleccionadas respectivamente de dos poblaciones

independientes, con medias 1 y 2 y varianzas 2

1 y 2

2 conocidas.

Si las dos poblaciones son normales, entonces, las estadísticas X 1 y X 2 tienen

respectivamente distribución normal N(1, 2

1 ,/n1) y N(2, 2

2 ,/n2) para n1 > 2,

y n2 > 2. Entonces: X 1 - X 2 tiene distribución normal N(1 - 2;

2

1 /n1+2

2 /n2).

Si las dos poblaciones no son normales, pero n1 y n2 son suficientemente

grandes (n1 > 30 y n2 > 30), entonces, X 1 - X 2 tiene aproximadamente

distribución normal N(1 - 2; 2

1 /n1+2

2 /n2).

Según sean las dos poblaciones normales o no, la estadística de prueba es:

2

2

2

1

2

1

2121 )(

nn

XXZ

→ N(0,1).

Si suponemos verdadera la hipótesis nula H0: 1 = 2 ó 1 - 2 = 0, la

estadística de prueba es: )1,0(

2

2

2

1

2

1

21N

nn

XXZ

Su valor Zcalc =

2

2

2

1

2

1

21

nn

XX

que resulta de dos muestras independientes, se

utiliza para probar Ho: 1 = 2 contra cualquiera de las hipótesis alternativas

H1: 1 2 ó H1: 1 > 2 ó H1: 1 < 2

La estructura de la prueba es similar a los casos descritos usando la

distribución Z.


Si se prueba H0: 1 = 2 o 1 - 2 = 0, contra H1: 1 2 o 1 - 2 ≠ 0, la región

crítica en el rango de variación de Z es:

R.C. = {Z < - Z1-/2 o Z > Z1-/2}

277


Si se prueba H0: 1 = 2 o 1 - 2 = 0, contra H1: 1 > 2 o 1 - 2 > 0, la región

critica en la variación de Z es:

R.C. = {Z > Z1- }


Si se prueba H0: 1 = 2 o 1 - 2 = 0, contra H1: 1 < 2 o 1 - 2 < 0, la región

critica en la variación de Z es:

R.C. = {Z < - Z1- }

Nota 1.- Cuando las hipótesis son de la forma:

1) H0: 1 - 2 = d0 contra H1: 1 - 2 d0

2) H0: 1 - 2 = d0 contra H1: 1 - 2 > d0

3) H0: 1 - 2 = d0 contra H1: 1 - 2 < d0

La estadística de la prueba es:

2

2

2

1

2

1

021

nn

dXXZ

Cuya distribución es aproximadamente normal N(0, 1) según sean las dos

poblaciones normales o no.

Se rechaza H0 con riesgo igual a , si ..CRZcalc (o si ..ARZcalc ). No se

rechaza H0 en caso contrario.

Nota 2.-

Se usa el intervalo de confianza I.C. al 100(1– α)% para la diferencia de medias 1 -

2, a fin de verificar si las medias son iguales (cuando se cumple que 1 - 2 = 0 ϵ

I.C.) o su diferencia asume un valor determinado (si ocurre que 1 - 2 = d0 ϵ I.C.).







278

Ejemplo 7.-

Un fabricante quiere comparar los tiempos de proceso de dos marcas de máquinas A

y B, para fabricar un tipo de artículo. Al observar dos muestras aleatorias de 60

artículos procesados por A y B respectivamente, encuentra que las medias

respectivas son 1,230 y 1,190 segundos. Suponga A = 120 y B = 90 segundos.

a) Al nivel de significación del 5%, ¿se puede inferir que la máquina B es más

rápida que la máquina A? Hallar el valor P.

b) Al nivel de significación del 5%, ¿se puede inferir que la media de B es menor

que la media de A en menos de 7 segundos? Hallar el valor P.

Solución

Sean XA y XB los tiempos de proceso con las máquinas A y B respectivamente y A,

B sus medias respectivas. Se desconocen las distribuciones de probabilidades de

XA y XB, pero las muestras son grandes (nA = nB = 60 > 30). Para determinar si la

máquina B es más rápida que la A, se comparan sus tiempos promedios de proceso:

A > B.

a) 1. Hipótesis: H0: A = B contra H1: A > B


3. Estadística de prueba.- si se supone verdadera la hipótesis Ho y para muestras

grandes, la estadística apropiada es:

)1,0(22

N

nn

XXZ

B

B

A

A

BA

4. Región Crítica. Para = 0.05 y una prueba unilateral de la cola derecha, en la

Tabla 1, distribución de Z se encuentra el valor Z0.95 = 1.645. Luego, la región

crítica es:

R.C. = {Z > 1.645}

5. Cálculos, de los datos se tiene:

nA = nB = 60, Ax = 1230, Bx = 1190, A = 120 y B = 90

E.S. = Error estándar = 60

90

60

120 2222

B

B

A

A

nn

= 19.365

07.2365.19

190,1230,1

ES

xxZ

BA

calc

279

6. Decisión: ya que Zcalc = 2.07 R.C., debemos rechazar Ho y concluir con el 5%

de significación que el equipo B utiliza menos tiempo en el proceso de

fabricación.

El valor P para la cola derecha es:

P = P[Z > Zcalc] = P[Z > 2.07] = 1 – Ф(2.07) = 1 – 0.98077 = 0.01923 Rpta.

Como P = 0.01923 < = 0.05, entonces se rechaza la Ho y se acepta H1: A > B.

Se concluye también con el 5% de significación que el equipo B utiliza menos

tiempo promedio en el proceso de fabricación.


Del menú escoger Estadísticas → Estadísticas básicas → 2t t de 2 muestras y

aparece la Ventana t de 2 muestras (prueba e intervalo de confianza) siguiente:

Recordar que cuando las muestras son grandes t se aproxima a la normal estándar.

Habilitar la opción Datos resumidos y escribir el Tamaño de muestra:, la

Media: y la Desviación estándar: correspondiente a la Primera: y Segunda:

muestra respectivamente.

280

Nota: Si los datos muestrales aparecen en columnas, se escoge Muestras en

diferentes columnas: y se ingresa la Primera: y Segunda: columna en el

recuadro correspondiente. Lo que sigue es igual para ambos casos.

Escoger Opciones… → Nivel de confianza: 95.0. En Diferencia de la prueba:

dejar el 0. Escoger en Hipótesis alterna: mayor que. Luego escoger Aceptar y

Aceptar.


Prueba T de dos muestras e IC Media del

Error

Muestra N Media Desv.Est. estándar

1 60 1230 120 15

2 60 1190.0 90.0 12

Diferencia = mu (1) - mu (2)

Estimado de la diferencia: 40.0

Límite inferior 95% de la diferencia: 7.9

Prueba T de diferencia = 0 (vs. >):

Valor T = 2.07 Valor P = 0.021 GL = 109

Aparecen los resultados antes obtenidos: Zcalc = 2.07 = T y el valor-P = 0.021

(muy próximo al 0.01923 encontrado con Z).

b) Probar que la media de B es menor que la media de A en menos de 7 segundos, es

equivalente a plantear: B < A - 7 o B - A < – 7 o A - B > 7.

Se debe probar H0: A - B = 7 contra H1: A - B > 7.

Si H0 es verdadera, la estadística de la prueba es: )1,0(7)(

22N

nn

XXZ

B

B

A

A

BA

La región crítica de la prueba unilateral de la cola derecha al nivel = 0.05 es 260

misma del caso a): R.C. = {Z > 1.645 }

7.1365.19

7)190,1230,1(7)( 21

ES

xxZcalc

Ya que Zcalc = 1.7 R.C., debemos rechazar Ho y concluir que el tiempo

promedio que utiliza la máquina B en el proceso es menor que el tiempo promedio

de A en menos de 7 segundos.

281

El valor P para la cola derecha es:


Como P = 0.04457 < = 0.05, entonces se rechaza la Ho y se acepta H1: A - B >

7. Se concluye también, con el 5% de significación, que el tiempo promedio que

utiliza la máquina B en el proceso es menor que el tiempo promedio de A en

menos de 7’’.


Los pasos son idénticos hasta antes de escoger Opciones… → Nivel de

confianza: 95.0. En Diferencia de la prueba: escribir 7. Escoger en Hipótesis

alterna: mayor que. Luego escoger Aceptar y Aceptar.



Error


1 60 1230 120 15

2 60 1190.0 90.0 12



Límite inferior 95% de la diferencia: 7.9

Prueba T de diferencia = 7 (vs. >):

Valor T = 1.70 Valor P = 0.046 GL = 109

Aparecen los resultados antes obtenidos: Zcalc = 1.70 = T y el valor-P = 0.046

(muy próximo al 0.04457 encontrado con Z).

6.6 PRUEBA DE HIPÓTESIS ACERCA DE DOS MEDIAS (con varianzas

desconocidas)

Si las dos muestras aleatorias independientes de tamaños n1 y n2 se seleccionan

respectivamente de dos poblaciones cuyas distribuciones no son normales con

varianzas 2 2

1 2y supuestas desconocidas, entonces, siempre que los tamaños de

las muestras sean grandes; n1 30 y n2 30 los parámetros 2 2

1 2y se estiman

respectivamente por 2

2

2

1 SyS .

282

Para probar la hipótesis nula 0 1 2: 0H contra una alternativa bilateral o

unilateral, se utiliza la estadística: 1 2 1 2

2 2

1 1 2 2

( )(0,1)

/ /

X XZ N

S n S n

Las regiones críticas y las reglas de decisión para las pruebas de la hipótesis nula

0 1 2 0 1 2 0: 0 ( : )H o H d contra una alternativa unilateral o bilateral

son las mismas del método con varianzas conocidas.

Sean 1 2X y X las medias y 2

2

2

1 SyS las varianzas de dos muestras aleatorias

independientes pequeñas (n1 < 30 y n2 < 30 respectivamente) seleccionadas de dos

poblaciones normales con medias 1 2y y varianzas 2 2

1 2y desconocidas.

Estas varianzas desconocidas presentan dos casos, ya que pueden ser iguales

(homogéneas) o diferentes (heterogéneas) cuya prueba se realiza mediante el test

de hipótesis para la razón de varianzas del acápite 6.4. Veamos ambos casos.

A. Varianzas desconocidas pero iguales ( 2

2

2

1 )

Si las poblaciones son normales, independientes, y con varianzas desconocidas

pero iguales 2

2

2

1 = 2 , entonces, la estadística de prueba es:

1 2

1 2 1 2

22 2

1 2

( )

n n

c c

X XT t

S S

n n

donde el estimador de la varianza común 2 es:

2 2

1 1 2 22

1 2

1 ( 1)

2c

n S n SS

n n

Si la hipótesis nula 0 1 2:H es verdadera, entonces, la estadística.

2

2

2

1

2

21

21

nn

cc

t

n

S

n

S

XXT

Su valor:

1 2

2 2

1 1 2 2

1 2 1 2

1 ( 1) 1 1

2

calc

x xt

n S n S

n n n n

que resulta de dos muestras aleatorias, se usa para probar H0 con una alternativa

unilateral o bilateral.

283

La estructura de la prueba es similar a la usada con la distribución de t.

1. Prueba bilateral o de dos colas

Si se prueba 0 1 2:H contra

1 1 2:H la región crítica es el intervalo;

R.C. = 1 2 1 21 / 2, 2 1 / 2, 2n n n nT t o T t

2. Prueba unilateral de cola a la derecha


1 1 2:H la región crítica es el intervalo

R.C. = {T 1 21 . 2n nt }

3. Prueba unilateral de cola a la izquierda


1 1 2:H la región crítica es el intervalo.

R.C. = {T 1 21 , 2n nt }

Ejemplo 8

Se compararon dos marcas de llantas de automóvil, 1 y 2, respecto a su duración

en Km; dos muestras aleatorias de 16 llantas de cada marca, dieron estos

resultados:

n1 = 16, 1x = 49,658, S1 = 2,150 y n2 = 16, 2x = 48,125, S2 =

1,875.

Con el 1% de significación, probar si son diferentes las duraciones medias de las

llantas de ambas marcas. Hallar el valor-P.

Solución

Datos: n1 = 16, 1x = 49,658, S1 = 2,150 y n2 = 16, 2x = 48,125, S2 =

1875.

Primero se debe probar si las varianzas de las duraciones de las llantas de ambas

marcas son iguales o no.

Hipótesis: 2

2

2

11

2

2

2

10 :,: HH , = 0.01

Estadística de prueba: siendo las poblaciones normales y suponiendo verdadera


15,152

2

2

1 fS

SF

284

Región crítica, para = 0.01 y la prueba bilateral, en la Tabla 4 de la

distribución F, se obtiene los valores críticos: f15, 15, 0.995 = 4.07; f15, 15, 0.005 = 1 /

4.07 = 0.246.

Entonces: R.C. = {F < 0.246 o F > 4.07}

Cálculos: con los datos de la muestra se obtiene: 2

2

2

2

2

1

1875

2150

S

SFcalc = 1.31

Decisión: como calcF = 1.31 R.A. se acepta Ho y concluimos que las

varianzas de las duraciones de las llantas de ambas marcas son iguales, con el

1% de significación.



1 σ2

2 2 varianzas

y aparece la Ventana 2 varianzas.

Habilitar la opción Datos resumidos y escribir el Tamaño de muestra: 16 y 16,

así como la Varianza: (de la muestra) 4622500 y 3515625 correspondiente a la

Primera: y Segunda: muestra respectivamente.

Escoger Opciones… → Nivel de confianza: 95.0. Luego escoger Aceptar y

Aceptar. En la hoja de Sesión aparecen los resultados siguientes:

Prueba de varianzas iguales Intervalos de confianza de Bonferroni de 95% para

desviaciones estándares

Muestra N Inferior Desv.Est. Superior

1 16 1524.27 2150 3564.60

2 16 1329.31 1875 3108.66



Aparece el calcF = 1.31 antes obtenido y el valor-P = 0.603 > = 0.01 y se

concluye también que las varianzas de las duraciones de las llantas de ambas

marcas son iguales, con el 1% de significación.

A continuación se prueba si son diferentes las duraciones medias de las llantas

de ambas marcas.

Hipótesis: 0 1 2:H contra 1 1 2:H = 0.01

285

La estadística de prueba es: 3021616

2

2

1

2

21 tt

n

S

n

S

XXT

cc

Región crítica, para = 0.01 y la prueba bilateral, en la Tabla 3: t30, 0.995 = 2.75.

R.C. = {T < -2.75 o T > 2.75}

Con la información muestral: n1 = 16, 1x = 49,658, S1 = 2,150 y n2 =

16, 2x = 48,125, S2 = 1875; y bajo el supuesto que Ho es cierta se

determina:

2 2 2 21 1 2 22

1 2

1 ( 1) 15 2150 15 1875

2 16 16 2c

n S n S x xS

n n

= 4’069062.5

1 2

2 2

1 2

49658 481252.15

4069062.5 4069062.5

16 16

calc

c c

x xt

S S

n n

Decisión: como tcalc = 2.15 R.A. se acepta Ho y se concluye que las

duraciones medias de las llantas de ambas marcas no son diferentes.

Para dos colas: P = 2P[T30 > 2.15] = 2[1 – P(T30 ≤ 2.15)] = 2[1 – x] …….. (1)

En la Tabla 3, T de student, no está el valor 2.15, se determina x interpolando

así:

Tα P

2.042 0.975

2.15 x 2.457 2.042 2.15 2.042

0.990 0.975 0.975x

27.67 =

0.108

0.975x

2.457 0.990 27.67x – 26.975 = 0.108 x = 0.9789


P-valor = 2 [1 – 0.9789] = 0.0422 Rpta.

Como el valor-P = 0.0422 > = 0.01 se acepta Ho y se concluye también que

las duraciones medias de las llantas de ambas marcas son iguales, con el 1% de

significación.



aparece la Ventana t de 2 muestras (prueba e intervalo de confianza)

siguiente:

286



muestra respectivamente. Seleccionar Asumir varianzas iguales.


dejar el 0. Escoger en Hipótesis alterna: no es igual a. Luego escoger Aceptar

y Aceptar. En la hoja de Sesión aparecen los resultados siguientes:


Error


1 16 49658 2150 538

2 16 48125 1875 469


Estimado de la diferencia: 1533

IC de 95% para la diferencia: (76, 2990)

Prueba T de diferencia = 0 (vs. no =): Valor T = 2.15

Valor P = 0.040 GL = 30

Ambos utilizan Desv.Est. agrupada = 2017.1917

Aparecen los resultados antes obtenidos tcalc = 2.15 y el valor-P = 0.040 > =

0.01 y se concluye también que las duraciones medias de las llantas de ambas

marcas son iguales, con el 1% de significación.

287

B. Varianzas desconocidas supuestas distintas 2 2

1 2

Si las varianzas de las dos poblaciones normales independientes son desconocidas

supuestas diferentes, entonces, la estadística de prueba usada es:

1 2 1 2

2 2

1 2

1 2

( )

H

X XT t

S S

n n

Donde:

11 2

2

2

2

2

1

2

1

2

1

2

2

2

2

1

2

1

n

n

S

n

n

S

n

S

n

S

H representa los grados de libertad.

Dado que H rara vez es un entero, se toma la parte entera (entero mayor de H).

La prueba de hipótesis es similar a las trabajadas anteriormente con la

distribución t.

Ejemplo 9

Dos máquinas embolsan diariamente detergente de manera independiente.



n1 = 12, 1x = 505, S1 = 10 y n2 = 12, 2x = 495, S2 = 4.

Asumiendo distribución normal para el peso de las bolsas, con el 1% de

significación ¿son diferentes los pesos medios de las bolsas con detergente de

ambas máquinas? Hallar el valor-P.

Solución

Datos: n1 = 12, 1x = 505, S1 = 10 y n2 = 12, 2x = 495, S2 = 4.

Primero se debe probar si las varianzas de los pesos de las bolsas con detergente

de ambas máquinas son iguales o no.

Hipótesis: 2

2

2

11

2

2

2

10 :,: HH , = 0.01

Estadística de prueba: siendo las poblaciones normales y suponiendo verdadera


11,112

2

2

1 fS

SF

288

Región crítica, para = 0.01 y la prueba bilateral, en la Tabla 4 de la

distribución F se obtiene los valores críticos: f11, 11, 0.995 = 5.32; f11, 11, 0.005 = 1 /

5.32 = 0.188.

R.C. = {F < 0.188 o F > 5.32}

Cálculos: con los datos de la muestra se obtiene: 16

1002

2

2

1 S

SFcalc = 6.25

Decisión: Como calcF = 6.25 R.C. se rechaza Ho y concluimos que las

varianzas de los pesos de las bolsas con detergente de ambas máquinas son

diferentes ( 2 2

1 2 ), con el 1% de significación.



1 σ2

2 2 varianzas

y aparece la Ventana 2 varianzas.

Habilitar la opción Datos resumidos y escribir el Tamaño de muestra: 12 y 12,

así como la Varianza: (de la muestra) 100 y 16 correspondiente a la Primera: y

Segunda: muestra respectivamente.

Escoger Opciones… → Nivel de confianza: 99.0. Luego escoger Aceptar y

Aceptar. En la hoja de Sesión aparecen los resultados siguientes:

Prueba de varianzas iguales Intervalos de confianza de Bonferroni de 99% para

desviaciones estándares

Muestra N Inferior Desv.Est. Superior

1 12 6.18776 10 22.1991

2 12 2.47510 4 8.8796



Aparece el calcF = 6.25 antes obtenido y el valor-P = 0.005 < = 0.01 y se

concluye también que las varianzas de los pesos de las bolsas con detergente de

ambas máquinas son diferentes ( 2 2

1 2 ), con el 1% de significación.

A continuación se prueba si son diferentes los pesos medios de las bolsas con

detergente de ambas máquinas.

Hipótesis: 0 1 2:H contra 1 1 2:H = 0.01

289

La estadística de prueba es: 14

2

2

2

1

2

1

21 tt

n

S

n

S

XXT H

Donde: H =

11 2

2

2

2

2

1

2

1

2

1

2

2

2

2

1

2

1

n

n

S

n

n

S

n

S

n

S

=

112

12

16

112

12

100

12

16

12

100

22

2

= 14.43 ≡ 14

Región crítica, para = 0.01 y la prueba bilateral, en la Tabla 3: t14, 0.995 = 2.977

R.C. = {T < -2.977 o T > 2.977}

Datos del problema:

n1 = 12, 1x = 505, 2

1S = 100 y n2 = 12, 2x = 495, 2

2S = 16.

12

16

12

100

495505

2

2

2

1

2

1

21

n

S

n

S

XXTcalc = 3.22

Decisión: como tcalc = 3.22 R.C. se rechaza Ho y se acepta 1 1 2:H . Se

concluye que los pesos medios de las bolsas con detergente de ambas máquinas

sí son diferentes, al 1% de significación.

Para dos colas: P = 2P[T14 > 3.22] = 2[1 – P(T30 ≤ 3.22)] = 2[1 – 0.9969] =

0.0062

Como el valor-P (hallado interpolando en T) = 0.0062 < = 0.01 se rechaza Ho

y se concluye también que los pesos medios de las bolsas con detergente de

ambas máquinas son diferentes, al 1% de significación.



aparece la Ventana t de 2 muestras (prueba e intervalo de confianza).



muestra respectivamente. No seleccionar Asumir varianzas iguales.


dejar el 0. Escoger en Hipótesis alterna: no es igual a. Luego escoger Aceptar

y Aceptar. En la hoja de Sesión aparecen los resultados siguientes:

290


Error


1 12 505.0 10.0 2.9

2 12 495.00 4.00 1.2



IC de 99% para la diferencia: (0.74, 19.26)

Prueba T de diferencia = 0 (vs. no =): Valor T = 3.22

Valor P = 0.006 GL = 14

Aparecen los resultados antes obtenidos tcalc = 3.22, los grados de libertad igual a

14 y el valor-P = 0.006 < = 0.01 y se concluye también que los pesos medios

de las bolsas con detergente de ambas máquinas son diferentes, al 1% de

significación.

6.7 PRUEBA DE HIPÓTESIS PARA LA PROPORCIÓN

Suponga que se dispone de una muestra aleatoria de n observaciones, obtenida

de una población con una proporción p de éxitos (elementos que poseen un

atributo particular). Si el número de observaciones de la muestra es grande y la

proporción muestral observada es p , para realizar contrastes acerca de p se

sigue los siguientes pasos:

1. Hipótesis: H0: p = p0

H1: p ≠ p0 o H1: p > p0, o H1: p < p0,



n

pq

ppZ

ˆ → N(0, 1)

4. La Región crítica de la prueba es:

R.C. = {Z < Zα/2 = - Z1- α/2 o Z > Z1- α/2 } para H1: p ≠ p0

R.C. = {Z > Z1-α} para H1: p > p0

R.C. = {Z < Zα = -Z1-α} para H1: p < p0

5. Con la información muestral y suponiendo que H0: p = p0 es cierta, hallar:

n

qp

ppZ calc

00

0ˆ

291

Donde n

muestralaenéxitosde

n

Xp

#ˆ = proporción de elementos que

poseen un atributo particular en la muestra.

6. Decisión: se rechaza H0 con riesgo igual a , ..CRZcalc (o si ..ARZcalc ). No

se rechaza H0 en caso contrario.

Método del valor P (o P-valor o sig o Probab, etc.)







Ejemplo 10

Una muestra aleatoria de 800 clientes de supermercados, 378 fueron capaces de decir

el precio correcto de un artículo inmediatamente después de ponerlo en el carro.

Contrastar, al nivel de significación del 10%, la hipótesis nula de que al menos la

mitad de los compradores son capaces de decir el precio correcto, frente a la

alternativa de que la proporción poblacional es menor de la mitad. Asimismo, hallar

el p-valor.

Solución

Denotemos por p la proporción poblacional de compradores capaces de decir el

precio correcto en estas circunstancias. Queremos contrastar las hipótesis:

H0: p ≥ p0 = 0.50 H1: p < 0.50 = 0.10 → Zα = -Z1-α = -Z0.90 = -1.28

La región crítica es R.C. = {Z < -1.28}

Datos: p0 = 0.50, n = 800, X = 378 4725.0800/378ˆ p

El estadístico del contraste es, entonces,

800

5.05.0

50.04725.0ˆ

00

0

x

n

qp

ppZcalc

= -1.56

292

Decisión: como Zcalc = –1.64 ϵ R.C. se rechaza la hipótesis nula con el 10% de

significación. Se concluye que menos de la mitad de los compradores son capaces de

decir el precio correcto.

P = P[Z < Zcalc] = P[Z < -1.56] = Ф(-1.56) = 0.05938 Rpta.

Como el valor-P = 0.06 < = 0.10 se rechaza la hipótesis nula y se concluye

también que menos de la mitad de los compradores son capaces de decir el precio

correcto, con el 10% de significación.


Del menú escoger Estadísticas → Estadísticas básicas → 1P 1proporción y

aparece la Ventana 1 proporción (prueba e intervalo de confianza).

Habilitar la opción Datos resumidos y escribir el Número de eventos: 378 (número

de éxitos) y el Número de ensayos: 800 (tamaño de la muestra).

Nota: Si los datos muestrales aparecen en una columna (1 para cada éxito y 0 para

cada fracaso), se escoge Muestras en columnas: y se ingresa dicha columna. Lo que

sigue es igual para ambos casos.

Marcar Realizar prueba de hipótesis y escribir en Proporción hipotética: 0.50.

Escoger Opciones… → Nivel de confianza: 90. Escoger en Hipótesis alterna: menor que.

Seleccionar Utilice la prueba y el intervalo basado en la distribución normal. Luego escoger

Aceptar y Aceptar. En la hoja de Sesión aparecen los resultados siguientes:

Prueba e IC para una proporción Prueba de p = 0.5 vs. p < 0.5

Límite

Muestra X N Muestra p superior 90% Valor Z Valor P

1 378 800 0.472500 0.495121 -1.56 0.060

Uso de la aproximación normal.

Aparecen los resultados antes obtenidos Zcalc = -1.56 y el valor-P = 0.06 < = 0.10 entonces se

rechaza la hipótesis nula y se concluye también que menos de la mitad de los compradores son

capaces de decir el precio correcto, con el 10% de significación.

293

6.8 PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE DOS

PROPORCIONES

Contrastar las hipótesis: Ho: p1 = p2 = p o p1 - p2 = 0 Contra:

H1: p1 < p2 o H1: p1 > p2 o H1: p1 ≠ p2

H1: p1 - p2 ≠ 0 o H1: p1 - p2 > 0 o H1: p1 - p2 < 0

Donde: p1 y p2 son parámetros, siendo estos parámetros las proporciones de

éxito de dos poblaciones binomiales.

La estadística de prueba en la cual se basa los criterios de decisión es la

variable aleatoria: 21 ˆˆ pp ; que tiene distribución normal, esto se cumple para

muestras grandes la cual se aproxima a la distribución normal estándar.

2

22

1

11

2121 )(ˆˆ

n

qp

n

qp

ppppZ

→ N(0, 1)

Si se selecciona muestras aleatorias independientes de tamaño n1 y n2 de una

población binomial, se calcula la proporción de éxitos 1p y 2p de cada

muestra: 1

11ˆ

n

Xp y

2

22ˆ

n

Xp . Donde:

X1: Es el número de éxitos en la muestra de tamaño n1

X2: Es el número de éxitos en la muestra de tamaño n2

El valor de la normal estándar Z, cuando Ho es verdadera y n1, n2 son grandes

es:

21

21

2

22

1

11

21

11

ˆˆˆˆ

nnpq

pp

n

qp

n

qp

ppZ

Para calcular Z, se estima el valor de p que aparece dentro del radical así:

21

21ˆ

nn

XXp

→ q = 1- p

Entonces el valor de la estadística Z, es:

21

21

11ˆˆ

ˆˆ

nnqp

ppZcalc

Luego usando los puntos críticos de la curva normal estándar se puede hallar

la región crítica para cada hipótesis alternativa.

294

PASOS PARA PROBAR LA HIPOTESIS DE DOS PROPORCIONES,

CUANDO LAS MUESTRAS SON GRANDES:

1. Ho: p1 = p2 o p1 - p2 = 0

H1: puede ser una de las alternativas.

H1: p1 < p2 o H1: p1 > p2 o H1: p1 ≠ p2

H1: p1 - p2 < 0 o H1: p1 - p2 > 0 o H1: p1 - p2 ≠ 0

2. Escoger un nivel de significación .

3. La estadística de prueba es la variable aleatoria 21ˆˆ PP , que tiene una

distribución aproximadamente normal cuando n1 y n2 son grandes. Es decir:

2

22

1

11

21 ˆˆ

n

qp

n

qp

ppZ

→ N(0, 1)

Suponiendo que Ho es verdadera.

4. Región Critica:

R.C. = {Z < Zα/2 = - Z1- α/2 o Z > Z1- α/2 } para H1: p1 ≠ p2

R.C. = {Z > Z1-α} para H1: p1 > p2

R.C. = {Z < Zα = -Z1-α} para H1: p1 < p2

5. Para los cálculos se halla:

1

11ˆ

n

Xp ,

2

22ˆ

n

Xp y

21

21ˆ

nn

XXp

Luego:

21

21

11ˆˆ

ˆˆ

nnqp

ppZcalc

6. Decisión: Rechazar: Ho; si Z pertenece a la región crítica; en caso contrario

aceptar Ho.

Método del valor P (o P-valor o sig o Probab, etc.)







295

Ejemplo 11

De una muestra aleatoria de 203 anuncios publicitados en revistas británicas,

52 eran humorísticos. De una muestra aleatoria independiente de 270 anuncios

publicados en revistas americanas, 56 eran humorísticos. Contrastar, frente a

una alternativa bilateral, la hipótesis nula de que las proporciones de anuncios

cómicos de las revistas británicas y americanas son iguales, con el 5% de

significación. Hallar p-valor.

Solución

Sea las proporciones poblacionales de anuncios humorísticos en revistas

británicas y americanas: p1 y p2, entonces se desea probar las hipótesis:

Ho: p1 = p2 y H1: p1 ≠ p2 con α = 0.05 → Z1 – α/2 = Z0.975 = 1.96

La región crítica es R.C. = {Z < -1.96 o Z > 1.96}

Datos: n1 = 203, X1 = 52, 203

52ˆ

1

11

n

Xp = 0.256, n2 = 270, X2 = 56,

270

56ˆ

2

22

n

Xp = 0.207,

473

108

270203

5652ˆ

21

21

nn

XXp = 0.228 y q =

0.772

El estadístico del contraste es:

270

1

203

1772.0228.0

207.0256.0

11ˆˆ

ˆˆ

21

21

xnn

qp

ppZcalc = 1.25

Decisión: como Zcalc = 1.25 ϵ R.A. no se rechaza la hipótesis nula con el 5% de

significación. Se concluye que las proporciones de anuncios cómicos de las

revistas británicas y americanas son iguales.

P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|] = = 2 P[Z < -1.25] =

= 2 Ф(-1.25) = 2 (0.10565) = 0.2113 Rpta.

La hipótesis nula de que las proporciones poblacionales de anuncios

humorísticos son la misma puede rechazarse para niveles de significación

mayores que 20.8%.

Como el valor-P = 0.2113 > = 0.05 no se rechaza la hipótesis nula y se

concluye también que las proporciones de anuncios cómicos de las revistas

británicas y americanas son iguales, con el 5% de significación.

296


Del menú escoger Estadísticas → Estadísticas básicas → 2P 2proporciones y

aparece la Ventana 2 proporciones (prueba e intervalo de confianza).

Habilitar la opción Datos resumidos y escribir para la Primera: y Segunda:

muestra en Eventos: 52 y 108 (número de éxitos) y en Ensayos: 203 y 403 (tamaño

de la muestra).

Nota: Si los datos muestrales aparecen en diferentes columnas (1 para cada éxito y 0

para cada fracaso), se escoge Muestras en diferentes columnas: y se ingresa dichas

columnas en Primera: y Segunda:. Lo que sigue es igual para ambos casos.

Escoger Opciones… → Nivel de confianza: 95. Dejar Diferencia de la prueba: 0.0. Escoger en

Hipótesis alterna: no es igual a. Seleccionar Utilice el cálculo agrupado de p para la prueba.

Luego escoger Aceptar y Aceptar. En la hoja de Sesión aparecen los resultados siguientes:

Prueba e IC para dos proporciones Muestra X N Muestra p

1 52 203 0.256158

2 56 270 0.207407

Diferencia = p (1) - p (2)


IC de 95% para la diferencia: (-0.0283508, 0.125851)

Prueba para la diferencia = 0 vs. no = 0: Z = 1.25 Valor P =

0.211

Prueba exacta de Fisher: Valor P = 0.225

Aparecen los resultados antes obtenidos Zcalc = 1.25 y el valor-P = 0.211 > = 0.05 entonces no se

rechaza la hipótesis nula y se concluye también que las proporciones de anuncios cómicos de las

revistas británicas y americanas son iguales, con el 5% de significación.

297

PRUEBAS DE HIPÓTESIS PARA UN SOLO PARÁMETRO

P.H. PARA LA MEDIA POBLACIONAL H0 : μ = μ0

H1: Caso Estadístico de prueba Rechazar H0 si:

μ > μ0

μ < μ0

μ ≠ μ0

Cuando la muestra es aleatoria de X ~

N (μ, σ2) con σ

2 conocida o n ≥ 30.

n

XZc

/

0

Zc > Z1 – α

Zc < Zα

|Zc| > Z1 – α/2

μ > μ0

μ < μ0

μ ≠ μ0

Cuando la muestra es aleatoria de X ~

N (μ, σ2) con σ

2 desconocida, n < 30.

10

/

nc t

nS

XT

Tc > t1 – α

Tc < tα

|Tc| > t1 – α/2

P.H. PARA LA VARIANZA POBLACIONAL H0 : σ2 = 2

0


σ2 > 2

0

σ2 < 2

0

σ2 ≠ 2

0

La muestra es aleatoria de una población

normal o aproximadamente normal. 2

12

0

2

2)1(

nC

Sn

χ2c > χ

21 – α

χ2c < χ

2α

χ2c < χ

2 α/2 o

χ2c > χ

21 – α/2

P.H. PARA LA PROPORCIÓN POBLACIONAL H0 : p = p0


μ > μ0

μ < μ0

μ ≠ μ0

La muestra es aleatoria y su tamaño es

grande (n ≥ 30)

n

qp

ppZc

00

0ˆ

Zc > Z1 – α

Zc < Zα

|Zc| > Z1 – α/2

PRUEBAS DE HIPÓTESIS PARA DOS PARÁMETROS

P.H. PARA LA IGUALDAD DE VARIANZAS POBLACIONALES H0 : 2

1 = 2

2

H1: Caso Estadístico de prueba Rechazar H0 si: 2

1 > 2

2

2

1 < 2

2

2

1 ≠ 2

2

Dos muestras aleatorias independientes de

poblaciones normales. 1,12

2

2

1

21 nnc fS

SF

Fc > f1 – α

Fc < fα

Fc <f α/2 o

Fc > f1 – α/2

P.H. PARA LA DIFERENCIA DE MEDIAS POBLACIONALES H0 : μ1 - μ2 = μ0


μ1 - μ2 > μ0

μ1 - μ2 < μ0

μ1 - μ2 ≠ μ0

1. Se toman dos muestras aleatorias

independientes, de poblaciones

normales con 2

1 y 2

2

conocidas o n1 y n 2 ≥ 30. 2

2

2

1

2

1

021

nn

XXZc

Zc > Z1 – α

Zc < Zα

|Zc| > Z1 – α/2

μ1 - μ2 > μ0

μ1 - μ2 < μ0

μ1 - μ2 ≠ μ0

2. Se toman dos muestras aleatorias

independientes de poblaciones

normales, con 2

1 y 2

2

desconocidas pero iguales

(varianzas homogéneas).

2

21

2

021

21

11

nn

p

c t

nnS

XXT

Tc > t1 – α

Tc < tα

|Tc| > t1 – α/2

298

μ1 - μ2 > μ0

μ1 - μ2 < μ0

μ1 - μ2 ≠ μ0

3. Dos muestras aleatorias

independientes de poblaciones

normales con 2

1 y 2

2

desconocidas pero diferentes

(varianzas heterogéneas).

Hc t

n

S

n

S

XXT

2

2

2

1

2

1

021

Con:

11 2

2

2

2

2

1

2

1

2

1

2

2

2

2

1

2

1

n

n

S

n

n

S

n

S

n

S

H

Tc > t1 – α

Tc < tα

|Tc| > t1 – α/2

P.H. PARA LA DIFERENCIA DE PROPORCIONES POBLACIONALES H0 : p1 - p2 = 0


p1 - p2 > 0

p1 - p2 < 0

p1 - p2 ≠ 0

Dos muestras aleatorias independien-

tes con n1 y n2 ≥ 30.

Con 21

2211 ˆˆˆ

nn

pnpnp

21

21

11ˆˆ

ˆˆ

nnqp

ppZc

Zc > Z1 – α

Zc < Zα

|Zc| > Z1 – α/2

P.H. PARA LA DIFERENCIA DE PROPORCIONES POBLACIONALES H0 : p1 - p2 = p0


p1 - p2 > p0

p1 - p2 < p0

p1 - p2 ≠ p0

Dos muestras aleatorias independien-

tes con n1 y n2 ≥ 30.

2

22

1

11

021

ˆˆˆˆ

ˆˆ

n

qp

n

qp

pppZc

Zc > Z1 – α

Zc < Zα

|Zc| > Z1 – α/2

299


1. Las bolsas de cierta marca de gelatina indican un contenido medio de 250

gramos. Se toma una muestra aleatoria de 36 bolsas, resultando una media de


a) Al 5% de significación ¿se puede afirmar que no se está cumpliendo con el

contenido medio en las bolsas? Hallar p-valor.

b) ¿Aceptaría usted que σ2 ≠ 250 gr

2 por bolsa? Use α = 0.05. Halle p-valor.

Solución

a) Sea X la variable aleatoria definida como el peso de las bolsas de gelatina.

1. Hipótesis: H0: = 250 gr. H1: 250


3. Estadística de prueba: para muestras grandes (n ≥ 30) es:

n

XZ

/

cuya distribución es N(0,1).

4. Región crítica: para = 0.05 y la alternativa bilateral, en la Tabla 1 de la

distribución normal estándar, se encuentra el valor crítico: Z1-/2 = Z0.975 =

1.96



5. Cálculos, de los datos se tiene: n = 36, 12ˆ,5.246

Sx , =

250.

Entonces:

75.1

36

12

2505.246

n

xZcalc

6. Decisión: Puesto que Zcalc = -1.75 ϵ R.A., no debemos rechazar H0 y

concluir con un 5% de significación que se está cumpliendo con el

contenido medio en las bolsas de gelatina.

P-valor = P[|Z| > |-1.75|] = P[|Z| > 1.75] = 2 P[Z < -1.75] = 2(0.04006) =

0.0801.

300

Como el valor-P = 0.0801 > = 0.05 no se rechaza Ho y se concluye también

con un 5% de significación que se está cumpliendo con el contenido medio en

las bolsas de gelatina.

b) Para verificar la hipótesis acerca de la varianza, se siguen los siguientes

pasos:

1. Hipótesis : H0: σ2 = 250 H1: σ

2 250


3. Estadística de prueba: población normal, con n = 36, y suponiendo

verdadera la hipótesis H0, la estadística de prueba es:

2

35

2

2

22

250

)1()1(

SnSn

4. Región crítica: Para = 0.05 y para un contraste bilateral, en la tabla 2 de

chi-cuadrado se encuentran los siguientes valores críticos:

6.202

35,025.0

2

1,2/ n y 2.532

35.975.0

2

1,2/1 n


2 > 53.2}

5. Cálculos: De los datos de la muestra resulta S2 = 12

2 = 144, entonces,

2.20250

)144(35

250

35

250

)1( 222

SSncalc


calc = 20.2 R.C. se rechaza H0: σ2 = 250 y concluimos

que la varianza de las bolsas de gelatina es diferente a 250 gr2 por bolsa,

con el 5% de significación.


calc = 20.2 < n – 1 = 35 el valor-P se obtiene

así:

P = 2 P[ 2

1n < 2

calc ] = 2 P[ 2

35 < 20.2] = 2 x ……. (1)

Como en la tabla 2, de chi-cuadrado, para 35 grados de libertad, no está el

valor 20.2, pero éste se encuentra entre los valores 18.5 (con probabilidad

0.01) y 20.6 (con probabilidad 0.025) se determina x interpolando de la

siguiente manera:

X2 P

18.5 0.01

20.2 x 20.6 18.5 20.2 18.5

0.025 0.01 0.01x

140 =

1.7

0.01x

301

20.6 0.025 140 x – 1.40 = 1.70 x = 0.02214


P = P-valor = 2{0.02214} = 0.0443 Rpta.

Como el valor-P = 0.0443 < = 0.05 se rechaza H0: σ2 = 250. Por lo tanto, se

concluye también con un 5% de significación que la varianza de las bolsas de

gelatina es diferente a 250 gr2 por bolsa.

2. En un estudio para determinar si ha disminuido el tiempo de vida (en horas) del

artículo producido por una empresa, se tomó una muestra aleatoria de 31

artículos, encontrándose los resultados siguientes: x = 45020 horas y S = 171

horas.

a) Aceptaría usted que el verdadero tiempo promedio de vida de los artículos de

la empresa es menor de 45 090 horas. Use = 0.01 y determine p-valor.

b) ¿Aceptaría usted que σ ≠ 200 horas por artículo? Use α = 0.05. Halle p-valor.

Solución

a) Sea X la variable aleatoria definida como el tiempo de vida del artículo.

1. Hipótesis: H0: = 45090 horas H1: < 45090



n

XZ

/


4. Región crítica: para = 0.01 y la alternativa unilateral izquierda, en la

Tabla 1 de la distribución normal estándar, se encuentra el valor crítico:

Z = -Z1- → Z0.01 = -Z0.99 = -2.33.

Luego, la región crítica está dada por: R.C = {Zcalc < -2.33}

5. De los datos se tiene: n = 31, 171ˆ,45020

Sx , = 45090.

Entonces: 28.231/171

4509045020

/

n

xZcalc

ϵ R.A.

6. Decisión: se acepta H0, se concluye al 1% de significación que el tiempo

promedio de vida de los artículos de la empresa es igual a 45 090 horas.

P-valor = P = P[Z < -2.28] = 0.0113. Rpta.

302

Como P = 0.0113 > = 0.01 se acepta Ho y se concluye también con =

0.01 que el tiempo medio de vida de los artículos de la empresa es de 45 090

horas.


pasos:

1. Hipótesis: H0: σ = 200 → σ2 = 40000 H1: σ 200 → H1: σ

2

40000



verdadera H0, la estadística de prueba es:

2

30

2

2

22

40000

)131()1(

SSn



8.162

30,025.0

2

1,2/ n y 0.472

30.975.0

2

1,2/1 n


2 > 47.0}


2 = 29 241, entonces,

9.2140000

)29241(30

40000

30

40000

)1( 222

SSncalc


calc = 21.9 R.A. no se rechaza H0: σ = 200 y

concluimos que la desviación estándar del tiempo de vida de los artículos

de la empresa es igual a 200 horas, con el 5% de significación.



así:

P = 2 P[ 2

1n < 2

calc ] = 2 P[2

30 < 21.9] = 2 x ……. (1)


valor 21.9, se determina x interpolando de la siguiente manera:

X2 P

20.6 0.10

21.9 x 23.4 20.6 21.9 20.6

0.20 0.10 0.10x

28 =

1.3

0.10x

303

23.4 0.20 28 x – 2.8 = 1.3 x = 0.1464


P = P-valor = 2{0.1464} = 0.2928 Rpta.

Como el valor-P = 0.2928 > = 0.05 se acepta H0: σ = 200. Por lo tanto, se

concluye también con un 5% de significación que la desviación estándar del

tiempo de vida de los artículos de la empresa es igual a 200 horas.


sal. Se toma una muestra aleatoria de 41 bolsas, resultando una media de 495 gr.

y una desviación típica de 12 gr.


contenido medio en las bolsas de sal? Halle p-valor.

b) ¿Aceptaría usted que σ2 < 200 gr


Solución

a) Sea X la variable aleatoria definida como el contenido de sal en las bolsas.

1. Hipótesis: H0: = 500 gr. H1: ≠ 500



n

XZ

/



normal estándar, se encuentra el valor crítico: Z1-/2 = Z0.975 = 1.96




Sx , = 500.

Entonces: 32.231/12

500495

/

n

xZcalc

ϵ R.C.

6. Decisión: se rechaza H0 y se acepta H1: ≠ 500, se concluye al 5% de

significación que no se está cumpliendo con el contenido medio en las

bolsas de sal.

P-valor = P[|Z| > |-2.32|] = P[|Z| > 2.32] = 2 P[Z < -2.32] = 2(0.01017) =

0.02034. Rpta.

304

Como P = 0.02034 < = 0.05 se rechaza Ho y se concluye también con =

0.05, que no se está cumpliendo con el contenido medio en las bolsas de sal.


pasos:

1. Hipótesis: H0: σ2 = 200 gr

2 H1: σ

2 < 200 gr

2




2

40

2

2

22

200

)141()1(

SSn

4. Región crítica: Para = 0.01 y para un contraste unilateral izquierdo, en la

tabla 2 de chi-cuadrado se encuentran el valor crítico siguiente:

2.222

40,01.0

2

1, n

Luego, la región crítica es: R.C. {X2 < 22.2}


2 = 144, entonces,

8.28200

)144(40

200

40

200

)1( 222

SSncalc


calc = 28.8 R.A. no se rechaza H0: σ2 = 200 y

concluimos que la varianza del contenido en las bolsas de sal es igual a

200 gr2, con el 1% de significación.

Como la prueba es unilateral a la izquierda el valor-P se obtiene así:

P = P[ 2

1n < 2

calc ] = P[ 2

40 < 28.8] = x ……. (1)



X2 P

26.5 0.05

28.8 x 29.1 26.5 28.8 26.5

0.10 0.05 0.05x

52 =

2.3

0.05x

29.1 0.10 52 x – 2.6 = 2.3 x = 0.0942

Reemplazando x = 0.0942 en (1) se obtiene: P = P-valor = 0.0942 Rpta.

305

Como el valor-P = 0.0942 > = 0.05 se acepta H0: σ2 = 200. Por lo tanto, se

concluye también con el 1% de significación, que la varianza del contenido

en las bolsas de sal es igual a 200 gr2.

4. Una muestra de 50 animales experimentales reciben una cierta clase de ración

por un período de 2 semanas. Sus aumentos de pesos arrojan los valores x =

420 gr. y S = 60 gr.

a) ¿Hay razón para creer que el aumento de peso neto medio poblacional es

mayor a 410 gr? Use α = 0.01. Halle p-valor.

b) Con α = 0.01 ¿Será rechazada la hipótesis σ2 = 2500 gr

2 a favor de σ

2 >

2500? Halle p-valor.

Solución

a) Sea X la variable aleatoria definida como el aumento de peso en los animales.

1. Hipótesis: H0: = 410 gr. H1: > 410



n

XZ

/


4. Región crítica: para = 0.01 y la alternativa unilateral derecha, en la Tabla

1 de la normal estándar, se encuentra el valor crítico: Z1- = Z0.99 = 2.33


33.2 calcZRC


Sx , = 410.

Entonces: 18.150/60

410420

/

n

xZcalc

ϵ R.A.

6. Decisión: no se rechaza H0: = 410 y se concluye al 1% de significación,

que el aumento de peso neto medio de los animales es igual a 410 gr.

P = P[Z > 1.18] = 1 - P[Z ≤ 1.18] = 1 – 0.881 = 0.119 Rpta.

Como valor-P = 0.119 > = 0.01 no se rechaza Ho y se concluye también

con = 0.01, que el aumento de peso neto medio de los animales es igual a

430 gr.

306


pasos:

1. Hipótesis: H0: σ2 = 2500 gr

2 H1: σ

2 > 2500 gr

2




2

49

2

2

22

2500

)150()1(

SSn

4. Región crítica: Para = 0.01 y para el contraste unilateral derecho, en la

tabla 2 de chi-cuadrado se encuentran el valor crítico siguiente:

9.742

49,99.0

2

1,1 n

Luego, la región crítica es: R.C. {X2 > 74.9}


2 = 3600, entonces,

6.702500

)3600(49

2500

49

2500

)1( 222

SSncalc


calc = 70.6 R.A. no se rechaza H0: σ2 = 2500 y se

concluye que la varianza del aumento del peso neto de los animales es

igual a 2500 gr2, con el 1% de significación.

Como la prueba es unilateral a la derecha el valor-P se obtiene así:

P = P[ 2

1n > 2

calc ] = P[ 2

49 > 70.6] = 1 - P[ 2

49 ≤ 70.6] = 1 - x ……. (1)



X2 P

70.2 0.975

70.6 x 74.9 70.2 70.6 70.2

0.99 0.975 0.975x

313.3 =

0.4

0.975x

74.9 0.99 313.3 x – 305.5 = 0.4 x = 0.9763


P = P-valor = 1 – 0.9763 = 0.0237 Rpta.

307


concluye también con el 1% de significación, que la varianza del aumento del

peso neto de los animales es igual a 2500 gr2.

5. Una universidad grande quiere estimar el número medio de días de enfermedad

de los estudiantes durante un año; una muestra de 50 estudiantes indica que

x = 3.2 días y S = 5.2 días.

a) ¿Hay razón para creer que el verdadero número medio de días de enfermedad

es diferente a 6 días? Use α = 0.05. Halle p-valor.

b) Con α = 0.01 ¿Será rechazada la hipótesis σ2 = 50 a favor de σ

2 < 50? Halle

p-valor.

Solución

a) Sea X la variable aleatoria definida como el número de días de enfermedad de

los estudiantes durante un año.

1. Hipótesis: H0: = 6 días H1: ≠ 6


3. Estadística de prueba: para n ≥ 30 es: n

XZ

/

→ N(0,1).





5. De los datos se tiene: n = 50, 2.5ˆ,2.3

Sx , =

6.

Entonces: 81.350/2.5

62.3

/

n

xZcalc

ϵ R.C.

6. Decisión: se rechaza H0 y se acepta H1: ≠ 6, se concluye con el 5% de

significación, que el número medio de días de enfermedad de los

estudiantes es diferente a 6 días (de acuerdo a los resultados estimados es

de 3.2 días).

308

P = P[|Z| > |-3.81|] = P[|Z| > 3.81] = 2 P[Z < -3.81] = 2(0.000) = 0.000.

Rpta.

Como P = 0.000 < = 0.05 se rechaza Ho y se concluye también con =

0.05, que el número medio de días de enfermedad de los estudiantes es

diferente a 6.


pasos:

1. Hipótesis: H0: σ2 = 50 días

2 H1: σ

2 < 50 días

2




2

49

2

2

22

50

)150()1(

SSn

4. Región crítica: para = 0.01 y el contraste unilateral izquierdo, en la tabla

2 de chi-cuadrado se encuentran el valor crítico siguiente:

9.282

49,01.0

2

1, n


5. Cálculos: De los datos de la muestra resulta S2 = 5.2

2 = 27.04, entonces,

5.2650

)04.27(49

50

49

50

)1( 222

SSncalc


calc = 26.5 R.C. se rechaza H0: σ2 = 50 y concluimos

que la varianza del número de días de enfermedad de los estudiantes es

diferente a 50 días2, con el 1% de significación (de acuerdo a los

resultados estimados es de 27.04 días2).

Como la prueba es unilateral a la izquierda el valor-P se obtiene interpolando:

P = P[ 2

1n < 2

calc ] = P[ 2

49 < 26.5] = 0.0041

Como el valor-P = 0.0041 < = 0.01 se rechaza H0: σ2 = 50. Por lo tanto, se

concluye también con el 1% de significación, que la varianza del número de

días de enfermedad de los estudiantes es diferente a 50 días2.

309

6. Las calificaciones de diez estudiantes en un examen de estadística fueron: 43,

61, 67, 70, 74, 76, 79, 85, 94 y 81. Suponga que estas calificaciones proceden de

una población normal.

a) Ponga a prueba H0: μ = 70 contra H1: μ ≠ 70, con un nivel de significación del

5%. Halle p-valor.

b) Ponga a prueba H0: σ2 = 500 contra H1: σ

2 ≠ 500, con un nivel de

significación de 0.05. Halle p-valor.

Solución

a) Sea X la variable aleatoria definida como las calificaciones de los alumnos.

1. Hipótesis: H0: μ = 70 H1: μ ≠ 70



tnS

xT

4. Región crítica: para = 0.05 y la alternativa bilateral, se encuentra el valor

crítico en la Tabla 3: t1-/2, n-1 = t0.975, 9 = 2.262

Luego, la región crítica en la variable T es: R.C = {T < -2.262 o T >

2.262}

5. Cálculos, con los datos se obtiene: n = 10,

x = 73, S = 14.08 y μ =

70

Entonces: 10/08.14

7073

/

nS

xTcalc

= 0.67

6. Decisión: puesto que Tcalc = 0.67 ϵ R.A., se acepta H0 y se concluye con un

5% de significación que la nota promedio de los alumnos es de 70 puntos.

Siendo la prueba bilateral, entonces p-valor = P es:

P = P[|T9| > |0.67|] = 2 P[T9 > 0.67] = 2{1 - P[T9 ≤ 0.67]} = 2 (1 – 0.75) = 0.50

Rpta.

Ya que en la tabla 3, T de student, para 9 grados de libertad, al valor 0.67 =

0.70, le corresponde una probabilidad acumulada de 0.75.

Como el valor-P = 0.50 > = 0.05, se acepta Ho: μ = 70 y se concluye

también, con un 5% de significación, que la nota promedio de los alumnos es

de 70 puntos.

310


pasos:

1. Hipótesis: H0: σ2 = 500 H1: σ

2 ≠ 500




2

9

2

2

22

500

)110()1(

SSn



70.22

9,025.0

2

1,2/ n y 0.192

9.975.0

2

1,2/1 n


2 > 19.0}


2 = 198.25,

entonces,

57.3500

)25.198(9

500

9

500

)1( 222

SSncalc



concluye que la varianza de las notas de los alumnos es igual a 500

puntos2, con el 5% de significación.



así:

P = 2 P[ 2

1n < 2

calc ] = 2 P[ 2

9 < 3.57] = 2 x ……. (1)



X2 P

3.33 0.05

3.57 x 4.17 3.33 3.57 3.33

0.10 0.05 0.05x

16.8 =

0.24

0.05x

4.17 0.10 16.8 x – 0.84 = 0.24 x = 0.064


P = P-valor = 2{0.064} = 0.128 Rpta.

311


concluye también con un 5% de significación, que la varianza de las notas de

los alumnos es igual a 500 puntos2.

7. Los pesos de los paquetes de arroz embolsado es de 15 Kg. Una muestra

aleatoria de 8 paquetes da una media de 15.3 Kg. y una desviación típica de

1.211 Kg. Suponga que los pesos se distribuyen normalmente.

a) Con una significación del 5 % pruebe si el verdadero peso medio de los

paquetes de arroz es distinto de 15 Kg. Halle p-value.


2 ≠ 5, con un α = 0.05. Halle p-valor.

Solución

a) Sea X la variable aleatoria definida como el peso de los paquetes de arroz.

1. Hipótesis: H0: μ = 15 H1: μ ≠ 15



tnS

xT

4. Región crítica: para = 0.05 y la alternativa bilateral, se encuentra el valor



2.365}


x = 15.3, S = 1.211 y μ =

15

Entonces: 8/211.1

153.15

/

nS

xTcalc

= 0.70

6. Decisión: puesto que Tcalc = 0.70 ϵ R.A., se acepta H0 y se concluye con un

5% de significación que el peso medio de los paquetes de arroz es igual a

15 Kg.


P = P[|T7| > |0.70|] = 2 P[T7 > 0.70] = 2{1 - P[T7 ≤ 0.70]} = 2 (1 – 0.75) = 0.50

Rpta.

Ya que en la tabla 3, T de student, para 7 grados de libertad, al valor 0.70, le

corresponde una probabilidad acumulada cercana a 0.75.

312

Como el valor-P = 0.50 > = 0.05, se acepta Ho: μ = 15 y se concluye

también, con un 5% de significación, que el peso medio de los paquetes de

arroz es igual a 15 Kg.


pasos:

1. Hipótesis: H0: σ2 = 5 H1: σ

2 ≠ 5




2

7

2

2

22

5

)18()1(

SSn



69.12

7,025.0

2

1,2/ n y 0.162

7.975.0

2

1,2/1 n


2 > 16.0}


2 = 1.467, entonces,

05.25

)467.1(7

5

7

5

)1( 222

SSncalc



concluye que la varianza de los pesos de los paquetes de arroz es igual a 5

Kg2, con el 5% de significación.



así:

P = 2 P[ 2

1n < 2

calc ] = 2 P[ 2

7 < 2.05] = 2 x ……. (1)



X2 P

1.69 0.025

2.05 x 2.17 1.69 2.05 1.69

0.05 0.025 0.025x

19.2 =

0.36

0.025x

313

2.17 0.05 19.2 x – 0.48 = 0.36 x = 0.044


P = P-valor = 2{0.044} = 0.088 Rpta.


concluye también con un 5% de significación, que la varianza de los pesos de

los paquetes de arroz es igual a 5 Kg2.

8. Se prueba una muestra aleatoria de 5 fusibles de cierta marca para determinar el

punto medio de ruptura. Los puntos de ruptura medidos en amperes fueron: 28,

32, 30, 24 y 36.

a) ¿Hay razón para creer que el verdadero punto medio de ruptura es mayor de

22 amperes? Use α = 0.01. Halle p-valor.

b) Con α = 0.01, ¿Será rechazada la hipótesis σ2 = 30 amp

2 a favor de σ

2 < 30?

Halle p-valor.

Solución

a) Sea X la variable aleatoria definida como el punto de ruptura de los fusibles.

1. Hipótesis: H0: μ = 22 amperes H1: μ > 22



tnS

xT

4. Región crítica: para = 0.01 y la alternativa unilateral derecha, se

encuentra el valor crítico en la Tabla 3: t1-, n-1 = t0.99, 4 = 3.747

Luego, la región crítica en la variable T es: R.C = {T > 3.747}


x = 30, S = 4.472 y μ =

22

Entonces: 5/472.4

2230

/

nS

xTcalc

= 4.0

6. Decisión: puesto que Tcalc = 4.0 ϵ R.C., se rechaza H0 y se concluye con el

1% de significación que el punto medio de ruptura es mayor de 22

amperes.

Siendo la prueba unilateral derecha, entonces p-valor = P es:

P = P[T4 > Tcalc] = P[T4 > 4.0] = {1 - P[T4 ≤ 4.0]} = (1 – 0.9915) = 0.0085 Rpta.

314

Ya que en la tabla 3, T de student, para 4 grados de libertad, no está el valor

4.0, se interpola y obtiene una probabilidad acumulada de 0.9915.

Como el valor-P = 0.0085 < = 0.01, se rechaza Ho: μ = 22 y se concluye

también, con el 1% de significación, que el punto medio de ruptura de los

fusibles es mayor de 22 amperes.


pasos:

1. Hipótesis: H0: σ2 = 30 amp

2 H1: σ

2 < 30




2

4

2

2

22

30

)15()1(

SSn

4. Región crítica: Para = 0.01 y para un contraste de la cola izquierda, en la

tabla 2 de chi-cuadrado se encuentra el siguiente valor crítico:

297.02

4.01.0

2

1, n


5. Cálculos: De los datos de la muestra resulta S2 = 20, entonces,

67.230

)20(4

30

4

30

)1( 222

SSncalc



concluye que la varianza de los puntos de ruptura de los fusibles es igual a

30 amp2, con el 1% de significación.

Como la prueba es unilateral izquierda y 2

calc = 2.67, el valor-P se obtiene

así:

P = P[ 2

1n < 2

calc ] = P[ 2

4 < 2.67] = 0.3857 Rpta.

Ya que en la tabla 2, de chi-cuadrado, para 4 grados de libertad, no está el

valor 2.67, se interpola y obtiene una probabilidad acumulada de 0.3857


concluye también con el 1% de significación, que la varianza de los puntos de

ruptura de los fusibles es igual a 30 amp2.

315

9. Un fabricante sostiene que sus autos consumen en promedio 2.50 galones de

gasolina cada 100 Km. Un vendedor de la compañía comprueba el consumo de

gasolina de 25 autos y encuentra que el consumo medio es de 2.61 galones cada

100 Km. con una desviación estándar de 0.25 galones.

a) ¿puede dudarse de lo sustentado por el fabricante? Use α = 0.01. Halle p-

valor.

b) ¿Será rechazada la hipótesis σ2 ≠ 0.38? Use α = 0.01. Halle p-valor.

Solución

a) Sea X la variable definida como el número galones consumidos cada 100 Km.

1. Hipótesis: H0: μ = 2.5 galones H1: μ ≠ 2.5



tnS

xT

4. Región crítica: para = 0.01 y la prueba es bilateral, se encuentra el valor



2.797 }


x = 2.61, S = 0.25 y μ =

2.5

Entonces: 25/25.0

50.261.2

/

nS

xTcalc

= 2.2

6. Decisión: puesto que Tcalc = 2.2 ϵ R.A., no se rechaza H0 y se concluye con

el 1% de significación que el consumo medio de gasolina en los autos es

de 2.5 galones cada 100 Km. y no puede dudarse de lo sustentado por el

fabricante.


P = P[|T24| > |2.2|] = 2 P[T24 > 2.2] = 2{1 - P[T24 ≤ 2.2]} = 2 (1 – 0.98) = 0.04

Rpta.



316

Como el valor-P = 0.04 > = 0.01, no se rechaza Ho: μ = 2.5 y se concluye

también, con el 1% de significación, que el consumo medio de gasolina en los

autos es de 2.5 galones cada 100 Km.


pasos:

1. Hipótesis: H0: σ2 = 0.38 galones

2 H1: σ

2 ≠ 0.38




2

24

2

2

22

38.0

)125()1(

SSn



89.92

24,005.0

2

1,2/ n y 6.452

24.995.0

2

1,2/1 n


2 > 45.6}


2 = 0.0625, entonces,

95.338.0

)0625.0(24

38.0

24

38.0

)1( 222

SSncalc


calc = 3.95 R.C. se rechaza H0: σ2 = 0.38 y se

concluye que la varianza del consumo de gasolina en los autos por cada

100 Km. es diferente a 0.38 galones2, con el 1% de significación.



así:

P = 2 P[ 2

1n < 2

calc ] = 2 P[ 2

24 < 3.95] = 2 (0.00) = 0.000

Ya que en la tabla 2, de chi-cuadrado, para 24 grados de libertad, el valor

3.95, tiene una probabilidad acumulada menor de 0.0005 ≡ 0.000

Como el valor-P = 0.000 < = 0.01 se rechaza H0: σ2 = 0.38. Por lo tanto, se

concluye también con el 1% de significación, que la varianza del consumo de

gasolina en los autos por cada 100 Km. es diferente a 0.38 galones2.

317

10. Una muestra de 25 clientes de cierta gasolinera indica que el número medio de

galones comprados a la semana es de x = 14.3 y la desviación estándar de S =

2.7 galones.

a) Con el 5 % de significación. ¿Hay razón para creer que el verdadero número

medio de galones comprados a la semana por cliente es menor de 15.6?

Determine el p-valor.

b) Con α = 0.05 ¿Aceptaría usted que σ2 > 4.1? Determine el p-valor.

Solución

a) Sea X la variable definida como el número de galones de gasolina comprados

a la semana por un cliente.

1. Hipótesis: H0: μ = 15.6 galones H1: μ < 15.6



tnS

xT

4. Región crítica: para = 0.05 y la prueba de la cola izquierda, se encuentra

el valor crítico en la Tabla 3: t, n-1 = -t1-, n-1 → t0.05, 24 = -t0.95, 24 = -1.711.

Luego, la región crítica en la variable T es: R.C = {T < -1.711}


x = 14.3, S = 2.7 y μ =

15.6

Entonces: 25/7.2

6.153.14

/

nS

xTcalc

= -2.41

6. Decisión: puesto que Tcalc = -2.41 ϵ R.C., se rechaza H0 y se concluye con

el 5% de significación, que el consumo medio semanal de gasolina por

cliente es menor a 15.6 galones.

Siendo la prueba unilateral izquierda, entonces p-valor = P es:

P = P[T24 < -2.41] = 1 - P[T24 ≤ 2.41] = 1 – 0.987 = 0.013 Rpta.



Como el valor-P = 0.013 < = 0.05, rechaza Ho: μ = 15.6 y se concluye

también, con el 5% de significación, que el consumo medio semanal de

gasolina por cliente es menor a 15.6 galones.

318


pasos:

1. Hipótesis: H0: σ2 = 4.1 galones

2 H1: σ

2 > 4.1




2

24

2

2

22

1.4

)125()1(

SSn

4. Región crítica: Para = 0.05 y para un contraste unilateral derecho, en la

tabla 2 de chi-cuadrado se encuentran el siguiente valor crítico:

4.362

24,95.0

2

1,1 n

Luego, la región crítica es: R.C. {X2 > 36.4}


2 = 7.29, entonces,

7.421.4

)29.7(24

1.4

24

1.4

)1( 222

SSncalc


calc = 42.7 R.C. se rechaza H0: σ2 = 4.1 y se concluye

que la varianza de las compras de gasolina por cliente es mayor de 4.1

galones2, con el 5% de significación.

Como la prueba es unilateral derecha el valor-P se obtiene así:

P = P[ 2

1n > 2

calc ] = P[ 2

24 > 42.7] = 1 - P[ 2

24 ≤ 42.7] = 1- 0.99 = 0.01

Ya que en la tabla 2, de chi-cuadrado, para 24 grados de libertad, el valor

42.7, tiene una probabilidad acumulada cercana a 0.99.

Como el valor-P = 0.01 < = 0.05 se rechaza H0: σ2 = 4.1. Por lo tanto, se

concluye también con el 5% de significación, que la varianza de las compras

de gasolina por cliente es mayor de 4.1 galones2.

11. Se compararon dos marcas de llantas de automóvil, 1 y 2, respecto a su duración

en Km. Dos muestras aleatorias de 31 llantas de cada marca, dieron estos

resultados:

1x = 46300, n1 = 31, S1 = 5000 y 2x = 48100, n2 = 31, S2 = 6100.

¿Son diferentes las duraciones medias de las llantas de ambas marcas? Use α =

0.01. Determine p-valor.

319

Solución

Sean X1 y X2 la duración (en Km.) de las llantas marca 1 y 2 respectivamente y

1, 2 sus respectivas medias. Se desconoce la distribución de probabilidades de

X1 y X2, pero las muestras son grandes (n1 = n2 = 31 > 30). Para determinar si

son diferentes las duraciones medias de las llantas de ambas marcas, se

comparan sus duraciones medias: 1 ≠ 2.

1. Hipótesis: H0: 1 = 2 contra H1: 1 ≠ 2


3. Estadística de prueba.- si se supone verdadera la hipótesis Ho y para muestras


)1,0(

2

2

2

1

2

1

21N

nn

XXZ

4. Región Crítica. Para = 0.01 y la alternativa bilateral, en la Tabla 1 de la



RC = {Zcalc < -2.575 o Zcalc > 2.575}


n1 = 31, 1x = 46300, S1 = 5000 y n2 = 31, 2x = 48100, S2 =

6100.


6100

31

5000 22

2

2

2

1

2

1 n

S

n

S = 1416.61

27.161.1416

481004630021

ES

xxZcalc

6. Decisión: ya que Zcalc = -1.27 R.A., no se rechaza Ho y se concluye con el

1% de significación, que la duración media de las llantas marca 1 y 2 es la

misma.

El valor P para la prueba bilateral es:

P = P[|Z| > |-1.27|] = P[|Z| > 1.27] = 2P[Z < -1.27] = 2(0.10204) = 0.2041

Rpta.

320

Como P = 2041 > = 0.01 no se rechaza Ho y se concluye también que la

duración media de las llantas de marcas es la misma, con el 1% de

significación.

12. Muestras del pago por hora para los choferes de camiones en las ciudades 1 y 2


n1 = 35, 1x = $ 5.30, S1 = $ 0.16 y n2 = 40, 2x = $ 5.40, S2 = $

0.15.

Con un nivel de significación del 1 %, probar si el pago medio por hora a los

choferes de camión de la ciudad 1 es menor que el pago medio por hora a los

choferes de camión de la ciudad 2. Hallar p-valor.

Solución

Sean X1 y X2 el pago por hora a los choferes de camión en las ciudades 1 y 2

respectivamente y 1, 2 sus respectivas medias. Se desconoce las distribución

de probabilidades de X1 y X2, pero las muestras son grandes (n1 y n2 > 30). Para

probar si el pago medio por hora a los choferes de camión de la ciudad 1 es

menor que el pago medio por hora a los choferes de la ciudad 2, se compara: 1

< 2.

1. Hipótesis: H0: 1 = 2 contra H1: 1 < 2


3. Estadística de prueba: si se supone verdadera la hipótesis Ho y para muestras


)1,0(

2

2

2

1

2

1

21N

nn

XXZ

4. Región Crítica. Para = 0.01 y la alternativa unilateral izquierda, en la Tabla 1

de la normal estándar, el valor crítico es: Z = -Z1- → Z0.01 = -Z0.99 = -2.33.

Luego, la región crítica está dada por: R.C = {Zcalc < -2.33}


1x = $ 5.30, n1 = 35, S1 = $ 0.16 y 2x = $ 5.40, n2 = 40, S2 = $

0.15.

321


15.0

35

16.0 22

2

2

2

1

2

1 n

S

n

S = 0.036

78.2036.0

40.530.521

ES

xxZcalc

6. Decisión: ya que Zcalc = -2.78 R.C., se rechaza Ho y se concluye con el 1%

de significación, que el pago medio por hora a los choferes de camión de la

ciudad 1 es menor que el pago medio por hora a los choferes de la ciudad 2.

El valor P para la prueba unilateral izquierda es:

P = P[Z < -2.78] = 0.0027 Rpta.

Como P = 0.0027 < = 0.01 se rechaza Ho y se concluye también que el

pago medio por hora a los choferes de camión de la ciudad 1 es menor que el

pago medio por hora a los choferes de la ciudad 2, con el 1% de significación.

13. En un estudio para determinar el gasto medio semanal en alimentos en los

hogares de las ciudades 1 y 2, se toma una muestra al azar de 200 hogares de la

ciudad 1 arrojando un gasto medio de S/. 150 y una desviación estándar de 35.

Una muestra al azar de 180 hogares de la ciudad 2 da una gasto medio de 140 y

una desviación estándar de 30. Probar si es diferente el gasto medio semanal en

alimentos en las ciudades 1 y 2. Use α = 0.05. Hallar p-valor.

Solución

Sean X1 y X2 el gasto semanal en alimentos en los hogares de las ciudades 1 y 2

respectivamente y 1, 2 sus respectivas medias. Se desconoce la distribución

de probabilidades de X1 y X2, pero las muestras son grandes (n1 y n2 > 30).

Para determinar si es diferente el gasto medio semanal en alimentos en ambas

ciudades, se comparan sus gastos medios: 1 ≠ 2.

1. Hipótesis: H0: 1 = 2 vs H1: 1 ≠ 2




)1,0(

2

2

2

1

2

1

21N

nn

XXZ

322




RC = {Zcalc < -1.96 o Zcalc > 1.96}


n1 = 200, 1x = 150, S1 = 35 y n2 = 180, 2x = 140, S2 = 30.


30

200

35 22

2

2

2

1

2

1 n

S

n

S = 3.34

34.3

14015021

ES

xxZcalc = 2.99

6. Decisión: ya que Zcalc = 2.99 R.C., se rechaza Ho y se concluye con el 5%

de significación, que el gasto medio semanal en alimentos en las ciudades 1 y

2 es diferente.


P = P[|Z| > |2.99|] = P[|Z| > 2.99] = 2Ф(-2.99) = 2(0.00139) = 0.00278

Rpta.


gasto medio semanal en alimentos de ambas ciudades es diferente, con el 5%

de significación.

14. Se compararon los gastos mensuales (S/.) en educación en las ciudades 1 y 2;

muestras aleatorias de 200 familias de la ciudad 1 y 150 de la ciudad 2, dieron

estos resultados: n1 = 200, 1X = 160, S1 = 60 y n2 = 150, 2X = 150,

S2 = 50.

Use α = 0.05, para determinar si el gasto medio mensual en educación de la

ciudad 1 es mayor que el gasto medio mensual en educación de la ciudad 2.

Hallar el p-valor.

Solución

Sean X1 y X2 el gasto mensual en educación realizado por las familias de las

ciudades 1 y 2 respectivamente y 1, 2 sus respectivas medias. Se desconoce

las distribución de probabilidades de X1 y X2, pero las muestras son grandes (n1

y n2 > 30). Para determinar si el gasto medio mensual en educación de la ciudad

323

1 es mayor que el gasto medio mensual en educación de la ciudad 2, se

comparan sus gastos medios: 1 > 2.

1. Hipótesis: H0: 1 = 2 contra H1: 1 > 2




)1,0(

2

2

2

1

2

1

21N

nn

XXZ

4. Región Crítica. Para = 0.05 y la alternativa unilateral derecha, en la Tabla 1

de la normal estándar, se encuentra el valor crítico: Z1- = Z0.95 = 1.645.

Luego, la región crítica en la variable Z está dada por: RC = { Zcalc > 1.645}


n1 = 200, 1X = 160, S1 = 60 y n2 = 150, 2X = 150, S2 = 50.


50

200

60 22

2

2

2

1

2

1 n

S

n

S = 5.89

89.5

15020021

ES

xxZcalc = 1.70

6. Decisión: ya que Zcalc = 1.70 R.C., se rechaza Ho y se concluye con el 5%

de significación, que el gasto medio mensual en educación de la ciudad 1 es

mayor que el gasto medio mensual en educación de la ciudad 2.

El valor P para la prueba unilateral derecha es:

P = P[Z > 1.70] = 1 – Ф(1.70) =1 – 0.95543 = 0.04457 Rpta.


gasto medio mensual en educación de la ciudad 1 es mayor que el gasto

medio mensual en educación de la ciudad 2, con el 5% de significación.

15. Para determinar el costo medio mensual de la enseñanza en las universidades A

y B, se toma una muestra al azar de 121 alumnos de la universidad A arrojando

un costo medio de S/. 650 y una desviación estándar de S/ 70. Una muestra al

azar de 121 alumnos de la universidad B da una costo medio de S/. 675 y una

desviación estándar de S/. 90. Con α = 0.01, probar si es diferente el costo medio

mensual de la enseñanza en las universidades A y B. Hallar p-valor.

324

Solución

Sean XA y XB el costo mensual de la enseñanza en las universidades A y B

respectivamente y A, B sus respectivas medias. Se desconoce la distribución

de probabilidades de XA y XB, pero las muestras son grandes (nA y nB > 30).

Para determinar si es diferente el costo medio mensual de la enseñanza en ambas

universidades, se comparan sus gastos medios: A ≠ B.

1. Hipótesis: H0: A = B vs H1: A ≠ B




)1,0(22

N

nn

XXZ

B

B

A

A

BA




RC = {Zcalc < -2.575 o Zcalc > 2.575}


nA = 121, Ax = 650, SA = 70 y nB = 121, Bx = 675, SB = 90.


90

121

70 2222

B

B

A

A

n

S

n

S = 10.37

37.10

675650

ES

xxZ

BA

calc = -2.41

6. Decisión: ya que Zcalc = -2.41 R.A., no se rechaza Ho y se concluye con el

1% de significación, que es igual el costo medio mensual de la enseñanza en

las universidades A y B.


P = P[|Z| > |-2.41|] = P[|Z| > 2.41] = 2Ф(-2.41) = 2(0.00798) = 0.01596

Rpta.

325

Como P = 0.01596 > = 0.01 se acepta Ho y se concluye también que el

costo medio mensual de la enseñanza en ambas universidades es igual, con el


16. La producción de 13 obreros de la jornada diurna, dio un promedio de 82 piezas

con una desviación estándar de 10, mientras que para 11 obreros de la jornada

nocturna, dio un promedio de 74 con una desviación estándar de 7. Con el 5% de

significación (α = 0.05), probar si:

a) ¿Son heterogéneas las varianzas de ambos turnos? Halle p-valor.

b) ¿Es diferente la producción media de los dos turnos? Halle p-valor.

Solución

Sean X1 y X2 las variables que representan el número de piezas producidas en

los turnos diurno (1) y nocturno (2) respectivamente. Asumiendo que las dos

poblaciones se distribuyen normalmente con varianzas desconocidas y las

muestras son pequeñas (n1 y n2 < 30) primero se prueba si las varianzas son

heterogéneas, para según ello probar si las medias son diferentes.

Datos: n1 = 13, 1X = 82, S1 = 10 y n2 = 11, 2X = 74, S2 = 7.

a) 1. Hipótesis: H0: 2

1 = 2

2 H1: 2

1 ≠ 2

2


3. Estadística de prueba: suponiendo las poblaciones normales y la hipótesis

nula cierta, para n1 = 13 y n2 = 11, la estadística de prueba es:

10,122

2

2

1 fS

SF

4. Región crítica. Para = 0.05 y la prueba bilateral en la Tabla 4, los valores

críticos F son: f12, 10, 0.025 = 1/ f10, 12, 0.975 = 1/ 3.37 = 0.297 y f12, 10, 0.975 =

3.62.

R.C. = {F < 0.297 o F > 3.62}


2

1S = 100, 2

2S = 49 y 49

1002

2

2

1 S

SFcalc = 2.04

326

6. Decisión. Como calcF = 2.04 R.A. se acepta Ho y concluimos que las

varianzas del número de piezas producidas en los turnos diurno y nocturno

son iguales (homogéneas), con el 5% de significación.

El valor P para la prueba bilateral y como calcF = 2.04 > 1 se obtiene así:

P = 2 P[f12,10 > 2.04] = 2 {1 - P[f12,10 ≤ 2.04]} > 0.10 (en Excel 0.2674).

Rpta.

Ya que en la Tabla 4 de la F, para 12 y 10 grados de libertad, la probabilidad

acumulada hasta 2.04 es menor a 0.95 (en Excel es 0.8663).

Como P > 0.10 > = 0.05, se acepta la hipótesis nula y se concluye también

que las varianzas del número de piezas producidas en los turnos diurno y

nocturno son homogéneas, con el 5% de significación.

b) A continuación se prueba si es diferente la producción media de los dos

turnos.

1. Hipótesis: H0: 1 = 2 y H1: 1 ≠ 2


3. La estadística de prueba cuando las varianzas son homogéneas es:

2221113

2

2

1

2

21 tt

n

S

n

S

XXT

cc

4. Región crítica, para = 0.05 y la prueba bilateral, en la Tabla 3: t22, 0.975 =

2.074. Entonces:

R.C. = {T < -2.0745 o T > 2.074}

5. Con la información muestral: n1 = 13, 1X = 82, S1 = 10 y n2 = 11, 2X =

74, S2 = 7; y bajo el supuesto que Ho es cierta se determina:

2 2 2 21 1 2 22

1 2

1 ( 1) 13 10 11 7

2 13 11 2c

n S n S x xS

n n

= 83.59

1 2

2 2

1 2

82 742.14

83.59 83.59

13 11

calc

c c

x xt

S S

n n

6. Decisión: como tcalc = 2.14 R.C. se rechaza Ho y se concluye con el 5%

de significación, que la producción media de los dos turnos son diferentes.

327


En la Tabla 3, T de student, no está el valor 2.15, se determina x interpolando

así:

Tα P

2.074 0.975

2.14 x 2.508 2.074 2.14 2.074

0.990 0.975 0.975x

28.93 =

0.066

0.975x

2.508 0.990 28.93x – 28.21 = 0.066 x = 0.9774


P-valor = 2 [1 – 0.9774] = 0.0452 Rpta.

Como el valor-P = 0.0452 < = 0.05 se rechaza Ho y se concluye también

que la producción media de los dos turnos son diferentes, con el 5% de

significación.

17. Dos máquinas enlatan café independientemente. Mediante muestras aleatorias

sin reemplazo, de latas con café tomadas de cada máquina, se han obtenido los

siguientes resultados sobre el peso de las latas (en gramos):

n1 = 16, 1X = 495, S1 = 9 y n2 = 16, 2X = 505, S2 = 5.

a) ¿Son diferentes las varianzas de los pesos de las latas con café de ambas

máquinas? Use = 0.05. Halle p-valor.

b) ¿Es mayor el peso medio de las latas con café de la máquina 2 que el de la

máquina 1? Use = 0.01 y determine p-valor.

Solución

Sean X1 y X2 las variables que representan el peso de las latas con café (en gr.)

de las máquinas 1 y 2 respectivamente. Asumiendo que las dos poblaciones se

distribuyen normalmente con varianzas desconocidas y las muestras son

pequeñas (n1 y n2 < 30) primero se prueba si las varianzas son diferentes, para

según ello probar si es mayor el peso medio de las latas con café de la máquina 2

que el de la máquina 1.

Datos: n1 = 16, 1X = 495, S1 = 9 y n2 = 16, 2X = 505, S2 = 5.


1 = 2

2 H1: 2

1 ≠ 2

2

328



nula cierta, para n1 = n2 = 16, la estadística de prueba es:

15,152

2

2

1 fS

SF



2.86.

R.C. = {F < 0.35 o F > 2.86}


2

1S = 81, 2

2S = 25 y 25

812

2

2

1 S

SFcalc = 3.24

6. Decisión. Como calcF = 3.24 R.C. se rechaza Ho y concluimos que las

varianzas de los pesos de las latas con café de ambas máquinas son

diferentes (heterogéneas), con el 5% de significación.


P = 2 P[f15,15 > 3.24] = 2 {1 - P[f15,15 ≤ 3.24]} = 2{1 – x} ……. (1)

Como en la Tabla 4 de la distribución F, para 15 y 15 grados de libertad, no

está el valor 3.24, pero éste se encuentra entre los valores 2.86 (con

probabilidad 0.975) y 3.52 (con probabilidad 0.99) para hallar x se interpola

así:

Fα P

2.86 0.975

3.24 x 3.52 2.86 3.24 2.86

0.99 0.975 0.975x

44 =

0.38

0.975x

3.52 0.99 44 x – 42.9 = 0.38 x = 0.984

Reemplazando x = 0.984 en (1) se tiene:

P = 2 {1 – 0.984} = 0.032 Rpta.

Como P = 0.032 < = 0.05, se rechaza la hipótesis nula y se concluye

también que las varianzas de los pesos de las latas con café de ambas

máquinas son diferentes (heterogéneas), con el 5% de significación.

329

b) A continuación se prueba si el peso medio de las latas con café de la máquina

2, es mayor que el peso medio de las latas con café de la máquina 1.

1. Hipótesis: H0: 1 = 2 y H1: 2 > 1


3. La estadística de prueba cuando las varianzas son heterogéneas es:

23

2

2

2

1

2

1

12 tt

n

S

n

S

XXT H

Donde: H =

11 2

2

2

2

2

1

2

1

2

1

2

2

2

2

1

2

1

n

n

S

n

n

S

n

S

n

S

=

116

16

25

116

16

81

16

25

16

81

22

2

= 23.45 ≡ 23

4. Región crítica, para = 0.01 y la prueba unilateral derecha, en la Tabla 3 el

valor crítico es: t23, 0.99 = 2.50. Entonces: R.C. = {T > 2.50}

5. Con la información muestral: n1 = 16, 1X = 495, S1 = 9, n2 = 16, 2X =


2 1

2 2

1 2

1 2

505 4953.89

81 25

16 16

calc

X Xt

S S

n n


de significación, que el peso medio de las latas con café de la máquina 2 es

mayor que el peso medio de las latas con café de la máquina 1.

Para la cola del lado derecho:

P = P[T23 > 3.89] = 1 - P[T23 ≤ 3.89] < 0.0005 (en Excel 0.0004)

Rpta.

Ya que en la Tabla 3 de la T, para 23 grados de libertad, la probabilidad

acumulada hasta 3.89 es mayor a 0.9995 (en Excel es 0.9996).

Como el valor-P < 0.0005 < = 0.01 se rechaza Ho y se concluye también

que el peso medio de las latas con café de la máquina 2 es mayor que el peso

medio de las latas con café de la máquina 1, con el 1% de significación.

330

18. En un colegio de secundaria, el cociente de inteligencia de 15 alumnos del turno

diurno, dio un promedio de 112 con una desviación estándar de 6; mientras que

para 15 estudiantes del turno nocturno, dio un promedio de 105 con una

desviación estándar de 15. Con el 1% de significación pruebe sí:

a) ¿Son heterogéneas las varianzas de ambos grupos? Halle p-valor.

b) ¿Son diferentes los cocientes medios de inteligencia de los 2 turnos? Halle p-

valor.

Solución

Sean X1 y X2 las variables que representan el cociente de inteligencia de los

alumnos del turno diurno (1) y del turno nocturno (2) respectivamente.

Asumiendo que las dos poblaciones se distribuyen normalmente con varianzas

desconocidas y las muestras son pequeñas (n1 y n2 < 30) primero se prueba si las

varianzas son heterogéneas, para según ello probar si son diferentes los cocientes

medios de inteligencia de los 2 turnos.

Datos: n1 = 15, 1X = 112, S1 = 6 y n2 = 15, 2X = 105, S2 = 15.


1 = 2

2 H1: 2

1 ≠ 2

2




14,142

2

2

1 fS

SF



4.30.

R.C. = {F < 0.233 o F > 4.30}


2

1S = 36, 2

2S = 225 y 225

362

2

2

1 S

SFcalc = 0.16


varianzas de los cocientes de inteligencia de los 2 turnos son diferentes

(heterogéneas), con el 1% de significación.

331

El valor P para la prueba bilateral y como calcF = 0.16 < 1 se obtiene así:

P = 2 P[f14,14 < 0.16] = 2 P[1/ f14,14 ≥ 1/ 0.16] = 2 P[f14,14 ≥ 6.25] =

= 2 {1 - P[f14,14 ≤ 6.25]} < 0.01 (en Excel 0.0016). Rpta.


acumulada hasta 6.25 es mayor a 0.995 (en Excel es 0.9992).

Como P < 0.01 < = 0.01, se rechaza la hipótesis nula y se concluye también

que las varianzas de los cocientes de inteligencia de ambos turnos son

diferentes (heterogéneas), con el 1% de significación.

b) A continuación se prueba si son diferentes los cocientes medios de

inteligencia de los 2 turnos.

1. Hipótesis: H0: 1 = 2 y H1: 1 ≠ 2



18

2

2

2

1

2

1

21 tt

n

S

n

S

XXT H

Donde: H =

11 2

2

2

2

2

1

2

1

2

1

2

2

2

2

1

2

1

n

n

S

n

n

S

n

S

n

S

=

115

15

225

115

15

36

15

225

15

36

22

2

= 18.37 ≡ 18

4. Región crítica, para = 0.01 y la prueba bilateral, en la Tabla 3 el valor

crítico es: t18, 0.995 = 2.878. Entonces: R.C. = {T < -2.878 o T > 2.878}

5. Con la información muestral: n1 = 15, 1X = 112, S1 = 6, n2 = 15, 2X =


1 2

2 2

1 2

1 2

112 1051.68

36 225

15 15

calc

X Xt

S S

n n

6. Decisión: como tcalc = 1.68 R.A. se acepta Ho y se concluye con el 1%

de significación, que los cocientes medios de inteligencia de los 2 turnos

son iguales.

332


En la Tabla 3, T de student, con 18 grados de libertad, no está el valor 1.68,

se determina x interpolando así:

Tα P

1.330 0.90

1.68 x 1.734 1.330 1.68 1.330

0.95 0.90 0.90x

8.08 =

0.35

0.90x

1.734 0.95 8.08x – 7.272 = 0.35 x = 0.943


P-valor = 2[1 – 0.943] = 0.114 Rpta.

Como el valor-P = 0.114 > = 0.01 no se rechaza Ho y se concluye también

que los cocientes medios de inteligencia de ambos turnos son iguales, con el


19. Muestras del sueldo de hombres (1) y mujeres (2) de una compañía


n1 = 20, 1X = $ 540, S1 = $ 16 y n2 = 20, 2X = $ 530, S2 = $ 15.

a) ¿Son heterogéneas las varianzas de los sueldos de ambos grupos? Use =

0.01. Halle p-valor.

b) Con un nivel de significación del 5%, probar si el sueldo medio de las

mujeres es menor que el de los hombres. Hallar p-valor.

Solución

Sean X1 y X2 las variables que representan el sueldo de los hombres (1) y de las

mujeres (2) respectivamente. Asumiendo que las dos poblaciones se distribuyen

normalmente con varianzas desconocidas y las muestras son pequeñas (n1 y n2 <

30) primero se prueba si las varianzas son heterogéneas, para según ello probar

si el sueldo medio de las mujeres es menor que el de los hombres.

Datos: n1 = 20, 1X = $ 540, S1 = $ 16 y n2 = 20, 2X = $ 530, S2 = $

15.


1 = 2

2 H1: 2

1 ≠ 2

2


333



19,192

2

2

1 fS

SF



3.43.

R.C. = {F < 0.292 o F > 3.43}


2

1S = 256, 2

2S = 225 y 225

2562

2

2

1 S

SFcalc = 1.14

6. Decisión. Como calcF = 1.14 R.A. no se rechaza Ho y concluimos que

las varianzas de los sueldos de ambos grupos son iguales (homogéneas),



P = 2 P[f19,19 > 1.14] = 2 {1 - P[f19,19 ≤ 1.14]} > 0.10 (en Excel 0.778).

Rpta.


acumulada hasta 1.14 es menor a 0.95 (en Excel es 0.611).

Como P > 0.10 > = 0.01, no se rechaza la hipótesis nula y se concluye

también que las varianzas de los sueldos de ambos grupos son iguales

(homogéneas), con el 1% de significación.

b) A continuación se prueba si el sueldo medio de las mujeres es menor que el

de los hombres.

1. Hipótesis: H0: 1 = 2 y H1: 2 < 1


3. La estadística de prueba cuando las varianzas son homogéneas es:

3822020

2

2

1

2

12 tt

n

S

n

S

XXT

cc

4. Región crítica, para = 0.05 y la prueba unilateral izquierda, en la Tabla 3:

t38, 0.05 = - t38, 0.95 = -1.686. Entonces:

334

R.C. = {T < -1.686}

5. Con la información muestral: n1 = 20, 1X = $ 540, S1 = $ 16, n2 = 20,

2X = $ 530, S2 = $ 15; y bajo el supuesto que Ho es cierta se determina:

2 2 2 21 1 2 22

1 2

1 ( 1) 19 16 19 15

2 20 20 2c

n S n S x xS

n n

= 240.5

2 1

2 2

1 2

530 5402.04

240.5 240.5

20 20

calc

c c

X Xt

S S

n n

6. Decisión: como tcalc = -2.04 R.C. se rechaza Ho y se concluye con el 5%

de significación, que el sueldo medio de las mujeres es menor que el

sueldo medio de los hombres.

Para la prueba unilateral izquierda:

P = P[T38 < -2.04] = 1 – P(T38 ≤ 2.04) = 1 – 0.976 = 0.024 Rpta.

Como el valor-P = 0.024 < = 0.05 se rechaza Ho y se concluye también que

el sueldo medio de las mujeres, es menor que el sueldo medio de los hombres,


20. Se ha llevado a cabo un estudio para analizar los gastos mensuales en seguridad

particular realizada por las empresas comerciales de dos ciudades. Mediante

muestras aleatorias sin reemplazo de 20 empresas tomadas en cada ciudad se han

obtenido los siguientes resultados:

n1 = 20, 1x = 402, S1 = 25 y n2 = 20, 2x = 385, S2 = 15.

a) ¿Son diferentes las varianzas de los gastos mensuales en seguridad particular

realizada por las empresas comerciales de las dos ciudades? Use = 0.05.

Halle p-valor.

b) ¿Son diferentes los gastos medios mensuales en seguridad particular realizada

por las empresas comerciales de ambas ciudades? Use = 0.05 y halle p-

valor.

Solución

Sean X1 y X2 las variables que representan los gastos mensuales en seguridad

particular de las empresas comerciales en las ciudades 1 y 2 respectivamente.

Asumiendo que las dos poblaciones se distribuyen normalmente con varianzas

335

desconocidas y las muestras son pequeñas (n1 y n2 < 30) primero se prueba si las

varianzas son diferentes; para según ello, probar si son diferentes los gastos

medios mensuales en seguridad particular de las empresas comerciales de ambas

ciudades.

n1 = 20, 1x = 402, S1 = 25 y n2 = 20, 2x = 385, S2 = 15.


1 = 2

2 H1: 2

1 ≠ 2

2




19,192

2

2

1 fS

SF



2.53.

R.C. = {F < 0.395 o F > 2.53}


2

1S = 625, 2

2S = 225 y 225

6252

2

2

1 S

SFcalc = 2.78


varianzas de los gastos mensuales en seguridad particular realizada por las

empresas comerciales de las dos ciudades son diferentes (heterogéneas),



P = 2 P[f19,19 > 2.78] = 2 {1 - P[f19,19 ≤ 2.78]} = 2{1 – x} ……. (1)

Como en la Tabla 4 de la distribución F, para 19 y 19 grados de libertad, no

está el valor 2.78, pero éste se encuentra entre los valores 2.53 (con

probabilidad 0.975) y 3.03 (con probabilidad 0.99) para hallar x se interpola

así:

Fα P

2.53 0.975

2.78 x 3.03 2.53 2.78 2.53

0.99 0.975 0.975x

33.33 =

0.25

0.975x

336

3.03 0.99 33.33 x – 32.5 = 0.25 x = 0.983

Reemplazando x = 0.983 en (1) se tiene:

P = 2 {1 – 0.983} = 0.034 Rpta.

Como P = 0.034 < = 0.05, se rechaza la hipótesis nula y se concluye

también que las varianzas de los gastos mensuales en seguridad particular

realizada por las empresas comerciales de ambas ciudades son diferentes

(heterogéneas), con el 5% de significación.

b) A continuación se prueba si son diferentes los gastos medios mensuales en

seguridad particular de las empresas comerciales de ambas ciudades.

1. Hipótesis: H0: 1 = 2 y H1: 2 ≠ 1



31

2

2

2

1

2

1

21 tt

n

S

n

S

XXT H

Donde: H =

11 2

2

2

2

2

1

2

1

2

1

2

2

2

2

1

2

1

n

n

S

n

n

S

n

S

n

S

=

120

20

225

120

20

625

20

225

20

625

22

2

= 31.11 ≡ 31


crítico es: t31, 0.975 = 2.04. Entonces: R.C. = {T < -2.04 o T > 2.04 }

5. Con la información muestral: n1 = 20, 1x = 402, S1 = 25 y n2 =

20, 2x = 385, S2 = 15; y bajo el supuesto que Ho es cierta se

determina:

1 2

2 2

1 2

1 2

402 3852.61

625 225

20 20

calc

X Xt

S S

n n


de significación, que los gastos medios mensuales en seguridad particular

de las empresas comerciales de ambas ciudades son diferentes.


337

En la Tabla 3, T de student, con 31 grados de libertad, no está el valor 2.61,

pero éste se encuentra entre los valores 2.453 (con probabilidad 0.99) y 2.744

(con probabilidad 0.995) para hallar x se interpola así:

Tα P

2.453 0.990

2.61 x 2.744 2.453 2.610 2.453

0.995 0.990 0.990x

58.2 =

0.157

0.990x

2.744 0.995 58.2 x – 57.618 = 0.157 x = 0.993


P-valor = 2[1 – 0.993] = 0.014 Rpta.

Como el valor-P = 0.014 < = 0.05 se rechaza Ho y se concluye también que

los gastos medios mensuales en seguridad particular de las empresas

comerciales de ambas ciudades son diferentes, con el 1% de significación.


(con 1’700 000 hogares) indica que el 30.5 % de los hogares compra periódicos

y revistas. Aceptaría Ud. que menos del 34 % de hogares limeños compra

periódicos y revistas? Use α = 0.05. Halle p-valor.

Solución

Denotemos con p la proporción (%) poblacional de hogares que compra

periódicos y revistas. Se quiere contrastar las hipótesis si menos del 34 % (0.34)

de hogares limeños compra periódicos y revistas.

1. Hipótesis: H0: p ≥ p0 = 0.34, H1: p < 0.34


3. Estadística de prueba: )1,0(ˆ

00

0 N

n

qp

ppZ

4. Región crítica, para = 0.05 y la prueba unilateral izquierda, en la Tabla 1 el

valor crítico es: Zα = -Z1-α = -Z0.95 = -1.645. Entonces: R.C. = {Z < -1.645}

5. Con la información muestral: n = 1000, 305.0ˆ p y bajo el supuesto que

Ho: p = p0 = 0.34 es cierta, se determina:

338

1000

66.034.0

34.0305.0ˆ

00

0

x

n

qp

ppZcalc

= -2.33

6. Decisión: como Zcalc = –2.33 ϵ R.C. se rechaza la hipótesis nula y se concluye

con el 5% de significación, que menos del 34 % (p < 0.34) de hogares

limeños compra periódicos y revistas (la estimación muestral indica que es el

30.5%).


Como el valor-P = 0.0099 < = 0.05 se rechaza la hipótesis nula y se concluye

también que menos del 34 % de hogares limeños compra periódicos y revistas,



(con 1.7 millones de hogares) 644 hogares indicaron que tienen abastecimiento

de agua de la red pública dentro de la vivienda. ¿Aceptaría usted que la

verdadera proporción de hogares que tienen abastecimiento de agua de la red

pública dentro de la vivienda difiere de 0.75 (75%)? Use α = 0.01. Halle p-valor.

Solución

Denotemos con p la proporción (%) poblacional de hogares que tienen

abastecimiento de agua de la red pública dentro de la vivienda. Se quiere

contrastar las hipótesis si la proporción de hogares que tienen abastecimiento de

agua de la red pública dentro de la vivienda difiere de 0.75 o 75% (p ≠ 0.75).

1. Hipótesis: H0: p = p0 = 0.75, H1: p ≠ 0.75



00

0 N

n

qp

ppZ


crítico es: Z1-α/2 = Z0.995 = 2.575. Entonces: R.C. = {Z < -2.575 o Z >

2.575}

5. Con la información muestral: n = 800, X = 644, 800

644ˆ

n

Xp = 0.805 y

bajo el supuesto que Ho: p = p0 = 0.75 es cierta, se determina:

339

800

25.075.0

75.0805.0ˆ

00

0

x

n

qp

ppZcalc

= 3.59

6. Decisión: como Zcalc = 3.59 ϵ R.C. se rechaza la hipótesis nula y se concluye

con el 1% de significación, que la proporción de hogares que tienen

abastecimiento de agua de la red pública dentro de la vivienda difiere de 0.75

o 75% (la estimación muestral señala que es 0.805 o el 80.5%).

Como la prueba es bilateral, el valor-P se determina así:

P = P[|Z| > |Zcalc|] = P[|Z| > 3.59] = 2Ф(-3.59) = 2(0.00017) = 0.00034

Rpta.

Como el valor-P = 0.00034 < = 0.01 se rechaza la hipótesis nula y se

concluye también que la proporción de hogares que tienen abastecimiento de

agua de la red pública dentro de la vivienda difiere de 0.75 o 75%, con el 1% de

significación.

23. De una muestra aleatoria de 500 ciudadanos entrevistados en Lima

Metropolitana, 400 indicaron que hay problemas de seguridad. ¿Indica esta

evidencia que más del 75 % de los ciudadanos limeños perciben que hay

problemas de seguridad? Use el nivel de significación de 0.05. Halle p-valor.

Explique el error tipo II.

Solución

Denotemos con p la proporción (%) poblacional de ciudadanos de Lima

Metropolitana que indican que hay problemas de seguridad. Se quiere contrastar

las hipótesis si más del 75 % (p > 0.75) de los ciudadanos limeños perciben que

hay problemas de seguridad.

1. Hipótesis: H0: p = p0 = 0.75, H1: p > 0.75



00

0 N

n

qp

ppZ


valor crítico es: Z1-α = Z0.95 = 1.645. Entonces: R.C. = {Z > 1.645}

340


400ˆ

n

Xp = 0.80 y bajo

el supuesto que Ho: p = p0 = 0.75 es cierta, se determina:

500

25.075.0

75.080.0ˆ

00

0

x

n

qp

ppZcalc

= 2.58

6. Decisión: como Zcalc = 2.58 ϵ R.C. se rechaza la hipótesis nula y se concluye

con el 5% de significación, que más del 75 % (p > 0.75) de los ciudadanos

limeños perciben que hay problemas de seguridad (la estimación muestral

señala que es 0.80 o el 80%).

Como la prueba es unilateral derecha, el valor-P se determina así:

P = P[Z > Zcalc] = P[Z > 2.58] = 1 – Ф(2.58) = 1 – 0.99506 = 0.00494

Rpta.


concluye también que más del 75 % (p > 0.75) de los ciudadanos limeños

perciben que hay problemas de seguridad, con el 1% de significación.

Error tipo II.- consiste en aceptar Ho (que el 75% de los ciudadanos limeños

percibe que hay problemas de seguridad) cuando es falsa (este porcentaje

realmente es de más del 75%).

24. Se tomó una muestra aleatoria de 300 compradores en un centro comercial y se

encontró que 182 están a favor de un horario más amplio para las compras.

¿Esta evidencia es suficiente para concluir que menos del 65 % de los

compradores están a favor de un horario más extenso? Use un nivel de

significación de 0.05. Halle p-valor.

Solución

Denotemos con p la proporción (%) poblacional de compradores en el centro

comercial que responden que están a favor de un horario más amplio para las

compras. Se quiere probar las hipótesis si menos del 65 % (p < 0.65) de los

compradores están a favor de un horario más extenso en el centro comercial.

1. Hipótesis: H0: p = p0 = 0.65, H1: p < 0.65


341


00

0 N

n

qp

ppZ




182ˆ

n

Xp = 0.607 y

bajo el supuesto que Ho: p = p0 = 0.65 es cierta, se determina:

300

35.065.0

65.0607.0ˆ

00

0

x

n

qp

ppZcalc

= -1.56

6. Decisión: como Zcalc = -1.56 ϵ R.A. no se rechaza la hipótesis nula y se

concluye con el 5% de significación, que el 65 % (p = 0.65) de los

compradores están a favor de un horario más extenso en el centro comercial.

Como la prueba es unilateral izquierda, el valor-P se determina así:


Como el valor-P = 0.05938 > = 0.05 no se rechaza la hipótesis nula y se

concluye también que el 65 % (p = 0.65) de los compradores están a favor de

un horario más extenso en el centro comercial, con el 5% de significación.


Metropolitana, 375 indicaron que no están de acuerdo con el servicio militar

obligatorio.

¿Indica esta evidencia que menos del 80 % de los ciudadanos no están de

acuerdo con el servicio militar obligatorio? Use el nivel de significación de 0.01.

Halle p-valor.

Solución

Denotemos con p la proporción (%) poblacional de ciudadanos entrevistados

que responden que indican que no están de acuerdo con el servicio militar

obligatorio. Se quiere probar las hipótesis si menos del 80% (p < 0.80) de los

ciudadanos no están de acuerdo con el servicio militar obligatorio.

1. Hipótesis: H0: p = p0 = 0.80, H1: p < 0.80


342


00

0 N

n

qp

ppZ




375ˆ

n

Xp = 0.75 y bajo

el supuesto que Ho: p = p0 = 0.80 es cierta, se determina:

500

20.080.0

80.075.0ˆ

00

0

x

n

qp

ppZcalc

= -2.80

6. Decisión: como Zcalc = -2.80 ϵ R.C. se rechaza la hipótesis nula y se concluye

con el 1% de significación, que menos del 80% (p < 0.80) de los ciudadanos

no están de acuerdo con el servicio militar obligatorio.

Como la prueba es unilateral izquierda, el valor-P se determina así:

P = P[Z < Zcalc] = P[Z < -2.80] = Ф(-2.80 ) = 0.00256 Rpta.


concluye también que menos del 80% (p < 0.80) de los ciudadanos no están de

acuerdo con el servicio militar obligatorio, con el 1% de significación.

26. A fin de determinar el nivel de aceptación de una revista de negocios, se

entrevistaron dos grupos de empresarios: de Lima Metropolitana (1) y del Resto



300.

Con α = 0.05 ¿Son diferentes las verdaderas proporciones de empresarios

“limeños” y “no limeños” que aceptan la revista de negocios? Determine p-

valor.

Solución

Sean p1 y p2, las proporciones poblacionales de empresarios de Lima

Metropolitana (1) y del Resto del País (2) que aceptan la revista de negocios.

Entonces, se desea probar si son diferentes las verdaderas proporciones de

empresarios “limeños” y “no limeños” que aceptan la revista de negocios.

343

1. Hipótesis: Ho: p1 = p2 y H1: p1 ≠ p2



2

22

1

11

2121 )(ˆˆ

n

qp

n

qp

ppppZ

→ N(0, 1)


crítico es: Z1-α/2 = Z0.975 = 1.96. Entonces: R.C. = {Z < -1.96 o Z > 1.96}

5. Bajo el supuesto que Ho es cierta y con la información muestral: n1 = 800,

X1 = 280, 800

280ˆ

1

11

n

Xp = 0.35, n2 = 1200, X2 = 300,

1200

300ˆ

2

22

n

Xp

= 0.25, 2000

580

1200800

300280ˆ

21

21

nn

XXp = 0.29 y q = 0.71; se determina:

1200

1

800

171.029.0

25.035.0

11ˆˆ

ˆˆ

21

21

xnn

qp

ppZcalc = 4.83

6. Decisión: como Zcalc = 4.83 ϵ R.C. se rechaza la hipótesis nula con el 5% de

significación. Se concluye que son diferentes las verdaderas proporciones de

empresarios “limeños” y “no limeños” que aceptan la revista de negocios.

P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|] = 2 P[Z < -4.83] =

= 2 Ф(-4.83) < 0.0001 (en Excel 0.0000014). Rpta.

Ya que en la Tabla 1 de la distribución normal estándar, la probabilidad

acumulada hasta -4.83 es menor a 0.0001 (en Excel es 0.00000068).

Como P < 0.0001 < = 0.01, se rechaza la hipótesis nula y se concluye también

que son diferentes las verdaderas proporciones de empresarios “limeños” y “no

limeños” que aceptan la revista de negocios, con el 5% de significación.

27. En una muestra aleatoria de 400 adultos, 220 están de acuerdo con la gestión

presidencial. Mientras que en una muestra de 600 jóvenes, 300 están de acuerdo

con la gestión presidencial. ¿Se puede afirmar que la verdadera proporción de

adultos que está de acuerdo con la gestión presidencial, es mayor que la

proporción de jóvenes que está de acuerdo con dicha gestión? Use α = 0.05.

Halle p-valor.

Solución

344

Sean p1 y p2, las proporciones poblacionales de adultos (1) y de jóvenes (2) que

están de acuerdo con la gestión presidencial. Entonces, se desea probar si la

verdadera proporción de adultos que está de acuerdo con la gestión presidencial,

es mayor que la proporción de jóvenes que está de acuerdo con dicha gestión.

1. Hipótesis: Ho: p1 = p2 y H1: p1 > p2



2

22

1

11

2121 )(ˆˆ

n

qp

n

qp

ppppZ

→ N(0, 1)


valor crítico es: Z1-α = Z0.95 = 1.645. Entonces: R.C. = {Z > 1.645}


X1 = 220, 400

220ˆ

1

11

n

Xp = 0.55, n2 = 600, X2 = 300,

600

300ˆ

2

22

n

Xp =

0.50, 1000

520

600400

300220ˆ

21

21

nn


600

1

400

148.052.0

50.055.0

11ˆˆ

ˆˆ

21

21

xnn

qp

ppZcalc = 1.55

6. Decisión: como Zcalc = 1.55 ϵ R.A. no se rechaza la hipótesis nula con el 5%

de significación. Se concluye que son iguales las verdaderas proporciones de

adultos y de jóvenes que están de acuerdo con la gestión presidencial.

Para la prueba es unilateral derecha:


Como P = 0.06057 > = 0.05, se “acepta” la hipótesis nula y se concluye

también que son iguales las verdaderas proporciones de adultos y de jóvenes que

están de acuerdo con la gestión presidencial, con el 5% de significación.

28. De los alumnos de la UNAC se toma una muestra aleatoria de 300 mujeres, 150

de las cuales están a favor de la titulación con tesis. En una muestra de 200

hombres, 120 indican que están a favor de lo mismo. ¿Se puede afirmar que hay

una diferencia significativa entre las verdaderas proporciones de alumnos y

alumnas que están a favor de la titulación con tesis? Use α = 0.01. Halle p-valor

345

Solución

Sean p1 y p2, las proporciones poblacionales de estudiantes hombres (1) y

mujeres (2) que están a favor de la titulación con tesis. Entonces, se desea probar

si son diferentes las verdaderas proporciones de alumnos y alumnas que están a

favor de la titulación con tesis.




2

22

1

11

2121 )(ˆˆ

n

qp

n

qp

ppppZ

→ N(0, 1)


crítico es: Z1-α/2 = Z0.995 = 2.575. Entonces: R.C. = {Z < -2.575 o Z >

2.575}


X1 = 120, 200

120ˆ

1

11

n

Xp = 0.60, n2 = 300, X2 = 150,

300

150ˆ

2

22

n

Xp =

0.50,

500

270

300200

150120ˆ

21

21

nn


300

1

200

146.054.0

50.060.0

11ˆˆ

ˆˆ

21

21

xnn

qp

ppZcalc = 2.20

6. Decisión: como Zcalc = 2.20 ϵ R.A. no se rechaza la hipótesis nula con el 1%

de significación. Se concluye que son iguales las verdaderas proporciones de

alumnos y alumnas que están a favor de la titulación con tesis.

P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|] = 2 P[Z < -2.20] =

= 2 Ф(-2.20) = 2 (0.0139) = 0.0278 Rpta.


también que son iguales las verdaderas proporciones de alumnos y alumnas que

están a favor de la titulación con tesis, con el 1% de significación.

29. Una empresa desea determinar la proporción de hogares que adquiere su

producto en las ciudades 1 y 2. Una muestra al azar de 600 hogares en cada

346

ciudad arroja que 288 lo adquiere en la ciudad 1 y 252 en la ciudad 2. ¿Será la

proporción de hogares que adquiere el producto en la ciudad 2 menor que la

proporción de hogares que adquiere el producto en la ciudad 1? Use = 0.01.

Halle p-valor.

Solución

Sean p1 y p2, las proporciones poblacionales de hogares que adquiere el producto

en las ciudades 1 y 2 respectivamente. Entonces, se desea probar si la verdadera

proporción de hogares que adquiere el producto en la ciudad 2 menor que la

proporción de hogares que adquiere el producto en la ciudad 1.

1. Hipótesis: Ho: p1 = p2 y H1: p2 < p1



2

22

1

11

1212 )(ˆˆ

n

qp

n

qp

ppppZ

→ N(0, 1)

4. Región crítica, para = 0.01 y la prueba unilateral, en la Tabla 1 el valor

crítico es: Zα = -Z1-α = -Z0.99 = -2.33. Entonces: R.C. = {Z < -2.33}


X1 = 288, 600

288ˆ

1

11

n

Xp = 0.48, n2 = 600, X2 = 252,

600

252ˆ

2

22

n

Xp =

0.42, 1200

540

600600

252288ˆ

21

21

nn


600

1

600

155.045.0

48.042.0

11ˆˆ

ˆˆ

21

12

xnn

qp

ppZcalc = -2.09

6. Decisión: como Zcalc = -2.09 ϵ R.A. no se rechaza la hipótesis nula con el 1%

de significación; y se concluye que las verdaderas proporciones poblacionales

de hogares que adquiere el producto en las ciudades 1 y 2 son iguales.

Para la prueba es unilateral izquierda:



también que las proporciones poblacionales de hogares que adquiere el producto

en las ciudades 1 y 2 son iguales, con el 5% de significación.

347

30. Se entrevistaron dos grupos de mujeres respecto a su interés por los polos de

verano “Sol y mar”. De una muestra de 250 mujeres menores de 40 años, 150

estuvieron interesados, mientras que de 250 mujeres de 40 años a más, sólo 120

mostraron interés. Con el 5% de significación, ¿existe diferencia entre la

proporción de mujeres menores de 40 años y las de 40 años a más que mostraron

interés por los polos de verano “Sol y mar”? Halle p-valor.

Solución

Sean p1 y p2, las proporciones poblacionales de mujeres menores de 40 años (1)

y las mujeres de 40 años a más (2) que muestran interés por los polos de verano

“Sol y mar”. Entonces, se desea probar si son diferentes ambas proporciones .




2

22

1

11

2121 )(ˆˆ

n

qp

n

qp

ppppZ

→ N(0, 1)


crítico es: Z1-α/2 = Z0.975 = 1.96. Entonces: R.C. = {Z < -1.96 o Z > 1.96}


X1 = 150, 250

150ˆ

1

11

n

Xp = 0.60, n2 = 250, X2 = 120,

250

120ˆ

2

22

n

Xp =

0.48, 500

270

250250

120150ˆ

21

21

nn


250

1

250

146.054.0

48.060.0

11ˆˆ

ˆˆ

21

21

xnn

qp

ppZcalc = 2.69

6. Decisión: como Zcalc = 2.69 ϵ R.C. se rechaza la hipótesis nula con el 5% de

significación; y se concluye que son diferentes las verdaderas proporciones de

mujeres menores de 40 años y las de 40 años a más que mostraron interés por

los polos de verano “Sol y mar”.

P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|] = 2 P[Z < -2.69] = 2 Ф(-2.69) = 2 (0.00357)

= 0.00714. Como P = 0.00714 < = 0.05, se rechaza la hipótesis nula y se

concluye también que son diferentes las verdaderas proporciones .

348


1. Un proceso está programado para embotellar la cantidad media de 750 mililitros

de gaseosa. Se toma una muestra aleatoria de 41 botellas, resultando una media

de 745 ml. y una desviación típica de 12 ml.


contenido medio en las botellas de gaseosa? Halle p-valor.

2. ¿Aceptaría usted que σ2 < 200 ml

2 por botella? Use α = 0.05. Halle p-valor.

Un proceso está programado para embolsar la cantidad media de 250 gramos

de café. Se toma una muestra aleatoria de 36 bolsas, resultando una media de


a) ¿Se puede afirmar que el contenido medio en las bolsas de café es mayor de

250 gramos? Use α = 0.05. Halle p-valor.




frejol. Se toma una muestra aleatoria de 35 bolsas, resultando una media de


a) Al 5% de significación ¿se puede afirmar que el contenido medio en las

bolsas de frejol es menor de 500 gramos? Halle p-valor.

b) ¿Aceptaría usted que σ2 > 300 gr


4. Se tiene la siguiente prueba de hipótesis: Ho: µ ≥ 100 y H1: µ < 100.

Una muestra de 50 elementos produce una media muestral de 95.5 y una

desviación estándar muestral de 12.

a) Realice la prueba de hipótesis usando α = 0.05. Halle p-valor.


2 ≠ 120, use α = 0.05. Halle p-valor.

5. Un proceso está programado para embolsar la cantidad media de 1000 gramos

de lenteja. Se toma una muestra aleatoria de 36 bolsas, resultando una media de



contenido medio en la bolsa? Halle p-valor.



349

6. Los pesos de diez estudiantes (en Kg.) fueron: 60, 44, 66, 71, 75, 75, 80, 84, 93

y 82. Suponga que estos pesos proceden de una población normal.

a) Ponga a prueba H0: μ = 70 Kg. contra H1: μ ≠ 70, con un α = 0.05. Halle p-

valor.

b) Ponga a prueba H0: σ2 = 80 Kg

2 contra H1: σ

2 > 80, use α = 0.05. Halle p-

valor.

7. Los pesos netos (grs.) de las bolsas de detergente es de 250. Una muestra

aleatoria de 10 bolsas dio estos pesos: 248, 251, 248, 247, 245, 246, 246, 252,

247, 250.

a) Será la media poblacional de los pesos netos menor a 250gr. Use α = 0.01.

Halle p-valor.


2 ≠ 15, con un α = 0.05. Halle p-valor.

8. Las latas de duraznos de la Compañía “La dulzura” deben contener un peso neto

de 16 onzas, pero hay una gran variabilidad. Una muestra aleatoria de seis latas

revela los pesos netos siguientes en onzas: 15.1, 16.1, 15.8, 15.4, 16.1 y 15.1.

a) Use α = 0.01 para determinar si el verdadero peso neto de las latas de

duraznos es menor de 16 onzas. Determine p-valor.

b) ¿Aceptaría usted que σ2 < 1.25 gr


9. Se prueba una muestra aleatoria de 9 bolsas de cierta marca para determinar el

peso medio de llenado. Los pesos de las bolsas, en onzas, fueron: 18, 22, 25, 20,

19, 26, 21, 24 y 23.

a) ¿Hay razón para creer que el verdadero peso medio de llenado es mayor de 18

onzas? Use α = 0.01. Halle p-valor.

b) ¿Será rechazada la hipótesis σ2 > 3.5 onzas

2? Use α = 0.05. Halle p-valor.

10. Los pesos en kilos de una muestra aleatoria de 8 cajas de galleta son: 14.6, 12.5,

15.3, 16.1, 14.4, 12.9, 13.7 y 14.9. Suponiendo que los pesos se distribuyen

normalmente.

a) Con una significación del 5 % pruebe si el peso medio de las cajas de galleta

es distinto de 14 Kg. Halle p-valor.


2 ≠ 5, con un nivel de significación de

0.05. Halle p-valor.

350

11. Un departamento de producción desea determinar si hay diferencia en el

rendimiento entre el turno diurno y el nocturno. Una muestra aleatoria de 80

obreros del turno diurno alcanza una producción media de 94.3 partes por hora,

con una desviación estándar de 14 partes por hora, mientras que otra muestra de

60 obreros de la noche alcanza un promedio de 89.7 partes por hora, con una

desviación estándar de 17. Se pide probar si es diferente el rendimiento medio de

ambos turnos. Use α = 0.05. Hallar p-valor.

12. En un estudio para determinar el costo medio de los televisores en las ciudades

A y B, se toma una muestra al azar de 200 hogares de A arrojando un costo

medio de $ 250 y una desviación estándar de 15. Una muestra al azar de 180

hogares de la ciudad B da una costo medio de $ 235 y una desviación estándar

de 10.

Con α = 0.01, probar si el costo medio de los televisores en las ciudades A es

mayor que el costo medio de los televisores en la ciudad B. Hallar p-valor.

13. El departamento de marketing desea determinar si hay diferencia entre las ventas

mensuales promedio realizadas por hombres y mujeres. Una muestra aleatoria de

80 mujeres arroja una venta media de 95 artefactos mensuales, con una

desviación estándar de 14 artefactos, mientras que otra muestra de 60 hombres

alcanza un promedio de 89 artefactos mensuales, con una desviación estándar de

17.

Con α = 0.05, ¿son diferentes las ventas medias realizadas por hombres y

mujeres (µm ≠ µh)? Determine el p-valor.

14. En un estudio para determinar el gasto medio mensual de los hogares en frutas

para las ciudades A y B, se toma una muestra al azar de 100 hogares de A

arrojando un gasto medio de S/. 82 y una desviación estándar de 15. Una

muestra al azar de 100 hogares de la ciudad B da una gasto medio de 75 y una

desviación estándar de 10.

Use α = 0.01, para probar si el gasto medio mensual en frutas en la ciudad B es

menor que el gasto medio en A. Halle p-valor.

15. Se comparan dos marcas de cigarrillos, 1 y 2, respecto a su contenido de nicotina

en miligramos; dos muestras aleatorias de 40 cigarrillos de la marca 1 y 50 de la

351

marca 2, dieron estos resultados: 1x = 14.3, n1 = 40, S1 = 2.9 y 2x =

15.7, n2 = 50, S2 = 3.8. ¿Es diferente el contenido medio de nicotina de las

dos marcas? Use α = 0.01. Halle p-valor.

16. Dos máquinas embotellan jugo independientemente. Mediante muestra aleatoria

sin reemplazo de botellas tomadas de cada máquina se han obtenido los

siguientes resultados sobre el contenido de las botellas (en ml.):

n1 = 16, 1X = 495, S1 = 5 y n2 = 16, 2X = 505, S2 = 7.

a) ¿Son diferentes las varianzas de los contenidos de las botellas con jugo de

ambas máquinas? Use = 0.05. Halle p-valor.

b) ¿Son diferentes los contenidos medios de las botellas con gaseosa de ambas

máquinas? Use = 0.01 y determine p-valor.

17. Se ha llevado a cabo un estudio para analizar los gastos mensuales en publicidad

(en dólares) realizado por las empresas comerciales de dos ciudades. Mediante

muestras aleatorias sin reemplazo tomadas independientemente en cada ciudad

se han obtenido los siguientes resultados:

n1 = 20, 1X = $ 950, S1 = 95 y n2 = 18, 2X = $ 850, S2 = 60.

a) ¿Son heterogéneas las varianzas de los gastos mensuales en publicidad de

ambas ciudades? Use = 0.01. Halle p-valor.

b) Con un nivel de significación del 5 %, probar si los gastos mensuales en

publicidad de las empresas de la ciudad 1 es mayor que el de las empresas de

la ciudad 2. Hallar p-valor.

18. Dos grupos (de 16 alumnas cada uno) escogidos al azar de una escuela para

secretarias, aprenden taquigrafía por dos métodos diferentes y luego se les

somete a pruebas de dictado. Se encuentra que el grupo 1 obtiene en promedio

123 palabras por minuto con una desviación estándar de 15 palabras, mientras

que el grupo 2 promedia 110 palabras por minuto con una desviación estándar de

10 palabras. Con el 1% de significación probar si:

a) ¿Son heterogéneas las varianzas de ambos grupos? Halle p-valor.

b) ¿Es diferente el promedio de palabras por minuto para los dos métodos? Halle

p-valor.

352

19. Se ha llevado a cabo un estudio para analizar los gastos mensuales (S/.) en

alquiler de local realizado por las empresas comerciales de dos ciudades

grandes. Mediante muestras aleatorias sin reemplazo tomadas

independientemente en cada ciudad se han obtenido los siguientes resultados:

n1 = 20, 1x = 938, S1 = 96 y n2 = 20, 2x = 856, S2 = 62.

a) ¿Son diferentes las varianzas de los gastos mensuales en alquiler de ambas

ciudades? Use = 0.05. Halle p-valor.

b) Con un nivel de significación del 5 %, probar si los gastos mensuales en

alquiler de las empresas de la ciudad 1 es menor que el de las empresas de la

ciudad 2. Hallar p-valor.

20. Dos máquinas embolsan diariamente detergente de manera independiente.



n1 = 12, 1x = 505, S1 = 10 y n2 = 12, 2x = 495, S2 = 4.

Con el 1% de significación probar si:

a) ¿Son diferentes las varianzas de los pesos de las bolsas con detergente de

ambas máquinas? Halle p-valor.

b) ¿Son diferentes los pesos medios de las bolsas con detergente de ambas

máquinas? Halle p-valor.

21. De una población de 100,000 fumadores de cigarro, se selecciona una muestra

aleatoria de 800 fumadores y se encuentra que 240 tienen preferencia por la

marca A. ¿Esta evidencia es suficiente para concluir que más del 25 % de los

fumadores de cigarro prefieren la marca A? Use un nivel de significación del

1%. Halle p-valor.

22. En una muestra aleatoria de 500 de los 100 000 ciudadanos de un distrito se

encontró que 200 están de acuerdo con la gestión del alcalde. Indica esta

evidencia que menos del 45% de los ciudadanos están de acuerdo con la gestión

del alcalde. Use un nivel de significación del 5%. Halle p-valor.

23. De una muestra aleatoria de 500 hombres entrevistados, 125 indicaron que ven

fútbol los lunes en la noche por televisión. ¿Indica esta evidencia que más del 20

% de los televidentes hombres ven el fútbol los lunes por la noche? Use el nivel

de significación de 0.01. Halle p-valor.

353

24. En una muestra aleatoria de 600 de los 20000 hogares de un distrito se encontró

que 240 consumen leche. Indica esta evidencia que menos del 45% de los

hogares consumen leche. Use un nivel de significación del 5%. Halle p-valor.

Explique el error tipo I.


Metropolitana, 200 indicaron que no están de acuerdo con el voto electrónico.

¿Indica esta evidencia que más del 20 % de los ciudadanos no están de acuerdo

con el voto electrónico? Use el nivel de significación de 0.01. Halle p-valor.

26. Se entrevistaron a hombres y mujeres respecto a su interés por una nueva marca

de perfume. En una muestra aleatoria de 400 hombres y 600 mujeres, 220

hombres y 300 mujeres dijeron que les gustaba el nuevo perfume. Con el 1% de

significación, ¿existe diferencia entre las verdaderas proporciones de hombres y

mujeres que dijeron que les gustaba el nuevo perfume? Halle p-valor.

27. De los alumnos de la UNAC se toma una muestra aleatoria de 600 hombres, 300

de las cuales están a favor del cambio curricular. En una muestra de 400

mujeres, 240 indican que están a favor de lo mismo. ¿Se puede afirmar que es

menor la proporción de hombres que están a favor del cambio curricular, que la

proporción de mujeres a favor del cambio curricular? Use α = 0.01. Halle p-

valor.

28. A fin de determinar el nivel de aceptación de la gestión presidencial, se

entrevistaron dos grupos de ciudadanos: de Lima Metropolitana (1) y del Resto



300

Con α = 0.05 ¿Existe diferencia entre las verdaderas proporciones de “limeños”

y “no limeños” que están de acuerdo con la gestión presidencial? Determine p-

valor.


casacas de cuero. De una muestra de 300 mujeres de 40 años a más, 75

estuvieron interesadas, mientras que de 200 mujeres menores 40 años, 80

mostraron interés. Con el 5% de significación, ¿será mayor la proporción de

354

mujeres menores de 40 años interesadas en la compra de casacas de cuero, que la

proporción de las de 40 años a más interesadas en dicha compra. Halle p-valor.

30. En una muestra aleatoria de 400 jóvenes, 220 están de acuerdo con la

suscripción de los Tratados de Libre Comercio (TLC’s). Mientras que en una

muestra de 600 adultos, 300 están de acuerdo con la suscripción de TLC’s.

a) ¿Está Ud. de acuerdo que más del 50% de jóvenes está de acuerdo con la

suscripción de TLC’s? Use α = 0.01. Halle p-valor.

b) ¿Se puede afirmar que hay una diferencia significativa entre las verdaderas

proporciones de jóvenes y adultos que están de acuerdo con la suscripción de

TLC’s? Use α = 0.05. Halle p-valor.

355

Capítulo 7. PRUEBAS DE HIPÓTESIS NO

PARAMÉTRICAS

“Ser culto, es el único modo de ser libre” José Martí

CONTENIDO

7.1 Uso de la distribución Chi-cuadrado. Test de independencia.

7.2 Test de bondad de ajuste.

7.3 Test de Wilcoxon.

7.4 Test de signos.

7.5 Test de la mediana.



En este capítulo, se presenta algunos métodos para la realización de pruebas

estadísticas no paramétricas, las mismas que no requieren la verificación de algunos

supuestos como la normalidad y homogeneidad de varianzas, para la realización de

pruebas paramétricas.

Los métodos no paramétricos son una serie de procedimientos que no requieren

supuestos acerca de la distribución de probabilidad por ello son llamados métodos de

libre distribución y son empleados con datos medidos en escala nominal u ordinal,

asi como con datos de intervalo o razón sin suponer distribución alguna.

Entre las ventajas del uso de los métodos no paramétricos se tiene:

- Se emplean cuando se desconoce la distribución de la población estudiada.

- Las hipótesis se formulan sin considerar valores para los parámetros.

- Se usa en datos de escala nominal u ordinal.

- Se usan cuando las muestras son pequeñas (n < 30).

Las desventajas de estos métodos son:

- Se vuelven complicadas para muestras grandes.

- Se desperdicia información usando métodos no paramétricos si se puede emplear

procedimientos paramétricos.

A continuación se desarrollan las principales pruebas estadísticas no paramétricas

con sus correspondientes aplicaciones.

356

7.1 USO DE LA DISTRIBUCIÓN CHI-CUADRADO. TEST DE

INDEPENDENCIA

En muchos estudios surge el interés por determinar si existe alguna relación de

dependencia entre variables cualitativas, cuyos resultados son presentados en

tablas de contingencia de f filas por c columnas. Las categorías (cualidades,

atributos o modalidades) de las variables se presentan en los márgenes superior

e izquierdo, en las casillas se presenta las frecuencias observadas para las

distintas combinaciones y los totales en los márgenes derecho e inferior.

Suponga que se desea determinar si las variables A y B son dependientes. Sean

Ai las categorías de A (i = 1, 2, …., f) y Bj las categorías de B (j = 1, 2, …., c)

las que se muestra en la tabla de contingencia pxq siguiente:

Obs. B1 …. Bj …. Bc ∑

A1 O11 …. O1j …. O1c O1.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

Ai Oi1 …. Oij …. Oic Oi.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

Af Of1 …. Ofj …. Ofc Of.

∑ O.1 …. O.j …. O.c n

En la tabla anterior se muestra también las frecuencias observadas Oij, los

totales de cada fila Oi. =

c

j

ijO1

, los totales de cada columna O.j =

f

i

ijO1

y el

total de observaciones para el estudio

f

i

i

c

j

j OOn11

.

Los pasos a seguir para la prueba de hipótesis son:

1. Hipótesis: Ho: A y B son variables independientes

H1: A y B son variables dependientes

357



f

i

cf

c

j ij

ijij

e

eO

1

2

)1)(1(

1

2

2)(

Donde n

OxOe

ji

ij

son las frecuencias esperadas obtenidas con las

frecuencias observadas, suponiendo que Ho es cierta, es decir que A y B son

independientes. Las frecuencias esperadas se muestran en la tabla de

contingencia pxq siguiente:

Esp. B1 …. Bj …. Bc ∑

A1 e11 …. e1j …. e1c O1.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

Ai ei1 …. eij …. eic Oi.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

Af ef1 …. efj …. efc Of.

∑ O.1 …. O.j …. O.c n

4. Región crítica: hallar el valor crítico 2

)1()1(,1 cf tal que la probabilidad de

rechazar H0 cuando se supone cierta sea: ][ 2

)1)(1(,1

2

cfP


)1()1(,1 cf }

2

)1()1(,1 cf

358

La región de aceptación es: R.A. = {X2 < 2

)1()1(,1 cf }

5. Hallar

f

i

c

j ij

ijij

calce

eO

1 1

2

2)(

con las tablas anteriores.

6. Decisión: se rechaza H0 con riesgo igual a , si ..2 CRcalc (o si

..2 ARcalc ). No se rechaza H0 en caso contrario. Si se rechaza Ho se dice

que la prueba es significativa con riesgo cuyo valor es .

Ejemplo 1

En un estudio realizado con los alumnos de la asignatura de Estadística Básica de

la FCE-UNAC, el año 2012, se usa el índice de masa corporal (peso/talla2) para

determinar la condición del peso del alumno (delgado, normal o con sobrepeso) y

ver si existe alguna relación de dependencia con el sexo (hombre o mujer) del

estudiante.

Los resultados observados obtenidos con el SPSS v21, se muestran en la

siguiente tabla:

Tabla de contingencia CONDICIÓN DEL PESO * SEXO

Valores Observados

CONDICIÓN DEL PESO

SEXO Total

Hombre Mujer

Delgado 0 7 7

Normal 33 66 99

Sobrepeso 5 9 14

Total 38 82 120

Con el 5% de significación probar si hay una relación de dependencia entre la

condición del peso del alumno y su sexo (género).

Solución

1. H0: La condición del peso de los estudiantes es independiente del género de

este. (NO existe relación entre la condición del peso y el género del

estudiante).

H1: La condición del peso de los estudiantes depende del género de este

(Existe relación entre la condición del peso y el genero del estudiante).

359



3

1

2

2

2

1

2

2)(

i j ij

ijij

e

eO

4. Región crítica: en la Tabla 2 de Chi-cuadrado, hallar el valor crítico

2

)1()1(,1 cfX = 2

2,95.0X = 5.99. Entonces, R.C. = {X2 > 5.99}

0.5

0.4

0.3

0.2

0.1

0.0

X

De

nsit

y

5.99

0.05

0

Distribution PlotChi-Square, df=2

Valor crítico de chi-cuadrado en Minitab

5. Hallar 2

calc con la tabla de valores observados y la de valores esperados

siguiente:

Tabla de contingencia CONDICIÓN DEL PESO * SEXO

Valores Esperados

CONDICIÓN DEL PESO

SEXO Total

Hombre Mujer

Delgado 2.2 4.8 7

Normal 31.4 67.6 99

Sobrepeso 4.4 9.6 14

Total 38 82 120

Los valores esperados se obtienen con los totales observados así:

Hombre-delgado = 7x38 / 120 = 2.2; Mujer-delgada = 7x82 / 120 = 4.8

Hombre-normal = 99x38 / 120 = 31.4; Mujer-normal = 99x82 / 120 = 67.6

Hombre-sobrep = 14x38 / 120 = 4.4; Mujer-sobrep = 14x82 / 120 = 9.6

360

4.31

)4.3133(

8.4

)8.47(

2.2

)2.20()( 2223

1

2

1

2

2

i j ij

ijij

calce

eO

6.9

)6.99(

4.4

)4.45(

6.67

)6.6766( 222

= 3.45

6. Decisión: como ..45.32 ARcalc , con el 5% de significación no se rechaza

H0, por lo tanto la condición del peso de los estudiantes es independiente del

género de este. (NO existe relación entre la condición del peso y el género

del estudiante).

Estando definidas las variables sexo y condición del peso, los resultados en el

programa SPSS se obtienen así:

Analizar → Estadísticos descriptivos → Tablas de contingencia. En la

ventana de Tablas de contingencia, ingresar en Filas: la variable condición del

peso y en Columnas: la variable sexo.

En Estadísticos, escoger Chi-cuadrado. Luego Continuar y Aceptar, los

resultados son la Tabla de contingencia de valores observados y las Pruebas de

chi-cuadrado siguientes:

Pruebas de chi-cuadrado

Valor gl Sig. asintótica

(bilateral)

Chi-cuadrado de Pearson 3,477a 2 ,176

Razón de verosimilitudes 5,561 2 ,062

Asociación lineal por

lineal

1,724 1 ,189

N de casos válidos 120

a. 3 casillas (50,0%) tienen una frecuencia esperada inferior a 5.

La frecuencia mínima esperada es 2,22.

Los resultados son similares, pues chi-cuadrado = 3.477, es equivalente al

45.32 calc y como el valor-P = Sig. = 0.176 > = 0.05 no se rechaza Ho y se

concluye también que la condición del peso de los estudiantes es independiente

del género, es decir no hay diferencias significativas entre el sexo y el peso de

los alumnos, con el 5% de significación.

361

De manera similar en el programa Minitab, definir las columnas para la

variables sexo y condición (del peso). Escoger del menú Estadísticas →

Tablas → Tabulación cruzada y chi-cuadrada. En Para filas: seleccionar

condición y en Para columnas: sexo, tal como se aprecia a continuación:

Con el botón chi-cuadrada … escoger Análisis de chi-cuadrada. Luego

Aceptar, Aceptar y en la ventana de Sesión aprece el resultado siguiente:

Estadísticas tabuladas: Condición, Sexo Filas: Condición Columnas: Sexo

Hombre Mujer Todo

Delgado 0 7 7

Normal 33 66 99

Sobrepeso 5 9 14

Todo 38 82 120

Contenido de la celda: Conteo

Chi-cuadrada de Pearson = 3.477, GL = 2, Valor P = 0.176

Chi-cuadrada de la tasa de verosimilitud = 5.561, GL =

2, Valor P = 0.062

* NOTA * 3 celdas con conteos esperados menores que 5

Resultados similares a los ya encontrados.

362

7.2 TEST DE BONDAD DE AJUSTE

Esta prueba es utilizada cuando se desea verficar si es razonable que los datos

observados de una variable, siguen una distribución de probabilidades

determinada con p parámetros.

Los pasos a seguir para la prueba de hipótesis son:

1. Hipótesis: Ho: Los datos se ajustan a un modelo de probabilidades

H1: Los datos no se ajustan al modelo de probabilidades



k

i

pk

i

ii

e

eO

1

2

)1(

2

2 )(

Los datos se presentan en una tabla de frecuencias, con k categorías o

intervalos Ai, con sus correspondientes frecuencias observadas Oi y

frecuencias esperadas ei = npi. Las probabilidades pi = P(Ai) se obtienen con

el modelo de probabilidades al que se ajustan los datos. La tabla es:

Ai Oi ei (Oi – ei)2 /ei

A1 O1 e1 (O1 – e1)2 /e1

A2 O2 e2 (O2 – e2)2 /e2

.

.

.

.

.

.

.

.

.

.

.

.

Ak Ok ek (Ok – ek)2 /ek

∑ n n ∑ (Oi – ei)2 /ei

2

1,1 pk

363


1,1 pk tal que la probabilidad de


1,1

2

pkP

La región crítica es: R.C. = {X2 < 2

1,1 pk }

5. Hallar

k

i i

ii

calce

eO

1

2

2 )( con la anterior tabla de frecuencias.

6. Decisión: se rechaza H0 con con el 100 % de significación, si ..2 CRcalc

No se rechaza H0 en caso contrario. Si se rechaza Ho se dice que la prueba

es significativa con riesgo cuyo valor es .

Ejemplo 2

Con el fin de estudiar si un dado está o no equilibrado, se arroja el dado 300 veces

en forma independiente, obteniéndose los siguientes resultados:

Resultado 1 2 3 4 5 6

Oi 55 42 53 46 47 57

Con el 5% de significación se puede decir que el dado no esta equilibrado.

Solución

1. Hipótesis: Ho: El dado está equilibrado → P(i) = 1/6, i = 1, 2, …, 6

H1: El dado no está equilibrado → P(i) ≠ 1/6, i = 1, 2, …, 6



6

1

2

16

2

2 )(

i i

ii

e

eO


2

1,1 pk = 2

5,95.0X = 11.1. Entonces, R.C. = {X2 > 11.1}

5. Hallar 2

calc con la información muestral n = 300 y bajo el supuesto que Ho

es cierta, es decir, pi = 1/6, por lo tanto las frecuencias esperadas son ei =

npi = 300x1/6 = 50. La Tabla de frecuencias observadas y esperadas es:

Resultado 1 2 3 4 5 6

Oi 55 42 53 46 47 57

ei 50 50 50 50 50 50

364

6

1

2

2 )(

i i

ii

calce

eO =

50

)5046(

50

)5053(

50

)5042(

50

)5055( 2222

+

50

)5057(

50

)5047( 22

= 3.44


H0, por lo tanto, se concluye que el dado está equilibrado.

7.3 TEST DE WILCOXON

Es una prueba de RANGOS CON SIGNOS propuesta por Wilcoxon (1945) y se

usa para contrastar una hipótesis referida al valor de la mediana de la población

(Me). Para la verificación de la hipótesis no se hace ningún supuesto sobre la

distribución de la población y las observaciones Xi requieren al menos una escala

de intervalo ya que la prueba toma la diferencia entre cada valor muestral y el

valor hipotético de la mediana.

Los pasos a seguir en la prueba son:

1. Hipótesis: Ho: Me = Me0

H1: Me ≠ Me0 o Me < Me0 o Me > Me0


3. Estadística de prueba: W = suma de los rangos positivos

4. Región crítica: buscar los valores críticos en la Tabla 5, de Wilcoxon para n ≤

40 y = 0.05 o 0.01.

5. Determinar la W de Wilcoxon con la información muestral y bajo el

supuesto que Ho es cierta, mediante el siguiente procedimiento:

a) Hallar las diferencias di = Xi – Me0 con el signo correspondiente. Si

alguna diferencia es cero, la observación asociada se elimina y el tamaño

efectivo de la muestra disminuye.

b) Ranquear las diferencias di en forma ascendente, sin tomar en cuenta el

signo (en valor absoluto). Si dos o más diferencias son iguales se asume

el rango promedio de esas diferencias empatadas.

c) Asignar los signos de las diferencias di a sus respectivos rangos.

d) Obtener la suma de los rangos para las diferencias positivas y para las

negativas por separado. La suma de los rangos positivos = Wcalc, es el

365

valor calculado del estadístico de prueba y sirve para hallar el valor-P y

compararlo con el nivel de significación .

e) Si el tamaño de muestra es grande el valor-P se obtiene mediante la

aproximación a la distribución Normal con:

)1,0()5.0(

NW

ZW

W

calc

Con 4

)1(

nnW y

24

)12)(1(

nnnW

6. Decisión: se rechaza H0 con el 100 % de significación, si ..CRWcalc No

se rechaza H0 en caso contrario. Si se rechaza Ho se dice que la prueba es


Otra forma de establecer la regla de decisión, es calculando el valor P, a

partir del valor Zcalc, de manera que:

Para dos colas: P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|]



Si el valor de P < , se rechaza H0. En caso contrario, se acepta H0.

Ejemplo 3

Una muestra de los salarios semanales (S/.) de 15 obreros arroja los siguientes

resultados: 303, 297, 375, 273, 321, 413, 233, 285, 276, 329, 306, 290, 380, 305 y

250. Probar si la mediana de los salarios es diferente de S/. 300. Use α = 0.05.

Solución

1. Hipótesis: Ho: Me = 300

H1: Me ≠ 300



4. Región crítica: para n = 15 y = 0.05, en la tabla 5, de Wilcoxon la región

crítica es: R.C. = {W < 25 o W > 95} → R.A. = {25 ≤ W ≤ 95}

5. Determinar la W de Wilcoxon con la información muestral y bajo el

supuesto que Ho es cierta, mediante el siguiente procedimiento:

366

Obreros Salarios

(Xi)

Diferencias

di = Xi – 300

Rango de

|di|

Rangos con signo

(+) (-)

1 303 3 1.5 1.5

2 297 -3 1.5 1.5

3 375 75 13 13

4 273 -27 9 9

5 321 21 7 7

6 413 113 15 15

7 233 -67 12 12

8 285 -15 6 6

9 276 -24 8 8

10 329 29 10 10

11 306 6 4 4

12 290 -10 5 5

13 380 80 14 14

14 305 5 3 3

15 250 -50 11 11

Total 67.5 52.5

Wcalc = suma de los rangos positivos = 67.5

6. Decisión: como Wcalc = 67.5 ϵ R.A., con el 5% de significación no se rechaza H0

y por lo tanto la mediana de los salarios es de S/. 300.

Para la aproximación a la distribución normal, con n = 15 se obtiene:

4

)16(15

4

)1(

nnW = 60 y

24

)31)(16(15

24

)12)(1(

nnnW = 17.61

61.17

60)5.05.67()5.0(

W

W

calc

WZ

= 0.40. Para dos colas, el valor-P es:

P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|] = 2 P[Z < -0.40] = 2(0.3446) = 0.69.

Como el valor-P = 0.69 > = 0.05, con el 5% de significación no se rechaza H0.

En el programa Minitab, definir la variable salarios con sus datos. Escoger del

menú Estadísticas → No paramétricos → 1W Wilcoxon de 1 muestra. Al abrir

la ventana de diálogo, en Variables: seleccionar Salarios, en Mediana de la

prueba: escribir 300 (mediana hipotética) y en Hipótesis alterna: escoger no es

igual a. Finalmente escoger Aceptar, tal como se aprecia a continuación:

367

En la ventana de Sesión aprece el resultado siguiente:

Prueba de clasificación con signos de Wilcoxon: Salarios (Xi) Prueba de la mediana = 300.0 vs. La mediana no = 300.0

Número

de Estadística Mediana

N prueba de Wilcoxon P estimada

Salarios (Xi) 15 15 67.5 0.691 304.0

Resultados y conclusiones similares a los antes obtenidos: W = 67.5 y P = 0.691.

El Minitab proporciona el intervalo de confianza del 95% para la mediana:

IC de clasificación con signos de Wilcoxon: Salarios (Xi) Intervalo de

Mediana Confianza confianza

N estimada lograda Inferior Superior

Salarios (Xi) 15 304.0 95.0 281.0 339.0

Como la mediana hipotética cae en el intervalo de confianza, también se acepta que

la mediana de los salarios es S/. 300.

7.4 TEST DE SIGNOS

Es una prueba basada en los signos que surgen de la diferencia de comparar los

datos de una población con respecto a su mediana o entre sí (en investigación

de mercados para identificar la preferencia hacia una de dos marcas de un

producto).

368

PRUEBA PARA COMPARAR LOS VALORES CON LA MEDIANA


1. Hipótesis: Ho: Me = Me0

H1: Me ≠ Me0 o Me < Me0 o Me > Me0


3. La estadística de prueba S = número de veces que se repite el signo menos

frecuente. S se basa en la distribución Binomial con probabilidad de éxito ½ ya

que la probabilidad que un valor sea mayor o menor que la mediana es ½.

4. Región crítica: buscar el valor crítico en la Tabla 6, de valores críticos para la

prueba del signo S: n ≤ 25 y = 0.01 o 0.05. La hipótesis nula se rechaza si S

es menor o igual al valor de la tabla.

5. Determinar S = número de veces que se repite el signo menos frecuente, con

la información muestral y bajo el supuesto que Ho es cierta, mediante el

siguiente procedimiento:

a) Aplicar un signo más (+) a cada valor observado en la muestra mayor que

la mediana hipotética Me0 y un signo menos (-) a cada valor menor. Si

algún valor es igual a la mediana hipotética Me0, no se aplica signo

alguno y el tamaño efectivo de la muestra disminuye.

b) Hallar Scalc = número de veces que se repite el signo menos frecuente, es

el valor calculado del estadístico de prueba y sirve para hallar el valor-P

y compararlo con el nivel de significación .

c) Si el tamaño efectivo de muestra es n > 20 el valor-P se obtiene mediante

la aproximación Normal de la Binomial S = X = número de veces que se

repite el signo menos frecuente con p = q = 0.5.

Si S = X → N(0.5n, 0.25n) entonces )1,0(5.0

5.0)5.0(N

n

nXZ calc

6. Decisión: se rechaza H0 con el 100 % de significación, si ..CRScalc No se

rechaza H0 en caso contrario. Si se rechaza Ho se dice que la prueba es




369





Ejemplo 4

Para la muestra de los salarios semanales (S/.) de 15 obreros del ejemplo 3,

siguientes: 303, 297, 375, 273, 321, 413, 233, 285, 276, 329, 306, 290, 380, 305 y

250. Probar si la mediana de los salarios es diferente de S/. 300. Use α = 0.05.

Solución


H1: Me ≠ 300


3. Estadística de prueba: S = número de veces que se repite el signo menos

frecuente.

4. Región crítica: para n = 15 y = 0.05, en la tabla 6 de valores críticos para

la prueba del signo, la región crítica es: R.C. = {S ≤ 3} → R.A. = {S > 3}

5. Determinar Scalc con la información muestral y bajo el supuesto que Ho es

cierta, mediante el siguiente procedimiento:

Obreros Salarios

(Xi)

Signo Diferencia

Xi – 300

1 303 +

2 297 -

3 375 +

4 273 -

5 321 +

6 413 +

7 233 -

8 285 -

9 276 -

10 329 +

11 306 +

12 290 -

13 380 +

14 305 +

15 250 -

370

Scalc = número de veces que se repite el signo menos frecuente = 7.

6. Decisión: como Scalc = 7 ϵ R.A., con el 5% de significación no se rechaza H0 y

por lo tanto la mediana de los salarios es de S/. 300.

Para la aproximación a la distribución normal de S = X = número de veces que

se repite el signo menos frecuente, con n = 15, p = q = 0.5 se obtiene:

155.0

155.0)5.07(

5.0

5.0)5.0( x

n

nXZ calc

= 0.00

Para dos colas, el valor-P es:

P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|] = 2 P[Z < 0.0] = 2(0.5000) = 1.0000.

Como el valor-P = 1.00 > = 0.05, con el 5% de significación no se rechaza H0.

En el programa Minitab, definir la variable salarios con sus datos. Escoger del

menú Estadísticas → No paramétricos → 1± Señal de 1 muestra.

Al abrir la ventana de diálogo, en Variables: seleccionar Salarios, en Mediana

de la prueba: escribir 300 (mediana hipotética) y en Hipótesis alterna:

escoger no es igual a. Finalmente escoger Aceptar, tal como se aprecia a

continuación:


371

Prueba de signos para mediana: Salarios (Xi) Prueba del signo de la mediana = 300.0 vs. no = 300.0

N Debajo Igual Arriba P Mediana

Salarios (Xi) 15 7 0 8 1.0000 303.0

Resultados y conclusiones similares a los obtenidos: S = Debajo = 7 y P = 1.0000.

El Minitab proporciona también el siguiente intervalo de confianza del 95% para la

mediana:

IC de signos: Salarios Intervalo de confianza del signo para la mediana

Intervalo de

Confianza confianza

N Mediana lograda Inferior Superior Posición

Salarios 15 303.0 0.8815 285.0 321.0 5

0.9500 279.4 326.0 NLI

0.9648 276.0 329.0 4

Como la mediana hipotética cae en el intervalo de confianza, también se acepta que

la mediana de los salarios es S/. 300.

PRUEBA PARA COMPARAR LOS VALORES ENTRE SI

En investigación de mercados sirve para identificar la preferencia hacia una de

dos marcas de un producto (se asigna signo positivo cuando la preferencia es por

la marca de interés y signo negativo en caso contrario), también para hacer

comparaciones entre los valores de los grupos A y B (asignando signo positivo

cuando el valor de A es superior al valor de B y signo negativo en caso contrario,

si son iguales se descarta las observaciones y n disminuye).

Probar si las preferencias son iguales para ambas marcas o que el número de

signos positivos es igual al número de signos negativos es equivalente a probar si

p = 0.50.


1. Hipótesis: Ho: p = 0.50

H1: p ≠ 0.50 o p < 0.50 o p > 0.50.


372

3. La estadística de prueba S = número de veces que se repite el signo menos

frecuente. S se basa en la distribución Binomial con probabilidad de éxito ½ ya

que la probabilidad que se prefiera una u otra marca (o que un valor sea mayor

o menor que otro) es ½.

4. Región crítica: buscar el valor crítico en la Tabla 6 para la prueba del signo S. La

hipótesis nula se rechaza si S es menor o igual al valor de la tabla.

5. Determinar S = número de veces que se repite el signo menos frecuente, con

la información muestral y bajo el supuesto que Ho es cierta, mediante el

siguiente procedimiento:

a) Si se comparan dos marcas de un bien o servicio: aplicar signo positivo

(+) cuando la preferencia es por la marca de interés y signo negativo (-)

en caso contrario.

Si se hace comparaciones entre los valores de los grupos A y B asignar

signo positivo (+) cuando el valor de A es superior al valor de B y signo

negativo (-) en caso contrario.

Si son iguales los valores no se aplica signo alguno, se descarta las

observaciones y el tamaño efectivo de la muestra disminuye.

b) Hallar Scalc = número de veces que se repite el signo menos frecuente, es

el valor calculado del estadístico de prueba y sirve para hallar el valor-P

y compararlo con el nivel de significación .

c) Si el tamaño efectivo de muestra es n > 20 el valor-P se obtiene mediante

la aproximación Normal de la Binomial S = X = número de veces que se

repite el signo menos frecuente con p = q = 0.5.

Si S = X → N(0.5n, 0.25n) entonces )1,0(5.0

5.0)5.0(N

n

nXZ calc

6. Decisión: se rechaza H0 con el 100 % de significación, si ..CRScalc por lo

tanto no son iguales las preferencias por ambos productos o los valores

comparados de los grupos A y B no son iguales.






373


Ejemplo 5

En un estudio para determinar si la marca de frugo B es más preferida por las amas

de casa que la marca A, se hizo degustar aleatoriamente las marcas A y B a 16 amas

de casa siendo sus preferencias las siguientes: B, B, B, B, A, B, B, B, B, B, B, A, B,

B, A y B. Con el 5% de significación pruebe si la preferencia de las amas de casa

por la marca de frugo A es inferior a la marca B.

Solución

1. Hipótesis: si la preferencia de las amas de casa por las marcas de frugo A y

B es la misma es equivalente a postular Ho: p = 0.50 frente a la alternativa

que la preferencia por la marca A es inferior a la marca B, H1: p < 0.50



frecuente.





Ama de casa Frugo preferido Signo

1 B +

2 B +

3 B +

4 B +

5 A -

6 B +

7 B +

8 B +

9 B +

10 B +

11 B +

12 A -

13 B +

14 B +

15 A -

16 B +

374


6. Decisión: como Scalc = 3 ϵ R.C., con el 5% de significación se rechaza H0 y por lo

tanto se acepta que la preferencia por la marca A es inferior a la marca B.

7.5 TEST DE LA MEDIANA

En el acápite 6.5 y 6.6 se trataron las pruebas estadísticas paramétricas Z o T para

la verificación de la igualdad de medias de dos poblaciones, extrayendo muestras

independientes de dichas poblaciones con varianzas conocidas o desconocidas.

La prueba de la mediana es la contraparte no paramétrica para la verificación de

la igualdad de medianas de dos poblaciones, extrayendo muestras independientes.

La escala de medida de la variable es cuando menos ordinal.

El procedimiento a seguir en la prueba es el siguiente:

1. Hipótesis: Ho: Me1 = Me2

H1: Me1 ≠ Me2 o Me1 > Me2 o Me1 < Me2



2

1

2

)1,1[

2

1

2

2)(

i j ij

ijij

e

eO

Donde Oij son las frecuencias observadas y eij son las frecuencias esperadas

obtenidas con las frecuencias observadas, suponiendo que Ho es cierta.


]1,1[ tal que la probabilidad de


]1,1[

2P


]1,1[ }

5. Determinar 2

calc , con la información muestral y bajo el supuesto que Ho es


a) Calcular la mediana común Me con toda la información de las dos muestras.

b) Para cada muestra determinar el número de observaciones que son menores

o iguales a la mediana común y las que son mayores a dicha mediana y las

frecuencias observadas resultantes se colocan en una tabla de

contingencia 2x2 como la siguiente:

375

Muestra ≤ Me > Me Total

1 O11 O12 O1.

2 O21 O22 O2.

Total O.1 O..2 n

c) Hallar las frecuencias esperadas n

OxOe

ji

ij

y colocarlas en la tabla:

Muestra ≤ Me > Me Total

1 e11 e12 O1.

2 e21 e22 O2.

Total O.1 O..2 n

d) Determinar

2

1

2

1

2

2)(

i j ij

ijij

calce

eO

6. Decisión: se rechaza H0 con riesgo igual a si si ..2 CRcalc No se rechaza

H0 en caso contrario. Si se rechaza Ho se dice que la prueba es significativa

con riesgo cuyo valor es .

Ejemplo 6

Con la información del número de unidades vendidas por hombres y mujeres en

la tabla, determinar si la mediana del número de unidades vendidas por las

mujeres es mayor que la mediana de las unidades vendidas por los hombres. Usar

el 5% de significación.

Hombres (1) Mujeres (2)

39 30

43 28

25 32

31 48

45 42

44 35

26 48

25 21

23 40

24 30

38 40

25 45

20 28

Solución

1. Hipótesis: Ho: Me2 = Me1 y H1: Me2 > Me1

376



2

1

2

)1,1[

2

1

2

2)(

i j ij

ijij

e

eO

4. Región crítica: el valor crítico es 2

]95.0,1[ = 3.84 y R.C. = {X2 > 3.84}.

5. Determinar 2


cierta, de la siguiente manera:

a) Con toda la información de las dos muestras se calcula la mediana común y

resulta Me = 31.5.

b) Para cada muestra se determina el número de observaciones que son

menores o iguales (orden 1) a la mediana común 31.5 y las que son

mayores (orden 2) a dicha mediana:

Unid. Vendidas Sexo Orden

39 1 2

43 1 2

25 1 1

31 1 1

45 1 2

44 1 2

26 1 1

25 1 1

23 1 1

24 1 1

38 1 2

25 1 1

20 1 1

30 2 1

28 2 1

32 2 2

48 2 2

42 2 2

35 2 2

48 2 2

21 2 1

40 2 2

30 2 1

40 2 2

45 2 2

28 2 1

Me = 31.5

377

Las frecuencias observadas resultantes se colocan en una tabla de


Muestra ≤ Me (Ord. 1) > Me (Ord. 2) Total

1 = hombres 8 5 O1. = 13

2 = Mujeres 5 8 O2. = 13

Total O.1 = 13 O.2 =13 n = 26


OxOe

ji

ij



1 = hombres 6.5 6.5 O1. = 13

2 = Mujeres 6.5 6.5 O2. = 13

Total O.1 = 13 O.2 =13 n = 26

d) Determinar:

2

1

2

1

2

2)(

i j ij

ijij

calce

eO

5.6

)5.68(

5.6

)5.65(

5.6

)5.65(

5.6

)5.68( 22222

calc = 1.385

P-valor = P( 2

1 > 1.385) = 1 - P( 2

1 ≤ 1.385) = 1 – 0.761 = 0.239.

6. Decisión: como 2

calc = 1.38 ϵ R.A. y P-valor = 0.239 > = 0.05, no se

rechaza H0 por lo tanto con el 5% de significación se acepta que la mediana

del número de unidades vendidas por las mujeres y los hombres son iguales.

378

En el programa Minitab, definir las variables Unidades vendidas y Sexo con

sus datos. Escoger del menú Estadísticas → No paramétricos → Prueba de

la mediana de Mood. Al abrir la ventana de diálogo, en Respuesta:

seleccionar Unid. vendidas, en Factor: seleccionar Sexo. Finalmente escoger

Aceptar, tal como se aprecia en la ventana de diálogo de la página anterior.


Prueba de mediana de Mood: Unid. vendidas en funcion de Sexo Prueba de la mediana de Mood para Unid. vendidas

Chi-cuadrada = 1.38 GL = 1 P = 0.239

ICs de 95.0% individuales

Sexo N<= N> Mediana Q3-Q1 -+---------+---------+---------+-----

1 8 5 26.0 16.5 (--*----------------------------)

2 5 8 35.0 14.5 (----------*---------------)

-+---------+---------+---------+-----

25.0 30.0 35.0 40.0

Mediana general = 31.5

Un IC de 95.0% para la mediana(1) - mediana(2): (-15.8,8.4)

Resultados y conclusiones similares a los obtenidos: 2

calc = 1.38 y P = 0.239. Por

lo tanto con el 5% de significación se acepta que la mediana del número de

unidades vendidas por las mujeres y los hombres son iguales.

379


1. En el estudio realizado con los alumnos de la asignatura de Estadística Básica de

la FCE-UNAC, el año 2012, con el 5% de significación probar si existe relación

entre el hobby (pasatiempo) del alumno y su sexo (género). Los resultados

observados obtenidos con el SPSS v21, se muestran en la siguiente tabla:

Tabla de contingencia HOBBY * SEXO

Valores Observados

HOBBY

SEXO Total

Hombre Mujer

Deportes 18 6 24

Música 12 33 45

Baile 1 9 10

TV / Cine 2 27 29

Otros 5 7 12

Total 38 82 120

Solución

1. H0: El hobby de los estudiantes es independiente del género de este. (NO

existe relación entre el hobby y el género del estudiante).

H1: El hobby de los estudiantes depende del género de este (Existe relación

entre el hobby y el genero del estudiante).



5

1

2

4

2

1

2

2)(

i j ij

ijij

e

eO


2

)1()1(,1 cfX = 2

4,95.0X = 9.49. Entonces, R.C. = {X2 > 9.49}

5. Hallar 2

calc con la tabla de valores observados y la de valores esperados.

Tabla de contingencia HOBBY * SEXO

Valores Esperados

HOBBY

SEXO Total

Hombre Mujer

Deportes 7.6 16.4 24

Música 14.3 30.8 45

Baile 3.2 6.8 10

TV / Cine 9.2 19.8 29

Otros 3.8 8.2 12

Total 38 82 120

380


Hombre-deportes = 24x38 / 120 = 7.6; Mujer-deportes = 24x82 / 120 = 16.4

Hombre-música = 45x38 / 120 = 14.3; Mujer-música = 45x82 / 120 = 30.8

Hombre-baile = 10x38 / 120 = 3.2; Mujer-baile = 10x82 / 120 = 6.8

Hombre-tv/cine= 29x38 / 120 = 9.2; Mujer-tv/cine = 29x82 / 120 = 19.8

Hombre-otros = 12x38 / 120 = 3.8; Mujer-otros = 12x82 / 120 = 8.2

Para hallar 2

calc ordenamos los valores observados y esperados en la tabla:

Hobby-sexo Oij eij (Oij - eij)2/ eij

Deporte-hombre 18 7.6 14.232

Música-hombre 12 14.3 0.355

Baile-hombre 1 3.2 1.482

Tv/cine-hombre 2 9.2 5.619

Otros-hombre 5 3.8 0.379

Deporte-mujer 6 16.4 6.595

Música-mujer 33 30.8 0.165

Baile-mujer 9 6.8 0.687

Tv/cine-mujer 27 19.8 2.604

Otros-mujer 7 8.2 0.176

∑

32.293

Luego

5

1

2

1

2

2)(

i j ij

ijij

calce

eO = 32.293


calc = 32.293 ϵ R.C., con el 5% de significación se rechaza

H0, por lo tanto el hobby de los estudiantes depende del género de este.

(Existe relación entre el hobby y el género del estudiante).

Estando definidas las variables sexo y hobby, los resultados en el programa

SPSS se obtienen así:

Analizar → Estadísticos descriptivos → Tablas de contingencia. En la

ventana de Tablas de contingencia, ingresar en Filas: la variable hobby y en

Columnas: la variable sexo.

En Estadísticos, escoger Chi-cuadrado. Luego Continuar y Aceptar, los

resultados son la Tabla de contingencia de valores observados del enunciado y

las Pruebas de chi-cuadrado siguientes:

2

calc

381



(bilateral)

Chi-cuadrado de Pearson 32,293a 4 ,000

Razón de verosimilitudes 33,297 4 ,000

Asociación lineal por

lineal

12,191 1 ,000



La frecuencia mínima esperada es 3,17.

Los resultados son similares, pues 2

calc = 32.293, y como el valor-P = Sig. =

0.000 < = 0.05 se rechaza Ho y se concluye también, con el 5% de

significación, que el hobby de los estudiantes depende del género.


la FCE-UNAC, el año 2012, con el 5% de significación probar si hay una

relación de dependencia entre la importancia de sus estudios para el alumno y su

sexo (género). Los resultados observados obtenidos con el SPSS v21, se

muestran en la siguiente tabla:

Tabla de contingencia IMPORTANCIA DE TUS ESTUDIOS * SEXO

Valores Observados

IMPORTANCIA DE TUS

ESTUDIOS

SEXO Total

Hombre Mujer

Poca 0 1 1

Media 2 4 6

Mucha 21 43 64

Muchísima 15 34 49

Total 38 82 120

Solución

1. H0: No existe relación entre la importancia de los estudios y el género del

estudiante (son independientes).

H1: Existe relación entre la importancia de los estudios y el genero del

estudiante.


382


4

1

2

3

2

1

2

2)(

i j ij

ijij

e

eO


2

)1()1(,1 cfX = 2

3,95.0X = 7.81. Entonces, R.C. = {X2 > 7.81}

5. Hallar 2


Tabla de contingencia IMPORTANCIA DE TUS ESTUDIOS * SEXO

Valores Esperados

IMPORTANCIA DE TUS

ESTUDIOS

SEXO Total

Hombre Mujer

Poca 0.3 0.7 1

Media 1.9 4.1 6

Mucha 20.3 43.7 64

Muchísima 15.5 35.5 49

Total 38 82 120


Hombre-poca = 1x38 / 120 = 0.3; Mujer-poca = 1x82 / 120 = 0.7

Hombre-media = 6x38 / 120 = 1.9; Mujer-media = 6x82 / 120 = 4.1

Hombre-mucha = 64x38 / 120 = 20.3; Mujer-mucha = 64x82 / 120 = 43.7

Hombre-muchísima = 49x38 / 120 = 15.5; Mujer-muchísima = 49x82 / 120 =

35.5

Para hallar 2


Imp.estudio-sexo Oij eij (Oij - eij)2/ eij

Poca-hombre 0 0.3 0.317

Media-hombre 2 1.9 0.005

Mucha-hombre 21 20.3 0.027

Muchisima-hombre 15 15.5 0.017

Poca-mujer 1 0.7 0.147

Media-mujer 4 4.1 0.002

Mucha-mujer 43 43.7 0.012

Muchísima-mujer 34 33.5 0.008

∑

0.535

Luego

4

1

2

1

2

2)(

i j ij

ijij

calce

eO = 0.535

2

calc

383


calc = 0.535 ϵ R.A., con el 5% de significación no se rechaza

H0, por lo tanto la importancia de los estudios es independiente del género del

alumno. (La importancia de los estudios no depende del género del alumno).

Estando definidas las variables importancia de los estudios y sexo, los

resultados en el programa SPSS son la Tabla de contingencia de valores

observados del enunciado y las Pruebas de chi-cuadrado siguientes:



(bilateral)

Chi-cuadrado de Pearson ,535a 3 ,911

Razón de verosimilitudes ,833 3 ,842

Asociación lineal por lineal ,000 1 ,996



Resultados similares a los obtenidos, es decir que la importancia de los

estudios es independiente del género del alumno, con el 5% de significación.

3. En una encuesta de Mason y Lind (1998) respecto a los ingresos de

representantes industriales que trabajan por su cuenta o son empleados de

empresas pequeñas, medianas o grandes, se encontró los siguientes resultados:

Valores Observados

TIPO DE

EMPRESA

INGRESOS (miles $)

< 20 20 - 40 > 40 Total

Cuenta propia 9 11 10 30

Pequeñas 12 10 13 35

Medianas 40 45 50 135

Grandes 89 104 107 300

Total 150 170 180 500

Examine la hipótesis de que no existe relación entre el nivel de ingreso de los

representantes industriales y el nivel de su empleo (trabajando por su cuenta o

empleados en empresas pequeñas, medianas o grandes). Realice la prueba al

nivel 0.05.

Solución

1. H0: No existe relación entre el nivel de ingreso de los representantes

industriales y el nivel de su empleo (son independientes).

384

H1: Existe relación entre el nivel de ingreso de los representantes industriales

y el nivel de su empleo.



4

1

2

6

3

1

2

2)(

i j ij

ijij

e

eO


2

)1()1(,1 cfX = 2

6,95.0X = 12.6. Entonces, R.C. = {X2 > 12.6}

5. Hallar 2


Valores Esperados

TIPO DE

EMPRESA

INGRESOS

< 20 20 - 40 > 40 Total

Cuenta propia 9.0 10.2 10.8 30

Pequeñas 10.5 11.9 12.6 35

Medianas 40.5 45.9 48.6 135

Grandes 90.0 102.0 108.0 300

Total 150 170 180 500


Cuenta propia: 30x150/500 = 9.0, 30x170/500 = 10.2, 30x180/500 = 10.8

Pequeñas: 35x150/500 = 10.5, 35x170/500 = 11.9, 35x180/500 = 12.6

Medianas: 135x150/500 = 40.5, 135x170/500 = 45.9, 135x180/500 =48.6

Grandes: 300x150/500 = 90, 300x170/500 = 102, 300x180/500 = 108

Para hallar 2


Tipo emp.-ingresos Oij eij (Oij - eij)2/ eij

C. propia - < 20 9 9.0 0.000

Pequeña - < 20 12 10.5 0.214

Mediana - < 20 40 40.5 0.006

Grande - < 20 89 90.0 0.011

C. propia - 20 a 40 11 10.2 0.063

Pequeña - 20 a 40 10 11.9 0.303

Mediana - 20 a 40 45 45.9 0.018

Grande - 20 a 40 104 102.0 0.039

C. propia - > 20 10 10.8 0.059

Pequeña - > 20 13 12.6 0.013

Mediana - > 20 50 48.6 0.040

Grande - > 20 107 108.0 0.009

∑

0.776 2

calc

385

Luego

4

1

3

1

2

2)(

i j ij

ijij

calce

eO = 0.776



H0, por lo tanto el nivel de ingreso de los representantes industriales es

independiente del nivel de su empleo (El nivel de ingreso de los

representantes industriales no depende del tipo de empresa donde labora).

4. Los datos de partes defectuosas procedente de tres proveedores [Anderson y

Otros (2004)] son los siguientes:

Valores Observados:

CALIDAD DE

PARTES

PROVEEDOR

A B C Total

Buena 90 170 135 395

Defectos pequeños 3 18 6 27

Defectos graves 7 7 9 23

Total 100 195 150 445

Use α = 0.05 y demuestre si hay independencia entre proveedor y calidad de las

partes. ¿Qué dice el resultado de su análisis al departamento de compras?

Solución

1. H0: No existe relación entre el proveedor y la calidad de las partes ofrecidas

(son independientes).

H1: Existe relación entre el proveedor y la calidad de las partes ofrecidas.



3

1

2

4

3

1

2

2)(

i j ij

ijij

e

eO


2

)1()1(,1 cfX = 2

4,95.0X = 9.49. Entonces, R.C. = {X2 > 9.49}

5. Hallar 2


Valores Esperados

CALIDAD DE

PARTES

PROVEEDOR

A B C Total

Buena 88.8 173.1 133.1 395

Defectos pequeños 6.1 11.8 9.1 27

Defectos graves 5.2 10.1 7.8 23

Total 100 195 150 445

386


Buena: 395x100/445 = 88.8, 395x195/445 = 173.1, 395x150/445 = 133.1

Def. pequeños.: 27x100/445 = 6.1, 27x195/445 = 11.8, 27x150/445 = 9.1

Def. graves.: 23x100/445 = 5.2, 23x195/445 = 10.1, 23x150/445 = 7.8

Para hallar 2


Calidad - proveedor Oij eij (Oij - eij)2/ eij

Buena - A 90 88.8 0.017

Def. peq. - A 3 6.1 1.551

Def. grave - A 7 5.2 0.649

Buena - B 170 173.1 0.055

Def. peq. - B 18 11.8 3.216

Def. grave - B 7 10.1 0.940

Buena - C 135 133.1 0.026

Def. peq. - C 6 9.1 1.057

Def. grave - C 9 7.8 0.201

∑

7.712

Luego

3

1

3

1

2

2)(

i j ij

ijij

calce

eO = 7.712



H0, por lo tanto la calidad de las partes ofrecidas es independiente del

proveedor (La calidad de las partes ofrecidas no depende del proveedor). Se

recomienda al departamento de compras

5. El experimento de lanzar 4 monedas al aire se repite 500 veces, el resultado de

observar el número de sellos es el siguiente:

N° de sellos (Xi) 0 1 2 3 4 Total

Frecuencias (ni = Oi) 25 129 192 118 36 500

Con el 5% de significación, ¿se ajusta el juego al azar?

Solución

1. Hipótesis: Ho: El juego se ajusta al azar → X ~ B(4, 0.5)

H1: El juego no se ajusta al azar (X no es binomial)



5

1

2

15

2

2 )(

i i

ii

e

eO

2

calc

387


2

1,1 pk = 2

4,95.0X = 9.49. Entonces, R.C. = {X2 > 9.49}

5. Hallar 2

calc con la información experimental n = 500 y bajo el supuesto que

Ho es cierta, es decir X ~ B(4, 0.5), luego:

P(0) = 4C0 (0.5)4 = 0.0625

P(1) = 4C1 (0.5)4 = 0.2500

P(2) = 4C2 (0.5)4 = 0.3750

P(3) = 4C3 (0.5)4 = 0.2500

P(4) = 4C4 (0.5)4 = 0.0625

Por lo tanto las frecuencias esperadas son ei = npi = 500 pi. La Tabla de

frecuencias observadas y esperadas es:

N° Sellos (Xi) 0 1 2 3 4

Oi 25 129 192 118 36

pi 0.0625 0.2500 0.3750 0.2500 0.0625

ei = npi 31.25 125.00 187.50 125.00 31.25

5

1

2

2 )(

i i

ii

calce

eO =

5.187

)5.187192(

125

)125129(

25.31

)25.3125( 222

25.31

)25.3136(

125

)125118( 22

= 2.6


H0, por lo tanto, se concluye que el juego se ajusta al azar.

6. Los 120 alumnos de la asignatura de Estadística Básica de la FCE-UNAC, el año

2012, opinaron sobre la importancia de su físico, con los siguientes resultados:

Imp. del físico Poca Media Mucha Muchísima Total

Alumnos (ni = Oi) 19 48 46 7 120

Con el 5% de significación probar si existe diferencia significativa entre la

importancia del físico de los alumnos.

Solución

1. Hipótesis: Ho: No hay diferencia en la importancia del físico de los alumnos

H1: Si hay diferencia en la importancia del físico de los alumnos


388


4

1

2

14

2

2 )(

i i

ii

e

eO


2

1,1 pk = 2

3,95.0X = 7.81. Entonces, R.C. = {X2 > 7.81}

5. Hallar 2

calc con la información observada de los 120 alumnos y bajo el

supuesto que Ho es cierta (la importancia del físico es la misma para los

alumnos) es decir, con la misma frecuencia esperada igual a 120/5 = 24. La

Tabla de frecuencias observadas y esperadas es:

Imp. del físico Poca Media Mucha Muchísima

Oi 19 48 46 7

ei 24 24 24 24

4

1

2

2 )(

i i

ii

calce

eO =

24

)247(

24

)2446(

24

)2448(

24

)2419( 2222

=

2

calc = 57.25


calc = 57.25 ϵ R.C., con el 5% de significación se rechaza

H0, por lo tanto, se concluye que si existe diferencia significativa entre la

importancia del físico de los alumnos.

7. Las notas de los 120 alumnos de la asignatura de Estadística Básica de la FCE-

UNAC, el año 2012, fueron las siguientes:

NOTAS Xi ni

7 - 8 7.5 2

8 - 9 8.5 6

9 - 10 9.5 7

10 - 11 10.5 21

11 - 12 11.5 33

12 - 13 12.5 22

13 - 14 13.5 19

14 - 15 14.5 7

15 - 16 15.5 3

Probar si las notas se distribuyen normalmente. Use α = 0.05.

Solución

1. Hipótesis: Ho: Las notas de los alumnos se distribuyen normalmente

H1: Las notas de los alumnos no se distribuyen normalmente

389



9

1

2

129

2

2 )(

i i

ii

e

eO


2

1,1 pk = 2

6,95.0X = 12.6. Entonces, R.C. = {X2 > 12.6}

5. Hallar 2

calc con la información observada de los 120 alumnos.

La nota promedio de los alumnos es: 77.11120

1412ˆ

n

nX ii

La varianza de las notas es:

82.21120

)77.11(120116950

1

ˆˆ

222

2

n

nnX ii → σ = 1.679

Bajo el supuesto que Ho es cierta, X = notas ~ N(11.77, 2.82), luego:

)1,0(679.1

77.11N

XZ

permite calcular las probabilidades pi para los 9

intervalos considerados así:

P(X ≤ 8) = P(Z ≤ -2.25) = Ф(-2.25) = 0.01222

P(8 ≤ X < 9) = P(-2.25 ≤ Z < -1.65) = Ф(-1.65) – Ф(-2.25) =

= 0.04947 - 0.01222 = 0.03725.

P(9 ≤ X < 10) = P(-1.65 ≤ Z < -1.05) = Ф(-1.05) – Ф(-1.65) =

= 0.14686 - 0.04947 = 0.09739.

P(10 ≤ X < 11) = P(-1.05 ≤ Z < -0.46) = Ф(-0.46) – Ф(-1.05) =

= 0.32276 - 0.14686 = 0.17590.

P(11 ≤ X < 12) = P(-0.46 ≤ Z < 0.14) = Ф(0.14) – Ф(-0.46) =

= 0.55567 - 0.32276 = 0.23291.

P(12 ≤ X < 13) = P(0.14 ≤ Z < 0.73) = Ф(0.73) – Ф(0.14) =

= 0.76730 - 0.55567 = 0.21163.

P(13 ≤ X < 14) = P(0.73 ≤ Z < 1.33) = Ф(1.33) – Ф(0.73) =

= 0.90824 - 0.76730 = 0.14094.

P(14 ≤ X < 15) = P(1.33 ≤ Z < 1.92) = Ф(1.92) – Ф(1.33) =

= 0.97257 - 0.90824 = 0.06433.

P(X ≥ 15) = P(Z ≥ 1.92) = 1 – Ф(1.92) = 1 - 0.97257 = 0.02743.

390

Las probabilidades pi y las frecuencias esperadas ei = n pi = 120 pi se

presentan en la siguiente tabla:

NOTAS Xi ni = Oi pi ei = npi (Oi - ei)2/ei

7 - 8 7.5 2 0.01222 1.5 0.1942

8 - 9 8.5 6 0.03725 4.5 0.5237

9 - 10 9.5 7 0.09739 11.7 1.8796

10 - 11 10.5 21 0.17590 21.1 0.0006

11 - 12 11.5 33 0.23291 27.9 0.9127

12 - 13 12.5 22 0.21163 25.4 0.4540

13 - 14 13.5 19 0.14094 16.9 0.2576

14 - 15 14.5 7 0.06433 7.7 0.0671

15 - 16 15.5 3 0.02743 3.3 0.0258

Total 120 1.00000 120.0 4.3152

En la última columna se tiene:

9

1

2

2 )(

i i

ii

calce

eO = 4.32



H0, por lo tanto, se concluye que las notas de los alumnos se distribuyen

normalmente.

8. Una muestra de los gastos de estudio mensual (S/.) de 16 alumnos arroja los

siguientes resultados: 120, 210, 100, 150, 120, 200, 200, 180, 250, 300, 250,

140, 300, 200, 160 y 300. Probar si la mediana de los gastos de estudio es

diferente de S/. 220. Use α = 0.05.

Solución


H1: Me ≠ 220



4. Región crítica: para n = 16 y = 0.05, en la tabla 5, de Wilcoxon la región

crítica es: R.C. = {W < 29 o W > 107} → R.A. = {29 ≤ W ≤ 107}

5. Determinar la W de Wilcoxon con la información muestral y bajo el supuesto

que Ho es cierta, tal como se aprecia en la tabla de la página siguiente.

Wcalc = suma de los rangos positivos = 45.5

391

Alumnos Gastos

(Xi)

Diferencia

di = Xi -

220

Rango de

|di|

Rangos con signo

(+) (-)

1 120 -100 14.5 14.5

2 210 -10 1 1

3 100 -120 16 16

4 150 -70 9 9

5 120 -100 14.5 14.5

6 200 -20 3 3

7 200 -20 3 3

8 180 -40 7 7

9 250 30 5.5 5.5

10 300 80 11.5 11.5

11 250 30 5.5 5.5

12 140 -80 11.5 11.5

13 300 80 11.5 11.5

14 200 -20 3 3

15 160 -60 8 8

16 300 80 11.5 11.5

Total 45.5 90.5

6. Decisión: como Wcalc = 45.5 ϵ R.A., con el 5% de significación no se rechaza

H0 y por lo tanto la mediana de los gastos de estudio es de S/. 220.

9. En el problema 8, use la prueba de los signos para probar si la mediana de los

gastos de estudio es diferente de S/. 220. Use α = 0.05.

Solución


H1: Me ≠ 220



frecuente.





392

Alumnos Gastos (Xi) Signo Diferencia

di = Xi - 220

1 120 -

2 210 -

3 100 -

4 150 -

5 120 -

6 200 -

7 200 -

8 180 -

9 250 +

10 300 +

11 250 +

12 140 -

13 300 +

14 200 -

15 160 -

16 300 +


6. Decisión: como Scalc = 5 ϵ R.A., con el 5% de significación no se rechaza H0 y

por lo tanto la mediana de los salarios es de S/. 220.

10. Con la información del peso de los hombres y mujeres en la tabla, determinar si

la mediana del peso de los hombres es mayor que la mediana del peso de las

mujeres. Usar el 5% de significación.


68 54

55 42

70 54

73 51

58 43

59 64

74 56

65 47

66 52

69 65

Solución

1. Hipótesis: Ho: Me1 = Me2 y H1: Me1 > Me2


393


2

1

2

)1,1[

2

1

2

2)(

i j ij

ijij

e

eO

4. Región crítica: el valor crítico es 2

]95.0,1[ = 3.84 y R.C. = {X2 > 3.84}.

5. Determinar 2


cierta, de la siguiente manera:

a) Con toda la información de las dos muestras se calcula la mediana común y

resulta Me = 58.5.

b) Para cada muestra se determina el número de observaciones que son

menores o iguales (orden 1) a la mediana común 58.5 y las que son

mayores (orden 2) a dicha mediana:

Peso Sexo Orden

68 1 2

55 1 1

70 1 2

73 1 2

58 1 1

59 1 2

74 1 2

65 1 2

66 1 2

69 1 2

54 2 1

42 2 1

54 2 1

51 2 1

43 2 1

64 2 2

56 2 1

47 2 1

52 2 1

65 2 2

Me = 58.5

Las frecuencias observadas resultantes se colocan en una tabla de



1 = hombres 2 8 O1. = 10

2 = Mujeres 8 2 O2. = 10

Total O.1 = 10 O.2 =10 n = 20

394


OxOe

ji

ij



1 = hombres 5 5 O1. = 10

2 = Mujeres 5 5 O2. = 10

Total O.1 = 10 O.2 =10 n = 20

d) Determinar:

2

1

2

1

2

2)(

i j ij

ijij

calce

eO

5

)52(

5

)58(

5

)58(

5

)52( 22222

calc = 7.20

P-valor = P( 2

1 > 7.20) = 1 - P( 2

1 ≤ 7.20) = 1 – 0.993 = 0.007.


calc = 7.20 ϵ R.C. y P-valor = 0.007 < = 0.05, se rechaza

H0 y se acepta H1, por lo tanto con el 5% de significación se aceta que la

mediana del peso de los hombres es mayor que la mediana del peso de las

mujeres.

Los resultados en el Minitab para la prueba de medianas es el siguiente:

Prueba de mediana de Mood: Peso en funcion de Sexo Prueba de la mediana de Mood para Peso

Chi-cuadrada = 7.20 GL = 1 P = 0.007

ICs de 95.0% individuales

Sexo N<= N> Mediana Q3-Q1 -----+---------+---------+---------+-

1 2 8 67.0 12.0 (-----------*----)

2 8 2 53.0 12.0 (----------*-------)

-----+---------+---------+---------+-

49.0 56.0 63.0 70.0

Mediana general = 58.5

Un IC de 95.0% para la mediana(1) - mediana(2): (3.0,23.0)

395



la FCE-UNAC, el año 2012, con el 5% de significación probar si existe relación

entre la importancia del aspecto físico del alumno y su sexo (género). Los

resultados observados obtenidos, se muestran en la siguiente tabla:

Tabla de contingencia IMPORTANCIA DE TU FÍSICO * SEXO

IMPORTANCIA DE

TU FÍSICO

SEXO Total

Hombre Mujer

Poca 12 7 19

Media 14 34 48

Mucha 10 36 46

Muchísima 2 5 7

Total 38 82 120


la FCE-UNAC, el año 2012, con el 5% de significación probar si hay una

relación de dependencia entre la especialización profesional del alumno de

economía y su sexo (género). Los resultados observados obtenidos con el SPSS

v21, se muestran en la siguiente tabla:

Tabla de contingencia ESPECIALIZACIÓN * SEXO

ESPECIALIZACIÓN

SEXO Total

Hombre Mujer

Teoría Económica 8 10 18

Gestión Empresarial 30 72 102

Total 38 82 120

3. Para determinar si el sexo (género) de las personas adultas es determinante para

que estas consuman licor, se realiza una encuesta a 500 adultos, obteniéndose los

siguientes resultados:

Consume licor Hombre Mujer Total

Sí 195 40 235

No 65 200 265

Total 260 240 500

Use α = 0.05 y demuestre si el género de las personas adultas es

determinante para que consuman licor.

396

4. Probar con el 5% de significación si el resultado de la evaluación semestral

(aprobado o desaprobado) en la asignatura de estadística básica depende del

profesor, con los resultados del semestre 2012-A en la Facultad de Ciencias

Económicas de la UNAC siguientes:

Profesor Aprobados Desaprobados Total

P1 33 17 50

P2 49 11 60

P3 15 37 52

Total 97 65 162

5. Se lanzan 2 dado 500 veces, el resultado de observar la suma del número de

puntos en los 2 dados es la siguiente:

Suma (Xi) Frecuencia (Oi)

2 6

3 20

4 45

5 42

6 72

7 98

8 75

9 44

10 48

11 35

12 15

Con el 5% de significación, ¿se ajusta el juego al azar?

6. Los pesos de los 120 alumnos de la asignatura de Estadística Básica de la FCE-

UNAC, el año 2012, fueron las siguientes:

PESO (Kg) ni = Oi

Menos 45 2

45 - 50 18

50 - 55 20

55 -60 25

60 - 65 31

65 - 70 9

70 - 75 7

75 - 80 4

80 a más 4

Con el 5% de significación, probar si los pesos se distribuyen normalmente.

7. Una encuesta de opinión a 300 clientes de un supermercado, sobre la calidad del

servicio, arroja los siguientes resultados:

397

Calidad servicio Excelente Bueno Regular Malo Pésimo

Frecuencias (Oi) 72 67 52 56 53

Con el 5% de significación probar si existe diferencia significativa entre la

opinión de los clientes sobre la calidad del servicio en el supermercado.

8. Una muestra de los ingresos familiares (S/.) de 20 empleados arroja los

siguientes resultados: 1300, 700, 700, 2500, 1500, 1200, 1500, 1500, 1500,

1000, 1400, 1800, 1500, 1000, 1500, 700, 700, 1000, 1840 y 2000. Probar si la

mediana de los ingresos es diferente de S/. 1400 con la prueba de Wilcoxon y de

los signos. Use α = 0.05.

9. Los pesos de 15 personas arroja los siguientes resultados: 59, 50, 44, 42, 54, 71,

73, 58, 51, 75, 59, 74, 90, 65 y 43. Probar si la mediana de los pesos es diferente

de 65 kilos con la prueba de Wilcoxon y de los signos. Use α = 0.05.

10. Los precios (S/.) del kilo de carne pagado por 12 amas de casa arroja los

siguientes resultados: 12.50, 12.00, 11.80, 13.20, 12.80, 11.50, 13.50, 12.40,

11.00, 14.00, 11.30 y 13.30. Probar si la mediana de los precios es diferente de

S/. 12.10 con la prueba de Wilcoxon y de los signos. Use α = 0.05.

11. Con la información de la talla de los hombres y mujeres en la tabla, determinar

si la mediana de la talla de los hombres es mayor que la mediana de la talla de

las mujeres. Usar el 5% de significación.


171 152

167 150

160 152

165 165

168 158

176 150

174 155

169 158

168 165

176 149

398

REFERENCIAS BIBLIOGRÁFICAS

1. Anderson, D. y Otros (2004). “Estadística para Administración y Economía”.

Editorial Thomson. Octava edición. México.

2. Berenson & Levin (1992). "Estadística para Administración y Economía".

Prentice Hall Hispanoamericana S.A., México.

3. Bazán, J. y Corbera, J. (1997). “Problemas de probabilidad”. Universidad

Nacional del Callao: Trabajo de investigación para la Facultad de Ciencias

Económicas. Callao.

4. Canovas, George (1995). “Probabilidad y Estadística: Aplicaciones y métodos”.

Mc Graw Hill, México.

5. Chué, J. y Otros (2007). “Estadística descriptiva y probabilidades”. Lima, Perú.

Fondo Editorial Universidad de Lima.

6. López de la Manzanara (1977). "Problemas de Estadística". Editorial Pirámide

S.A., Madrid.

7. Moya y Saravia (1988). "Probabilidad e Inferencia Estadística". Editorial San

Marcos, Lima.

8. Hoog & Craig (1981). "Introduction to Mathematical Statistics". Mc Graw –Hill,

México.

9. Kohler, Heinz (1996). “Estadística para Negocios y Economía”. Compañía

Editorial Continental S.A., México.

10. Levin R. & Rubin D. (1996). "Estadística para Administradores". Prentice–Hall

Hispanoamericana S.A. Sexta edición, México.

11. Levin R. & Rubin D. (2004). “Estadística para Administración y Economía”.

Editorial Pearson Prentice-Hall. Séptima edición, México.

12. Mason, R. y Lind, D. (1998). “Estadística para Administración y Economía”.

Editorial Alfaomega. Octava edición. México.

13. Martínez, Ciro (2005). “Estadística y Muestreo”. Ecoe Ediciones. Décimo

segunda edición. Bogota, Colombia.

14. Meendenhall, William (1990). "Estadística para Administradores". Grupo

Editorial Iberoamérica S.A., México.

15. Ministerio de Educación (2000). “Nutrición y Retardo en el Crecimiento”.

Resultados del II Censo Nacional de Talla en Escolares 1999. Lima.

399

16. Ministerio de Salud (2011). Informe del estado nutricional en el Perú.

Componente nutricional ENAHO-CENAN Julio 2009 – Junio 2010, CENAN –

INEI. Lima, Perú, 2011.

17. Mood & Graybill (1978). "Introducción a la Teoría Estadística". Editorial

Aguilar. Madrid, España.

18. Pérez, César (2002). “Estadística aplicada a través de Excel”. Editorial Pearson-

Prentice Hall. Madrid, España.

19. Spiegel, Murray (1991). "Estadística". Colección Schaum. Mc Graw-Hill,

México.

20. Toma, J. y Rubio, J. (2008). “Estadística aplicada”. Segunda parte. Universidad

del Pacífico: Apuntes de estudio 69. Lima.

21. Webster, Allen. (2000). “Estadística aplicada a los negocios y la economía”.

Editorial McGraw-Hill. Tercera edición. Bogota, Colombia.

REFERENCIAS WEB

22. Acuña, Edgar (2012). “Pruebas no paramétricas”. Universidad de Puerto Rico.

http://www.google.com.pe/url?sa=t&rct=j&q=&esrc=s&frm=1&source=web&c

d=6&sqi=2&ved=0CEoQFjAF&url=http%3A%2F%2Facademic.uprm.edu%2Fe

acuna%2Fminiman11sl.pdf&ei=e7dpUov5Foj28wTn8oCYAQ&usg=AFQjCNE

-MH9RWOglMaHg479MiFrk0l_FJA

23. Bazán, Juan (2011). “Texto de estadística computacional con R, Excel, Minitab

y SPSS” (PDF). Universidad Nacional del Callao: Trabajo de investigación para

la Facultad de Ciencias Económicas. Callao.

http://www.unac.edu.pe/documentos/organizacion/vri/cdcitra/Informes_Finales_

Investigacion/Enero_2011/BAZAN_BACA_FCE/Estad%EDstica%20computaci

onal.pdf

24. http://es.wikipedia.org/wiki/William_Sealy_Gosset; revisado en agosto de 2012.

25. http://buscon.rae.es/drae/ Real Academia Española © Todos los derechos

reservados. Vigésima segunda edición (2001).

http://www.google.com.pe/url?sa=t&rct=j&q=&esrc=s&frm=1&source=web&cd=6&sqi=2&ved=0CEoQFjAF&url=http%3A%2F%2Facademic.uprm.edu%2Feacuna%2Fminiman11sl.pdf&ei=e7dpUov5Foj28wTn8oCYAQ&usg=AFQjCNE-MH9RWOglMaHg479MiFrk0l_FJA




http://www.unac.edu.pe/documentos/organizacion/vri/cdcitra/Informes_Finales_Investigacion/Enero_2011/BAZAN_BACA_FCE/Estad%EDstica%20computacional.pdf



http://es.wikipedia.org/wiki/William_Sealy_Gosset

http://buscon.rae.es/drae/

400

APÉNDICE

401

F(z) = Φ (z) = P [Z ? z] =

z F(z) z F(z) z F(z) z F(z) z F(z) z F(z)

-3.59 0.00017 -2.99 0.00139 -2.39 0.00842 -1.79 0.03673 -1.19 0.11702 -0.59 0.27760

-3.58 0.00017 -2.98 0.00144 -2.38 0.00866 -1.78 0.03754 -1.18 0.11900 -0.58 0.28096

-3.57 0.00018 -2.97 0.00149 -2.37 0.00889 -1.77 0.03836 -1.17 0.12100 -0.57 0.28434

-3.56 0.00019 -2.96 0.00154 -2.36 0.00914 -1.76 0.03920 -1.16 0.12302 -0.56 0.28774

-3.55 0.00019 -2.95 0.00159 -2.35 0.00939 -1.75 0.04006 -1.15 0.12507 -0.55 0.29116

-3.54 0.00020 -2.94 0.00164 -2.34 0.00964 -1.74 0.04093 -1.14 0.12714 -0.54 0.29460

-3.53 0.00021 -2.93 0.00169 -2.33 0.00990 -1.73 0.04182 -1.13 0.12924 -0.53 0.29806

-3.52 0.00022 -2.92 0.00175 -2.32 0.01017 -1.72 0.04272 -1.12 0.13136 -0.52 0.30153

-3.51 0.00022 -2.91 0.00181 -2.31 0.01044 -1.71 0.04363 -1.11 0.13350 -0.51 0.30503

-3.50 0.00023 -2.90 0.00187 -2.30 0.01072 -1.70 0.04457 -1.10 0.13567 -0.50 0.30854

-3.49 0.00024 -2.89 0.00193 -2.29 0.01101 -1.69 0.04551 -1.09 0.13786 -0.49 0.31207

-3.48 0.00025 -2.88 0.00199 -2.28 0.01130 -1.68 0.04648 -1.08 0.14007 -0.48 0.31561

-3.47 0.00026 -2.87 0.00205 -2.27 0.01160 -1.67 0.04746 -1.07 0.14231 -0.47 0.31918

-3.46 0.00027 -2.86 0.00212 -2.26 0.01191 -1.66 0.04846 -1.06 0.14457 -0.46 0.32276

-3.45 0.00028 -2.85 0.00219 -2.25 0.01222 -1.65 0.04947 -1.05 0.14686 -0.45 0.32636

-3.44 0.00029 -2.84 0.00226 -2.24 0.01255 -1.64 0.05050 -1.04 0.14917 -0.44 0.32997

-3.43 0.00030 -2.83 0.00233 -2.23 0.01287 -1.63 0.05155 -1.03 0.15151 -0.43 0.33360

-3.42 0.00031 -2.82 0.00240 -2.22 0.01321 -1.62 0.05262 -1.02 0.15386 -0.42 0.33724

-3.41 0.00032 -2.81 0.00248 -2.21 0.01355 -1.61 0.05370 -1.01 0.15625 -0.41 0.34090

-3.40 0.00034 -2.80 0.00256 -2.20 0.01390 -1.60 0.05480 -1.00 0.15866 -0.40 0.34458

-3.39 0.00035 -2.79 0.00264 -2.19 0.01426 -1.59 0.05592 -0.99 0.16109 -0.39 0.34827

-3.38 0.00036 -2.78 0.00272 -2.18 0.01463 -1.58 0.05705 -0.98 0.16354 -0.38 0.35197

-3.37 0.00038 -2.77 0.00280 -2.17 0.01500 -1.57 0.05821 -0.97 0.16602 -0.37 0.35569

-3.36 0.00039 -2.76 0.00289 -2.16 0.01539 -1.56 0.05938 -0.96 0.16853 -0.36 0.35942

-3.35 0.00040 -2.75 0.00298 -2.15 0.01578 -1.55 0.06057 -0.95 0.17106 -0.35 0.36317

-3.34 0.00042 -2.74 0.00307 -2.14 0.01618 -1.54 0.06178 -0.94 0.17361 -0.34 0.36693

-3.33 0.00043 -2.73 0.00317 -2.13 0.01659 -1.53 0.06301 -0.93 0.17619 -0.33 0.37070

-3.32 0.00045 -2.72 0.00326 -2.12 0.01700 -1.52 0.06426 -0.92 0.17879 -0.32 0.37448

-3.31 0.00047 -2.71 0.00336 -2.11 0.01743 -1.51 0.06552 -0.91 0.18141 -0.31 0.37828

-3.30 0.00048 -2.70 0.00347 -2.10 0.01786 -1.50 0.06681 -0.90 0.18406 -0.30 0.38209

-3.29 0.00050 -2.69 0.00357 -2.09 0.01831 -1.49 0.06811 -0.89 0.18673 -0.29 0.38591

-3.28 0.00052 -2.68 0.00368 -2.08 0.01876 -1.48 0.06944 -0.88 0.18943 -0.28 0.38974

-3.27 0.00054 -2.67 0.00379 -2.07 0.01923 -1.47 0.07078 -0.87 0.19215 -0.27 0.39358

-3.26 0.00056 -2.66 0.00391 -2.06 0.01970 -1.46 0.07215 -0.86 0.19489 -0.26 0.39743

-3.25 0.00058 -2.65 0.00402 -2.05 0.02018 -1.45 0.07353 -0.85 0.19766 -0.25 0.40129

-3.24 0.00060 -2.64 0.00415 -2.04 0.02068 -1.44 0.07493 -0.84 0.20045 -0.24 0.40517

-3.23 0.00062 -2.63 0.00427 -2.03 0.02118 -1.43 0.07636 -0.83 0.20327 -0.23 0.40905

-3.22 0.00064 -2.62 0.00440 -2.02 0.02169 -1.42 0.07780 -0.82 0.20611 -0.22 0.41294

-3.21 0.00066 -2.61 0.00453 -2.01 0.02222 -1.41 0.07927 -0.81 0.20897 -0.21 0.41683

-3.20 0.00069 -2.60 0.00466 -2.00 0.02275 -1.40 0.08076 -0.80 0.21186 -0.20 0.42074

-3.19 0.00071 -2.59 0.00480 -1.99 0.02330 -1.39 0.08226 -0.79 0.21476 -0.19 0.42465

-3.18 0.00074 -2.58 0.00494 -1.98 0.02385 -1.38 0.08379 -0.78 0.21770 -0.18 0.42858

-3.17 0.00076 -2.57 0.00508 -1.97 0.02442 -1.37 0.08534 -0.77 0.22065 -0.17 0.43251

-3.16 0.00079 -2.56 0.00523 -1.96 0.02500 -1.36 0.08692 -0.76 0.22363 -0.16 0.43644

-3.15 0.00082 -2.55 0.00539 -1.95 0.02559 -1.35 0.08851 -0.75 0.22663 -0.15 0.44038

-3.14 0.00084 -2.54 0.00554 -1.94 0.02619 -1.34 0.09012 -0.74 0.22965 -0.14 0.44433

-3.13 0.00087 -2.53 0.00570 -1.93 0.02680 -1.33 0.09176 -0.73 0.23270 -0.13 0.44828

-3.12 0.00090 -2.52 0.00587 -1.92 0.02743 -1.32 0.09342 -0.72 0.23576 -0.12 0.45224

-3.11 0.00094 -2.51 0.00604 -1.91 0.02807 -1.31 0.09510 -0.71 0.23885 -0.11 0.45620

-3.10 0.00097 -2.50 0.00621 -1.90 0.02872 -1.30 0.09680 -0.70 0.24196 -0.10 0.46017

-3.09 0.00100 -2.49 0.00639 -1.89 0.02938 -1.29 0.09853 -0.69 0.24510 -0.09 0.46414

-3.08 0.00104 -2.48 0.00657 -1.88 0.03005 -1.28 0.10027 -0.68 0.24825 -0.08 0.46812

-3.07 0.00107 -2.47 0.00676 -1.87 0.03074 -1.27 0.10204 -0.67 0.25143 -0.07 0.47210

-3.06 0.00111 -2.46 0.00695 -1.86 0.03144 -1.26 0.10383 -0.66 0.25463 -0.06 0.47608

-3.05 0.00114 -2.45 0.00714 -1.85 0.03216 -1.25 0.10565 -0.65 0.25785 -0.05 0.48006

-3.04 0.00118 -2.44 0.00734 -1.84 0.03288 -1.24 0.10749 -0.64 0.26109 -0.04 0.48405

-3.03 0.00122 -2.43 0.00755 -1.83 0.03362 -1.23 0.10935 -0.63 0.26435 -0.03 0.48803

-3.02 0.00126 -2.42 0.00776 -1.82 0.03438 -1.22 0.11123 -0.62 0.26763 -0.02 0.49202

-3.01 0.00131 -2.41 0.00798 -1.81 0.03515 -1.21 0.11314 -0.61 0.27093 -0.01 0.49601

-3.00 0.00135 -2.40 0.00820 -1.80 0.03593 -1.20 0.11507 -0.60 0.27425 0.00 0.50000

TABLA 1. DISTRIBUCIÓN ACUMULATIVA NORMAL ESTÁNDAR

z

t dte 2/2

2

1

402

F(z) = Φ (z) = P [Z ? z] =

continuación

z F(z) z F(z) z F(z) z F(z) z F(z) z F(z)

0.01 0.50399 0.61 0.72907 1.21 0.88686 1.81 0.96485 2.41 0.99202 3.01 0.99869

0.02 0.50798 0.62 0.73237 1.22 0.88877 1.82 0.96562 2.42 0.99224 3.02 0.99874

0.03 0.51197 0.63 0.73565 1.23 0.89065 1.83 0.96638 2.43 0.99245 3.03 0.99878

0.04 0.51595 0.64 0.73891 1.24 0.89251 1.84 0.96712 2.44 0.99266 3.04 0.99882

0.05 0.51994 0.65 0.74215 1.25 0.89435 1.85 0.96784 2.45 0.99286 3.05 0.99886

0.06 0.52392 0.66 0.74537 1.26 0.89617 1.86 0.96856 2.46 0.99305 3.06 0.99889

0.07 0.52790 0.67 0.74857 1.27 0.89796 1.87 0.96926 2.47 0.99324 3.07 0.99893

0.08 0.53188 0.68 0.75175 1.28 0.89973 1.88 0.96995 2.48 0.99343 3.08 0.99896

0.09 0.53586 0.69 0.75490 1.29 0.90147 1.89 0.97062 2.49 0.99361 3.09 0.99900

0.10 0.53983 0.70 0.75804 1.30 0.90320 1.90 0.97128 2.50 0.99379 3.10 0.99903

0.11 0.54380 0.71 0.76115 1.31 0.90490 1.91 0.97193 2.51 0.99396 3.11 0.99906

0.12 0.54776 0.72 0.76424 1.32 0.90658 1.92 0.97257 2.52 0.99413 3.12 0.99910

0.13 0.55172 0.73 0.76730 1.33 0.90824 1.93 0.97320 2.53 0.99430 3.13 0.99913

0.14 0.55567 0.74 0.77035 1.34 0.90988 1.94 0.97381 2.54 0.99446 3.14 0.99916

0.15 0.55962 0.75 0.77337 1.35 0.91149 1.95 0.97441 2.55 0.99461 3.15 0.99918

0.16 0.56356 0.76 0.77637 1.36 0.91308 1.96 0.97500 2.56 0.99477 3.16 0.99921

0.17 0.56749 0.77 0.77935 1.37 0.91466 1.97 0.97558 2.57 0.99492 3.17 0.99924

0.18 0.57142 0.78 0.78230 1.38 0.91621 1.98 0.97615 2.58 0.99506 3.18 0.99926

0.19 0.57535 0.79 0.78524 1.39 0.91774 1.99 0.97670 2.59 0.99520 3.19 0.99929

0.20 0.57926 0.80 0.78814 1.40 0.91924 2.00 0.97725 2.60 0.99534 3.20 0.99931

0.21 0.58317 0.81 0.79103 1.41 0.92073 2.01 0.97778 2.61 0.99547 3.21 0.99934

0.22 0.58706 0.82 0.79389 1.42 0.92220 2.02 0.97831 2.62 0.99560 3.22 0.99936

0.23 0.59095 0.83 0.79673 1.43 0.92364 2.03 0.97882 2.63 0.99573 3.23 0.99938

0.24 0.59483 0.84 0.79955 1.44 0.92507 2.04 0.97932 2.64 0.99585 3.24 0.99940

0.25 0.59871 0.85 0.80234 1.45 0.92647 2.05 0.97982 2.65 0.99598 3.25 0.99942

0.26 0.60257 0.86 0.80511 1.46 0.92785 2.06 0.98030 2.66 0.99609 3.26 0.99944

0.27 0.60642 0.87 0.80785 1.47 0.92922 2.07 0.98077 2.67 0.99621 3.27 0.99946

0.28 0.61026 0.88 0.81057 1.48 0.93056 2.08 0.98124 2.68 0.99632 3.28 0.99948

0.29 0.61409 0.89 0.81327 1.49 0.93189 2.09 0.98169 2.69 0.99643 3.29 0.99950

0.30 0.61791 0.90 0.81594 1.50 0.93319 2.10 0.98214 2.70 0.99653 3.30 0.99952

0.31 0.62172 0.91 0.81859 1.51 0.93448 2.11 0.98257 2.71 0.99664 3.31 0.99953

0.32 0.62552 0.92 0.82121 1.52 0.93574 2.12 0.98300 2.72 0.99674 3.32 0.99955

0.33 0.62930 0.93 0.82381 1.53 0.93699 2.13 0.98341 2.73 0.99683 3.33 0.99957

0.34 0.63307 0.94 0.82639 1.54 0.93822 2.14 0.98382 2.74 0.99693 3.34 0.99958

0.35 0.63683 0.95 0.82894 1.55 0.93943 2.15 0.98422 2.75 0.99702 3.35 0.99960

0.36 0.64058 0.96 0.83147 1.56 0.94062 2.16 0.98461 2.76 0.99711 3.36 0.99961

0.37 0.64431 0.97 0.83398 1.57 0.94179 2.17 0.98500 2.77 0.99720 3.37 0.99962

0.38 0.64803 0.98 0.83646 1.58 0.94295 2.18 0.98537 2.78 0.99728 3.38 0.99964

0.39 0.65173 0.99 0.83891 1.59 0.94408 2.19 0.98574 2.79 0.99736 3.39 0.99965

0.40 0.65542 1.00 0.84134 1.60 0.94520 2.20 0.98610 2.80 0.99744 3.40 0.99966

0.41 0.65910 1.01 0.84375 1.61 0.94630 2.21 0.98645 2.81 0.99752 3.41 0.99968

0.42 0.66276 1.02 0.84614 1.62 0.94738 2.22 0.98679 2.82 0.99760 3.42 0.99969

0.43 0.66640 1.03 0.84849 1.63 0.94845 2.23 0.98713 2.83 0.99767 3.43 0.99970

0.44 0.67003 1.04 0.85083 1.64 0.94950 2.24 0.98745 2.84 0.99774 3.44 0.99971

0.45 0.67364 1.05 0.85314 1.65 0.95053 2.25 0.98778 2.85 0.99781 3.45 0.99972

0.46 0.67724 1.06 0.85543 1.66 0.95154 2.26 0.98809 2.86 0.99788 3.46 0.99973

0.47 0.68082 1.07 0.85769 1.67 0.95254 2.27 0.98840 2.87 0.99795 3.47 0.99974

0.48 0.68439 1.08 0.85993 1.68 0.95352 2.28 0.98870 2.88 0.99801 3.48 0.99975

0.49 0.68793 1.09 0.86214 1.69 0.95449 2.29 0.98899 2.89 0.99807 3.49 0.99976

0.50 0.69146 1.10 0.86433 1.70 0.95543 2.30 0.98928 2.90 0.99813 3.50 0.99977

0.51 0.69497 1.11 0.86650 1.71 0.95637 2.31 0.98956 2.91 0.99819 3.51 0.99978

0.52 0.69847 1.12 0.86864 1.72 0.95728 2.32 0.98983 2.92 0.99825 3.52 0.99978

0.53 0.70194 1.13 0.87076 1.73 0.95818 2.33 0.99010 2.93 0.99831 3.53 0.99979

0.54 0.70540 1.14 0.87286 1.74 0.95907 2.34 0.99036 2.94 0.99836 3.54 0.99980

0.55 0.70884 1.15 0.87493 1.75 0.95994 2.35 0.99061 2.95 0.99841 3.55 0.99981

0.56 0.71226 1.16 0.87698 1.76 0.96080 2.36 0.99086 2.96 0.99846 3.56 0.99981

0.57 0.71566 1.17 0.87900 1.77 0.96164 2.37 0.99111 2.97 0.99851 3.57 0.99982

0.58 0.71904 1.18 0.88100 1.78 0.96246 2.38 0.99134 2.98 0.99856 3.58 0.99983

0.59 0.72240 1.19 0.88298 1.79 0.96327 2.39 0.99158 2.99 0.99861 3.59 0.99983

0.60 0.72575 1.20 0.88493 1.80 0.96407 2.40 0.99180 3.00 0.99865 3.60 0.99984

TABLA 1. DISTRIBUCIÓN ACUMULATIVA NORMAL ESTÁNDAR

z

t dte 2/2

2

1

403

0.0005 0.001 0.005 0.01 0.025 0.05 0.10 0.20 0.30 0.40

1 3.93E-07 1.57E-06 3.93E-05 1.57E-04 9.82E-04 3.93E-03 0.016 0.064 0.148 0.275

2 0.001 0.002 0.010 0.020 0.051 0.103 0.211 0.446 0.713 1.02

3 0.015 0.024 0.072 0.115 0.216 0.352 0.584 1.01 1.42 1.87

4 0.064 0.091 0.207 0.297 0.484 0.711 1.06 1.65 2.19 2.75

5 0.158 0.210 0.412 0.554 0.831 1.15 1.61 2.34 3.00 3.66

6 0.299 0.381 0.676 0.872 1.24 1.64 2.20 3.07 3.83 4.57

7 0.485 0.598 0.989 1.24 1.69 2.17 2.83 3.82 4.67 5.49

8 0.710 0.857 1.34 1.65 2.18 2.73 3.49 4.59 5.53 6.42

9 0.972 1.15 1.73 2.09 2.70 3.33 4.17 5.38 6.39 7.36

10 1.26 1.48 2.16 2.56 3.25 3.94 4.87 6.18 7.27 8.30

11 1.59 1.83 2.60 3.05 3.82 4.57 5.58 6.99 8.15 9.24

12 1.93 2.21 3.07 3.57 4.40 5.23 6.30 7.81 9.03 10.2

13 2.31 2.62 3.57 4.11 5.01 5.89 7.04 8.63 9.93 11.1

14 2.70 3.04 4.07 4.66 5.63 6.57 7.79 9.47 10.8 12.1

15 3.11 3.48 4.60 5.23 6.26 7.26 8.55 10.3 11.7 13.0

16 3.54 3.94 5.14 5.81 6.91 7.96 9.31 11.2 12.6 14.0

17 3.98 4.42 5.70 6.41 7.56 8.67 10.1 12.0 13.5 14.9

18 4.44 4.90 6.26 7.01 8.23 9.39 10.9 12.9 14.4 15.9

19 4.91 5.41 6.84 7.63 8.91 10.1 11.7 13.7 15.4 16.9

20 5.40 5.92 7.43 8.26 9.59 10.9 12.4 14.6 16.3 17.8

21 5.90 6.45 8.03 8.90 10.3 11.6 13.2 15.4 17.2 18.8

22 6.40 6.98 8.64 9.54 11.0 12.3 14.0 16.3 18.1 19.7

23 6.92 7.53 9.26 10.2 11.7 13.1 14.8 17.2 19.0 20.7

24 7.45 8.08 9.89 10.9 12.4 13.8 15.7 18.1 19.9 21.7

25 7.99 8.65 10.5 11.5 13.1 14.6 16.5 18.9 20.9 22.6

26 8.54 9.22 11.2 12.2 13.8 15.4 17.3 19.8 21.8 23.6

27 9.09 9.80 11.8 12.9 14.6 16.2 18.1 20.7 22.7 24.5

28 9.66 10.4 12.5 13.6 15.3 16.9 18.9 21.6 23.6 25.5

29 10.2 11.0 13.1 14.3 16.0 17.7 19.8 22.5 24.6 26.5

30 10.8 11.6 13.8 15.0 16.8 18.5 20.6 23.4 25.5 27.4

31 11.4 12.2 14.5 15.7 17.5 19.3 21.4 24.3 26.4 28.4

32 12.0 12.8 15.1 16.4 18.3 20.1 22.3 25.1 27.4 29.4

33 12.6 13.4 15.8 17.1 19.0 20.9 23.1 26.0 28.3 30.3

34 13.2 14.1 16.5 17.8 19.8 21.7 24.0 26.9 29.2 31.3

35 13.8 14.7 17.2 18.5 20.6 22.5 24.8 27.8 30.2 32.3

36 14.4 15.3 17.9 19.2 21.3 23.3 25.6 28.7 31.1 33.3

37 15.0 16.0 18.6 20.0 22.1 24.1 26.5 29.6 32.1 34.2

38 15.6 16.6 19.3 20.7 22.9 24.9 27.3 30.5 33.0 35.2

39 16.3 17.3 20.0 21.4 23.7 25.7 28.2 31.4 33.9 36.2

40 16.9 17.9 20.7 22.2 24.4 26.5 29.1 32.3 34.9 37.1

41 17.5 18.6 21.4 22.9 25.2 27.3 29.9 33.3 35.8 38.1

42 18.2 19.2 22.1 23.7 26.0 28.1 30.8 34.2 36.8 39.1

43 18.8 19.9 22.9 24.4 26.8 29.0 31.6 35.1 37.7 40.0

44 19.5 20.6 23.6 25.1 27.6 29.8 32.5 36.0 38.6 41.0

45 20.1 21.3 24.3 25.9 28.4 30.6 33.4 36.9 39.6 42.0

46 20.8 21.9 25.0 26.7 29.2 31.4 34.2 37.8 40.5 43.0

47 21.5 22.6 25.8 27.4 30.0 32.3 35.1 38.7 41.5 43.9

48 22.1 23.3 26.5 28.2 30.8 33.1 35.9 39.6 42.4 44.9

49 22.8 24.0 27.2 28.9 31.6 33.9 36.8 40.5 43.4 45.9

50 23.5 24.7 28.0 29.7 32.4 34.8 37.7 41.4 44.3 46.9

G.L.PROBABILIDAD P

TABLA 2.

DISTRIBUCIÓN ACUMULATIVA CHI-CUADRADO

Los valores en la tabla son de Chi-cuadrado, siendo la pro-

babilidad p el área en el extremos inferior. 0

Xα

P

404

0.50 0.60 0.70 0.80 0.90 0.95 0.975 0.99 0.995 0.999 0.9995

1 0.455 0.708 1.07 1.64 2.71 3.84 5.02 6.63 7.88 10.8 12.1

2 1.39 1.83 2.41 3.22 4.61 5.99 7.38 9.21 10.6 13.8 15.2

3 2.37 2.95 3.66 4.64 6.25 7.81 9.35 11.3 12.8 16.3 17.7

4 3.36 4.04 4.88 5.99 7.78 9.49 11.1 13.3 14.9 18.5 20.0

5 4.35 5.13 6.06 7.29 9.24 11.1 12.8 15.1 16.7 20.5 22.1

6 5.35 6.21 7.23 8.56 10.6 12.6 14.4 16.8 18.5 22.5 24.1

7 6.35 7.28 8.38 9.80 12.0 14.1 16.0 18.5 20.3 24.3 26.0

8 7.34 8.35 9.52 11.0 13.4 15.5 17.5 20.1 22.0 26.1 27.9

9 8.34 9.41 10.7 12.2 14.7 16.9 19.0 21.7 23.6 27.9 29.7

10 9.34 10.5 11.8 13.4 16.0 18.3 20.5 23.2 25.2 29.6 31.4

11 10.3 11.5 12.9 14.6 17.3 19.7 21.9 24.7 26.8 31.3 33.1

12 11.3 12.6 14.0 15.8 18.5 21.0 23.3 26.2 28.3 32.9 34.8

13 12.3 13.6 15.1 17.0 19.8 22.4 24.7 27.7 29.8 34.5 36.5

14 13.3 14.7 16.2 18.2 21.1 23.7 26.1 29.1 31.3 36.1 38.1

15 14.3 15.7 17.3 19.3 22.3 25.0 27.5 30.6 32.8 37.7 39.7

16 15.3 16.8 18.4 20.5 23.5 26.3 28.8 32.0 34.3 39.3 41.3

17 16.3 17.8 19.5 21.6 24.8 27.6 30.2 33.4 35.7 40.8 42.9

18 17.3 18.9 20.6 22.8 26.0 28.9 31.5 34.8 37.2 42.3 44.4

19 18.3 19.9 21.7 23.9 27.2 30.1 32.9 36.2 38.6 43.8 46.0

20 19.3 21.0 22.8 25.0 28.4 31.4 34.2 37.6 40.0 45.3 47.5

21 20.3 22.0 23.9 26.2 29.6 32.7 35.5 38.9 41.4 46.8 49.0

22 21.3 23.0 24.9 27.3 30.8 33.9 36.8 40.3 42.8 48.3 50.5

23 22.3 24.1 26.0 28.4 32.0 35.2 38.1 41.6 44.2 49.7 52.0

24 23.3 25.1 27.1 29.6 33.2 36.4 39.4 43.0 45.6 51.2 53.5

25 24.3 26.1 28.2 30.7 34.4 37.7 40.6 44.3 46.9 52.6 54.9

26 25.3 27.2 29.2 31.8 35.6 38.9 41.9 45.6 48.3 54.1 56.4

27 26.3 28.2 30.3 32.9 36.7 40.1 43.2 47.0 49.6 55.5 57.9

28 27.3 29.2 31.4 34.0 37.9 41.3 44.5 48.3 51.0 56.9 59.3

29 28.3 30.3 32.5 35.1 39.1 42.6 45.7 49.6 52.3 58.3 60.7

30 29.3 31.3 33.5 36.3 40.3 43.8 47.0 50.9 53.7 59.7 62.2

31 30.3 32.3 34.6 37.4 41.4 45.0 48.2 52.2 55.0 61.1 63.6

32 31.3 33.4 35.7 38.5 42.6 46.2 49.5 53.5 56.3 62.5 65.0

33 32.3 34.4 36.7 39.6 43.7 47.4 50.7 54.8 57.6 63.9 66.4

34 33.3 35.4 37.8 40.7 44.9 48.6 52.0 56.1 59.0 65.2 67.8

35 34.3 36.5 38.9 41.8 46.1 49.8 53.2 57.3 60.3 66.6 69.2

36 35.3 37.5 39.9 42.9 47.2 51.0 54.4 58.6 61.6 68.0 70.6

37 36.3 38.5 41.0 44.0 48.4 52.2 55.7 59.9 62.9 69.3 72.0

38 37.3 39.6 42.0 45.1 49.5 53.4 56.9 61.2 64.2 70.7 73.4

39 38.3 40.6 43.1 46.2 50.7 54.6 58.1 62.4 65.5 72.1 74.7

40 39.3 41.6 44.2 47.3 51.8 55.8 59.3 63.7 66.8 73.4 76.1

41 40.3 42.7 45.2 48.4 52.9 56.9 60.6 65.0 68.1 74.7 77.5

42 41.3 43.7 46.3 49.5 54.1 58.1 61.8 66.2 69.3 76.1 78.8

43 42.3 44.7 47.3 50.5 55.2 59.3 63.0 67.5 70.6 77.4 80.2

44 43.3 45.7 48.4 51.6 56.4 60.5 64.2 68.7 71.9 78.7 81.5

45 44.3 46.8 49.5 52.7 57.5 61.7 65.4 70.0 73.2 80.1 82.9

46 45.3 47.8 50.5 53.8 58.6 62.8 66.6 71.2 74.4 81.4 84.2

47 46.3 48.8 51.6 54.9 59.8 64.0 67.8 72.4 75.7 82.7 85.6

48 47.3 49.8 52.6 56.0 60.9 65.2 69.0 73.7 77.0 84.0 86.9

49 48.3 50.9 53.7 57.1 62.0 66.3 70.2 74.9 78.2 85.4 88.2

50 49.3 51.9 54.7 58.2 63.2 67.5 71.4 76.2 79.5 86.7 89.6



babilidad p el área en el extremos inferior.

Probabilidad PG.L.

TABLA 2.

0

Xα

P

405

0.0005 0.001 0.005 0.01 0.025 0.05 0.10 0.20 0.30 0.40

51 24.1 25.4 28.7 30.5 33.2 35.6 38.6 42.4 45.3 47.8

52 24.8 26.1 29.5 31.2 34.0 36.4 39.4 43.3 46.2 48.8

53 25.5 26.8 30.2 32.0 34.8 37.3 40.3 44.2 47.2 49.8

54 26.2 27.5 31.0 32.8 35.6 38.1 41.2 45.1 48.1 50.8

55 26.9 28.2 31.7 33.6 36.4 39.0 42.1 46.0 49.1 51.7

56 27.6 28.9 32.5 34.3 37.2 39.8 42.9 47.0 50.0 52.7

57 28.2 29.6 33.2 35.1 38.0 40.6 43.8 47.9 51.0 53.7

58 28.9 30.3 34.0 35.9 38.8 41.5 44.7 48.8 51.9 54.7

59 29.6 31.0 34.8 36.7 39.7 42.3 45.6 49.7 52.9 55.6

60 30.3 31.7 35.5 37.5 40.5 43.2 46.5 50.6 53.8 56.6

61 31.0 32.5 36.3 38.3 41.3 44.0 47.3 51.6 54.8 57.6

62 31.7 33.2 37.1 39.1 42.1 44.9 48.2 52.5 55.7 58.6

63 32.5 33.9 37.8 39.9 43.0 45.7 49.1 53.4 56.7 59.6

64 33.2 34.6 38.6 40.6 43.8 46.6 50.0 54.3 57.6 60.5

65 33.9 35.4 39.4 41.4 44.6 47.4 50.9 55.3 58.6 61.5

66 34.6 36.1 40.2 42.2 45.4 48.3 51.8 56.2 59.5 62.5

67 35.3 36.8 40.9 43.0 46.3 49.2 52.7 57.1 60.5 63.5

68 36.0 37.6 41.7 43.8 47.1 50.0 53.5 58.0 61.4 64.4

69 36.7 38.3 42.5 44.6 47.9 50.9 54.4 59.0 62.4 65.4

70 37.5 39.0 43.3 45.4 48.8 51.7 55.3 59.9 63.3 66.4

71 38.2 39.8 44.1 46.2 49.6 52.6 56.2 60.8 64.3 67.4

72 38.9 40.5 44.8 47.1 50.4 53.5 57.1 61.8 65.3 68.4

73 39.6 41.3 45.6 47.9 51.3 54.3 58.0 62.7 66.2 69.3

74 40.4 42.0 46.4 48.7 52.1 55.2 58.9 63.6 67.2 70.3

75 41.1 42.8 47.2 49.5 52.9 56.1 59.8 64.5 68.1 71.3

76 41.8 43.5 48.0 50.3 53.8 56.9 60.7 65.5 69.1 72.3

77 42.6 44.3 48.8 51.1 54.6 57.8 61.6 66.4 70.0 73.2

78 43.3 45.0 49.6 51.9 55.5 58.7 62.5 67.3 71.0 74.2

79 44.1 45.8 50.4 52.7 56.3 59.5 63.4 68.3 72.0 75.2

80 44.8 46.5 51.2 53.5 57.2 60.4 64.3 69.2 72.9 76.2

81 45.5 47.3 52.0 54.4 58.0 61.3 65.2 70.1 73.9 77.2

82 46.3 48.0 52.8 55.2 58.8 62.1 66.1 71.1 74.8 78.1

83 47.0 48.8 53.6 56.0 59.7 63.0 67.0 72.0 75.8 79.1

84 47.8 49.6 54.4 56.8 60.5 63.9 67.9 72.9 76.8 80.1

85 48.5 50.3 55.2 57.6 61.4 64.7 68.8 73.9 77.7 81.1

86 49.3 51.1 56.0 58.5 62.2 65.6 69.7 74.8 78.7 82.1

87 50.0 51.9 56.8 59.3 63.1 66.5 70.6 75.7 79.6 83.0

88 50.8 52.6 57.6 60.1 63.9 67.4 71.5 76.7 80.6 84.0

89 51.5 53.4 58.4 60.9 64.8 68.2 72.4 77.6 81.6 85.0

90 52.3 54.2 59.2 61.8 65.6 69.1 73.3 78.6 82.5 86.0

91 53.0 54.9 60.0 62.6 66.5 70.0 74.2 79.5 83.5 87.0

92 53.8 55.7 60.8 63.4 67.4 70.9 75.1 80.4 84.4 88.0

93 54.5 56.5 61.6 64.2 68.2 71.8 76.0 81.4 85.4 88.9

94 55.3 57.2 62.4 65.1 69.1 72.6 76.9 82.3 86.4 89.9

95 56.1 58.0 63.2 65.9 69.9 73.5 77.8 83.2 87.3 90.9

96 56.8 58.8 64.1 66.7 70.8 74.4 78.7 84.2 88.3 91.9

97 57.6 59.6 64.9 67.6 71.6 75.3 79.6 85.1 89.2 92.9

98 58.4 60.4 65.7 68.4 72.5 76.2 80.5 86.1 90.2 93.8

99 59.1 61.1 66.5 69.2 73.4 77.0 81.4 87.0 91.2 94.8

100 59.9 61.9 67.3 70.1 74.2 77.9 82.4 87.9 92.1 95.8

G.L.PROBABILIDAD P




TABLA 2.

0

Xα

P

406

0.50 0.60 0.70 0.80 0.90 0.95 0.975 0.99 0.995 0.999 0.9995

51 50.3 52.9 55.8 59.2 64.3 68.7 72.6 77.4 80.7 88.0 90.9

52 51.3 53.9 56.8 60.3 65.4 69.8 73.8 78.6 82.0 89.3 92.2

53 52.3 55.0 57.9 61.4 66.5 71.0 75.0 79.8 83.3 90.6 93.5

54 53.3 56.0 58.9 62.5 67.7 72.2 76.2 81.1 84.5 91.9 94.8

55 54.3 57.0 60.0 63.6 68.8 73.3 77.4 82.3 85.7 93.2 96.2

56 55.3 58.0 61.0 64.7 69.9 74.5 78.6 83.5 87.0 94.5 97.5

57 56.3 59.1 62.1 65.7 71.0 75.6 79.8 84.7 88.2 95.8 98.8

58 57.3 60.1 63.1 66.8 72.2 76.8 80.9 86.0 89.5 97.0 100.1

59 58.3 61.1 64.2 67.9 73.3 77.9 82.1 87.2 90.7 98.3 101.4

60 59.3 62.1 65.2 69.0 74.4 79.1 83.3 88.4 92.0 99.6 102.7

61 60.3 63.2 66.3 70.0 75.5 80.2 84.5 89.6 93.2 100.9 104.0

62 61.3 64.2 67.3 71.1 76.6 81.4 85.7 90.8 94.4 102.2 105.3

63 62.3 65.2 68.4 72.2 77.7 82.5 86.8 92.0 95.6 103.4 106.6

64 63.3 66.2 69.4 73.3 78.9 83.7 88.0 93.2 96.9 104.7 107.9

65 64.3 67.2 70.5 74.4 80.0 84.8 89.2 94.4 98.1 106.0 109.2

66 65.3 68.3 71.5 75.4 81.1 86.0 90.3 95.6 99.3 107.3 110.5

67 66.3 69.3 72.6 76.5 82.2 87.1 91.5 96.8 100.6 108.5 111.7

68 67.3 70.3 73.6 77.6 83.3 88.3 92.7 98.0 101.8 109.8 113.0

69 68.3 71.3 74.6 78.6 84.4 89.4 93.9 99.2 103.0 111.1 114.3

70 69.3 72.4 75.7 79.7 85.5 90.5 95.0 100.4 104.2 112.3 115.6

71 70.3 73.4 76.7 80.8 86.6 91.7 96.2 101.6 105.4 113.6 116.9

72 71.3 74.4 77.8 81.9 87.7 92.8 97.4 102.8 106.6 114.8 118.1

73 72.3 75.4 78.8 82.9 88.8 93.9 98.5 104.0 107.9 116.1 119.4

74 73.3 76.4 79.9 84.0 90.0 95.1 99.7 105.2 109.1 117.3 120.7

75 74.3 77.5 80.9 85.1 91.1 96.2 100.8 106.4 110.3 118.6 121.9

76 75.3 78.5 82.0 86.1 92.2 97.4 102.0 107.6 111.5 119.9 123.2

77 76.3 79.5 83.0 87.2 93.3 98.5 103.2 108.8 112.7 121.1 124.5

78 77.3 80.5 84.0 88.3 94.4 99.6 104.3 110.0 113.9 122.3 125.7

79 78.3 81.5 85.1 89.3 95.5 100.7 105.5 111.1 115.1 123.6 127.0

80 79.3 82.6 86.1 90.4 96.6 101.9 106.6 112.3 116.3 124.8 128.3

81 80.3 83.6 87.2 91.5 97.7 103.0 107.8 113.5 117.5 126.1 129.5

82 81.3 84.6 88.2 92.5 98.8 104.1 108.9 114.7 118.7 127.3 130.8

83 82.3 85.6 89.2 93.6 99.9 105.3 110.1 115.9 119.9 128.6 132.0

84 83.3 86.6 90.3 94.7 101.0 106.4 111.2 117.1 121.1 129.8 133.3

85 84.3 87.7 91.3 95.7 102.1 107.5 112.4 118.2 122.3 131.0 134.5

86 85.3 88.7 92.4 96.8 103.2 108.6 113.5 119.4 123.5 132.3 135.8

87 86.3 89.7 93.4 97.9 104.3 109.8 114.7 120.6 124.7 133.5 137.0

88 87.3 90.7 94.4 98.9 105.4 110.9 115.8 121.8 125.9 134.7 138.3

89 88.3 91.7 95.5 100.0 106.5 112.0 117.0 122.9 127.1 136.0 139.5

90 89.3 92.8 96.5 101.1 107.6 113.1 118.1 124.1 128.3 137.2 140.8

91 90.3 93.8 97.6 102.1 108.7 114.3 119.3 125.3 129.5 138.4 142.0

92 91.3 94.8 98.6 103.2 109.8 115.4 120.4 126.5 130.7 139.7 143.3

93 92.3 95.8 99.6 104.2 110.9 116.5 121.6 127.6 131.9 140.9 144.5

94 93.3 96.8 100.7 105.3 111.9 117.6 122.7 128.8 133.1 142.1 145.8

95 94.3 97.9 101.7 106.4 113.0 118.8 123.9 130.0 134.2 143.3 147.0

96 95.3 98.9 102.8 107.4 114.1 119.9 125.0 131.1 135.4 144.6 148.2

97 96.3 99.9 103.8 108.5 115.2 121.0 126.1 132.3 136.6 145.8 149.5

98 97.3 100.9 104.8 109.5 116.3 122.1 127.3 133.5 137.8 147.0 150.7

99 98.3 101.9 105.9 110.6 117.4 123.2 128.4 134.6 139.0 148.2 151.9

100 99.3 102.9 106.9 111.7 118.5 124.3 129.6 135.8 140.2 149.4 153.2

G.L.Probabilidad P




TABLA 2.

0

Xα

P

407

0.75 0.80 0.85 0.90 0.95 0.975 0.990 0.995 0.9995

1 1.000 1.376 1.963 3.078 6.314 12.706 31.821 63.657 636.619

2 0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925 31.599

3 0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841 12.924

4 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604 8.610

5 0.727 0.920 1.156 1.476 2.015 2.571 3.365 4.032 6.869

6 0.718 0.906 1.134 1.440 1.943 2.447 3.143 3.707 5.959

7 0.711 0.896 1.119 1.415 1.895 2.365 2.998 3.499 5.408

8 0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355 5.041

9 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250 4.781

10 0.700 0.879 1.093 1.372 1.812 2.228 2.764 3.169 4.587

11 0.697 0.876 1.088 1.363 1.796 2.201 2.718 3.106 4.437

12 0.695 0.873 1.083 1.356 1.782 2.179 2.681 3.055 4.318

13 0.694 0.870 1.079 1.350 1.771 2.160 2.650 3.012 4.221

14 0.692 0.868 1.076 1.345 1.761 2.145 2.624 2.977 4.140

15 0.691 0.866 1.074 1.341 1.753 2.131 2.602 2.947 4.073

16 0.690 0.865 1.071 1.337 1.746 2.120 2.583 2.921 4.015

17 0.689 0.863 1.069 1.333 1.740 2.110 2.567 2.898 3.965

18 0.688 0.862 1.067 1.330 1.734 2.101 2.552 2.878 3.922

19 0.688 0.861 1.066 1.328 1.729 2.093 2.539 2.861 3.883

20 0.687 0.860 1.064 1.325 1.725 2.086 2.528 2.845 3.850

21 0.686 0.859 1.063 1.323 1.721 2.080 2.518 2.831 3.819

22 0.686 0.858 1.061 1.321 1.717 2.074 2.508 2.819 3.792

23 0.685 0.858 1.060 1.319 1.714 2.069 2.500 2.807 3.768

24 0.685 0.857 1.059 1.318 1.711 2.064 2.492 2.797 3.745

25 0.684 0.856 1.058 1.316 1.708 2.060 2.485 2.787 3.725

26 0.684 0.856 1.058 1.315 1.706 2.056 2.479 2.779 3.707

27 0.684 0.855 1.057 1.314 1.703 2.052 2.473 2.771 3.690

28 0.683 0.855 1.056 1.313 1.701 2.048 2.467 2.763 3.674

29 0.683 0.854 1.055 1.311 1.699 2.045 2.462 2.756 3.659

30 0.683 0.854 1.055 1.310 1.697 2.042 2.457 2.750 3.646

31 0.682 0.853 1.054 1.309 1.696 2.040 2.453 2.744 3.633

32 0.682 0.853 1.054 1.309 1.694 2.037 2.449 2.738 3.622

33 0.682 0.853 1.053 1.308 1.692 2.035 2.445 2.733 3.611

34 0.682 0.852 1.052 1.307 1.691 2.032 2.441 2.728 3.601

35 0.682 0.852 1.052 1.306 1.690 2.030 2.438 2.724 3.591

40 0.681 0.851 1.050 1.303 1.684 2.021 2.423 2.704 3.551

45 0.680 0.850 1.049 1.301 1.679 2.014 2.412 2.690 3.520

50 0.679 0.849 1.047 1.299 1.676 2.009 2.403 2.678 3.496

55 0.679 0.848 1.046 1.297 1.673 2.004 2.396 2.668 3.476

60 0.679 0.848 1.045 1.296 1.671 2.000 2.390 2.660 3.460

70 0.678 0.847 1.044 1.294 1.667 1.994 2.381 2.648 3.435

80 0.678 0.846 1.043 1.292 1.664 1.990 2.374 2.639 3.416

90 0.677 0.846 1.042 1.291 1.662 1.987 2.368 2.632 3.402

100 0.677 0.845 1.042 1.290 1.660 1.984 2.364 2.626 3.390

200 0.676 0.843 1.039 1.286 1.653 1.972 2.345 2.601 3.340

300 0.675 0.843 1.038 1.284 1.650 1.968 2.339 2.592 3.323

400 0.675 0.843 1.038 1.284 1.649 1.966 2.336 2.588 3.315

500 0.675 0.842 1.038 1.283 1.648 1.965 2.334 2.586 3.310

1000 0.675 0.842 1.037 1.282 1.646 1.962 2.330 2.581 3.300

5000 0.675 0.842 1.037 1.282 1.645 1.960 2.327 2.577 3.292

bilidad p el área acumulada en el extremos inferior.

G.L.PROBABILIDAD P

TABLA 3.

DISTRIBUCIÓN ACUMULATIVA T DE STUDENT

Los valores en la tabla son valores t, siendo la proba-

0

t0

p

408

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

0.950 161 200 216 225 230 234 237 239 241 242 243 244 245 245 246 246 247 247 248 248

0.975 648 799 864 900 922 937 948 957 963 969 973 977 980 983 985 987 989 990 992 993

0.990 4052 5000 5403 5625 5764 5859 5928 5981 6022 6056 6083 6106 6126 6143 6157 6170 6181 6192 6201 6209

0.995 16211 20000 21615 22500 23056 23437 23715 23925 24091 24224 24334 24426 24505 24572 24630 24681 24727 24767 24803 24836

0.950 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.40 19.41 19.42 19.42 19.43 19.43 19.44 19.44 19.44 19.45

0.975 38.51 39.00 39.17 39.25 39.30 39.33 39.36 39.37 39.39 39.40 39.41 39.41 39.42 39.43 39.43 39.44 39.44 39.44 39.45 39.45

0.990 98.50 99.00 99.17 99.25 99.30 99.33 99.36 99.37 99.39 99.40 99.41 99.42 99.42 99.43 99.43 99.44 99.44 99.44 99.45 99.45

0.995 198.50 199.00 199.17 199.25 199.30 199.33 199.36 199.37 199.39 199.40 199.41 199.42 199.42 199.43 199.43 199.44 199.44 199.44 199.45 199.45

0.950 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 8.76 8.74 8.73 8.71 8.70 8.69 8.68 8.67 8.67 8.66

0.975 17.44 16.04 15.44 15.10 14.88 14.73 14.62 14.54 14.47 14.42 14.37 14.34 14.30 14.28 14.25 14.23 14.21 14.20 14.18 14.17

0.990 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.35 27.23 27.13 27.05 26.98 26.92 26.87 26.83 26.79 26.75 26.72 26.69

0.995 55.55 49.80 47.47 46.19 45.39 44.84 44.43 44.13 43.88 43.69 43.52 43.39 43.27 43.17 43.08 43.01 42.94 42.88 42.83 42.78

0.950 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.94 5.91 5.89 5.87 5.86 5.84 5.83 5.82 5.81 5.80

0.975 12.22 10.65 9.98 9.60 9.36 9.20 9.07 8.98 8.90 8.84 8.79 8.75 8.71 8.68 8.66 8.63 8.61 8.59 8.58 8.56

0.990 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.55 14.45 14.37 14.31 14.25 14.20 14.15 14.11 14.08 14.05 14.02

0.995 31.33 26.28 24.26 23.15 22.46 21.97 21.62 21.35 21.14 20.97 20.82 20.70 20.60 20.51 20.44 20.37 20.31 20.26 20.21 20.17

0.950 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.70 4.68 4.66 4.64 4.62 4.60 4.59 4.58 4.57 4.56

0.975 10.01 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6.68 6.62 6.57 6.52 6.49 6.46 6.43 6.40 6.38 6.36 6.34 6.33

0.990 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16 10.05 9.96 9.89 9.82 9.77 9.72 9.68 9.64 9.61 9.58 9.55

0.995 22.78 18.31 16.53 15.56 14.94 14.51 14.20 13.96 13.77 13.62 13.49 13.38 13.29 13.21 13.15 13.09 13.03 12.98 12.94 12.90

0.950 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 4.03 4.00 3.98 3.96 3.94 3.92 3.91 3.90 3.88 3.87

0.975 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60 5.52 5.46 5.41 5.37 5.33 5.30 5.27 5.24 5.22 5.20 5.18 5.17

0.990 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87 7.79 7.72 7.66 7.60 7.56 7.52 7.48 7.45 7.42 7.40

0.995 18.63 14.54 12.92 12.03 11.46 11.07 10.79 10.57 10.39 10.25 10.13 10.03 9.95 9.88 9.81 9.76 9.71 9.66 9.62 9.59

0.950 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.60 3.57 3.55 3.53 3.51 3.49 3.48 3.47 3.46 3.44

0.975 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90 4.82 4.76 4.71 4.67 4.63 4.60 4.57 4.54 4.52 4.50 4.48 4.47

0.990 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 6.62 6.54 6.47 6.41 6.36 6.31 6.28 6.24 6.21 6.18 6.16

0.995 16.24 12.40 10.88 10.05 9.52 9.16 8.89 8.68 8.51 8.38 8.27 8.18 8.10 8.03 7.97 7.91 7.87 7.83 7.79 7.75

0.950 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.31 3.28 3.26 3.24 3.22 3.20 3.19 3.17 3.16 3.15

0.975 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 4.36 4.30 4.24 4.20 4.16 4.13 4.10 4.08 4.05 4.03 4.02 4.00

0.990 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 5.81 5.73 5.67 5.61 5.56 5.52 5.48 5.44 5.41 5.38 5.36

0.995 14.69 11.04 9.60 8.81 8.30 7.95 7.69 7.50 7.34 7.21 7.10 7.01 6.94 6.87 6.81 6.76 6.72 6.68 6.64 6.61

0.950 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.10 3.07 3.05 3.03 3.01 2.99 2.97 2.96 2.95 2.94

0.975 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96 3.91 3.87 3.83 3.80 3.77 3.74 3.72 3.70 3.68 3.67

0.990 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26 5.18 5.11 5.05 5.01 4.96 4.92 4.89 4.86 4.83 4.81

0.995 13.61 10.11 8.72 7.96 7.47 7.13 6.88 6.69 6.54 6.42 6.31 6.23 6.15 6.09 6.03 5.98 5.94 5.90 5.86 5.83

0.950 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.94 2.91 2.89 2.86 2.85 2.83 2.81 2.80 2.79 2.77

0.975 6.94 5.46 4.83 4.47 4.24 4.07 3.95 3.85 3.78 3.72 3.66 3.62 3.58 3.55 3.52 3.50 3.47 3.45 3.44 3.42

0.990 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85 4.77 4.71 4.65 4.60 4.56 4.52 4.49 4.46 4.43 4.41

0.995 12.83 9.43 8.08 7.34 6.87 6.54 6.30 6.12 5.97 5.85 5.75 5.66 5.59 5.53 5.47 5.42 5.38 5.34 5.31 5.27

Los valores en la tabla son valores F, siendo la probabilidad p el área acumulada en el extremos inferior.

TABLA 4. DISTRIBUCIÓN ACUMULATIVA F: P [F ≤ f]

2

3

4

5

6

7

G.L.

Denom.P

1

8

9

10

Grados de libertad del numerador

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

0.950 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85 2.82 2.79 2.76 2.74 2.72 2.70 2.69 2.67 2.66 2.65

0.975 6.72 5.26 4.63 4.28 4.04 3.88 3.76 3.66 3.59 3.53 3.47 3.43 3.39 3.36 3.33 3.30 3.28 3.26 3.24 3.23

0.990 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63 4.54 4.46 4.40 4.34 4.29 4.25 4.21 4.18 4.15 4.12 4.10

0.995 12.23 8.91 7.60 6.88 6.42 6.10 5.86 5.68 5.54 5.42 5.32 5.24 5.16 5.10 5.05 5.00 4.96 4.92 4.89 4.86

0.950 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75 2.72 2.69 2.66 2.64 2.62 2.60 2.58 2.57 2.56 2.54

0.975 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44 3.37 3.32 3.28 3.24 3.21 3.18 3.15 3.13 3.11 3.09 3.07

0.990 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30 4.22 4.16 4.10 4.05 4.01 3.97 3.94 3.91 3.88 3.86

0.995 11.75 8.51 7.23 6.52 6.07 5.76 5.52 5.35 5.20 5.09 4.99 4.91 4.84 4.77 4.72 4.67 4.63 4.59 4.56 4.53

0.950 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 2.67 2.63 2.60 2.58 2.55 2.53 2.51 2.50 2.48 2.47 2.46

0.975 6.41 4.97 4.35 4.00 3.77 3.60 3.48 3.39 3.31 3.25 3.20 3.15 3.12 3.08 3.05 3.03 3.00 2.98 2.96 2.95

0.990 9.07 6.70 5.74 5.21 4.86 4.62 4.44 4.30 4.19 4.10 4.02 3.96 3.91 3.86 3.82 3.78 3.75 3.72 3.69 3.66

0.995 11.37 8.19 6.93 6.23 5.79 5.48 5.25 5.08 4.94 4.82 4.72 4.64 4.57 4.51 4.46 4.41 4.37 4.33 4.30 4.27

0.950 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 2.57 2.53 2.51 2.48 2.46 2.44 2.43 2.41 2.40 2.39

0.975 6.30 4.86 4.24 3.89 3.66 3.50 3.38 3.29 3.21 3.15 3.09 3.05 3.01 2.98 2.95 2.92 2.90 2.88 2.86 2.84

0.990 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03 3.94 3.86 3.80 3.75 3.70 3.66 3.62 3.59 3.56 3.53 3.51

0.995 11.06 7.92 6.68 6.00 5.56 5.26 5.03 4.86 4.72 4.60 4.51 4.43 4.36 4.30 4.25 4.20 4.16 4.12 4.09 4.06

0.950 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54 2.51 2.48 2.45 2.42 2.40 2.38 2.37 2.35 2.34 2.33

0.975 6.20 4.77 4.15 3.80 3.58 3.41 3.29 3.20 3.12 3.06 3.01 2.96 2.92 2.89 2.86 2.84 2.81 2.79 2.77 2.76

0.990 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.80 3.73 3.67 3.61 3.56 3.52 3.49 3.45 3.42 3.40 3.37

0.995 10.80 7.70 6.48 5.80 5.37 5.07 4.85 4.67 4.54 4.42 4.33 4.25 4.18 4.12 4.07 4.02 3.98 3.95 3.91 3.88

0.950 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49 2.46 2.42 2.40 2.37 2.35 2.33 2.32 2.30 2.29 2.28

0.975 6.12 4.69 4.08 3.73 3.50 3.34 3.22 3.12 3.05 2.99 2.93 2.89 2.85 2.82 2.79 2.76 2.74 2.72 2.70 2.68

0.990 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 3.69 3.62 3.55 3.50 3.45 3.41 3.37 3.34 3.31 3.28 3.26

0.995 10.58 7.51 6.30 5.64 5.21 4.91 4.69 4.52 4.38 4.27 4.18 4.10 4.03 3.97 3.92 3.87 3.83 3.80 3.76 3.73

0.950 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49 2.45 2.41 2.38 2.35 2.33 2.31 2.29 2.27 2.26 2.24 2.23

0.975 6.04 4.62 4.01 3.66 3.44 3.28 3.16 3.06 2.98 2.92 2.87 2.82 2.79 2.75 2.72 2.70 2.67 2.65 2.63 2.62

0.990 8.40 6.11 5.18 4.67 4.34 4.10 3.93 3.79 3.68 3.59 3.52 3.46 3.40 3.35 3.31 3.27 3.24 3.21 3.19 3.16

0.995 10.38 7.35 6.16 5.50 5.07 4.78 4.56 4.39 4.25 4.14 4.05 3.97 3.90 3.84 3.79 3.75 3.71 3.67 3.64 3.61

0.950 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41 2.37 2.34 2.31 2.29 2.27 2.25 2.23 2.22 2.20 2.19

0.975 5.98 4.56 3.95 3.61 3.38 3.22 3.10 3.01 2.93 2.87 2.81 2.77 2.73 2.70 2.67 2.64 2.62 2.60 2.58 2.56

0.990 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60 3.51 3.43 3.37 3.32 3.27 3.23 3.19 3.16 3.13 3.10 3.08

0.995 10.22 7.21 6.03 5.37 4.96 4.66 4.44 4.28 4.14 4.03 3.94 3.86 3.79 3.73 3.68 3.64 3.60 3.56 3.53 3.50

0.950 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42 2.38 2.34 2.31 2.28 2.26 2.23 2.21 2.20 2.18 2.17 2.16

0.975 5.92 4.51 3.90 3.56 3.33 3.17 3.05 2.96 2.88 2.82 2.76 2.72 2.68 2.65 2.62 2.59 2.57 2.55 2.53 2.51

0.990 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52 3.43 3.36 3.30 3.24 3.19 3.15 3.12 3.08 3.05 3.03 3.00

0.995 10.07 7.09 5.92 5.27 4.85 4.56 4.34 4.18 4.04 3.93 3.84 3.76 3.70 3.64 3.59 3.54 3.50 3.46 3.43 3.40

0.950 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35 2.31 2.28 2.25 2.22 2.20 2.18 2.17 2.15 2.14 2.12

0.975 5.87 4.46 3.86 3.51 3.29 3.13 3.01 2.91 2.84 2.77 2.72 2.68 2.64 2.60 2.57 2.55 2.52 2.50 2.48 2.46

0.990 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 3.37 3.29 3.23 3.18 3.13 3.09 3.05 3.02 2.99 2.96 2.94

0.995 9.94 6.99 5.82 5.17 4.76 4.47 4.26 4.09 3.96 3.85 3.76 3.68 3.61 3.55 3.50 3.46 3.42 3.38 3.35 3.32

19

20

13

14

15

16

17

18

Los valores en la tabla son valores F, siendo la probabilidad p el área acumulada en el extremos inferior.

G.L.

Denom.P

Grados de libertad del numerador

11

12

TABLA 4. DISTRIBUCIÓN ACUMULATIVA F: P [F ≤ f]

409

Tabla 5. De Wilcoxon para n ≤ 40 y = 0.05 o 0.01.

n 0.05 0.01 n 0.05 0.01 n 0.05 0.01

6 0 - 21

18 40 - 131 27 - 144

30 137 - 328 109 - 356

7 2 - 26

19 46 - 144 32 - 158

31 147 - 349 118 - 378

8 3 - 33 0 - 36

20 52 - 158 37 - 173

32 159 - 369 128 - 400

9 5 - 40 1 - 44

21 58 - 173 42 - 189

33 170 - 391 138 - 423

10 8 - 47 3 - 52

22 65 - 188 48 - 205

34 182 - 413 148 - 447

11 10 -56 5 - 61

23 73 - 203 54 - 222

35 195 - 435 159 - 471

12 13 - 65 7 - 71

24 81 - 219 61 - 239

36 208 - 458 171 - 495

13 17 - 74 9 - 82

25 89 - 236 68 - 257

37 221 - 482 182 - 521

14 21 - 84 12 - 93

26 98 - 253 75 - 276

38 235 - 506 194 - 547

15 25 - 95 15 - 105

27 107 - 271 83 - 295

39 249 - 531 207 - 573

16 29 - 107 19 - 117

28 116 - 290 91 - 315

40 264 - 556 220 - 600

17 34 - 119 23 - 130 29 126 - 309 100 - 335

Fuente: Journal of the American Statistical Association, setiembre de 1965.

Tabla 6. Valores críticos para la prueba del signo S: n ≤ 25 y = 0.01 o 0.05

n 0.01 0.05 n 0.01 0.05

1 - -

14 1 2

2 - -

15 2 3

3 - -

16 2 3

4 - -

17 2 4

5 - -

18 3 4

6 - 0

19 3 4

7 - 0

20 3 5

8 0 0

21 4 5

9 0 1

22 4 5

10 0 1

23 4 6

11 0 1

24 5 6

12 1 2

25 5 7

13 1 2

La hipótesis nula se rechaza si S es menor o igual al valor de la tabla.

ejercicios de estadistica ii

Documents