metodos estadísticos 09 primera unidad

47
Universidad Peruana Unión Facultad de Ingeniería y Arquitectura EAP Ingeniería de Ambiental MEINV MÉTODOS ESTADÍSTICOS PARA LA INVESTIGACIÓN Docente Mg. María Vallejos Atalaya I Semestre 2009

Upload: solymarysol

Post on 11-Aug-2015

82 views

Category:

Engineering


5 download

TRANSCRIPT

Universidad Peruana Unión

Facultad de Ingeniería y Arquitectura

EAP Ingeniería de Ambiental

MEINV

MÉTODOS ESTADÍSTICOS

PARA LA INVESTIGACIÓN

Docente

Mg. María Vallejos Atalaya

I Semestre 2009

Métodos Estadísticos para la investigación

2

Presentación

El presente módulo ha sido preparado con el propósito de servir al estudiante de la Escuela Académica Profesional de Ingeniería de Alimentos - Facultad de Ingeniería - Universidad Peruana Unión, en la formación inicial del amplio campo que constituye la teoría de los métodos estadísticos aplicados a la investigación. El propósito del módulo, es presentar una introducción en el marco de estudio de la estadística de manera que el estudiante de nuestra escuela conozca las múltiples aplicaciones, no solamente en los campos de ciencias naturales, ingeniería, sino también en ciencias sociales y, especialmente, en ingeniería de alimentos. Como se demostrará mas adelante el conocimiento del comportamiento de los parámetros es vital para extraer conclusiones respecto a la población. El presente módulo está organizado en tres unidades, en las cuales se enfoca el aprendizaje de los métodos estadísticos para la aplicación en actividades de especialización profesional como de investigación y en la vida misma. La primera unidad consta de conceptos fundamentales, estimación de parámetros y pruebas de hipótesis paramétricas. La segunda unidad estudia la construcción de diseños experimentales, el análisis de varianza y pruebas de comparaciones múltiples. La tercera unidad centra su atención en el análisis de regresión, covarianza, superficie de respuesta y pruebas no paramétricas. Es el anhelo de la tutora que este módulo contribuya al logro de los objetivos de la asignatura.

Métodos Estadísticos para la investigación

3

INDICE GENERAL PRIMERA UNIDAD ........................................................................................................................................ 4 ESTIMACIONES Y PRUEBAS DE HIPÓTESIS ............................................................................................ 4 1. ESTIMACIÓN DE PARÁMETROS ........................................................................................................ 4

1.1. ESTIMACIÓN PUNTUAL. ........................................................................................................... 4 1.1.1. Estimación Puntual para la media poblacional. ......................................................................... 5 1.1.2. Estimación Puntual para la varianza poblacional. ..................................................................... 5 1.1.3. Estimación de parámetros de dos poblaciones........................................................................... 5 1.1.4. Estimación puntual de una población de variable cualitativa .................................................... 6 1.1.5. Estimación puntual de dos poblaciones de variables cualitativas. ............................................. 6

1.2. ESTIMACIÓN INTERVÁLICA .................................................................................................... 6 1.2.1. Intervalo confidencial para la media poblacional ...................................................................... 6 1.2.2. Intervalo confidencial para la diferencia de medias poblacionales ............................................ 7 1.2.3. Intervalo confidencial para la proporción poblacional .............................................................. 8 1.2.4. Intervalo confidencial para la diferencia de proporciones poblacionales .................................. 8

2. SELECCIÓN DEL TAMAÑO DE MUESTRA en m.a.s........................................................................ 15 3. PRUEBAS DE HIPÓTESIS .................................................................................................................... 20

3.1. PRUEBA DE NORMALIDAD DE DATOS ............................................................................... 23 3.2. PRUEBA DE HIPÓTESIS REFERIDA A LA MEDIA POBLACIONAL ................................. 29 3.3. PRUEBA DE HIPÓTESIS REFERIDA A LA VARIANZA POBLACIONAL ......................... 32 3.4. PRUEBA DE HIPÓTESIS REFERIDA A LA PROPORCIÓN POBLACIONAL ..................... 35 3.5. PRUEBA DE HIPÓTESIS REFERIDA A DOS VARIANCIAS POBLACIONALES ............... 38 3.6. PRUEBA DE HIPÓTESIS REFERIDA A DOS MEDIAS POBLACIONALES ........................ 42 3.7. PRUEBA DE HIPÓTESIS REFERIDA A DOS PROPORCIONES POBLACIONALES ......... 45

Métodos Estadísticos para la investigación

4

PRIMERA UNIDAD

ESTIMACIONES Y PRUEBAS DE HIPÓTESIS

Los métodos estadísticos inferenciales constituyen una forma de extraer conclusiones

respecto a una población, de los datos obtenidos realmente de una muestra.

La inferencia estadística comprende dos tipos principales de técnicas: Estimación de

parámetros y contrastación de hipótesis. Independientemente de la técnica que se utilice,

la finalidad general es utilizar datos de una muestra para extraer conclusiones respecto a

una población.

1. ESTIMACIÓN DE PARÁMETROS

Las técnicas de estimación son utilizadas cuando el investigador no tiene hipótesis previa

respecto al valor de una característica de la población y desea conocer cuál podría ser tal

valor.

La estimación puede asumir 2 formas:

- Estimación puntual

- Estimación por intervalos

1.1. ESTIMACIÓN PUNTUAL.

Contiene el cálculo de una sola cifra numérica, esto es un valor estadístico para evaluar

el parámetro desconocido de la población.

Una desventaja de esta forma de estimación es que no aporta la precisión de la

estimación del parámetro.

Las estimaciones puntuales más usuales son:

COMPETENCIAS:

1. Estima parámetros mediante la estimación puntual e interválica. 2. Determina el tamaño adecuado de una muestra aleatoria 3. Contrasta hipótesis pramétricas para la media, varianza, proporción en una y dos

poblaciones

Métodos Estadísticos para la investigación

5

1.1.1. Estimación Puntual para la media poblacional.

Se halla mediante las siguientes fórmulas.

- Para datos simples - Para datos agrupados

f

fx = x =

n

x = x =

i

iii

ˆˆ

1.1.2. Estimación Puntual para la varianza poblacional.

Se halla mediante las siguientes fórmulas.

- Para datos simples - Para datos agrupados

2 2 i2

2 2 i2

i

i

= s = ( x - x )

n - 1 = s =

( x - x ) f

f - 1

1.1.3. Estimación de parámetros de dos poblaciones

Sea X una variable aleatoria que se distribuye como una distribución normal con media x

y varianza ²x e Y otra variable aleatoria que se distribuye como una distribución normal

con media y y varianza ²y.

La estimación de parámetros de dos poblaciones se pueden realizar mediante:

a) La comparación de sus medias, luego:

212121ˆˆ x -x = - = -

b) La comparación de sus varianzas, luego:

s

s = =

2x

2x

x

x

x

2

x

2

1

2

1

2

2

1

2

ˆ

ˆˆ

Métodos Estadísticos para la investigación

6

1.1.4. Estimación puntual de una población de variable cualitativa

Sea X una variable cualitativa con:

P - 1 = Qy

AX si 0,

AX si 1,

N

M

N

XPcon

X

i

Luego:

p - 1 = qy

A xsi 0,

A xsi 1,

n

m

N

xpcon

x

i

Entonces: P p

1.1.5. Estimación puntual de dos poblaciones de variables cualitativas.

Sea X la variables aleatoria de una población cualitativa con Px proporción de aciertos en

X y sea Y la variables aleatoria de otra población cualitativa con Py proporción de aciertos

en Y, luego:

p - p = P - P = P - P xxxxxx 212121 ˆˆ

1.2. ESTIMACIÓN INTERVÁLICA

La estimación por intervalos de un parámetro nos indica límites dentro de los cuales el

parámetro tiene la probabilidad especificada de estar. Los estimados por intervalos se

conoce como intervalos de confianza y los límites inferior y superior como los límites de

confianza.

En general el intervalo de confianza para el parámetro se expresa:

- 1 = )k + k - P( ˆˆˆˆ

Los intervalos confidenciales más usuales son:

1.2.1. Intervalo confidencial para la media poblacional

Para determinar el intervalo confidencial para la media poblacional se debe tomar en

cuenta lo siguiente:

Métodos Estadísticos para la investigación

7

- Cuando se conoce la varianza de la población (n 30)

- 1 = )n

Z + x n

Z - xP(22

)1()1(

- Cuando no se conoce la varianza de la población (n 30)

P( x - ts

n x + t

s

n) = 1 - ( n (

2,n-1)1

21 1 , )

1.2.2. Intervalo confidencial para la diferencia de medias poblacionales

Cuando n1 + n2 - 2 30 se usa el valor de la abscisa de la distribución normal

estándar Z(1-α/2)

Si, n1 + n2 - 2 < 30 se usa el valor de la abscisa de la distribución t student ( t(n-1, 1-α/2)

Se presentan los siguientes casos:

- Si ²1 y ²2 son conocidos

- 1 =] n

+n

Z + )x-x( - n

+n

Z - )x-xP[(22

22

2

2

1

2

1)

21(2121

2

2

1

1)1(21

- Si ²1 y ²2 no son conocidos

se presentan dos casos:

a. Si ²1 es aproximadamente igual a ²2 entonces; ²1 ²2 ²

2 - n + n

1)s - n( + 1)s - n( = s :donde

-1=])n

1+

n

1(st+)x-x(-)

n

1+

n

1(st-)x-xP[(

2

2)-nn(

2)-nn(

21

2

222

11

21

2,2

12121

21

2,2

1212121

Cuando ²1 es diferente a ²2

-1=]n

s+

n

st + )x-x(_ - _

n

s +

n

st - )x-xP[(

22

)-nn

22

)-nn(

2

2

1

12,

21(2121

2

2

1

12,

2121

2121

Métodos Estadísticos para la investigación

8

1.2.3. Intervalo confidencial para la proporción poblacional

Se presentan los siguientes casos:

- Cuando se conoce la proporción poblacional o n 30

- 1 =n

pqZ + p P

n

pqZ - P(p

22))1()1(

- Cuando no se conoce la proporción poblacional o n30

P(p - tpq

n P p + t

pq

n) = 1 - (

2,n-1) (

2,n-1)1 1

1.2.4. Intervalo confidencial para la diferencia de proporciones

poblacionales

Se pueden presentan los siguientes casos:

- Si P1 y P2 son proporciones poblacionales conocidas o n1 y n2 son muestras grandes

(n30)

-1=]n

qp+

n

qpZ+)p-p( p-P

n

qp+

n

qpZ-)p-pP[(

222

22

1

11)1(2121

2

22

1

11)1(21

- Si P1 y P2 son proporciones poblacionales desconocidas o n1 y n2 son muestras

pequeñas (n<30)

-1=]n

qp+

n

qpt+)p-p(P-P

n

qp+

n

qpt-)p-pP[( )-nn()-nn(

2

22

1

112,

212121

2

22

1

112,

21(21 2121

Nota: Si los tamaños de muestra son muy diferentes por ejemplo n1 = 80 , n2 = 20 se

recomienda emplear:

n + n

pn + pn = p :donde

)n

1 +

n

1)(p - (1p = s

2

21

2211

21

Esta proporción denota la proporción conjunta de las dos muestras.

Métodos Estadísticos para la investigación

9

EJEMPLOS

1. Se ensaya un test para determinar el coeficiente de inteligencia a 8 alumnos; los

resultados fueron:

98, 108, 92, 111, 102, 95, 89, 115.

Determine la estimación puntual e interválica (use el 90% de confianza) para el promedio

verdadero del cociente de inteligencia.

Solución

n = 8, x = 101.25, s = 9.377 -1 = 0.90 Luego 2

1 = 0.95

como n 30, entonces t(n – 1, 1 - /2) = t(7,095) = 1.895

a) Estimación puntual: 25.101

x

b) Estimación intervalica:

Por formula

- 1 = )n

st + x

n

st - xP( )(( 95.0,7)95.0,7

Reemplazando

- 1 = ) - P(8

377.9895.125.101

8

377.9895.125.101

Se obtiene

%9053.10797.94 =] P[

2. Un biólogo desea hacer una estimación, con un intervalo de confianza del 95%, de

la cantidad promedio de agua que consume diariamente cierta especie animal en

condiciones experimentales. El investigador supone que la población de valores de

consumo diario de agua está normalmente distribuido y, con base en experiencias

pasadas, que la varianza de la población es de 4 gramos cuadrados. Una muestra

aleatoria de 25 animales arroja una media de 16,5 gramos.

Métodos Estadísticos para la investigación

10

De acuerdo con los datos suministrados, el biólogo puede construir un intervalo de

confianza del 95%.

Solución

n = 25, x = 16.5, s = 2 -1 = 0.95 Luego 2

1 = 0.975

como n 30, entonces t(n – 1, 1 - /2) = t(24,0.975) = 2.064

Estimación intervalica:

Por formula

- 1 = )n

st + x

n

st - xP( )(( 95.07)95.07

Reemplazando

%9524

2064.25.16

24

2064.25.16 = ) - P(

Se obtiene

%9034.1766.15 =] P[

3. Como parte de un experimento, una gran empresa manufacturera encontró que el

tiempo promedio requerido para que 16 empleados escogidos al azar completaran una

tarea determinada era de 26 minutos. La desviación estándar era de 5 minutos. Construir

el intervalo de confianza del 95% para la media poblacional.

Solución

n = 16 x = 26 s = 5 1- = 0.95 entonces 2

1 = 0.975

como n < 30, entonces t(n – 1, 1 - /2) = t(15, 0.975) = 2.131

Por formula

- 1 = )n

st + x

n

st - xP( )(( 975.0,15)975.0,15

Métodos Estadísticos para la investigación

11

Reemplazando

%95)16

5131.226

16

5131.226 = + - P(

Se obtiene

%9566.2834.23 =] P[

4. Se ha hecho un estudio de las diferencias entre estudiantes universitarios del

primer año que estuvieron en academias y estudiantes que no estuvieron. Para ello se

tomó una muestra aleatoria de 50 estudiantes universitarios que habían asistido a

academias y una muestra aleatoria simple independiente de 60 estudiantes que no lo

habían hecho. Al final del primer semestre se administró a los estudiantes una prueba de

rendimiento en matemática. Los que habían asistido a academias, obtuvieron un puntaje

promedio de 14,5, con una varianza de 4,8; y el puntaje promedio para el grupo que no

había asistido a la academia, fue de 13,75 con una varianza de 6,4. Construya un

intervalo de confianza para la diferencia entre las dos medias poblacionales (use 99% de

confianza).

Solución

ASISTIERON

ACADEMIA

NO ASISTIERON

ACADEMIA

nx1= 50

1x =14.5

s2x1 = 4.8

nx2 = 60

2x =13.75

s2x2 = 6.4

1 - = 0.99 luego 1- 2

= 0.995

Como nx1 + nx2 - 2 > 30 entonces Z (1 - /2) = Z(0.995) = 2.58

Por formula

-1=]n

s+

n

sz + )x-x(_ - _

n

s +

n

sz - )x-xP[(

22

)(

22

)(

2

2

1

1

212121

2

2

1

1

2121

Métodos Estadísticos para la investigación

12

Reemplazando

%9960

4.6

50

8.458.275.135.14

60

4.6

50

8.458.275.135.14

21=]+ + )-( - + - )-P[(

Se obtiene

%9991.141.021

=] - P[

5. Los estudiantes que se matricularon en un curso de Métodos Estadísticos fueron

distribuidas al azar en dos grupos. El grupo A utilizó numerosas técnicas y actividades

para enriquecer el curso. El grupo B estudió mediante el método tradicional de

conferencias. Los puntajes obtenidos en una prueba de rendimiento, hecha al terminar el

curso dieron los siguientes resultados:

Grupo n x s

A 10 80 8

B 12 72 10

Construir el intervalo de confianza del 90% para la diferencia de los puntajes promedios

poblacionales.

Solución

La confianza, 1 - = 0.90 luego 1 - 2

= 0.95

Como nA + nB –2 < 30 entonces t (nA + nB –2,1– /2) = t(20, 0.95) = 1.725

Por formula

-1=]n

s+

n

st+)x-x( -

n

s+

n

st-)x-xP[(

B

2B

A

2A

n(nBABA

B

2B

A

2A

n(nBA BABA )2/1,2)2/1,2

Reemplazando

%9012

100

10

64725.17280

12

100

10

64725.17280 =]++)-( - +-)-P[(

BA

Se obtiene

%9062.1438.1 =] - P[BA

Métodos Estadísticos para la investigación

13

6. Una encuesta para verificar las actitudes de los trabajadores ante el boletín

mensual, se les pidió a 500 trabajadores de una gran empresa que indicaran con que

frecuencia leían el boletín de noticias. De los 500, 375 informaron que leían todas las

ediciones. Construir el intervalo de confianza del 95% para la proporción real de los que

opinan afirmativamente.

Solución

n = 500 p = 500

375= 0.75 q =0.25 1- = 0.95 luego

2

1 = 0.975

Como n > 30 entonces Z(1 - /2) = Z(0.975) = 1.96

Por formula

- 1 =] n

pqZ + p P

n

pqZ - P[p )2/1()2/1(

Reemplazando

%95500

)25.0(75.096.175.0

500

)25.0(75.096.175.0 =] + P - P[

Se obtiene:

%9579.071.0 =] P P[

7. En una muestra aleatoria de 400 adultos y 600 jóvenes que vieron un cierto

programa de televisión, 100 adultos y 300 jóvenes reconocieron que les había gustado.

Determinar los límites de confianza del 99% para la diferencia de proporciones de todos

los adultos y jóvenes que vieron con agrado el programa.

Solución

ADULTOS JÓVENES

nA= 400

aA = 100

pA

=0,25

qA= 0,75

nJ = 600

aJ = 300

pJ=0,50

qJ

= 0,50

Métodos Estadísticos para la investigación

14

1 - = 0.99 luego 1- 2

= 0.995

Como nA+ nJ - 2 > 30 entonces Z (1 - /2) = Z(0.995) = 2.58

Puesto que los tamaños de muestras son muy diferentes, se emplea la varianza

mancomunada así:

n + n

pn + pn = p

JA

JAJA

Reemplazando

4.01000

400

600400

50,0*60025,0*400

+

+ = p

)n

1 +

n

1)(p - (1p = s

JA

)1

+ 1

)(( = s 032.0600400

6.04.0

Por formula

-1=])n

1 +

n

1)(p - (1pZ+)p-p(P-P)

n

1 +

n

1)(p - (1pZ-)p-pP[(

JA

JAJA

JA

JA 2//1(2//1(

Reemplazando

%99)032.0(58.25.025.0)032.0(58.25.025.0 =]+)(P-P-)P[( JA

Se obtiene

%9917.033.0 =] P-P P[ JA

Métodos Estadísticos para la investigación

15

2. SELECCIÓN DEL TAMAÑO DE MUESTRA EN M.A.S

El procedimiento de muestreo, o diseño experimental, como se le llama comúnmente,

influye en la cantidad de información por observación o medición. Este diseño, junto con

el tamaño muestral n, determina la cantidad total de información relevante en la muestra.

Salvo en contadas ocasiones, trataremos la situación de muestreo más sencilla, un

muestreo de una población relativamente grande, y se enfocará la atención del tamaño

de muestra n.

Para ver cómo el tamaño muestral afecta al ancho de un intervalo de confianza,

considérese la desviación estándar de la distribución para cualquier estimador puntual.

Por ejemplo, la desviación estándar de la media muestral x , es:

nx

Nota: si se desea que el ancho de un intervalo de confianza sea pequeño, debe

aumentarse el tamaño de muestra.

Procedimiento para seleccionar el tamaño muestra

Sea el parámetro que se quiere estimar, y sea la desviación estándar del estimador

puntual. Entonces se procede según los pasos siguientes.

Elegir d, la cota para el error de estimación, y un coeficiente de confianza (1 - ),

Resolver la siguiente ecuación para el tamaño de muestra n:

dZ

)2/1(

Nota: Para la mayoría de los estimadores

es una función del tamaño de muestra n.

Propósito: Estimar la media poblacional

Como se recordardará la media muestral x se distribuye normalmente con media y

varianza 2/n, entonces dado un valor z(1-/2), enla distribución normal entre - z(1-/2) y

z(1-/2), se encuentra 1- de los posibles valores de x .

Métodos Estadísticos para la investigación

16

1-

/2 /2

-Z1- /2 Z1- /2

Entonces para tener una “confiabilidad” de 1- debe usarse el coeficiente de

“confiabilidad” de Z1- /2 (que llamaremos sólo z) obtenido en la tabla de distribución

normal estándar o en la función de estadísticas de Excel.

De otro lado si establecemos que el nivel de precisión de nuestra estimación de la media

es d unidades, estaríamos estableciendo el margen de error admisible para la media

muestral respecto a la media poblacional , entonces:

P( x - d) = 1 -

Implica que se tiene una confiabilidad de 1- de que el nivel de precisión se cumpla en la

estimación de la media poblacional a través de la media muestral x .

nzd

2

Entonces,

El tamaño de muestra para poblaciones infinitas es:

2

22

d

zn

Si de otro lado, el muestreo es sobre una población finita, entonces

1

N

nN

n

zd

Entonces, El tamaño de muestra para poblaciones finitas es:

222

22

)1(

zNd

zNn

Ajuste de tamaño de muestra:

Métodos Estadísticos para la investigación

17

Si 10.0N

n entonces n0 =

N

n

n

1

Ejemplo 1.

De una población de 4000 individuos se desea estudiar la media de la presión arterial

sistólica, la cual se distribuye normalmente con = 10, para ello se ha fijado un nivel de

confiabilidad de 95% y el nivel de precisión en 2. ¿Cuál será el tamaño de muestra

adecuado?

Solución:

Como datos del problema tenemos:

Z1- /2= Z0.975 = 1.96

d = 2

= 10

Entonces:

9410)96.1()14000(2

10)96.1(4000

)1( 222

22

222

22

zNd

zNn

Como 10.0N

n, entonces no es necesario usar la corrección n0.

El tamaño de 94 individuos es suficiente.

Ejemplo 2.

Resuelva el mismo problema pero considerando una precisión de d=0.8

Solución:

Tenemos ahora,

52310)96.1()14000(8,0

10)96.1(4000

)1( 222

22

222

22

zNd

zNn

Métodos Estadísticos para la investigación

18

Como 10.0N

n, entonces el tamaño de muestra será:

463

4000

5231

523

10

N

n

nn

Deberá tomarse entonces una muestra de 463 individuos.

Propósito: Estimar la proporción poblacional

El procedimiento es análogo al propósito anterior, debiendo emplearse ahora:

Para poblaciones infinitas

2

2

d

pqzn

Para poblaciones finitas

pqzNd

pqzNn

22

2

)1(

Y si 10.0N

n entonces completar el cálculo con:

N

n

nn

10

Ejemplo:

Se desea estudiar una población de 2000 alumnos referente a la prevalencia de

desnutrición. Se estima p estaría muy cercano a 0,25 y para ello se ha establecido como

nivel de confiabilidad el 95% y el nivel de precisión 0,05 ¡Cuál es el tamaño de muestra

necesario?

Solución:

N = 2000

Z1 - /2 = Z0,975 = 1.96

p = 0,25

Métodos Estadísticos para la investigación

19

q = 1 – p = 1 – 0,25 = 0,75

d = 0,05

Entonces,

252)75,0)(25,0()96,1()12000()05,0(

)75,0)(25,0()96,1(2000

)1( 22

2

22

2

pqzNd

pqzNn

Como 10.0N

n, entonces el tamaño de muestra será:

224

2000

2521

252

10

N

n

nn

El tamaño de muestra necesario es de 253 alumnos.

Métodos Estadísticos para la investigación

20

3. PRUEBAS DE HIPÓTESIS

A continuación definiremos algunos conceptos básicos para la prueba de hipótesis.

Hipótesis

Es una afirmación que esta sujeta a verificación o comprobación; así un educador puede

hacerse la hipótesis de que cierto método de enseñanza mejora el rendimiento de los

alumnos. Hipótesis establecidas en esta forma proporcionan con frecuencia motivo para

realizar una investigación. Por esta razón se le denomina hipótesis de investigación.

Generalmente hay que volver a plantear las hipótesis de investigación convenientemente

de tal forma que se puedan comprobar mediante los métodos estadísticos, así planteadas

las hipótesis reciben el nombre de hipótesis estadística.

Hipótesis nula (Ho)

Son aquellas que están referidas a algún parámetro de la población o de las poblaciones

de estudio. Estas son llamadas hipótesis científicas.

Hipótesis alternativa (Ha)

Junto a la hipótesis nula se debe formular la denominada hipótesis alternativa que es la

que sirve para contrastarla.

Errores de prueba y nivel de significación

Tengamos presente que si bien Ho puede ser cierta, tendremos siempre la probabilidad

no nula de que por efecto del azar, nuestra decisión sea la de rechazar hipótesis; en tal

caso estaremos cometiendo el denominado ERROR DE TIPO I.

De otro lado podría Ho ser falsa y nuevamente el efecto aleatorio conducirnos a la

decisión equivocada de aceptar Ho, en tal caso estaremos cometiendo el ERROR DE

TIPO II. Obviamente, si Ho es cierta y no lo rechazamos o si es falsa y rechazamos,

estaremos decidiendo bien.

Al error de tipo I se le fija una probabilidad de ocurrencia previamente a la prueba, a dicha

probabilidad se le denomina , en ocasiones se le llama P valúe, pero en ambos casos

corresponde al NIVEL DE SIGNIFICACIÓN.

P(ERROR TIPO I) =

Métodos Estadísticos para la investigación

21

Podemos objetivizar la decisión de Ho respecto a la naturaleza de ésta de ser cierta o

falsa.

DECISIÓN NATURALEZA DE Ho SOBRE Ho Cierta Falsa

No rechazar Decisión Error tipo II

correcta (probabilidad ) Rechazar Error tipo I Decisión

(Probabilidad ) correcta

Es deseable que ambas probabilidades fuesen lo menores posibles. Sin embargo, no es

posible minimizar ambas probabilidades a la vez ya que están íntimamente relacionadas

de tal modo que al disminuir una de ellas la otra aumenta. Así si queremos minimizar

inmediatamente aumenta la probabilidad de y viceversa. Generalmente el investigador

fija apriori el error que está dispuesto a tolerar, es decir la probabilidad máxima de

cometer el error de tipo I.

La decisión de una prueba estadística está asociada al nivel de significación:

a) Si P < 0.05 ( = 0.05)

se dice que existe significación en la prueba

b) Si P < 0.01 ( = 0.01)

se dice que existe alta significación en la prueba

Pruebas bilaterales y unilaterales

Cuando tenemos hipótesis alternativa de la forma:

Ho : = o Ho : P = Po

Ha : o Ha : P Po

Al rechazar Ho, optaremos por que el parámetro es diferente del supuesto pudiendo ser

mayor, significativamente o acaso menor, significativamente. En tales casos el nivel de

significación queda partido en /2 en cada lado de la distribución del estadístico o

función de prueba.

Métodos Estadísticos para la investigación

22

Tendremos entonces una prueba bilateral. (dos puntos críticos)

1 -

/2 /2 De otro lado, si la hipótesis se orienta a un solo lado, entonces el nivel de significación también estará en aquel lado y consecuentemente estas pruebas se llaman unilaterales. (un punto crítico)

Ho : = o

Ha : > o

1 -

Ho : = o

Ha : < o

1 -

A las regiones de valores de abscisas comprendidas en la parte sombreada se le llama

REGIÓN DE RECHAZO, y a las no sombreadas se le llama REGIÓN DE ACEPTACIÓN.

Una prueba de contrastación de hipótesis estadística se conduce básicamente según el

siguiente procedimiento.

1. Seleccionar el parámetro de interés 2. Plantear las hipótesis

- Hipótesis nula (Ho) - Hipótesis alternativa (Ha)

3. Establecer el nivel de significación de prueba () 4. Identificar o construir la función de prueba y la ley de probabilidad que sigue dicha

función de prueba. 5. Efectuar el reemplazo numérico en la función de prueba con la información

muestral. 6. Determinar las regiones de aceptación o rechazo en la distribución de la función

de prueba, según se trate de pruebas bilaterales o unilaterales. 7. Tomar una decisión sobre Ho, según la siguiente regla:

a.- Rechazar Ho si el valor de la función de prueba cae en la región de rechazo. En tal caso se concluirá que Ho se rechaza en favor de Ha con una

Métodos Estadísticos para la investigación

23

significación estadística. b.- No rechazar Ho si el valor de la función de prueba cae en la región de

aceptación. En tal caso se concluirá de que la información muestral no brinda suficientes evidencias como para sospechar de que Ho no sea cierta.

8. Establecer la conclusión.

Antes de poder estimar parámetros o realizar la prueba de hipótesis para hacer

conclusiones sobre los parámetros de la población es necesario que la variable en

estudio se ajuste a una distribución normal para que los resultados de la investigación

sean confiables. Por lo tanto la primera prueba de hipótesis a estudiar corresponde a la

PRUEBA DE NORMALIDAD DE DATOS, que nos permite determinar si la variables en

estudio se distribuye normalmente o no.

3.1. PRUEBA DE NORMALIDAD DE DATOS

1. Reconocimiento de una ley de probabilidad con información real.

a. Reconocimiento teórico (distribución de probabilidad)

b. Ajuste empírico de una población real a una teórica.

c. Pruebas de bondad de ajuste

- Prueba Ji-cuadrada

- Prueba de Kolmogorov-Smirnov

d. Construcción de muestras aleatorias

e. Construcción de muestras artificiales con una ley de probabilidad arbitraria. (método

de Monte Carlo).

f. Prueba de aleatoriedad.

2. Transformaciones de variables aleatorias no normales a normales.

Transformación raíz cuadrada:

Se usa cuando se tiene una variable (X) que se aproxima a una

distribución de Poisson, así:

20Xdecir es , X de pequeños valores para 1 + X = Z

X de grandes valores para X = Z

ii

ii

Métodos Estadísticos para la investigación

24

Transformación angular:

Se usa cuando se tiene una variable (X) que se aproxima a una

distribución Binomial, así:

X de pequeños valores para 1 + X arcsen = Z

X de grandes valores para X arcsen = Z

ii

ii

Transformación logarítmica:

Se usa cuando se tiene una variable (X) tiende a crecer

20Xdecir es , X de pequeños valores para 1 + X = Z

X de grandes valores para X = Z

ii

ii

Transformación de Fisher:

Se usa cuando se tiene una variable (X) que se aproxima a una distribución Ji-cuadrada

con n grados de libertad.

i i2Z = 2 X - 2n - 1 para cualesquier valor de X

3. PRUEBA DE BONDAD DE AJUSTE A LA DISTRIBUCIÓN NORMAL

Procedimiento

(1) Formular la hipótesis:

Ho: La información dada se ajusta a una ley de distribución normal

Ha: La información dada no se ajusta a una ley de distribución normal

(2) Fijar el nivel de significancia ()

las más usadas son; = 0,05; 0,01; 0,10

1 - = 0,90; 0,99; 0,90 grados de confianza

(3) Elegir la función pivotal

) (prueba e

)e - f( = U

22

1)-(r

i

2

iio

Métodos Estadísticos para la investigación

25

donde: r = m - k,

m = Nº de clases en la inf. real

n = Nº de parámetros de la ley de prob.

fi = frecuencia absoluta simple observada

ei = frecuencia absoluta simple esperada

ei = n pi ; ei 5

Uo = máx Sn(x) - P(x) (Prueba de Kolmogorov) donde: Sn(x) = Hi frec. rel. acum. observada

P(x) = Fi = P(Xx) frec. acum. Esperada

Tabla de la prueba de Kolmogoroy Smirnov ***

Tamaño de la

Muestra (n)

Nivel de significación correspondiente a D = el valor

máximo de Fo (X) = SN (X)

0.20 0.15 0.10 0.05 0.01

1 2 3 4 5

6 7 8 9

10

11 12 13 14 15

16 17 18 19 20

25 30 35

más de 35

0.900 0.684 0.565 0.494 0.446 0.410 0.381 0.358 0.339 0.322 0.307 0.295 0.284 0.274 0.266 0.258 0.250 0.244 0.237 0.231 0.21 0.19 0.18

n

07.1

0.925 0.726 0.597 0.525 0.474 0.436 0.405 0.381 0.360 0.342 0.326 0.313 0.302 0.292 0.283 0.274 0.266 0.259 0.262 0.246 0.22 0.20 0.19

n

14.1

0.950 0.776 0.642 0.564 0.510 0.470 0.438 0.411 0.388 0.368 0.352 0.338 0.325 0.314 0.304 0.295 0.286 0.278 0.272 0.264 0.24 0.22 0.21

n

22.1

0.975 0.842 0.708 0.624 0.565 0.521 0.486 0.457 0.432 0.410 0.391 0.375 0.361 0.349 0.338 0.328 0.318 0.309 0.301 0.294 0.27 0.24 0.23

n

36.1

0.995 0.929 0.828 0.733 0.669 0.618 0.577 0.543 0.514 0.490 0.468 0.450 0.433 0.418 0.404 0.392 0.381 0.371 0.363 0.358 0.32 0.29 0.27

n

63.1

De S. Siegel, Nonparametric Statistica, McGraw-Hill Book Company, Nueva York, 1958. Se ha adaptado de F. J. Massey, Jr., “the Kolmogorov-Smirnov Test for Goodness of Fit”, J. Amer. Statist. Ass., vol. 46, pág. 70, 1951, con la amable autorización del autor y el editor.

Métodos Estadísticos para la investigación

26

Ej. n = 10. = 0.05 P(U c) = 0.95 c = 0.410 (4) Determinar la región de rechazo y la región de aceptación.

(5) Tomar la decisión.

Si Uo RA entonces aceptamos Ho es decir la información se ajusta a una distribución

normal, si Uo RR entonces rechazamos Ho es decir la información no se ajusta a una

distribución normal.

Antes de realizar cualquier análisis estadístico se deben tener presentes las condiciones

de aplicación del mismo. En casi todos los análisis estadísticos, la asunción de

normalidad es un común denominador. De ahí que comencemos este apartado con la

prueba estadística de Normalidad. Ésta se denomina prueba de Kolmogorov - Smirnov y

se halla en el SPSS en el menú de Análisis, dentro de la opción de Pruebas no

paramétricas y finalmente bajo el nombre abreviado de K-S de una muestra... . El cuadro

de diálogo nos permite seleccionar la variable a analizar y la ley de probabilidad que se

propone como de la población de la que ha sido extraída la muestra.

Es importante notar que a veces las asunciones se refieren a la Normalidad de las

poblaciones que se comparan, por lo que esta prueba de K-S debe repetirse para cada

una de las muestras a comparar.

RA

1 –

RA

f(u)

U U0

Métodos Estadísticos para la investigación

27

Ejemplo:

La tabla siguiente presenta la información de notas de 162 estudiantes en el curso de

estadística durante un año dado. Probar que la siguiente muestra fue extraía de una

población de notas distribuidas en forma normal con = 0,01.

Notas

30-40

40-50

50-60

60-70

70-80

80-90

90-100

N de est.

5

10

28

52

31

26

10

Solución

Ho: Las notas se ajustan a una ley de distribución normal

Ha: Las notas no se ajustan a una ley de distribución normal

= 0.01

Notas x

Estandarizando z

Nº Estudiantes

f

Probabilidad P

Valores Esperados

ei = npi

Ji- Cuadrada (fi-ei)2/ei

30 – 40 -2.70 – -1.99 5 0.0198 3.20

40 – 50 -1.99 – -1.28 10 0.0767 12.42 0.02

50 – 60 -1.28 – -0.57 28 0.1833 29.69 0.10 60 – 70 -0.57 – 0.14 52 0.2706 43.84 1.52 70 – 80 0.14 – 0.84 31 0.2468 39.99 2.02

80 – 90 0.84 – 1.55 26 0.1391 22.53 0.53

90 – 100 1.55 – 2.26 10 0.0484 7.84 0.60

TOTAL 162 U0 = 4.79

Notas x

Estandarizando Z

Nº Estudiante

f

FrecuenciaRelativas

h

Probabilidad p

Frecuencias Relativas

Acumulada Sn(x)= Hi

Probabilidad

Acumulada P(x)

Kolmogorov

MaxH-P

30 – 40 -2.70 – -1.99 5 0.0309 0.0198 0.0309 0.0198 0.0111 40 – 50 -1.99 – -1.28 10 0.0617 0.0767 0.0926 0.0964 0.0038 50 – 60 -1.28 – -0.57 28 0.1728 0.1833 0.2654 0.2797 0.0143

60 – 70 -0.57 – 0.14 52 0.3210 0.2706 0.5864 0.5504 0.0360

70 – 80 0.14 – 0.84 31 0.1914 0.2468 0.7778 0.7972 0.0194 80 – 90 0.84 – 1.55 26 0.1605 0.1391 0.9383 0.9363 0.0020

90 – 100 1.55 – 2.26 10 0.0617 0.0484 1.0000 0.9847 0.0153

TOTAL 162 1 U0 = 0.0360

x = 68.09 s = 14.11

70.211.14

09.68301

Z

0198.00035.00233.070.299.199.170.21 ] ZP[] ZP[=] Z[p

15 15.68

Métodos Estadísticos para la investigación

28

Prueba X²:

345.112

) 0.99 , 3 ( =

e

)e - f( = U

2

1)-(r

i

2

iio

Como r = m – k = 6 – 2 = 4

Donde:

m: Nº de filas ajustadas

k: Nº parámetros de la distribución normal

Uo = 4.490 Ut = 11.345

Decisión:

Como Uo RA aceptamos Ho la información se ajusta a la distribución normal.

Prueba de Kolmogorov

Uo = máx Sn(x) - P(x) = 0.0342

= 0.01

n = 162

U = 0,0342

Ut = 128.0162

63.163.1

n, obtenido de la tabla de Kolmogorov

RA

1 – = 4,490

= 0,01

f(u)

U Ut = 11,345

RR

U0 = 4,490

RA

1 – = 0,99

= 0,01

f(u)

U Ut = 0,128

RR

U0 = 0,0342

Métodos Estadísticos para la investigación

29

Decisión:

Como Uo RA aceptamos Ho

Conclusión:

Se concluye que la información se ajusta a la distribución normal con el 1% de

significación de prueba.

3.2. PRUEBA DE HIPÓTESIS REFERIDA A LA MEDIA POBLACIONAL

Esta prueba se aplica aún a poblaciones que no se alejan demasiado de las

características de una población normal.

Las hipótesis referentes a este parámetro pueden ser:

Ho: = o

Ha: o Prueba bilateral

Ho: = o

Ha: > o Prueba unilateral

Ho: = o

Ha: < o Prueba unilateral

Dicha prueba se efectúa mediante la siguiente función de prueba:

a) Si la desviación estándar poblacional no es conocida o n<30

)1,1(

n

oo t

ns/

- x = t

b) Si la desviación estándar poblacional es conocida o n30

n n/

- x = z (0,1)

oo

Métodos Estadísticos para la investigación

30

Ejemplo 1:

El señor Martínez afirma que su programa de entrenamiento en ventas de seguro de vida

le permite a su compañía vender más pólizas que las compañías "promedio". El promedio

mensual de ventas de todos los agentes de la compañía es de $300. A una muestra de

agentes que han recibido el programa de entrenamiento se le encuentra las siguientes

ventas en dólares: 300, 270, 360, 390, 309, 405, 360, 420, 375, 330. Si usted fuera el

supervisor de estos agentes, adoptaría para los restantes el programa de entrenamiento

propuesto por el señor Martínez. Emplee 5% de nivel de significación.

Solución

= 300, n = 10, x = 351.9, s = 48.64 -1 = 0.95

como n 30, entonces t(n – 1, 1-) = t(9,0.95) = 1.895

Ho: 300

Ha: 300

= 0.05

f.p. 37.3

10

64.48

3009.3510

0

n

s

xt

Decisión: Como t0 pertenece a la región de rechazo entonces rechazamos la hipótesis

nula a favor de la hipótesis alternativa

Conclusión: El programa de entrenamiento de ventas de seguro de vida le permite a su

compañía vender más pólizas de seguro que la compañía promedio, por lo cual se

adoptará para el resto de los agentes el programa propuesto por el señor Martinez.

Ejemplo 2:

Los sistemas de escape de emergencia para tripulantes de aeronaves son impulsados

por un combustible sólido. Una de las características importantes de este producto es la

RA

1 - = 0,95

RR

= 0,05

tt = 1,812

t0 = 3,37

Métodos Estadísticos para la investigación

31

rapidez de combustión. Las especificaciones requieren que la rapidez promedio de

combustión sea 50 cm/s. Se sabe que la desviación estándar de esta rapidéz es 2 cm/s.

El experimentador decide especificar una probabilidad para el error tipo I del 5%. Se

selecciona una muestra aleatoria de 25 y obtiene una rapidez promedio muestral de

combustión de 51,3 cm/s. ¿A qué conclusión debe llegar?

Solución:

= 50, n = 25, x = 51.3, =2 = 0.05

como n > 30, entonces Z(1 - /2) = Z(0.975) = 1.96

Ho: = 50

Ha: 50

= 0.05

f.p. 25.3

25

2

503.51

n

- x = Z

oo

96.1)975,0( Z= Z t

Decisión: Como Z o RR Rechazamos la Ho , a favor de Ha

Conclusión: Por lo tanto no se cumple con las especificaciones la rapidez promedio de

combustión difiere de 50 cm/s. Usando 5% de significación de prueba.

RR

2 = 0,025

Zt = -1,96

RA

1 - = 0,95

RR

2 = 0,025

Zt =1,96

Z0 =3.25

Métodos Estadísticos para la investigación

32

3.3. PRUEBA DE HIPÓTESIS REFERIDA A LA VARIANZA POBLACIONAL

Algunas veces se necesitan pruebas sobre la varianza o la desviación estándar de una

población.

Procedimiento:

Supóngase que se desea probar la hipótesis de que la varianza de una población normal

2 es igual a un valor específico, por ejemplo, 2

o. Sea X1, X2, ..., Xn una muestra aleatoria

de n observaciones tomadas de esta población.

Las hipótesis referentes a este parámetro pueden ser:

Ho: 2 = 2

o

Ha: 2 2

o Prueba bilateral

Ho: 2 = 2

o

Ha: 2 > 2

o Prueba unilateral

Ho: 2 = 2

o

Ha: 2 < 2

o Prueba unilateral

Se utiliza el estadístico de prueba

2

22 )1(

o

o

SnX

donde S2 es la varianza muestral. Ahora si Ho: 2 = 2

o es verdadera, entonces el

estadístico de prueba X2o sigue una distribución ji-cuadrada con n-1 grados de libertad.

Por consiguiente, se calcula el valor de la estadística de prueba X2o, y la hipótesis Ho:

2

= 2º , debe rechazarse si:

2

2/1,1

2

2

2/,1

2

no

no

sio

Métodos Estadísticos para la investigación

33

donde X2n-1,/2 y X2

n-1,1-/2 son los puntos que corresponden a los porcentajes 100/2

inferior y superior de la distribución ji-cuadrada con n-1 grados de libertad,

respectivamente.

El mismo estadístico se utiliza para hipótesis alternativas unilaterales, Para hipótesis

unilateral: Ho: 2 = 2

o

Ha: 2 > 2

o

Se rechaza si: X2o > X2

(n-1,1-)

Para la otra hipótesis unilateral: Ho: 2 = 2

o

Ha: 2 < 2

o

Se rechaza si: X2o < X2

n-1,

RA

1 –

2

)2/,1( nX

RR

/2 RR

/2

2

)2/1,1( nX

RA

1 – RR

2

)1,1( nX

RA

1 –

RR

2

),1( nX

Métodos Estadísticos para la investigación

34

PROCEDIMIENTO PARA MUESTAS GRANDES

Las hipótesis planteadas son idénticas a las mencionadas anteriormente lo que se

modifica es la función de prueba, que cuando el tamaño de muestra es mayor que 30 se

utiliza la distribución normal.

El estadístico de prueba es:

n

sZ

o

oo

2

El gráfico utilizado sería acampanado.

Ejemplo:

Considérese una máquina de llenado de botellas. Al tomar una muestra aleatoria de 20

botellas se obtiene una varianza muestral para el volumen de llenado de 0,0153 (onzas

de fluido)2. Si la varianza del volumen de llenado es mayor que 0,01 (onzas de fluido)2,

entonces existe una proporción inaceptable de botellas que serán llenadas con una

cantidad menor de líquido. ¿Existe evidencia en los datos muestrales que sugiera que el

fabricante tiene un problema con el llenado de botellas? Utilice 5% de significación de

prueba.

Solución:

2 = 0.01, n = 20, s2 = 0.0153 = 0.05

como n < 30, entonces 2

)1,1( nX = 1.302

)95.0,19( X

Ho: 2 = 0.01

Ha: 2 > 0.01

= 0.05

Métodos Estadísticos para la investigación

35

f.p. 07.2901.0

)0153.0)(19()1(2

22

o

o

SnX

1.302

)95.0,19( X

Decisión: Como 07.292 oX RA aceptamos Ho

Conclusión: El fabricante no tiene problemas con el llenado de botellas, pues la varianza

es igual a 0.01.

3.4. PRUEBA DE HIPÓTESIS REFERIDA A LA PROPORCIÓN

POBLACIONAL

La hipótesis se refiere al parámetro P, la proporción de individuos de la población con una

determinada característica.

Las hipótesis referentes a este parámetro pueden ser:

Ho: P = Po

Ha: P Po Prueba bilateral

Ho: P = Po

Ha: P > Po Prueba unilateral

Ho: P = Po

Ha: P < Po Prueba unilateral

La función de prueba para valores de n 30 es:

n )/np-(1p

p - P = z (0,1)

oo

oo

RA

1 – = 0.95 RR

= 0.05

1.302 tX

07.292 oX

Métodos Estadísticos para la investigación

36

La función de prueba para valores de n < 30 es:

t )/np-(1p

p - P = t 1)-(n

oo

oo

Ejemplo 1:

El alcalde de una ciudad cree que más del 60% de los residentes de un suburbio

adyacente está a favor de anexarse a la ciudad. En una muestra aleatoria de 120 adultos,

75 dijeron que estaban a favor. ¿Proporcionan estos datos evidencia suficiente como

para apoyar la opinión del alcalde?

Solución

P = 0.60, n = 120, m = 75, 625.0120

75 p , = 0.05

como n > 30, entonces 645.1)95,0()1( Z Z= Z t

Ho: 60.0 P

Ha: 60.0 P

= 0.05

f.p. 56.0

120

)4.0(6.0

6.0625.00

)/np-(1p

p - P = Z

oo

o

Decisión: Como Z o RA aceptamos Ho

Conclusión: Los datos no proporcionan suficiente evidencia como para aceptar la opinión

del alcalde. Usando un 5% de significación de prueba.

RA

1 - = 0,95

RR

= 0,05

Zt = 1,645

Z0 = 0,56

645.1)95,0( Z= Z t

Métodos Estadísticos para la investigación

37

Ejemplo 2:

Un fabricante de semiconductores produce controladores que se emplean en

aplicaciones de motores automovilísticos. El cliente requiere que la fracción de

controladores defectuosos en uno de los pasos de manufactura críticos no sea mayor que

0,05, y que el fabricante demuestre esta característica del proceso de fabricación con

este nivel de calidad, utilizando = 0,05. El fabricante de semiconductores toma una

muestra aleatoria de 200 dispositivos y encuentra que 4 de ellos son defectuosos. ¿El

fabricante puede demostrar al cliente la calidad del proceso?

Solución

P = 0.05, n = 200, m = 4, 02.0200

4 p , = 0.05

como n > 30, entonces 645.1)95,0()1( Z Z= Z t

Ho: 05.0 P

Ha: 05.0 P

= 0.05

f.p. 94.1

200

)95.0(05.0

05.002.00

)/nP-(1P

P - p = Z

oo

o

Decisión: Como Z o RR rechazamos Ho , a favor de la Ha

Conclusión: El fabricante puede demostrar al cliente la calidad del proceso. Usando un

5% de significación de prueba.

RA

1 - = 0,95

RR

= 0,05

Zt = -1,645

Z0 = 3.03

645.1)95,0( Z= Z t

Métodos Estadísticos para la investigación

38

3.5. PRUEBA DE HIPÓTESIS REFERIDA A DOS VARIANCIAS

POBLACIONALES

La prueba de comparación de muestras, requiere que las variancias de las dos

poblaciones muestreadas sean iguales. En esta sección describiremos una prueba para

la hipótesis nula 21 = 2

2 , que se aplica a muestras aleatorias independientes obtenidas

de dos poblaciones normales; debe utilizarse con mucho cuidado por ser muy sensible a

las desviaciones de tal suposición

Las hipótesis referentes a este parámetro pueden ser:

Ho: 2

1 = 22

Ha: 2

1 22 Prueba bilateral

Ho: 2

1 = 22

Ha: 2

1 > 22 Prueba unilateral

Ho: 2

1 = 22

Ha: 2

1 < 22 Prueba unilateral

.Si las muestras aleatorias independientes de tamaño n1 y n2, se extraen de poblaciones

normales que tiene la misma variancia, para la prueba de igualdad de variancias se utiliza

el siguiente estadístico.

2

2

2

1

s

sF

que es un valor de una variable aleatoria que tiene la distribución F con n1 - 1 y n2 – 1

grados de libertad.

Obs. F1 - (v1,v2) =),(F

1

12 vv

Regiones críticas para probar 2

2

2

1

Métodos Estadísticos para la investigación

39

Hipótesis alterna Estadístico de prueba Rechaza la hipótesis nula si:

21 < 2

2 2

2

2

1

s

sF

F < F(n1 – 1, n2 – 1)

21 > 2

2 2

2

2

1

s

sF

F > F1-(n1 – 1, n2 – 1)

21 2

2 2

2

m

M

s

sF

F < F/2(nM – 1, nm – 1) ó

F > F1-/2(nM – 1, nm – 1)

Donde: s2M : la mayor de las dos variancias muestrales,

s2m : la más pequeña de las variancias.

Para hipótesis unilateral: Ho: 2

2

2

1

Ha: 2

2

2

1

El mismo estadístico se utiliza para hipótesis alternativas unilaterales, Para hipótesis

unilateral:

Ho: 2

2

2

1

Ha: 2

2

2

1

Para la otra hipótesis unilateral:

Ho: 2

2

2

1

Ha: 2

2

2

1

RA

1 –

)1,1(2/ mnMnF

RR

/2 RR

/2

)1,1(2/1 mnMnF

RA

1 – RR

)12,11(1 nnF

Métodos Estadísticos para la investigación

40

PROCEDIMIENTO PARA MUESTAS GRANDES

Las hipótesis planteadas son idénticas a las mencionadas anteriormente lo que se

modifica es la función de prueba, que cuando el tamaño de muestra es mayor que 30, se

utiliza la distribución normal.

El estadístico de prueba es:

21

21

2

1

2

1

nns

ssZ

p

o

2

)1()1(

:

21

2

22

2

112

nn

snsns

donde

p

Ejemplo 1:

Se requiere determinar si existe menos variabilidad en el plateado realizado por la

compañía 1 que el efectuado por la compañía 2. Si las muestras aleatorias

independientes de tamaño 12 del trabajo desempeñado por las compañías producen

s1=0,035 mil y s2=0,062 mil, pruébese la hipótesis nula de que 21 = 2

2 contra la hipótesis

alterna de que 21 < 2

2 con un nivel de significancia de 0,05.

Solución:

n1 = n2 = 12, s1 = 0.035, s2 = 0.062, = 0.05

como n1 + n2 < 30, entonces 355.0)11,11()1,1( 05,021 FnnF = F t

RA

1 –

RR

)12,11(1 nnF

Métodos Estadísticos para la investigación

41

Ho: 2

2

2

1

Ha: 2

2

2

1

= 0.05

f.p. 319.0)062.0(

)035.0(2

2

2

2

2

1 s

sF

Decisión: Como 0F RA se acepta Ho

Conclusión: La variabilidad de plateado de la compañía 1 es menor que de la compañía

2. Usando 5% de significación de prueba.

Ejemplo 2:

Las siguientes muestras aleatorias son mediciones de la capacidad de producción de

calor (en millones de calorías por tonelada (de especímenes de carbón de dos minas:

Mina 1: 8,260, 8,130, 8,350, 8,070, 8,340

Mina 2: 7,950, 7,890, 7,900, 8,140, 7,920, 7,840,

Utilícese un nivel de significancia de 0,02 para probar si es razonable suponer que las

variancias de las poblaciones muestreadas son iguales.

Solución:

n1 = 5, n2 = 6, s1 = 0.1275, s2 = 0.1045, = 0.02

como n1 + n2 < 30, entonces 39.11)5,4(06.0)5,4()1,1( 99.001.021 FFnnF = F t

RA

1 – = 0.95

RR

= 0.05

355.0tF

319.00 F

Métodos Estadísticos para la investigación

42

Ho: 2

2

2

1

Ha: 2

2

2

1

= 0.05

f.p. 49.1)1045.0(

)1275.0(2

2

2

2

2

1 s

sF

49.1oF

Decisión: Como 0F RA se acepta Ho

Conclusión: La variabilidad de ambas poblaciones es igual. Usando 2% de significación

de prueba.

3.6. PRUEBA DE HIPÓTESIS REFERIDA A DOS MEDIAS POBLACIONALES

Cuando la comparación de dos poblaciones es con respecto a sus medias la hipótesis

natural es que ambas tienen igual promedio, o en otras palabras que la diferencia de

ambos promedios es nula o difieren en alguna cantidad específica.

Las hipótesis referentes a este parámetro pueden ser:

Ho: 1 = 2

Ha: 1 2 Prueba bilateral

Ho: 1 = 2

Ha: 1 > 2 Prueba unilateral

Ho: 1 = 2

Ha: 1 < 3 Prueba unilateral

RA

1 –

06.02/ F

RR

/2 RR

/2

39.112/1 F

Métodos Estadísticos para la investigación

43

Pueden presentarse varias situaciones dependiendo de como son sus varianzas:

Con varianzas conocidas:

La función de prueba es:

n

n +

n

) - ( - )x - x( = z (0,1)

22o

2

2

1

1

2121

Con varianzas desconocidas y diferentes:

La función de prueba es:

t

n

s +

n

s

) - ( - )x - x( = t 2) - n + n(

22o 21

2

2

1

1

2121

como n1 + n2 - 2 30 entonces esta función de prueba sigue una distribución normal

estándar.

Con varianzas desconocidas y aproximadamente iguales, la función de prueba es:

2 - n + n

s1) - (n + s1) - (n = s

a.mancomunad varianza la es s aquÍ

t

)n

1 +

n

1(s

) - ( - )x - x( = t

222

2

2) - n + n(

2

o

21

21

21

2121

21

Al igual que en el caso anterior, si n1 + n2 - 2 30 entonces la función de prueba sigue

una distribución normal estándar.

Ejemplo

Una compañía desea comparar las expectativas salariales anuales de su personal de

ventas femenino y masculino, según un nuevo plan de compensaciones venta-más-

comisión. Se pidió a n1 = 40 vendedoras y n2 = 40 vendedores, muestreados al azar,

Métodos Estadísticos para la investigación

44

predijeron sus ingresos anuales bajo el nuevo plan. Las medias y desviaciones

muestrales eran:

1x = $ 31 083 2x = $ 29 745

s1 = $ 2 312 s2 = $ 2 569

¿Proporcionan estos datos evidencia que indique una diferencia en el promedio del

ingreso anual esperado tanto entre los vendedores como las vendedoras? Haga la

prueba con =0,10.

Solución:

Ho: 21 5.59725522 - n + n

s1) - (n + s1) - (n = s

yx

2y

2x2

Ha: 21

= 0.10

f.p. 45.2

40

1

40

15.597255252

02974531083

11

21

2

+

n +

ns

) - ( - )y - x( = Z

xx

yx

o

645.1)95,0( Z= Z t

Decisión: Como Z o RR no existe suficiente evidencia como para aceptar la

hipótesis nula, por consiguiente aceptamos la Ha.

Conclusión: Los datos proporcionan suficiente evidencia como para indicar una diferencia

en el promedio del ingreso anual esperado tanto entre los vendedores usando un 10% de

significación de prueba.

RR

2 = 0,05

Zt = -1,645

RA

1 - = 0,90 RR

2 = 0,05

Zt =1,645

Z0 = 2,46

Métodos Estadísticos para la investigación

45

3.7. PRUEBA DE HIPÓTESIS REFERIDA A DOS PROPORCIONES

POBLACIONALES

Cuando se desea comparar dos poblaciones cualitativas

Las hipótesis referentes a este parámetro pueden ser:

Ho: P1 = P2

Ha: P1 P2 Prueba bilateral

Ho: P1 = P2

Ha: P1 > P2 Prueba unilateral

Ho: P1 = P2

Ha: P1 < P3 Prueba unilateral

La función de prueba es:

n + n

pn + pn = p

:amancomunad proporción la es p AquÍ

n

)n

1 +

n

1)(p - (1p

)P - (P - )p - (p =z (0,1)

21

2211

21

2121

Ejemplo 1:

Un sociólogo cree que la proporción de hombres que pertenecen a un grupo

socioeconómico determinado (grupo A) y que ven regularmente lucha en TV. supera

mucho a un segundo grupo de hombres (grupo B) que también ven lucha. Muestras

aleatorias simples de los dos grupos arrojaron los siguientes resultados.

Tamaño de Número de hombres que ven Grupo la muestra regularmente lucha en TV A nA = 150 98

B nB = 200 80

¿proporcionan estos datos evidencia suficiente como para apoyar la tesis del sociólogo?

use = 0,05

Métodos Estadísticos para la investigación

46

Solución:

51.0350

8098

p

Ho: BA P P

Ha: BA P P

= 0.05

f.p. 63.4

200

1

150

1)49.0(51.0

0)4.065.0(0

+

= Z

645.1)95.0( Z= Z t

Decisión: Como Z o RR rechazamos Ho en favor Ha

Conclusión: Los datos proporcionan suficiente evidencia como para apoyar la opinión del

sociólogo con un 5% de significación de prueba.

RA

1 - = 0,95 RR

2 = 0,05

Zt =1,645

Z0 = 4,63

Métodos Estadísticos para la investigación

47

REFERENCIAS

1. Downie, N, Heath, R. 1986. Métodos Estadísticos Aplicados. Quinta edición.

México: Editorial Harla.

2. Ferran, M. 2001. SPSS Análisis Estadístico. España: Editorial Mc Graw–Hill /

Interamericana.

3. Hernandez R, Fernandez C. Y Baptista P. 1996. Metodología de la Investigación.

Colombia: Editorial Mc Graw-Hill.

4. Martinez, Ciro. 1995. Estadística. Santa Fe de Bogotá: Editorial Presencia.

5. Mendenhall W, Sincich T. 1997. Probabilidad y estadística para ingeniería y

ciencias. Cuarta edición. México: Editorial Prentice-Hall hispanoamericana, S.A.

6. Meza de Castillo E. 1994. Probabilidad. Lima: CONCYTEC.

7. Miller F, Johnson. 1992. Probabilidad y Estadística para Ingenieros. Cuarta

edición. México: Editorial Prince Hall.

8. Mitacc Meza M. 1994. Tópicos de Estadística y Probabilidad. Lima: Editorial San

Marcos.

9. Montgomery D, Runger G. 1996. Probabilidad y Estadística aplicadas a la

Ingeniería. México: Mc Graw-Hill.

10. Montgomery D. 2004. Diseño y Análisis de Experimentos. Segunda edición.

México: Editorial Limusa S.A.

11. Morris H. 1988. Probabilidad y Estadística. Estados Unidos: Editorial ADDISON-

WESLEY Iberoamericana.

12. Moya R, Saravia A. 1998. Probabilidad e Inferencia Estadística. Segunda edición.

Lima: Editorial San Marcos.

13. Sierra Bravo R. 1994. Análisis Estadístico Multivariado, teoría y ejercicios.

España: Editorial Paraninfo, S.A.

14. Wonnacott y Wonnacott. 1991. Estadística Básica Practica. México: Editorial

Limusa