2.estadistica

86
DR. JORGE ACUÑA A. 1 INGENIERIA INDUSTRIAL INGENIERIA INDUSTRIAL CONTROL DE CALIDAD I CONTROL DE CALIDAD I 2. ESTADISTICA 2. ESTADISTICA

Upload: de-fieston

Post on 11-Jun-2015

2.234 views

Category:

Education


0 download

TRANSCRIPT

Page 1: 2.estadistica

DR. JORGE ACUÑA A.

1

INGENIERIA INDUSTRIALINGENIERIA INDUSTRIAL

CONTROL DE CALIDAD ICONTROL DE CALIDAD I

2. ESTADISTICA2. ESTADISTICA

Page 2: 2.estadistica

Muestras correctamente

seleccionadas permiten inferir

sobre la situación real de una

característica en estudio.

Aplicación de la estadística al

control de procesos y de materiales

es solamente un arma para la

toma de decisiones y no la solución

a los problemas existentes.

ING. JORGE ACUÑA A., PhD., PROFESOR

2

Page 3: 2.estadistica

Diseño de procedimientos eficientes que suministren datos confiables para su posterior análisis.

Planear la recolección de datos indicando entre otros aspectos tiempo (¿cuándo?, lugar (¿dónde?), responsabilidades (¿quién?), formatos y procedimientos (¿cómo?).

El registro y análisis de la información proveniente de muestras representativas tomadas de pruebas físicas químicas y servicioscon el fin de verificar su estado.

ING. JORGE ACUÑA A., PhD., PROFESOR

3

Page 4: 2.estadistica

Datos deben ser veraces y reflejar las condiciones del proceso, datos erróneos generan conclusiones erróneas.

El analista debe tener plena confianza en los datos para que el estudio sea válido.

Mínima desconfianza en los datos o en su procedencia obligan al analista a descartarlos.

Recolección de datos debe ser cuidadosamente planeada y programada asignado los recursos que sean necesarios para garantizar excelente calidad de datos.

ING. JORGE ACUÑA A., PhD., PROFESOR

4

Page 5: 2.estadistica

Acciones correctivas y preventivas, con las que se procurará reducir y si es posible eliminar los problemas.

Análisis y aproximaciones de los datos a distribuciones de probabilidad es necesario agruparlos de tal manera que se puedan visualizar comportamientos y tendencias históricas de los procesos que ayuden a interpretar los aspectos que pueden estar causando descontrol y por ende bajos niveles de calidad.

ING. JORGE ACUÑA A., PhD., PROFESOR

5

Page 6: 2.estadistica

Visualizar la posible distribución de datos

Cada dato pierde su identidad.

Distribuciones estadísticas teóricas o

empíricas para inferir hacia el problema.

Distribuciones de frecuencia de datos no

agrupados presentan una distribución

que es muy difícil de aproximar.

Cifras significativas de los datos

Selección de un número de clases que

refleje una adecuada distribución. ING. JORGE ACUÑA A., PhD., PROFESOR

6

Page 7: 2.estadistica

Recolectar los datos (xi) de acuerdo con el tamaño de muestra previamente calculado.

Ordenar los datos de menor a mayor.

Calcular el rango:

R = ximáx - ximín

Fijar el número de clases (k),

Calcular el intervalo de clase (i), así:

i = R/k

El valor de i debe ser redondeado siempre hacia arriba y a la misma cantidad de decimales que tienen los datos.

ING. JORGE ACUÑA A., PhD., PROFESOR

7

Page 8: 2.estadistica

Calcular el rango propuesto (Rp)

Rp = ir * k

Calcular la diferencia (d)

d = Rp – R

Este valor es un número cuya última cifra significativa debe ser impar. Si no lo es, se debe devolver al paso 5 y hacer el cálculo con otro número de clases, hasta que se cumpla la condición.

Calcular la mitad de la diferencia (md)

md = d/2

ING. JORGE ACUÑA A., PhD., PROFESOR

8

Page 9: 2.estadistica

Fijar los límites reales de clase (Li, Ls), usando el siguiente procedimiento:

a. Tomar el valor del dato menor y restarle el valor de md; el valor obtenido es el primer Li.

Li1 = ximín – md

b. Sumar i al valor de Li1, para obtener el primer Ls.

Ls1 = Li1 + i

Lsk = ximáx + md

donde Lsk = último límite real superior.

ING. JORGE ACUÑA A., PhD., PROFESOR

9

Page 10: 2.estadistica

Completar el cuadro de

frecuencias de datos agrupados.

Construir el histograma para

observar la distribución del

conjunto de datos.

ING. JORGE ACUÑA A., PhD., PROFESOR

10

Page 11: 2.estadistica

Se toman doce grupos de cinco unidades de una máquina llenadora de latas de pasta de tomate y se pesan, originando los siguientes datos:

Construir una distribución de frecuencias de datos agrupados.

ING. JORGE ACUÑA A., PhD., PROFESOR

11

Page 12: 2.estadistica

ING. JORGE ACUÑA A., PhD., PROFESOR

12

HOJA DE DATOS - DISTRIBUCION DE FRECUENCIAS

––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

Artículo: Pasta de tomate Código: XY-987

Característica: Peso Especificación: 20,0 2,5 decigramos

Operación: Llenado Máquina: Llenadora n=60

Operario: M. Matamoros Inspector: M. Coto Turno: 1

Fecha:02-12-84 Hora de inicio: 8 am Hoja: 1de 1

–––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

# 1 2 3 4 5 6 7 8 9 10 11 12

–––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

1 22,0 23,0 20,0 21,5 19,0 21,5 22,5 25,0 21,5 24,5 22,5 23,5

2 20,5 19,0 19,0 19,0 21,5 24,0 20,0 20,5 23,0 24,0 22,5 20,0

3 20,0 21,5 19,5 21,0 22,5 19,5 21,0 21,5 22,5 23,5 20,5 20,5

4 21,0 21,0 20,0 20,0 22,5 22,0 22,5 21,5 23,5 22,0 22,0 22,5

5 22,5 21,5 22,5 22,0 18,5 22,0 22,0 22,5 21,0 22,0 19,5 23,0

––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––-

Page 13: 2.estadistica

R = ximáx - ximín

R = 25,0 – 18,5 = 6,5

k = 1 + 3,3 log n

k = 1 + 3,3 log 60

k 7

R 6,5

i = —— = ——— = 0,923 = 1,0

k 7

Rp = ir * k = 7 * 1,0 = 7,0

ING. JORGE ACUÑA A., PhD., PROFESOR

13

Page 14: 2.estadistica

d

md = d/2 = ——= 0,25

2

Li1 = ximín - md = 18,5 - 0,25 = 18,25

Ls1 = Li1 + i = 18,25 + 1,0 = 19,25

Li2 = Ls1 = 19,25

Ls2 = Li2 + i = 19,25 + 1,0 = 20,25

ING. JORGE ACUÑA A., PhD., PROFESOR

14

Page 15: 2.estadistica

ING. JORGE ACUÑA A., PhD., PROFESOR

15

––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

HOJA DE DATOS - DISTRIBUCION DE FRECUENCIAS

–––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

Artículo: Pasta de tomate Código: XY-987

Característica: Peso Especificación: 20,0 2,5 decigramos

Operación: Llenado Máquina: Llenadora n=60

Operario: M. Matamoros Inspector: M. Coto Turno: 1

Fecha:02-12-84 Hora de inicio: 8 am Hoja: 1 de 1

––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

Li Ls CONTEO nk xk Nk fk Fk

––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

18,25 19,25 ||||| 5 18,75 5 8,33 8,33

19,25 20,25 ||||||||| 9 19,75 14 15,00 23,33

20,25 21,25 |||||||| | 9 20,75 23 15,00 38,33

21,25 22,25 |||||||||||||||| 16 21,75 39 26,67 65,00

22,25 23,25 |||||||||||||| 14 22,75 53 23,33 88,33

23,25 24,25 ||||| 5 23,75 58 8,33 96,67

24,25 25,25 || 2 24,75 60 3,33 100

Page 16: 2.estadistica

ING. JORGE ACUÑA A., PhD., PROFESOR

16

in

dn

Ax

K

k

k

*

*1

2

11

2 **

*n

dn

n

dn

is

K

k

k

K

k

k

CV=s/x

PROMEDIO

DESVIACION

ESTANDAR

COEFICIENTE DE VARIACION:

Page 17: 2.estadistica

Calcular la media aritmética y la desviación

estándar

_ A= 21,75 para d = 0

x = 21,75 + (-12/60) * 1,0 = 21,55 decigramos

ING. JORGE ACUÑA A., PhD., PROFESOR

17

decigramoss 525,160

12

60

142*0,1

2

––––––––––––––––––––––––––––––––––––––––––––––

xk nk d nk*d nk*d2

–––––––––––––––––––––––––––––––––––––––––––––

18,75 5 –3 –15 45

19,75 9 –2 –18 36

20,75 9 –1 – 9 9

21,75 16 0 0 0

22,75 14 1 14 14

23,75 5 2 10 20

24,75 2 3 6 18

––––––––––––––––––––––––––––––––––––––––––––––––––

TOTAL nk*d= –12 nk*d2= 142

Page 18: 2.estadistica

Esta distribución conocida por su forma de campana (campana de Gauss) es una de las más importantes en teoría estadística.

Esta distribución tiene propiedades importantes, tales como: › Está definida de - a + . › Es simétrica lo que implica que la probabilidad de

ocurrencia de un valor x menor que la media es igual a la de un valor x mayor que la media.

› El área bajo la curva es 1. › La moda, media y mediana son iguales. › Si se conoce la media ( ) y la varianza ( 2) se

determina la curva

ING. JORGE ACUÑA A., PhD., PROFESOR

18

Page 19: 2.estadistica

La distribución muestral es normal aunque la poblacional no lo sea. Tiene promedio y desviación estándar igual a /√n

Puede estandarizarse usando el estadístico Z = (x - )/ .

Las funciones densidad y acumulada son para - x + :

ING. JORGE ACUÑA A., PhD., PROFESOR

19

2

2

1

2

1)(

x

exf

b

a

dxxfxF )()(

Page 20: 2.estadistica

Una fábrica especifica que el peso de los tarros de frutas que produce debe obedecer a un peso medio de 2,00 kg con una desviación estándar de 0,05 kg. ¿Cuál es la probabilidad de que un determinado tarro pese entre 1,90 y 2,06 kg, sabiendo que esta variable se distribuye normalmente?

ING. JORGE ACUÑA A., PhD., PROFESOR

20

Page 21: 2.estadistica

05.0

29.1

05.0

206.206.19.1 NNxPA

A = N(1,2) – N(–2,0) A = 0,8849 – 0,0228 A = 0,8621 La probabilidad de que un determinado

tarro pese entre 1,90 y 2,06 kg es 0,8621.

ING. JORGE ACUÑA A., PhD., PROFESOR

21

1.9 2.06

A

Page 22: 2.estadistica

"Si se toman m-muestras aleatorias de tamaño n de una población cuya distribución puede o no ser normal y que tiene media µ y desviación estándar , la distribución de muestreo correspondiente a los promedios de las m muestras será aproximadamente normal, con media µ igual a µ y desviación muestral igual a / n."

ING. JORGE ACUÑA A., PhD., PROFESOR

22

x

x

Page 23: 2.estadistica

Un proceso de llenado de bolsas de

cacao en polvo origina un peso

medio de 50,10 g y una desviación

estándar de 5,25 g. Si se toma una

muestra de 40 bolsas, ¿cuál es la

probabilidad de que su media se

encuentre entre 48,10 y 50,90 g?

ING. JORGE ACUÑA A., PhD., PROFESOR

23

Page 24: 2.estadistica

A=P(48,10< <50,9)= N((50,90-50,10)/0,83)

- N((48,10-50,10)/0,83)

A = N(0,96) - N(-2,41)

A = 0,83147 - 0,00798 (Obtenidos de Tablas )

A = 0,8235

La probabilidad de que la media de peso de

una muestra de 40 bolsas se encuentre entre

48,10 y 50,90 gramos es 0,8235.

ING. JORGE ACUÑA A., PhD., PROFESOR

24

x

Page 25: 2.estadistica

En una industria se fabrican productos

que deben tener un peso medio

comprendido entre 10,049 y 10,095

g. Se toma una muestra de 15

unidades, originándose un promedio

de 10,072 g y una desviación

estándar de 0,100 g. ¿Cuál es la

probabilidad de cumplir con el peso

fijado?

ING. JORGE ACUÑA A., PhD., PROFESOR

25

Page 26: 2.estadistica

P(10,049 10,095)=T((10,095-10,072)/(0,100/ 14))

-T((10,049-10,072)/(0,100/ 14))

= T (0,861) - T (-0,861)

= 0,80 - 0,20

= 0,60

La probabilidad de cumplir con el peso medio fijado es 0,60.

Los valores de T(0,861) y T(-0,861) sirven para calcular las probabilidades usando la Tablas.

ING. JORGE ACUÑA A., PhD., PROFESOR

26

x

Page 27: 2.estadistica

Una máquina llenadora ha

ejecutado su operación con una

varianza de 0,83 grms2. Si se toma

una muestra de 15 unidades,

¿cuál es la probabilidad de tener

una varianza:

a. Superior a 1,31 grms2?

b. Inferior a 0,56 grms2?

ING. JORGE ACUÑA A., PhD., PROFESOR

27

Page 28: 2.estadistica

n * s2 15 (1,31)

a. 2 = –––––– = –––––––– = 23,7

2 0,83

n * s2 15 (0,56)

b. 2 = –––––– = ———— = 10,1 2 0,83 Los valores de la probabilidad se encuentran en

Tablas.

En conclusión, la probabilidad de obtener una varianza superior a 1,31 grms2 es 0,05 y la de obtener una varianza inferior a 0,56 grms2 es 0,25.

ING. JORGE ACUÑA A., PhD., PROFESOR

28

Page 29: 2.estadistica

En un proceso de corte de varillas para un ensamble especial, existen dos máquinas cortadoras tecnológicamente parecidas aunque diferentes en antigüedad. Esta similitud hace pensar que las varianzas de corte generadas por ambas máquinas puedan ser comparadas.

Si se toma una muestra de 16 elementos de cada máquina, calcular la probabilidad de que la razón de varianzas sea:

a. Mayor a 1,97 b. Menor a 0,508

ING. JORGE ACUÑA A., PhD., PROFESOR

29

Page 30: 2.estadistica

Utilizando Tablas: v1 = n1 - 1 = 16 - 1 = 15 v2 = n2 - 1 = 16 - 1 = 15 Fv1,v2, 1= F15,15, 1 =1,97 para 1=0,10 Fv1,v2, 2= F15,15, 2 =0,508 para 2=0,10

pues F15,15, 2 = 1 / F15,15, 1 Como respuesta al problema se tiene que

la probabilidad de que la razón de varianzas sea superior a 1,97 es 0,10 y de que sea inferior a 0,508 es también 0,10.

ING. JORGE ACUÑA A., PhD., PROFESOR

30

Page 31: 2.estadistica

Una distribución de variable discreta si se ajusta a experimentos que cumplen con cinco propiedades:

Hay n pruebas Existe una probabilidad de éxito p y una de fracaso q=1-p Las pruebas son independientes Interesan x casos del total de casos Las funciones densidad y acumulada así como el valor

esperado ( ) y la varianza ( 2) son las siguientes: f(x) = n px * q n-x para x 0

x (n-x) n’ F(x) = f(x) = np 2= npq X=0

ING. JORGE ACUÑA A., PhD., PROFESOR

31

Page 32: 2.estadistica

Un cliente establece que para aceptar un lote de producto que le envía el fabricante, éste debe cumplir con el contrato firmado. Este contrato establece que el lote se acepta si una muestra de 20 unidades extraída de él, contiene dos o menos defectuosos.

Si el fabricante envía un lote 10% defectuoso, ¿cuál es la probabilidad de que sea rechazado?

ING. JORGE ACUÑA A., PhD., PROFESOR

32

Page 33: 2.estadistica

Primero que todo se debe analizar si se cumple con las cuatro condiciones fijadas para la distribución binomial.

1. n = 20 3. Hay independencia 2. p = 0,10 4. x 2 Por leyes de probabilidad se tiene que la

probabilidad de rechazo es igual al complemento de la probabilidad de aceptación.

Sea:

P(X > 2) = 1 – P (X 2) 2 P(X 2) = B(2,20,0,10) = b(xi,n,p) i=0

ING. JORGE ACUÑA A., PhD., PROFESOR

33

Page 34: 2.estadistica

P(X 2) = B(2,20,0,10) = b(xi,n,p) i=0 P(X 2) = b(0,20,0,10) + b(1,20,0,10) + b(2,20,0,10) 20! 20! 20! P(X 2) = ––––– 0,100 * 0,9020 + ––––––– 0,101 * 0,9019 + –––––– 0,102*0,9018

20! * 0! 19! * 1! 18! * 2!

P(X 2) = 0,1216+0,27+0,2853 = 0,6769 Probabilidad de rechazo = P(X>2) = 1 - P(X 2) = 1-0,6769 = 0,3231 Si se utiliza la Tabla se tiene que: P(X 2) = B (2,20,0,10) = 0,6769 P(X>2) = 1 - P(X 2) = 1 - 0,6769 = 0,3231

Por lo tanto la respuesta es que si se envía un lote

10% defectuoso la probabilidad de que sea rechazado es 0,3231.

ING. JORGE ACUÑA A., PhD., PROFESOR

34

Page 35: 2.estadistica

Una compañía farmacéutica afirma que existe una probabilidad de 0,005 de que un paciente que ingiere un nuevo medicamento, sufra una reacción secundaria. Si 2000 pacientes compran este medicamento, ¿cuál es la probabilidad de que:

a. ocho sufran efectos secundarios? b. mas de ocho sufran efectos

secundarios?

ING. JORGE ACUÑA A., PhD., PROFESOR

35

Page 36: 2.estadistica

p = 0,005 n = 2000 x= 8 = 2000 * 0,005 = 10 a. Utilizando la fórmula se tiene: 108

p (8,10) = e-10 ——— = 0,1126 8! Utilizando la Tabla p (8,10)= P (8,10)– P (7,10) = 0,333 – 0,220 = 0,113 Por lo tanto, la probabilidad de que ocho de los 2000

pacientes sufran efectos secundarios al ingerir el medicamento es 0,113.

b. P(x>8) = 1 - P( x 8 ) = 1 – 0,333 = 0,667 Por lo tanto, la probabilidad de que mas de ocho de los 2000

pacientes sufran efectos secundarios al ingerir el medicamento es 0,667.

ING. JORGE ACUÑA A., PhD., PROFESOR

36

Page 37: 2.estadistica

Para µ, se calculan así:

_

Lc = x Z /2 * ——— si es conocida

n

_ s

Lc = x t /2 * ——— si es desconocida

n-1

Para 2, se calculan así:

ns2 ns2

LIc = ——— LSc = ———

2 1- /2 2

/2

ING. JORGE ACUÑA A., PhD., PROFESOR

37

Page 38: 2.estadistica

Se toman 30 varillas cortadas por una

máquina cortadora. Si se tiene una

longitud promedio de 5,35 cm, con una

desviación típica de 0,85 cm.

a. ¿Cuáles son los límites de confianza para µ, con 95% de confianza?

b. ¿Cuáles son los límites de confianza para 2, con 95% de confianza?

c. Si se conociera que 2 es igual a 1,58 cm2,

¿cuál es la respuesta a la pregunta a?

ING. JORGE ACUÑA A., PhD., PROFESOR

38

Page 39: 2.estadistica

_ a. n = 30 x = 5,35 cm s = 0,85 cm (1- ) = 0,95

= 0,05 _ s _ s LIc = x – t /2 ——— LSc = x + t /2 ——— n-1 n-1 0,85 0,85 LIc = 5,35 – 2,045 ——— LSc = 5,35 + 2,045 ——— 29 29 = 5,02 cm = 5,67 cm t /2 = t 0,025 = 2,045 de Tablas Esto significa que se puede afirmar con 95% de confianza

que el proceso de corte de varillas tiene un promedio de corte comprendido entre 5,02 cm y 5,67 cm.

ING. JORGE ACUÑA A., PhD., PROFESOR

39

Page 40: 2.estadistica

b. s2 = 0,852 = 0,7225 cm2

n s2 30 (0,7225) 21,675 LIc = ——— = —————– = ––———— = 0,474 cm2

20,975 45,7 45,7

n s2 30(0,7225) 21,675 LSc = ——— = ————— = ———— = 1,35 cm2

2 0,025 16 16

Los valores de chi-cuadrado provienen de Tablas. Esto significa que se puede afirmar con 95% de confianza

que el proceso de corte de varillas tiene una varianza de corte comprendida entre 0,474 cm2 y 1,35 cm2.

ING. JORGE ACUÑA A., PhD., PROFESOR

40

Page 41: 2.estadistica

c. Si 2 = 1,58 cm2 entonces = 1,257 cm. _ 1,257 LIc = x – Z /2 ——— = 5,35 – 1,96 ———— = 4,9 cm n 30 _ 1,257 LSc= x + Z /2 ——— = 5,35 + 1,96 ———– = 5,8 cm n 30 Los valores de Z se obtuvieron de tablas Esto significa que se puede afirmar con 95% de confianza que el

proceso de corte de varillas tiene un promedio de corte comprendido entre 4,9 cm y 5,8 cm.

ING. JORGE ACUÑA A., PhD., PROFESOR

41

Page 42: 2.estadistica

Comportamiento de un proceso con el fin de ejecutar acciones que prevengan problemas de calidad.

Procedimiento mediante el cual, sujeto a un error tipo I denotado por , se contrasta una hipótesis planteada con el fin de probar su veracidad o su falsedad.

Error tipo I ( ) es la probabilidad de rechazar la hipótesis nula siendo esta verdadera.

Error tipo II (ß) es la probabilidad de aceptar la hipótesis nula siendo esta falsa.

ING. JORGE ACUÑA A., PhD., PROFESOR

42

Page 43: 2.estadistica

a. Plantear la hipótesis nula H0 y la hipótesis alternativa denotada por Ha.

b. Prueba debe ser unilateral o bilateral.

c. Fijar el nivel de significación ( ) o error tipo I, (1%, 5% ó 10%)

d. Definir el estadístico a usar de acuerdo con la distribución de probabilidad que le corresponde a la variable en estudio y según lo que se desee probar (una media, dos medias, una varianza, dos varianzas, una proporción o dos proporciones).

ING. JORGE ACUÑA A., PhD., PROFESOR

43

Page 44: 2.estadistica

e. Definir las áreas donde se cumplirá cada una de las hipótesis.

f. Calcular el valor del estadístico seleccionado

g. Comparar el estadístico obtenido con el estadístico teórico. El resultado permitirá conocer la decisión de aceptación o rechazo

h. Obtener las conclusiones del experimento efectuado. Un valor importante de calcular aquí es el error tipo II.

ING. JORGE ACUÑA A., PhD., PROFESOR

44

Page 45: 2.estadistica

ING. JORGE ACUÑA A., PhD.,

PROFESOR 45

EJEMPLO 2.14 pag. 76EJEMPLO 2.14 pag. 76

En un proceso de fabricación de

piezas de precisión se quiere que el

valor nominal del diámetro de una

pieza sea 20,0 mm. Se conoce que la

desviación estándar de esta

característica es 3,0 mm. Se toma una

muestra de 25 piezas obteniéndose un

promedio de diámetro de 19,2 mm.

¿Se ha cumplido con lo requerido?

Use =5%.

Page 46: 2.estadistica

ING. JORGE ACUÑA A., PhD.,

PROFESOR 46

SOLUCION Se seguirá el procedimiento planteado.

a. Planteo de la hipótesis

H0: µ = 20,0

Ha: µ 20,0

b. La hipótesis es bilateral puesto que no

se cumple con lo requerido si el promedio de la

muestra es mayor o menor que lo especificado.

c. El nivel de significación es dado, = 5%.

d. El estadístico por usar es el siguiente:

_

x – µ

Z = ––––––

/ n

Page 47: 2.estadistica

ING. JORGE ACUÑA A., PhD.,

PROFESOR 47

SOLUCION e. Las áreas de cumplimiento de la hipótesis .

f. Cálculo del estadístico citado en d.

_

x – µ 19,2 – 20,0

Z = ——— = —————— = –1,33

/ n 3,0/ 25

g. El valor de Z calculado (–1,33) se encuentra en

el área de cumplimiento de la hipótesis nula.

h. En conclusión, se puede afirmar, con =5%, que

estadísticamente se cumple con el valor nominal

requerido.

Page 48: 2.estadistica

ING. JORGE ACUÑA A., PhD.,

PROFESOR 48

EJEMPLO 2.15 pag. 77EJEMPLO 2.15 pag. 77

Si en el Ejemplo anterior no se

conoce la desviación estándar pero

a partir de la muestra se calcula una

desviación típica de 2,1 mm ¿Qué

conclusiones se obtienen? Use

=5%.

Page 49: 2.estadistica

ING. JORGE ACUÑA A., PhD.,

PROFESOR 49

SOLUCIONSOLUCION Se seguirá el procedimiento planteado. a. Planteo de la hipótesis H0: µ = 20,0 Ha: µ 20,0 b. La hipótesis es bilateral puesto que no se

cumple con lo requerido si el promedio de la muestra

es mayor o menor que lo especificado. c. El nivel de significación es dado, = 5%. d. El estadístico por usar es el siguiente: _

x – µ t = ————

s/ n-1

Page 50: 2.estadistica

ING. JORGE ACUÑA A., PhD.,

PROFESOR 50

SOLUCIONSOLUCION

e. Las áreas de cumplimiento de la hipótesis.

f. Cálculo del estadístico citado en d. _ x – µ 19,2 – 20,0 t = –––––––––– = —————— = –1,87 s/ n-1 2,1/ 24 g. El valor de t calculado (–1,87) se encuentra

en el área de cumplimiento de la hipótesis nula. h. En conclusión, se puede afirmar, con

= 5%, que estadísticamente se cumple con el valor

nominal requerido.

Page 51: 2.estadistica

ING. JORGE ACUÑA A., PhD., PROFESOR

51

Un proveedor envía lotes de producto

que según sus registros son 5%

defectuosos. Un cliente toma una

muestra de 200 unidades y encuentra

16 unidades defectuosas. ¿Es cierto lo

que muestran los registros del

proveedor, con =5%?

Page 52: 2.estadistica

Se seguirá el procedimiento planteado. a. Planteo de la hipótesis

H0: p = 0,05 Ha: p > 0,05

b. La hipótesis es unilateral puesto que lo problemático en cuanto a calidad es que el porcentaje de defectuosos supere lo especificado.

c. El nivel de significación es dado, = 5%. d. El estadístico por usar es el siguiente:

x – np Z = –––––––

npq

ING. JORGE ACUÑA A., PhD., PROFESOR

52

Page 53: 2.estadistica

e. Las áreas de cumplimiento de la hipótesis. f. Cálculo del estadístico x – np 16 – 200(0,05) Z = ———— = ––––––––––––––– = 1,95 npq 200*0,05*0,95 g. El valor de Z calculado (1,95) se encuentra

fuera del área de cumplimiento de la hipótesis nula.

h. En conclusión, no hay evidencia estadística para aceptar la hipótesis nula con = 5%. Por lo tanto, estadísticamente no es cierto lo que anotan los registros del fabricante.

ING. JORGE ACUÑA A., PhD., PROFESOR

53

Page 54: 2.estadistica

Para el mismo producto del Ejemplo 3, existe otro proveedor. Una muestra de 200 unidades extraídas de un lote enviado por él, tenía 12 unidades defectuosas. ¿Se puede decir con 95% de confianza que el proveedor del Ejemplo 3 da peor calidad que el de este ejemplo.

ING. JORGE ACUÑA A., PhD., PROFESOR

54

Page 55: 2.estadistica

ING. JORGE ACUÑA A., PhD.,

PROFESOR 55

SOLUCIONSOLUCION

Se seguirá el procedimiento planteado.

a. Planteo de la hipótesis

p1: fracción defectuosa del proveedor A

p2: fracción defectuosa del proveedor B

H0: p1 = p2

Ha: p1 > p2

b. La hipótesis es unilateral pues se

quiere probar si la cantidad de defectuosos

enviada por un proveedor es

significativamente mayor que la del otro.

c. El nivel de significación es dado, = 5%.

Page 56: 2.estadistica

ING. JORGE ACUÑA A., PhD.,

PROFESOR 56

SOLUCIONSOLUCION d. El estadístico por usar es:

x1 + x2

p’ = ————— q’ = 1 – p’

n1 + n2 e. Las áreas de cumplimiento

f. Cálculo del estadístico

x1 + x2 16 + 12

p’ = –––––––– = ––––––––– = 0,07

n1 + n2 200 + 200 q’ = 1 – 0,07 = 0,93 g. El valor de Z calculado (0,784) está en el área de

cumplimiento de la hipótesis nula.

h. Se puede afirmar, con =5%, que no hay diferencia

significativa entre las calidades suministradas por ambos

proveedores.

784.0

200

1

200

193.0*07.0

200

12

200

16

11''

21

2

2

1

1

Z

nnqp

n

x

n

x

Z

Page 57: 2.estadistica

ING. JORGE ACUÑA A., PhD., PROFESOR

57

• En el corte de una varilla

cromada se genera una

varianza de la longitud de 2,5

mm2. Se toma una muestra de

30 varillas y se mide la varianza

muestral de la longitud, la que

resulta ser 2,0 mm2. ¿Existe

alguna diferencia significativa

con el valor inicial de 2,5 mm2?

Use =5%.

Page 58: 2.estadistica

Se seguirá el procedimiento planteado. a. Planteo de la hipótesis

H0: 2 = 2,5

Ha: 2 2,5 b. La hipótesis es bilateral puesto que no se cumple con

lo requerido si la varianza de la muestra es mayor o menor que la especificada.

c. El nivel de significación es dado, = 5%. d. El estadístico por usar es el siguiente:

s2 2= (n-1) ——

2 e. Las áreas de cumplimiento de la hipótesis.

58

Page 59: 2.estadistica

f. Cálculo del estadístico citado en d.

s2 2= (n-1) —— = 29 * (2/2,5) = 23,2

2

g. El valor de 2 calculado (23,2) se encuentra en el área de cumplimiento de la hipótesis nula.

h. En conclusión, se puede afirmar, con = 5%, que estadísticamente no existe diferencia con la varianza inicial.

ING. JORGE ACUÑA A., PhD., PROFESOR

59

Page 60: 2.estadistica

En un proceso de corte de bolsas plásticas se usan dos máquinas. De la máquina A se toma una muestra de 30 unidades que genera una varianza en la longitud de corte de 3,3 mm2 y de la máquina B se toma una muestra de 25 unidades que genera una varianza en la longitud de corte de 4,1 mm2. ¿Se puede afirmar, con = 5%, que una máquina es mejor en la ejecución de esta operación que la otra?

ING. JORGE ACUÑA A., PhD., PROFESOR

60

Page 61: 2.estadistica

Se seguirá el procedimiento planteado. a. Planteo de la hipótesis Sea 2

A la varianza producida por la máquina A 2

B la varianza producida por la máquina B H0:

2A = 2

B

Ha: 2A 2

B

b. La hipótesis es bilateral puesto se desea probar la existencia de diferencias entre las varianzas de ambas máquinas.

c. El nivel de significación es dado, = 5%. d. El estadístico por usar es el siguiente:

s12

F = ——— s2

2

ING. JORGE ACUÑA A., PhD., PROFESOR

61

Page 62: 2.estadistica

e. Las áreas de cumplimiento de hipótesis. Los valores de F de

0.53 y 1.94 fueron extraídos de tablas F con /2 = 0.025. f. Cálculo del estadístico citado en d.

s12 3,3

F = ——–– = ——–– = 0,805 s2

2 4,1 g. El valor de F calculado (0,805) se encuentra en el área de

cumplimiento de la hipótesis nula (ver Figura 2.18). h. En conclusión, se puede afirmar, con =5%, que no existe

ninguna diferencia de variabilidad de la longitud de corte entre ambas máquinas.

ING. JORGE ACUÑA A., PhD., PROFESOR

62

Page 63: 2.estadistica

Una inspección de calidad efectuada sobre dos marcas de baterías para linterna, reveló que una muestra aleatoria de 61 unidades de la marca A generó un promedio de vida útil de 36,5 horas con una desviación estándar de 1,8 horas, mientras que otra muestra aleatoria de 31 unidades de la marca B generó un promedio de 36,8 horas con una desviación estándar de 1,5 horas.

Con un nivel de significación del 5% se desea saber si hay diferencia significativa entre la vida útil de ambas marcas.

ING. JORGE ACUÑA A., PhD., PROFESOR

63

Page 64: 2.estadistica

Para probar si hay diferencia significativa entre los promedios se debe comprobar primero la diferencia entre las varianzas, para así seleccionar el estadístico adecuado.

1. Hipótesis de varianzas Siguiendo los pasos de una prueba de hipótesis se tiene: a. Planteo de la hipótesis

H0: 2

A = 2B

Ha: 2A 2

B

b. Como la hipótesis alternativa es de desigualdad, entonces es bilateral. Esto significa que puede darse una relación mayor o menor.

ING. JORGE ACUÑA A., PhD., PROFESOR

64

Page 65: 2.estadistica

c. El nivel de significancia es = 5%.

d. El estadístico por usar es Fc = s12/ s2

2 (distribución F-Fisher), pues lo que se desea es medir la relación de varianzas.

e. Las áreas de la hipótesis que se va a probar. v1 = n1–1 = 61–1=60 v2=n2-1 = 31–1=30 De una Tabla F con /2= 2.5% se tiene:

F 60,30,0.025 = 0,551 F 60,30,0.975 = 1,440

f. Fc= s12/ s2

2 = 1,82/1,52 = 1,44 g. Este valor calculado de Fc cae en el área donde se

cumple Ho, por lo tanto se acepta Ho.

ING. JORGE ACUÑA A., PhD., PROFESOR

65

Page 66: 2.estadistica

h. Se concluye que ambas varianzas, al 5% de significancia, son iguales.

Se procede entonces a hacer la hipótesis de promedios.

Siguiendo los pasos de prueba de hipótesis se tiene: a. Planteo de la hipótesis

Ho: µ1 = µ2

Ha : µ1 µ2

b. La hipótesis es bilateral al igual que en la hipótesis anterior.

c. El nivel de significación es del 5%

ING. JORGE ACUÑA A., PhD., PROFESOR

66

Page 67: 2.estadistica

d. Según la hipótesis anterior las varianzas son desconocidas pero iguales, además, los tamaños de muestra son mayores que 30. Por lo tanto el estadístico por usar es:

e. Las áreas de cumplimiento y rechazo. v = n1 + n2 – 2 v = 61 + 31 – 2 v = 90

ING. JORGE ACUÑA A., PhD., PROFESOR

67

2

2

2

1

2

1

21

n

s

n

s

xxt

Page 68: 2.estadistica

De tablas se obtienen los valores: t 90, 0,025 = –1,987 t90,0,975=1,987

f. El estadístico calculado es:

En este caso ( 1 – 2) = 0 pues es de suponer que tratándose de un mismo producto las medias poblacionales son iguales.

g. No hay evidencia estadística, con = 5%, para concluir que ambas medias sean diferentes.

ING. JORGE ACUÑA A., PhD., PROFESOR

68

845,0355,0

3,0

31

5,1

61

8,1

08,365,3622

t

Page 69: 2.estadistica

Permite probar el ajuste de los resultados de un experimento a una distribución de probabilidad teórica sujeto a un error .

El método en cuestión se basa en la comparación de las frecuencias absolutas observadas y las frecuencias absolutas esperadas, calculadas a partir de la distribución teórica en análisis.

Se usa el estadístico chi-cuadrado para n>50, de lo contrario, se debe aplicar otras técnicas tales como Kolgomorov o Shapiro-Wilks

ING. JORGE ACUÑA A., PhD., PROFESOR

69

Page 70: 2.estadistica

Ho : f(x) = función densidad de la distribución teórica siendo probada

Ha : f(x) a esa función Ejemplo: e– x

Ho: f(x) = p (x, ) = ––––––– x!

e– x

Ha: f(x) p (x, ) = ———— x!

Se usa el estadístico chi-cuadrado: K

2c = (nk – ek)

2 / ek

k=1

ING. JORGE ACUÑA A., PhD., PROFESOR

70

Page 71: 2.estadistica

ING. JORGE ACUÑA A., PhD.,

PROFESOR 71

MUESTREO ESTADISTICOMUESTREO ESTADISTICO • Confianza en los resultados obtenidos a partir del

análisis de muestras.

• Aleatoriedad y representatividad.

• Una muestra es aleatoria cuando los elementos

que la componen fueron extraídos de una población

en la cual todos sus componentes tuvieron la misma

probabilidad de pertenecer a esa muestra.

• Una muestra es representativa cuando sus

elementos reflejan las características de la población

de la cual fueron extraídos.

• Ambas propiedades están ligadas al tamaño de la

muestra y al método usado para su selección.

Page 72: 2.estadistica

ING. JORGE ACUÑA A., PhD.,

PROFESOR 72

PROCEDIMIENTOPROCEDIMIENTO • Identificación de la característica por estudiar y

del marco de muestreo.

• Escogencia del tipo de muestreo

• Determinación del tamaño de la muestra,

mediante la fórmula que especifique el tipo de

muestreo.

• Selección aleatoria de la muestra previa

definición del procedimiento adecuado.

• Escogencia del método de estimación del error

estadístico.

• Cálculo de inferencias, errores y grado de

confianza de las conclusiones.

Page 73: 2.estadistica

ING. JORGE ACUÑA A., PhD.,

PROFESOR 73

VENTAJASVENTAJAS •Ahorro de dinero al evitar la inspección 100%, la

cual tiene costos más altos.

•Ahorro de tiempo al disminuir la cantidad por

inspeccionar en relación con la inspección 100%.

•Atención de casos individuales

•Recurso indispensable cuando la inspección es

destructiva.

•Unico método posible cuando la población es

infinita.

•Excelente opción cuando los errores no

muestrales, especialmente humanos, son grandes

e imposibles de reducir.

•Error y sesgo

Page 74: 2.estadistica

ING. JORGE ACUÑA A., PhD.,

PROFESOR 74

TIPOS DE MUESTREOTIPOS DE MUESTREO

• Muestreo aleatorio simple

• Muestreo sistemático

• Muestreo estratificado

• Muestreo por conglomerados

• Muestreo de aceptación.

Page 75: 2.estadistica

ING. JORGE ACUÑA A., PhD.,

PROFESOR 75

MUESTREO ALEATORIO MUESTREO ALEATORIO

SIMPLESIMPLE • ESTIMACION DE PROMEDIOS

• ESTIMACION DE PROPORCIONES

2

2/ *

E

Zn222

2/

22

2/

**

**

ENZ

NZn

22

2/

2

2/

***

***

ENqpZ

qpNZn

2

2/*E

Zqpn

nN

nNx

2

*1 n

x

2

n

qp

N

nNx

**1

n

qpx

*

Page 76: 2.estadistica

ING. JORGE ACUÑA A., PhD.,

PROFESOR 76

EJEMPLO 2.28 pag. 113EJEMPLO 2.28 pag. 113

Considérese un lote de producción de 1000

unidades, cuya varianza en el diámetro de

una de sus partes es 250 mm. Se desea

estimar el promedio del diámetro, a partir de

una muestra, con una confianza del 95% y

con error no mayor a 1 mm. ¿Cuál es ese

tamaño de muestra y su error estándar?

Page 77: 2.estadistica

ING. JORGE ACUÑA A., PhD.,

PROFESOR 77

SOLUCIONSOLUCION

N = 1000 E = 1

Z /2 = 1,96 (extraído de Tablas)

2 = 250

Para estimar el promedio de diámetro de esta

pieza, se debe extraer una muestra de 481

unidades. El muestreo tiene un error estándar

de 0,52.

481~2,480)1*1000(250*96,1

250*1000*96,1

**

**2

2

222

2/

22

2/

ENZ

NZn

52,0481

250*

11000

4811000 2

x

Page 78: 2.estadistica

ING. JORGE ACUÑA A., PhD.,

PROFESOR 78

EJEMPLO 2.29 pag. 113EJEMPLO 2.29 pag. 113

Un fabricante afirma que el 2,5% de los

productos que entrega el comprador son

defectuosos. Si éste recibe los productos en

lotes de 5000 unidades, ¿cuál debe ser el

tamaño de la muestra por usar para verificar

lo expresado por el fabricante? Use 95% de

confianza y un error no máximo del 1% en la

estimación.

Page 79: 2.estadistica

ING. JORGE ACUÑA A., PhD.,

PROFESOR 79

SOLUCIONSOLUCION

E = 0,01 p = 0,025 q = 0,975

N = 5000 (1- ) =0,95 Z /2 = 1,96

Lo anterior significa que para estimar el

porcentaje defectuoso de ese producto, se

debe extraer una muestra de 789 unidades.

Este muestreo tiene un error estándar de

0,005.

789)01,0*5000()975,0*025,0*96,1(

975,0*025,0*5000*96,1

***

***22

2

22

2/

2

2/

ENqpZ

qpNZn

005,0789

975,0*025,0*

15000

7895000**1 n

qp

N

nNx

Page 80: 2.estadistica

ING. JORGE ACUÑA A., PhD.,

PROFESOR 80

MUESTREO MUESTREO

ESTRATIFICADOESTRATIFICADO • Los elementos poblacionales se dividen primero en k-

grupos y luego se aplica muestreo aleatorio simple

• Este proceso se llama estratificación y a cada grupo

se le llama estrato.

• Se estratifica porque los elementos poblacionales

presentan heterogeneidad, por lo que la obtención de

conclusiones representativas se hace difícil.

• Las probabilidades de selección de los estratos pueden

ser diferentes y no es necesario que todos los elementos

tengan la misma oportunidad de selección, pero se debe

conocer la probabilidad de cada uno.

• La estratificación se ejecuta de tal manera que exista

cierta homogeneidad entre los elementos de cada grupo

y que queden en igual número en cada estrato.

Page 81: 2.estadistica

ING. JORGE ACUÑA A., PhD.,

PROFESOR 81

MUESTREO MUESTREO

ESTRATIFICADOESTRATIFICADO • Afijación proporcional: se basa en el tamaño del

estrato

•Afijación óptima

k

i

iixN

NnN

nN

1

**1

**ii N

N

nn *

k

i

ii

iii

N

Nnn

1

*

2

1

2

2

1

*

*1

N

N

N

N

n

k

i

ii

k

i

ii

x

Page 82: 2.estadistica

ING. JORGE ACUÑA A., PhD.,

PROFESOR 82

EJEMPLO 2.32 pag. 119EJEMPLO 2.32 pag. 119 La producción de una empresa se ha dividido en tres estratos, de

acuerdo con la fracción defectuosa que presenten. Por registros de

los últimos años se conoce la siguiente información:

–––––––––––––––––––––––––––––––––––––––––––––––––––––––

Estrato No. % Defectuoso No. Lotes i (%)

1 5 ó más 35 0,97

2 1,5 a 4,99 80 0,82

3 Menos de 1,5 15 0,30

–––––––––––––––––––––––––––––––––––––––––––––––––––––––

TOTAL 130 1,25*

* Para el total de la producción.

a. A. Si se desea tomar una muestra de 20 lotes, ¿cuántos lotes de

cada estrato se deben seleccionar?

b. B. Compare los errores estándar correspondientes con el error

estándar de muestreo aleatorio simple.

Page 83: 2.estadistica

ING. JORGE ACUÑA A., PhD.,

PROFESOR 83

SOLUCIONSOLUCION Para efectos didácticos este problema se resolverá por

afijación proporcional y por afijación óptima. En

situaciones prácticas se debe escoger el que mejor se

adapte a las condiciones.

• Afijación proporcional

––––––––––––––––––––––––––––––––––––––

Estrato Tamaño de la muestra

–––––––––––––––––––––––––––––––––––––––––––

1 n1 = (20/130) * 35 = 5,38 ³ 5

2 n2 = (20/130) * 80 = 12,3 ³ 12

3 n3 = (20/130) * 15 = 2,3 ³ 3

––––––––––––––––––––––––––––––––––––––––––––

Para completar los 20 lotes seleccionados, se deben

tomar 5 lotes del estrato 1, 12 lotes del estrato 2 y 3

lotes del estrato 3.

Page 84: 2.estadistica

ING. JORGE ACUÑA A., PhD.,

PROFESOR 84

SOLUCIONSOLUCION

• Afijación óptima

Los cálculos iniciales para obtener el tamaño de

muestra por este método.

––––––––––––––––––––––––––––––––––––––––––––

Estrato Ni i Ni* i i2 Ni* i2

––––––––––––––––––––––––––––––––––––––––––––

1 35 0,97 33,95 0,94 32,93

2 80 0,82 65,60 0,67 53,79

3 15 0,30 4,50 0,09 1,35

––––––––––––––––––––––––––––––––––––––––––––

TOTALES Ni* i=104,05 Ni* i2= 88,07

–––––––––––––––––––––––––––––––––––––––––––

Page 85: 2.estadistica

ING. JORGE ACUÑA A., PhD.,

PROFESOR 85

SOLUCIONSOLUCION Se calculan los tamaños de muestra de la siguiente manera:

b. Comparación de errores

El error estándar para afijación proporcional es:

186,005,104

5,4*20

1361,1205,104

6,65*20

652,605,104

95,33*20

3

2

1

n

n

n

169,0

30,0*1582,0*8097,0*35*130

1*

20*130

20130

**1

**

222

1

x

x

k

i

iixN

NnN

nN

Page 86: 2.estadistica

ING. JORGE ACUÑA A., PhD.,

PROFESOR 86

SOLUCIONSOLUCION El error estándar para muestreo por afijación óptima es:

El error estándar si se usa muestreo aleatorio simple

se calcula así:

Los errores del muestreo por afijación proporcional (0,169) y

óptima (0,164) son parecidos, mientras que el error del

muestreo aleatorio simple (0,26)

164,0

130

07,88

130

05,104*

20

1

*

*1

2

2

2

1

2

2

1

x

x

k

i

ii

k

i

ii

x N

N

N

N

n

26,020

25,1*

1130

20130 2

x